Говнокод #13873 — C++ — Говнокод.ру

bormand 30.09.2013 08:05 # 0

P.S. Зато я открыл для себя boost::tokenizer :)

Ответить

bormand 30.09.2013 08:39 # +13

Поясню в чем проблема: getline неюзабелен в качестве токенизатора, ибо считает, что последний пустой токен это fail. Почему так? А потому что в getline() таится костыль для файлов.

С древних времен программисты разделились на два лагеря: остроконечников и тупоконечников. Остроконечники всегда заканчивали свои файлы на LF или че там использовалось на их оси (LF - терминатор). А тупоконечники заканчивали файл сразу после последнего символа последней строки, не ставя лишний по их мнению LF (LF - сепаратор). Из-за этого раздора, код ньюфагов то недочитывал пару символов в конце строки, то читал лишнюю пустую, то вообще повторял последнюю строку джважды, чем доставлял им море баттхертов...

Крестостандартизаторы, глядя на этот цирк, решили как-то устранить эту проблему в своей либе. Единственным решением оказалась установка failbit не только при чтении за конец файла, но и при чтении злополучной "пустой" строки...

Жизнь была бы простой и безоблачной, если бы они добавили отдельную функцию gettoken(), в которой этого костыля бы не было...

Ответить

bormand 30.09.2013 09:05 # 0

P.S. Ну насчет неюзабелен я, конечно, погорячился. Просто неудобен: фейл на последнем токене и фейл посредине надо обрабатывать по-разному.
Ответить
spivti 30.09.2013 13:20 # −1

очень поучительный каммент, с детальным разбором.

Ответить
- anonimb84a2f6fd141 30.09.2013 18:03 # −1
  
  А я нихуя не понял.
  Ответить
  - bormand 30.09.2013 19:01 # +1
    
    Если что-то заинтересовало - спрашивай ;)
    Ответить
    - anonimb84a2f6fd141 30.09.2013 19:41 # +1
      
      В чем проблема-то?
      Ответить
      - bormand 30.09.2013 20:11 # +1
        
        В крестолибе есть функция std::getline(stream, buf, delim), которая читает из потока stream в строку buf токен, заканчивающийся указанным разделителем (или концом потока).
        
        Например если в потоке у нас "a|b", и мы вызываем std::getline(stream, buf, '|'), то при первом вызове мы получим buf = "a", при втором buf = "b" и установленный eofbit у стрима. Если вызвать его еще раз, то ничего не прочитается, и у стрима включится failbit, и вылетит исключение (если оно разрешено).
        
        Если бы все так и работало, достаточно было бы включить режим исключений у потока, и тупо вызвать по getline'у на каждый токен (и проверить stream.eof(), если хочется убедиться, что стрим дочитался до конца). При нехватке токенов вылетело бы исключение.
        
        Но из-за описанной выше питушни, если в потоке было "a|", при первом вызове мы получим buf = "a", а при втором ничего не прочтется, установятся сразу оба флага - eofbit и failbit и вылетит исключение. Поэтому такой простой подход уже не прокатит, и надо отключать исключения, и втыкать проверки после каждого токена... Что неприятно.
        Ответить
        
        anonimb84a2f6fd141 30.09.2013 21:52 # +1
        
        А что мешает сделать readline() и потом split()?
        Ответить
        
        bormand 01.10.2013 05:14 # 0
        
        > потом split()
        Отсутствие оного.
        Ответить
        
        anonimb84a2f6fd141 01.10.2013 19:45 # −1
        
        СИШКОПРОБЛЕМЫ ОЛОЛО В C есть же strtok?
        Ответить
        
        bormand 01.10.2013 21:52 # +1
        
        Ну что ж я буду юзать strtok в крестах? Он же строки портит...
        
        А альтернативу я нашел: boost::tokenizer или boost::split.
        Ответить
        
        anonimb84a2f6fd141 03.10.2013 17:24 # −1
        
        КРЕСТОПРОБЛЕМЫ: В поисках split(). bormand, М., 2013, тираж 1 экземпляр.
        Ответить
        
        3Doomer 02.10.2013 12:07 # −1
        
        запили свой, problems?
        Ответить
        
        Stertor 03.10.2013 17:46 # −1
        
        Борманд, жжошь! )
        
        Кто минуснул?!
        Ответить
        
        anonimb84a2f6fd141 03.10.2013 19:14 # 0
        
        А в чем отжиг?
        Ответить
        
        Stertor 03.10.2013 19:29 # 0
        
        Если я не ошибаюсь, split() есть в сишке-за-решеткой, но никак не в крестах.
        Ответить
Dummy00001 30.09.2013 16:07 # −2

"С древних времен программисты разделились на два лагеря: остроконечников и тупоконечников."

Это деление только у глупых программистов, которые не знают как делать FSM для lexer'ов/parser'ов.
Ответить
- bormand 30.09.2013 16:21 # +1
  
  > Это деление только у глупых программистов, которые не знают как делать FSM для lexer'ов/parser'ов.
  Причем здесь это? Различия то начинаются еще при записи в файл - тот же vim считает LF терминатором, и добавляет \n к последней строке, а тот же notepad, считает LF сепаратором, и не добавляет. Как FSM для getline'а поможет в борьбе с различиями при записи в файл?
  
  Максимум, чего можно добиться навелосипедив getline - это нормальная работа с обеими форматами. Но ведь он и так это умеет. Зачем изобретать то, что уже прекрасно работает?
  
  А вот gettoken да, можно и написать. Но согласитесь, а не лучше ли было бы, если бы он был готовый, и его не приходилось каждый раз писать заново? В сишке же есть strtok. Он хоть и уёбищен, но есть.
  
  P.S. За что мне поставили минус в комменте про boost::tokenizer я вообще не понял.
  Ответить
  - Dummy00001 30.09.2013 17:32 # 0
    
    "Как FSM для getline'а поможет в борьбе с различиями при записи в файл?"
    
    Важно не то как оно пишется в файл. Важно то, можно ли оттуда прочитать.
    
    getline() очевидно неправильная функция если тебе нужно читать потенциально битые текстовые файлы и/или файлы с неизвестным заранее разделителем.
    
    "Но ведь он и так это умеет. Зачем изобретать то, что уже прекрасно работает?"
    
    Пример в ГК (и мой личный ограниченый опыт) как бы намекают что оно весьма далеко от "прекрасно."
    
    "В сишке же есть strtok. Он хоть и уёбищен, но есть."
    
    Много лет назад читал от скуки /usr/include/string.h и наткнулся на strpbrk(). Почитал ман, порадовался жизни, и после этого перестал трахатся с strtok(). Рекомендую.
    Ответить
    - bormand 30.09.2013 17:56 # 0
      
      > Пример в ГК
      Пример в ГК использует getline не по назначению (из-за того, что авторы не удосужились сделать отдельный gettoken без описанного выше костыля). Отсюда и проблема. А для чтения строк из файла он вполне адекватно себя ведет.
      
      > с неизвестным заранее разделителем
      Ну тут да, придется свой парсер-детектор написать.
      
      > strpbrk
      Спасибо, не знал про эту функцию ;) Удобно.
      Ответить
    - wvxvw 30.09.2013 19:11 # +2
      
      > strpbrk
      Юникс писался армянской диаспорой в Чехословакии...
      Ответить
    - Stertor 03.10.2013 22:30 # −1
      
      <Важно не то как оно пишется в файл. Важно то, можно ли оттуда прочитать.>
      
      Снимаю шляпу) Эти слова нужно написать на табличке перед входом на сей сайт.
      Ответить
- bormand 30.09.2013 16:30 # +1
  
  P.S. И вообще, вы, как умный программист, мне предлагаете для разбора сраного быдлоформата в духе "111|222|the test|foo bar", для которого на сишке вполне хватало strto*, городить FSM, или того хуже юзать flex+bison?
  Ответить
  - roman-kashitsyn 30.09.2013 16:37 # +5
    
    Нет, конечно. Только Spirit, только хардкор.
    Ответить
    - bormand 30.09.2013 16:39 # 0
      
      Хех, спирит страшен в гневе. Там при любом косяке такие ошибки компиляции в лог валятся... bison, на самом деле, поприятнее будет (но он здесь явный оверкилл).
      Ответить
      - roman-kashitsyn 30.09.2013 17:55 # +3
        
        Вам смешно, а я вот такое часто нахожу
        namespace s = boost::spirit::classic; if (s::parse ( lonlat.begin() , lonlat.end() , s::real_p[s::assign_a(lon)] >> +s::space_p >> s::real_p[s::assign_a(lat)] ).full) { point = Point(lon, lat); } else { /* error handling code */ }
        Ответить
        
        bormand 30.09.2013 18:11 # +2
        
        Синтаксис у спирита все-таки укуренный. Без спирта не разобраться.
        
        P.S. http://govnokod.ru/12937 :)
        Ответить
        
        guest 01.10.2013 06:59 # +2
        
        Сам ты укуреный. Даже я, никогда не видевший спирта и не читавший его документацию сразу понял, что код читает что-то вида:
        Прочитать float константу в переменную lon
        [Прочитать >>]
        Пропустить 1 или более пробелов
        [Прочитать >>]
        Прочитать float константу в переменную lat
        Соответственно если сматчилось, то используем, иначе обрабатываем ерор. В [] написано то, в чем я сильно не уверен и скорее всего это (а в этом я уверен) просто связующий\разделяющий символ.
        
        LispGovno
        Ответить
        
        bormand 01.10.2013 07:09 # 0
        
        > просто связующий\разделяющий символ
        Так и есть.
        
        > сразу понял
        Да понять то можно... Ты написать попробуй... Там с действиями в [ ... ] траблы в основном, кресты это ж не ленивый хаскель...
        
        P.S. Хотя траблы с [ ... ] это уже не к спирту, а скорее к фениксу и т.п.
        Ответить
        
        guest 01.10.2013 07:12 # 0
        
        >Там с действиями в [ ... ] траблы в основном
        Например? Действия в неожиданном порядке вызываются в соответствии с порядком приоритетов?
        Ответить
        
        bormand 01.10.2013 07:17 # +4
        
        Туда надо пихать ленивую функцию ;) А на крестах это не очень приятное занятие.
        
        Ну и компилится спиртосодержащий код просто пиздец как долго... Не говоря уж о портянках с ошибками, после которых обычные бустовские кажутся несущественными и маленькими.
        Ответить
        
        1024-- 01.10.2013 08:05 # 0
        
        Горькая правда...
        Кстати, не знаете, есть ли относительно простое (для анскильных питушков) и подробное руководство по Spirit на более-менее русском языке? Желательно, чтобы там охватывалась старая версия (classic) и новая.
        А то статьи с примерами обычно пишут в стиле "Давайте напишем Hello, world, теперь распарсим списочек вида a,b,c,d,e;. Смотрите, как всё просто и понятно! Теперь вы знаете Спирит!" Иногда ещё внезапно начинают использовать Phoenix, хотя мозг читателя ещё не отошёл от всей мощи Spirit'а.
        Да, документация - это хорошо, но лучше бы почитать в более художественной форме на родном языке.
        Ответить
        
        defecate-plusplus 01.10.2013 08:36 # 0
        
        классик-то накой? есть наследие, которое надо сопровождать?
        вы вообще с какой целью интересуетесь? для продакшена спирит в коде - не самый приятный инструмент
        Ответить
        
        bormand 01.10.2013 10:34 # 0
        
        > для продакшена спирит в коде - не самый приятный инструмент
        Угу. Для серьезных грамматик что-то в духе bison'а и удобнее и быстрее, и ошибки внятные дает... Простенький скриптовый интерпретатор (процедурное подмножество сишки или паскаля) без замашек на производительность на связке bison+flex ваяется за вечер...
        
        А для простых грамматик можно что-нибудь навелосипедить. Выйдет короче и понятней чем спирт. А главное компилиться будет быстро ;)
        Ответить
        
        1024-- 07.10.2013 17:30 # 0
        
        > вы вообще с какой целью интересуетесь?
        В основном - для своего развития и повышения компетентности.
        Довелось мне писать парсер. Буст использовали не самый новый, новоспирита там ещё не было. Парсер работает, подкрутить грамматику для изменений в будущем я могу, но не чувствую контроля над ситуацией.
        Хотелось бы всё осознать и отвязаться если не от периодических заглядываний в документацию, то хотя бы от периодических заглядываний в примеры.
        Ответить
        
        crastinus 01.10.2013 21:14 # +1
        
        Ты хорошо понимаешь, потому что спирит строился по аналогии со стандартными потоками ввода/вывода.
        
        qi::rule<string::const_iterator,int()>
        развернутое до POD будет выглядеть так:
        http://pastebin.com/YGnTLEtE
        Ответить
        
        roman-kashitsyn 01.10.2013 21:21 # +2
        
        dear::god<please<make<it<stop...> > > >
        Ответить
        
        Stertor 03.10.2013 22:31 # 0
        
        Не груби.
        Ответить
  - Dummy00001 30.09.2013 17:37 # 0
    
    "городить FSM"
    
    мелкую FSM (которая будет правильно обрабатывать отсутствие последнего перевода строки) можно и в десяток строк вместить. даже FSM ее не обязательно называть.
    
    можно чуть больше строк написать и "нагородить" еще и нахождение терминатора строки.
    
    потому что даже с strtok() тебе все равно нужно состояние что бы определить что после последнего разделителя нет больше строки vs. есть пустая строка.
    Ответить
    - bormand 30.09.2013 18:07 # 0
      
      > которая будет правильно обрабатывать отсутствие последнего перевода строки
      А с getline'ом файл отлично обрабатывается и без FSM (т.к. подобная FSM инкапсулирована в сам getline).
      
      У меня проблема то возникла при парсинге сообщений в духе "111|222|aaa|bbb". Начал писать к парсеру тесты, и напоролся на этот failbit при "111|222|aaa|". Подключил boost::tokenizer (т.к. свой gettoken писать банально и скучно, а разобраться с незнакомым мне куском буста не повредит), и пошел плакаться на ГК ;)
      Ответить
      - Dummy00001 30.09.2013 18:28 # +2
        
        > У меня проблема то возникла при парсинге сообщений в духе "111|222|aaa|bbb".
        
        в некоторых случаях я забиваю на эффективность, и делаю аналог перлового/этц split() с помощью string::find_first_of (C++ аналог strpbrk), сигнатура:
        
        std::vector<std::string> split( const std::string &, int max_items = INT_MAX );
        
        догадываюсь что тормозит, но по барабану - потому что мне важнее что работает надежно.
        Ответить
        
        bormand 30.09.2013 18:41 # +1
        
        Ну в том же Qt есть QString::split(), он даже по регулярке умеет. Если бы проект был с Qt - поюзал бы.
        
        > догадываюсь что тормозит
        Если не гигабайтные файлы парсить - не будет :)
        
        > важнее что работает надежно
        +1
        Ответить
        
        roman-kashitsyn 30.09.2013 18:49 # +2
        
        Я бы написал такую сигнатуру
        template <typename CharType, typename OutputIterator> void split(const std::basic_string<CharType> & s, CharType d, OutputIterator out, std::size_t max = std::basic_string<CharType>::npos);
        С приходом c++11 split, возвращающий вектор, достаточно эффективен (даже в c++03 он может быть эффективен при наличии RVO или NRVO).
        Ответить
        
        bormand 30.09.2013 18:57 # +1
        
        Имхо, лучше сделать токенный итератор как в boost::tokenizer. Вектор, возвращенный split'ом потом один хрен обходить придется. И будет или v[i++] или p = v.begin(); .. *p++; или цикл с оными. Может, конечно быть v[0], v[1], .., но оно почти всегда легко сводится к итератору. А итератор тут окажется эффективней (по крайней мере по расходу памяти).
        
        P.S. Хотя с другой стороны split, возвращающий вектор, может сразу найти какие-то форматные ошибки. А с итератором мы о них узнаем только в ходе разбора.
        Ответить
        
        roman-kashitsyn 30.09.2013 19:00 # +2
        
        С моим вариантом сигнатуры можно передать в качестве OutputIterator объект-сопрограмму, поглощающий элементы по мере присваивания
        Ответить
        
        bormand 30.09.2013 19:09 # 0
        
        Осторожней, а то так и до хаскелевого ленивого ввода-вывода можно докатиться...
        Ответить
        
        roman-kashitsyn 30.09.2013 19:18 # +1
        
        Кондуиты наше всё
        
        Задачка тут у нас есть - преобразовать большой xml в много маленьких json. Проблема в том, что используемые xml и json библиотеки работают через коллбэки, вызывая функторы с соответствующими объектами на входе. Обе хотят управление, что в плюсах неудобно.
        
        Мораль: люди, делайте нормальные итераторы, пишите пулл-парсеры, не забирайте управление.
        Ответить
        
        bormand 30.09.2013 19:23 # +1
        
        Эм, ну если с парсером xml я еще понимаю (видимо обычный SAX), то с json-генератором я в раздумиях. Зачем ему нужно управление и коллбеки? Он же, по идее, должен быть пассивным классом, у которого дергают функции для записи элементов (ну или отдают ему заранее наполненный JSONObject)?
        Ответить
        
        roman-kashitsyn 30.09.2013 19:31 # +1
        
        там интерфейс вида
        objBuilder.put(const std::string & key, function<void(ObjectBuilder)> callback)
        Коллбэк вызывается с билдером, который конструирует подобъект. Почему так сделали, я не знаю.
        Ответить
        
        bormand 30.09.2013 19:40 # +1
        
        Изврат какой-то. Это ж по коллбеку на ноду.
        Хотя с DOM'ом оно бы неплохо скрестилось.
        
        > Почему так сделали, я не знаю.
        Поди под работу с DOM'ом или подобными иерархиями заточено.
        Ответить
        
        gost 11.04.2019 17:21 # +1
        
        Именно поэтому я за «rapidjson».
        
        writer.StartObject(); writer.String("key"); writer.String("value"); // writer.Int(42); // writer.Double(42.0); // ... writer.String("array_key"); writer.BeginArray(); writer.Int(43); writer.String("44"); writer.Bool(true); writer.EndArray(); writer.EndObject(); /* { "key": "value", "array_key": [43, "44", true] } */
        Ответить
        
        PACTPOBblu_nemyx 11.04.2019 18:21 # 0
        
        Прикокококольно. Можно генерировать объекты и массивы любого уровня вложенности? BeginArray()...EndArray() работают с внутренним стеком?
        Ответить
        
        Steve_Brown 11.04.2019 18:35 # 0
        
        Может быть, достаточно просто хранить одно число - уровень вложенности. Да и то только для красивых индентов. Но это не точно.
        
        Впрочем, вопрос о максимальном уровне вложенности уже вызывает вопросы. Что ты такое хочешь сделать, извращенец?
        Ответить
        
        BOKCEJIbHblu_nemyx 11.04.2019 18:39 # +1
        
        > только для красивых индентов.
        Ну проверять незакрытые/лишние скобки то надо.
        Ответить
        
        Steve_Brown 11.04.2019 18:44 # +2
        
        Ну да, еще проверка ошибок. Но если не ошибаться, то не надо.
        Ответить
        
        PACTPOBblu_nemyx 11.04.2019 18:55 # +3
        
        <?php class rapidjson { private $data = ''; public function StartObject() {$this->data .= '{';} public function EndObject() {$this->data .= '}';} public function BeginArray() {$this->data .= '[';} public function EndArray() {$this->data .= ']';} public function Int($value) {$this->data .= strval(intval($value)) . ', ';} public function Key($value) {$this->data .= '"' . addslashes($value) . '": ';} public function String($value){$this->data .= '"' . addslashes($value) . '", ';} public function Bool($value) {$this->data .= '"' . ($value ? 'true' : 'false') . '", ';} public function __toString() {return $this->data;} } $writer = new rapidjson(); $writer->StartObject(); $writer->Key("key"); $writer->String("value"); $writer->Key("array_key"); $writer->BeginArray(); $writer->Int(43); $writer->String("44"); $writer->Bool(true); $writer->EndArray(); $writer->EndObject(); echo $writer;
        
        https://ideone.com/HdzxT8
        Ответить
        
        PACTPOBblu_nemyx 11.04.2019 19:01 # +1
        
        В методе Bool я напрасно вставил кавычки. Какой анскилл )))
        Ответить
        
        gost 11.04.2019 19:58 # +1
        
        В «JSON» нельзя ставить запятую после последнего элемента. Какой анскилл )))
        Ответить
        
        PACTPOBblu_nemyx 11.04.2019 20:27 # 0
        
        В моём примере вообще с запятыми всё плохо.
        
        Мы уже работаем над тем, чтобы пофиксить это в следующей версии.
        Ответить
        
        OCETuHCKuu_nemyx 11.04.2019 20:47 # 0
        
        class rapidjs {
        
        /fixed
        Ответить
        
        Steve_Brown 11.04.2019 19:37 # 0
        
        - А где можно скачать эту библиотеку?
        - А вот она!
        Ответить
        
        OCETuHCKuu_nemyx 11.04.2019 20:43 # 0
        
        Какой багор )))
        Ответить
        
        gost 11.04.2019 19:56 # +1
        
        Ага.
        http://rapidjson.org/md_doc_sax.html
        
        Причём есть даже «PrettyWriter», который на выходе даст отформатированный JSON.
        Ответить
        
        gost 11.04.2019 20:03 # +1
        
        Ну и краткий «fuckyou» «FAQ»:
        http://rapidjson.org/md_doc_faq.html
        Ответить
        
        BOKCEJIbHblu_nemyx 11.04.2019 18:34 # 0
        
        Именно поэтому я за 'J':
        load 'convert/json' enc_json ('key';'array_key') ,: 'value';<43;'44';'json_true' {"key":"value","array_key":[43,"44",true]}
        Ответить
        
        Dummy00001 30.09.2013 19:16 # 0
        
        не, извращение.
        
        твой сплит ничего не возвращает. к нему join() не прикрутишь: join( sep1, split(str, sep2) ); (или еще лучше: join( sep1, apply( split(str, sep2), func1 ) ); )
        
        и в добавок можно всегда результат на экран дампнуть.
        
        в добавок генерализировать токое, по личному опыту, уже давно не пытаюсь. если мелкие тривиальные разницы типа: сплит по строке, сплит по набору символов, мержить соседние сплитеры или нет, сплитить только первые Н подстроки (хвост целеком пихать в последний элемент).
        
        PS я скопипастил сигнатуру именно из того одного места где у меня сплит не имеет аргумент разделитель! он там в пробелы захордкожен (симулирует split /\s+/).
        Ответить
        
        bormand 30.09.2013 19:20 # 0
        
        > твой сплит ничего не возвращает. к нему join() не прикрутишь
        Он третьим аргументом передаст какой-нибудь join_iterator:
        
        std::string result; split(str, sep2, join_iterator(result, sep1));
        Ответить
        
        Dummy00001 30.09.2013 19:31 # +1
        
        уговорил.
        
        но мне все равно писание задом наперед, к чему С++ с итераторами и функтоидами подталкивает, не нравится.
        
        я предпочитаю прямолинейный функциональный код.
        
        собственно говоря, первый split()/join() (а так же keys() и values() для мапов) у меня в С++ появились когда меня просто трахание с итераторами достало в одном пруф-оф-консепт'е. тормозило заметно, но работало.
        
        до этого еще пытался эмулировать слайсы с помощью std::pair<iterator,iterator>, но оно сосало немеряно (в оссобенности когда второй итератор инвалидировался).
        Ответить
        
        bormand 30.09.2013 19:48 # 0
        
        > с итераторами
        Да не, все-таки итераторы это не задом-наперед.
        // split возвращает итератор // join принимает итератор join(split(str, sep2), sep1) // между ними можно вставить еще какие-то преобразования
        Ну а вообще - итераторы удобны только для потоковой обработки. Если надо рандомный доступ - лучше ваши split'ы и join'ы (или их Qt'шные аналоги, если проект на Qt).
        Ответить
        
        roman-kashitsyn 30.09.2013 19:26 # +4
        
        > твой сплит ничего не возвращает. к нему join() не прикрутишь
        Функциональщиной в крестах балуетесь?
        
        continuation passing style же
        split(str, sep2, transform_with(func1, join_with(sep1, handle_string)))
        Ответить
        
        Dummy00001 30.09.2013 22:06 # +2
        
        какой-то лисп уже получается.
        
        только же опять задом наперёд...
        Ответить
        
        bormand 01.10.2013 05:15 # +1
        
        > задом наперёд
        Forth :)
        Ответить
    - anonimb84a2f6fd141 30.09.2013 18:20 # +1
      
      >мелкую FSM
      А что, русского термина нету? Конечный автомат же.
      Ответить
- guest 01.10.2013 22:53 # −3
  
  >>"С древних времен программисты разделились на два лагеря: остроконечников и тупоконечников."
  
  остроконечников, тупоконечников и хуеконечников
  Ответить
  - guest 04.10.2013 14:14 # +2
    
    Малограмотный идиот, не читавший Свифта детектед.
    Ответить

Dummy00001 30.09.2013 16:30 # +2

> good=0 bad=0 fail=1 eof=1

лично по граблям не ходил, но наблюдал людей которые пытались обработать ошибки ввода в iostream. как правило их отличает от нормальныю людей тенденция стучатся головой по стенке. в паре мест у нас народ просто забил и переписал на stdio.

к слову, по крайней мере в старой версии гнутой stl, можно было добится что бы все четыре флага были выставлены. последовательности уже не помню, но по сырцам я ее находил. а по сырцам я лазил пытаясь понять накой фиг их там 4ре и чем они отличаются друг от друга.

ЗЫ Согласно вот этому: http://www.cplusplus.com/reference/ios/ios/fail/ - "failbit is generally set by an operation when the error is related to the internal logic of the operation itself;" Другими словами std::getline() призналась что в ней есть ошибка... Вообщем вынос мозгов.

Ответить

bormand 30.09.2013 16:34 # 0
Ну как я понимаю их логику - badbit это внешняя трабла (обрыв сокета, ошибка фс), а failbit это логическая ошибка (вместо числа подсунули мусор, чтение за концом файла), ну а eofbit это как сишный feof().

failbit в этом месте вполне логичен для основного применения getline:
```
while (std::getline(stream, line)) {
    // ... process line ...
}
```
Но вот для других разделителей он там только мешается.
Ответить
- bormand 30.09.2013 16:43 # 0
  
  > вполне логичен
  Ну вернее как. Он вполне логичен как костыль, позволяющий работать с файлами обеих типов одинаково, не обрабатывая лишнюю пустую строку.
  Ответить
roman-kashitsyn 30.09.2013 16:39 # 0

Абстракции такие абстракции
Ответить
- bormand 30.09.2013 16:49 # +7
  
  Да такое ощущение, что тут повторяется история вавилонской башни: бог дал программистам кодировки, big и little endian, LF как сепаратор и как терминатор, окончания строк на CR/LF/CR+LF, чтобы они холиварили, и не могли написать ничего взаимодействующего друг с другом ;)
  Ответить
  - Stertor 01.10.2013 19:45 # −4
    
    < повторяется история вавилонской башни>
    То-то я смотрю, как распухают дистрибьютивы линукса (это при том, что ядро весит около ~100 мб), а он как был жопой, так ей и остается. Не зря их логотип напоминает сфинктер с геморроидальными шишками.
    Ответить
    - guest 01.10.2013 20:54 # −10
      
      показать все, что скрыто
      Добро пожаловать на ГовноХабр! * g o a t s e x * g o a t s e x * g o a t s e x * g g o / \ \ / \ o a| | \ | | a t| `. | | : t s` | | \| | s e \ | / / \\\ --__ \\ : e x \ \/ _--~~ ~--__| \ | x * \ \_-~ ~-_\ | * g \_ \ _.--------.______\| | g o \ \______// _ ___ _ (_(__> \ | o a \ . C ___) ______ (_(____> | / a t /\ | C ____)/ \ (_____> |_/ t s / /\| C_____) | (___> / \ s e | ( _C_____)\______/ // _/ / \ e x | \ |__ \\_________// (__/ | x * | \ \____) `---- --' | * g | \_ ___\ /_ _/ | g o | / | | \ | o a | | / \ \ | a t | / / | | \ |t s | / / \__/\___/ | |s e | / | | | |e x | | | | | |x * g o a t s e x * g o a t s e x * g o a t s e x *
      Ответить
      - crastinus 01.10.2013 21:04 # −1
        
        Может постить статистику после таких сообщений
        Ответить
        
        guest 01.10.2013 21:14 # +3
        
        _.----. .-" \-. / ; \ : /: \ ; .' ; ; ; .-" : : : _.+( .-- : : ; ; <o> '<o> : : ; : ; ; : ; - : : ) ' .-. ' : ( '. `"' .' ; "-._.:`---':-"-.'+' ; ; " _..__.-. -. (: ,' .:(o); "-._ : _: 0 ; \`. ; .'/.\-/-. `: : : : -U--:"-. \ ; ; ; : ----; "-.L.-" \ '. ' \ ---( ;O: ; \ '. '-;-' :-: : `. ""/ ; : ; ""T .-": :`. / : --"" : ; Y ; ; : : : : ; ; ; : ; : : : ; : ; \ ; : ; : \_ : : \ \"-. ; ; \ `. "-. : : c \ `./"-._ ; : \ \ "-. : ; `. ;-. -.`. : : __..--"" \ : `.\.`.\ ; :_..--""; ; _.-'\ ; ")))T : ; _L.-'"" ; : '-=' ; :_..--"" : ; / ; ;; : .' / ;: J `. / ;'" :-.' /\ ; ; / ; : : / : : ; / ; : : / bug ; : ; / : : : / : :
        Ответить
        
        Stertor 01.10.2013 22:54 # −5
        
        показать все, что скрытоХах. Единственная пизда на всея сайте.
        Ответить
        
        anonimb84a2f6fd141 02.10.2013 00:06 # 0
        
        И в 2 кб влез?
        Ответить
        
        anonimb84a2f6fd141 03.10.2013 17:25 # +1
        
        А почему у нее баг между ног?
        Ответить
        
        Stertor 03.10.2013 19:31 # 0
        
        Этот баг - извечная головная боль всех мужчин -программистов
        Ответить
        
        anonimb84a2f6fd141 03.10.2013 19:54 # 0
        
        Так это не баг, это фича. Или баг в том, что фичи нету?
        Ответить
        
        Stertor 03.10.2013 19:55 # 0
        
        #define true (Math.random()>0.5)
        Ответить
        
        TarasB 04.10.2013 14:23 # 0
        
        инопланетянка что ли? лицо длиннющее, тело дистрофичное
        Ответить
        
        anonimb84a2f6fd141 07.10.2013 19:12 # 0
        
        То причес, или действительно лоб как у Кайли Миноуг.
        Ответить
        
        LispGovno 04.12.2013 20:49 # 0
        
        Крыша поехала
        Ответить
    - crastinus 01.10.2013 21:02 # 0
      
      >при том, что ядро весит около ~100 мб
      ~3 мб
      > он как был жопой, так ей и остается.
      .NET в винде весит каких-то 1.5 ГБ, а она как оставалась жопой так и остается.
      Я ведь рассказывал о работе своих прог в винде. Когда .NET 4 прогу я переношу с семерки на хрюшу половина функционала исчезает))
      Ответить
      - guest 01.10.2013 21:12 # 0
        
        Если прогу понадобилось переносить как ты выразился "с семерки на хрюшу", можно сделать нелестный вывод о программисте.
        Ответить
        
        crastinus 01.10.2013 21:15 # −1
        
        Поясни
        Ответить
        
        guest 01.10.2013 21:17 # +1
        
        Тупое быдло.
        Ответить
        
        crastinus 01.10.2013 21:20 # 0
        
        Все кто использует хоть что-то устаревшее это тупое быдло. Гениально, маэстро.
        Ответить
        
        guest 01.10.2013 21:24 # +1
        
        ОМГ. Разрабатывал прогу на семерке, и вдруг с какого-то перепугу перенес ее на XP. Это нормально?
        Ответить
        
        crastinus 01.10.2013 21:32 # −2
        
        >Разрабатывал прогу на семерке
        Разрабатывал прогу в платформонезависимом фреймворке, перенес ее на чуть другую платформу с тем же фреймворком и не работает. Это нормально?
        Ответить
        
        bormand 01.10.2013 21:54 # +4
        
        ФРЕЙМВОРКОПРОБЛЕМЫ
        
        P.S. Кстати 4.0 или 4.5, не помню какой точно, на хрюше уже не идет.
        Ответить
        
        guest 01.10.2013 21:57 # 0
        
        Выходит, он еще и врун.
        Ответить
        
        bormand 01.10.2013 22:02 # +3
        
        > он еще и врун
        Да почему, может быть 4.0 еще идет, а 4.5 - уже нет. Я не помню когда они поломали совместимость, т.к. первый и последний .net, под который я кодил неделю-две имел версию 2.0 :)
        
        Просто я недавно пытался поставить на виртуалку 2013ю визуал студию экспресс, и нужный ей фреймворк не встал на хрю. Пришлось корячить семерку в виртуалбокс...
        Ответить
        
        guest 01.10.2013 22:50 # 0
        
        >> виртуалбокс...
        Виртуалишь?
        Ответить
        
        3.14159265 08.10.2013 13:32 # +4
        
        .NET феноменально ебанутая платформа. Собственно потому лучше её не использовать.
        
        Жабу, ту и вовсе используя различные ухищрения можно компилить и запускать хоть под 1.4 и ниже, хоть под 1.1.
        
        Байт-код ведь всё тот же. Проблемы только с новыми классами, которые можно собрать и подложить. И новой моделью памяти в 1.5.
        Ответить
        
        Stertor 08.10.2013 14:33 # 0
        
        Плюсануууууууууууууууууууууууууул.
        +1
        Ответить
        
        anonimb84a2f6fd141 05.12.2013 03:04 # 0
        
        Если последние 15 лет ничего не менять, то и ломаться нечему. Ну привязка к версиям винды - это фирменная фича МС, мать его.
        Ответить
        
        crastinus 02.10.2013 05:59 # −1
        
        Нет, выходит, что ты почетный член хора мальчиков-евнухов им. Балмера.
        Ответить
        
        anonimb84a2f6fd141 02.10.2013 00:12 # −1
        
        Это не там где async появился?
        Ответить
        
        crastinus 02.10.2013 05:58 # −1
        
        Если бы не шел, то программа бы не запускалась. Точно также и с декларант-алко (.NET 2.0 и тоже хуета с половиной функционала).
        Ответить
        
        anonimb84a2f6fd141 02.10.2013 00:12 # −1
        
        Да, кстати, вроде в оригинале (java) смысл байткода - в портируемости, а в дотнете все один хуй работает только под нужными версиями винды. Правда, есть моно.
        Ответить
        
        TarasB 04.10.2013 14:24 # +1
        
        Ну и какого хуя программа так написана, что работает в 7ке, но не работает в хрюше?
        Ответить
        
        guest 04.10.2013 15:20 # +1
        
        Видите ли, это разные операционные системы.
        Ответить
        
        Stertor 04.10.2013 16:18 # 0
        
        можно подумать, что в семерке API иные, нежели в XP.
        Ответить
        
        bormand 04.10.2013 16:59 # 0
        
        Там их, внезапно, чуть больше ;) Ну и юзая новые фишки теряешь совместимость со старыми осями. Чем никого не удивить. Это не только в винде так.
        Ответить
        
        Stertor 04.10.2013 18:19 # 0
        
        Чуть больше - для приукрашивания и тп, но фундаментальные api те же. Просто кое-кто навернулся с семеркой, бля, что и говорить..
        Ответить
        
        defecate-plusplus 04.10.2013 18:23 # +1
        
        нет, не чуть
        многие системные вещи были написаны, переписаны и дописаны
        даже есть нюансы между сервис-паками сраной xp, о чем и говорить
        или ты хочешь сказать, что апи 15 летней давности должно хватать и поныне?
        Ответить
        
        Stertor 04.10.2013 18:36 # 0
        
        >> сраной xp
        У Вас, простите, все в порядке?
        
        Коды ошибок иные, во всяком случае на дельфях. Я уже обжегся. Я просто имею в виду, что суть неизменна. Иначе это была бы уже не винда.
        Ответить
        
        Stertor 04.10.2013 18:27 # +2
        
        Помню, писал скинизацию для свой проги, при тестировании оказалось, что на win2000 нет библиотеки тем uxtheme.dll, прога падала. Можно было тупо забить на 2000: подумаешь, у
        кого она еще стоит, главное, чтобы прога на xp/vista/7 шла, и т.п. -
        но я не такой человек! Пришлось упорно колдовать. Окончательный вариант: прога определяет версию ОС и в зависимости от
        этого включает ту или иную отрисовку.
        Кстати, Delphi 7 работает начиная с win98 и кончая семеркой, а вот Delphi 2009 и все последующие - уже нет, так как они юникодные.
        Ответить
        
        anonimb84a2f6fd141 07.10.2013 21:38 # +1
        
        Лучше дропнуть 9x, чем то, что в тотале до сих пор нет нормального юникода, зато, видите ли, работает под 9х. Алсо, unicows.dll.
        Ответить
        
        bormand 08.10.2013 06:23 # +1
        
        > зато, видите ли, работает под 9х
        Он на делфи 6 вроде написан. И автор обновляться вроде как не собирается. Есть вероятность, что у него винда 9х, и в ней больше ничего не идет...
        
        P.S. А в той же кутишке где-то до 4.3 были и юникод и поддержка 98 винды. :)
        
        P.P.S. А еще в 98й вроде бы нет поддержки больших файлов (4 гига и больше), т.к. еще не было 64 битных перемоток, да и фат один хер такие файлы не понимает.
        Ответить
        
        anonimb84a2f6fd141 08.10.2013 06:44 # +1
        
        Да Гислер интервью давал по этому поводу. Не помню, что он там нес, что-то про размер экзешника. Хуею я с этого парня.
        Ответить
        
        Stertor 08.10.2013 14:37 # 0
        
        >>Он на делфи 6 вроде написан
        Гисслер до сих пор сидит на 2-ой или 3-ей Делфи. Я был в шоке, когда узнал. Что это - нежелание раскошеливаться на новый компилятор или попытка сохраненить свой статус "тру-кодера": (форма готовая есть, классы есть, руки есть, голова есть. Что еще надо для кодинга???)
        Ответить
        
        TarasB 08.10.2013 15:12 # 0
        
        меньше размер исполняемого файла, все баги известны и привычны, фичи не так и нужны
        Ответить
        
        anonimb84a2f6fd141 05.12.2013 03:05 # +1
        
        Юникод в файловом менеджере не нужен? Совсем некуда спешить?
        Ответить
        
        anonimb84a2f6fd141 05.12.2013 03:28 # +1
        
        http://www.softkey.info/reviews/review9900.php вот то замечательное интервью.
        
        >Есть и приятные моменты. Например, полная поддержка Unicode в TC была написана мной вручную, тогда как в Lazarus все контролы изначально поддерживают Unicode и базируются на UTF-8.
        Ответить
        
        anonimb84a2f6fd141 05.12.2013 17:15 # +1
        
        Широко известный факт, что вы до сих пор пишете свой файл-менеджер на допотопном Delphi 2. С чем это связано?
        
        Я являюсь обладателем лицензионных версий всех последних Delphi, поэтому я достаточно хорошо представляю себе их возможности. Но дело тут вот в чем: компиляция exe-файла в Delphi 2 дает на выходе файл, ощутимо меньший по размеру, чем, например, в Delphi 7. Кроме того, тестирование показывает, что exe'шник из-под Delphi 2 работает заметно быстрее, чем его полный аналог, выпущенный компилятором Delphi 7. Я сталкиваюсь с тем, что люди часто удивляются, что Total по-прежнему работает очень быстро. Я собираюсь сохранить эту его особенность, и отчасти секрет тут в правильно выбранном компиляторе.
        
        Добавлю, что, кроме того, Delphi 2 генерирует очень универсальный код, например, с полной поддержкой 16-битовых приложений или Windows 95/98 - у меня до сих пор хватает таких клиентов. В то же самое время TC прекрасно себя чувствует и в Windows 7.
        Ответить
        
        Stertor 05.12.2013 17:40 # +2
        
        Он
        сказал одну очень умную мысль, которая запала мне в душу: не стоит
        увлекаться скинами - интерфейс такой программы выглядит вычурно на фоне
        остальных окон.
        Ответить
        
        anonimb84a2f6fd141 05.12.2013 18:26 # +1
        
        Зависит от софта. Для видеоредакторов - маст хев, для более сурьезных программ - не обязательно.
        Ответить
        
        anonimb84a2f6fd141 06.12.2013 00:05 # 0
        
        >Для видеоредакторов
        Для плееров конечно же.
        Ответить
        
        crastinus 07.10.2013 21:09 # 0
        
        хз. Не разбирался.
        Ответить
      - anonimb84a2f6fd141 02.10.2013 00:09 # +1
        
        Есть такие "спермопроблемы", если честно, мне это в мрикософте давно не нравится: во-первых, все не портабельно, не стоит фреймверк на винде - хуй соси, во-вторых, все жутко завязано на ось. Все новые фичи только под последнюю ось, так больше никто не делает. Жава чуть ли не под win32 работает. Но не вендой единой, андроид тоже так себя вроде ведет.
        Ответить
        
        bormand 02.10.2013 08:23 # +1
        
        > андроид тоже так себя вроде ведет
        Да не, у андроида совместимость годная. Ну настолько, насколько ее вообще можно сделать годной для такого зоопарка устройств и осей.
        
        Тут дело скорее в писателях софта, которые не хотят париться и поддерживать 2.х (меньше стандартных компонентов, нету некоторых апишек, или же нужно подключать compat либу, чтобы они эти апишки юзать и т.п.), и выбирают минимальное сдк повыше...
        Ответить
        
        anonimb84a2f6fd141 03.10.2013 17:26 # +1
        
        У него тоже апи работают начиная с определенных версий оси, слава богу, что, вроде бы, в новых версиях этот карнавал прекратили.
        Ответить
        
        Stertor 04.10.2013 16:19 # 0
        
        Зоопарк и есть.
        Ответить

Yuuri 02.10.2013 10:46 # +3

«The Good, the Bad and the Fail»

Ответить

PACTPOBblu_nemyx 11.04.2019 16:29 # 0

Ничего не понимаю. Переведи на «русский».
Ответить

guest8 10.04.2019 17:01 # −999

Говнокод: по колено в коде.

C++ / Говнокод #13873

Комментарии (245) RSS

Добавить комментарий