Говнокод #25395 — C++ — Говнокод.ру

C++ / Говнокод #25395

+1
1. 01
2. 02
3. 03
4. 04
5. 05
6. 06
7. 07
8. 08
9. 09
10. 10
11. 11
12. 12
13. 13
14. 14
15. 15
16. 16
17. 17
18. 18
19. 19
20. 20
21. 21
22. 22
23. 23
24. 24
25. 25
26. 26
27. 27
28. 28
29. 29
30. 30
31. 31
32. 32
33. 33
34. 34
35. 35
36. 36
37. 37
38. 38
39. 39
40. 40
41. 41
42. 42
43. 43
```
// https://github.com/CVC4/CVC4/blob/14b9dbaa0c9e8dce52d1a28595dc1cc80756abed/src/expr/pickler.cpp


static Block mkBlockBody4Chars(char a, char b, char c, char d) {
  Block newBody;
  newBody.d_body.d_data = (a << 24) | (b << 16) | (c << 8) | d;
  return newBody;
}

static char getCharBlockBody(BlockBody body, int i) {
  Assert(0 <= i && i <= 3);

  switch(i) {
  case 0: return (body.d_data & 0xff000000) >> 24;
  case 1: return (body.d_data & 0x00ff0000) >> 16;
  case 2: return (body.d_data & 0x0000ff00) >> 8;
  case 3: return (body.d_data & 0x000000ff);
  default:
    Unreachable();
  }
  return '\0';
}

// ...

void PicklerPrivate::toCaseString(Kind k, const std::string& s) {
  d_current << mkConstantHeader(k, s.size());

  unsigned size = s.size();
  unsigned i;
  for(i = 0; i + 4 <= size; i += 4) {
    d_current << mkBlockBody4Chars(s[i + 0], s[i + 1],s[i + 2], s[i + 3]);
  }
  switch(size % 4) {
  case 0: break;
  case 1: d_current << mkBlockBody4Chars(s[i + 0], '\0','\0', '\0'); break;
  case 2: d_current << mkBlockBody4Chars(s[i + 0], s[i + 1], '\0', '\0'); break;
  case 3: d_current << mkBlockBody4Chars(s[i + 0], s[i + 1],s[i + 2], '\0'); break;
  default:
    Unreachable();
  }

}
```
Очередное переизобретение какой-то байтоебской поеботы типа ntohl(). И вообще, тут UB.

Запостил: j123123, 21 Февраля 2019

Tweet
Комментарии (94) RSS
- Hu3KoypoBHeBblunemyx 21.02.2019 21:27 # +2
  
  Hakuna matata! В программах на "Си" или "C++" всегда есть какой-нибудь UB.
  Ответить
- Elvenfighter 22.02.2019 19:19 # 0
  
  А где, собственно , UB?
  
  P.S. s.size() >= std::numeric_limits<unsigned>::max() - 4 наверняка вылетит по памяти значительно раньше. Но "cover my ass" assert можно и вставить.
  Ответить
  - bormand 22.02.2019 19:37 # 0
    
    Ну, к примеру, на шестой строке.
    Ответить
    - 6E3yMHblu_nemyx 22.02.2019 19:42 # 0
      
      Надо заранее указать тип контейнера для результата, чтобы не было переполнения, иначе тупой компилятор может попытаться сдвинуть char на 24 разряда?
      
      Что-то типа (uint32_t)a << 24 или static_cast?
      Ответить
      
      bormand 22.02.2019 19:52 # +1
      
      Не, char он таки превратит в int перед сдвигом.
      
      Но int во-первых хуй знает какого размера. А во-вторых сдвиг знакового числа влево до упора ничем хорошим не закончится (даже при 32-битном инте).
      Ответить
      
      6E3yMHblu_nemyx 22.02.2019 19:57 # 0
      
      У d_data и у char знаковость разная?
      Ответить
      
      bormand 22.02.2019 20:00 # 0
      
      Это уже не важно.
      Ответить
      
      6E3yMHblu_nemyx 22.02.2019 20:24 # +2
      
      А что важно?
      
      UB существует только в «C» и «C++». В других языках программирования никаких UB нет, именно поэтому я за другие языки.
      Ответить
      
      bormand 22.02.2019 20:24 # 0
      
      > что важно
      1) число знаковое и может быть отрицательным
      2) его двигают влево
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 08:35 # 0
      
      > UB существует только в «C» и «C++»
      "UB" существует во всех низкоуровневых языках с претензией на переносимость и у которых больше одной реализации. Даже у разных процов линейки "x86" в некоторых ситуациях было разное поведение на разных процах (щас точно не помню все, помню что была хуита с чтением слова по адресу FFFF, в одних процах байт читался из следующего сегмента, в других из начала текущего, остальных нагуглить/наяндексить не могу, они советуют мне посмотреть "Свойства системы"), так в стародавние времена определяли на каком проце мы запущены.
      Ответить
      
      bormand 23.02.2019 10:37 # 0
      
      Когда на одном проце так, а на другом по-другому - это implementation defined. С этим можно жить.
      
      UB хуже. С ним даже доки по железу и конпелятору тебе не помогут.
      
      И, на самом деле, UB есть и во вполне высокоуровневых языках. Просто они там довольно очевидные. Гонки между потоками, к примеру.
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 10:51 # 0
      
      > у разных процов [...] было разное поведение на разных процах
      Мда, надо бы как-нибудь выделить денёк, чтобы выспаться.
      Ответить
      
      bormand 24.02.2019 07:39 # 0
      
      > низкоуровневых языках
      А уж в железе сколько UB'ов...
      Ответить
      
      guest8 24.02.2019 14:03 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      6E3yMHblu_nemyx 24.02.2019 17:10 # 0
      
      Открою секрет: цифровое железо –— это абстракция. В любом железе хоть на какое-то время появляются сигналы, уровень которых между нулём и единицей.
      
      В первых пятивольтовых микросхемах ТТЛ входной сигнал в интервале от 2,5 вольт до 5 воспринимался как единица, от 0 до 0,5 вольт –— как ноль, а вот сигнал в интервале 0,5...2,5 вольт был UB.
      Ответить
      
      bormand 24.02.2019 20:41 # +1
      
      Именно поэтому поверх этой абстракции навернули ещё одну - синхронную логику, где все триггеры переключаются одновременно (более-менее).
      Ответить
      
      bormand 24.02.2019 20:50 # +1
      
      З.Ы. А на границе синхронного домена стоят многослойные синхронизаторы, которые пытаются не пустить UB внутрь...
      Ответить
      
      cmepmop 22.02.2019 20:32 # 0
      
      А поместицца ли в int гугол?
      Ответить
      
      bormand 22.02.2019 20:34 # +2
      
      На этот вопрос легко ответить - это undefined behavior.
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 08:38 # 0
      
      В "Python" да. Именно поэтому я за "Python".
      Ответить
      
      guest8 23.02.2019 19:21 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 23.02.2019 19:51 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:00 # 0
      
      > по последнему биту
      А такое решение довольно часто юзают для интерпретаторов.
      Ответить
      
      guest8 23.02.2019 20:04 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:10 # +1
      
      Ну иначе ты ещё одно слово потратишь или вообще мелкие числа в куче будешь аллоцировать.
      
      В какой-то реализации лишпа вроде 2 бита откусывали.
      Ответить
      
      guest8 23.02.2019 20:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 20:15 # +1
      
      Во всяких питонах на sizeof в большинстве случаев похуй.
      Ответить
      
      guest8 23.02.2019 20:16 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 20:21 # 0
      
      Так ты про сишный sizeof штоле? А его можно поломать?
      Ответить
      
      guest8 23.02.2019 20:26 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:29 # 0
      
      Там точно такую поебень предлагали?!
      Ответить
      
      guest8 23.02.2019 20:30 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 20:30 # 0
      
      Не вижу здесь поломки sizeof.
      Ответить
      
      guest8 23.02.2019 20:32 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:35 # 0
      
      Да похуй на сайзоф. Можно функцию написать. Но эта хуйня только через указатель передаётся. Непонятно тогда зачем оптимизация. Куче похуй 4 или 8 байт хранить, всё равно блок 2 слова.
      Ответить
      
      guest8 23.02.2019 20:37 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:38 # 0
      
      Да ьам скорее всего те же лонги и лежат для пирфоманса.
      Ответить
      
      guest8 23.02.2019 20:39 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:43 # 0
      
      Если там байты - то они вообще пизданулись.
      Ответить
      
      guest8 23.02.2019 20:44 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 23.02.2019 20:40 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 20:42 # 0
      
      sizeof нормально работает, просто в сьруктурк вчех этих цифор нету, ведь sizeof всегда возращает только размер самой струкцуры. Будь она не в унионе была бы та же хуйря.
      Ответить
      
      guest8 23.02.2019 20:43 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:44 # 0
      
      Да похуй, если честно, главное чтобы профит какой-то был.
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 20:48 # +2
      
      > вернет неверный размер этой "структуры"
      Открою секрет, струкьуры в сишке фиксированного размера, никакой sizeof нигде тебе не будет читать поля структуры.
      
      > передачу по значению
      Жто же питно, в нём всё в куче, функции принимают только оказатели.
      
      > массив из такой хуни тоже не сделать
      указатели.
      Ответить
      
      guest8 23.02.2019 20:52 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 20:59 # 0
      
      > ХАК
      Если хак приносит профит - вай нот?
      Ответить
      
      guest8 23.02.2019 21:21 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 21:22 # 0
      
      Ну лишаем и лишаем. Хуй с ним. Мне насрать. Идиома (можешь называть её хаком) с массивом размера 0 или 1 в конце струк уры довольно часто юзается в сишке.
      Ответить
      
      guest8 23.02.2019 21:24 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      OCETuHCKuu_nemyx 24.02.2019 01:17 # 0
      
      Кто о чём, а борманд о хуях.
      Ответить
      
      1024-- 24.02.2019 01:15 # 0
      
      Этот хак стоит в исключениях стандарта потому, что массово используется?
      Или он проходит по стандарту и так?
      
      Что я вижу:
      * Выход за границу массива
      * Игнорирование перестановки полей структуры компилятором
      * Игнорирование паддингов, в которые нельзя писать
      Хотя, я всех тонкостей, разумеется, не знаю. Но, если учесть капризность стандарта и безумные правила для UB, любой другой код в аналогичной ситуации наткнулся бы на одну из этих проблем и улетел бы в UB.
      Ответить
      
      bormand 24.02.2019 05:32 # 0
      
      Х.з., походу массив в конце структуры - очередной специальный случай. Я не уверен, что это сработает для массива в середине.
      
      А переставлять поля и так нельзя.
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:03 # 0
      
      Джигиты это просто демонический массив, сама структура —– просто заголовок, с ней сайзов работает как положено. Никакой sizeof размер демонического моммива не вернёт. Тут всё норсально.
      
      А теперь приведи мне свою реализацию где sizeof бы работал как ты кочешь.
      Ответить
      
      guest8 23.02.2019 21:14 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:20 # 0
      
      dgigit[1] это просто хуйня для того чтобы можно было читать данные, а заодно и дополнительная память в юнионе, чтобы было где битик возводить. И в сишке это норма. Не зря же flexible arrays придумали.
      Ответить
      
      guest8 23.02.2019 21:22 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 23.02.2019 21:25 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bormand 23.02.2019 21:05 # +2
      
      Ну и с такими структурами обычно делают функцию в духе allocate_number() и не парятся с sizeof().
      Ответить
      
      guest8 23.02.2019 21:15 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      gost 23.02.2019 21:06 # 0
      
      > В сишке обычно структуры или юнионы имеют предсказуемый (получаемый через sizeof) размер
      С чего ты это взял?
      
      struct Peetooh { char *name; unsigned char color[3]; };
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:10 # 0
      
      Ну структура, в ней указатель и три чара. Шо тут не фуксировано?
      Ответить
      
      gost 23.02.2019 21:14 # 0
      
      Вот именно, что ничего — как и в примере восьмого гостя выше. А вот суммарный объём памяти, который будут занимать подобные структуры, вполне себе нефиксированный, что, по всей видимости, гостя и не устраивает.
      Ответить
      
      guest8 23.02.2019 21:17 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 23.02.2019 21:14 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      gost 23.02.2019 21:16 # 0
      
      >>> что вернет sizeof для этого униона?
      >>>
      union { long i; struct { unsigned long length; digit digits[1]; } bignum; };
      
      Размер long + sizeof(digit), что не так?
      Ответить
      
      guest8 23.02.2019 21:18 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:23 # 0
      
      В низкоуровневой сишке хаки —– ЭТО НОРМА!
      Ответить
      
      guest8 23.02.2019 21:25 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:16 # 0
      
      Я бы лучше этот пример привёл:
      struct petux { size_t size; char data[]; };
      У такой хуйни размер брать нельзя.
      Ответить
      
      guest8 23.02.2019 21:18 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:22 # 0
      
      Наоборот, это добавили в "C99".
      Ответить
      
      guest8 23.02.2019 21:23 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 23.02.2019 21:27 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:32 # 0
      
      Так не делай это говно! Нада в петуха совать укайзатель, томушо этот union только начало блока памяти произвольного размера.
      Ответить
      
      guest8 23.02.2019 21:35 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:40 # 0
      
      Ты ещё пожалуйся что нельзя сделать массив демонических массивов, а только массив укахателей.
      Ответить
      
      guest8 23.02.2019 21:22 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:33 # 0
      
      А до C99 юзали массив из одного элемента.
      Ответить
      
      guest8 23.02.2019 21:39 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 21:51 # +1
      
      Такая структура обычно лежит перед мосивом:
      struct petux *petya = (struct petux*)malloc(filesize); fread(petya, filesize,1, filepetya);
      Поля Пети заполнились нужными данными, за ним лежит массив, теперь мы можем с ним работать. petya->data[petya->size - 1] последний элемень масива. Всё хорошо и красиво.
      Ответить
      
      bormand 23.02.2019 22:48 # 0
      
      > бородатых сишников
      Бородатым сишникам не нравится выделять по 2 куска памяти на каждый чих, поэтому и юзают такую хуйню для всяких строк, блобов да длинных чисел.
      
      Вся суть в аллокации хедера и данных одним блоком. А идиома с массивом - просто для удобства, чтобы меньше кастовать. Можешь выкинуть массив и переименовать структуру в number_header.
      
      З.Ы. Даже в крестах make_shared() делает нечто подобное чтобы склеить счётчики и объект в одну аллокацию.
      Ответить
      
      Hu3KoypoBHeBblunemyx 23.02.2019 22:58 # 0
      
      Там не только с аллокацией проще, но ещё и копирование, чтение из файла, запись в файл, memcmp и с прочей хуйнёй с одним куском памяти проще работать.
      Ответить
      
      bormand 23.02.2019 20:48 # 0
      
      А я говорил про другую оптимизацию, когда объекты (указатели на них) и мелкие числа совмещены в один тип размером в uintptr_t и разруливаются по биту.
      Ответить
- bormand 22.02.2019 20:29 # +1
  
  > UB
  Да похуй на UB, оно вообще не работает (отрицательное d засрёт своим знаковым битом всё остальное). Или у автора там беззнаковый чар?
  Ответить
  - 6E3yMHblu_nemyx 23.02.2019 14:28 # 0
    
    То есть ещё во время каста будет так называемое расширение знака?
    
    Кстати, у некоторых кококомпиляторов есть переключатель «signed char/unsigned char».
    Ответить
    - Hu3KoypoBHeBblunemyx 23.02.2019 16:09 # 0
      
      А я думал, что chad всегда singed.
      Ответить
      
      1024-- 23.02.2019 19:19 # 0
      
      Он же вроде хрен знает какigned, если не специфицировать signed/unsigned.
      Ответить
    - 1024-- 23.02.2019 19:18 # 0
      
      > переключатель «signed char/unsigned char»
      Т.е. это на случай, когда пишут не signed char, не unsigned char, а просто char?
      Ответить
      
      guest8 23.02.2019 19:20 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      1024-- 23.02.2019 19:31 # 0
      
      А про что тогда безумный петух говорит?
      Ответить
      
      gost 23.02.2019 19:47 # +3
      
      А кто его разберёт. Он же безумный.
      Ответить
      
      6E3yMHblu_nemyx 23.02.2019 20:14 # 0
      
      Я про тот случай, когда нет явного спецификатора signed или unsigned. В одних компиляторах по умолчанию signed, в других unsigned, а в некоторых есть ключ командной строки или опции конфига, которыми можно выбрать знаковость/беззнаковость чара, если программист явно знаковость не указал.
      Ответить
      
      guest8 23.02.2019 20:15 # −999
      
      показать все, что скрытоvanished
      Ответить
Добавить комментарий
Ошибка компиляции комментария:

Гости могут высказаться только в понедельник, среду, четверг или воскресение
Помни, guest, за тобой могут следить!

А не использовать ли нам bbcode?

[b]жирный[/b] — жирный

[i]курсив[/i] — курсив

[u]подчеркнутый[/u] — подчеркнутый

[s]перечеркнутый[/s] — перечеркнутый

[blink]мигающий[/blink] — мигающий

[color=red]цвет[/color] — цвет (подробнее)

[size=20]размер[/size] — размер (подробнее)

[code=<language>]some code[/code] (подробнее)

Проверочный код: *

Говнокод: по колено в коде.

C++ / Говнокод #25395

Комментарии (94) RSS

Добавить комментарий