Говнокод #23534 — Си — Говнокод.ру

bugspawn 15.11.2017 00:06 # −1

подсказка: сей фрагмент иллюстрирует волшебный порядок вычисления операндов в С/С++

Ответить

roman-kashitsyn 15.11.2017 00:26 # +3

Подсказка: нет никакого волшебного порядка, порядок вычисления зависит от компилятора, твой код содержит UB.
Пример с 100 работает из-за наличия "точки следования" в виде оператора ,
Ответить
- bugspawn 15.11.2017 01:16 # 0
  
  тест №3:
  - частично вычисляется левая часть = (выполняется getptr())
  - вычисляется правая часть (выполняется jump())
  - продолжает вычисляться левая часть (выполняется *)
  не, ну это КАК ВООБЩЕ?
  т.е. есть оператор =, у него 2 операнда, и компилятор такой взял чучуть посчитал слева, потом чучуть справа, потом подумал решил снова влево посчитать
  
  тест №2:
  - вычисляется правая часть (выполняется jump() и ",")
  - вычисляется левая часть = (выполняется getptr() и потом *)
  каким таким боком "," внутри правого операнда влияет на то, когда в левом операнде будет посчитано значение в скобках (getptr()) - до или после вычисления правого операнда???
  Ответить
  - SemaReal 15.11.2017 01:21 # +3
    
    Ну посмотри асмовый листинг, и узнай почему копелятор так делает.
    Это же UB, он имеет право что угодно сделать. При включенной оптмизации компелятор вообще может выкинуть UB код: дескать можно вообще ничего не делать, раз UB.
    Ответить
    - Dummy00001 15.11.2017 19:29 # 0
      
      > Это же UB, он имеет право что угодно сделать.
      
      правильнее: что бы разрешить компилерам делать что угодно (== агресивная оптимизация вызовов функций), стандарт оставляет это как UB.
      Ответить
      - subaru 15.11.2017 22:18 # 0
        
        Лолшто. Уб - это некорректный код, который в общем случае нельзя диагностировать при конпиляции, не более. Как висячий указатель разыменовать. Стандарт не вводит уб ради каких-то там оптимизаций. Просто конпиляторы оптимизируют в предположении, что программист не пишет некорректный код, не более.
        Ответить
        
        Dummy00001 15.11.2017 22:23 # 0
        
        > Уб - это некорректный код,
        
        я не говорил про общий случай. я говорил про конкретный случай, проиллюстрированый в говнокоде.
        
        стандарт может сделать корректным код сверху, но это преднамеренно не делается.
        Ответить
        
        subaru 15.11.2017 22:30 # 0
        
        Да, почитал топик, ты все правильно сказал. Извини за выпад. Иногда хочется поумничать неразобравшись. Прости.
        Ответить
        
        Dummy00001 16.11.2017 00:05 # +1
        
        internal internet error. apology identified. undefined behavior detected. aborting.
        
        WAS THIS PAGE HELPFUL? YES/NO. TELL US MORE. YOUR OPINION IS IMPORTANT TO US!
        Ответить
        
        Antervis 16.11.2017 11:41 # 0
        
        в общем случае нет, а в частном случае иногда можно. Например, разыменовывание нулевого указателя - точно UB, к гадалке не ходи.
        Ответить
        
        j123123 07.12.2017 18:14 # 0
        
        Нет. Разыменование нулевого указателя в sizeof() не является UB
        
        char *ptr = NULL; size_t sz = sizeof(*ptr); // не UB
        Ответить
        
        inkanus-gray 08.12.2017 00:17 # 0
        
        А тут фактически нет разыменования, потому что sizeof — это хак. Это синтаксический сахар. Чтобы определить размер данных, не нужно иметь к ним доступ. Размер определяется косвенным путём (в данном случае компилятор просто залезает в определение переменной ptr).
        
        В процессорах x86 есть похожий хак: инструкция LEA. Она тоже не читает данные, а просто вычисляет их адрес.
        Ответить
        
        j123123 08.12.2017 00:53 # 0
        
        https://ru.wikipedia.org/wiki/Синтаксический_сахар
        > Принципиально то, что синтаксический сахар, теоретически, всегда можно удалить из языка без потери его возможностей — всё, что можно написать с применением синтаксического сахара, может быть написано на этом же языке и без него. Таким образом, синтаксический сахар предназначен лишь для того, чтобы сделать более удобным для программиста написание программы.
        
        Допустим:
        
        struct shit { uint8_t a; uint32_t b; uint 8_t c; uint32_t d; uint 8_t e; }; ... size_t sz = sizeof(struct shit);
        
        И как это переносимо написать без sizeof? Создавать массив из двух элементов struct shit и вычитать разницу адресов между нулевым и первым элементом для такого массива? Такой подход будет неточным.
        Для одной структуры с учетом выравниваний полей допустим будет такая хуита:
        
        | uint8_t a | uint32_t b | uint8_t c | uint32_t d | uint8_t e| |8bit|____|____|____|8bit|8bit|8bit|8bit|8bit|____|____|____|8bit|8bit|8bit|8bit|8bit|
        
        Но если сделать массив из двух таких структур, этот uint8_t e уже сожрет себе все 4 байта, и разница между одним и другим указателем в массиве из двух таких структур будет не равна размеру одной структуры в байтах
        
        | uint8_t a | uint32_t b | uint8_t c | uint32_t d | uint8_t a | ... |8bit|____|____|____|8bit|8bit|8bit|8bit|8bit|____|____|____|8bit|8bit|8bit|8bit|8bit|____|____|____| ...
        Ответить
        
        j123123 08.12.2017 01:01 # 0
        
        А еще ж есть всякие битфилды... в общем я не думаю что существует некий костыльный способ, который может заменить sizeof во всех возможных ситуациях и позволит обойтись полностью без sizeof
        Ответить
        
        bormand 08.12.2017 07:20 # 0
        
        sizeof(имя_структуры). Заменяет во всех ситуациях, но можно ошибиться, в отличие от сахара со звездочкой.
        Ответить
        
        j123123 08.12.2017 13:26 # 0
        
        не заменяет, если этот sizeof() используется в макросе
        
        #define COPYSHIT(dest,src) memcpy(dest, src, sizeof(*src))
        Ответить
        
        bormand 08.12.2017 19:46 # +1
        
        Никто не мешает передать тип параметром.
        Ответить
        
        g0cTb 08.12.2017 01:49 # 0
        
        > разница между одним и другим указателем в массиве из двух таких структур будет не равна размеру одной структуры в байтах
        
        1) равна, т.к. размер структуры включает паддинги
        2) и соответственно sizeof возвращает ровно количество байт между двумя структурами в массиве
        Ответить
        
        j123123 08.12.2017 02:44 # 0
        
        Почему тогда не сделали синтаксического сахара чтоб узнавать размер структуры без учета паддинга в самом конце?
        Ответить
        
        g0cTb 08.12.2017 12:48 # 0
        
        И зачем нужно узнавать размер без падинга?
        Ответить
        
        j123123 08.12.2017 13:21 # 0
        
        Для записи в файл. Или например чтоб меньше байт копировать, если скопировать надо всего одну такую структуру
        Ответить
        
        roman-kashitsyn 08.12.2017 13:33 # 0
        
        > Для записи в файл чтоб меньше байт копировать
        Ты же знаешь, что ОС всё равно блоками пишет, да?
        Ответить
        
        j123123 08.12.2017 13:35 # 0
        
        Да, но в файл хочется записать структуру без ненужного мусора в конце.
        Ответить
        
        j123123 08.12.2017 13:54 # +1
        
        Вообще, намного полезнее была б фича чтоб можно было последовательно пройтись по всем полям структуры, ну типа
        
        struct shit { uint8_t a; uint32_t b; uint8_t c; uint32_t d; uint8_t e; }; struct shit somecrap; ... fwrite(&(somecrap.a), sizeof(somecrap.a), 1, fd); fwrite(&(somecrap.b), sizeof(somecrap.b), 1, fd); fwrite(&(somecrap.c), sizeof(somecrap.c), 1, fd); // чтоб всю эту питушню не писать // а каким-нибудь foreach-ем пройтись
        
        Вобщем-то сишечка довольно убогий язык, но в плюсах-то эту проблему решили же, да?
        Ответить
        
        roman-kashitsyn 08.12.2017 14:07 # 0
        
        > Вообще, намного полезнее была б фича чтоб можно было последовательно пройтись по всем полям структуры
        
        Я так и делал всегда. Там же строки могут быть, указатели, вот это всё. Плюс byte order иногда важен. Просто пишешь простенький сериализатор/десериализатор и не выёживаешься. Ну или просто используешь какой-нибудь asn1/protobuf.
        Ответить
        
        j123123 11.12.2017 03:21 # +1
        
        Вот и получается, что подобные проблемы приходится решать всякими там кодогенераторами (какой-нибудь asn1/protobuf) или писать все эти сериализации/десериализации руками.
        
        > Там же строки могут быть, указатели, вот это всё.
        
        Можно придумать некий внутриязыковой механизм, который бы позволял программировать все такие вариации, скажем
        
        struct data_8 { uint8_t sz; uint8_t *data; }; struct data_16 { uint16_t sz; uint8_t *data; }; struct shit { uint32_t someshit; struct data_8 a; struct data_16 a; }; struct shit somecrap; COMPILETIME_FOREACH_STRUCT (TYPEOF(somecrap); somecrap) { STOREDATA(somecrap##TYPE, fd); // для "struct data_8" и "struct data_16" будут особым образом объявлены отдельные функции // которые бы отвечали за то, как это обрабатывать }
        
        В общем тут как раз таки гомоиконность нужна. В плюсах есть лишь какие-то ограниченные костыли, вроде констэкспров, шаблонов. Есть ли какие-нибудь способы распарсить в компилтайме тип структуры (из чего она состоит) и на основе этого порождать некий код, который что-то там должен делать?
        Ответить
        
        bormand 11.12.2017 07:54 # 0
        
        > есть ли в плюсах
        Пока только ограниченное говно типа boost::fusion, где поля надо руками перечислять (типы само надёргает).
        
        Но обещают завезти нормальную рефлексию и кодогенерецию. Лет через 5-10.
        Ответить
        
        subaru 11.12.2017 12:40 # +3
        
        > обещают завезти нормальную рефлексию
        
        а завезут метушню
        Ответить
        
        nemyx 08.07.2020 09:51 # 0
        
        Ну как, завезли?
        Ответить
        
        guest8 08.07.2020 10:16 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        nemyx 08.07.2020 10:22 # 0
        
        Будем ждать.
        Ответить
        
        roman-kashitsyn 11.12.2017 12:53 # 0
        
        > приходится решать всякими там кодогенераторами
        
        У кодогенераторов есть преимущество: они могут генерить код на разных языках из одного описания.
        Ответить
        
        bormand 11.12.2017 18:10 # 0
        
        > код на разных языках
        Правда при этом приходится добавлять ещё один язык для таких описаний...
        Ответить
        
        roman-kashitsyn 11.12.2017 18:19 # 0
        
        > Правда при этом приходится добавлять ещё один язык для таких описаний...
        
        ... что не обязательно является чем-то плохим.
        Ответить
        
        Antervis 11.12.2017 19:18 # +1
        
        попытки решить проблемы одних языков созданием других лишь приводят к увеличению числа проблемных языков
        Ответить
        
        roman-kashitsyn 11.12.2017 19:54 # +1
        
        > попытки решить проблемы одних языков созданием других
        
        Так-то в каком-нибудь CL можно один раз написать макрос и генерить из
        (def-serializable-struct cat (name string) (volume (cm³ fixnum)) (weight (g fixnum)))
        сериализаторы/десериализаторы/парсеры/валидаторы/модули для nodejs/даже небо/даже аллаха. Но люди продолжают придумывать новые, более другие языки.
        Ответить
        
        SemaReal 08.12.2017 04:39 # 0
        
        Правда не UB? И чему же оно будет равно?
        Ответить
        
        j123123 08.12.2017 05:03 # 0
        
        sizeof(char) всегда 1
        Ответить
        
        SemaReal 10.12.2017 21:18 # 0
        
        FOO *bar;
        иными словами sizeof(*bar) всегда есть sizeof(bar) даже если bar это данглинг поинтер?
        
        Ну звучит логично: не надо разыменовывать
        Ответить
        
        Antervis 08.12.2017 17:22 # −1
        
        але гараж. sizeof работает над типом а не над данными. Вот в реализации offsetof, наприме, формальный UB.
        Ответить
  - subaru 15.11.2017 22:21 # 0
    
    Ты нуб штоли? Конпилятор переупорядочивает инструкции так, чтобы они выполнялись быстрее. Иди читать про точки следования в плюсах и конвеер в процессоре, нуб.
    Ответить
- bugspawn 15.11.2017 01:21 # 0
  
  единственное объяснение что мне приходит в голову, это что сперва вычисляется то что в скобках с наибольшим уровнем вложенности по обе стороны от =, причем справа налево, потом от большего уровня вложенности к меньшему
  Ответить
  - roman-kashitsyn 15.11.2017 01:27 # +2
    
    Думаю, тем, кто пишет код с UB и винит компилятор в нелогичном поведении, лучше идти напитон. Там наверняка порядок вычисления присваиваний детерминирован. Специально для творческих личностей, желающих этим порядком воспользоваться.
    Ответить
    - SemaReal 15.11.2017 01:31 # 0
      
      Не только питон. Обычно в ЯПах под JVM и .NET тоже нет UB (ну, кроме race conditions). А в CPython и MRI Ruby нет и их:)
      
      В swift, я думаю, что тоже UB нет (во всяк случае ябловый UBSanitizer в шланге работает только для C)
      Ответить
      - j123123 15.11.2017 02:46 # 0
        
        В C# есть https://stackoverflow.com/a/1860953
        Но UB там возникает не на ровном месте, в отличии от плюсов и сишки
        Ответить
        
        SemaReal 15.11.2017 02:48 # 0
        
        >>unsafe" block
        ну так-то оно и в Java есть sun.misc.Unsafe
        
        Даже в питоне можно взять cTypes и стригеррить черте-что
        
        Мы же про "нормальное" использование языка.
        Ответить
        
        j123123 15.11.2017 02:58 # 0
        
        Не, можно и без unsafe, например вот https://habrahabr.ru/company/enterra/blog/243371/ :
        
        > Если кратко, то содержание поста сводится к рассмотрению следующего примера:
        
        [Description(Value)] class Test { const string Value = "X\ud800Y"; }
        
        > Строка в C# представляет собой последовательность слов в UTF-16. А значение "X\ud800Y" не особо хорошее, т.к. включает в себя старшее слово суррогатной пары 0xD800, после которого должно бы идти младшее слово (интервал 0xDC00..0xDFFF), но вместо него идёт Y (0x0059). Проблемы начинаются из-за того, что в IL-коде для хранения аргументов конструктора атрибута используется UTF-8. Впрочем, у Джона Скита всё очень хорошо расписано, всем советую прочитать оригинальный пост.
        
        > Меня заинтересовало, как же будут себя вести MS.NET и Mono в этой непростой ситуации (подробная заметка). А вести они себя будут по-разному. Первое различие можно увидеть во время компиляции. MS.NET положит значение строки в метаданные в виде 58 ED A0 80 59, а Mono — в виде 58 59 BF BD 00 (оба значения являются невалидными UTF-8 строчками). Второе различие можно пронаблюдать запустив полученные приложения. MS.NET сможет запустить обе версии и успешно достанет значение аргумента атрибута (в виде 0058 fffd fffd 0059 и 0058 0059 fffd fffd 0000 соответственно), а Mono поперхнётся настолько невалидной строкой и вернёт null в каждом из случаев. Из-за этого маленький пример Джона Скита сразу упал, когда я попытался запустить его под Mono.
        Ответить
        
        j123123 15.11.2017 03:01 # 0
        
        в общем если хотите чтоб без UB - пишите на брайнфаке. Во всяких нетривиальных языках всегда можно какую-то ерунду не учесть, типа кодировок или вообще фиг пойми чего, из-за чего возникнет UB, не потому что специально хотели делать UB, просто никто о таком нестандартном сценарии не задумывался
        Ответить
        
        SemaReal 15.11.2017 03:19 # 0
        
        Охренеть!! ТАкой литерал не должен был скомпилироваться!
        Это дыра в стандарте
        [quote]
        According to the ECMA-334 document (p. 473):
        
        A program that does not contain any occurrences of the unsafe modifier cannot exhibit any undefined behavior.
        [/quote]
        
        Но вообще мой cl четко видит тут три буквы: первая и последняя обычные, а средняя занимает 3 байта в UTF-8 (мне кажется это какой-то такой плейн где всякие asian languages, а нет, это невалидная хуйня (которую уникод обозначает значком [?]) )
        
        class Program { const string Value = "X\ud800Y"; static void Main(string[] args) { Console.WriteLine(String.Join(" ", Encoding.UTF8.GetBytes(Value).Select(b => b.ToString()))); } } // 88 239 191 189 89 // Тащемто попытка напечтать то и выводит: X[?]Y.
        Ответить
      - d_fomenok 15.11.2017 19:22 # 0
        
        # UB (ну, кроме race conditions)
        
        Это не UB
        Ответить
        
        SemaReal 15.11.2017 23:12 # 0
        
        да, ты прав
        Ответить
  - SemaReal 15.11.2017 01:36 # +5
    
    После игры "угадай что делает компелятор по эфектам от UB" вам предстоит уровень "возьми платформу с weak memory model типа ARM или PowerPC и угадай в каком порядке CPU выполнит твой код"
    Ответить
    - bugspawn 15.11.2017 01:50 # 0
      
      это поэтому на ведроидах все без исключения постоянно крэшится? :)
      Ответить
      - SemaReal 15.11.2017 02:28 # +1
        
        Откуда статистика?
        
        Ведроид бывает
        1) не только на arm (mips, atom)
        2) 90% софта там писано на java/kotlin под ART. А там действуют правила JMM и JLS.
        
        зы: ну ты понимаешь же что с weak memory model можно прекрасно жить, как и с любой другой memory model, главное не завязываться на странные спец-эффекты.
        Любой CPU всегда можно попросить не реордерить ничего (обычно с помощью интринсика или ключевого слова ЯПа, которое затем превращается в инструкцию типа fence или как-то так)
        Ответить
        
        bugspawn 15.11.2017 04:38 # 0
        
        статистика по личным и очевидцев наблюдениям)
        понятно что жить можно и любой подводный камень можно переступить
        но должно же быть какоето объяснение феномену...
        на вики пишут что косяки JMM с 2004 года недействительны
        Ответить
        
        SemaReal 15.11.2017 05:13 # +2
        
        Я думаю что падения связаны с более низким уровнем review (у ябла он сильнее), а не с memory model ибо см. пункт 2.
        
        У JMM нет UB кроме race conditions, но это не совсем UB так как не зависит от компилятора (а зависит от количества ядер, шедулера операционной системы, количества и тяжести других процессов, и месяца китайского календаря).
        
        Объяснение очень простое: чем слабее гарантии -- тем больше свободы у инженеров в разработке проца, а значит тем лучше он у них может получиться.
        
        Ты ведь наверное тоже не любишь делать свои интерфейсы и API публичными, что бы на них сразу же завязались 150 человек, и ты бы потом не мог их отрефакторить
        Ответить

Stallman 16.11.2017 00:09 # −1

Автор, срочно переходи на PHP!
Там всё, как тебе нравится: https://ideone.com/IY0KUp

Ответить

inkanus-gray 16.11.2017 00:12 # −1

Что такое $$ptr в данной программе?
Ответить
- Stallman 16.11.2017 00:15 # −1
  
  Обращение к переменной с названием в переменной $ptr.
  Ответить
  - inkanus-gray 16.11.2017 00:36 # −1
    
    А переменные с названиями 0, 1 и 2 в "PHP" бывают?
    Ответить
    - Stallman 16.11.2017 01:03 # 0
      
      В ПХП возможно всё, если делать это через жопу.
      Напрямую к ним обратиться нельзя - это синтаксически неверно. Но если использовать $$, то именем переменной может быть любая строка и, следовательно, что угодно, что в нее конвертится.
      https://ideone.com/svS2sO
      Ответить
      - inkanus-gray 16.11.2017 01:21 # 0
        
        Я догадывался... Но как объяснить непрограммистам, над чем я ржу?
        
        P.S. Это можно публиковать отдельным говнокодом.
        Ответить
        
        Stallman 16.11.2017 01:44 # −1
        
        Действительно, пусть будет.
        Ответить
j123123 16.11.2017 21:12 # +1

Но в пыхе нет указателей, как же без них отстрелить себе ногу?
Ответить
- SemaReal 16.11.2017 21:18 # +1
  
  Когда я был пыховцем, у меня не было указателей чтобы отстрелить себе ногу, но мне хотелось ходить без ноги, как взрослые С++ программисты, и тогда я использовать SQL инъекции, глобальные переменные и eval()
  Ответить
  - subaru 16.11.2017 22:03 # 0
    
    Я так и думал, что ты был пыховцем.
    Ответить
    - SemaReal 17.11.2017 15:59 # 0
      
      один раз не пидарас
      Ответить

Bobik 16.11.2017 22:29 # 0

Переходи на С++17

Ответить

Говнокод: по колено в коде.

Си / Говнокод #23534

Комментарии (68) RSS

Добавить комментарий