Говнокод #25375 — Си — Говнокод.ру

j123123 13.02.2019 13:07 # 0

https://govnokod.ru/15707 хуйню с определением endian я уже когда-то вбрасывал

Ответить

O4epegHou_nemyx 13.02.2019 13:38 # +1

Можно ли считать этот ыореант кросплатформиным?

union {
        int16_t petyx;
        int8_t petyshki[2];
    } petyxu;
    petyxu.petyx = 1;
    if (petyxu.petyshki[0] != 1) {
        puts("TY PETIX!!!");
    }

Ответить

gost 13.02.2019 14:25 # −1

Не работает на платформах без «int8_t» или «int16_t», проверь.
Ответить
- O4epegHou_nemyx 13.02.2019 14:27 # 0
  
  Это какие такие?
  Ответить
  - gost 13.02.2019 14:30 # 0
    
    Не знаю, но Штандарт их обозначает как «optional».
    Ответить
    - O4epegHou_nemyx 13.02.2019 14:36 # 0
      
      Именно поэтому я против "Штандарта".
      Ответить
  - guest8 13.02.2019 14:39 # −999
    
    показать все, что скрытоvanished
    Ответить
    - O4epegHou_nemyx 13.02.2019 14:49 # 0
      
      Не знал, что "C89" —– это платформа.
      Ответить
    - O4epegHou_nemyx 13.02.2019 15:07 # +1
      
      На дворе уже давно "C11", не пися уже о "C99", а вы всё поминаете это древнее говно.
      Ответить
guest8 13.02.2019 14:38 # −999

показать все, что скрытоvanished
Ответить
- O4epegHou_nemyx 13.02.2019 14:53 # 0
  
  Разве петикс и петишки не будут занимать одну и ту же память?
  Ответить
  - guest8 13.02.2019 15:42 # −999
    
    показать все, что скрытоvanished
    Ответить
    - Kakou-mo_nemyx 13.02.2019 17:38 # 0
      
      Хотелось бы увидеть примеры самых странных вещей, которые получаются из-за «type punning».
      
      Перемешивание байтов из-за «big engian», «little endian», «middle endian» меня не интересует, это и так понятно.
      
      Коверкание чисел из-за копирования целого питуха в плавающего и обратно меня тоже не интересует. Видел я алгоритм с «обратным квадратным корнем» (0x5F3759DF), меня этим не запугать.
      
      Что ещё бывает?
      Ответить
      - guest8 13.02.2019 17:45 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 17:48 # 0
        
        Допустим. Стандарт позволяет в целях выравнивания добавлять незначащие байты перед структурой?
        Ответить
        
        guest8 13.02.2019 17:53 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 17:56 # 0
        
        Ну то есть можно гарантировать, что первые байты скалярных членов union'а и первые байты первых полей структур, также являющихся членами того же union'а, будут накладываться?
        Ответить
        
        guest8 13.02.2019 17:58 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 18:06 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:10 # 0
        
        То есть стандарт позволяет для реализации union'а использовать произвольный контейнер? Его члены можно упаковать в какой-нибудь архив (в TAR или в контейнер OLE2) или там есть ограничения на sizeof?
        Ответить
        
        guest8 13.02.2019 18:13 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 13.02.2019 18:29 # +2
        
        > в разные углы памяти распихкать
        нахуй такой юнон, я всегда считал, что это чтоб память экономить для данных, которые не юзаются одновременно, и чтоб юзать как reinterpret_cast в крестах.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:37 # 0
        
        Вот кстати, существует ли в сишке адекватная замена reinterpret_cast? memcpy/memmove не предлагать. Про каст указателей я знаю, но от него у меня звёздочки в глазах.
        Ответить
        
        guest8 13.02.2019 18:39 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:46 # −1
        
        Но у него хотя бы синтаксис приличный.
        Сравни:
        rooster = reinterpret_cast<char>(chick);
        
        И вот этот ужас:
        rooster = *(char *)&chick;
        Ответить
        
        O4epegHou_nemyx 13.02.2019 18:48 # +2
        
        #define REINTERPRET_CAST(From, To, value) ((union{From from; To to;}){.from = value}.to) printf("%x", REINTERPRET_CAST(float, int, 3.14));
        Ответить
        
        O4epegHou_nemyx 13.02.2019 19:03 # 0
        
        Ну конкретно для printf каст не нужен, он же не знает о типе :)
        Ответить
        
        guest8 13.02.2019 19:04 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 13.02.2019 19:09 # 0
        
        Нет, он не знает что я ему передал, он знает только как это привести к внешнему представлению. Я мог написать %s или %lld или вообще %n и получить хуй-пойми-что.
        Ответить
        
        guest8 13.02.2019 18:48 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:50 # +1
        
        Нет, в си сделали не плохо, а ещё хуже:
        
        int x = (int)3.14; float y = (float)3; printf("%d\n", x); printf("%f\n", y);
        
        Вот тут, например, и не «посмотреть по-другому» (reinterpret_cast), и не «расширение/сужение», тут полноценное преобразование (с кучей арифметических действий).
        
        Я считаю, что (int) не нужен. Лучше явно использовать floor/ceil/round/что-то там ещё, чтобы показать, как именно ты хочешь округлить.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:33 # 0
        
        Для сравнения: в стандартном «Паскале» не было отдельных union'ов, там были записи с вариантными полями. Самое последнее поле записи могло ветвиться (естественно, в это поле можно было упихать и сложные типы вроде вложенных записей и массивов), а перед ним должно было стоять специальное поле-дискриминант, которое показывает, какой из вариантов в настоящий момент используется:
        
        type Vorent = (eAge, eIq, eWeight); (* это enum *) Petux = record what: Vorent; (* это дискриминант *) case what of (* а это начало того самого union'а *) eAge: (* если what = eAge, используем этот вариант *) age: byte; eIq: (* если what = eIq, используем этот вариант *) iq: byte; eWeight: (* если what = eWeight, используем этот вариант *) weight: byte; end; (* end закрывает и case, и record *)
        
        Теоретически компилятор или рантайм могли проверить текущее значение дискриминанта (what в нашем примере), чтобы разрешить доступ только к одному варианту.
        
        Компания «Борланд» при реализации своего диалекта решила на дискриминант положить болт. В «Турбо Паскале» и в его наследниках можно в любой момент использовать любой вариант (как в «сишке» можно использовать любой член союза):
        
        type Petux = record case integer of (* можно написать любой идентификатор поля или типа *) (* всё равно он будет проигнорирован компилятором *) 42: (* здесь можно написать любое значение *) (* всё равно его никто не проверит *) age: byte; 'Q': (* можно даже указать константу другого типа *) iq: byte; false: (* эти константы просто разделяют варианты *) weight: byte; end; (* end закрывает и case, и record *)
        
        И в «Турбо Паскале» уже можно записать значение в petookh.age, а прочитать из petookh.iq, хотя «Standard Pascal» этого не позволял.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:17 # 0
        
        У меня появилась идея. А давайте второй член союза хранить циклически сдвинутым на один бит (ROR 1), чтобы при извлечении нужно было сдвигать обратно (ROL 1); у третьего члена уже делать сдвиг на два бита и так далее, каждый последующий член сдвигать ещё на один бит.
        
        union petux { age char; iq char; weight char; }; union petux petookh = {0}; petookh.age = 42; printf("%d\n", petookh.iq); // выведет 84 printf("%d\n", petookh.weight); // выведет 168
        
        Стандарт я этим не нарушу?
        Ответить
        
        guest8 13.02.2019 18:29 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 18:35 # 0
        
        Я предложил не простой сдвиг, а циклический:
        00101010
        01010100
        10101000
        01010001
        10100010
        01000101
        10001010
        00010101
        Он не потребует лишней памяти.
        Ответить
        
        guest8 13.02.2019 18:38 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Xom94ok 14.02.2019 21:28 # 0
        
        > может быть что iq у него стал 96. Или 33. Или 22. Хотя почти всегда он станет 42
        
        Всегда 42.
        
        http://eel.is/c++draft/class.union (в других стандартах примерно то же самое)
        > If a standard-layout union contains several standard-layout structs that share a
        > common initial sequence ([class.mem]), and if a non-static data member of an
        > object of this standard-layout union type is active and is one of the standard-layout
        > structs, it is permitted to inspect the common initial sequence of any of the
        > standard-layout struct members
        
        У тебя в юнионе оба члена одинакового типа и они полностью занимают common
        initial sequence. Это то же самое, что сделать мемсру из одного в другого.
        Ответить
        
        guest8 14.02.2019 21:41 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Xom94ok 14.02.2019 21:51 # 0
        
        это кресты, как в сишечке - не знаю
        > поясни тогда цытаткуо
        union { char8_t koko; char32_t kukarek; } u; u.koko = 123; char32_t kudah = u.kukarek; // в трёх битах u.kukarek что угодно, // т.к. не common initial sequence.
        
        UPD: бля, чёт я не посмотрел на то, что тут всё про си, но чует мой пушистый зад, что в си всё намного проще, ибо нет классов и связанного нетривиального говна
        Ответить
        
        guest8 14.02.2019 22:08 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 22:30 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 22:39 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 15.02.2019 01:15 # −999
        
        показать все, что скрытоvanished
        Ответить
  - Kakou-mo_nemyx 13.02.2019 15:43 # 0
    
    Надо посмотреть, разрешает ли стандарт выравнивание элементов массива. Вроде бы элементы массива должны идти плотно, но я не уверен.
    
    Выравнивание полей структуры он разрешает, поэтому при описании структур приходится вставлять директивы компилятора (#pragma, __attribute__), чтобы не выравнивал. У некоторых ЯП даже было слово «packed» для этого.
    Ответить
    - guest8 13.02.2019 17:06 # −999
      
      показать все, что скрытоvanished
      Ответить
      - bormand 13.02.2019 19:31 # +1
        
        > равен размеру самого большого члена
        Нет. Возьми юнион из uint64_t и uint8_t[9]. Его размер будет 16 а не 9.
        Ответить
        
        guest8 13.02.2019 19:34 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:35 # 0
        
        Union должен быть разработан настолько, чтобы без труда мог вместить самый большой член.
        Ответить
        
        guest8 13.02.2019 19:36 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:37 # 0
        
        И поэтому его ждёт трудная ночь. Впрочем, как и все предыдущие ночи.
        Ответить
    - bormand 13.02.2019 19:44 # 0
      
      > элементы массива должны идти плотно
      Да. Поэтому по-дефолту размеры всех типов достаточно выровнены.
      Ответить
- Kakou-mo_nemyx 13.02.2019 15:46 # 0
  
  Слишком много софта, привязанного к играм с юнионом. Юнионы используют для сериализации данных, отправляемых по сети или записываемых в файл. Если кококококой-нибудь кококококомпилятор будет что-то вставлять перед элементом юниона, то в нём нельзя будет скомпилировать заметную часть ПО.
  Ответить

Lorip1971 13.02.2019 14:00 # 0

именно поэтому я за Rust,
i8,i16,i32,i64,i128
u8,u16,u32,u64,u128
isize,
usize

и никакой питушни с этими вашими sizeof

Ответить

O4epegHou_nemyx 13.02.2019 14:10 # +2

"Rust" нинужен.
Ответить
- Kakou-mo_nemyx 13.02.2019 16:07 # 0
  
  А на чём мы будем сидеть, если насеста не будет?
  Ответить
KGeist 25.02.2019 23:35 # 0

то же в C давно есть
Ответить

Kakou-mo_nemyx 13.02.2019 16:15 # 0

И вообще проверка рахит-тинктуры должна производиться в компайл-тайме.

Ответить

O4epegHou_nemyx 13.02.2019 17:31 # 0

В S" Forth" я могу включать/выключать компай тайм когда захочу. Именно поэтому я за S" Forth".
Ответить

guest8 13.02.2019 16:19 # −999

показать все, что скрытоvanished

Ответить

Kakou-mo_nemyx 13.02.2019 16:28 # +2

Кто о чём, а ты о хуях.

На DSP, где один октет адресовать нельзя в принципе. У них в «байте» может быть 16, 32 или даже 64 бита, чего вполне хватает для того, чтобы вместить целый long int.

Были ещё древние процессоры с 24-битными, 32-битными, 36-битными, 48-битными словами, не разбитыми на байты. У «PDP-10» известный компилятор «Си» разбивал 36-битное слово на 9-битные «байты» (нонеты), но другие компиляторы могли и не разбивать.
Ответить
- guest8 13.02.2019 16:45 # −999
  
  показать все, что скрытоvanished
  Ответить
  - O4epegHou_nemyx 13.02.2019 17:05 # +1
    
    Минимально адресуемая единица —– это байт, а мышыное слово –— это идинитса размером с регистр.
    Ответить
    - guest8 13.02.2019 17:08 # −999
      
      показать все, что скрытоvanished
      Ответить
      - O4epegHou_nemyx 13.02.2019 17:14 # +1
        
        WORD, DWORD и пр. хуетень —– это просто названия типов, оставленные для отвратной совместимости, с термином "мышиное слово" они были связаны только на 16-битных процессорах.
        Ответить
        
        guest8 13.02.2019 17:16 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 13.02.2019 17:24 # +2
        
        Как это следует из того что я нопейсал? В "x86" "словом" называют джва байта из-за анальной совместимости вот и всё, на других ракотектурах оно не зашкварено.
        Ответить
        
        guest8 13.02.2019 18:52 # −999
        
        показать все, что скрытоvanished
        Ответить
- guest8 13.02.2019 18:35 # −999
  
  показать все, что скрытоvanished
  Ответить
  - Kakou-mo_nemyx 13.02.2019 18:40 # 0
    
    Опять ты о хуях.
    
    char бывает разным. Он не обязан быть восьмибитным. Точно так же long int не обязан вмещать несколько чаров.
    
    Тебе другой гость написал нестрогое неравенство, из которого следует, что long int может совпасть с чаром.
    
    Были какие-то реализации, авторы которых поняли слово «char» буквально и решили уместить в него юникодный символ.
    Ответить
    - guest8 13.02.2019 18:44 # −999
      
      показать все, что скрытоvanished
      Ответить
  - guest8 13.02.2019 18:46 # −999
    
    показать все, что скрытоvanished
    Ответить
    - Kakou-mo_nemyx 13.02.2019 18:57 # 0
      
      Ещё в BCD = binary-coded decimal. Это когда в каждом байте или в каждом ниббле байта (в каждой тетраде) хранится десятичная цифра.
      Ответить
      - guest8 13.02.2019 19:00 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:06 # 0
        
        Микрокалькуляторы прямо в BCD и считали, чтобы не заморачиваться с перекодированием чисел при выводе на экран.
        
        Ещё у IEEE754 есть инструкции для двоично-десятичных данных.
        
        А у IBM/370 был шестнадцатеричный плавающий питух:
        https://en.wikipedia.org/wiki/IBM_hexadecimal_floating_point
        Там порядок означал не на сколько битов нужно сдвинуть мантиссу, а на сколько шестнадцатеричных цифр.
        Ответить
        
        guest8 13.02.2019 19:11 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 13.02.2019 19:15 # 0
        
        Джва пальца это слишком маленькая разрядность. Именно поэтому я за 64 пальца.
        Ответить
        
        guest8 13.02.2019 19:21 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 13.02.2019 19:23 # 0
        
        Джва символа всего надо.
        Ответить
        
        guest8 13.02.2019 19:26 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:22 # 0
        
        –— Я всех умней! —– кричит петух. –—
        Умею я считать до двух!
        —– Подумаешь! –— ворчит хорёк. —–
        А я могу до четырёх!
        –— Я —– до шести! –— воскликнул жук.
        —– Я –— до восьми! —– шепнул паук.
        
        Тут подползла сороконожка:
        –— Я, кажется, умней немножко
        Жука и даже паука —–
        Считаю я до сорока!
        
        —– Ах, ужас! –— ужаснулся уж. —–
        Ведь я ж не глуп. Но почему ж
        Нет у меня ни рук, ни ног,
        А то и я считать бы мог!
        
        А у меня есть карандаш.
        Ему что хочешь, то задашь.
        Одной ногой умножит, сложит.
        Всё в мире сосчитать он может!
        Ответить
    - guest8 13.02.2019 19:44 # −999
      
      показать все, что скрытоvanished
      Ответить
      - guest8 13.02.2019 19:47 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 19:49 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 19:49 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 19:50 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:58 # 0
        
        Кстати, в троичной системе каждый трит может хранить (0; 1; 2), а может и хранить (-1; 0; 1). В последнем случае для отрицательных чисел не придётся изобретать никаких дополнительных представлений (правда, детектировать отрицательные числа будет очень трудно).
        Ответить
        
        guest8 15.02.2019 01:14 # −999
        
        показать все, что скрытоvanished
        Ответить
      - Kakou-mo_nemyx 13.02.2019 19:52 # 0
        
        Ты тут первый заговорил про «не степень двойки». Поясни свою мысль.
        Ответить
        
        guest8 13.02.2019 19:53 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 19:54 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 20:02 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 20:10 # 0
        
        Вроде char должен как минимум вмещать весь набор символов, которыми набрана сама программа. Там меньше семи битов никак не получается (можно было бы уложиться в шесть, если бы сишка была регистронезависимой).
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 20:16 # 0
        
        P.S. Это свойство окажется полезным для раскрутки компилятора: чтобы на сишке написать компилятор сишки. Без этого свойства парсинг будет выглядеть странновато...
        Ответить
        
        bormand 13.02.2019 20:18 # +1
        
        > весь набор символов
        Допустим, я заюзал юникодные смайлики в строковых литералах. В чар они не входят. ЧЯНТД?
        Ответить
        
        gost 13.02.2019 20:39 # +2
        
        A byte is at least large enough to contain any member of the basic execution character set (5.3) and the eight-bit code units of the Unicode UTF-8 encoding form […]
        
        § 4.4, 1
        
        The basic source character set consists of 96 characters: the space character, the control characters representing horizontal tab, vertical tab, form feed, and new-line, plus the following 91 graphical characters […]
        
        § 5.3, 1
        Ответить
        
        bormand 13.02.2019 20:40 # +1
        
        Таки растянули до 8 :)
        Ответить
        
        gost 13.02.2019 20:41 # 0
        
        Угу. Это драфт N4659, если что.
        Ответить
        
        bormand 13.02.2019 20:36 # +2
        
        Стандарт рассматривает source и execution наборы символов (5.2.1 Character sets). Каждый из них должен вместить как минимум basic набор (52 буквы, 10 цифр и 29 закорючек).
        
        5.2.1.2 Multibyte characters
        The basic character set shall be present and each character shall be encoded as a single byte.
        
        Т.е. таки минимум 7 бит независимо от кодировок.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 20:47 # 0
        
        Значит, я могу использовать две десятичные цифры (96 < 100), но не могу обойтись четырьмя троичными (96 > 81)?
        Ответить
      - gost 13.02.2019 20:45 # 0
        
        bormand где-то в глубинах Стандарта раскапывал, что бит в крестах (и сишке) может иметь только два состояния, так что увы.
        Ответить
      - gost 13.02.2019 20:49 # +2
        
        Ага, вот:
        
        [...] The representations of integral types shall define values by use of a pure binary numeration system. [...]
        
        § 6.9.1, 7
        
        A positional representation for integers that uses the binary digits 0 and 1, in which the values represented by successive bits are additive, begin with 1, and are multiplied by successive integral power of 2, except perhaps for the bit with the highest position. (Adapted from the American National Dictionary for Information Processing Systems.)
        
        § 6.9.1, 7, сноска 52.
        Ответить
        
        bormand 13.02.2019 20:52 # +3
        
        Хм, а в C99, если я правильно его читаю, было требование только на unsigned char и битовые поля. А всё остальное implementation defined.
        
        Ну и bit - unit of data storage in the execution environment large enough to hold an object that may have one of two values.
        Ответить
        
        guest8 13.02.2019 23:19 # −999
        
        показать все, что скрытоvanished
        Ответить
guest8 13.02.2019 16:43 # −999

показать все, что скрытоvanished
Ответить
- O4epegHou_nemyx 13.02.2019 17:16 # 0
  
  Нихуя не понял, "bormand" говорил, что это какое-то параллельное присваивание.
  Ответить
  - guest8 13.02.2019 17:19 # −999
    
    показать все, что скрытоvanished
    Ответить
    - Kakou-mo_nemyx 13.02.2019 18:52 # +1
      
      Угу, в некоторых компиляторах для 16-битных платформ sizeof(int) == sizeof(short int) == 2, а в некоторых компиляторах для 32-битных платформ sizeof(int) == sizeof(long int) == 4. То есть int с чем-нибудь по размеру совпадает, но нужно угадать, с чем именно на этот раз.
      
      По такой логике на 64-битной машине надо было вообще делать sizeof(int) == 8.
      Ответить
      - guest8 13.02.2019 18:58 # −999
        
        показать все, что скрытоvanished
        Ответить
      - guest8 13.02.2019 19:03 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:14 # +1
        
        Да, кстати, в «Юниксе», пытаясь абстрагироваться от железа, выдумали какую-то глупость с типами без явного размера.
        
        Но ведь при сохранении данных в файл или при отправке по сети использовался явный размер. Допустим, у меня есть формат графического файла с плотностью 24 бита на пиксель (каналы R, G, B по 8 бит). Если я вместо 24 битов запишу 16, 32 или 64, аргументируя это тем, что такой размер инта на моей машине, то этот файл никто не сможет прочитать (точнее, смогут только те, кто компилировал вьюер тем же компилятором). Значит, мне придётся использовать низкоуровневую питушню, в которой я могу размер указать явно.
        
        Почему они так сделали?
        Ответить
        
        guest8 13.02.2019 19:19 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:32 # +1
        
        У формата «TIFF» может быть сигнатура «II» или «MM». Угадайте с одного раза, что она означает.
        
        Так вот, «II» означает «Иинтел», т. е. числа, не помещающиеся в байт, записывали адепты маленького конца.
        
        «MM» означает «Ммоторола», т. е. числа, не помещающиеся в байт, записывали адепты большого конца.
        
        Естественно, как на машине с «little endian», так и на машине с «big endian» можно было посмотреть порнокартинки обоих форматов, просто при просмотре файлов с сигнатурой «MM» на машине с интеловским процессором теоретически чуть-чуть снижался пирфоманс из-за необходимости менять порядок байтов. Хотя какой к чёрту пирфоманс из-за порядка байтов, когда основное время съедает ввод-вывод или разжатие?
        Ответить
        
        guest8 13.02.2019 19:35 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 19:36 # +1
        
        Чтобы добавить ёбли в парсерах.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 19:40 # 0
        
        Зато он оберегает от необходимости передавать кокококодировку отдельно или детектировать её хитрыми алгоритмами.
        Ответить
        
        guest8 13.02.2019 19:47 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.02.2019 19:50 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 20:01 # +3
        
        > мне не важен размер
        Т.е. тебе вообще похуй на результат твоей проги?
        
        Есть 3 стула:
        1) Для корректной работы проги тип должен вместить нужные мне числа. И мне похуй, как конпелятор его реализует.
        2) Для корректной работы проги тип должен иметь указанные мной размер и представление.
        3) Мне нужен самый эффективный тип на данной платформе (для длинной арифметики, к примеру).
        
        int описывает только третий вариант. А этот вариант в реальном коде встречается гораздо реже первого...
        
        З.Ы. Разрабатывая код, я вообще не знаю что я могу засунуть в int т.к. минимальный размер инта описан в informative приложении к стандарту, которое никого ни к чему не обязывает.
        Ответить
        
        guest8 13.02.2019 20:04 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 20:07 # 0
        
        > INT_MAX
        Ну я же пишу - во время разработки кода, а не во время копуляции.
        Ответить
        
        guest8 13.02.2019 20:09 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 20:13 # +5
        
        > автолулз
        Т.е. язык оказался настолько непригоден для разработки, что почти сразу (лет через 8) пришлось к нему нагородить внешний конфигуратор из говна и палок. Ок.
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 21:25 # 0
        
        Кстати, кто-нибудь может объяснить, зачем нужен скрипт libtool? Что он может сделать такого, чего не могут стандартные средства?
        Ответить
        
        guest8 13.02.2019 23:29 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 00:06 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 13:56 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 13:58 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 14.02.2019 00:08 # 0
        
        Под венду всё равно не соберёт.
        Ответить
        
        Kakou-mo_nemyx 14.02.2019 00:49 # 0
        
        Говорите точно, под кокококой кокококомпилятор. У меня под «mingw» всё собирает.
        Ответить
        
        bormand 14.02.2019 07:52 # 0
        
        MSVC.
        Ответить
        
        Kakou-mo_nemyx 14.02.2019 12:29 # 0
        
        Под него вроде и autotools никто не затачивал?
        Ответить
        
        Kakou-mo_nemyx 13.02.2019 20:05 # 0
        
        Ещё в эпоху «DOS» было немало случаев, когда случайно оказывалось, что программа не может прочитать половину файла, потому что компилятор по умолчанию использует «signed». Разработчикам приходилось оперативно добавлять квалификатор «unsigned» в 100500 мест, чтобы поднять лимит.
        
        Это одно из следствий похуизма.
        Ответить
        
        guest8 13.02.2019 20:10 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 14.02.2019 05:50 # 0
        
        А может где-то нужен именно signed и ты своим typedef или #define всё поломаешь?
        Ответить
        
        bormand 13.02.2019 20:10 # +1
        
        > похуизма
        Не, с файлами другая история. Никто не верил, что появятся настолько огромные накопители и тем более файлы. Причём много раз подряд не верили. Да и сейчас не верят - диски перевели на унылое LBA48 вместо LBA64.
        Ответить
        
        guest8 13.02.2019 23:03 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        O4epegHou_nemyx 14.02.2019 05:50 # 0
        
        Именно поэтому я за 640 Кб.
        Ответить
        
        guest8 15.02.2019 01:13 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 15.02.2019 07:24 # 0
        
        А если программа влезает, но требует сотню метров библиотек?
        Ответить
        
        guest8 15.02.2019 10:42 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 15.02.2019 12:03 # 0
        
        > оверлеи
        Эдак и многозадачность можно запилить.
        Ответить
        
        guest8 13.02.2019 20:17 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 20:18 # 0
        
        > А если битоёбишь, то уже не похуй.
        Иди второй вариант дочитай, блджад.
        Ответить
        
        guest8 13.02.2019 20:20 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        j123123 14.02.2019 07:56 # 0
        
        > 3) Мне нужен самый эффективный тип на данной платформе (для длинной арифметики, к примеру).
        
        > int описывает только третий вариант.
        
        Нет, не описывает. На x86-64 у тебя будет 32-битный int, но для эффективной длинной арифметике на данной платформе лучше взять 64-битный тип
        Ответить
        
        j123123 14.02.2019 08:10 # 0
        
        > З.Ы. Разрабатывая код, я вообще не знаю что я могу засунуть в int т.к. минимальный размер инта описан в informative приложении к стандарту, которое никого ни к чему не обязывает.
        
        Нет, это не в informative. Ну может в каких-то старых и так, но давай взглянем на C17 :
        
        https://web.archive.org/web/20181230041359if_/http://www.open-std.org/jtc1/sc22/wg14/www/abq/c17_updated_proposed_fdis.pdf#subsection.6.2.5
        
        > 6.2.5 Types
        
        > A "plain" int object has the natural size suggested by the architecture of the executionenvironment (large enough to contain any value in the range INT_MIN to INT_MAX as defined in the header <limits.h>).
        
        https://web.archive.org/web/20181230041359if_/http://www.open-std.org/jtc1/sc22/wg14/www/abq/c17_updated_proposed_fdis.pdf#subsection.5.2.4
        
        > 5.2.4.2.1 Sizes of integer types <limits.h>
        
        > Moreover, except for CHAR_BIT and MB_LEN_MAX, the following shall be replaced by expressions that have the same type as would an expression that is an object of the corresponding type converted according to the integer promotions. Their implementation-defined values shall be equal or greaterin magnitude (absolute value) to those shown, with the same sign.
        Ответить
        
        bormand 14.02.2019 08:11 # 0
        
        Хм, и правда. А нахуя они в С99 джва раза эти размеры описали. Один раз в этом разделе и второй - в приложении.
        
        Т.е. int это int16_least_t. Ок.
        Ответить
        
        j123123 14.02.2019 08:11 # 0
        
        Кстати, раз UCHAR_MAX должен быть как минимум 255, то CHAR_BIT по этому стандарту менее чем 8-битным быть не может (потому что 255 тупо не влезет в 7-битный байт)
        Ответить
        
        bormand 14.02.2019 08:31 # +1
        
        Вот что реально хотелось бы - набор интов с фиксированной длиной (одинаково работающих для всех платформ) и компайл-тайм флажки про emulated operations и emulated storage для этих типов.
        
        Например на арме, если я не туплю, uint8 будет с флагом emulated operation но без emulated storage. А на какой-нибудь DSP'шке он получит и emulated storage.
        Ответить
        
        bormand 14.02.2019 08:38 # +1
        
        З.Ы. Ну и возможно режимы unchecked/checked/saturated для знаковых чисел. Опять же с одинаковой реализацией для всех платформ и флажками про их нативную поддержку.
        Ответить
        
        guest8 13.02.2019 19:45 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 13.02.2019 19:46 # +2
        
        Особенно красиво там смотрится DWORD64.
        Ответить
        
        guest8 13.02.2019 19:48 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        eszett 13.02.2019 21:18 # 0
        
        Есть еще DWORDLONG, ULONLONG, ULONG64, все тот же uint64
        Ответить
        
        guest8 13.02.2019 23:28 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 22:48 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.02.2019 23:53 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 15.02.2019 00:28 # −999
        
        показать все, что скрытоvanished
        Ответить

guest8 13.02.2019 16:57 # −999

показать все, что скрытоvanished

Ответить

O4epegHou_nemyx 13.02.2019 17:15 # 0

Что это?
Ответить
- guest8 13.02.2019 17:16 # −999
  
  показать все, что скрытоvanished
  Ответить
  - O4epegHou_nemyx 13.02.2019 17:28 # 0
    
    Откуда надыбал?
    Ответить
    - Kakou-mo_nemyx 13.02.2019 17:33 # 0
      
      Попробовал погуглить, откуда он мог надыбать:
      https://devblog.gosso.se/2018/06/how-to-implement-security-txt-under-well-known-in-iis/
      
      https://cybersins.com/howto-resposible-disclosure-with-security-txt/
      
      https://www.bountysource.com/issues/55643936-add-security-txt
      
      https://securitytxt.org/
      Ответить
Kakou-mo_nemyx 13.02.2019 17:31 # 0

Роман, а почему ты пишешь от имени гостя?
Ответить
guest8 13.02.2019 18:36 # −999

показать все, что скрытоvanished
Ответить
- O4epegHou_nemyx 13.02.2019 18:38 # 0
  
  Я думаю, это "оффтоп".
  Ответить
  - guest8 15.02.2019 00:30 # −999
    
    показать все, что скрытоvanished
    Ответить
guest8 14.02.2019 23:56 # −999

показать все, что скрытоvanished
Ответить
- guest8 15.02.2019 00:29 # −999
  
  показать все, что скрытоvanished
  Ответить
  - Kakou-mo_nemyx 15.02.2019 00:59 # 0
    
    А куда складывать плохо известное?
    Ответить
    - guest8 15.02.2019 01:12 # −999
      
      показать все, что скрытоvanished
      Ответить
    - MAKAKA 27.03.2020 16:55 # 0
      
      .badly-known
      Ответить
      - KOPOHABuPYC 28.03.2020 01:55 # 0
        
        Макака, твои легкие я сгною с особым удовольствием.
        Ответить
guest8 14.02.2019 23:57 # −999

показать все, что скрытоvanished
Ответить
- guest8 15.02.2019 00:28 # −999
  
  показать все, что скрытоvanished
  Ответить
  - guest8 15.02.2019 00:31 # −999
    
    показать все, что скрытоvanished
    Ответить

Elvenfighter 14.02.2019 00:25 # 0

> Ведь sizeof(long int) может быть равен sizeof(char).

Тем, кто пишет под такие вот платформы, думаю, не стоит париться о кросс-платформенности.

Ответить

Steve_Brown 14.02.2019 10:31 # +5

Надо написать самый ебанутый компилятор
который полностью соответствует стандарту
но при этом реализует все как попало - 7 бит в байте, 3 байта в инте, поля структуры хранятся в случайном порядке с паддингом, нулевой указатель имеет представление 42.
И заставить, чтобы все программы могли компилироваться под этот компилятор и работать.

Ответить

O4epegHou_nemyx 14.02.2019 10:45 # 0

Crazy C Compiler
Ответить
- Kakou-mo_nemyx 14.02.2019 16:05 # +1
  
  Смотри, чувак написал ебанутый компилятор сишки, выхлоп которого содержит только инструкции MOV:
  https://github.com/Battelle/movfuscator
  Ответить
  - Kakou-mo_nemyx 14.02.2019 16:21 # +1
    Статья о тьюринг-полноте инструкции «mov»:
    https://www.cl.cam.ac.uk/~sd601/papers/mov.pdf
    
    Автор даже изобрёл ветвление на mov'ах. Пример:
    
    mov [di], 0 mov [si], 1 mov ax, [di]
    
    В результате выполнения в ax будет лежать 1, если si=di, и ноль, если они не равны.
    Ответить
    - Kakou-mo_nemyx 15.02.2019 01:07 # 0
      
      Автор реально крейзи: «Removing all but the mov instruction from future iterations of the x86 architecture would have many advantages: the instruction format would be greatly simplified, the expensive decode unit would become much cheaper, and silicon currently used for complex functional units could be repurposed as even more cache. As long as someone else implements the compiler».
      Ответить
      - Kakou-mo_nemyx 15.02.2019 17:38 # 0
        
        https://ru.wikipedia.org/wiki/URISC
        Ответить
  - O4epegHou_nemyx 14.02.2019 16:41 # +1
    
    Этот чувак реально крэйзи:https://github.com/Battelle/reductio/blob/master/README.md
    Ответить
    - Kakou-mo_nemyx 14.02.2019 17:16 # 0
      
      Обобщённое программирование, устранение дублирования кода.
      Ответить
    - Kakou-mo_nemyx 14.02.2019 17:26 # 0
      
      Я вот ещё что придумал: к сожалению, инструкцию MOV для x86 нельзя представить в ASCII-кодах, зато инструкции AND, SUB, XOR представить в ASCII-кодах можно, причём как с непосредственным аргументом, так и с байтом mod r/m.
      
      Надо придумать эффективный способ выражения MOV через комбинации этих трёх инструкций.
      
      На поверхности такой вариант: обнуляем регистр с помощью XOR или SUB самого с собой, потом с помощью XOR кладём в него новое значение.
      Ответить
      - Kakou-mo_nemyx 15.02.2019 01:53 # 0
        
        Он меня опередил. У него есть постпроцессоры, умеющие заменять MOV на другие инструкции:
        
        ## XORfuscator x86 xor is Turing-complete, so the XORfuscator translates programs into XOR instructions, and only XOR instructions. ## SUBfuscator Translates programs into only SUB instructions.
        Ответить
    - guest8 14.02.2019 17:31 # −999
      
      показать все, что скрытоvanished
      Ответить
      - Kakou-mo_nemyx 14.02.2019 17:32 # 0
        
        Но как Вы это расследовали, Холмс?
        Ответить
      - Kakou-mo_nemyx 15.02.2019 01:08 # 0
        
        Надо «Микрософту» сказать, что всё ПО в мире копирует их «Сапёра».
        Ответить
bormand 14.02.2019 11:55 # +3

> 3 байта в инте
31 бит в инте. А то получается, что padding биты в стандарте зря описаны и нигде реально не встречаются...
Ответить
- bormand 14.02.2019 12:00 # +4
  
  З.Ы. А в padding битах будет лежать CRC4 от данных. И все операции будут убивать прогу если эти биты некорректны. Битоёбы должны страдать.
  Ответить
  - bormand 14.02.2019 12:15 # +4
    
    Отрицательные числа запишем в формате sign+magnitude. Причём magnitude поксорено с магической константой и провёрнуто циклическим сдвигом. Ибо нехуй кастовать.
    Ответить
bormand 14.02.2019 12:09 # +2

Я бы ещё все символы basic execution set перемешал в случайном порядке. Стандарт не запрещает.
Ответить
bormand 14.02.2019 12:21 # +3

В указатели добавим случайные биты (равные для указателей на один объект). Ибо нельзя сравнивать указатели на разные объекты.
Ответить
- O4epegHou_nemyx 14.02.2019 12:27 # 0
  
  В моём тёмном царстве уныния и безнадёжности появился проблеск надежды. Запрещены ли по стандарту рекурсивные макросы?
  Ответить
  - bormand 14.02.2019 12:31 # 0
    
    Да, запрещены, к сожалению. Макросы раскрываются один раз и попадают в блеклист.
    
    Что не помешало в boost preprocessor замутить конечные но достаточно юзабельные циклы.
    Ответить
    - O4epegHou_nemyx 14.02.2019 12:33 # +2
      
      Свет погас...
      Ответить
      - bormand 14.02.2019 13:25 # +2
        
        Юзай `m4'.
        Ответить
        
        guest8 23.02.2019 02:30 # −999
        
        показать все, что скрытоvanished
        Ответить
- 1024-- 14.02.2019 17:18 # 0
  
  > Ибо нельзя сравнивать указатели на разные объекты.
  Т.е. вообще нельзя указатели сравнивать?
  Если объекты разные, сравнивать нельзя; если одинаковые, то всё очевидно - не нужно сравнивать. Если неясно, то есть шанс, что объекты разные - нельзя.
  Ответить
  - guest8 14.02.2019 17:23 # −999
    
    показать все, что скрытоvanished
    Ответить
    - 1024-- 14.02.2019 17:39 # 0
      
      Какой багор )))
      Но какой прок от этого? Разные массивы можно хранить в разных адресных пространствах?
      UB ради UB, ограничивают полезные возможности.
      Ответить
      - guest8 14.02.2019 17:44 # −999
        
        показать все, что скрытоvanished
        Ответить
      - bormand 14.02.2019 18:54 # +2
        
        Для поддержки gc. Чтобы он мог без палева двигать объекты.
        Ответить
        
        Kakou-mo_nemyx 14.02.2019 21:00 # 0
        
        Если в рантайме объекты будут перемещаться сами собой, почти весь царский сишный код вмиг перестанет работать.
        Ответить
        
        guest8 23.02.2019 02:29 # −999
        
        показать все, что скрытоvanished
        Ответить
bormand 14.02.2019 13:33 # +1

Ну и зависимость всех этих битностей и т.п. от фазы луны и положения звёзд - в полнолуние байт 13 бит, к примеру. Чтоб не хардкодили размеры.
Ответить
- gost 14.02.2019 13:46 # +2
  
  …А всем недовольным комментаторы с Хабра будут писать, что это низкоуровневый язык и тут так принято, а кому это не нравится — тот быдло тупое!
  Ответить
  - bormand 14.02.2019 14:00 # 0
    
    Прикрывайся сковородочкой.
    Ответить
  - bormand 14.02.2019 15:16 # +1
    
    Надо ещё сделать процессор, на котором вся эта хуйня достаточно оптимально работает.
    Ответить
    - Kakou-mo_nemyx 14.02.2019 15:53 # +1
      
      j123123 периодически притаскивает сюда интересные курьёзы. Вот, например, шизик пытается изобрести 40-битный аналог 80386:
      http://www.libsf.org/li386/indexmain.html
      Ответить
      - CHayT 14.02.2019 15:56 # 0
        
        TempleOS надо туда портировать
        Ответить
        
        Bapr_BuKePHeC 16.02.2019 15:57 # 0
        
        Я бы её вообще сжёг.
        Ответить
        
        3oJIoTou_xyu 16.02.2019 17:40 # 0
        
        Она каменая
        Ответить
      - guest8 14.02.2019 16:23 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Kakou-mo_nemyx 14.02.2019 16:31 # 0
        
        Сорокоуст.
        Ответить
    - CHayT 14.02.2019 15:55 # 0
      
      В GPU регистры между тредами шарятся, можно пойти дальше и bus lines шарить.
      Ответить
Kakou-mo_nemyx 14.02.2019 17:35 # +4

>> который полностью соответствует стандарту
>> но при этом реализует все как попало

Итальянская забастовка!

https://ru.wikipedia.org/wiki/Итальянская_забастовка
Ответить
j123123 23.02.2019 00:59 # 0

> но при этом реализует все как попало - 7 бит в байте

Не выйдет, UCHAR_MAX нельзя будет записать. Он должен быть минимум 255.
Ответить

guest8 14.02.2019 15:56 # −999

показать все, что скрытоvanished

Ответить

Koko 28.03.2020 18:22 # 0

Какой-то багор )))000)0)
Ответить
- KOPOHABuPYC 29.03.2020 22:10 # 0
  
  Это не багор, это твоя будущая кардиограмма.
  Ответить

Говнокод: по колено в коде.

Си / Говнокод #25375

Комментарии (223) RSS

Добавить комментарий