Говнокод #27177 — JavaScript

MAKAKA 25.12.2020 01:49 # +1

У вас конечно неплохие зачатки чтобы стать "PHP" программистом, но возможно вам стоит почитать про оператор сравнения двух чисел

Ответить

Alexandre 25.12.2020 01:55 # 0

Про операторы сравнения, разумеется знаю, но как-то даже сам не сообразил, что написал. Первым делом в голову пришёл такой вариант, но т.к времени размышлять не было, излагал всё в коде.
Ответить
- Rooster 27.12.2020 18:06 # +1
  
  Излажал.
  Ответить

gost 25.12.2020 02:47 # +2

>>> Первым делом в голову пришёл такой вариант, но т.к времени размышлять не было, излагал всё в коде.
И вот именно поэтому начинать программировать нужно с «Си».

Ответить

Alexandre 25.12.2020 03:01 # 0

Объясните суть не просветлённому, пожалуйста.
Ответить
- MAKAKA 25.12.2020 03:03 # +4
  
  Потому что программисту на "Си" проверить знак числа через строку это примерно как забить шуруп в бетонную стену ботинком: в принципе наверное реально, но сложно, долго, неудобно, глупо, и не нужно
  Ответить
  - bootcamp_dropout 25.12.2020 13:53 # 0
    
    Приведи реальный пример задачи которую программисту на "Си" не как забить шуруп в бетонную стену ботинком
    Ответить
    - MAKAKA 25.12.2020 14:22 # 0
      
      сериализовать данные из памяти на диск оптимальным образом
      Ответить
      - bormand 25.12.2020 21:36 # +3
        
        Да, в этом примере шуруп действительно забивается не в стену, а в яйца того, кто будет это поддерживать.
        
        50% багов и уязвимостей в мире, имхо, от сишных сериализаций и парсеров. Остальные в PHP.
        Ответить
        
        gost 25.12.2020 21:54 # +1
        
        > 50% багов и уязвимостей в мире, имхо, от сишных сериализаций и парсеров. Остальные в PHP.
        От strcpy(), memcpy() и printf() ещё. Хлебать говно с выходом за границы сишных массивов мы будем ещё очень долго.
        Ответить
        
        bormand 25.12.2020 21:57 # 0
        
        Дык это и есть наколеночная сериализация да парсинг.
        Ответить
        
        Desktop 25.12.2020 22:38 # 0
        
        яка розумна цьому альтернатива?
        Ответить
        
        bormand 25.12.2020 22:41 # 0
        
        Генераторы сериализаторов.
        Ответить
        
        guest6 25.12.2020 23:09 # 0
        
        то есть если тебе нужно считать структуру из файла на си, ты используешь json, да?
        Ответить
        
        bormand 25.12.2020 23:26 # 0
        
        Да, но с типизированной обёрткой над ним. Вот реально, ни разу об этом не пожалел.
        
        А надо было пилить свой говнопарсер и годами отлавливать в нём баги, страдать при добавлении новых полей и изучать что там записалось в хекс-редакторе? Только тогда сишники примут в свою касту?
        Ответить
        
        guest6 25.12.2020 23:35 # 0
        
        я просто беру .h файл со структурой правильно упакованной из SDK, и теку.
        
        разумеется, речь идет о тех данных, которые не нужно валидировать (там нет указателей), и которые не будут меняться.
        Ответить
        
        bormand 25.12.2020 23:38 # 0
        
        Угу, которые не нужно валидировать, править руками, читать глазами, поддерживать, обновлять, передавать на другие машины... Там и правда прокатит сишная структурка.
        
        З.Ы. Ну и чтобы не было иерархии и желательно вообще коллекций, само собой. Ну и строк переменной длины чтобы не было. Тогда вообще прям идеальный кейс.
        Ответить
        
        MAKAKA 25.12.2020 23:42 # 0
        
        >которые не нужно валидировать,
        зачем валидировать инты?
        
        >править руками,
        огромное количество конфигов нереально руками исправить, сейчас даже дырки в файрволе тулой открывают.
        
        алсо, у некоторых конфигов вообще есть только гуй
        
        >читать глазами,
        огромное количество конфигов нереально галазми читать, сейчас даже настройки сервисов через тулу читают
        
        алсо, у некоторых конфигов вообще есть только гуй
        
        >поддерживать
        что?
        
        >обновлять
        что не так?
        
        >передавать на другие машины...
        тут-то что не так, если у меня структура упакована верно?
        
        Ты бы поглядел сколько времени у жавоёба уходит на серилазиацию в джсон и обратно рефлексией, и понял бы, как пиздато сишнику с указателем на структуру в памяти)
        Ответить
        
        bormand 25.12.2020 23:45 # 0
        
        > зачем валидировать инты
        
        Ну ты какой-то вырожденный случай рассматриваешь, когда у тебя фиксированная структура из трёх сраных интов и вообще насрать на их значения...
        
        Не хочу спорить короче, наебался я уже с сишными структурами. Как своими так и унаследованными. Не нравится жсон - возьми более подходящий готовый сериализатор.
        Ответить
        
        MAKAKA 25.12.2020 23:48 # 0
        
        Спорить действительно странно, потому что мы говорим о разных требованиях.
        
        Конечно же дерево строк разной длинны так хранить не нужно, но очень часто структуры бывают именно статические, а разве у тебя в железе таких структур нет?
        
        И вот в сишке у меня есть такая возможность -- взять память, и натянуть на структуру, а в высокоуровневом говне -- нет.
        Ответить
        
        bormand 25.12.2020 23:51 # 0
        
        Константы я обычно просто в хедере описываю. Или пишу скрипт, который мне из них сделает такой хедер. Зачем для этого какие-то файлы, натягивания структур на память и прочая требуха?
        
        Файлы нужны для динамичных вещей, которые будут меняться, которые потом обновлять и поддерживать придётся...
        Ответить
        
        MAKAKA 25.12.2020 23:57 # 0
        
        Ну вот я тебе скажу, что моя волшебная железка пишет в память 4 байта.
        
        Первый байт это размер кукорямбы (беззнаковое целое)
        Второй байт состоит из восьми флагов: тилли, вилли, билли итд.
        Остальные два это целое беззнаковое (это всё за пределы x86 не выходит, так что байт ордер ты знаешь)
        
        Как ты вот такое распарсишь?
        Ответить
        
        bormand 26.12.2020 00:23 # 0
        
        > Как ты вот такое распарсишь?
        
        Практика показывает, что через год-другой эта железка будет возвращать какой-нибудь массив температур в Яунде, первый байт окажется variable-length интом, а при включенном флаге тилли там ещё пять байт прилетает...
        
        Поэтому стримо-вьюхой, которая безопасно читает по одному полю с указанным типом и эндианом.
        
        Если и мапать -- то только в приватную структуру, чтобы не дай бог остальной код эту срамоту не видел и на её поля не завязался.
        Ответить
        
        guest6 26.12.2020 00:44 # 0
        
        Ну вот мы тут давеча за MBR пиздели.
        
        Сильно ли поменялась структура MBR за последние тридцать семь лет?
        
        Если у тебя поменяется структура, то у тебя обосрется любая десериализация, будь то сгенерированный по схеме код или даже JSON (хотя последний переживет конечно добавление новых полей)
        Ответить
        
        bormand 26.12.2020 01:10 # 0
        
        > обосрется любая десериализация
        
        Суть в том, что многие бинарные форматы имеют какие-то штуки с переменной длиной (массивы, иногда даже полиморфные), оффсетами (относительно какого-нибудь хедера в середине) или особенным кодированием (variable-length числа, к примеру).
        
        Какие-то куски этих форматов можно замапать на сишные структуры. Но далеко не все. При этом надо не забывать о проверках на вылет за буфер.
        
        Посмотри на gpt (массив с указанным в заголовке шагом) или usb дескрипторы (полиморфный массив), я молчу о файлухах.
        
        > Сильно ли поменялась структура MBR за последние тридцать семь лет?
        
        Я не историк, но на английской вики аж 6 каких-то вариантов, LBA тоже поди сбоку прикручено.
        
        З.Ы. Ага, в 96 году. Ну 24 года из 37 ничего не менялось.
        Ответить
        
        guest6 26.12.2020 01:28 # 0
        
        Если у тебя переменная длина, то твоя структура зависит от данных. Разумеется, мапинг тут использовать встрёмно
        
        >проверках на вылет за буфер.
        Это тоже актуально только для переменной длины.
        
        Если такой длины нет, то я просто определяю размер статически, и теку
        
        >24
        ну ок, ну вот)
        Ответить
        
        bormand 26.12.2020 01:30 # 0
        
        > Это тоже актуально только для переменной длины.
        
        Ну вот у тебя там в начале структуры какая-то длина. Её проверить надо, видимо. Вдруг там написано 4, а реально пришло 3 байта? Это вполне штатная ситуация, когда со всяким говном работаешь.
        
        На подобное штуке обосрался openssl и словил heartbleed.
        Ответить
        
        guest6 26.12.2020 01:34 # 0
        
        Откуда там пришло 4?
        Если поменялся формат (Petuh, Petuh2 итд) то конечно нужно передавать sizeof()
        
        А если они нарушили протокол, но пускай сами нахуй идут, не?
        
        Хотя конечно с другой стороны я не хочу прочитать неинициализированную память, и получить UB или незамапаленную память, и получуть фолт (особенно если я драйвер например, и могу уронить систему)
        Тут ты прав
        Ответить
        
        bormand 26.12.2020 01:44 # 0
        
        > Откуда там пришло 4?
        
        Откуда я знаю? Так вышло. Deal with it.
        
        > упасть
        
        Упасть -- это лучший исход, имхо. Хуже когда какие-нибудь данные закорраптятся или утекут. Или вообще RCE.
        Ответить
        
        MAKAKA 26.12.2020 02:01 # 0
        
        >Откуда я знаю? Так вышло. Deal with it.
        
        MAKAKA: смотрите! В си можно сохранить на диск два байта, считать их, и обойтсь без сериализации
        
        Всё: ну конечно, хакер пошлет тебе по сети неверное значение, ты выделишь неверного размера буфер, и хакер сделает тебе RCE
        Ответить
        
        Desktop 26.12.2020 02:02 # +3
        
        > сохранить на диск два байта
        - лаба
        
        > хакер пошлет тебе по сети неверное значение
        - суровая реальность
        Ответить
        
        gost 26.12.2020 01:44 # +2
        
        > Откуда там пришло 4?
        Да-да-да, вот именно так одним тёмным вечером думал простой программист Джон, создавая очередную дырень, которая через N лет приведёт к потере охулиарда долларов у незадачливых пользователей.
        
        > Хотя конечно с другой стороны я не хочу прочитать неинициализированную память, и получить UB или незамапаленную память, и получуть фолт (особенно если я драйвер например, и могу уронить систему)
        Oh, sweet summer child! Если бы всё ограничивалось простым сегфолтом — мы бы жили в прекрасном мире розовых единорогов.
        Помнишь «Heartbleed»? Почитай описание, если не помнишь, и впечатлись.
        Ответить
        
        MAKAKA 26.12.2020 01:53 # 0
        
        Вы начинаете выдвигать какие=то охуительные требования, которых изначально не было.
        
        Если вы боитесь дырени, то вам и джейсон с жабкой нахуй не нужен, а уж про все эти undefined в JS я вообще молчу
        
        херблядь тут вообще не причем: пришедшие по сети данные логично проверять, если не ты их послал. Я же не о том
        Ответить
        
        bormand 26.12.2020 02:03 # +1
        
        > пришедшие по сети данные логично проверять, если не ты их послал
        
        пришедшие данные логично проверять
        
        fxd
        Ответить
        
        MAKAKA 26.12.2020 02:04 # 0
        
        То есть MBR из примера ты бы читал по байтику?
        Ответить
        
        bormand 26.12.2020 02:05 # 0
        
        > Вы начинаете выдвигать какие=то охуительные требования, которых изначально не было
        
        Отмазка прям в стиле microsoft: а вы нормальным клиентом ходите, тогда наш сервак падать не будет.
        Ответить
        
        MAKAKA 26.12.2020 02:07 # 0
        
        Ээ.. чувак, бывают разные требования.
        
        Если я пишу хайлоад приложение, работающее с бигдатой, то у меня одни требования
        
        А если веб сайт для себя то другие.
        
        Если я пишу библиотеку для криптографии, которая будет работать с данными, которые хуй знает кто подготовил, то у меня одни требования.
        
        А если я хочу сейф своей игры сделать, или тулу, которая читает задокументированную статическую структуру, то другие
        
        не?
        Ответить
        
        bormand 26.12.2020 02:09 # +3
        
        > если я хочу сейф своей игры сделать
        
        Ага, а потом люди качают специально сформированный сейв и остаются без биткоинов. Именно поэтому у меня и нет доверия к софту. Вообще.
        Ответить
        
        MAKAKA 26.12.2020 02:13 # 0
        
        расскажи опжлста как ты спиздишь биткоины с помощью специально сформированного сейфа, если его структура статична
        Ответить
        
        bormand 26.12.2020 02:15 # 0
        
        > если его структура статична
        
        Почитай про Starcraft EUD. Тебе понравится ;)
        Ответить
        
        MAKAKA 26.12.2020 02:18 # 0
        
        а можно вкраце?
        
        я всё равно не понимаю как можно что-то переполнить считав байт с флагами
        Ответить
        
        bormand 26.12.2020 02:19 # 0
        
        Ну вот у тебя там в файле инты всякие, флаги. Возможно какой-то инт заставит какой-то цикл уже во время игры выйти за границу какого-то другого буфера и т.п. Или какая-то кобенация флагов тобой не была учтена.
        
        З.Ы. Иди читай, блин, там чуваки целую экосистему вокруг этого бага в старкрафте развернули.
        Ответить
        
        MAKAKA 26.12.2020 02:23 # 0
        
        >. Возможно какой-то инт заставит какой-то цикл уже во время игры выйти за границу какого-то другого буфера
        
        что мешает мне насрать неверный int в json?
        
        ладно, почитаю потом
        Ответить
        
        gost 26.12.2020 02:15 # +2
        
        Я как-то разрабатывал в исследовательских целях для одной старенькой игрушки игрушечный сервер, который выглядел абсолютно нормально, но при заходе на которой у пользователя запускался «calc.exe». С тех пор тоже не доверяю софту.
        P. S. Ещё как-то натыкался на любопытную статью, в которой описывалось создание полноценного ботнета из игроков небезызвестного «Counter Strike». Причём, если мне память не изменяет, там для вступления в коллектив достаточно было вообще просто внутри игры посмотреть информацию о таком весёлом сервере. Очень хороший пример того, как на сишке легко и просто сериализовывать данные, да.
        
        > расскажи опжлста как ты спиздишь биткоины с помощью специально сформированного сейфа, если его структура статична
        «Heartbleed», там тоже хендшейк статичен.
        Ответить
        
        MAKAKA 26.12.2020 02:17 # +1
        
        хендшейк опенссл сломал опенссл, каким образом мое приложение молжет спиздить биткоины, если оно с ними не работает?
        Ответить
        
        gost 26.12.2020 02:19 # +2
        
        Очень просто: хендшейк опенссл слил хакеру твой пароль от онлайн-кошелька с биткоинами.
        Ответить
        
        MAKAKA 26.12.2020 02:27 # 0
        
        для этого хендшейк должен впринципе уметь выполнять какой-то код, который читает биткоины
        
        если он не берет ни код, ни имена внешних тулов из структуры, то как он что считает?
        
        если размер буфера известен заранее, то самое ужасное, что может случиться, это буфер заполнится мусором
        
        Например, я буду ждать там 0 или 1, а получу 23
        
        Тоже самое может случиться и в JSON, это тоже придется валидировать
        Ответить
        
        bormand 26.12.2020 02:30 # +2
        
        > это тоже придется валидировать
        
        Да, придётся. Но, по крайней мере, сам парсер уже более-менее отвалидирован без тебя.
        
        В том и проблема, что большая часть сишного кода -- это ебучие самодельные парсеры! Строк, блобов, пакетов, чёрта лысого. Думаешь от хорошей жизни сейчас кругом ASLR и прочие DEP?
        Ответить
        
        guest6 26.12.2020 02:32 # 0
        
        в сишке парсер это каст и комилятор, который ее упаковывает. Он разве не отвалидирован?
        Ответить
        
        bormand 26.12.2020 02:36 # 0
        
        > каст и комилятор, который ее упаковывает
        
        Ну они отвечают только за то, что поля внутри структуры будуть читаться с правильным оффсетом. А вот что она замапана как надо и куда надо и прочитана полностью и без мусора отвечаешь ты и только ты.
        Ответить
        
        gost 26.12.2020 02:39 # 0
        
        > в сишке парсер это каст и комилятор, который ее упаковывает.
        Вот именно. А нормальный, вменяемый парсер должен уметь правильно валидировать поступающие ему на вход данные по-хорошему ещё на стадии парсинга — и уж точно до того, как отдать их клиентскому коду.
        
        Ну вот появилось у тебя требование: считать байт со значением не меньше единицы и не больше сотни. В самописном сишкопарсере тебе придётся делать ёбанный костыль — и таким образом ты пойдёшь по пути создания ёбанного говнопарсера с дырами, о чём я написал выше. Унылый жаваёб просто напишет что-нибудь вроде @validate(GREATER, 0, LOWER, 101) или что они там для такого пишут — и пойдёт дальше писать фабрики стратегий.
        
        Короче говоря, любое дело нужно делать правильно с самого начала, иначе в конце ты рискуешь получить дырявое говно.
        Ответить
        
        guest6 26.12.2020 02:42 # 0
        
        >вменяемый парсер должен уметь правильно валидировать поступающие ему на вход данные
        
        А что еще он должен?
        
        Я вот люблю SOAP, и считаю, что вменяемый парсер должен поддерживать схемы и ENUM.
        
        а JSON не поддерживает из коробки, и потому он говно, не?
        
        Фишка в том, что всё это не бесплатно.
        JSON в миллион раз более не бесплатен, и самое главное -- он совершенно бесполезен, когда тебе нужно считать заранее задокументированную структуру НЕ в JSON формате
        Ответить
        
        gost 26.12.2020 02:49 # 0
        
        > А что еще он должен?
        Быть удобным, расширяемым и безопасным инструментом. Сишный «парсер», увы, подходит только по первому пункту, и то исключительно тогда, когда тебе надо считать два инта и три флага.
        Ответить
        
        guest6 26.12.2020 02:54 # 0
        
        >расширяемым
        структура mbr, как было замечено выше, не менялась 24 года. Зачем тут что-то расширять?
        
        И зачем мне расширять что-то, если и писун и читун данных лежат в одном модуле трансляции?
        
        >безопасным
        что такое "безопасность" для случая с интами и флагами статичной структуры, и как json бы решил эту проблему?
        Ответить
        
        gost 26.12.2020 02:34 # 0
        
        А началось всё с того, что ты написал:
        >>> Хотя конечно с другой стороны я не хочу прочитать неинициализированную память, и получить UB или незамапаленную память, и получуть фолт
        На что я тебе резонно заметил, что чтение неинициализированной памяти может привести к гигантским баграм и миллионам мух слитых паролей.
        Ответить
        
        guest6 26.12.2020 02:40 # 0
        
        Если ваш поинт в том, что чтение неиницилизированной памяти это не только сегфолт, но и еще что угодно, то я соглашусь, но немного перефразирую:
        
        это что угодно из того, что может в принципе сделать программа.
        Ответить
        
        gost 26.12.2020 02:46 # +3
        
        > это что угодно из того, что может в принципе сделать программа.
        Ох, не хочется мне разбивать твои розовые очки…
        https://landave.io/2018/05/7-zip-from-uninitialized-memory-to-remote-code-execution/
        >>> The initialization of some member data structures of the RAR decoder classes relies on the RAR handler to configure the decoder correctly before decoding something. Unfortunately, the RAR handler fails to sanitize its input data and passes the incorrect configuration into the decoder, causing usage of uninitialized memory.
        
        Да, всё верно: ты извлекаешь обычный, безобидный архив, после чего на твоём компьютере выполняется произвольный код. Ну как, тебе ещё не страшно жить?
        Ответить
        
        guest6 26.12.2020 02:54 # 0
        
        > incorrect configuration into the decoder, causing usage of uninitialized memory.
        
        А если бы он читал JSON, то конфигурация всегда была бы корректной?
        Ответить
        
        gost 26.12.2020 02:59 # 0
        
        Так я тебя убедил, что чтение неинициализированной памяти — это выполнение полностью произвольного кода?
        Ответить
        
        MAKAKA 26.12.2020 03:00 # 0
        
        Чтение неинициализированной памяти это UB, а UB вроде как может сделать всё, что угодно, я согласен
        Ответить
        
        CHayT 26.12.2020 02:47 # +2
        
        > это что угодно из того, что может в принципе сделать программа.
        
        Например выполнить шеллкод, который превратит твою программу в готсе.
        Ответить
        
        guest6 26.12.2020 02:52 # 0
        
        для этого тебе нужно, чтобы враг записал данные за пределы выделенной тобой памяти, в область кода, не?
        Ответить
        
        gost 26.12.2020 02:54 # 0
        
        Ну разумеется не. RWX страницы уже почитай и в природе-то не встречаются, чтобы в ним что-то писать.
        Ответить
        
        guest6 26.12.2020 02:56 # +1
        
        В таком случае как я могу выполнить шелл код?
        
        Ну вот я записал в свою структуру Petuh с байтами и флагами какое-то говно, у меня получились всратые флаги и всратые байты, и где тут шелл код такой, что он не работал бы будь там json?
        
        я не доебываюсь, я правда пытаюсь понять
        Ответить
        
        bormand 26.12.2020 02:59 # 0
        
        Да блин, банальный виртуальный или косвенный вызов твоя прога сделает через этот мусор. А дальше ему уже можно помочь пойти куда надо и пропрыгав по твоему коду получить что-то нужное.
        Ответить
        
        guest6 26.12.2020 03:01 # 0
        
        >виртуальный или косвенный вызов
        не понял: в структуре будет указатель на функцию что ли?
        Ответить
        
        bormand 26.12.2020 03:01 # 0
        
        Ну да, у тебя в проге ни одного нет?)
        
        Не обязательно прям в этой. Возможно в какой-то другой, на которую можно повлиять или сослаться мусором из этой.
        Ответить
        
        MAKAKA 26.12.2020 03:04 # +1
        
        Я просто не очень понимаю, как можно считать с диска адрес функции.
        
        Если же адрес функции мы вычисляем на основе данных, то данные нужно валидировать даже если они пришли через JSON.
        
        Грубо говоря если в структуре есть поле "смещение в таблице функций", то нельзя в такое поле писать случайное число, даже если это JSON
        Ответить
        
        bormand 26.12.2020 03:27 # 0
        
        Ну как я понял описание баги -- "мусор" в файле загнал код в неожиданную ветку, которая рассчивает что что-то ещё заполнено (судя по configure decoder там какие-нибудь коллбеки для алгоритмов сжатия). Видимо эта ветка читнула ещё мусорца из неинициализированной локалки и дёрнула коллбек.
        Ответить
        
        Desktop 26.12.2020 02:15 # 0
        
        чот вспомнилось, как я hex-редактором правил файл профиля для FlatOut 2, чтобы обойти UI-йное ограничение на длину имени пользователя
        
        помню, в двух местах надо было исправлять
        Ответить
        
        gost 26.12.2020 02:13 # +2
        
        Суть в том, что единственный способ сделать на сишке более-менее безопасную сериализацию — это сидеть как сыч и параноидально проверять каждое поле, и да, аккуратно читая структурку по байтикам. Всё остальное имеет очень большие шансы через год превратиться в тыкву дыру, через которую все твои данные спиздят, все сохранения в играх потрут и под конец ещё и на рабочий стол насрут.
        
        > Если вы боитесь дырени, то вам и джейсон с жабкой нахуй не нужен, а уж про все эти undefined в JS я вообще молчу
        Джейсоны я могу более-менее безопасно сериализовывать/десериализовывать без адского геморроя и паранойи. Более того, во многих случаях я могу себе позволить даже не проверять всякие там размеры буфера, потому что в этом случае да, всё, чем мне будет грозить выход за границу — это IndexError и 500 клиенту, ну или через что там мы общаемся. А выход за границу массива в сишке мне грозит таким ворохом проблем, что даже как-то неудобно объяснять.
        Ответить
        
        MAKAKA 26.12.2020 02:19 # 0
        
        на сишке ты можешь сгенерировать парсер и лексер, как там было выше правильно замечено, но ты не обязан
        
        на JSON ты не переполнишь буфер, а вот undefined ты получишь отлично.
        Ответить
        
        gost 26.12.2020 02:21 # +1
        
        > на сишке ты можешь сгенерировать парсер и лексер, как там было выше правильно замечено, но ты не обязан
        Ну да, а можно вообще взять либу для парсинга джейсонов и потечь.
        
        > на JSON ты не переполнишь буфер, а вот undefined ты получишь отлично.
        Как я получу undefined, если у меня в языке undefined нет?
        Ответить
        
        MAKAKA 26.12.2020 02:24 # 0
        
        я изначально сравнивал си со всякими JS
        в джаве ты точно так же ловно получишь null, например.
        
        > для парсинга джейсонов и потечь.
        Если мне нужно читать json или хранить иерархические данные неизвестного размера то да, разумеется
        Ответить
        
        bormand 26.12.2020 02:25 # +1
        
        > в джаве ты точно так же ловно получишь null
        
        Да блядь, как можно сравнивать undefined и undefined behavior?!
        Ответить
        
        MAKAKA 26.12.2020 02:30 # 0
        
        Как я могу получить undefined behavior читая байты из файла а буфер заранее известного размера?
        
        Разве что там действительно сложная структура, а в файле насрано, но мы не о сложных структурах.
        Ответить
        
        bormand 26.12.2020 02:33 # 0
        
        > Как я могу получить undefined behavior читая байты из файла а буфер заранее известного размера?
        
        Ну, к примеру, файл оказался короче заранее известного размера. А ты это забыл проверить. Или длинее. Упс.
        Ответить
        
        guest6 26.12.2020 02:36 # 0
        
        очевидно, что файл я читаю в память. Врядли я буду мемори мапд использовать
        
        В памяти я выделил место, например массив
        И конечно инициализировал его нулями (я же не еблан иметь неинициализированную память)
        
        Если файл короче, то в части полей меня ждут ноли.
        совсем как в json, не?
        
        >длинее
        обычно я сообщаю размер приемника тому, кто читает. Это же сишка.
        Ответить
        
        bormand 26.12.2020 02:43 # +1
        
        > я же не еблан
        
        Помнишь, ты вчера спрашивал, что делать, если архитектура в голову не помещается?
        
        Так вот сишнику помимо этой архитектуры и заката солнца вручную приходится держать в голове ещё кучу правил: вот это занулить, вот это передать, вот тут не забыть сравнить...
        Ответить
        
        guest6 26.12.2020 02:45 # 0
        
        Джависту тоже много говна приходится держать, например не забыть про Closable, лол:)
        
        Я не спорю с тем, что сишник все делает вручную, если у него не плюсы конечно
        Ответить
        
        1024-- 26.12.2020 11:57 # +1
        
        Ха! А вот когда я говорил, как удобно в жс и других языках с гц, статушки безгцёвые говорили, что пофиг вообще, программист должен думать, а на жс выходит "undefined" и "[Object object]". В то время, как моя питушня нажиралась памятью или выдавала исключение и падала, их питушня впадала в убное безумие и стирала города с лица земли.
        
        Я говорил сектантам, что если запоминать каждую мелочь, которая "ну мелочь же, как её не запомнить хорошему программисту", то места на бизнес-логику не останется. Но сектанты будут продолжать закатывать Солнце вручную только потому, что в современной книжке 1960 года написали, что программирование на статушне безгцёвой работает быстрее лишпа и позволяет разрабатывать программы быстрее, чем отлаживать перфокарты дыроколом и липкой лентой.
        
        Но нет, сектанты не будут использовать выразительный язык потому, что деды не использовали гц и динамушню.
        
        Но у дедов не было света, а у тебя, %username%, я почти уверен, в сортире, откуда ты читаешь мой пост с телефона-с-которого-можно-не-только-звонить, которого у дедов не было, сейчас горит лампочка, и ты её при выходе не отключишь ибо не хочешь светодиоды часто нагревать/охлаждать. Так выкрути лампочку и ходи в туалет гордо как ходили деды!
        Ответить
        
        gost 26.12.2020 02:30 # +3
        
        Короче говоря, на сишке заебись сериализовывать только тогда, когда у тебя структура очень простая. Если в один прекрасный момент внезапно потребовалось её чуть усложнить, сделав просто простой (строку добавить, например), то тебя ждёт весёлый геморрой с двумя стульями: выкинуть всё нахуй и переписывать на более удобные инструменты, или просто добавить небольшой костылик. А потом ещё небольшой. Ну и вот тут ещё чуть-чуть поправить. Ай, блин, проверку теперь некуда воткнуть… Ладно, похуй, сойдёт!
        И вот таким образом простое и элегантное решение превращается в ёбанное нагромождение костылей, в котором критические баги 10/10 находятся трижды в день.
        
        Именно поэтому хвалить простоту сериализации данных на сишке может только обманутый, неразобравшийся человек.
        Ответить
        
        guest6 26.12.2020 02:35 # 0
        
        >когда у тебя структура очень простая.
        Или когда эта структура поностью принадлежит тебе.
        Хакеры тебе не шлют по сети никакие данные.
        
        Или когда структура заранее задокументирована (см пример с MBR)
        
        >обманутый, неразобравшийся человек.
        ну давайте напишем такое на JS или Java и сравним с си
        https://govnokod.xyz/_27177/#comment-589971
        
        обращаю внимание: данные там взяты из спецификации, их не по сети пользователь послал
        Ответить
        
        bormand 26.12.2020 02:39 # +1
        
        > структура заранее задокументирована
        > взяты из спецификации
        
        И что это меняет?
        
        Не, я согласен что есть случаи когда похуй... Но, к примеру, как много "программистов" ожидает, что рандомный сайт может стукнуться к их хуйне, запущенной на локалхосте (да, недоступной извне)?
        Ответить
        
        guest6 26.12.2020 02:43 # 0
        
        Борманд, скажи пожалуйста, как бы ты решил эту задачу с помощью Java?
        
        Наш разговор начался с того, что сишка такие задачи умеет решать легко, а Java нет.
        Ответить
        
        bormand 26.12.2020 02:47 # 0
        
        Какую задачу то? MBR распарсить? Сделал бы точно такой же вью-стрим как на крестах, который аккуратно всё проверяет и читает примитивы побайтово. Благо их там немного.
        
        getU8(), getU16LE(), getSubView() и т.п.
        Ответить
        
        MAKAKA 26.12.2020 02:51 # 0
        
        то есть вот такую хуйню
        
        struct mbr_partition_table_entry uint8_t end_chs[3]; uint32_t first_sector_lba; uint32_t sector_count; }__attribute__((packed));
        
        ты бы заполнял вручную, через getU8(), читая под капотом примитивы побайтово?
        
        А какую проблему бы ты этим решил?
        Ответить
        
        bormand 26.12.2020 02:52 # 0
        
        > А какую проблему бы ты этим решил?
        
        В данном простейшем случае никакую, разве что про размеры и вылеты за них вообще думать не придётся.
        
        Но мне ведь после MBR'а наверное захочется файлуху попарсить или что-то ещё интересное? А вот там этот view-stream уже на всю катушку работает.
        Ответить
        
        guest6 26.12.2020 02:58 # 0
        
        >В данном простейшем случае никакую
        ну слава богу
        
        >размеры и вылеты за них вообще думать не придётся.
        а как можно куда-то вылетить с обычной структурой?
        
        >наверное захочется файлуху попарсить
        ну да, а потом SMB или NFS. Но почему мы всё время придумываем задачу, решение для которой не подходит?
        
        Разумеется, чтение рендомных данных нужно валидировать
        Ответить
        
        bormand 26.12.2020 03:05 # 0
        
        > почему мы всё время придумываем задачу
        
        Потому что MBR или твоя структурка из 4 байт -- это вырожденные случаи, которые на практике довольно редко встречаются?
        
        Возьми тот же GPT. Казалось бы, там тоже массив структурок. Но ты не можешь его выразить сишным массивом т.к. интервал не известен. Надо оффсеты считать и кастовать каждую по-отдельности. И тут уже очень легко вылететь и читнуть что-то не то.
        Ответить
        
        MAKAKA 26.12.2020 03:07 # 0
        
        Я привел какие-то случаи, вы обозвали их вырожденными)
        
        А если я сам пишу и "клиент" (который прочитает) и "сервер" (который запишет) то я могу взять структуру?
        
        >интервал не известен
        Тогда структура данных не статична, ее размер заранее неизвестен, и мое решение не подходит, я не спорю
        Ответить
        
        gost 26.12.2020 03:10 # +2
        
        > А если я сам пишу и "клиент" (который прочитает) и "сервер" (который запишет) то я могу взять структуру?
        Да бери, мы тут вроде как не твои начальники, и даже пользоваться твоими клиентами не собираемся.
        Только будь готов к тому, что через полгода тебе станет совершенно необходимо высрать в эту структуру путь к файлу или там URL. И тогда перед тобой будут два стула: либо выкинуть всё, что ты написал, и переписать на нормальный парсер, либо начать пилить собственный велосипед, внося в наш мир ещё немножко софта с критическими дырами.
        Ответить
        
        guest6 26.12.2020 03:12 # 0
        
        > через полгода тебе станет совершенно необходимо высрать в эту структуру
        
        во-первых совершенно не очевидно, почему так (см пример с mbr)
        
        во-вторых что мешает добавить поле в .h файл, и все перекомпилировать?
        
        "сервер" начнет писать новые данные, "клиент" их читать.
        
        Если же мне нужно будет сичтать старые данные, то я сосну, да
        Ответить
        
        gost 26.12.2020 03:17 # +1
        
        > во-первых совершенно не очевидно, почему так (см пример с mbr)
        Потому что это программирование, чувак. Меняющиеся каждую неделю требования (и неважно, рабочие или просто твои) — это суровая реальность жизни. Я глубоко удивлён, что кому-то это требуется объяснять.
        
        > во-вторых что мешает добавить поле в .h файл, и все перекомпилировать?
        Ну да, как-то так думали программисты из «Майкрофоста», когда делали MAX_PATH. Сколько там десятков лет это дерьмо фиксят и всё пофиксить не могут?
        Ответить
        
        MAKAKA 26.12.2020 03:21 # 0
        
        >Меняющиеся каждую неделю требования
        >это суровая реальность жизни
        снова отсылаю к примеру MBR.
        
        >MAX_PATH
        MAX_PATH уже пофиксили недавно (ограничение можно снять), но на него завязался охулион пользователей, так что это не попадает под определение "клиент и сервер пишу я"
        Ответить
        
        gost 26.12.2020 03:31 # 0
        
        > MAX_PATH уже пофиксили недавно (ограничение можно снять), но на него завязался охулион пользователей
        Ну да, в Windows 10 1607. А сколько там этот MAX_PATH не менялся? Лет двадцать-тридцать? Понимаешь, к чему я веду?
        Можешь гарантировать, что завтра не придумают MBRv2 с «Косынкой» и анимешными девочками, который тебе тоже окажется нужным поддерживать?
        Ответить
        
        guest6 26.12.2020 03:35 # 0
        
        >А сколько там этот MAX_PATH не менялся? Л
        Потому что это была константа в .h файле, с которым скомпилировались клиенты
        
        Это не мой случай
        
        >Можешь гарантировать, что завтра не придумают MBRv2
        Если его придумают, то отвалится охулион готового кода, так что он будет обратно совместим
        Ответить
        
        gost 26.12.2020 03:37 # +1
        
        > Это не мой случай
        > он будет
        «Это меня не коснётся, я точно уверен».
        Ответить
        
        guest6 26.12.2020 03:39 # 0
        
        --Мне нравится ездить на велосипеде на работу
        --Завтра тебе понадобится проехать 500 километров, и твой велосипед соснет
        --Но работа не будет на таком расстоянии
        --«Это меня не коснётся, я точно уверен».
        Ответить
        
        Desktop 26.12.2020 03:41 # 0
        
        Я потерял нить спора. Проапдейтьте меня, пожалуйста
        Ответить
        
        guest6 26.12.2020 03:49 # 0
        
        Началось с того, что сишка позволяет десериализовать/сериализовать данные из структуры с заранее известным размером довольно легко. А джава нет.
        
        А мне стали рассказывать, что если завтра я захочу в эту структуру добавить поле сломав совместимость, то старые данные я не смогу десериализовать.
        
        Теперь еще рассказывают, что Pydantic в питоне умеет валидировать данные, а сишка нет.
        Ответить
        
        gost 26.12.2020 03:43 # +2
        
        — Но через три месяца наступит зима и твой велосипед соснёт.
        — «Это меня не коснётся, я точно уверен».
        Ответить
        
        guest6 26.12.2020 03:46 # 0
        
        Я живу в Бразилии (работаю с древним говном, которое не меняется), тут не бывает зимы)
        
        Либо
        
        Я живу там, где захочу (сам пишу клиент и сервер) зимы тут нет
        Ответить
        
        gost 26.12.2020 03:51 # 0
        
        > работаю с древним говном, которое не меняется
        Если ты готов поставить на это часы своей жизни, проведённые за разгребанием своего же говна — ну, что поделать.
        
        > сам пишу клиент и сервер
        А у тебя требования никогда не меняются?
        Ответить
        
        guest6 26.12.2020 03:52 # 0
        
        >Если ты готов поставить на это часы своей жизни, проведённые за разгребанием своего же говна
        
        Я пока не понял, о каких часах речь.
        
        >А у тебя требования никогда не меняются?
        Если они поменяются, то я добавлю поле, и перекомпилирую программу.
        
        Если никто за пределами меня не пользуется моей серизализацией, то я не вижу проблем
        Ответить
        
        gost 26.12.2020 03:56 # 0
        
        > Если они поменяются, то я добавлю поле, и перекомпилирую программу.
        Завтра тебе понадобилось насрать в свою структуру путь к файлу. Твои действия?
        Ответить
        
        MAKAKA 26.12.2020 04:02 # 0
        
        Путь к файлу это строка. Длина строки мне не известна, так что придется переключиться на другой подход (иначе мне придется выделять MAX_PATH, и валидировать, что она кончается нулём)
        
        Однако и у JSON есть такие проблемы: если завтра мне придется насрать в него мегабайтный BMP, то наверное не логично использовать текстовый формат (мне придется делать base64/uuc же, да?): это может занять лишнее место, особенно если мне надо гонять много таких структур и часто
        
        Я лучше тогда переключусь на бинарный формат, чей парсер будет хранить размер данных, и всё валидировать.
        
        Так что любой формат имеет свои плюсы и минусы
        Ответить
        
        gost 26.12.2020 04:09 # 0
        
        >>> Я пока не понял, о каких часах речь.
        > так что придется переключиться на другой подход
        Я ответил на твой вопрос?
        
        > иначе мне придется выделять MAX_PATH, и валидировать, что она кончается нулём
        И стать одним из миллионов несчастных, чьи программы нельзя устанавливать слишком глубоко в ФС, ага. Сам же писал о том, что в «Microsoft» это дерьмо похоронили.
        
        > мегабайтный BMP
        Тут надо проводить отдельное исследование, что приходиться сериализовывать чаще: строки произвольной длины или мегабайтные БМПмы? Эмпирически мне вот кажется, что первое. Но да, если тебе надо гонять очень много и очень часто — инструмент придётся менять.
        Но и экономить на спичках тоже смысла мало. В перекатном петухе, например, капчи гоняются в виде картинок по «JSON», никто не умер, удобно, все довольны.
        Ответить
        
        MAKAKA 26.12.2020 04:14 # 0
        
        >Я ответил на твой вопрос?
        Не совсем.
        
        Более мощные подходы обычно тратят больше ресурсов. Например, Oracle развернуть сложнее, чем сохранить csv, но Oracle бесконечно мощнее.
        
        По сути, ты предлагаешь всегда использовать Oracle, потому что если вдруг мне придется выбирать из миллиона записей по сложной функции, то csv не подойдет.
        
        >И стать одним из миллионов несчастных
        Верно, потому я и сказал, что строки неизвестной длины хранить в моем подходе не нужно.
        
        >что приходиться сериализовывать чаще: строки произвольной длины или мегабайтные БМПмы?
        
        Согласен. потому и было сказано, что каждый подход имеет и плюсы, и минусы.
        
        Дерево строк неизвестной длины в миллион раз проще сохранить в JSON, например>
        
        >капчи гоняются в виде картинок по «JSON»
        Хочется думать, что каптча не занимает мегабайт.
        
        Для любого подхода можно найти пример, когда он не подходит (либо когда является оверхедом): и для json, и для "сишной сериализации"
        Ответить
        
        CHayT 26.12.2020 04:20 # +3
        
        > csv
        
        Хороший пример, кстати. В Швеции по стандарту запятая — десятичный разделитель, и поэтому csv тут немного сломан. Сколько человековеков было потрачено на поиски косяков в огромных дампах данных в этом говноформате.
        Ответить
        
        guest6 26.12.2020 04:30 # 0
        
        Это хороший пример того, как локализация ломает данные.
        Хоть в JSON, хоть в csv, хоть где
        Ответить
        
        gost 26.12.2020 04:44 # 0
        
        Спокойного утра, CHayT.
        Ответить
        
        CHayT 26.12.2020 13:40 # 0
        
        Добрый день, gost.
        Ответить
        
        gost 26.12.2020 16:10 # 0
        
        Добрый вечер, CHayT.
        Ответить
        
        1024-- 26.12.2020 12:15 # +1
        
        Хороший пример, кстати. В России по стандарту запятая — десятичный разделитель, и поэтому csv тут немного сломан.
        Ответить
        
        gost 26.12.2020 04:26 # 0
        
        > По сути, ты предлагаешь всегда использовать Oracle, потому что если вдруг мне придется выбирать из миллиона записей по сложной функции, то csv не подойдет.
        Нет, я предлагаю не использовать нерасширяемый и опасный способ сериализации данных.
        
        > Для любого подхода можно найти пример, когда он не подходит (либо когда является оверхедом): и для json, и для "сишной сериализации"
        Главная проблема твоей «безопасной» (структура фиксированной длины без всяких там коллекций/иерархий, you name it) «сишной сериализации» в том, что она до крайности хуёво расширяется. Надо добавить коллекцию? Надо добавить строку? Появилось две версии структуры, включающиеся в зависимости от значения флагов (здравствуй, iphdr)? Ты выкидываешь весь свой код и пишешь всё заново.
        Более того, «сишная сериализация» не имеет никаких возможностей для валидации данных, что создаёт широчайший простор для «забыли проверить».
        
        Этих причин достаточно для того, чтобы считать «сишную сериалилизацию» антипаттерном. Любые другие антипаттерны обладают похожими свойствами: прямо сейчас они выглядят удобно и быстро, но в перспективе порождают только опасные баги и хуёво поддерживаемый код.
        Ответить
        
        guest6 26.12.2020 04:33 # 0
        
        > не использовать нерасширяемый и опасный способ сериализации данных.
        
        CSV точно так же не расширяемый и не безопасный (вон, Снаут пример привел), однако вряд-ли все хотят заменить его на СУБД
        
        >до крайности хуёво расширяется.
        Как и любой бинарный формат в общем-то.
        
        COM тоже не расширяется, а создается новый интфейс.
        
        Можно ли считать COM антипаттерном?
        Ответить
        
        gost 26.12.2020 04:39 # 0
        
        > CSV точно так же не расширяемый и не безопасный (вон, Снаут пример привел), однако вряд-ли все хотят заменить его на СУБД
        Ну а где он используется-то, помимо задач «быстренько выгрузить говно и прогнать через run-once скриптик»? Сейчас вроде как везде либо «JSON», либо «SQLite».
        
        > Как и любой бинарный формат в общем-то.
        Из-за позднего часа ты неправильно десериализовал слово «расширяется».
        
        Если мне нужно добавить строковое поле в «protobuf» — я открою свой .proto и добавлю туда одну строку. Если мне нужно добавить его в «pydantic» — я открой свой Petuh.py и добавлю туда одну строку. Если мне нужно добавить его в «сишную сериализацию» — я выкидываю нахуй весь код и переходу на «protobuf» или ещё какую-нибудь хуйню. Именно поэтому «сишная срализация» и хуёво расширяется.
        Ответить
        
        MAKAKA 26.12.2020 04:48 # 0
        
        >Ну а где он используется-то
        В огромном количестве бизнес и интерперйс питушни
        
        > я открою свой .proto и добавлю туда одну строку.
        А что будет с клиентом предыдущей версии? Или там передается схема?
        
        В COM вот не передается. Значит ли это, что COM использовать не нужно?
        
        >я выкидываю нахуй весь код
        или просто добавляешь структуру в файл, и перекомпилируешь клиент и сервер
        Ответить
        
        1024-- 26.12.2020 12:37 # 0
        
        > (сам пишу клиент и сервер)
        
        В чат заходит MITM.
        Ответить
        
        bormand 26.12.2020 03:46 # 0
        
        > «Это меня не коснётся, я точно уверен».
        
        Блядь, не смешно. Я на одной и той же сишной структуре три раза граблями по ебалу получал, добавляя в неё новые биты...
        
        А структура то простейшая, битовые флаги да немного интов, как в примере гостя. Ничто не предвещало беды.
        
        З.Ы. Парсилась она именно по-сишному.
        Ответить
        
        guest6 26.12.2020 03:53 # 0
        
        расскажи подробнее пжлст
        Ответить
        
        bormand 26.12.2020 04:01 # 0
        
        Да там мой косяк. Недосмотрел, что с ней иногда работает старый модуль, который неизвестный ему хвост молча затирал нулями.
        
        Предполагалось, что обратная совместимость там не нужна.
        Ответить
        
        guest6 26.12.2020 04:07 # 0
        
        > работает старый модуль,
        
        то есть условие "клиент и сервер перекомпилируются вместе" не выполняется
        
        >обратная совместимость
        действительно, обратную совместимость получить в JSON намного проще
        Ответить
        
        bormand 26.12.2020 04:18 # +1
        
        > обратную совместимость получить в JSON намного проще
        
        Не, она там реально не нужна. Но с жсоном я бы ошибку об отсутствующем поле быстрее получил. И быстрее бы разобрался что вообще происходит. А с сишкой просто нули и иногда нерабочая опция.
        
        Это просто пример, чем заканчиваются "но я же внимательный", "здесь точно не нужна совместимость, они же вместе собираются, зачем мне поле с версией" и "забьём паддингом до 512 чтобы не париться с длинами".
        
        Три раза одни и те же грабли с интервалом в пару лет, да.
        Ответить
        
        guest6 26.12.2020 04:31 # 0
        
        конечно быстрее
        
        а с WSDL схемой и прокси классом ты бы даже не скомпилировался, но если я предложу заменить JSON на SOAP/WSDL, то никто меня не поддержит, правда?
        Ответить
        
        bormand 26.12.2020 04:34 # 0
        
        Скомпилировался бы.
        
        Ну wdsl и json тут перебор, имхо. А какой-нибудь протобуф норм зашёл бы. Тоже ведь схема какая-никакая.
        Ответить
        
        guest6 26.12.2020 04:51 # 0
        
        Если ты изминил поле, то нет, не скомпилировался бы, потому что ты обновил бы схему, по ней получил бы новый прокси-класс, и все бы упало сразу.
        
        >перебор
        >имхо
        > какой-нибудь
        
        видишь, существуют разные варианты, и ты между ними выбираешь. Это входит в противоречие с утверждением, что "json всегда лучше "
        Ответить
        
        1024-- 26.12.2020 12:19 # 0
        
        > условие "клиент и сервер перекомпилируются вместе" не выполняется
        Клиент и сервер - это разные программы, а значит гарантированно их разные версии могут запускаться вместе.
        Под такую питушню должен быть номер версии как одно из полей данных. Как минимум, для того, чтобы вывести "запустите меня с сервером моей версии" и упасть. Чтобы ни у программиста, ни у пользователя не возникало ни питушни, ни вопросов, откуда питушня.
        Ответить
        
        1024-- 26.12.2020 12:48 # 0
        
        Это даже надо делать, чтобы такой питушни не возникало хотя бы на этапе разработки, пока поля добавляются, и надо для тестов иметь строго одинаковые версии клиента и сервера, ведь внимание программиста сосредоточено на протоколе, а не на питушении одинаковых версий. Аналогично, внимание админа тоже сосредоточено не на питушении одинаковых версий.
        
        Обычно для доморощенных питушень цикл жизни программы такой:
        1. активная разработка (меняется формат, надо для тестов иметь одну версию),
        2. длительное использование (формат не меняется, запуск питузов прописан по крону или по мануалу пользователя, программист забывает, что он написал),
        3. правка бага/фичи (новые требования, часто незначительные, а иногда значительные изменения протокола),
        4. goto 2
        Ответить
        
        bormand 26.12.2020 03:14 # 0
        
        > Я привел какие-то случаи, вы обозвали их вырожденными)
        
        Хм, ну я вроде нормально парировал твой выпад с MBR при помощи GPT. Они из одной области, очень большая вероятность, что тебе придётся поддерживать оба.
        Ответить
        
        MAKAKA 26.12.2020 03:15 # 0
        
        Если мне придется иметь дело с GPT (или любой другой структурой переменной длины) то мой способ не подойдет, я вроде с этим и не спорил.
        Ответить
        
        gost 26.12.2020 03:28 # 0
        
        И у тебя будет два разных инструмента, решающих одну и ту же задачу. Очень удобное архитектурное решение.
        Ответить
        
        MAKAKA 26.12.2020 03:31 # 0
        
        У тебя тоже много разных решений: где-то json, где-то свой кастомный парсер с валидацией, где-то ты и вовсе возьмешь генератор парсеров и лексеров. Тебя это не смущает?
        Ответить
        
        gost 26.12.2020 03:34 # 0
        
        В одном приложении я такой хуйни стараюсь избегать.
        Ответить
        
        guest6 26.12.2020 03:36 # 0
        
        Допустим, ты пишешь IDE.
        Тебе нужны лексер и парсер для кода и клиент JSON для сохранения конфигов, нет разве?
        Ответить
        
        gost 26.12.2020 03:38 # 0
        
        Эти инструменты будут решать разные задачи из разных областей. А у тебя MBR будет парситься одним способом, а GPT — другим.
        Ответить
        
        guest6 26.12.2020 03:41 # 0
        
        мы ввели какое-то очень абстрактное понятие "область".
        
        Могу ли я использовать json для конфигов (чтобы поддержать новую версию) и сериализацию структуры для IPC между двумя своими процессами, запускаемыми из одной версии программы?
        
        Или я должен тратить циклы CPU на json всегда?
        Ответить
        
        gost 26.12.2020 03:47 # 0
        
        > Могу ли я
        Я тебе уже говорил, что не являюсь ни твоим начальником, ни твоим клиентом. Что хочешь — то и делай.
        
        > и сериализацию структуры для IPC между двумя своими процессами, запускаемыми из одной версии программы
        Я бы посоветовал использовать уже написанные библиотеки для IPC, потому что сам их писать заебёшься ещё до того, как напишешь собственный протокол синхронизации.
        
        > Или я должен тратить циклы CPU на json всегда?
        Тебе bormand уже приводил реальный пример того, как не тратить циклы на JSON, но всё равно иметь бульмень безопасную десериализацию.
        Ответить
        
        guest6 26.12.2020 03:51 # 0
        
        > Что хочешь — то и делай.
        Вопрос "могу ли я" означает "считаешь ли ты допустимым"
        
        >Я бы посоветовал использовать уже написанные библиотеки для IPC
        >протокол синхронизации.
        
        Особенно это актуально для пересылки двух байт
        
        > как не тратить циклы на JSON, но всё равно иметь бульмень безопасную десериализацию.
        
        генерацией парсера?
        Это хорошее решение, но оно более громоздкое, и я бы хотел понять, чем оно лучше.
        
        Вы в который раз используете термин "безопасную", но я к сожалению так и не понял, чем небезопасного в статической структуре с байтами
        Ответить
        
        gost 26.12.2020 04:00 # 0
        
        > Вопрос "могу ли я" означает "считаешь ли ты допустимым"
        Я не твой исповедник, чтобы тебе указывать, что допустимо, а что нет.
        
        > Особенно это актуально для пересылки двух байт
        О, мсье никогда не писал своего IPC? Рекомендую, очень увлекательное занятие.
        
        > но я к сожалению так и не понял, чем небезопасного в статической структуре с байтами
        Отсутствие гарантированной валидации.
        Ответить
        
        guest6 26.12.2020 04:06 # 0
        
        ты серьезно считаешь, что на вопрос
        >считаешь ли ты допустимым
        хорошим ответом явлчется
        >Я не твой исповедник,
        ?
        
        ладно, попробуем по другому: как бы сделал ты?
        
        >О, мсье никогда не писал своего IPC?
        мсье пересылал данные между двумя программами, довольно простые, тем самым способом, и не столкнулся ни с какими проблемами, кстати (вряд-ли это можно назвать полноценным IPC)
        
        >Отсутствие гарантированной валидации.
        
        JSON так же не имеет валидации. Ее имеет pydantic и всякие другие либы, к сериализации отношения не имеющие
        Ответить
        
        gost 26.12.2020 04:16 # 0
        
        > ты серьезно считаешь, что на вопрос
        В четыре часа ночи? Разумеется.
        
        > как бы сделал ты?
        Один мудуль программы читает конфиги в «JSON», другой мудуль программы использует либу для IPC и пересылает структуры без ебли.
        
        > тем самым способом
        Каким? Сокеты, пайпы, шаренная память, мейлслоты, COM?
        
        > к сериализации отношения не имеющие
        Десериализация — это весь процесс от «вот у нас какие-то байты» до «это валидный объект Petuh». Поэтому разумеется, имеющие.
        Ответить
        
        MAKAKA 26.12.2020 04:26 # +1
        
        >В четыре часа ночи? Разумеется.
        Это такое "иди в дупу, не хочу отвечать"?P)
        
        >Один мудуль программы
        >другой мудуль программы
        То есть использование двух подходов тут нас не пугает, но если один из них заменить на сишную сериализацию, то сразу станет пугать?
        
        >Каким?
        Named pipes, но по идее разницы быть не должно, если я не шлю их по сети.
        
        >Десериализация — это весь процесс о
        > «это валидный объект Petuh».
        
        В таком случае десериализации нету из коробки ни в python (без пайдантик) ни в Java, ни даже в JavaScript, ведь не существует способа гарантировать, что в поле IQ у петуха мы не запишем "-1" или NaN
        
        ps: а вообще ты прав про четыре часа, надо собираться
        Ответить
        
        gost 26.12.2020 04:34 # 0
        
        > То есть использование двух подходов тут нас не пугает, но если один из них заменить на сишную сериализацию, то сразу станет пугать?
        Да. Потому что ты проводишь некорректное сравнение. Корректным было бы парсинг одной половины конфига JSON-ом, а другой половины — сишной сериализацией YAMLем.
        
        > Named pipes
        А, ну так там всё сделано за тебя — и соединения, и синхронизация, и даже кое-какую сериализацию и ту запилили (см. «PIPE_READMODE_MESSAGE»). Веселье-то начинается когда тебе надо организовать IPC в расшаренной памяти.
        
        > из коробки
        А кто про искаропки-то что-то говорил? Никто не говорил, странное какое-то требование, ненужное.
        
        Спокойного утра, guest6.
        Ответить
        
        guest6 26.12.2020 04:57 # 0
        
        >арсинг одной половины конфига JSON-ом, а другой половины
        
        У меня есть два модуля
        Один использует подход Foo, другой Bar.
        И это нормально.
        но если Foo вдруг становится равным сишной сериализации, то сравнение становится некорректным
        
        >А, ну так там всё сделано за тебя
        Я говорил о сериализации, а она нужна при серийной передаче данных.
        В шаред мемори наверное можно ничего не сериализовать (если все ее клиенты скомпилированы вместе на одном языке), но нужно пирдолица с синхронизацией доступа к памяти
        
        > Никто не говорил, странное какое-то требование, ненужное.
        
        Наличие чего-то из карбоки -- большой плюс для маленьких несложных программ, особенно в си, где нет совсем простых средств для установки зависимостией
        
        Спокойного утра, гост
        Ответить
        
        bormand 26.12.2020 10:18 # 0
        
        > парсинг одной половины конфига JSON-ом, а другой половины — сишной сериализацией
        
        Кстати, вполне популярная практика. Как минимум в osu и factorio такое видел. Байтоёбский хедер, а потом gzip + json/csv.
        Ответить
        
        1024-- 26.12.2020 13:05 # 0
        
        > В таком случае десериализации нету из коробки ни в python (без пайдантик) ни в Java, ни даже в JavaScript, ведь не существует способа гарантировать, что в поле IQ у петуха мы не запишем "-1" или NaN
        
        Отличная мысль. Противники сишной высериализации слишком сильно поднатужились в её обсирании, что получившейся волной брызг смыло всё.
        
        Очевидно, они говорят или хотели сказать, или должны были сказать о какой-то другой валидации.
        Скажем, о валидации коллекции другой формы ([1,2] vs [1, {"2": 3}]) или об упрощении написания инструментов валидации (жсон шхема) в силу малой фантазии насчёт форм жсон-коллекций.
        
        Но питушня про число от 0 до 100 и прочие высказывания о валидации питушень внутри жсон, преподнесённые как аргументы в пользу жсон, требуют дальнейшего пояснения. Лично я не могу сказать, чем условие 0 <= x && x <= 100 в коде для x из жсона отличается от условия 0 <= x && x <= 100 в коде для x из бинарушни, если нет упомянутых жавовских аннотаций.
        Ответить
        
        1024-- 26.12.2020 13:32 # 0
        
        Дочитал до конца тред сверху вниз. Там упоминаяется о первичной валидации (об аналогичном я говорю, упоминая валидацию коллекции другой формы) и вообще говорится, что это не сам жсон, а питушня, которую я бы назвал высериализационной инфраструктурой, которая при использовании жсон содержит диалект для директив валидации, а не только высер-всёр жсона. С аргументами в пользу такой инфраструктуры сложно не согласиться, и для чуть менее*, чем всех реальных задач сишная высериализация у неё отсасывает.
        
        ______________
        * я сказал "чуть менее, чем всех" просто на всякий случай вроде микроконтроллеров и подобной питушни. Для всего остального можно написать статически питуизированную инфрапитушню (с расширением для Object aka void*, чтобы вместить себя банку сгужсонки), которая за счёт крестошаблонов и компиляции только нужного, либо за счёт оптимизации на этапе компиляции и/или за счёт работы жида доведёт производительность до уровня рукописной сиштушни за авторством Царя.
        Ответить
        
        gost 26.12.2020 16:01 # 0
        
        > как аргументы в пользу жсон
        Это не аргументы в пользу «ЖСОН», это аргументы против бездумного каста структуры в набор байт и обратно.
        Ответить
        
        1024-- 26.12.2020 12:36 # 0
        
        > MBR будет парситься одним способом, а GPT — другим
        При всём уважении к адептам структурированной питушни, которые ссут на сишную реализацию бинарной высериализации,
        
        что в этом плохого?
        
        Про MBR и GPT мы говорим в 2020, когда обе этих питушни уже существуют, и мы можем выбирать привычные инструменты 2020. Сейчас это смузихлёбный JSON, который им подходит.
        
        Но давайте представим, что мы в 1983. До GPT ещё где-то одно десятилетие, до JSON - где-то пара десятилетий.
        
        Зададимся вопросом, что нам использовать для работы с GPT, чтобы
        * эта питушня не тормозила сейчас - в 1983,
        * эта питушня поддерживала формат, который мы не знаем, но будет сделан через десятилетие,
        * эта питушня была не менее удобной, чем формат, который мы не знаем, но будет сделан через два десятилетия,
        * эту питушню не обосрали на неизвестном нам сайте несуществующей ближайшее десятилетие страны через четыре десятилетия?
        
        Так и сейчас, если выбирать формат, надо рассматривать потребности настоящего и грубые мазки насчёт будущего (ну хотя бы версию вписать в поля, и всё). Совершенно не факт, что наша программа проживёт более 10 лет. Скорее наоборот, виндушня с 256 символами на путь - это исключение из правил, о котором мы знаем из-за ошибки выжившего. Как легендарная советская электроника, которую мы, херы, миллениалы и зумеры, знаем больше по тем экземплярам из остатков, но не видим полной картины.
        Ответить
        
        gost 26.12.2020 16:09 # 0
        
        > что в этом плохого?
        То, что это создаёт неконсистентность. Программа работает с двумя одинаковыми по своей сути объектами совершенно разными способами. Более того, при необходимости распарсить ещё какую-нибудь подобную питушню программисту придётся решать дополнительную задачу: какой способ выбрать? А будет ли простой каст структуры безопасным? А не понадобится ли его расширять? А может, парсер будет оверкиллом? Может, писать велосипед будет быстрее?
        Если же подобная бинарушня парсится сразу хорошим, годным, расширяемым способом (спросите bormand как!), то и вопросов не возникает: надо ещё что-то распарсить — просто сделаем парсер по примеру уже существующих.
        
        Каст структуры в бинарушню и обратно подобен goto, только без goto. На малых «дистанциях» и в очень специфических случаях (goto error; struct {int, int}) он облегчает жизнь, как только случай становится чуть более общим — всё, нам приходится либо переписывать всё с нуля, либо мириться с лапшой (goto) или RCE (каст). Именно это и называется «антипаттерном».
        Ответить
        
        1024-- 26.12.2020 17:49 # 0
        
        > неконсистентность
        При естественном ходе событий неконсистентность зародится сама из-за течения времени. Будет новый код про GPT и старый про MBR. Можно будет решить, переписывать ли код про MBR с учётом новых реалий, или и так сойдёт (старый код хороший, либо он какой есть, но MBR отомрёт).
        
        Для нового формата скорее всего будут использовать новый способ парсинга как для GPT, либо придумают ещё более новый третий, который родился за эти десятилетия, либо если способ парсинга MBR и так хорош, будут использовать его.
        
        Пусть похожие питушни парсятся разным способом, но главное - чтобы парсились хорошо
        
        > случай становится чуть более общим — всё, нам приходится либо переписывать всё с нуля, либо мириться с лапшой
        И нет ничего такого, чтобы в один момент взять и выкинуть к хренам старый парсер и переписать на новый формат. Если изначально были слабые знания о требованиях и сильные незнания об изменениях, переписать всё к хренам - нормально.
        А лапшу можно пытаться инкапсулировать, если она инкапсулируется. Скажем, если к бинарной питушне добавилась в конце жсонщина (как рар в раржпеге).
        Ответить
        
        gost 26.12.2020 16:16 # 0
        
        > Но давайте представим, что мы в 1983.
        Не понимаю, к чему ты начал обсуждать форматы, ну да ладно. В 1983-м году бинарушня была суровой необходимостью, потому что иначе было никак. В 2020-м году использовать бинарушню с целью экономии тактов или байт — это в 99% случаях признак говна в голове. Конечно, есть ещё всякие микроконтроллеры, но тут нужно призвать дядю defecate-plusplus, чтобы он наглядно продемонстрировал, что экономия на спичках даже в среде микроконтроллерщиков приводит к неврозам.[/color]
        
        > эту питушню не обосрали на неизвестном нам сайте несуществующей ближайшее десятилетие страны через четыре десятилетия?
        В этом треде никто не обсирал ни «MBR», ни «GPT». Обсирались лишь подходы к их парсингу.
        Ответить
        
        defecate-plusplus 26.12.2020 16:56 # +1
        
        ну...
        если писать мморпг сервер и клиент к нему, то бинарный протокол (протобуф или что-то аналогичное с версионностью и валидацией, а не просто memcpy) может быть обоснован
        
        также странно будет гонять жсон в манямирке модбаса, где в целом смотрят с непониманием на пакеты длиннее 255 блять
        Ответить
        
        gost 26.12.2020 17:05 # 0
        
        > если писать мморпг сервер и клиент к нему
        Ну да, я же и написал про экономию байтов. Всяческий хуйлоад под это не попадает, там не экономия, там просто необходимость — иначе всё либо вообще не заработает, либо заработает, но крайне хуёво.
        
        > манямирке модбаса, где в целом смотрят с непониманием на пакеты длиннее 255 блять
        Какой багор )))
        Прямо вспоминаю, как пару лет назад писал сериализатор бинарушни в 150 текстовых символов, среди которых ещё и несколько запрещённых было. Где-то на ГК даже алгоритм описывал. Наебался тогда надолго, ещё и совсем недавно там баг нашли, пришлось фиксить, лол.
        Ответить
        
        1024-- 26.12.2020 17:53 # 0
        
        Просто и форматы, и подходы, и задачи меняются со временем.
        Часто нельзя себе позволить купить время программистов, которые напишут весь нужный код одновременно. Всегда будет эволюция и состояние, когда есть код из настоящего, прошлого, далёкого прошлого и архаичных времён. Может, в каком-то проекте поддерживают разработки А. Лавлейс.
        Ответить
        
        1024-- 26.12.2020 12:44 # 0
        
        > А если я сам пишу и "клиент" (который прочитает) и "сервер" (который запишет) то я могу взять структуру?
        Борманд же показал пример MITM в играх, где игра была и "клиентом" (когда писала файл), и "сервером" (когда читала файл) одновременно, но пришёл MITM в роли писаря файлов и зашкварил "сервер", подсунув в файле какое-то говно с "запросом" (сохранением игори).
        
        Для сетевых сервера и клиента с протоколом справедлив классический MITM. Если они на одной забуренной во внутреннюю сеть машине, то это ещё ладно, хотя и тут Борманд показал: произвольный сайт может зашкварить твой внутренний HTTP и HTTPS сайт пользуясь твоим браузером. Думая дальше в этом направлении, можно представить торрент-клиент, скайп и подобные программы, которые можно попытаться заставить обратиться к локальному серверу, если порты подходят.
        Ответить
        
        gost 26.12.2020 03:06 # +2
        
        > Но почему мы всё время придумываем задачу, решение для которой не подходит?
        Да потому что «сишный парсер» хорошо подходит только для сферических задач в вакууме, когда у тебя нет ни сложной структуры, ни коллекций переменной длины (строки!), вообще ничего нет, кроме тупых интов. И ладно бы только это, так у тебя и валидации вообще никакой не должно быть, потому что как только ты начинаешь делать валидацию — ты вступаешь на Путь Говна, Ебли и Геморроя. И вся обещанная простота превращается в CVE.
        Ответить
        
        guest6 26.12.2020 03:09 # +1
        
        >сферических задач в вакууме
        
        то есть все задачи без переменной длины и иерархии мы считаем сферическими?
        
        >как только ты начинаешь делать валидацию — ты вступаешь на Путь Говна, Ебли и Геморроя.
        
        Про какую валидацию речь?
        
        Я не сказал "каст к указателю на структ всегда лучше json" (жаль, если так прочиталось), я сказал, что есть задачи, которые легко решаются, а в джаве (и вообще языках без прямого доступа к неуправляемой памяти) они не решаются.
        Ответить
        
        gost 26.12.2020 03:12 # 0
        
        > то есть все задачи без переменной длины и иерархии мы считаем сферическими?
        И любой валидации.
        
        > Про какую валидацию речь?
        Любую. Вот как только среди всех возможных байтовых представлений твоей структуры появляется невалидное — «сишный парсер» становится непригоден.
        Ответить
        
        guest6 26.12.2020 03:13 # +1
        
        А если у меня JSON, то как это мне поможет?
        невалдным можем быть число 32 в поле foo, разве json может мне как-то гарантировать, что его там не будет?
        Ответить
        
        gost 26.12.2020 03:26 # 0
        
        > невалдным можем быть число 32 в поле foo, разве json может мне как-то гарантировать, что его там не будет?
        Тебе это будет гарантировать парсер, на вход которому ты подашь схему с валидацией. Буквально на днях же я тут приводил реальный пример «Pydentic»:
        >>> class Petuh(BaseModel): ... name: str ... age: int ... ... @validator('age') ... def age_must_be_positive(cls, value): ... if value < 0: ... raise ValueError('nahui') ... return value ... >>> petuh = Petuh(**json.loads('{"name": "Petya", "age": -1}')) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "pydantic\main.py", line 362, in pydantic.main.BaseModel.__init__ pydantic.error_wrappers.ValidationError: 1 validation error for Petuh age nahui (type=value_error)
        
        Всё, твоя программа безопасна. Потребуется завтра проверять, что имя начинается с прописной буквы? Ты в этом же месте напишешь простой и ясный проверяющий код. Другой человек захочет сделать проверку — ему будет крайне просто разобраться, как нужно (а ведь на месте другого человека можешь оказаться ты).
        
        А что с сишным парсером? Правильно, тебе придётся хуй знает где хуй знает как пилить хуй знает что. Может, это будет кусок парсера, может, надо будет звать is_valid() после парсинга, может, звать отдельные функции для каждого поля… Как я и сказал — геморрой.
        Ответить
        
        MAKAKA 26.12.2020 03:33 # +1
        
        Ты написал кастомную логику валидации, точно такую же логику могу сделать и я:
        
        * делаю структуру
        * делаю в ней метод age_must_be_positive
        
        что такое validator, кстати? Это разве часть JSON?
        Ответить
        
        gost 26.12.2020 03:35 # 0
        
        > делаю в ней метод age_must_be_positive
        На сишке?
        
        > что такое validator, кстати? Это разве часть JSON?
        Это часть «Pydentic».
        Ответить
        
        guest6 26.12.2020 03:37 # +1
        
        >На сишке?
        ну метод может быть только в сишке-с-классами, на сишке придется делать функциб validate для всей структуры видимо.
        
        Это вопрос к удобству сишки, а не к парсингу
        
        >Это часть «Pydentic».
        Тогда причем же тут json?
        
        Декларативная валидация это круто (В джанге есть тоже например), но мы сравнивали способы десерилазиации
        Ответить
        
        gost 26.12.2020 03:42 # 0
        
        > на сишке придется делать функциб validate для всей структуры видимо
        Кто её будет вызывать? Когда этот кто-то её будет вызывать? Как сигнализировать об ошибке?
        
        > Тогда причем же тут json?
        Притом, что он тут обеспечивает безопасную «первичную» десериализацию данных.
        А валидация, как ни странно, является частью десериализации объекта.
        Ответить
        
        guest6 26.12.2020 03:45 # +1
        
        >Кто её будет вызывать?
        Да JSON то тут причем? Вызывать её будет питоновская либа, точно так же она могла бы вызывать ее после десериализации бинарных данных
        
        >обеспечивает безопасную «первичную» десериализацию данных.
        Что такое "безопасная первичная десериализация"?
        Что такого можно записать в uint8_t, что будет небезопасно, но будет безопасно при записи в обычный int в питоне?
        Ответить
        
        gost 26.12.2020 03:55 # 0
        
        > Да JSON то тут причем?
        Вот именно, причём тут JSON? Мы обсуждаем способы десериализации объектов, а не только JSON.
        
        > Вызывать её будет питоновская либа
        Ну то есть непонятно кто и непонятно когда. А может и вообще никто, если забыли и/или не разобрались.
        
        > Что такое "безопасная первичная десериализация"?
        Это когда я могу написать «json.loads(some_shit)» и быть более-менее уверенным, что не сделал дыру с RCE.
        
        > Что такого можно записать в uint8_t, что будет небезопасно
        Размер последующей строки.
        Ответить
        
        1024-- 26.12.2020 12:10 # 0
        
        > как много "программистов" ожидает, что рандомный сайт может стукнуться к их хуйне, запущенной на локалхосте (да, недоступной извне)?
        Честно говоря, я о такой возможности даже не думал, хотя и осознанно включал CSRF-питушню для внутреннего сайта.
        
        Но такой частный случай CSRF я не рассматривал. Это же можно сделать удалённое администрирование питухов с серым IP на основе "CSRF-прокси"!
        Ответить
        
        1024-- 26.12.2020 11:21 # 0
        
        > Вдруг там написано 4, а реально пришло 3 байта?
        А паддинги всякие? Они же по идее любую структуру и любой массив могут зашкварить, из-за чего идея с высериализацией в сишке работает только для строк в формате ASCII, а никакие структуры высериализовывать нельзя?
        Ответить
        
        bormand 26.12.2020 11:29 # 0
        
        Гость структуру аккуратно составил, в данном конкретном случае с паддингами и выравниваниями проблем не должно быть.
        Ответить
        
        1024-- 26.12.2020 13:35 # 0
        
        Какой умный гость. Писал бы на жс и не тратил внимание на составление структур в сишке - пользователи сайтов бы видели меньше undefined и [Object object].
        Ответить
        
        1024-- 25.12.2020 23:18 # 0
        
        Надо же было создать ололо язык, в котором битность чисел и раскладка байтов по слову неизвестны! Потомки будут глядеть на жителей XX века как на дикарей, которые мало того, что ходили без масок, но и творили такой бред.
        
        Специально вместо того, чтобы компилятор пошевелил мозгами на малом числе нестандартных платформ, сишник должен в каждой программе попердолиться на этот счёт, не ошибиться, чтобы доказать своё звание сишника.
        
        P.S. Ну если пирфоманс важен, сделали бы user defined питушню вместо UB. Если 99% моих пользователей - большие индейцы, выставляю флаг племени больших индейцев. Если наоборот - выставляю флаг маленьких. То же с представлением чисел и прочим.
        Ответить
- guest3 27.12.2020 19:32 # 0
  
  Чаушеску?
  Ответить
bootcamp_dropout 25.12.2020 03:15 # +2

у меня на первом курсе вуза был си и препод развлекался тем что при сдаче лабы вводил всякую хуйню и прога ломалась

а если у студента в лабе была фраза "нажмите любую клавишу" то он жал кнопку питания ноутбука
Ответить
- MAKAKA 25.12.2020 03:22 # +3
  
  Если бы у него учился Боманд, то он через ACPI бы перехватил это нажатие, и всё бы сработало
  Ответить
  - bormand 25.12.2020 08:16 # 0
    
    Угу. А на случай reset'а можно в автозагрузку прописаться и заранее сохранять введённые данные.
    Ответить
    - 1024-- 25.12.2020 09:21 # 0
      
      Никогда ещё до этого программа нахождения наименьшего общего кратного не занимала столько строк!
      Ответить
      - bormand 25.12.2020 09:30 # 0
        
        Собственная ось, которая загружается вместо винды и вычисляет наименьшее общее кратное?
        Ответить
        
        1024-- 25.12.2020 09:45 # 0
        
        Да. И главное - определяет, когда reset нажали для перезагрузки, а когда - как любую кнопку. Даже если, когда нажали reset, было активно сообщение "press any key".
        Ответить
        
        bormand 25.12.2020 09:47 # +1
        
        Ну это изи. На диск же записан флаг, что мы ждали нажатия на любую кнопку.
        
        З.Ы. Любой приличный редактор такое переживает. Да и браузеры тоже, по крайней мере фф.
        Ответить
        
        1024-- 25.12.2020 09:54 # 0
        
        Надо считать намерение. Если я хочу перезагрузиться, программа должна запуститься сначала. Если я хочу нажать кнопку, программа должна запуститься и отмотаться до нужного места.
        
        Хотя, "press any key" обычно пишут в конце программы, так что ладно.
        Ответить
- bormand 25.12.2020 12:29 # 0
  
  А вообще -- кнопка питания не клавиша же (key), а кнопка (button).
  
  Хотя на некоторых ноутах она именно как клавиша оформлена... Видимо такой и попался.
  Ответить
- guest3 27.12.2020 19:32 # 0
  
  Очевидно, он не играл на аккордеоне.
  Ответить
1024-- 25.12.2020 09:47 # +1
То ли дело C!
```
int sum_pos(int* begin, int* end) {
	int sum = 0;
	while(begin < end) {
		if (0x80000000 ^ (0x80000000 & *begin)) sum += *begin;
		begin ++;
	}
	return sum;
}
```
https://ideone.com/5Ytc9r
Ответить
- bormand 25.12.2020 09:51 # 0
  
  sum += *begin & ((0x80000000 & *begin) >> 31)
  
  Что-то не прокатило ;(
  Ответить
  - 1024-- 25.12.2020 09:56 # 0
    
    Это же signed карманный лев, который бережёт знак от укусов.
    Я ещё хотел ~(0x80000000 & *begin), но не прокатило по, вероятно, той же причине. И даже если скастить оба операнда & в unsigned int, не прокатило.
    
    P.S. А вот если реинтерпретировать питушню в скобках как unsigned и потом сдвинуть, должно сработать.
    Ответить
  - gost 25.12.2020 10:38 # 0
    
    Добрый день, bormand.
    Ответить
- 1024-- 25.12.2020 10:03 # +1
  То ли дело Haskell!
  
  sum_pos = length . (($[1..]) . take =<<) main = print $ sum_pos [-2, 4, -10, 8]
  
  Кратенько для пока ещё психически здоровых людей: берём бесконечный список, откусываем от него X элементов (для X из [-2, 4, -10, 8]), конкатенируем получившиеся списки, считаем длину итогового списка, которая будет искомой суммой. В качестве кобенации операций map и concat выбран оператор (=<<), который для монады "список" имеет именно такую реализацию.
  Ответить
  - bormand 25.12.2020 10:06 # 0
    
    > психически здоровых
    
    Перепиши на J. Там поди в 3-4 символа уложишься.
    Ответить
  - 1024-- 25.12.2020 13:12 # +1
    То ли дело ECMAScript 2016!
    
    const sum_pos = arr => eval(arr.join('+').replace(/-/g, '0*')); console.log(sum_pos([-2,4,-10,8]));
    Ответить
    - bootcamp_dropout 25.12.2020 13:56 # +1
      
      [-2,4,-10,8].reduce((r,c) => r + (c + Math.abs(c))/2, 0)
      Ответить
- gost 25.12.2020 10:38 # 0
  - if (0x80000000 ^ (0x80000000 & *begin)) sum += *begin; + sum += *begin * (*begin > 0);
  
  Проверь.
  Ответить
  - 1024-- 25.12.2020 10:56 # 0
    
    Питушня какая-то. Это надо какие-то опереции сравнения помнить. Сишник должен видеть битовую суть чисел, а не вдаваться в абстрактушню!
    Ответить
    - guest6 25.12.2020 12:43 # +1
      
      Питушня питушная. Заедушная.
      Ответить
    - gost 25.12.2020 14:54 # 0
      
      Сишник помнит, что явное обращение к знаковому биту потенциально может вызывать кучу UB/ID (в зависимости от версии стандарта, настроек компиляции и погоды на Марсе), и не выёбывается почём зря.
      Ответить
      - bormand 25.12.2020 15:00 # 0
        
        Именно поэтому у меня подгорает от дисплейчиков в факторио, которые юзают один кобенатор для сдвига константы в знаковый бит:
        // эквивалентный код if ((masks[i] << n) < 0) { ... зажечь лампочку i ... }
        Ответить
    - MAKAKA 25.12.2020 16:58 # 0
      
      Кстати, вопрос, может от ламушка конечно: а сишка обязана использовать дополнительный код вообще?
      Ответить
      - 1024-- 25.12.2020 17:10 # 0
        
        Раньше точно не должна была. Хотя всё равно интересно, разрешено ли знаковому биту лежать где попало, а не в старшем бите.
        
        Но где-то на ГК, кажется, писали, что либо в новой сишке, либо в новых крестах решили закрепить дополнительного питуза, поскольку другие не нужны. А может быть, не было такого.
        Ответить
        
        jojaxon 25.12.2020 17:15 # 0
        
        Я делал сериализацию для целого числа переменной длины и бит со знаком у знакового числа сделал младшим (свободная реализация ZigZag-Encoding)
        Ответить
        
        1024-- 25.12.2020 17:30 # 0
        
        Вы именно писали компилятор C или C++, чтобы у пользователя программы работали с таким представлением?
        
        > Хотя всё равно интересно, разрешено ли знаковому биту лежать где попало, а не в старшем бите.
        Имеется в виду отношение стандартов C или C++ разных версий к данному вопросу.
        Ответить
  - bormand 25.12.2020 12:04 # 0
    
    Добрый день, gost. В этом треде нельзя юзать операторы сравнения.
    Ответить
    - jojaxon 25.12.2020 17:17 # 0
      
      А оператор космического корабля? Или оператор переориентации в боевой вертолет?
      Ответить

MAKAKA 25.12.2020 23:37 # 0

лучшее https://pbs.twimg.com/media/EqD7S6FXUAIuiLE?format=jpg&name=small

Ответить

guest6 26.12.2020 01:31 # 0

Нетопырь, лети к луне
Джаваскрипт, гори в огне,
Джаваскрипт, тони в говне

Передача говна из Java в JS в JCEF в моем случае позволена только через строки.

Приходится писать

if (foo === 'true')

матапушто

> Boolean('false');
true

дебилы, блядь

Ответить

bormand 26.12.2020 01:49 # +1

> Boolean('false')

(bool)"false"

Дебилы, блядь.
Ответить
- gost 26.12.2020 01:52 # +1
  
  static_cast<bool>("false");
  
  Дебилы, блядь.
  Ответить
  - MAKAKA 26.12.2020 01:55 # 0
    
    В очередной раз убеждаюсь, что писать на С++ проще и приятнее, чем на "JavaScript"
    Ответить
  - bormand 26.12.2020 01:59 # +1
    
    > bool("False") // True
    
    Дебилы, блядь.
    Ответить
    - Desktop 26.12.2020 01:59 # 0
      
      "false" as Bool
      
      Cannot convert value of type 'String' to type 'Bool' in coercion
      Ответить
      - bormand 26.12.2020 02:01 # +2
        
        Дебилы, блядь. Даже сконвертить не могут.
        Ответить
    - bormand 26.12.2020 02:00 # 0
      
      > var_dump((bool)"false"); // true
      
      Дебилы, блядь.
      
      Вот от "PHP" не ожидал, если честно. До последнего думал, что правильно сконвертит.
      Ответить
bormand 26.12.2020 01:56 # +1
Кстати, они таки дебилы, но не тут:
```
Boolean(false)     // false
new Boolean(false) // true
```
Ответить
- 1024-- 26.12.2020 13:15 # 0
  
  Надо было делать не только настраиваемые касты к строке (toString) и к мелкому питузу (valueOf), но и к булу (для использования в if, ! и т.п.), чтобы забоксированное значение false могло докричаться до внешнего мира.
  Ответить
  - bormand 26.12.2020 13:23 # 0
    
    Зачем вообще было делать тип Boolean, который заведомо криво работает? Или просто так вышло т.к. к любой функции можно сдуру применить new?
    Ответить
    - jojaxon 26.12.2020 13:34 # +2
      
      Нужно сократить вопрос до "Зачем вообще было делать Javascript таким всратым" и ответ до "просто так вышло".
      Ответить
      - bormand 26.12.2020 13:40 # 0
        
        > просто так вышло
        
        Ну да, кто ж знал, что на языке для анимации кнопочек начнут писать серьёзные проекты и даже сервера?
        Ответить
      - 1024-- 26.12.2020 13:50 # 0
        
        Ну там хотя бы 'use strict' сделали, чтобы локально включать новый диалект языка. И совместимость не просрали, и говно можно вырезать из языка, чтобы в новом коде с 'use strict' уже не было зашквара. Я уже где-то писал, что как-то так и надо делать - позволять разные версии языка компилировать вместе, а не пытаться натянуть сову монодиалектности на глобус реальных требований, из-за которых никому ненужное старое говно держат в языке "ради совместимости", новые возможности проектируют исходя из старого говна и они выходят мёртворождёнными, а полезные старые возможности, которыми люди пользовались, депрекейтят и удаляют.
        
        Вроде же arguments.caller выпилили ради оптимизации хвостушни.
        Ответить
        
        bormand 26.12.2020 13:54 # 0
        
        > ради оптимизации хвостушни
        
        Не, на MDN пишут, что по соображениям безопасности 22 года(!) назад выпилили. Чтобы код из странички в привилегированную гуйню и экстененшены не лез, скорее всего. И вообще оно работало только в IE и никогда не было частью стандарта.
        Ответить
        
        1024-- 26.12.2020 13:57 # 0
        
        А, значит формулировка была другая, где я читал. Там скорее всего было следование взад вместо эквивалентности - что-то вида "мы не можем впилить хвостушню потому, что у нас не выпилен звонарь".
        Ответить
        
        bormand 26.12.2020 13:59 # 0
        
        Хвостушню в скриптушню обычно не впиливают чтобы бектрейсы хорошо читались, без выпавших кусков. По крайней мере для питона это так.
        
        Тем более на практике она особо и не критична.
        Ответить
        
        1024-- 26.12.2020 14:12 # 0
        
        Вебтушня активно качает идеи из функциушни. Есть шанс, что мы увидим какие-нибудь интересные идеи на этот счёт, если каждый первый будет обмазываться рекурсией. И какой-нибудь V8 будет заниматься восстановлением стека по фотографии.
        
        Ну и проблема заинлайнивания, жидования и состэковывания была и раньше. Сколько-то лет писали, что использование в коде try ... catch приводит к сливу пирфоманса, что функция с такими матными словами мешает жиду V8 работать в полную силу. А тут надо перейти от заинлайнивания на N уровней к заинлайниванию на "бесконечность" уровней.
        Ответить
        
        bormand 26.12.2020 14:22 # 0
        
        > восстановлением стека по фотографии
        
        А это невозможно. Тут либо ты тратишь память и сохраняешь контекст либо нет. Разве что для чистых функций можно заново проиграть весь вызов для отладчика.
        Ответить
        
        1024-- 26.12.2020 14:37 # 0
        
        Для режима отладки (или если кто-то пользуется содержимым исключения) можно сделать циклический буфер на последние N адресов (адрес 0, если надо лезть в обычный стек), а так - не оптимизировать питушню ради записи в логе - фигня какая-то. Это ведь даже не питонушня, где можно из функции добраться до всех локальных переменных любого фрейма и может быть любого лексического контекста (про второе не знаю).
        Ответить
        
        bormand 26.12.2020 14:38 # 0
        
        Да проще не выпендриваться с рекурсией и юзать функции высшего порядка. Функциональщики одобрят.
        Ответить
        
        1024-- 26.12.2020 17:54 # 0
        
        Да, хотя для пользовательских функций высшего порядка может понадобиться рекурсия.
        Ответить
        
        gost 26.12.2020 18:11 # 0
        
        Да проще не выпендриваться с рекурсией и юзать цикл while. Императоры одобрят.
        Ответить
    - 1024-- 26.12.2020 13:44 # 0
      
      Да, это не сам Boolean кривой, а логика языка плохо спроецировалась на забоксенный бул.
      * возможность с помощью new получить объект, а не примитивушню (ради которой наверно в движках прописывают поведение для этих всех new PrimitivePituz)
      * автокаст объекта к булу (null - false, не null - true)
      
      Кстати, для новой питушни возможность помещения значения в зашкваренную коробку сразу пофиксили:
      
      new BigInt('123') Uncaught TypeError: BigInt is not a constructor BigInt('123') 123n
      Ответить
      - bormand 26.12.2020 13:48 # 0
        
        > is not a constructor
        
        Хм, т.е. я должен явно заявлять, что функция -- не конструктор?
        Ответить
        
        1024-- 26.12.2020 13:53 # 0
        
        Да. Хотя, с другой стороны, это можно заявить только в стандартных типах данных, чтобы new Boolean() и Date() не работали, а Boolean() и new Date() - работали, а на уровне пользователя уже понятно, что тип данных и коньструктор, а что - функция.
        
        P.S. Вообще, надо сделать как в хаскеле. Тогда для питушни с большой буквы будет эффект с new, а для питушни с маленькой - эффект без new.
        Ответить
  - gost 26.12.2020 15:59 # 0
    
    Осторожно, ты сейчас изобретёшь перегрузку операторов.
    Ответить
    - 1024-- 26.12.2020 17:55 # 0
      
      Какой багор )))
      Да, в жс бы перегрузку операторов и метатаблицы.
      Ответить
      - gost 26.12.2020 18:04 # +2
        
        А ещё надо чтоб ГОМОИКОНЫ!..
        Ответить

guest6 26.12.2020 01:39 # +1

блядь,. английский езе хуже С++

spelling disk is used for magnetic storage (e.g. hard disks) while disc is used for optical storage (e.g. compact discs, better known as CDs

Ответить

bormand 26.12.2020 01:47 # +1

Ну это же обычное US vs UK, как всякие color и colour?
Ответить
- Desktop 26.12.2020 01:50 # 0
  
  брмнд, хвтт првт кммнтр
  Ответить
- MAKAKA 26.12.2020 01:51 # 0
  
  гдеж обычное? HDD DISK vs Compact DISC же
  Ответить
  - bormand 26.12.2020 01:52 # 0
    
    Ну там же пишут, что американцы везде писали свой disk и текли. А британский disc только в патенте про компакт-диски проскочил.
    Ответить
    - MAKAKA 26.12.2020 01:54 # 0
      
      так и было, но получилось же охуенно
      Ответить
Desktop 26.12.2020 01:47 # 0

https://www.grammarly.com/blog/disc-disk/

> английский езе
- руске вдмо тозе
Ответить
- MAKAKA 26.12.2020 01:51 # 0
  
  если бы всё было так просто, я бы сюда не писил
  https://en.wikipedia.org/wiki/Spelling_of_disc
  Ответить
  - Desktop 26.12.2020 01:57 # 0
    
    в языках и не такое бывает
    
    нам, как не нейтив спикерам, можно писать discette и не париться
    Ответить
1024-- 26.12.2020 13:20 # 0

Начнём с того, что у них есть s, k и c, и одну из трёх можно выкинуть.
Ответить

Говнокод: по колено в коде.

JavaScript / Говнокод #27177

Комментарии (244) RSS

Добавить комментарий