- 1
Ещё один тред обсуждения несбыточного мифического «нового ГК»
Нашли или выдавили из себя код, который нельзя назвать нормальным, на который без улыбки не взглянешь? Не торопитесь его удалять или рефакторить, — запостите его на говнокод.ру, посмеёмся вместе!
−7
Ещё один тред обсуждения несбыточного мифического «нового ГК»
Такие мысли появиласть в результате флеймов с 1024-- и вообще.
На новом говнокоде вместо модерации должены быть:
1. Механизм скрыльничества на уровне сайта/api
2. Как на имиджбордах, все посты и комменты должны подчищаться из базы после определенного скрока давности, чтобы не нужно было вмешательство никаких админов и модераторов. Это хорошо решает проблему любых набегов. Но некоторые посты пользователи могут пометить как важные, которые не следует удалять. Для этого они должны выразить такое желание в явной форме, например, нажимая на кнопку «cохранить». Проблема в том, что ботоводы могут сохранять свои комменты и посты скриптами, поэтому нужно ввести хорошую капчу и какой-то сложно вычислимый DRM, вычисляя который ты приносишь пользу новому ГК в любой форме. Это либо вычисление биткоинов на кошелёк, с которого оплачивается хостинг, либо ещё какая-то форма принесения пользы сообществу. Вот об этом и предлагаю поговорить: в каких формах вообще можно принести пользу ГК, так, чтобы для оценки пользы и подтверждения факта принесения пользы не требовалось вмешательство модераторов и админов?
Срать в текущих, ещё не умерших разделах, это никак не помешает, но мусор достаточно быстро потрётся и останутся только те комменты, которые сообщество считает полезными. Кроме того, думаю, если спамер окупает свои действия полезной работой по отношению к сайту (например, оплачивает хостинг), он имеет полное право спамить, потому что механизмы скрытия доступны всем из коробки.
Мне кажется более логичным в явной форме обозначать хорошее, чтобы оно осталось, а остальное убивать; нежели хранить всё, а в явной форме обозначать плохое.
При таком раскладе нет вероятности, что злоумышленник удалит что-то полезное. Проблема модерации в том, что модератор может удалить то, что тебе нужно.
Явно надо отмечать хорошее, а не плохое.
В этом моя мысль ИТТ.
Хм, я сначала прочитал как "Механизм скрыльничества на уровне IP".
Кнопка "скрыть всю подсеть с руснёй этими мудаками".
Вы - тупое и тяжелое на подъём быдло, скам, который не в силах побороть лень и написать API, которое избавило бы Вас от необходимости заходить на ГК чтобы запостить коммент... Путей тут несколько.
Первый, и самый тяжкий - написание API к ГК; можете сразу забить.
Второй - быдло перестаёт рассматривать ГК как борду, а общение продолжает в чате а-ля Bormand_NGK. Разумеется, нужно запилить реальный чат, а не самообновляющуюся парсилку комментов.
Просмотр рекламы может быть?
> Вот об этом и предлагаю поговорить: в каких формах вообще можно принести пользу ГК, так, чтобы для оценки пользы и подтверждения факта принесения пользы не требовалось вмешательство модераторов и админов
Откинем на время моральные аспекты, которые сложно проверить автоматически. У нас останется бложик с платным хостингом. Стоит отметить, что люди придумали как единый эквивалент материальных благ, так и электронный эквивалент единого эквивалента материальных благ. А именно - деньги и их перевод через Интернет.
Преимуществами денег (хотя бы на фоне криптопузыря) являются:
* отсутствие серьёзных требований к производительности железа
* лёгкость использования
* более высокая стабильность курса по отношению к материальным благам
"Полезная" работа, "полезные" вычисления - это дополнительный слой перегонки ресурсов машиной Голдберга и способ завуалировать простой и понятный любому человеку, прочитавшему ОП-пост, факт: сохранение своих высеров планируется сделать платным.
Всю эту питушню надо придумывать и пердолиться при использованиии. А нормальные деньги уже придуманы, переводы через Интернет придуманы, осталось только взять готовые технологии, отстёгивать комиссии и налоги - и система работает.
Что я говорил: нечего выпендриваться, прикрутите нормальные деньги. Возможно, удобнее будет сделать платную подписку или виртуальные счета как в сотовых компаниях: человек зачисляет деньги администрации один раз через банк, а затем распоряжается ими через сайт; когда кто-то хочет вывести деньги, они перечисляются от администрации на счёт этого человека.
Брависсимо, блядь!
5 евро в месяц?
Деньги вещь ясная, но на хостинг их много не нужно, а куда девать лишнее? Если же сделать сохранение высеров слишком дешевым, то спамеры купят себе сохранялок по два рубля кило хоть обсохраняйся.
Нужно что-то типа рейтингов на торрентах, отдал — качай.
Я-то пытаюсь понять, можно ли каким-то другим способом приносить пользу ГК, кроме как оплачивать его хостинг. Оплачивать сохранение высеров всегда лучше трудом или временем, или действиями, направленными на пользу сообществу ГК. Но, если ничего такого не придумается, можно и деньги, но это, конечно, последняя мера. С деньгами свои проблемы.
Ну или как на бордах, пусть всё помирает, да и всё. Так же как и сейчас, только о размерах базы заботиться не надо. При хорошем АПИ каждый может сохранять к себе всё интересное локально.
Как часто пользователи ГК ищут что-то в старых тредах? И как часто находят что-то полезное?
Да какие там размеры, блин. Сраные 200 метров за овер 10 лет (и это с индексами).
> Оплачивать сохранение высеров всегда лучше трудом или временем, или действиями, направленными на пользу сообществу ГК.
Где Сёма с его коронной репликой стоимость 1000 капч, когда он так нужен?
Уважающий себя багор может сделать сервис, который будет делать полезные дела за деньги. Сам выйдет в плюс, свои высеры поднимет, другим говнокодовцам работу упростит.
Менее упорные багры отдадут ему те самые два рубля.
А обычным пользователям эта польза для ГК будет как лишний пердолинг. На работе поработать, чтобы получить деньги, на ГК поработать, чтоб получить баллы почёта.
Так же обидно, как когда у тебя под боком ЛЭП на 110кВ, а рядом сраный телефонишко не заряжается потому, что переходничков на 5В нет.
> Деньги вещь ясная, но на хостинг их много не нужно, а куда девать лишнее?
В отличие от пользы ГК, которой тоже может оказаться выше нормы - до такой степени, что девать некуда, деньги можно потратить.
В крайнем случае, положит Страйкер их в банк под проценты для детей и внуков. Это ж не бюджетные деньги, которые надо потратить на указанные цели, чтоб не больше и не меньше, и отчитаться за каждый рубль.
> Как часто пользователи ГК ищут что-то в старых тредах? И как часто находят что-то полезное?
Я для этого свой кривенький скрипт использую (т.к. Google забывает, а глупый поиск мелковат). Иногда нахожу что-то полезное.
Он еще, сука такая, вореции прячет. Походу считает сео.
>Где Сёма с его коронной репликой [...], когда он так нужен?
Ха-ха, у меня бывает тоже такая мысль проскакивает, когда вижу на гк какую-то глупость.
Рассчитывает, что вы сами уже запомнили?
А что русне, собсно, не нравится в фразе про капчи?
1. здесь нафиг никому эти капчи в промышленных масштабах разгадывать не нужно, максимум - для самообразования натренировать нейропитуха
2. была так часто произнесена на ГК, что уже почти стала мемом
Чувак, ты реально крэйзи.
Такие лайки будут вполне материальны, в отличие от ёбаной кармочки.
P. S. Дыра: заводишь двух ботов и гоняешь между ними один лайк туда сюда, сохраняя весь мусор обоих.
Лайк складывает деньги на счёт, через месяц они (часть их/полный объём/больше 1 лайка) снимаются для продления жизни залайканной питушни; есть месяц на то, чтобы забрать деньги.
В твоей модели деньги идут только от пользователей администрации. Ну хорошо. Подумай тогда над такой порочной практикой: «ребята, пишите в треде #12345, потом сохраним его одним махом через месяцок, чтобы дешевле вышло». В итоге каждый месяц новый тред ещё на месяц, и всё в нём в кучу. Корневые комменты становятся вместо постов… Ну и всё в таком духе. Пообкатать идейку ещё надо.
А дизлайк — снимает.
…со счёта обоих в пользу сервера. Эдакая аннигиляция.
На самом деле, как-то про мамку борманда уже и думать не хочется. Бля, про что шутить тогда?
Олег Мавроматти — не режиссер «Зеленого слоника». Режиссер «Зеленого слоника» — Светлана Баскова. Олег Мавроматти формально числится как продюсер «Зеленого слоника» и снимался в некоторых фильмах Басковой в качестве актера. Олег Мавроматти — режиссер «Выблядков»[1] и многих авангардных фильмов и перформансов. В их числе и тот, который был упомянут выше. Вот как дело обстояло в действительности: Олег Мавроматти сделал электрический стул и подключил его к компьютеру так, чтобы он был приведен в действие по результатам открытого голосования в интернете. В процессе голосования он сидел на стуле, не получая никакого вреда. В результате голосования Олег Остался жив.
[1] — https://www.kinopoisk.ru/film/vyblyadki-2000-420424/
vistefan, 10.03.2018
Можно сделать форум, дать каждому желающему раздел с модеркой и вперед
С точки зрения общения и оставленных полезных комментариев - не очень.
Давайте лучше назначим кого-нибудь нормального модератором, чтобы он вычислял стопроцентных ботов и раздавал им баны, чистил спам и выдавал злостным спамерам баны.
Тогда уже не будет ни спама и его уничтожением, ни минусаторов, ни проблемы с исправлением рейтингов.
А ещё специально для тех, кто хочет добавить биткоинов в проект, нужно сделать кнопку доната.
PHPшники пишут на PHP и никогда его не ругают. Никогда не видел недовольного PHPшника.
Чтобы это значило?
Да ну?
Я, например.
вот трушный: http://govnokod.ru/23479#comment393276
Хуя обосрал))
Кресты уже не доставляют. А действительно интересные фишки типа метаклассов или open method'ов ещё не скоро завезут.
в ишшью страйкер хуй сосал
прыщебляди хуже ссаки
кодеры-свинособаки
нам говнокодерам давно не в кайф все данное говно
Хуй с ним, выложу сегодня так, без curses, потом запушу получше.
А то из стока заходишь в зеркало треда, не замечаешь, что выше или ниже по скроллу тоже непрочитано, а оно уже помечается как прочитанное, и потом зелёная подстветка теряет смысл в стоке, всё равно вычитываешь. Либо приходится внимательно скроллить зеркало треда, а на гигантских тредах и с телефона это ужасно.
Я тут решил обновить свои данные, перекачал все посты. Вот на эти получил 404, может пригодится список: https://pastebin.com/7ey3PU04 (правда, некоторые из них могут быть живыми, т.к. на больших постах и при глюках тоже иногда бывает 404)
http://rgho.st/8dHTNwDwN - распарсенная питушня
https://pastebin.com/DEx3684P - актуальные топы
За то время, что я скачивал только обновившиеся посты, Genom успел переименоваться в Genome, удалили десяток-другой пользователей и чёрт знает сколько постов.
https://pastebin.com/WUcY1TmX посты и комментарии с >=500 русских букв.
Это я отдельно сохранил на всякий случай (с гвфорума?)
Помню, ещё история про двух негодяев была, но она наверно утрачена.
Seagate дважды подвёл меня, не покупайте жесткачи этой марки. Мой комп стоит на резиновых шарах "попрыгунчиках", чтобы уменьшить вредную для диска внешнюю вибрацию, но это не уберегло мои данные, увы.
Дважды подвёл свой жесткач к твоим губам, проверь.
Засунул тебе свои резиновые шары-попругунчики и повибрировал ими, проверь.
Уменьшил вредную вибрацию твоей мамки, проверь.
Уберёг свои данные у тебя за щекой, проверь.
Интересная, всё-таки дисциплина.
Только честно. Я никому не скажу.
Конардо? Конардо великовозрастной придурок. Я-то кому помешал? Пусть отпишутся здесь, как мужчины. А минусовать подло, тем более, что минусуют все посты подряд, не глядя на их содержимое.
Ты поди комп в качестве обогревателя юзаешь?
http://risovach.ru/upload/2018/03/mem/umnyy-negr_171809808_orig_.jpg
Правда, так можно всю жизнь соптимизировать и выкинуть из бинарников жизни, что иногда скучно.
На каких данных?
Сами то дампы копеечные, по 50-60 метров в архиве.
* докачаны посты с новыми комментариями, а старые посты - с прошлых разов
Вместе архивы пока не сливал.
Память на самом деле задаётся.
Вообще, интересная питушня. Пробую сжать JSON с говнокодовской психозой. Референсный PPMd 512M/10 сжал его за какие-то жалкие секунды.
Жалкие секунды - это эмоциональное утверждение по сравнению с PAQ, если считать точно - где-то полминуты.
Он полностью симметричный.
Рекомендую fp8_v2. Он жмёт незначительно хуже, но сильно быстрее.
Использовал его для практических нужд: зожатие гига jpegов.
http://web.archive.org/web/20150206011442/http://dhost.info/paq8 уже не работает.
Сорцы например тут:
https://github.com/JohannesBuchner/paq/tree/master/fp8_v2
Бинарник+сорцы
https://encode.ru/attachment.php?s=0b0649509e42af7c50c61e9 776ab7f17&attachmentid=1919&d=1334082590
Орхивировать можно тупым drag&drop на exeшник.
Ждём-с результаций от орхиваторов и сравнеций аларитмов безконечово зожатия.
LZMA2 работает хуже настроенного PPMd. Хотя, увеличение размера словаря и слова приводят к улучшенному зожатию, когда у PPMd зависимость от размера слова не монотонная, с минимумом (для ГК - при 10). С LZMA2 зожимал через гуи, там нельзя поставить больше 1024МБ.
К сожалению, не записал, сколько paq8pxd -1 памяти использовал. Результатов paq8pxd -8 так и не дождался, однако зажав примерно половину файла. В процессе зожатия хром ещё как-то работал, а вот эксплорер и остальные программы стали совершенно дубовыми. Диспетчер задач показал, что всё вылилось в интенсивный пердолинг файла подкачки, тут даже SSD не спас, ощущения такие, как при тормозах от нечитающейся дискеты. Не знаю, может удастся когда-нибудь повторить, но для этого надо закрыть браузер с ГК, что нереально. Если кто хочет попробовать, я сжимал base.json из архива http://rgho.st/8dHTNwDwN.
Там зависимость по памяти раньше была линейная, насколько я помню.
Флаг просто менял объем памяти.
Для paq8pxd нужно поставить 6, чтобы он аллокатил гигабайт.
Чтоб сравнение было честным, ну и своппинг не портил жизнь.
LZMA2 ультра слово=273 1024M 2m17s 25 510 454
>paqfp8 -8 1096M 0h37m02s 17 673 69
Не так уж и плохо, учитывая что 7z асспаралеллит, а paq всегда был однопоточным.
но в формуле экспонента 0x10000<<level = 0x10000 * 2^level
>в 2..6 раз дольше по процессорному времени, хотя сжал хуже.
LZMA хорош тем что он ассиметричный: разжимает на порядок быстрее чем зожимает. И памяти для декомпрессии раз в 10 меньше надо.
Удобно когда разжимают 100500 раз, а сжимаем всего раз и время не сильно критично.
PPMD и CM напротив симметричные, но тексты они пакуют сильно лучше. Тексты вообще конёк PPMD. В других типах файлов LZMA его может и уделать.
>PPMd вроде тоже однопоточный (по крайней мере, судя по загрузке процессора)
Угу, но я сравнивал LZMA и PAQ.
Total 147347490 bytes compressed to 17538083 bytes.
Time 16991.66 sec, used 427023618 bytes of memory
За четыре лишних часа по сравнению со скоростным paqfp8, удалось выжать какую-то сотню килобайт.
Total 147347490 bytes compressed to 17120064 bytes.
Time 14770.58 sec, used 1565777154 bytes of memory
А fp8 или fp8_v2?
Есть еще v3, который еще быстрее, но там много моделей порезали, не знаю, может на текстах и норм.
А вообще paq8 — хорош, во-первых как замена GC2018. Ведь сучий ргхост давно запретил лить запароленные архивы. Всё они хотят знать.
А во-вторых завсегда приятно потраллить бормандов (как явление) циклопическим временем декомпрессии.
На другой стороне радуги, есть дико котируемый мною zstd, который по скорости бьёт вообще всё. Очень рекомендую.
https://github.com/mcmilk/7-Zip-Zstd
v2, строго по ссылкам из http://govnokod.ru/23901#comment408634
https://encode.ru/threads/613-FP8-(-Fast-PAQ8)
fp8_v6, должно быть годно.
https://encode.ru/attachment.php?attachmentid=5122&d=15030 87121
Хотя, интересно, вдруг оно как fp8_v2 за всё полчаса сделает, а сожмёт лучше, чем paq8pxd -8.
Да, fp8 быстрее пакует, главное чтоб в своп не залазило. -5, -6 норм.
Вообще забавно получается: всё что все тут насрали за десятилетие (!), всё вайпы, срачи, вореции, генереции всё умещается в жалкие 10 мегабайт.
Можно сделать максимально несжимаемые вореции — каждый слог выбирать так, чтобы модель считала его наименее вероятным.
Так это же надо знать внутренний стейт модели, в paq нужно учитывать кобенацию их всех. Тем более они ж оче адаптивные.
Но есть такая атака, когда злоумышленник сначала надрачивает арифметический кодер, а затем шлёт антивероятные данные чем переполняет буфер.
the "raw" coding mode for slices is needed so a tight upper bound can be put on the compressed size of slices, otherwise its possible to construct a sequence of frames where one slice has a compressed size that is very much larger than its raw size, this would likely never occur with any real video but contructed videos that push the range coder statistics one direction and then sharply switch everything to have completely opposite statistics would result in a locally bloated up bitstream. Such bloated up slices would annoyingly require larger buffers to be allocated to allow encoding them, the raw coding mode puts a constraint on this so that a buffer that is about as large as the raw pixels is gurateed to be large enough for coding a slice in some mode. Reducing the needed memory and complexity of an encoder implementation and also reducing the worst case local bitrate requirement for anything else in the chain
>Можно сделать максимально несжимаемые вореции
Проще сразу /dev/random или sha256 слать.
Вангую что в 128 раз меньше чем paq8pxd -8.
З.Ы. Из-за твоих 7z архивов ngk теперь крутится на 4 гигах памяти и 2 ядрах…
Структура варьируется. Внутри архива файлы придерживаются описанной структуры. Я бы рекомендовал сделать diff для base_struct.txt и readme.txt из всех архивов, чтобы просмотреть историю изменения структуры. В основном там добавлялись новые поля, но могло что-то другое поменяться.
И HTML-версия есть только в JSON.
> З.Ы. Из-за твоих 7z архивов ngk
Как мне кажется, лучше было бы всё запилить на своём компе, а потом переработанную психозу залить на чужой :)
> ворируется
Конвертер ассёртится при вореации структуры (новые поля, не те типы и т.п.) Так что можно не париться с диффами прочтименяшек.
Пробелы были в %date% и %time% из cmd.
Когда я зожимал днём, пробелов не было. Как-то раз ночью они пришли и всё испортили.
Чтобы не пердолиться со вставкой нулей, я поставил кавычки в скрипт.
да, знатный пирдолинг
прыщевики плачут
Питоузик
Увы, смена хеша - это смена мыла, а не аватара.
> историю значений
Да, примерно так и делаю. Только я планирую хранить историю записей целиком + историю кармочки отдельно (т.к. она меняется чаще, чем тексты и остальное).
З.Ы. NGK пишет историю начиная с сегодняшнего вечера. Так что с личкой теперь надо быть аккуратнее.
А мне понравилась новая аватарка стретора. Это ж страйко ему навесил?
Осталось очистить html от говна (у тебя там лишние div'ы и span'ы вокруг) и убрать дубликаты, которые отличаются только этими div'ами.
З.Ы. Пак за 2013 и первые джва за 2014 лениво парсить — в них js вместо json и текстов нету.
Интересно
> js вместо json
Там по сути написано "var pitux = KOKOKO", где KOKOKO - это JSON. Простая замена должна помочь.
Да х.з. есть ли в них смысл, текстов то нету. Из полезной инфы там разве что статистика по кармочке.
Если очень хочется — давай добавлю эти 3 пака, тексты можно взять из более свежих снепшотов.
Я сам пытался объединять файлы, чтоб построить базу с историей, но у меня не вышло. Учёл только волнение кармы, а потом стало слишком поздно, чтобы добавить остальное. А там оказалось, что на ГК меняется почти что всё, это меня деморализовало. Надо всё заново делать. Разжимать эти файлы, добавлять их, ... А мне лень уже.
Да пиздец, там дольше файлы розжимались, чем обработка шла. Надеюсь, что ничего не упустил, иначе опять полдня на декомпрессию...
Сейчас я храню все версии комментов, тредов, юзеров и языков, которые отличаются хотя бы одним полем.
Сразу причёсывать хтмл я побоялся, поэтому там куча лишних копий (чисто текстовые, скрытые и т.п.). Вот их и надо вычистить вилкой.
Для комментариев может быть интересна история правок и история голосования. Кнопка с всплывающей историей была бы полезна. А кармочка в этом всплывающем окне - графиком от времени.
Главный вопрос - какую версию пользователь хочет посмотреть. Нужен или поиск, или диффы как на гитхабе, или специальный режим, который показывает точку наибольшей информативности треда. Возможно, это будет какое-то синтетическое состояние, где один комментарий будет из одного времени, а другой - из другого, но где Стертор ещё не стёр свой текст, а Страйкер - чужой, а новые комментарии уже оставлены. Такой синтетический режим наверно будет самым полезным, его наверно даже можно кэшировать (кроме новых комментариев), показывать по умолчанию и поиск по умолчанию вести в нём.
Я так и хотел написать, но не хочется выкладывать базу в промежуточном состоянии.
А вот расскажи для нубасов, какое там ограничение на проц, есть ли лимиты на входящий/исходящий трафик? Могу ли я за свои 5 баксов использовать 1 ядро на 100%, высирать сколько угодно трафика, и лезть в инет сколько хочу?
А вот за сеть до упора (гигабит) они банят на всякий случай (в инете на это жаловались). Лимит трафика -
терабайт на 5 баксовом, всё что выше пишут что платное (не проверял).
Майнинг и торренты вроде явно запрещены в TOS.
Как они определят что там крутится не влазя в виртуалку?
Ты думаешь им в неё так сложно влезть? :)
Перечитал TOS. Про торренты и майнинг я ошибся — они тупо оставили за собой право ёбнуть виртуалку без предупреждения(!) с потерей всех данных(!) если ты будешь слишком сильно юзать проц/сеть/диск.
Причём определения этого слишком сильно там нет.
>Причём определения этого слишком сильно там нет.
Как и в рашке. Правда, это не рашка.
https://www.digitalocean.com/legal/terms/
Пункт 12.1.
Только я постоянно пароль забываю. gcode и год или как?
Дяденька, я не настоящий программист...
is for goat+chese