1. Python / Говнокод #26269

    −2

    1. 01
    2. 02
    3. 03
    4. 04
    5. 05
    6. 06
    7. 07
    8. 08
    9. 09
    10. 10
    11. 11
    12. 12
    def raboficate(sents: Sequence[Sequence[str]]) -> Sequence[str]:
        RABOWORDS = (
            ('много', '.'),
            ('малость', '.'),
            ('зачем', '?')
        )
    
        sents_rab = []
        for sent in sents:
            raboword = random.choice(RABOWORDS)
            sents_rab.append([raboword[0]] + sent + [raboword[1]])
        return sents_rab

    Массовое зомбирование сознания при помощи «Python».
    https://github.com/gost-gk/raboscript

    В помощь начинающим рабомантам и кобенаторам нашим отделом по датамайнингу бигдаты был надатамайнен, почищен и приведён к удобоваримому виду (все слова/знаки препинания разделены пробелами, мусор убран) самый длинный фанфик по «Mass Effect»: https://mega.nz/#!XdFyzahR!_rXcsCBWyyrnl69feQMpCi238ACNp euO-Zz9nn2E-FQ (сорок мегабайт отборной психозы!).
    Также аналитическим отделом был найден пакет «pymorphy2», с помощью которого наши инженеры надеются довести рабоскрипт до идеала.

    Запостил: gost, 15 Декабря 2019

    Комментарии (136) RSS

    • Зачем опять в спортзале прыгают?
      Много и она будет это и знать и понимать.
      Много попытался было возразить младший полисмен.
      Много у них своих проблем, хлопот и вопросов — предостаточно, — подтвердила проекция.
      Зачем любыми методами, способами, средствами, — сказал старпом?
      Много старший группы кроганов остановился, вгляделся вдаль.

      Зачем это — не в традициях людей?
      Зачем это было необходимо — и это было сделано?
      Малость горящую, покрытую язвами разрушений.
      Зачем странные эти нормандовцы, очень странные?
      Зачем причина, полагаю, в другом?
      Много дженкинс был впечатлён возрастом найденной пострадавшей азари.
      Ответить
    • Ещё и статья об этом pymorphy2 написана:
      https://link.springer.com/chapter/10.1007%2F978-3-319-26123-2_31

      И словарь из «Открытого корпуса»:
      http://opencorpora.org/
      Ответить
      • Из «Открытого корпуса» можно скачать словарь коллокаций и словари биграмм и триграмм, чтобы генерировать предложения.
        Ответить
      • А ещё в «Открытом корпусе» есть сборник текстов, разбитых на слова. У каждого слова в xml-атрибутах лежит его морфологический разбор.

        <paragraph id="38528">
          <sentence id="110286">
            <source>Порошенко поручил создать гуманитарный коридор на юго-востоке Украины</source>
            <tokens>
              <token id="1995269" text="Порошенко">
                <tfr t="Порошенко" rev_id="4546521">
                  <v>
                    <l id="260469" t="порошенко">
                      <g v="NOUN"></g>
                      <g v="anim"></g>
                      <g v="ms-f"></g>
                      <g v="Fixd"></g>
                      <g v="Surn"></g>
                      <g v="plur"></g>
                      <g v="ablt"></g>
                    </l>
                  </v>
              <token id="1995270" text="поручил">
                <tfr t="поручил" rev_id="4546522">
                  <v>
                    <l id="260798" t="поручил">
                      <g v="VERB"></g>
                      <g v="perf"></g>
                      <g v="tran"></g>
                      <g v="masc"></g>
                      <g v="sing"></g>
                      <g v="past"></g>
                      <g v="indc"></g>
                    </l>
                  </v>
                </tfr>
              </token>
              <token id="1995271" text="создать">
                <tfr t="создать" rev_id="4546523">
                  <v>
                    <l id="328586" t="создать">
                      <g v="INFN"></g>
                      <g v="perf"></g>
                      <g v="tran"></g>
                    </l>
                  </v>
                </tfr>
              </token>
        Ответить
        • Зарезал тебя, страдай.
          Ответить
        • <token id="1995272" text="гуманитарный">
                  <tfr t="гуманитарный" rev_id="4546524">
                    <v>
                      <l id="76865" t="гуманитарный">
                        <g v="ADJF"></g>
                        <g v="inan"></g>
                        <g v="masc"></g>
                        <g v="sing"></g>
                        <g v="accs"></g>
                      </l>
                    </v>
                  </tfr>
                </token>
                <token id="1995273" text="коридор">
                  <tfr t="коридор" rev_id="4546525">
                    <v>
                      <l id="139616" t="коридор">
                        <g v="NOUN"></g>
                        <g v="inan"></g>
                        <g v="masc"></g>
                        <g v="sing"></g>
                        <g v="accs"></g>
                      </l>
                    </v>
                  </tfr>
                </token>
                <token id="1995274" text="на">
                  <tfr t="на" rev_id="4546526">
                    <v>
                      <l id="166264" t="на">
                        <g v="PREP"></g>
                      </l>
                    </v>
                    <v>
                      <l id="388676" t="на">
                        <g v="INTJ"></g>
                      </l>
                    </v>
                    <v>
                      <l id="388734" t="на">
                        <g v="PRCL"></g>
                      </l>
                    </v>
                  </tfr>
                </token>
                <token id="1995275" text="юго-востоке">
                  <tfr t="юго-востоке" rev_id="4546527">
                    <v>
                      <l id="386792" t="юго-восток">
                        <g v="NOUN"></g>
                        <g v="inan"></g>
                        <g v="masc"></g>
                        <g v="sing"></g>
                        <g v="loct"></g>
                      </l>
                    </v>
                  </tfr>
                </token>
          Ответить
    • http://www.aot.ru/history.html
      http://www.aot.ru/onlinedemo.html
      http://www.aot.ru/technology.html

      Наши технологии базируются на многоуровневом представлении естестевенного языка, которое, в свою очередь, было заимствовано у системы ФРАП (Система французско-русского автоматического перевода была разработана коллективом лаборатории машинного перевода Всесоюзного центра переводов совместно с коллективом лаборатории машинного перевода МГПИИЯ им М. Тореза. 1976-1986 ГГ.)

      Компоненты, составляющие языковую модель, - лингвистические процессоры, которые друг за другом обрабатывают входной текст. Вход одного процессора является выходом другого. Выделяются следующие компоненты:

      • Графематический анализ. Выделение слов, цифровых комплексов, формул и т.д. (подробнее)
      • Морфологический анализ. Построение морфологической интерпретации слов входного текста.(подробнее)
      • Синтаксический анализ. Построение дерева зависимостей всего предложения.(подробнее)
      • Семантический анализ. Построение семантического графа текста.(подробнее)


      Люди пишут диссертации по ворециям.
      Ответить
    • показать все, что скрытоvanished
      Ответить
      • Пайрайт.

        Я слегка запутался в питоновских метатипах. В доке пишут, что у Sequence должен быть __len__():
        sequence
        An iterable which supports efficient element access using integer indices
        via the __getitem__() special method and defines a __len__() method
        that returns the length of the sequence. Some built-in sequence types
        are list, str, tuple, and bytes. Note that dict also supports __getitem__()
        and __len__(), but is considered a mapping rather than a sequence because
        the lookups use arbitrary immutable keys rather than integers.
        Ответить
    • Добавил простенький нормализатор текста для приведения к требуемому рабоскриптом виду. Прогнал через него Рыбаченко (http://samlib.ru/r/rybachenko_o_p/teror2-12.shtml), получил знатную зомбопсихозу!

      Малость хотя сама голова все больше превращается в лом.
      Много вот снова атакуют илы всех моделей.
      Малость хотя сама голова все больше превращается в лом.
      Малость что и выразить бедным человеческим языком невозможно.
      Зачем и девчата получили возможность сражаться на оружии противника?
      Много чтобы хоть чуть-чуть отхлынула эта волна дичайших страданий и боли.

      Много гитлеровцы смилостивились и устроили выходной день.
      Зачем стреляй лучше по старикам?
      Много некоторые из них применяли в качестве оружия реактивные снаряды.
      Много правда, немцы сейчас оснащены неплохо.
      Малость а он, черт побери, не все детали схемы помнит.
      Много эльцветы древнее племя, не знающее старости, пусть и не бессмертное.

      Много советские летчики приняли бой.
      Зачем демон хвастливо произнес : — у нас много различных видов пыток?
      Малость если да то получается господь, вовсе не является непогрешимым.
      Зачем бормотал на русском с легким украинским акцентом один из них?
      Малость оживленная при этом богом войны аресом.
      Много а юношей в латах осталось значительно меньше.
      Ответить
      • Приведи реальный пример, где тебе пригодились вореции.
        Ответить
      • > Прогнал через него Рыбаченко (http://samlib.ru/r/rybachenko_o_p/teror2-12.shtml)

        Неплохо-неплохо.

        В одной из альтернативных реальностей Адольфу Гитлеру удалось развиться до уровня гипервсемогущего Надбога и теперь вся сверх цивилизация человеческих Богов-демиургов, всемогущих творцов вселенных под угрозой уничтожения и порабощения. Чтобы отыскать ключик к победе, над не знающим пределов силы бесноватым фюрером, российского полковника-инженера Петра Дегтярева воплощают в молекулу ДНК с целью взять под контроль мозг Гитлера.
        Ответить
        • Прям напомнило:

          Эта книга расскажет читателям о тайном контакте автора этой книги, Зайцева Ивана Сергеевича с самыми высокопоставленными слугами супер засекреченной тоталитарной секты Сатаны, во главе которой стоит президент Российской Федерации Владимир Владимирович Путин, которого клонировали Сатанисты в 1952 году из черепа самого Гитлера. И они же его продвинули в президенты Российской Федерации, для осуществления своего плана по созданию нового четвертого тысячелетнего Рейха, ада Адольфа Гитлера.

          Оказывается, что Сатанисты давно уже клонируют нужных им людей - диктаторов и В.В. Путин клон Гитлера входит в их коллекцию клонированных Гитлеров. Об этой тайне мне по секрету рассказал сам лично В.В. Путин.

          Путин получился у Сатанистов наиболее удачными Гитлеровским клоном, и он наиболее точно скопировал у настоящего Гитлера способность и искреннее желание воплотить свою Фюрерскую мечту в жизнь, уничтожить всё земное человечество в мясорубке будущих концлагерей. Создав свою службу ФСБ, что в Сатанинских секретных документах расшифровывается как: ФСБ-Фюрер Снова Бог Земли Русской.

          Сатанинская секта обладает очень серьёзными высокоразвитыми технологиями, которые и не снились даже инопланетянам. Они изучили человеческий мозг в совершенстве и управляют им как индивидуально, так и в массовом порядке на больших расстояниях.

          Они умеют читать чужие мысли, отключать мозг, списывать с мозга информацию и записывать на любой мозг, что угодно и кому угодно и т.д.

          Сатанисты даже проводили массовые учения в конце 80-х годов прошлого столетия по массовому управлению людьми на расстоянии из их секретного центра. При этом, прикрываясь якобы способных к этому, некоторых известных людей-экстрасенсов гипнотизировать весь Советский Союз на стадионах и телеэкранах в прямом эфире.
          Ответить
    • > Также аналитическим отделом был найден пакет «pymorphy2», с помощью которого наши инженеры надеются довести рабоскрипт до идеала
      Вот это интересно.

      > сорок мегабайт отборной психозы
      У меня ещё мысль была, брать такие большие тексты и сравнивать концы фраз какой-нибудь марковской цепью.
      Выбирать кобенации пар со схожими окончаниями, для получения малость шизорифмы.
      Ответить
      • Есть ещё вот такая штука: https://pypi.org/project/russtress/. С её помощью можно вообще хуярить идеальный ямб-хорей.
        Ответить
        • >RNN with LSTM
          Трендовенько.

          Между прочим я тут заметил, что от вдумчивого чтения классических вореций (2014), возникает такое лёгкое головокружение.
          Более известное как вздрыжне-эффект. Который обусловлен внезапными, неожиданными разрывами фраз.

          А много-малостная шиза действительно обладает неким зомбирующим эффектом.
          Ответить
    • Мой фрагмент юзерскрипта. В text скармливаю произвольный текст.

      var nav=text.replace(/[.?!,—]/g,'\n').split("\n").filter(x => { return x.length>3; })
      var prefix=['Малость','Много', 'Зачем'];
      var suffix=[[',',',', '?'],['.','.', '?']];
      
      var s="";
      for (var k=0;k<8;++k)
      {
          i=((nav.length)*Math.random())&~1;
      	
          for (var j=0;j<2;++j)
      	     r=(Math.random()*3)|0,s+=prefix[r]+' '+nav[i+j].trim().toLowerCase()+suffix[j][r]+'\n';
          if (1==k%2) s+='\n';
      }


      Поют несколько раз. Ассистенты зомбирующего повторяют после каждого раза "Зачем? Зачем?"

      Таким образом обеспечивается усиление смешивания образов.

      Текст поется 10-20 раз.

      Основной смысл - оглупление. Бывают случаи очень сильного падения уровня интеллекта в результате применения этой методики.


      Эта методика вызывает страх падения интеллекта, и поэтому зомбирующий пугает тем, что жертва станет полным идиотом, если вспомнит зомбирование.
      Ответить
      • Засрал весь форум
        Ответить
      • >var
        фууу
        >for
        фуууууууууууууууууууу

        как там, в 2002-м?
        Ответить
        • А что нынче продвинутые хипстеры вместо for юзают? Последний раз я слышал, что модно использовать «for of».
          Ответить
          • показать все, что скрытоvanished
            Ответить
            • Да, я как-то мельком видел статью, порицающую «for in» — мол, опасно, небезопасно, чо-то-там-ещё. Вот в ней же и писали, что надо использовать новомодный «for of», добавленный в каком-то свежем стандарте.
              Ответить
            • const Range = require('range'); // или import {range} from 'range';
              
              for (const i of Range.range(22)) {

              ReferenceError: require is not defined

              Фу блядь, фу нахуй.
              Превратили некогда простой язык в какую-то жабу.

              Конструкция цикла стала только многословнее. И скорее всего хуже по пирформансу:
              for (var i=0;i<22;++i)


              >for in -- по объекту (логично и удобно, как и всё в джаваскрипт)
              >>for in
              >>логично и удобно
              >>как и всё в джаваскрипт

              Надеюсь это сраказм.
              Ответить
      • показать все, что скрытоvanished
        Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
    • показать все, что скрытоvanished
      Ответить
      • Вариант — всё мелкое говно запихнуть в тар без сжатия, тарболл и несколько оставшихся крупных кусков говна отослать несколькими потоками.

        > будет 10 секунд минимум
        Если у тебя гигабитная сетка, то гигабайт ты быстрее, чем за 8 секунд, никак не передашь. Да и за 8 не передашь.
        Ответить
        • показать все, что скрытоvanished
          Ответить
          • Чтобы передать всё одним блобом, да.

            Быстрее десяти секунд вряд ли получится разогнаться из-за заголовков и прочего TCP-дерьма.
            Ответить
            • показать все, что скрытоvanished
              Ответить
              • Ой, всё.
                Ответить
                • показать все, что скрытоvanished
                  Ответить
                  • О тишине и не мечтай!
                    Ответить
                    • Ты очень неумело создаешь активность. Граничит с тупостью..
                      Ответить
                    • показать все, что скрытоvanished
                      Ответить
                      • Могу поссать тебе в ебало - парахатом, для запаха. А ты помечтай, представь, что волна морская - пенная и солёная, накрыла тебя с головой.
                        Ответить
                        • Ну ты выдал... Просто слов нет.
                          Ответить
                          • Блять, жиголо, ты хоть раз видел нужник на пляже? Нет?.. В прибрежной зоне почти 80% мочи. Да-да, блять, не пытайся это отрицать. Дети, дяденьки и тетечки весело плещутся, все радостны и довольны.
                            Ответить
                            • Прошлым летом был в Джугбе - курорт для быдла. Отдыхающие были пьяны, курили, сосались прямо на пляже. Повсюду были разбросаны пивные бутылки, окурки и осколки стекла. Малую нужду люди справляли, очевидно, в раздевалочных кабинках; там стоял ужасный запах.

                              Больше туда ни ногой.
                              Ответить
        • > без сжатия
          С gzip'ом лучше будет, имхо. Один хер он сейчас почти бесплатный.

          А потоки никакого смысла не имеют. Емнип, даже сраный net cat спокойно забивал гигабитку до упора.

          Именно поэтому я за tar -zc | nc
          Ответить
          • Ну хз, судя по «пол минуты распаковывать» — там какие-то малость устаревшие процессоры.

            В общем, жать надо до тех пор, пока передача в IO упирается.
            Ответить
            • > малость устаревшие процессоры
              но ведь
              >> Говно состоит из пятидести тысяч файлов.
              которые ФС будет размазывать довольно долго
              Ответить
            • >судя по «пол минуты распаковывать» — там какие-то малость устаревшие процессоры.

              Сжатие — правильная идея. Но deflate много устарел.

              Поэтому я за ZSTD.

              https://github.com/facebook/zstd
              https://www.systutorials.com/docs/linux/man/1-zstd/


              Скорость распаковки — по несколько гигабайт в секунду. При большем, чем у gzip сжатии.

              Алгоритм надёжный, проверенный. Не зря его завезли в linux kernel и btrfs.
              Ответить
              • показать все, что скрытоvanished
                Ответить
                • ZSTD — сочетание скорости gzipa и зожатия lzma.
                  Compressor name 	Compress. 	Decompress. 	Compr. size 	Ratio
                  lzma 19.00 -0 		34 MB/s 	80 MB/s 	64013917 	30.20
                  lzma 19.00 -2 		25 MB/s 	91 MB/s 	58867911 	27.77
                  lzma 19.00 -4 		14 MB/s 	95 MB/s 	57201645 	26.99
                  lzma 19.00 -5 		3.28 MB/s 	103 MB/s 	49710307 	23.45
                  lzma 19.00 -9 		2.66 MB/s 	107 MB/s 	48707450 	22.98
                  
                  zstd 1.4.3 -1 		480 MB/s 	1203 MB/s 	73508823 	34.68
                  zstd 1.4.3 -2 		356 MB/s 	1067 MB/s 	69594511 	32.84
                  zstd 1.4.3 -5 		104 MB/s 	932 MB/s 	63993747 	30.19
                  zstd 1.4.3 -8 		46 MB/s 	1055 MB/s 	60757793 	28.67
                  zstd 1.4.3 -11 		20 MB/s 	1001 MB/s 	59239357 	27.95
                  zstd 1.4.3 -15 		7.12 MB/s 	1024 MB/s 	57167422 	26.97
                  zstd 1.4.3 -18 		3.58 MB/s 	912 MB/s 	53690572 	25.33
                  
                  zlib 1.2.11 -1 		119 MB/s 	383 MB/s 	77259029 	36.45
                  zlib 1.2.11 -6 		35 MB/s 	407 MB/s 	68228431 	32.19
                  zlib 1.2.11 -9 		14 MB/s 	404 MB/s 	67644548 	31.92
                  
                  libdeflate 1.3 -1 	201 MB/s 	865 MB/s 	73318371 	34.59
                  libdeflate 1.3 -3 	161 MB/s 	912 MB/s 	70668968 	33.34
                  libdeflate 1.3 -6 	99 MB/s 	924 MB/s 	67928189 	32.05
                  libdeflate 1.3 -9 	16 MB/s 	898 MB/s 	65701539 	31.00
                  libdeflate 1.3 -12 	7.39 MB/s 	900 MB/s 	64801629 	30.57


                  https://github.com/inikep/lzbench
                  Ответить
              • Малость deflate устарел? Зачем тогда используют deflate? Зачем?
                Ответить
          • показать все, что скрытоvanished
            Ответить
            • Да, однопоточный. Он же просто передаёт stdin/stdout через сокет.
              Ответить
      • >Можно сжать LZMA

        Он тормозной.
        Зожимай zstd или brotli, будет тебе счастье.

        Если так хочется LZMA.
        Малость быстрее будет https://github.com/conor42/fast-lzma2

        И стоит помнить что XZ, популярная в луниксах обёртка LZMA2 — fractal of bad design.

        https://www.nongnu.org/lzip/xz_inadequate.html
        Ответить
    • показать все, что скрытоvanished
      Ответить
    • Меня напрягает, что алиса недослушивает и перебивает меня, встревая в паузы.
      Ответить
    • Я нашёл жемчужину на тему «много-мало»:

      https://rustih.ru/eduard-asadov-kak-mnogo-tex-s-kem-mozhno-lech-v-postel/

      Возможно, Эдуард Асадов.
      Ответить

    Добавить комментарий