Говнокод #26001 — Python — Говнокод.ру

Python / Говнокод #26001

+1
1. 01
2. 02
3. 03
4. 04
5. 05
6. 06
7. 07
8. 08
9. 09
10. 10
11. 11
12. 12
13. 13
14. 14
15. 15
16. 16
17. 17
18. 18
19. 19
20. 20
21. 21
22. 22
23. 23
24. 24
25. 25
26. 26
27. 27
28. 28
29. 29
30. 30
31. 31
32. 32
33. 33
34. 34
35. 35
36. 36
37. 37
38. 38
```
import re, copy, json

config = {}


def domain_mapper(domain):
	def injector(f):
		if domain not in config:
			config[domain] = []
		config[domain].append(f)
	return injector

def default(f):
	config['default'] = [f]
	return f

@domain_mapper("gmail.com")
@default
def google_filter(content):
	regex = r"([^\!\?\.]*?offer.*?[\!\?\.])"
	repl = r""
	return re.sub(regex, repl, content, re.M)

@domain_mapper("gmail.com")
def another_google_filter(content):
	return content

@domain_mapper("yandex.ru")
def yandex_filter(content):
	regex = r"<img src=[\"'](.+?)[\"'].*/>"
	repl = r"\1"
	return re.sub(regex, repl, content, re.M)

@domain_mapper("mail.ru")
def mail_filter(content):
	regex = r"<img src=[\"'](.+?)\.gif[\"'].*/>"
	repl = r"<img src='\1.png'/>"
	return re.sub(regex, repl, content, re.M)
```
Говно или нет?

Запостил: miwomare, 28 Октября 2019

Tweet
Комментарии (85) RSS
- miwomare 28.10.2019 19:27 # 0
  
  class Email:
  
  def __init__(self, email, message):
  self.email = email
  self.message = message
  
  def send(self):
  for fltr in self.find_filter():
  self.message = fltr(self.message)
  return self
  
  def find_filter(self):
  fltr = None
  matches = re.match(r"[0-9a-zA-Z\.]+@([a-z]+\.[a-z]+)", self.email)
  if not matches: raise Exception("Invalid email addr")
  domain = matches.group(1)
  # 'default' домен не пройдет re.match
  if domain not in config: return config['default']
  return config[domain]
  
  def __str__(self):
  return json.dumps(self.__dict__)
  
  def __repr__(self):
  return str(self)
  Ответить
  - MAKAKA 28.10.2019 19:31 # 0
    
    >matches = re.match(r"[0-9a-zA-Z\.]+@([a-z]+\.[a-z]+)", self.email)
    ну такое
    http://emailregex.com/
    Ответить
    - bagrinho 28.10.2019 20:05 # 0
      
      Ага. Адреса с плюсиками не пройдут (как теперь регистрировать файки?), адреса с минусом не пройдут ([email protected]), адреса на доменах с цифрами не пройдут (довольно популярные e1.ru, 163.com, mail333.com), с минусами тоже (mtu-net.ru), адреса на доменах выше второго уровня не пройдут (yahoo.co.uk), адреса на доменах с Punycode не пройдут.
      Ответить
      
      guest8 28.10.2019 20:08 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bagrinho 28.10.2019 20:19 # 0
      
      Какое же говно! Для разных языков дали неэквивалентные регулярки.
      
      RFC учитывает всякие устаревшие форматы, включая возможность отправить e-mail на IP-адрес (domain-literal в RFC), а ещё адрес в уголковых скобках (angle-addr), экранирование символов в local-part. Плюс ещё разные реализации ссылаются на разные версии RFC (822, 2822, 5322).
      Ответить
      
      MAKAKA 28.10.2019 20:24 # 0
      
      [место для шутки про парсинг адреса на языке рулов одного годного MTA]
      Ответить
      
      bagrinho 28.10.2019 21:46 # +1
      
      Проще перечислить, каких символов не должно быть в адресе, чем перечислять, что можно.
      
      Отбросим поддержку UUCP (цепочка маршрутизаторов почты через !), angle-addr ("Vasiliy Pupkin" <[email protected]>), отправку на айпишник (vasya-pupkin@[169.254.1.1]). Тогда адрес должен содержать ровно один символ @, которым он делится на локальную часть и доменную часть.
      
      В локальной части нельзя использовать непечатаемые символы (с кодами 0x00-0x20 и 0x7F), кавычки, запятую, точку с запятой и какие-то скобочки. Всё остальное можно разрешить. Кстати, сервер вправе учитывать регистр, поэтому приводить локальную часть к нижнему регистру не надо. Хотя «Граватар» и большинство форумов всё-таки приводят, чтобы затруднить мультоводство (популярные почтовые системы регистр не учитывают).
      
      Доменная часть должна подчиняться стандартам DNS: разрешены латинские буквы, цифры, минусы и точки. Домен может быть любого уровня, а не только второго. Регистр в доменной части игнорируется.
      
      Остаётся открытым вопрос о символах за пределами ASCII. В доменной части они могут быть закодированы в Punycode (xn--p1ai, например), а могут быть и не закодированы. Ограничения же локальной части нужно смотреть в RFC.
      
      Закидайте меня какашками, если что-то наврал.
      Ответить
      
      Steve_Brown 29.10.2019 10:13 # +2
      
      Наверное, разумный подход.
      Но я бы сделал просто .*@.+ и ниипет.
      Ответить
      
      gost 29.10.2019 10:20 # 0
      
      Поддерживаю. Единственный правильный способ валидировать и-мейл — это послать на него письмо-подтверждение.
      Ответить
      
      bagrinho 29.10.2019 10:20 # 0
      
      Это, пожалуй, лучше, чем по ошибке отклонить валидный е-мейл.
      
      Только потом при использовании (если на него нужно что-то отправлять) придётся проверить, чтобы никакой символ не сыграл роль разделителя. Ну, например, адрес вставляется в поле To:, а там запятая служит разделителем элементов списка.
      Ответить
      
      guest8 29.10.2019 10:24 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Steve_Brown 29.10.2019 12:41 # 0
      
      Ну, нелатинские буквы встречаются. Эффективные миллениалы уже вовсю используют домен .рф и чотакова. (а Thunderbird пока не поддерживает)
      
      Тут, наверное, достаточно защиты от откровенно неподходящих вариантов, типа "", "ул. Ленина д 12", "ааа", "Иванов", "vk.com/ivanof69"...
      Ответить
      
      Dpyrou_Pycoqpo6_CEMA 29.10.2019 13:07 # +1
      
      Но как же тогда быть если запись на путинг за 200 руб. по почте mailto:яватный@хуйвжопе.рф?
      Ответить
      
      Steve_Brown 29.10.2019 14:10 # 0
      
      Зайти через веб-интерфейс. Если и там не поддерживает, завести другой ящик.
      Ответить
      
      guest8 29.10.2019 13:23 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      Steve_Brown 29.10.2019 14:34 # 0
      
      Зависит от того, как хорошо почтовый клиент этого "где-то" всё это поддерживает.
      Ответить
      
      bagrinho 29.10.2019 14:51 # 0
      
      Попробовать и так, и так, оба раза поймать невнятное сообщение об ошибке, потому что где-то валидируют домен по регулярке, случайно найденной на Stackoverflow.
      
      Хороший сервис должен сам сконвертировать домен в Punycode, если требуется.
      Ответить
      
      govninho 28.10.2019 22:12 # 0
      
      Какое же говно сайт emailregex.com! Выложили довольно годную картинку:
      http://emailregex.com/wp-content/uploads/sites/2/2014/06/General-Email-Regex-Railroad-Diagram-emailregex.com_.png
      
      Но не осилили написать по ней регулярку.
      Ответить
      
      MAKAKA 28.10.2019 22:14 # 0
      
      +1, говнино
      
      годная рега там только для перла
      Ответить
      
      govninho 28.10.2019 22:15 # 0
      
      Особенно порадовал вариант для MSSQL. Домен Камеруна или Колумбии? Не может быть! Наверняка опечатка, а автор имел в виду точка-ком.
      Ответить
      
      MAKAKA 28.10.2019 22:18 # 0
      
      Камерун просто это особый случай, его надо хардкодить, как hack про перееезд berkely.cs.edu в одном MTA
      
      Кстати, о камеруне. Как там с погодой?
      Ответить
      
      govninho 28.10.2019 22:21 # 0
      
      Почему Камерун — особый случай? Ты поддерживаешь расистов? Может быть, ещё сексистов поддерживаешь, которые обо всех пользователях сайтов пишут в мужском роде?
      Ответить
      
      guest8 28.10.2019 22:26 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      govninho 28.10.2019 22:33 # 0
      
      А ещё... А ещё... какашка!
      Ответить
      
      guest8 28.10.2019 22:34 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      XYEMPA3b 28.10.2019 22:45 # 0
      
      Ты чо такая дерзкая?
      Ответить
      
      guest8 28.10.2019 22:48 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 28.10.2019 22:53 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      XYEMPA3b 28.10.2019 23:08 # +1
      
      Именно поэтому я за "PHP".
      Ответить
      
      miwomare 28.10.2019 23:32 # 0
      
      +1
      Ответить
      
      miwomare 28.10.2019 23:08 # 0
      
      а golang можно?
      Ответить
      
      miwomare 28.10.2019 23:11 # 0
      
      че-то на питоне похоже одни дауны пишут
      Ответить
      
      guest8 28.10.2019 23:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 28.10.2019 23:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guestinxo 29.10.2019 00:15 # 0
      
      Чем golang отличается от go?
      Ответить
      
      guest8 29.10.2019 00:48 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      XYEMPA3b 29.10.2019 00:49 # 0
      
      Го — это игра такая, типа рэндзю.
      Ответить
      
      guest8 29.10.2019 00:57 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 29.10.2019 00:57 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 29.10.2019 00:58 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      whois 02.11.2019 21:54 # 0
      
      > милениалы так говорят
      Неправда, как минимум я так не говорю, зато видал как старперы за 30 так говорят.
      Ответить
      
      miwomare 29.10.2019 01:08 # 0
      
      go не гуглится =(
      Ответить
      
      guest8 29.10.2019 01:09 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bagrinho 29.10.2019 01:11 # 0
      
      Есть алгоритм «A*». Чтобы его нагуглить или наяндексить, нужно в начало запроса добавить восклицательный знак.
      Ответить
      
      guest8 29.10.2019 01:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bagrinho 29.10.2019 01:20 # 0
      
      ! означает искать именно в такой форме, не склоняя, не спрягая, не заменяя синонимами. В общем, выключить искусственного идиота.
      Ответить
      
      bagrinho 29.10.2019 01:24 # 0
      
      Хотя сейчас что-то не получается (и «Гугл», и «Яндекс» выдают много мусора). Раньше работало.
      
      Похоже, что алгоритм сделали более вореционным. Совсем пользователей за дебилов считают.
      Ответить
      
      whois 02.11.2019 21:56 # 0
      
      Что-то я не нашел у них восклисательного знака в языке запросов, походу убрали.
      Ответить
      
      -__- 02.11.2019 22:31 # 0
      
      Вот пидоры.
      Ответить
      
      guest8 02.11.2019 22:43 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      PACTPOBblu_nemyx 02.11.2019 22:51 # 0
      
      У «Duckduckgo» восклицательный знак означает перейти на закладку. Закладка «!a» ведёт на «Amazon», например.
      
      Хелпа у них не нашёл. Вместо хелпа у этих петухов 100500 страниц с рекламой «приватности».
      Ответить
      
      guestinxo 29.10.2019 01:23 # 0
      
      A star
      Ответить
      
      guestinxo 29.10.2019 01:23 # 0
      
      Minus a
      Ответить
      
      guest8 29.10.2019 01:10 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      miwomare 29.10.2019 02:04 # 0
      
      guest8, а ты видел регекспы на "PHP"? Это же лютая дичь 2019 - все еще нет юникода.
      Ответить
      
      guest8 29.10.2019 02:23 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      bagrinho 29.10.2019 06:15 # 0
      
      Есть. В конец регулярки нужно добавить модификатор u, тогда с UTF-8 работает:
      https://www.php.net/manual/ru/reference.pcre.pattern.modifiers.php
      
      /Вот так/u
      Ответить
      
      whois 02.11.2019 21:57 # 0
      
      /fuck/u
      Ответить
      
      Booster 02.11.2019 22:06 # 0
      
      Ты чья файка? Растера рустера бустера? Скажи что-нибудь на S Forth.
      Ответить
      
      guestinxo 28.10.2019 23:05 # 0
      
      Какой пиздец. Бесят дебилы, не ставящие знаки препинания.
      Ответить
      
      guest8 28.10.2019 23:07 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guestinxo 28.10.2019 23:09 # 0
      
      Ахах, один даже точку ставит в конце каждого предложения, даже вопросительного. Через пробел правда.
      Ответить
      
      guest8 28.10.2019 23:06 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guestinxo 28.10.2019 23:15 # 0
      
      https://vk.com/wall-127146702_1032470
      Ответить
      
      guest8 28.10.2019 23:24 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 29.10.2019 01:28 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 28.10.2019 20:14 # −999
      
      показать все, что скрытоvanished
      Ответить
- MAKAKA 28.10.2019 19:30 # +3
  
  Сама задача -- говно.
  Если есть на свете ад для программистов, то они там день-деньской парсят произвольный HTML регулярками
  Ответить
  - miwomare 28.10.2019 19:55 # 0
    
    Не тут html заранее задан (только img тэги и только с сокращением /> )
    Ответить
    - guest8 28.10.2019 20:02 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      miwomare 28.10.2019 20:33 # 0
      
      гарантия - сегодня
      Ответить
      
      nyTuH_nugop 28.10.2019 20:51 # −102
      
      показать все, что скрытовчера поменяется, гарантия - сегодня
      сегодня поменяется, гарантия - завтра
      Ответить
      
      guest8 28.10.2019 21:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 29.10.2019 02:29 # −999
      
      показать все, что скрытоvanished
      Ответить
  - bagrinho 28.10.2019 20:00 # 0
    
    Да, HTML лучше парсить специальной библиотекой для XML/SGML, которая представит его в виде DOM или предоставит поиск элементов через XPath или через CSS-селекторы.
    
    Парсить HTML вручную имеет смысл, только если для библиотеки XML не хватает памяти или если файл испорчен (недокачан, незакрытые теги — вот это всё). Да и в этом случае лучше не регуляркой, а пройти простым циклом.
    Ответить
    - miwomare 28.10.2019 20:04 # 0
      
      Не очень хотелось использовать стороние либы
      Ответить
      
      guest8 28.10.2019 20:08 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 28.10.2019 21:13 # −999
      
      показать все, что скрытоvanished
      Ответить
      
      guest8 28.10.2019 21:14 # −999
      
      показать все, что скрытоvanished
      Ответить
  - miwomare 29.10.2019 01:52 # 0
    
    а вообще да, задачу придумал обкуренный даун.
    Ответить
- gost 28.10.2019 20:20 # 0
  
  >Говно или нет?
  > import re
  Говно.
  
  Импорты через запятую, между функциями одна строка, индентация табами — читать PEP8, быстро, решительно!
  Ответить
  - MAKAKA 28.10.2019 20:25 # 0
    
    мне тут пчтика наппела, что у гугла кодстайл отличается от пепа
    Ответить
    - gost 28.10.2019 20:39 # +1
      
      Именно поэтому я против «Гугла».
      Ответить
  - miwomare 28.10.2019 20:30 # 0
    
    спс поржал
    Ответить
  - miwomare 29.10.2019 01:56 # 0
    
    и это, лови пару импортов за щеку, peppanazi.
    Ответить
Добавить комментарий
Ошибка компиляции комментария:

Гости могут высказаться только во вторник, пятницу или субботу
Где здесь C++, guest?!

А не использовать ли нам bbcode?

[b]жирный[/b] — жирный

[i]курсив[/i] — курсив

[u]подчеркнутый[/u] — подчеркнутый

[s]перечеркнутый[/s] — перечеркнутый

[blink]мигающий[/blink] — мигающий

[color=red]цвет[/color] — цвет (подробнее)

[size=20]размер[/size] — размер (подробнее)

[code=<language>]some code[/code] (подробнее)

Проверочный код: *

Говнокод: по колено в коде.

Python / Говнокод #26001

Комментарии (85) RSS

Добавить комментарий