- 01
- 02
- 03
- 04
- 05
- 06
- 07
- 08
- 09
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
function isSpam(comment) {
// quick and dirty filter agains guest spam
// it can reject normal links, but who cares...
if ((comment.user_id == 1) && comment.text.match('http://'))
return true;
if ((comment.user_id == 25580) && ((comment.text.match('^, http')) ||
(comment.text.match(', , http')) ||
(comment.text.match('<strong>')) ||
(comment.text.match('^<a href=')) ||
(comment.text.match('^comment[0-9]+,')) ||
(comment.text.match('storefocus')) ||
(comment.text.match('.*Хрюкни, свинособака')) ||
(comment.text.match('.*<span style')) ||
(comment.text.replace(/\s*/g, '').match('viagra|cialis|levitra')) ||
(comment.text.match('-[0-9a-fA-F]{4}\.pdf'))))
return true;
return false;
}
Какой bаrop )))
> Анскильный
Ибо нехуй тратить на спамеров больше времени, чем они потратили на свой скрипт.
А стертор напоминает олега сивоконя, но тот не прогал на пасквиле.
Этот принцип самый эффективный.
Последний раз спамили с рандомным мусором в каждом комменте (видимо, чтобы обойти антиспам иньо). Т.е. простое сравнение уже не прокатит. Нужен какой-нибудь байесовский классификатор, который обучается на примерах спама и не спама...
Но это надо думать, писать, отлаживать. А моя херня на регулярках, которую запостили в этом топике, пока вполне справляется и затраты на её поддержку почти нулевые - въебал новую регулярку и забыл.
Тем более, цитирование обычно начинают со знака >, ну или @, кому как.
А, это гость. А то я поначалу подумал, что это админу спамить запретили.