- 01
- 02
- 03
- 04
- 05
- 06
- 07
- 08
- 09
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
<?php
$str = file_get_contents('source.txt');
$out = '';
$len = strlen($str);
$word = '';
$bad_words = array(
'Аноним',
'Птн',
'Сен',
'Ответ',
'Пропущено',
'ответов',
'изображениями',
'Нажмите',
'jpg',
'png',
'gif',
'Кб',
'x',
);
$str=str_replace('Нажмите "ответ", чтобы увидеть тред целиком.','', $str);
$str=str_replace('Показана уменьшенная копия, оригинал по клику.','', $str);
$str=str_replace('Пропущено ','', $str);
$str=str_replace(' ответов, из них ','', $str);
$str=str_replace(' с изображениями.','', $str);
$str=str_replace('Аноним','', $str);
$str=str_replace('Ответы','', $str);
$str=str_replace('Ответ','', $str);
$str=str_replace('Птн','', $str);
$str=str_replace('Сен','', $str);
$str=str_replace('jpg','', $str);
$str=str_replace('png','', $str);
$str=str_replace('gif','', $str);
$str=str_replace('Кб','', $str);
$str=str_replace('x','', $str);
for ($i = 0; $i < $len; $i++) {
$c = $str[$i];
if (($c >= 'a') && ($c <= 'z') ||
($c >= 'A') && ($c <= 'Z') ||
($c >= 'а') && ($c <= 'я') ||
($c >= 'А') && ($c <= 'Я')
) {
$word.=$c;
} else {
if ($word != '') {
$out.=strtolower($word) . "\r\n";
}
$word = '';
}
}
file_put_contents('dictonary.txt', $out);
?>
Из чьей-то пхп-вайпалки для известной имиджборды.
Генерирует словарь слов из текста, взятого с помощью Ctrl+C с любой из страниц борды.
Pedofil 14.06.2012 23:07 # −7
Lowezar 14.06.2012 23:44 # +2
7ion 15.06.2012 01:28 # +1
Lowezar 15.06.2012 11:10 # +1
7ion 15.06.2012 11:40 # +1
Lure Of Chaos 15.06.2012 01:05 # +4
someone 15.06.2012 09:23 # +2
bormand 15.06.2012 10:14 # +2
Lure Of Chaos 16.06.2012 00:39 # +1
jQuery 15.06.2012 13:44 # +2
Lure Of Chaos 16.06.2012 00:39 # +1