- 1
l.add_xpath('price', '//table[3]/tr/td[2]/table[1]/tr[1]/td[3]/table/tr[3]/td/table/tr[2]/td/text()', lambda x: '.'.join(x))
Нашли или выдавили из себя код, который нельзя назвать нормальным, на который без улыбки не взглянешь? Не торопитесь его удалять или рефакторить, — запостите его на говнокод.ру, посмеёмся вместе!
−102
l.add_xpath('price', '//table[3]/tr/td[2]/table[1]/tr[1]/td[3]/table/tr[3]/td/table/tr[2]/td/text()', lambda x: '.'.join(x))
hometwo 05.05.2014 14:24 # −11
orion 05.05.2014 18:37 # 0
bormand 05.05.2014 18:39 # 0
eth0 05.05.2014 18:44 # +2
orion 05.05.2014 18:47 # +8
myaut 05.05.2014 19:53 # +5
guest 05.05.2014 20:27 # 0
Зачем?
>text.encode('utf-8')
Зачем?
orion 05.05.2014 23:11 # 0
2. текст в утф нужен был
guest 05.05.2014 23:47 # 0
2. Обычно текст хранят в юникоде и кодируют при надобности.
Да и говна не вижу.
bormand 06.05.2014 05:43 # +1
А вот это тогда что? Ну хотя там верстале поди вломы было айдишки давать этим элементам, а тестерам запретили править верстку, вот и выкручиваются :)
guest 06.05.2014 17:51 # 0
>вероятно, он просто выковыривает xpath, который любезно генерит Firefox, и не парится
orion 07.05.2014 13:41 # −1
wvxvw 06.05.2014 10:29 # +1
kyzi007 06.05.2014 17:31 # +1
roman-kashitsyn 06.05.2014 17:38 # +1
вероятно, он просто выковыривает xpath, который любезно генерит Firefox, и не парится
guest 06.05.2014 17:51 # +1
kyzi007 06.05.2014 18:59 # 0
guest 06.05.2014 19:13 # 0
Если ломается абсолютный xpath, как правило, был сделан какой-то редизайн и сломается и cssselect. Плюс, не всегда у нужного элемента есть уникальный id или class. Или вообще какой-то.
kyzi007 06.05.2014 22:05 # 0
wvxvw 06.05.2014 17:54 # 0
kyzi007 06.05.2014 19:00 # +2
guest 06.05.2014 19:12 # +1
Ворюга! Пират! У-у-у-у!
roman-kashitsyn 06.05.2014 19:14 # +2
Vasiliy 06.05.2014 20:16 # 0
http://habrahabr.ru/company/mailru/blog/200394/
соррь за хабр. с HTML5 все еще проще.
guest 06.05.2014 20:26 # 0
kyzi007 06.05.2014 22:09 # 0
guest 06.05.2014 22:18 # 0
kyzi007 06.05.2014 22:29 # +1
guest 06.05.2014 22:47 # 0
Т.е. граббингом чужих страничек?
>Мне еще плагин к броузеру для автоматизации предлагали. Очень актуально для серверов.
?
kyzi007 06.05.2014 22:51 # 0
Не страничек, магазинов аля ебей.
wvxvw 06.05.2014 23:05 # 0
Ну а кроме него есть w3m, Linx... Очень полезные вещи, когда нужно проверить как что-то работает на сервере, на который нет доступ через HTTP.
Ну и Хром писался исторически как бот собирающий информацию из загруженых и выполненых страниц (т.е. со всеми ж.скриптами и КССами, одно время говорят он и с Ихаботом дружил - это автоматизированый Флеш плеер, и со всякими парсерами ПДФ / ППТ и чего там только не было).
У нас например наша сборка Хрома на сервере занимается конвертацией флешевых роликов в видео.
kyzi007 06.05.2014 23:53 # 0
guest 07.05.2014 00:13 # 0
В смысле флешек? Не видео, играющегося в флеш проигрывателях?
guest 07.05.2014 00:14 # 0
Если нужная информация грузится через аякс, все обычно упрощается, т.к. там json. Во вк там, правда, передается html в json :)
guest 06.05.2014 22:46 # 0
kyzi007 06.05.2014 22:13 # 0
eth0 07.05.2014 18:57 # 0
У говнокода есть в меру статические страницы.
А вот за избыточную подгрузку по мере надобности надо убивать, это точно.
Vasiliy 07.05.2014 22:10 # 0
Это как ?
По опыту скажу в 146% случаев бывает так, все на страницу вываливается в надежде, что нибудь, когда нибудь, кому нибудь пригодится.
eth0 08.05.2014 20:53 # +1
Когда делали последний сайт твиттера, явно надеялись, что никто не будет смотреть больше топ-10 записей в блоге. Другим я такую несуразность объяснить не смогу.
Если крутить до бесконечности и дальше, то нельзя ни поставить закладку на том, где остановился, ни нормально обработать хождение вперёд-назад по истории. Ну и ко всему прочему, страница тупо уронит браузер, когда закончится память.
1024-- 08.05.2014 21:22 # 0
kyzi007 06.05.2014 17:28 # 0
guest 06.05.2014 01:04 # −2