[Moscow.pm] определение адреса RSS ленты

Dmitry Simonov dsimonov на gmail.com
Пт Фев 4 02:53:10 PST 2011


Не передёргивай :) Парсер XML-потоков - это отдельный поток задач,
требующий готового решения. Распарсить же html-ку на поиск нескольких
ссылок - это как раз то самое, для чего pure-перл подходит лучше
всего.

Я занимался задачей полноценного вынимания ссылок из большого объёма
html-документов (русскоязычный сегмент) - до нескольких миллионов
страниц в сутки как раз с использование HTML::Parser-а, так что знаю о
чём говорю. Это ужас-ужас просто. Когда смотришь на результаты того,
что попадает под парсинг, - берёт оторопь.

---
С искр. ув. Д.Симонов


2011/2/4 Andrew Shitov <andy на shitov.ru>:
> 2011/2/4 Dmitry Simonov <dsimonov на gmail.com>:
>> Скажу честно. Лучше напиши свои регэкспы,
>
> А потом и свой парсер RSS? :-)
>
> --
> Andrew Shitov
> ______________________________________________________________________
> andy на shitov.ru | http://shitov.ru
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>


Подробная информация о списке рассылки Moscow-pm