[Moscow.pm] Работа с Web::Scraper

Evgeniy Kosov evgeniy на kosov.su
Ср Ноя 9 01:52:07 PST 2011


On 09.11.2011 13:36, Foxcool wrote:
> Заранее извиняюсь, возможно, за тривиальные вопросы, т.к. я из редкого
> нынче вида Перл-джуниоров.
> Есть интересный модуль Web::Scraper, документацию которого я не нахожу
> избыточной, т.к. не могу разобраться, как его "натравливать" на теги.
> Есть некая страница, которая полна таблиц, идущих друг за другом, разных
> и т.д. Первая проблема, с которой я столкнулся: мне нужны определенные
> таблицы. И не с определенным id или class, а с значением другого атрибута.
>
> <tablewidth="100%"cellspacing="0"cellpadding="3"border="0">
> <tablewidth="100%"cellspacing="2"cellpadding="1">
>
>
> Например, cellspacing="2", или cellpadding="1", или даже оба. Как мне
> указать это скраперу? Кстати, посоветуете другой инструмент, буду
> непротив. С небольшим модулем, который парсит регулярками разобрался
> быстро и доволен его работой, но хотелось бы разобраться с каким-нибудь
> большим и стабильным инструментом для того, чтобы использовать его в
> чрезмерно важных задачах.
>
>
>

Посмотрите на WWW::Mechanize 
(http://search.cpan.org/~jesse/WWW-Mechanize-1.70/).
Если я ничего не путаю, с его помощью подобные задачи решались просто.

-- 
С уважением,
Евгений Косов.


Подробная информация о списке рассылки Moscow-pm