[Moscow.pm] Работа с Web::Scraper

Denis Fedoseev denis.fedoseev на gmail.com
Ср Ноя 9 01:55:41 PST 2011


WWW::Mechanize работает с инстансом Firefox, это как кировцем грядки на
даче полоть.

9 ноября 2011 г. 13:52 пользователь Evgeniy Kosov <evgeniy на kosov.su>написал:

> On 09.11.2011 13:36, Foxcool wrote:
>
>> Заранее извиняюсь, возможно, за тривиальные вопросы, т.к. я из редкого
>> нынче вида Перл-джуниоров.
>> Есть интересный модуль Web::Scraper, документацию которого я не нахожу
>> избыточной, т.к. не могу разобраться, как его "натравливать" на теги.
>> Есть некая страница, которая полна таблиц, идущих друг за другом, разных
>> и т.д. Первая проблема, с которой я столкнулся: мне нужны определенные
>> таблицы. И не с определенным id или class, а с значением другого атрибута.
>>
>> <tablewidth="100%"cellspacing="0"cellpadding="3"border="0">
>> <tablewidth="100%"cellspacing="2"cellpadding="1">
>>
>>
>> Например, cellspacing="2", или cellpadding="1", или даже оба. Как мне
>> указать это скраперу? Кстати, посоветуете другой инструмент, буду
>> непротив. С небольшим модулем, который парсит регулярками разобрался
>> быстро и доволен его работой, но хотелось бы разобраться с каким-нибудь
>> большим и стабильным инструментом для того, чтобы использовать его в
>> чрезмерно важных задачах.
>>
>>
>>
>>
> Посмотрите на WWW::Mechanize (
> http://search.cpan.org/~jesse/WWW-Mechanize-1.70/).
> Если я ничего не путаю, с его помощью подобные задачи решались просто.
>
> --
> С уважением,
> Евгений Косов.
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>



-- 
С уважением, Денис Федосеев
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20111109/8e937cf2/attachment.html>


Подробная информация о списке рассылки Moscow-pm