[Moscow.pm] Работа с Web::Scraper

Akzhan Abdulin akzhan.abdulin на gmail.com
Ср Ноя 9 03:25:48 PST 2011


Я для этой цели использую Nokogiri или Mechanize, на Ruby.

9 ноября 2011 г. 13:36 пользователь Foxcool <foxcool333 на gmail.com> написал:

> Заранее извиняюсь, возможно, за тривиальные вопросы, т.к. я из редкого
> нынче вида Перл-джуниоров.
> Есть интересный модуль Web::Scraper, документацию которого я не нахожу
> избыточной, т.к. не могу разобраться, как его "натравливать" на теги.
> Есть некая страница, которая полна таблиц, идущих друг за другом, разных и
> т.д. Первая проблема, с которой я столкнулся: мне нужны определенные
> таблицы. И не с определенным id или class, а с значением другого атрибута.
>
> <tablewidth="100%"cellspacing=**"0"cellpadding="3"border="0">
> <tablewidth="100%"cellspacing=**"2"cellpadding="1">
>
>
> Например, cellspacing="2", или cellpadding="1", или даже оба. Как мне
> указать это скраперу? Кстати, посоветуете другой инструмент, буду непротив.
> С небольшим модулем, который парсит регулярками разобрался быстро и доволен
> его работой, но хотелось бы разобраться с каким-нибудь большим и стабильным
> инструментом для того, чтобы использовать его в чрезмерно важных задачах.
>
>
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20111109/ae49cea3/attachment.html>


Подробная информация о списке рассылки Moscow-pm