WWW::Mechanize работает с инстансом Firefox, это как кировцем грядки на даче полоть.<br><br><div class="gmail_quote">9 ноября 2011 г. 13:52 пользователь Evgeniy Kosov <span dir="ltr"><<a href="mailto:evgeniy@kosov.su">evgeniy@kosov.su</a>></span> написал:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="HOEnZb"><div class="h5">On 09.11.2011 13:36, Foxcool wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Заранее извиняюсь, возможно, за тривиальные вопросы, т.к. я из редкого<br>
нынче вида Перл-джуниоров.<br>
Есть интересный модуль Web::Scraper, документацию которого я не нахожу<br>
избыточной, т.к. не могу разобраться, как его "натравливать" на теги.<br>
Есть некая страница, которая полна таблиц, идущих друг за другом, разных<br>
и т.д. Первая проблема, с которой я столкнулся: мне нужны определенные<br>
таблицы. И не с определенным id или class, а с значением другого атрибута.<br>
<br>
<tablewidth="100%"cellspacing="0"cellpadding="3"border="0"><br>
<tablewidth="100%"cellspacing="2"cellpadding="1"><br>
<br>
<br>
Например, cellspacing="2", или cellpadding="1", или даже оба. Как мне<br>
указать это скраперу? Кстати, посоветуете другой инструмент, буду<br>
непротив. С небольшим модулем, который парсит регулярками разобрался<br>
быстро и доволен его работой, но хотелось бы разобраться с каким-нибудь<br>
большим и стабильным инструментом для того, чтобы использовать его в<br>
чрезмерно важных задачах.<br>
<br>
<br>
<br>
</blockquote>
<br></div></div>
Посмотрите на WWW::Mechanize (<a href="http://search.cpan.org/~jesse/WWW-Mechanize-1.70/" target="_blank">http://search.cpan.org/~jesse/WWW-Mechanize-1.70/</a>).<br>
Если я ничего не путаю, с его помощью подобные задачи решались просто.<span class="HOEnZb"><font color="#888888"><br>
<br>
-- <br>
С уважением,<br>
Евгений Косов.</font></span><div class="HOEnZb"><div class="h5"><br>
-- <br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>С уважением, Денис Федосеев<br><br>