Не модуль, но все же: <a href="http://eax.me/web-spider/">http://eax.me/web-spider/</a> + см 10-й пункт <a href="http://eax.me/mini-notes-issue-4/">http://eax.me/mini-notes-issue-4/</a><br><br><div class="gmail_quote">2 июня 2012 г., 14:56 пользователь Александр Фокскул <span dir="ltr"><<a href="mailto:foxcool333@gmail.com" target="_blank">foxcool333@gmail.com</a>></span> написал:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p>Я бы посоветовал сразу силениум. На новые версии браузера часто проблемно найти расширение.<br>
У силениума есть сервер и модуль для перла на CPAN.</p>
<p>02.06.2012 14:09 пользователь "Ali Ramazanov" <<a href="mailto:netspamer@gmail.com" target="_blank">netspamer@gmail.com</a>> написал:</p><div><div class="h5"><br>
><br>
> Как вариант использовать<br>
> <a href="https://metacpan.org/module/WWW::Mechanize::Firefox" target="_blank">https://metacpan.org/module/WWW::Mechanize::Firefox</a> и собственно сам<br>
> firefox с плагином Mozrepl. Решение рабочее, но не производительное.<br>
> Firefox нужно периодически рестартить, из-за отжирания памяти)<br>
><br>
> 2 июня 2012 г., 9:52 пользователь Alessandro Gorohovski<br>
> <<a href="mailto:an.gorohovski@gmail.com" target="_blank">an.gorohovski@gmail.com</a>> написал:<br>
> > Гнатына Александр <<a href="mailto:gnatyna@ya.ru" target="_blank">gnatyna@ya.ru</a>> писал(а) в своём письме Fri, 01 Jun 2012<br>
> > 23:03:05 +0300:<br>
> ><br>
> >> wget<br>
> >><br>
> >> Огласите требования.<br>
> ><br>
> ><br>
> > Требования, вроде бы, не хитрые --- нужно сохранить всю инфу web-страницы в<br>
> > html -файл.<br>
> ><br>
> > Обычно, поступал так, например:<br>
> ><br>
> > my $url = '<a href="http://www.xn--80aid7bg" target="_blank">http://www.адрес</a>';<br>
> ><br>
> ><br>
> > my $agent = LWP::UserAgent->new;<br>
> > $agent->agent("Opera");<br>
> ><br>
> > my $request = HTTP::Request->new( GET => $url );<br>
> > $request->header('Accept' => 'text/html');<br>
> ><br>
> > open(FILE, ">info.html");<br>
> > print FILE_S $response->content;<br>
> > close FILE;<br>
> ><br>
> > Но сейчас столкнулся с тем, что для Web-страниц, содержащих JavaScript<br>
> > все содержимое не могу получить,<br>
> > т.е. то что вижу в броузере (Opera or others) нет в сохранённом файле.<br>
> ><br>
> > Понимаю, что здесь проблема для меня с отработкой JavaScript, которые<br>
> > выполняются в броузере.<br>
> ><br>
> > Вопрос в том, есть ли какой Perl-модуль или что-то консольное, выполняющее<br>
> > все что делает броузер<br>
> > с возможностью сохранения этого результата?<br>
> ><br>
> ><br>
> ><br>
> >> В Птн, 01/06/2012 в 21:58 +0300, Alessandro Gorohovski пишет:<br>
> >>><br>
> >>> Уважаемое сообщество,<br>
> >>> Доброго времени суток!<br>
> >>><br>
> >>> Посоветуйте модуль (кому реально приходилось пользоваться)<br>
> >>> хорошего Web-spider.<br>
> >>><br>
> >>> P.s.<br>
> >>> На CPAN смотрел, их бескрайнее множество.<br>
> >>><br>
> >>> Спасибо<br>
> >><br>
> >><br>
> >><br>
> ><br>
> ><br>
> > --<br>
> > Alessandro<br>
> ><br>
> > --<br>
> > Moscow.pm mailing list<br>
> > <a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
> --<br>
> Moscow.pm mailing list<br>
> <a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div>
<br>--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>С уважением, Александр<br>Личный блог: <a href="http://eax.me/" target="_blank">http://eax.me/</a><br>Мой форум: <a href="http://it-talk.org/" target="_blank">http://it-talk.org/</a><br>
Мой Twitter: <a href="http://twitter.com/afiskon" target="_blank">http://twitter.com/afiskon</a><br><br>