phantomjs например<br><br><div class="gmail_quote">2012/6/2 Alessandro Gorohovski <span dir="ltr"><<a href="mailto:an.gorohovski@gmail.com" target="_blank">an.gorohovski@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Гнатына Александр <<a href="mailto:gnatyna@ya.ru" target="_blank">gnatyna@ya.ru</a>> писал(а) в своём письме Fri, 01 Jun 2012 23:03:05 +0300:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
wget<br>
<br>
Огласите требования.<br>
</blockquote>
<br>
Требования, вроде бы, не хитрые --- нужно сохранить всю инфу web-страницы в html -файл.<br>
<br>
Обычно, поступал так, например:<br>
<br>
my $url = '<a href="http://www.xn--80aid7bg" target="_blank">http://www.адрес</a>';<br>
<br>
<br>
my $agent = LWP::UserAgent->new;<br>
$agent->agent("Opera");<br>
<br>
my $request = HTTP::Request->new( GET => $url );<br>
$request->header('Accept' => 'text/html');<br>
<br>
open(FILE, ">info.html");<br>
print FILE_S $response->content;<br>
close FILE;<br>
<br>
Но сейчас столкнулся с тем, что для Web-страниц, содержащих JavaScript<br>
все содержимое не могу получить,<br>
т.е. то что вижу в броузере (Opera or others) нет в сохранённом файле.<br>
<br>
Понимаю, что здесь проблема для меня с отработкой JavaScript, которые выполняются в броузере.<br>
<br>
Вопрос в том, есть ли какой Perl-модуль или что-то консольное, выполняющее все что делает броузер<br>
с возможностью сохранения этого результата?<div class="im HOEnZb"><br>
<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
В Птн, 01/06/2012 в 21:58 +0300, Alessandro Gorohovski пишет:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Уважаемое сообщество,<br>
Доброго времени суток!<br>
<br>
Посоветуйте модуль (кому реально приходилось пользоваться)<br>
хорошего Web-spider.<br>
<br>
P.s.<br>
На CPAN смотрел, их бескрайнее множество.<br>
<br>
Спасибо<br>
</blockquote>
<br>
<br>
</blockquote>
<br>
<br>
-- <br></div><span class="HOEnZb"><font color="#888888">
Alessandro</font></span><div class="HOEnZb"><div class="h5"><br>
-- <br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br>