<div>PhantomJS + Selenium::Remote::Driver<span></span></div><div><br></div><a href="http://blogs.perl.org/users/robhammond/2013/02/web-scraping-with-perl-phantomjs.html">http://blogs.perl.org/users/robhammond/2013/02/web-scraping-with-perl-phantomjs.html</a><div>
<a href="https://metacpan.org/module/Selenium::Remote::Driver">https://metacpan.org/module/Selenium::Remote::Driver</a><br><br>понедельник, 7 октября 2013 г. пользователь Евгений Заварыкин  писал:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">Тут отлично подойдет phantomjs ( <a href="http://phantomjs.org/" target="_blank">http://phantomjs.org/</a> ). На perl можно сделать обертку под него.<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">
7 октября 2013 г., 8:19 пользователь Dmitry L. <span dir="ltr"><<a href="javascript:_e({}, 'cvml', 'dim0xff@gmail.com');" target="_blank">dim0xff@gmail.com</a>></span> написал:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">+1 к WWW::Mechanize::Firefox. Или какой-нибудь WebDriver.<br>
<br>
А искать я бы стал средствами js в самом браузере (и менять DOM как<br>
вздумается, например как предложил Сергей - обернуть нужный кусок в<br>
span), а потом просто сделать скриншот.<br>
<br>
2013/10/7 Nikolay Mishin <<a href="javascript:_e({}, 'cvml', 'mi@ya.ru');" target="_blank">mi@ya.ru</a>>:<br>
<div><div>> я бы попробовал<br>
> use WWW::Mechanize::Firefox;<br>
> он умеет скриншоты делать<br>
> <a href="https://github.com/gitpan/WWW-Mechanize-Firefox/blob/master/eg/screenshot.pl" target="_blank">https://github.com/gitpan/WWW-Mechanize-Firefox/blob/master/eg/screenshot.pl</a><br>
> потом<br>
> use GD;<br>
> <a href="https://metacpan.org/module/GD" target="_blank">https://metacpan.org/module/GD</a><br>
> в общем, думаю, задача вполне решаема, вот только вопрос в производительности<br>
><br>
> можете поконкретнее сказать что искать на странице и как это должно выглядеть в итоге?<br>
> 07.10.2013, 00:24, "Dmitry Eremeev" <<a href="javascript:_e({}, 'cvml', 'dmitry@eremeev.ru');" target="_blank">dmitry@eremeev.ru</a>>:<br>
>> Коллеги, здравствуйте!<br>
>><br>
>> Есть такая задача: на входе url некой страницы и сигнатуры (куски текста или строки из html-кода). Нужно туда сходить вебкитом, или еще чем, срендерить и вернуть png-скриншот шириной 1024px (высота не ограничена). На полученной картинке нужно пометить место с найденной сигнатурой (наложить картинку с галкой, например).<br>



>><br>
>> Ситуация усложняется тем, что искать нужно не только текст, но и куски html-кода и в этом случае помечать на картинке места, в которых примерно находится код. То есть, например, если в сигнатуре будет <img src, то нужно будет указать на странице-скриншоте место с этой самой картинкой.<br>



>><br>
>> В общем, надо отрендерить страницу как бы в браузере шириной 1024 и правильно показать-отметить на ней то, что находится по строчным сигнатурам в html-исходнике.<br>
>><br>
>> Это решаемо силами перла? Кто-то может взяться это слабать за разумные бабки? Нужно в виде подключаемой либы, что надо из сипана на тачку поставим.<br>
>><br>
>> Перл относительно критичен тем, что данный модуль будет заинтегрирован в уже работающий внутренний продукт конторы, а продукту 100 лет и он на древнем пятом портяночном перле.<br>
>><br>
>> Yours,<br>
>> Dmitry Eremeev<br>
>> <a href="tel:%2B7%20906%207005771" value="+79067005771" target="_blank">+7 906 7005771</a><br>
>> --<br>
>> Moscow.pm mailing list<br>
>> <a href="javascript:_e({}, 'cvml', 'moscow-pm@pm.org');" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
><br>
> --<br>
> С уважением<br>
> Николай Мишин<br>
><br>
> --<br>
> Moscow.pm mailing list<br>
> <a href="javascript:_e({}, 'cvml', 'moscow-pm@pm.org');" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
<br>
<br>
<br>
</div></div><span><font color="#888888">--<br>
//wbr, Dmitry L.<br>
</font></span><div><div>--<br>
Moscow.pm mailing list<br>
<a href="javascript:_e({}, 'cvml', 'moscow-pm@pm.org');" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br></div>
</blockquote></div>