[Moscow.pm] Глупый вопрос

Stanislaw Pusep creaktive на gmail.com
Вс Окт 6 23:47:50 PDT 2013


PhantomJS + Selenium::Remote::Driver

http://blogs.perl.org/users/robhammond/2013/02/web-scraping-with-perl-phantomjs.html
https://metacpan.org/module/Selenium::Remote::Driver

понедельник, 7 октября 2013 г. пользователь Евгений Заварыкин писал:

> Тут отлично подойдет phantomjs ( http://phantomjs.org/ ). На perl можно
> сделать обертку под него.
>
>
> 7 октября 2013 г., 8:19 пользователь Dmitry L. <dim0xff на gmail.com<javascript:_e({}, 'cvml', 'dim0xff на gmail.com');>
> > написал:
>
>> +1 к WWW::Mechanize::Firefox. Или какой-нибудь WebDriver.
>>
>> А искать я бы стал средствами js в самом браузере (и менять DOM как
>> вздумается, например как предложил Сергей - обернуть нужный кусок в
>> span), а потом просто сделать скриншот.
>>
>> 2013/10/7 Nikolay Mishin <mi на ya.ru <javascript:_e({}, 'cvml',
>> 'mi на ya.ru');>>:
>> > я бы попробовал
>> > use WWW::Mechanize::Firefox;
>> > он умеет скриншоты делать
>> >
>> https://github.com/gitpan/WWW-Mechanize-Firefox/blob/master/eg/screenshot.pl
>> > потом
>> > use GD;
>> > https://metacpan.org/module/GD
>> > в общем, думаю, задача вполне решаема, вот только вопрос в
>> производительности
>> >
>> > можете поконкретнее сказать что искать на странице и как это должно
>> выглядеть в итоге?
>> > 07.10.2013, 00:24, "Dmitry Eremeev" <dmitry на eremeev.ru<javascript:_e({}, 'cvml', 'dmitry на eremeev.ru');>
>> >:
>> >> Коллеги, здравствуйте!
>> >>
>> >> Есть такая задача: на входе url некой страницы и сигнатуры (куски
>> текста или строки из html-кода). Нужно туда сходить вебкитом, или еще чем,
>> срендерить и вернуть png-скриншот шириной 1024px (высота не ограничена). На
>> полученной картинке нужно пометить место с найденной сигнатурой (наложить
>> картинку с галкой, например).
>> >>
>> >> Ситуация усложняется тем, что искать нужно не только текст, но и куски
>> html-кода и в этом случае помечать на картинке места, в которых примерно
>> находится код. То есть, например, если в сигнатуре будет <img src, то нужно
>> будет указать на странице-скриншоте место с этой самой картинкой.
>> >>
>> >> В общем, надо отрендерить страницу как бы в браузере шириной 1024 и
>> правильно показать-отметить на ней то, что находится по строчным сигнатурам
>> в html-исходнике.
>> >>
>> >> Это решаемо силами перла? Кто-то может взяться это слабать за разумные
>> бабки? Нужно в виде подключаемой либы, что надо из сипана на тачку поставим.
>> >>
>> >> Перл относительно критичен тем, что данный модуль будет заинтегрирован
>> в уже работающий внутренний продукт конторы, а продукту 100 лет и он на
>> древнем пятом портяночном перле.
>> >>
>> >> Yours,
>> >> Dmitry Eremeev
>> >> +7 906 7005771
>> >> --
>> >> Moscow.pm mailing list
>> >> moscow-pm на pm.org <javascript:_e({}, 'cvml', 'moscow-pm на pm.org');> |
>> http://moscow.pm.org
>> >
>> > --
>> > С уважением
>> > Николай Мишин
>> >
>> > --
>> > Moscow.pm mailing list
>> > moscow-pm на pm.org <javascript:_e({}, 'cvml', 'moscow-pm на pm.org');> |
>> http://moscow.pm.org
>>
>>
>>
>> --
>> //wbr, Dmitry L.
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org <javascript:_e({}, 'cvml', 'moscow-pm на pm.org');> |
>> http://moscow.pm.org
>>
>
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20131007/c8f2ee34/attachment-0001.html>


Подробная информация о списке рассылки Moscow-pm