[Moscow.pm] Как парсить сайты?

Харпалёв Иван ivan.kharpalev на gmail.com
Пт Янв 3 06:05:28 PST 2014


Это как раз то, что нужно!!! Спасибо!

И вопрос чуть в сторону от Перла, но про то, как можно на коленке сделать
мониторинг веб странички.

Подскажите, как в консоли броузера написать, чтобы по таймеру страница
обновлялась, из неё извлекалось нужное и куда-то?? сохранялось (лучше бы
дописывалось в файл или посылалось по сети)

Идейно кажется, что это не сложно:
обновить, подождать, выбрать элемент, сделать post запрос.
но очень далёк от фронта и ступор.

И по каким материалам вообще такому научиться?



3 января 2014 г., 17:30 пользователь Dmitry Latin <dim0xff на gmail.com>написал:

> > Как быть, если контент формируется динамически в броузере?? (по событиям
> > исполняется js и в результате этого возникают целевые элементы dom)
> >
> >
> > Хотя бы как быть со страницами, которые по onLoad() за некоторое время
> > формируются?
> >
> > А глобальный вопрос в свете этого ----
> > Есть ли броузер с api из Perl?
> > чтобы было можно возбуждать события, читать писать переменные.
> >
> > Спасибо!
> >
>
> http://phantomjs.org + Selenium::Remote::Driver
>
> --
> //wbr, Dmitry Latin
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20140103/9996488d/attachment-0001.html>


Подробная информация о списке рассылки Moscow-pm