[Moscow.pm] сохранение веб-страницы в виде текста со ссылками (примерно как lynx)

iSage isage на aumi.ru
Пн Май 14 06:27:29 PDT 2012


Ну так links -dump http://ya.ru > myfile.txt
Нэ?

On Mon, 14 May 2012 17:19:50 +0400, Dmitry Arsentiev
<dmarsentev на gmail.com> wrote:
> Здравствуйте.
> Не знает ли кто-нибудь библиотек, модулей, не обязательно перловых,
> которые бы позволяли сохранять веб-страницы в том виде,
> в котором их показывает терминальный браузер?
> Т.е. в виде текста и ссылок.
> 
> Т.е. библиотека должна работать как вот этот сайт, имитирующий lynx.
> http://www.delorie.com/web/lynxview.html
> Как будто открыл браузер, сделал CTRL+A плюс ссылки,
> а потом сделал CTRL+V в текстовый файл.
> 
> Тут возникает сразу вопрос про js.
> Для упрощения задачи можно считать, что контент,
> который генерится js-ом, мы игнорируем.
> Спасибо.



Подробная информация о списке рассылки Moscow-pm