[Moscow.pm] сохранение веб-страницы в виде текста со ссылками (примерно как lynx)

Dmitry Arsentiev dmarsentev на gmail.com
Пн Май 14 06:19:50 PDT 2012


Здравствуйте.
Не знает ли кто-нибудь библиотек, модулей, не обязательно перловых,
которые бы позволяли сохранять веб-страницы в том виде,
в котором их показывает терминальный браузер?
Т.е. в виде текста и ссылок.

Т.е. библиотека должна работать как вот этот сайт, имитирующий lynx.
http://www.delorie.com/web/lynxview.html
Как будто открыл браузер, сделал CTRL+A плюс ссылки,
а потом сделал CTRL+V в текстовый файл.

Тут возникает сразу вопрос про js.
Для упрощения задачи можно считать, что контент,
который генерится js-ом, мы игнорируем.
Спасибо.


Подробная информация о списке рассылки Moscow-pm