[Moscow.pm] HTML-Parser: модификация

pavel brosku на mail.ru
Вс Май 17 18:16:37 PDT 2009


> Message: 1
> Date: Sat, 16 May 2009 14:35:45 +0400
> From: "Dmitry E. Oboukhov" <unera на debian.org>
> Subject: [Moscow.pm] HTML-Parser: модификация
> To: moscow-pm на pm.org
> Message-ID: <20090516103545.GO24918 на work.uvw.ru>
> Content-Type: text/plain; charset="utf-8"
>
> нужно примерно следующее:
>
> чтобы имея на входе html, пропустить через парсер, получить набор
> объектов (а-ля DOM), покрутить их свойствами (скажем hidden кому-то
> поставить итп), а затем на выход выдать опять же html
>
> никто не знает модули на эту тему есть?

Мне кажется есть смысл посмотреть в сторону HTML::TokeParser
Полученный HTML он разбирает в хэш, при этом раскладывает по атрибутам и т.п.,
поэтому можно модифицируя этот хэш на выходе получить требуемый html. 
Хотя TokeParser, по-моему надстройка над Parser, хотя 100% точно не скажу.




Подробная информация о списке рассылки Moscow-pm