[Rio-pm] Como traduzir uma página HTML para XML

Cleysinho cleysinhonv em gmail.com
Terça Fevereiro 7 12:00:22 PST 2012


Olá pessoal,


Estou com um desafio intessante que esta me custando algumas horas da minha
madrugada. Estou usando expressão regular para extrair resultado de uma
página (usando www::mechanize), o módulo esta até elegante, mas a dinâmica
dos resultados da página faz com que a expressão regular fure em algum
momento da análise. Devido essa dinâmica entendi que seria mais "simples"
transformar a página html em xml, o delicioso de tudo isso é que não faço
idéia de como fazer inicialmente. Se alguém souber como posso fazer,
poderia me dar alguma dica ou sugerir algum módulo  se não lhes custar o
tempo.

A página
http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669

Abraços,

-- 
**
.: Inteligência Coletiva :.
Uma inteligência distribuída por toda parte: tal é o nosso axioma inicial.
Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na
humanidade’. (Pierre Lévy)
www.cleysinho.blogspot.com
www.bioinfopop.ufv.br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20120207/367541d0/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm