[Rio-pm] Como traduzir uma página HTML para XML

Stanislaw Pusep creaktive em gmail.com
Terça Fevereiro 7 12:34:24 PST 2012


Tutoriais sobre XPath:
http://sao-paulo.pm.org/equinocio/2010/set/3
http://zvon.org/comp/r/tut-XPath_1.html

Por outro lado, talvez você já esteja familiarizado com os seletores CSS.
Mesmo que não, vale a pena conferir esse módulo, que aceita tanto seletor
CSS quanto XPath:
https://metacpan.org/module/Web::Scraper

ABS()



2012/2/7 Cleysinho <cleysinhonv em gmail.com>

> Olá pessoal,
>
>
> Estou com um desafio intessante que esta me custando algumas horas da
> minha madrugada. Estou usando expressão regular para extrair resultado de
> uma página (usando www::mechanize), o módulo esta até elegante, mas a
> dinâmica dos resultados da página faz com que a expressão regular fure em
> algum momento da análise. Devido essa dinâmica entendi que seria mais
> "simples" transformar a página html em xml, o delicioso de tudo isso é que
> não faço idéia de como fazer inicialmente. Se alguém souber como posso
> fazer, poderia me dar alguma dica ou sugerir algum módulo  se não lhes
> custar o tempo.
>
> A página
> http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669
>
> Abraços,
>
> --
> **
> .: Inteligência Coletiva :.
> Uma inteligência distribuída por toda parte: tal é o nosso axioma inicial.
> Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na
> humanidade’. (Pierre Lévy)
> www.cleysinho.blogspot.com
> www.bioinfopop.ufv.br
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20120207/cbc0e815/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm