[Rio-pm] Como traduzir uma página HTML para XML

Cleysinho cleysinhonv em gmail.com
Terça Fevereiro 7 12:17:44 PST 2012


Ótimo esta duas referências me nortearão para entender as necessidades. Vou
ler e em sequida houvendo dúvidas eu volto a perguntar.
Obrigado!

2012/2/7 Daniel Mantovani <daniel.oliveira.mantovani em gmail.com>

> Eu tenho exemplos de como utilizar XPath no meu github,
>
> https://github.com/mantovani/WWW-Orkut-API-Search/blob/master/lib/WWW/Orkut/API/Search.pm
> Acho que vai te ajudar bastante, qualquer duvida pergunte.
>
> Aqui vai a documentacao do modulo,
> https://metacpan.org/module/HTML::TreeBuilder::XPath
>
> []'s
>
> --
> Software Engineer
> Just Another Perl Hacker
> Daniel Mantovani +5511 8538-9897
> XOXO
>
> On Feb 7, 2012, at 6:09 PM, Cleysinho wrote:
>
> Estou lendo chefe.
>
> 2012/2/7 Daniel Mantovani <daniel.oliveira.mantovani em gmail.com>
>
>> Nao use regular expression para tratar texto irregulares, portanto leia:
>> http://sao-paulo.pm.org/artigo/2010/utilizandoxpathparacriarwebspiders
>>
>>
>>
>>  --
>> Software Engineer
>> Just Another Perl Hacker
>> Daniel Mantovani +5511 8538-9897
>> XOXO
>>
>> On Feb 7, 2012, at 6:00 PM, Cleysinho wrote:
>>
>> Olá pessoal,
>>
>>
>> Estou com um desafio intessante que esta me custando algumas horas da
>> minha madrugada. Estou usando expressão regular para extrair resultado de
>> uma página (usando www::mechanize), o módulo esta até elegante, mas a
>> dinâmica dos resultados da página faz com que a expressão regular fure em
>> algum momento da análise. Devido essa dinâmica entendi que seria mais
>> "simples" transformar a página html em xml, o delicioso de tudo isso é que
>> não faço idéia de como fazer inicialmente. Se alguém souber como posso
>> fazer, poderia me dar alguma dica ou sugerir algum módulo  se não lhes
>> custar o tempo.
>>
>> A página
>> http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669
>>
>> Abraços,
>>
>> --
>> **
>> .: Inteligência Coletiva :.
>> Uma inteligência distribuída por toda parte: tal é o nosso axioma
>> inicial. Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na
>> humanidade’. (Pierre Lévy)
>> www.cleysinho.blogspot.com
>> www.bioinfopop.ufv.br
>>
>> _______________________________________________
>> Rio-pm mailing list
>> Rio-pm em pm.org
>> http://mail.pm.org/mailman/listinfo/rio-pm
>>
>>
>>
>> _______________________________________________
>> Rio-pm mailing list
>> Rio-pm em pm.org
>> http://mail.pm.org/mailman/listinfo/rio-pm
>>
>
>
>
> --
> **
> .: Inteligência Coletiva :.
> Uma inteligência distribuída por toda parte: tal é o nosso axioma inicial.
> Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na
> humanidade’. (Pierre Lévy)
> www.cleysinho.blogspot.com
> www.bioinfopop.ufv.br
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>



-- 
**
.: Inteligência Coletiva :.
Uma inteligência distribuída por toda parte: tal é o nosso axioma inicial.
Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na
humanidade’. (Pierre Lévy)
www.cleysinho.blogspot.com
www.bioinfopop.ufv.br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20120207/3dca536b/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm