[Rio-pm] Como traduzir uma página HTML para XML

Wagner Arbex arbex em arbex.pro.br
Terça Fevereiro 7 16:01:40 PST 2012


Olá, Cleydson;

Vc tem quer ler essa página do KEGG ou vc consegue essas infs da proteína no NCBI? Minha pergunta é pq vc tem serviços - muitos, por sinal - disponibilizados pelo NCBI que são facilmente acessados em Perl e que te retornam "todas" as infs que vc precisa.  Amanhã posso te passar mais dicas. 

Salvo engano, uma outra opção, como vc deve saber, é usar BioPerl. Esse "treco" não é tão feio como parece :)

[]s e até mais. 
--
   Wagner Arbex, DSc
   Bioinformatics, Modeling and Simulation
   http://www.arbex.pro.br/

   Sent from my iPad

On 07/02/2012, at 18:00, Cleysinho <cleysinhonv em gmail.com> wrote:

> Olá pessoal,
> 
> 
> Estou com um desafio intessante que esta me custando algumas horas da minha madrugada. Estou usando expressão regular para extrair resultado de uma página (usando www::mechanize), o módulo esta até elegante, mas a dinâmica dos resultados da página faz com que a expressão regular fure em algum momento da análise. Devido essa dinâmica entendi que seria mais "simples" transformar a página html em xml, o delicioso de tudo isso é que não faço idéia de como fazer inicialmente. Se alguém souber como posso fazer, poderia me dar alguma dica ou sugerir algum módulo  se não lhes custar o tempo.
> 
> A página
> http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669
> 
> Abraços,
> 
> -- 
> .: Inteligência Coletiva :.
> Uma inteligência distribuída por toda parte: tal é o nosso axioma inicial. Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na humanidade’. (Pierre Lévy)
> www.cleysinho.blogspot.com
> www.bioinfopop.ufv.br
> 
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20120207/41173ee7/attachment-0001.html>


Mais detalhes sobre a lista de discussão Rio-pm