<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Nao use regular expression para tratar texto irregulares, portanto leia:<div><a href="http://sao-paulo.pm.org/artigo/2010/utilizandoxpathparacriarwebspiders">http://sao-paulo.pm.org/artigo/2010/utilizandoxpathparacriarwebspiders</a></div><div><br></div><div><br></div><div><br><div apple-content-edited="true">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">-- <br>Software Engineer<br>Just Another Perl Hacker<br>Daniel Mantovani +5511 8538-9897<br>XOXO</div></span></div>
</div>
<br><div><div>On Feb 7, 2012, at 6:00 PM, Cleysinho wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Olá pessoal,<br><br><br clear="all">Estou com um desafio intessante que esta me custando algumas horas da minha madrugada. Estou usando expressão regular para extrair resultado de uma página (usando www::mechanize), o módulo esta até elegante, mas a dinâmica dos resultados da página faz com que a expressão regular fure em algum momento da análise. Devido essa dinâmica entendi que seria mais "simples" transformar a página html em xml, o delicioso de tudo isso é que não faço idéia de como fazer inicialmente. Se alguém souber como posso fazer, poderia me dar alguma dica ou sugerir algum módulo  se não lhes custar o tempo.<br>
<br>A página<br><a href="http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669">http://www.genome.jp/dbget-bin/www_bget?pte:PTT_17669</a><br><br>Abraços,<br><br>-- <br><div style="font-family:'Lucida Grande',Geneva,Verdana,Arial,Helvetica,sans-serif;line-height:21px">
<span style="font-family:arial;line-height:normal"><span style="font-family:sans-serif;line-height:19px"><b></b></span></span></div><div style="font-family:tahoma,sans-serif;line-height:21px"><div>
<span style="font-size:13px;line-height:21px"><div><span style="font-size:13px;line-height:21px">.: Inteligência Coletiva :.</span></div>Uma
 inteligência distribuída por toda parte: tal é o nosso axioma inicial. 
Ninguém sabe tudo, todos sabem alguma coisa, todo o saber está na 
humanidade’. (</span><span style="font-size:13px;line-height:21px">Pierre Lévy)</span>
</div></div><div><a style="font-family:tahoma,sans-serif" href="http://www.cleysinho.blogspot.com/" target="_blank">www.cleysinho.blogspot.com</a><br><a href="http://www.bioinfopop.ufv.br/" target="_blank">www.bioinfopop.ufv.br</a><br>
<span style="font-family:tahoma,sans-serif"></span></div><div style="display:inline"></div><br>
_______________________________________________<br>Rio-pm mailing list<br><a href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a><br>http://mail.pm.org/mailman/listinfo/rio-pm</blockquote></div><br></div></body></html>