<table cellspacing="0" cellpadding="0" border="0" ><tr><td valign="top" style="font: inherit;">Realmente Tiago, concordo com você. <br>Até comentei mesmo com um amigo que participa do projeto comigo. Chega um ponto, que as regex ficam imensas e que depois só jesus tem paciencia de analisa-las numa possivel manutenção do codigo e nesse caso a gente nem tem a garantia que vai servir pra 100% dos codigos que irao passar por elas. Mais ainda perl é novo pra mim e quando o tempo aperta, a gente acaba fazendo magica mesmo e usando todo recurso que esta disponivel... Mais concordo plenamente você e com alguns que disseram pra ter cuidado usando regex em html. Muito bom !<br>Já estou olhando aqui e achei bem interessante para o meu problema o mojo::dom e agradeço a todos pela ajuda.<br>abraços();<br><br><div><div><div><div align="left"><div><div><div><div><span class="Apple-style-span" style="color:rgb(0, 0,
 255);font-family:arial;font-size:13px;"><strong><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="2"><br></font></strong></span></div><div><span class="Apple-style-span" style="color:rgb(0, 0, 255);font-family:arial;font-size:13px;"><strong><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="2"><br></font></strong></span></div><div><span class="Apple-style-span" style="color:rgb(0, 0, 255);font-family:arial;font-size:13px;"><strong><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="2"><br></font></strong></span></div><div><font class="Apple-style-span" color="#0000ff" face="arial, helvetica, sans-serif" size="2"><b>----------------</b></font></div><font class="Apple-style-span" style="color:rgb(45, 45, 45);font-family:arial;" face="arial, helvetica, sans-serif"><font style="font-size:13px;">Matheus Lucas<br></font></font><span class="Apple-style-span" style="color:rgb(45, 45,
 45);font-family:arial;font-size:small;">Tecnologia em Sistemas para Internet</span></div><div><font class="Apple-style-span" style="color:rgb(45, 45, 45);font-family:arial;" face="arial, helvetica, sans-serif" size="2">Viçosa-MG</font></div><div></div><div style="color:rgb(45, 45, 45);"><font class="Apple-style-span" size="2"><br></font></div></div></div><div style="color:rgb(45, 45, 45);font-family:arial;"><font class="Apple-style-span" face="arial, helvetica, sans-serif" size="2"><i>"Seja livre, use Linux !"</i></font></div></div></div></div></div><br><br>--- Em <b>qua, 3/4/13, Tiago Peczenyj <i><tiago.peczenyj@gmail.com></i></b> escreveu:<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"><br>De: Tiago Peczenyj <tiago.peczenyj@gmail.com><br>Assunto: Re: [Rio-pm] xpath<br>Para: "Perl Mongers Rio de Janeiro" <rio-pm@pm.org><br>Data: Quarta-feira, 3 de Abril de 2013, 13:48<br><br><div
 id="yiv1391535304"><div dir="ltr">IMHO vc pode sim usar regex para parserar html SE<div><br></div><div>1) a estrutura do html for porca (tipo cheio de tag q não fecha ou coisas q não façam muito sentido)</div><div>2) a estrutura (quase) nunca mudar (e vc procura uma string X como "APROVADO" ou "ERRO)</div>

<div>3) vc está desesperado<br><div class="yiv1391535304gmail_extra"><br>Mas para cada ponto que vc pode usar, existem muitos argumentos contra. vc até pode usar como um complemento ao seu parser mas se basear SÓ nisso, como criterio geral, é furada.</div>

<div class="yiv1391535304gmail_extra"><br></div><div class="yiv1391535304gmail_extra"><br></div><div class="yiv1391535304gmail_extra"><div class="yiv1391535304gmail_quote">2013/4/3 Marcio Ferreira <span dir="ltr"><<a rel="nofollow" ymailto="mailto:marciodesouzaferreira@gmail.com" target="_blank" href="/mc/compose?to=marciodesouzaferreira@gmail.com">marciodesouzaferreira@gmail.com</a>></span><br>

<blockquote class="yiv1391535304gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div dir="ltr">Desculpe a pressa em responder, o e-mail anterior, alguns pontos que podem ser tocados:<div><br></div><div>

o Web::Scraper, ~força~ que vc faça a ~configuração~ da sua navegação, assim vc de fato se concentra no seu problema e esquece o resto.</div>


<div>o Mojo::DOM é muito amigavel, ele cria de fato um objeto pra vc navegar no seu DOM, isso é legal!</div><div><br></div><div>NUNCA USE REGEX PRA PARSER DE HTML</div><div><a rel="nofollow" target="_blank" href="http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top">http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top</a><br>




</div><div><br></div><div>Porque nao gosto do HTML::TreeBuilder: vc precisa fazer linha a linha seus "findnodes" e compor seu objeto na mao, frente a soluções como Web::Scraper e Mojo::DOM, acho que ele ficou pra trás. =/</div>




<div class="yiv1391535304gmail_extra"><br></div><div class="yiv1391535304gmail_extra">**Quando digo HTML::TreeBuilder, me refiro ao HTML::TreeBuilder::XPath mesmo =P<div class="yiv1391535304im"><br clear="all"><div><br>[]s,<br><br>Marcio Ferreira<div></div><div>

skype: marcio.ferreir4</div>

<div><a rel="nofollow">(21) 8365-7768</a><br></div></div>
<br><br></div><div class="yiv1391535304gmail_quote">2013/4/3 Nuba Princigalli <span dir="ltr"><<a rel="nofollow" ymailto="mailto:nuba@fastmail.fm" target="_blank" href="/mc/compose?to=nuba@fastmail.fm">nuba@fastmail.fm</a>></span><br><blockquote class="yiv1391535304gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex;">

<div><div class="yiv1391535304h5">


<u></u>




<div><div><div>On Wed, Apr 3, 2013, at 01:17 PM, Marcio Ferreira wrote:<br></div>
<blockquote type="cite"><div dir="ltr"><div>Também há o HTML::TreeBuilder (mas um pouco mais complicado de "gerenciar" o workflow).<br></div>
</div>
</blockquote><div> </div>
</div><div>Já usei e recomendo o <a rel="nofollow" target="_blank" href="https://metacpan.org/module/HTML::TreeBuilder::XPath">https://metacpan.org/module/HTML::TreeBuilder::XPath</a><br></div>
<div> </div>
<div><div>--<br></div>
<div>Nuba R. Princigalli  <a rel="nofollow" ymailto="mailto:nuba@pauleira.com" target="_blank" href="/mc/compose?to=nuba@pauleira.com">nuba@pauleira.com</a>  <a rel="nofollow" target="_blank" href="http://pauleira.com">http://pauleira.com</a>  @nprincigalli<br></div>
<div>Discipline is not an end in itself, just a means to an end. - King Crimson<br></div>
<div> </div>
</div>
</div>

<br></div></div><div class="yiv1391535304im">_______________________________________________<br>
Rio-pm mailing list<br>
<a rel="nofollow" ymailto="mailto:Rio-pm@pm.org" target="_blank" href="/mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a rel="nofollow" target="_blank" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></div></blockquote></div><br></div></div>
<br>_______________________________________________<br>
Rio-pm mailing list<br>
<a rel="nofollow" ymailto="mailto:Rio-pm@pm.org" target="_blank" href="/mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a rel="nofollow" target="_blank" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br><br clear="all"><div><br></div>-- <br>Tiago B. Peczenyj<br>Linux User #405772<br>

<br><a rel="nofollow" target="_blank" href="http://about.me/peczenyj">http://about.me/peczenyj</a>
</div></div></div>
</div><br>-----Anexo incorporado-----<br><br><div class="plainMail">_______________________________________________<br>Rio-pm mailing list<br><a ymailto="mailto:Rio-pm@pm.org" href="/mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br><a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a></div></blockquote></td></tr></table>