estou cansado pra implementar, mas o Web::Scraper é tipo um néctar dos deuses, vc faz um crawler em 5' com ele, bem estilo Perl(que sai da frente e deixa você focar na solução) isso se o HTML não for um monstrengo =)<br clear="all">

<br>[]s,<br><br>Marcio Ferreira<div>@_marcioferreira</div><div>(11) 8567-1482   skype: marcio.ferreir4</div><div><a href="http://marciodesouzaferreira.blogspot.com/" target="_blank">marciodesouzaferreira.blogspot.com</a><br>

</div><br>
<br><br><div class="gmail_quote">2012/10/19 Rafael Prenzier <span dir="ltr"><<a href="mailto:rafaelprenzier@gmail.com" target="_blank">rafaelprenzier@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

WWW::Mechanize ++<div class="HOEnZb"><div class="h5"><br><br><div class="gmail_quote">2012/10/19 Ricardo Filipo <span dir="ltr"><<a href="mailto:ricardo_filipo@yahoo.com.br" target="_blank">ricardo_filipo@yahoo.com.br</a>></span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Eu gosto do HTML::TreeBuilder pois dá uma visão mais organizada do DOM.<br><br>Veja um exemplo de uso:<br><a href="https://github.com/rfilipo/WebService-EBC/blob/master/lib/WebService/EBC/News.pm" target="_blank">https://github.com/rfilipo/WebService-EBC/blob/master/lib/WebService/EBC/News.pm</a><br>


<br> <blockquote style="border-left:2px solid rgb(16,16,255);margin-left:5px;margin-top:5px;padding-left:5px">  <div style="font-family:times new roman,new york,times,serif;font-size:12pt"> <div style="font-family:times new roman,new york,times,serif;font-size:12pt">


 <div dir="ltr"> <font face="Arial"> <hr size="1">  <b><span style="font-weight:bold">De:</span></b> Aureliano Guedes <<a href="mailto:guedes_1000@hotmail.com" target="_blank">guedes_1000@hotmail.com</a>><br> <b><span style="font-weight:bold">Para:</span></b> Rio PM <<a href="mailto:rio-pm@pm.org" target="_blank">rio-pm@pm.org</a>> <br>


 <b><span style="font-weight:bold">Enviadas:</span></b> Sexta-feira, 19 de Outubro de 2012 13:22<br> <b><span style="font-weight:bold">Assunto:</span></b> [Rio-pm] HTML::Parse<br> </font> </div><div><div> <br><div>



<div><div dir="ltr">
Ola monges,<br>tudo bem?<br><br>Qual um bom modulo para buscar string em um HTML?<br>Vocês aconselham o HTML::Parse?<br><br>Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma pagina.<br><br>Um exemplo é esse: <a href="http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/" target="_blank">http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/</a><br>


<br>Os Links estão nesse formato: <br><pre><span><<span>a</span> <span>href</span>="<a rel="nofollow">/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html</a>" <span>title</span>="<a rel="nofollow">Thaeme E Thiago - Ai Que Do</a>"></span><span></span></pre>


<br>O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria pegar apenas o primeiro.<br>Poderia usar regexp mas anteriormente me disseram que não é muito
 elegante parsear HTML na unha.<br><br>Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.<br><br>Att,<br>Aureliano Guedes.<br>                                      </div></div>
</div><br></div></div><div>_______________________________________________<br>Rio-pm mailing list<br><a href="mailto:Rio-pm@pm.org" target="_blank">Rio-pm@pm.org</a><br><a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br>


<br> </div></div> </div> </blockquote>  <br>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org" target="_blank">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br><br clear="all"><div><br></div></div></div><span class="HOEnZb"><font color="#888888">-- <br>

Rafael Prenzier dos Santos | Engenheiro e Perl Monger <br>
<br><div><img src=""> (11) 5209-0847</div><div><div><div><div><br></div><div><a href="http://www.prenzier.com" target="_blank">www.prenzier.com</a><br></div>
<div><br><div><a href="http://gplus.to/prenzier" target="_blank"><img src=""></a> <a href="http://www.facebook.com/rafaelprenzier" target="_blank"><img src=""></a> <a href="http://twitter.com/prenzier/" target="_blank"><img src=""></a> <a href="http://www.orkut.com.br/Main#Profile?uid=13496291347057199080" target="_blank"><img src=""></a> <a href="http://cid-eacb613d80ce8dba.profile.live.com/" target="_blank"><img src=""></a> <a href="http://www.delicious.com/rafaelprenzier/" target="_blank"><img src=""></a> <a href="http://www.google.com/profiles/rafaelprenzier" target="_blank"><img src=""></a> <a href="http://br.linkedin.com/pub/rafael-prenzier-dos-santos/29/6a2/478" target="_blank"><img src=""></a> <a href="http://www.youtube.com/prenzier" target="_blank"><img src=""></a> <a href="http://www.diigo.com/user/prenzier" target="_blank"><img src=""></a> <a href="http://www.shelfari.com/rprenzier/shelf" target="_blank"><img src=""></a> <a href="http://flavors.me/prenzier" target="_blank"><img src=""></a> </div>


<div><a href="http://www.diigo.com/user/prenzier" target="_blank"></a><br><div><br></div></div></div></div></div></div><br>
</font></span><br>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br>