[Rio-pm] HTML::Parse

Aureliano Guedes guedes_1000 em hotmail.com
Sexta Outubro 19 19:11:54 PDT 2012


Parece interessante mesmo, mas dificil de entender, principalmente quando é alguem que como eu não sabe nada de HTML.
Realmente não entendi como faria tudo isso com o Web::Scraper.

From: marciodesouzaferreira em gmail.com
Date: Fri, 19 Oct 2012 21:14:53 -0300
To: rio-pm em pm.org
Subject: Re: [Rio-pm] HTML::Parse

estou cansado pra implementar, mas o Web::Scraper é tipo um néctar dos deuses, vc faz um crawler em 5' com ele, bem estilo Perl(que sai da frente e deixa você focar na solução) isso se o HTML não for um monstrengo =)


[]s,

Marcio Ferreira em _marcioferreira(11) 8567-1482   skype: marcio.ferreir4marciodesouzaferreira.blogspot.com






2012/10/19 Rafael Prenzier <rafaelprenzier em gmail.com>


WWW::Mechanize ++

2012/10/19 Ricardo Filipo <ricardo_filipo em yahoo.com.br>



Eu gosto do HTML::TreeBuilder pois dá uma visão mais organizada do DOM.

Veja um exemplo de uso:
https://github.com/rfilipo/WebService-EBC/blob/master/lib/WebService/EBC/News.pm




    


     De: Aureliano Guedes <guedes_1000 em hotmail.com>
 Para: Rio PM <rio-pm em pm.org> 



 Enviadas: Sexta-feira, 19 de Outubro de 2012 13:22
 Assunto: [Rio-pm] HTML::Parse
   





Ola monges,
tudo bem?

Qual um bom modulo para buscar string em um HTML?
Vocês aconselham o HTML::Parse?

Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma pagina.

Um exemplo é esse: http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/




Os Links estão nesse formato: 
<a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" title="Thaeme E Thiago - Ai Que Do">



O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria pegar apenas o primeiro.
Poderia usar regexp mas anteriormente me disseram que não é muito
 elegante parsear HTML na unha.

Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.

Att,
Aureliano Guedes.
 		 	   		  

_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm




     
_______________________________________________

Rio-pm mailing list

Rio-pm em pm.org

http://mail.pm.org/mailman/listinfo/rio-pm


-- 


Rafael Prenzier dos Santos | Engenheiro e Perl Monger 


 (11) 5209-0847
www.prenzier.com


            







_______________________________________________

Rio-pm mailing list

Rio-pm em pm.org

http://mail.pm.org/mailman/listinfo/rio-pm



_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm 		 	   		  
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20121020/2907a6df/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm