[Rio-pm] xpath

Andre Carneiro andregarciacarneiro em gmail.com
Quarta Abril 3 09:39:19 PDT 2013


Matheus


Se você for usar para parsear HTML, você pode tentar o
HTML::TreeBuilder::XPath, ou mesmo o WWW::Scraper. Ambos são excelentes! O
WWW::Scraper tem conceitos bem diferentes do HTML::TreeBuilder::XPath. Eu
recomendo que você veja os dois!

Esse assunto é bem recorrente por aqui. Se quiser, você pode entrar no site
oficial do São Paulo Perl Mongers. Se não me falhe a memória, tem tutoriais
abordando esse problema com os dois módulos que eu mencionei. O site é esse
aqui: http://sao-paulo.pm/artigos

O artigo que eu escrevi sobre isso é esse aqui:
http://sao-paulo.pm.org/artigo/2010/utilizandoxpathparacriarwebspiders

O outro eu não achei. Kd o artigo de scrapping com WWW::Scraper, pessoal?



Cheers!


2013/4/3 Matheus Lucas <malsi2 em yahoo.com.br>

> Ola amigos !
> Esbarrei em um problema com algumas regex aqui em arquivos html e me deram
> a ideia de usar xpath para resolver. Eu nunca trabalhei com xpath e achei
> muitos modulos na cpan.
> Gostaria de saber se alguem ja trabalhou com algum modulo de xpath pra
> perl e gostaria de receber opniões que modulo é interessante, mais rapido
> de aprender e tals ? Ja vi que tem varios, mais ainda não sei qual é o
> melhor para o problema e continuo a estudar. Gradeço se alguem puder me
> orientar nisso.
> Agradeço a todos !
>
> *
> *
> *
> *
> *
> *
> *----------------*
> Matheus Lucas
> Tecnologia em Sistemas para Internet
> Viçosa-MG
>
> *"Seja livre, use Linux !"*
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>



-- 
André Garcia Carneiro
Software Engineer
(11)982907780
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20130403/8ee3c95c/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm