Só uma observação: Scrapy, além de processar a árvore HTML, também gerencia a fila de downloads, extração de links, validação de robots.txt... Enfim, é um framework completo.<div>No CPAN tem <a href="https://metacpan.org/module/Scrappy">https://metacpan.org/module/Scrappy</a>; mas, pelos meus testes, é lento demais (para as minhas necessidades). Aliás, reza a lenda que ele usa Parallel::ForkManager, o que, infelizmente, não é verdade (é uma dependência morta :(<br clear="all">

<br>ABS()<br><br>
<div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Apr 24, 2012 at 12:12, Daniel de Oliveira Mantovani <span dir="ltr"><<a href="mailto:daniel.oliveira.mantovani@gmail.com" target="_blank">daniel.oliveira.mantovani@gmail.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Bom dia,<br>
<br>
Achei um framework para Web Crawling muito interessante escrito em Python,<br>
<a href="http://doc.scrapy.org/en/latest/intro/tutorial.html" target="_blank">http://doc.scrapy.org/en/latest/intro/tutorial.html</a><br>
<br>
Sim, 'e claro que exsite uma solucao muito bem implementada em Perl,<br>
estavel e testada:<br>
<a href="https://metacpan.org/module/Web::Scraper" target="_blank">https://metacpan.org/module/Web::Scraper</a><br>
O meu ponto 'e simples, eu estava lendo a minha cota de artigos<br>
aleatorios do dia quando encontrei-o em um blog desconhecido:<br>
<a href="http://isbullsh.it/2012/04/Web-crawling-with-scrapy/" target="_blank">http://isbullsh.it/2012/04/Web-crawling-with-scrapy/</a><br>
<br>
Eu sei que existem centenas de milhares de artigos sobre coisas em Perl,<br>
<a href="https://www.google.com.br/search?sourceid=chrome&ie=UTF-8&q=perl+blogs" target="_blank">https://www.google.com.br/search?sourceid=chrome&ie=UTF-8&q=perl+blogs</a><br>
<br>
E um artigo muito melhor sobre Web::Scraper,<br>
<a href="http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/" target="_blank">http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/</a><br>
<br>
Conclusao, se existe algo bom implementado em outra linguagem procure no CPAN.<br>
<span><font color="#888888"><br>
<br>
--<br>
"If you’ve never written anything thoughtful, then you’ve never had<br>
any difficult, important, or interesting thoughts. That’s the secret:<br>
people who don’t write, are people who don’t think."<br>
=begin disclaimer<br>
   Sao Paulo Perl Mongers: <a href="http://sao-paulo.pm.org/" target="_blank">http://sao-paulo.pm.org/</a><br>
 SaoPaulo-pm mailing list: <a href="mailto:SaoPaulo-pm@pm.org" target="_blank">SaoPaulo-pm@pm.org</a><br>
 L<<a href="http://mail.pm.org/mailman/listinfo/saopaulo-pm" target="_blank">http://mail.pm.org/mailman/listinfo/saopaulo-pm</a>><br>
=end disclaimer<br>
</font></span></blockquote></div><br></div>
</div>