[Cascavel-pm] (sem assunto)

Joenio Marques joenio em gmail.com
Segunda Agosto 1 09:59:05 PDT 2005


Olá Guilherme,

Tenho trabalhado com isso ultimamente (spider) e até o momento tenho
usado principalmente o LWP aliado as expresoes regulares.
As vezes pesquiso outras maneiras de fazer isso para ter metodos
alternativos. Como por exemplo fazer um parser no HTML utilizando
HTML::TreeBuilder ao inves de utilizar apenas regex. Mas as regex
sempre sao utilizadas, mesmo sendo numa pequena proporcao.
Eu tambem nao conheco muitas fontes sobre o assunto. recentemente
encontrei um ebook da OReilly chamado Spidering Hacks que traz muitas
dicas sobre o assunto.
Utilizo Perl da ActiveState sob windows para essas tarefas. Mas as
vezes fico meio limitado por nao encontrar alguns modulos
interessantes no repositorio da ActiveState.

Sds,
Joenio Marques

Em 29/07/05, Guilherme Oliveira<guilherme em itcon.com.br> escreveu:
>  
>  
> Boa tarde amigos Monges. 
>   
> Depois demais de um ano estou com tempo para retomar um antigo projeto meu e
> gostaria da ajuda de vocês. 
> Gostaria que alguém qu pudesse me dizer em que link encontro material sobre
> a criação de webcrawler´s/spyder para web. 
> Se o Módulo PWL é o mais indicado ou existe um outro melhor para a terefa. 
> e segundo eu consigo ter todas as funionalidades do perl com activeperl for
> Windows ou pelo menos consigo desenvolver este projeto no windows ou vou ter
> que usar linux apra empreitada. 
> De antemão já avradeço a todos. 
> um forte abraço aos monges. 
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
> 
>


Mais detalhes sobre a lista de discussão Cascavel-pm