[Cascavel-pm] (sem assunto)
Joenio Marques
joenio em gmail.com
Segunda Agosto 1 09:59:05 PDT 2005
Olá Guilherme,
Tenho trabalhado com isso ultimamente (spider) e até o momento tenho
usado principalmente o LWP aliado as expresoes regulares.
As vezes pesquiso outras maneiras de fazer isso para ter metodos
alternativos. Como por exemplo fazer um parser no HTML utilizando
HTML::TreeBuilder ao inves de utilizar apenas regex. Mas as regex
sempre sao utilizadas, mesmo sendo numa pequena proporcao.
Eu tambem nao conheco muitas fontes sobre o assunto. recentemente
encontrei um ebook da OReilly chamado Spidering Hacks que traz muitas
dicas sobre o assunto.
Utilizo Perl da ActiveState sob windows para essas tarefas. Mas as
vezes fico meio limitado por nao encontrar alguns modulos
interessantes no repositorio da ActiveState.
Sds,
Joenio Marques
Em 29/07/05, Guilherme Oliveira<guilherme em itcon.com.br> escreveu:
>
>
> Boa tarde amigos Monges.
>
> Depois demais de um ano estou com tempo para retomar um antigo projeto meu e
> gostaria da ajuda de vocês.
> Gostaria que alguém qu pudesse me dizer em que link encontro material sobre
> a criação de webcrawler´s/spyder para web.
> Se o Módulo PWL é o mais indicado ou existe um outro melhor para a terefa.
> e segundo eu consigo ter todas as funionalidades do perl com activeperl for
> Windows ou pelo menos consigo desenvolver este projeto no windows ou vou ter
> que usar linux apra empreitada.
> De antemão já avradeço a todos.
> um forte abraço aos monges.
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
>
>
Mais detalhes sobre a lista de discussão Cascavel-pm