[SP-pm] Curso de verão na FEI

Stanislaw Pusep creaktive at gmail.com
Fri Jan 13 04:40:18 PST 2012


Sendo um pouco pedante: *web crawler* ou *spider* explora a web em
profundidade e tenta recuperar o máximo de informações (exemplo de uso:
Google); BuscaPé/JáCotei/afins empregam *scrapers* que exploram sites
específicos na horizontal e só consideram os dados que seguem um schema
bem-definido.
Acho importante fazer essa distinção :)

ABS()



2012/1/13 Nelson Ferraz <nferraz em gmail.com>

> Do site:
>
> > RESUMO: Como automatizar a navegação web com scripts Perl. Capturar,
> tratar e apresentar
> > informações capturadas na web com Perl. O conteúdo será ministrado por
> uma
> > explicação teórica seguida de exercícios/prática.
>
> Poderia incluir alguma informação prática sobre o que são web
> crawlers. Algo como:
>
> Web crawlers, também conhecidos como "spiders" ou "bots", são
> programas criados para navegar na web automaticamente, coletando
> informações. Este tipo de programa é frequentemente usado em
> ferramentas de busca (como o Google), sites de comparação de preços
> (como o Buscapé, KuantoKusta, e JáCotei), ou qualquer outro sistema
> que precise coletar informações da web.
> =begin disclaimer
>   Sao Paulo Perl Mongers: http://sao-paulo.pm.org/
>  SaoPaulo-pm mailing list: SaoPaulo-pm em pm.org
>  L<http://mail.pm.org/mailman/listinfo/saopaulo-pm>
> =end disclaimer
>
-------------- Pr�xima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120113/d4da148f/attachment.html>


More information about the SaoPaulo-pm mailing list