[SP-pm] Webscraper

Luis Motta Campos luismottacampos em yahoo.co.uk
Quinta Novembro 29 01:20:05 PST 2007


Lorn wrote:
> Apresentação do miyagawa no SF.pm, espero que esse cara venha no fisl :P
> 
> http://www.slideshare.net/miyagawa/webscraper-for-sfpm-lt/

Eu tive a oportunidade de ver a apresentacao em Vienna.

Mas o Web::Scrapper parecia mais facil de usar quando ele estava manobrando.

Depois, eu descobri que o fonte nao tem um unico byte de documentacao,
nem mesmo comentarios. O codigo tambem nao eh claro (ele usa variaveis
com nomes estranhos, e muita coisa nao obvia).

Noves fora, quando eu precisei de scrapping, fiquei tentado a aprender a
usar ruby. Como eu tinha pressa e precisava de um scrapper "descartavel"
para capturar informacoes de uma lista de discussao interna da empresa
que recebe emails de atividade do cron diariamente, eu terminei
escrevendo uma expressao regular que buscava as informacoes e me
entregava o que eu queria... :)

Espero que, alem de ir ao FISL, o Miyagawa termine a documentacao (que
eh mais importante, imho).

Putamplexos!
-- 
Luis Motta Campos (a.k.a. Monsieur Champs) is a software engineer,
Perl fanatic evangelist, and amateur {cook, photographer}



Mais detalhes sobre a lista de discussão SaoPaulo-pm