[Cascavel-pm] Novo modulo p/ CPAN (WWW-Scraper-ISBN-Siciliano)

Lorn lorn.br em gmail.com
Terça Outubro 10 20:56:41 PDT 2006


aha!
use http://search.cpan.org/~sburke/HTML-Tree-3.18/lib/HTML/TreeBuilder.pm
tive os mesmo problemas, expressões regulares monstruosas :)

On 10/10/06, Joenio Marques <joenio em gmail.com> wrote:
>
> Sim!
> Terei problemas no futuro com certeza...
> Mas nao vejo uma forma simples de contornar isso completamente,
> arquivos de configuracao talvez seja uma boa, mas ainda nao resolveria
> outras questoes, por exemplo a REGEX que extrai os dados que eu quero,
> poderia utilizar parser é verdade, mas ainda assim no dia que o HTML
> da Siciliano for completamente alterado, o modulo deixaria de
> funcionar e teria q ser atualizado...
>
>
> Em 10/10/06, Alceu R. de Freitas Jr.<glasswalk3r em yahoo.com.br> escreveu:
> >
> > --- Joenio Marques <joenio em gmail.com> escreveu:
> >
> > > nao sei... o unico parametro que ele recebe é o isbn
> > > do livro sendo
> > > pesquisado, o modulo deve seguir esta interface:
> > >
> > http://search.cpan.org/~aschamp/WWW-Scraper-ISBN-Driver-0.18/Driver.pm
> > >
> >
> > Talvez essa interface devesse ser mudada então... :-D
> > Mas eu ainda acho que você vai ter problemas de
> > manutenção, porque algumas URL's estavam hardcoded no
> > código. Talvez ler de um arquivo de configuração?
> > Variável de ambiente?
> >
> > []'s
> >
> >
> > Alceu Rodrigues de Freitas Junior
> > --------------------------------------
> > glasswalk3r em yahoo.com.br
> > http://www.imortais.cjb.net
>
> --
> Joenio Marques
> - Salvador Perl Mongers
> _______________________________________________
> Cascavel-pm mailing list
> Cascavel-pm em pm.org
> http://mail.pm.org/mailman/listinfo/cascavel-pm
>



-- 
Lorn
- Slackware Linux
www.slackwarezine.com.br
- http://lornlab.org
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: http://mail.pm.org/pipermail/cascavel-pm/attachments/20061011/2b9ea33a/attachment.html 


Mais detalhes sobre a lista de discussão Cascavel-pm