[Rio-pm] xpath

Marcio Ferreira marciodesouzaferreira em gmail.com
Quarta Abril 3 09:27:44 PDT 2013


Desculpe a pressa em responder, o e-mail anterior, alguns pontos que podem
ser tocados:

o Web::Scraper, ~força~ que vc faça a ~configuração~ da sua navegação,
assim vc de fato se concentra no seu problema e esquece o resto.
o Mojo::DOM é muito amigavel, ele cria de fato um objeto pra vc navegar no
seu DOM, isso é legal!

NUNCA USE REGEX PRA PARSER DE HTML
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top

Porque nao gosto do HTML::TreeBuilder: vc precisa fazer linha a linha seus
"findnodes" e compor seu objeto na mao, frente a soluções como Web::Scraper
e Mojo::DOM, acho que ele ficou pra trás. =/

**Quando digo HTML::TreeBuilder, me refiro ao HTML::TreeBuilder::XPath
mesmo =P

[]s,

Marcio Ferreira
skype: marcio.ferreir4
(21) 8365-7768


2013/4/3 Nuba Princigalli <nuba at fastmail.fm>

> **
> On Wed, Apr 3, 2013, at 01:17 PM, Marcio Ferreira wrote:
>
> Também há o HTML::TreeBuilder (mas um pouco mais complicado de "gerenciar"
> o workflow).
>
>
> Já usei e recomendo o https://metacpan.org/module/HTML::TreeBuilder::XPath
>
> --
> Nuba R. Princigalli nuba at pauleira.com http://pauleira.com @nprincigalli
> Discipline is not an end in itself, just a means to an end. - King Crimson
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm at pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20130403/abc11257/attachment-0001.html>


Mais detalhes sobre a lista de discussão Rio-pm