[Rio-pm] xpath

Matheus Lucas malsi2 em yahoo.com.br
Quarta Abril 3 10:48:41 PDT 2013


Realmente Tiago, concordo com você. 
Até comentei mesmo com um amigo que participa do projeto comigo. Chega um ponto, que as regex ficam imensas e que depois só jesus tem paciencia de analisa-las numa possivel manutenção do codigo e nesse caso a gente nem tem a garantia que vai servir pra 100% dos codigos que irao passar por elas. Mais ainda perl é novo pra mim e quando o tempo aperta, a gente acaba fazendo magica mesmo e usando todo recurso que esta disponivel... Mais concordo plenamente você e com alguns que disseram pra ter cuidado usando regex em html. Muito bom !
Já estou olhando aqui e achei bem interessante para o meu problema o mojo::dom e agradeço a todos pela ajuda.
abraços();




----------------Matheus Lucas
Tecnologia em Sistemas para InternetViçosa-MG
"Seja livre, use Linux !"

--- Em qua, 3/4/13, Tiago Peczenyj <tiago.peczenyj em gmail.com> escreveu:

De: Tiago Peczenyj <tiago.peczenyj em gmail.com>
Assunto: Re: [Rio-pm] xpath
Para: "Perl Mongers Rio de Janeiro" <rio-pm em pm.org>
Data: Quarta-feira, 3 de Abril de 2013, 13:48

IMHO vc pode sim usar regex para parserar html SE
1) a estrutura do html for porca (tipo cheio de tag q não fecha ou coisas q não façam muito sentido)2) a estrutura (quase) nunca mudar (e vc procura uma string X como "APROVADO" ou "ERRO)

3) vc está desesperado

Mas para cada ponto que vc pode usar, existem muitos argumentos contra. vc até pode usar como um complemento ao seu parser mas se basear SÓ nisso, como criterio geral, é furada.



2013/4/3 Marcio Ferreira <marciodesouzaferreira em gmail.com>


Desculpe a pressa em responder, o e-mail anterior, alguns pontos que podem ser tocados:


o Web::Scraper, ~força~ que vc faça a ~configuração~ da sua navegação, assim vc de fato se concentra no seu problema e esquece o resto.


o Mojo::DOM é muito amigavel, ele cria de fato um objeto pra vc navegar no seu DOM, isso é legal!
NUNCA USE REGEX PRA PARSER DE HTMLhttp://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top






Porque nao gosto do HTML::TreeBuilder: vc precisa fazer linha a linha seus "findnodes" e compor seu objeto na mao, frente a soluções como Web::Scraper e Mojo::DOM, acho que ele ficou pra trás. =/





**Quando digo HTML::TreeBuilder, me refiro ao HTML::TreeBuilder::XPath mesmo =P

[]s,

Marcio Ferreira

skype: marcio.ferreir4

(21) 8365-7768



2013/4/3 Nuba Princigalli <nuba em fastmail.fm>










On Wed, Apr 3, 2013, at 01:17 PM, Marcio Ferreira wrote:

Também há o HTML::TreeBuilder (mas um pouco mais complicado de "gerenciar" o workflow).


 
Já usei e recomendo o https://metacpan.org/module/HTML::TreeBuilder::XPath

 
--

Nuba R. Princigalli  nuba em pauleira.com  http://pauleira.com  @nprincigalli

Discipline is not an end in itself, just a means to an end. - King Crimson

 




_______________________________________________

Rio-pm mailing list

Rio-pm em pm.org

http://mail.pm.org/mailman/listinfo/rio-pm



_______________________________________________

Rio-pm mailing list

Rio-pm em pm.org

http://mail.pm.org/mailman/listinfo/rio-pm



-- 
Tiago B. Peczenyj
Linux User #405772



http://about.me/peczenyj


-----Anexo incorporado-----

_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20130403/2cd4f885/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm