[SP-pm] dúvida HTML::TreeBuilder

Thu Aug 20 05:47:40 PDT 2009

2009/8/20 jimmy <jimmy.tty em gmail.com>:
> agradeço a reposta, já me deixou claro que às vezes não será possível
> escapar de expressões regulares ao fazer o parser do html.
> eu só escrevia parses baseados em regex eu gostaria de usá-las o mínimo
> possível uma vez que o módulo se propõe a deixar a análise mais simples.
>
> eu estou tentando desenvolver um parser com o HTML::TreeBuilder desde o
> último ES, ainda não consegui desenvolver nada que fosse mais simples
> que usar somente regex nesse caso, a quantidade de laços e desvios que
> estou usando é muito grande. não posso postar o site aqui, mas outros
> problemas que tiver vou postar aqui na lista.

ARGH, procura nos arquivos da lista e você vai ver em TODOS os posts
relacionados a HTML: NUNCA USE REGEX PRA PARSEAR HTML. Regexes não
foram feitas com esse propósito.

O Daniel quase acertou na solução:

my $look_td = $tree_page->look_down(_tag => 'td',class => 'info');

my $codigo;
for ($look_td ->content_list) {
  $codigo = $_, last unless ref;
}

croak "Não achou código" unless $codigo;

-- 
   Eden Cardim       Need help with your Catalyst or DBIx::Class project?
  Code Monkey                    http://www.shadowcat.co.uk/catalyst/
 Shadowcat Systems Ltd.  Want a managed development or deployment platform?
http://edenc.vox.com/            http://www.shadowcat.co.uk/servers/