[Rio-pm] HTML::Parse

Andre Carneiro andregarciacarneiro em gmail.com
Sexta Outubro 19 10:47:38 PDT 2012


Vários módulos e vários jeitos de fazer!



Se eu entendi o que você precisa, pode ser assim:

use common::sense;
use WWW::Mechanize;
my $m = WWW::Mechanize->new();
$m->get('http://www.google.com <http://www.algumapagina.com>');
my @Links = $m->links();
foreach my $link(@Links){
    say $link->text;

}
undef $m;


#Por favor, RTFM aqui:
http://search.cpan.org/~jesse/WWW-Mechanize-1.72/lib/WWW/Mechanize/Link.pm


Caso não seja isso o que você quer, explique melhor por gentileza!







2012/10/19 Aureliano Guedes <guedes_1000 em hotmail.com>

>  Ola monges,
> tudo bem?
>
> Qual um bom modulo para buscar string em um HTML?
> Vocês aconselham o HTML::Parse?
>
> Eu não entendo muito de html, mas estou tentando pegar um link dentro de
> uma pagina.
>
> Um exemplo é esse:
> http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/
>
> Os Links estão nesse formato:
>
> <a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" title="Thaeme E Thiago - Ai Que Do">
>
>
> O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria
> pegar apenas o primeiro.
> Poderia usar regexp mas anteriormente me disseram que não é muito elegante
> parsear HTML na unha.
>
> Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.
>
> Att,
> Aureliano Guedes.
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>



-- 
André Garcia Carneiro
Software Engineer
(11)982907780
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20121019/e0226e3b/attachment-0001.html>


Mais detalhes sobre a lista de discussão Rio-pm