<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style></head>
<body class='hmmessage'><div dir='ltr'>
Acho que estou cometendo algum erro.<br><br>#!/usr/bin/env perl<br><br>use strict;<br>use warnings;<br>use WWW::Mechanize;<br><br>sub parse {<br>    my ($self) = shift;<br>    $self =~ s/\s+/\+/g;<br>    chomp $self;<br>    chop $self;<br>    return $self;<br>}<br><br>sub link_gen {<br>    my $self = shift; <br>    my $link = "http://www.buscamp3.org/busca/" . $self;<br>    return $link;<br>}<br><br>sub get_donwloader_link {<br>    my $self = shift;<br>    my $m = WWW::Mechanize->new();<br>    $m->get($self);<br>    my @Links = $m->links();<br>    foreach my $link(@Links){<br>        print $link->text();<br>        <br>    }<br>    undef $m;<br>}<br><br>open IN, $ARGV[0] or die;<br>foreach (<IN>){<br>    print "Search for: " . $_ . "\n";<br>    print get_donwloader_link (link_gen (parse ($_)));<br>    print "\n__________________________________________________\n";<br>}<br><br><div><div id="SkyDrivePlaceholder"></div><hr id="stopSpelling">From: guedes_1000@hotmail.com<br>To: rio-pm@pm.org<br>Date: Fri, 19 Oct 2012 17:56:34 +0000<br>Subject: Re: [Rio-pm] HTML::Parse<br><br>

<style><!--
.ExternalClass .ecxhmmessage P
{padding:0px;}
.ExternalClass body.ecxhmmessage
{font-size:10pt;font-family:Tahoma;}

--></style>
<div dir="ltr">
Isso, é mais ou menos isso mesmo.<br>No caso você usou o WWW:Mechanize, que apesar de eu usar como navegador nunca tinha parado para ver essa propriedade dele.<br>Mas será que não fica um pouco pesado não usar o Mechanize?<br><br>Eu não entendi como usar o Web::Scraper indicado pelo Junior.<br><br>Mas ja me ajudaram, obrigado.<br><br><div><div id="ecxSkyDrivePlaceholder"></div><hr id="ecxstopSpelling">Date: Fri, 19 Oct 2012 14:47:38 -0300<br>From: andregarciacarneiro@gmail.com<br>To: rio-pm@pm.org<br>Subject: Re: [Rio-pm] HTML::Parse<br><br>Vários módulos e vários jeitos de fazer!<div><br></div><div><br></div><div><br></div><div>Se eu entendi o que você precisa, pode ser assim:</div><div><br></div><div>use common::sense;</div><div>use WWW::Mechanize;</div><div>
my $m = WWW::Mechanize->new();</div><div>$m->get('<a href="http://www.algumapagina.com" target="_blank">http://www.google.com</a>');</div><div>my @Links = $m->links();</div><div>foreach my $link(@Links){</div>

<div>    say $link->text;</div><div>    </div><div>}</div><div>undef $m;</div><div><br></div><div><br></div><div>#Por favor, RTFM aqui: <a href="http://search.cpan.org/~jesse/WWW-Mechanize-1.72/lib/WWW/Mechanize/Link.pm" target="_blank">http://search.cpan.org/~jesse/WWW-Mechanize-1.72/lib/WWW/Mechanize/Link.pm</a> </div>
<div><br></div><div><br></div><div>Caso não seja isso o que você quer, explique melhor por gentileza!</div><div><br></div><div><br></div><div><br></div><div><br></div><div>
<br></div><div><br><br><div class="ecxgmail_quote">2012/10/19 Aureliano Guedes <span dir="ltr"><<a href="mailto:guedes_1000@hotmail.com">guedes_1000@hotmail.com</a>></span><br><blockquote class="ecxgmail_quote" style="border-left:1px #ccc solid;padding-left:1ex">




<div><div dir="ltr">
Ola monges,<br>tudo bem?<br><br>Qual um bom modulo para buscar string em um HTML?<br>Vocês aconselham o HTML::Parse?<br><br>Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma pagina.<br><br>Um exemplo é esse: <a href="http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/" target="_blank">http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/</a><br>

<br>Os Links estão nesse formato: <br><pre><span><<span>a</span> <span>href</span>="<a target="_blank">/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html</a>" <span>title</span>="<a target="_blank">Thaeme E Thiago - Ai Que Do</a>"></span><span></span></pre>

<br>O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria pegar apenas o primeiro.<br>Poderia usar regexp mas anteriormente me disseram que não é muito elegante parsear HTML na unha.<br><br>Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.<br>

<br>Att,<br>Aureliano Guedes.<br>                                       </div></div>
<br>_______________________________________________<br>
Rio-pm mailing list<br>
<a href="mailto:Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br><br clear="all"><div><br></div>-- <br>André Garcia Carneiro<br>Software Engineer<br>

<a target="_blank">(11)982907780</a><br>
</div>
<br>_______________________________________________
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm</div>                                    </div>
<br>_______________________________________________
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm</div>                                    </div></body>
</html>