[Rio-pm] HTML::Parse
Aureliano Guedes
guedes_1000 em hotmail.com
Sexta Outubro 19 12:16:26 PDT 2012
Opa, valeu mesmo a ajuda.
Eu consegui o que queria nessa primeira etapa, ficou assim:
http://pastebin.com/GzAnaCK1
Agora tenho outro problema.
O link direciona para uma pagina de download, seguindo nosso exemplo temo a seguinte pagina: http://www.buscamp3.org/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html
Dentro dessa pagina é que esta o link do download, como no caso: www.buscamp3.org/dl/3473494b6c3636334d55/554545485125135/thaeme+e+thiago+ai+que+do.mp3
A duvida agora continua sendo banal: "Como faço para salvar esse arquivo em um diretorio?".
No momento que requisitar a pagina virá o arquivo normalmente??
Pois eu tentei dar um get no arquivo dessa forma e não deu certo:
use LWP::Simple;
my $url = get ('www.buscamp3.org/dl/3473494b6c3636334d55/554545485125135/thaeme+e+thiago+ai+que+do.mp3');
open OUT,">". 'abcde.mp3';
print OUT $url;
Tentei usar: binmode $url;
Nenhuma dessas tentativas deu certo.
Tem alguma forma especial de fazer download de arquivo *.mp3?
From: gabriel.vieira em gmail.com
Date: Fri, 19 Oct 2012 15:48:03 -0300
To: rio-pm em pm.org
Subject: Re: [Rio-pm] HTML::Parse
-----------8<-----------perl -MMojo::UserAgent -E 'say Mojo::UserAgent->new->get("http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/")->res->dom("table.linhas_lista")->[0]->find("a")->[0]->{href}'
----------->8-----------
ou
-----------8<-----------mojo get http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/ a 12 attr href
----------->8-----------
2012/10/19 Aureliano Guedes <guedes_1000 em hotmail.com>
Ola monges,
tudo bem?
Qual um bom modulo para buscar string em um HTML?
Vocês aconselham o HTML::Parse?
Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma pagina.
Um exemplo é esse: http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/
Os Links estão nesse formato:
<a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" title="Thaeme E Thiago - Ai Que Do">
O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria pegar apenas o primeiro.
Poderia usar regexp mas anteriormente me disseram que não é muito elegante parsear HTML na unha.
Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.
Att,
Aureliano Guedes.
_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm
--
Gabriel Vieira
_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20121019/c6fa0602/attachment.html>
Mais detalhes sobre a lista de discussão Rio-pm