[Rio-pm] HTML::Parse

Sexta Outubro 19 12:16:26 PDT 2012

Opa, valeu mesmo a ajuda. 
Eu consegui o que queria nessa primeira etapa, ficou assim:
http://pastebin.com/GzAnaCK1

Agora tenho outro problema.

O link direciona para uma pagina de download, seguindo nosso exemplo temo a seguinte pagina: http://www.buscamp3.org/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html

Dentro dessa pagina é que esta o link do download, como no caso: www.buscamp3.org/dl/3473494b6c3636334d55/554545485125135/thaeme+e+thiago+ai+que+do.mp3

A duvida agora continua sendo banal: "Como faço para salvar esse arquivo em um diretorio?".
No momento que requisitar a pagina virá o arquivo normalmente??

Pois eu tentei dar um get no arquivo dessa forma e não deu certo:

use LWP::Simple;
my $url = get ('www.buscamp3.org/dl/3473494b6c3636334d55/554545485125135/thaeme+e+thiago+ai+que+do.mp3');
open OUT,">". 'abcde.mp3';
print OUT $url;

Tentei usar: binmode $url;

Nenhuma dessas tentativas deu certo.

Tem alguma forma especial de fazer download de arquivo *.mp3?

From: gabriel.vieira em gmail.com
Date: Fri, 19 Oct 2012 15:48:03 -0300
To: rio-pm em pm.org
Subject: Re: [Rio-pm] HTML::Parse

-----------8<-----------perl -MMojo::UserAgent -E 'say Mojo::UserAgent->new->get("http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/")->res->dom("table.linhas_lista")->[0]->find("a")->[0]->{href}'

----------->8-----------
ou
-----------8<-----------mojo get http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/  a 12 attr href

----------->8-----------
2012/10/19 Aureliano Guedes <guedes_1000 em hotmail.com>

Ola monges,
tudo bem?

Qual um bom modulo para buscar string em um HTML?
Vocês aconselham o HTML::Parse?

Eu não entendo muito de html, mas estou tentando pegar um link dentro de uma pagina.

Um exemplo é esse: http://www.buscamp3.org/busca/Thaeme+e+Thiago+-+Ai+que+do/

Os Links estão nesse formato: 
<a href="/download/thaeme+e+thiago+ai+que+do_3473494b6c3636334d55.html" title="Thaeme E Thiago - Ai Que Do">

O Problema é que no caso dessa pagina tem 4 links desse modelo e eu queria pegar apenas o primeiro.
Poderia usar regexp mas anteriormente me disseram que não é muito elegante parsear HTML na unha.

Sei que a duvida é banal, mas se puderem me dar uma dica agradeço.

Att,
Aureliano Guedes.

_______________________________________________

Rio-pm mailing list

Rio-pm em pm.org

http://mail.pm.org/mailman/listinfo/rio-pm

-- 
Gabriel Vieira

_______________________________________________
Rio-pm mailing list
Rio-pm em pm.org
http://mail.pm.org/mailman/listinfo/rio-pm 		 	   		  
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20121019/c6fa0602/attachment.html>