[Rio-pm] LWP::Simple x UTF-8

Alexei Znamensky russoz em gmail.com
Quinta Junho 2 16:12:56 PDT 2011


Olá Matheus,

2011/6/2 Matheus Lucas <malsi2 em yahoo.com.br>

> Bom dia amigos !
> Estou com uma pequena duvida aqui, talvez alguem ai ja passou por isso...
> estou pegando conteudo de alguns sites com o metodo get() do LWP::Simple
>
>  my $urlContent = get("
> http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87");
>
> porem, este site esta vindo originalmente em formato ISO(8859-1) e com um
> monte de caracteres bagunçados, quando eu abro em um navegador configurado
> para utf8...normal né.
>
> *Administração:
> * Administrado na ração para frangos de corte e perus.
>
>
> mais eu preciso desse arquivo em utf-8 !!!
>

*** DISCLAIMER: naked self promotion ***

Alternativamente, você poderia usar o DataFlow para manipular isso:

------------------------- cut here -------------------------
use DataFlow;

my $flow = DataFlow->new([
   'URLRetriever',
   Encoding => { from => 'iso8859-1', to => 'utf8' },
   SimpleFileOutput => { file => '> meuarquivo.html' },
]);

$flow->process( 'http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87' );
------------------------- cut here -------------------------

[]s
AZ


continuando, eu abro um arquivo usando o open com o argumento
> "encoding(UTF-8)"
> open( FILE, '>:encoding(UTF-8)', "ttt.htm" );
> e escrevo da forma tradicional... nao conheço outra forma de escrever
> arquivos no perl.
> print FILE $urlContent;
> e mesmo assim ele vem com os caracteres da codificacao ocidental, porem eu
> verifico o arquivo com o comando ""file ttt.htm" e ele me fala que o arquivo
> ta em utf-8.
>
> a pergunta é: alguem ai sabe como pegar esse codigo ou escrever ele ja na
> codificaçao utf-8 ????
> espero ter sido claro :-)
>
> Abraços a todos e obrigado !
>
> Matheus Lucas
> Viçosa-MG
>
>
>
> --- Em *seg, 30/5/11, Diogo Leal <estranho em diogoleal.com>* escreveu:
>
>
> De: Diogo Leal <estranho em diogoleal.com>
> Assunto: [Rio-pm] FSLDC é neste sábado
> Para: "Perl Mongers Rio de Janeiro" <rio-pm em pm.org>
> Data: Segunda-feira, 30 de Maio de 2011, 19:28
>
> Pessoal,
>
> Será neste sábado o Forum de Software Livre de Duque de Caxias, que contará
> com uma palestra sobre Perl Moderno.
> Acho que será bem válido a presença dos monges lá no evento.
>
> O site do evento é => http://forumsoftwarelivre.com.br/2011/
>
> Eu sei que é em Caxias.. mas pô... Caxias é perto do Rio.
>
>
>
> Diogo Leal [aka estranho]
> http://diogoleal.com
> msn | gtalk: estranho em diogoleal.com<http://mc/compose?to=estranho@diogoleal.com>
>
>
> -----Anexo incorporado-----
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org <http://mc/compose?to=Rio-pm@pm.org>
> http://mail.pm.org/mailman/listinfo/rio-pm
>
>
> _______________________________________________
> Rio-pm mailing list
> Rio-pm em pm.org
> http://mail.pm.org/mailman/listinfo/rio-pm
>



-- 
Alexei "RUSSOZ" Znamensky
[russoz_gmail_com] [russoz.wordpress.com] [www.flickr.com/photos/alexeiz] [
https://github.com/russoz]
Only love / Can bring the rain / That makes you yearn to the sky
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/rio-pm/attachments/20110602/56430983/attachment.html>


Mais detalhes sobre a lista de discussão Rio-pm