<table cellspacing="0" cellpadding="0" border="0" ><tr><td valign="top" style="font: inherit;"><span class="email">Stanislaw, Ole, muito obrigado pelas dicas, ja bateu 100% aqui na caxola.</span><br>Obrigado e um abraço todos !!! :-D<br><br>Matheus<br><br><br>--- Em <b>qui, 2/6/11, Stanislaw Pusep <i><creaktive@gmail.com></i></b> escreveu:<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"><br>De: Stanislaw Pusep <creaktive@gmail.com><br>Assunto: Re: [Rio-pm] LWP::Simple x UTF-8<br>Para: "Perl Mongers Rio de Janeiro" <rio-pm@pm.org><br>Data: Quinta-feira, 2 de Junho de 2011, 11:36<br><br><div id="yiv1725135612">Bom dia, Matheus!<div>O LWP retorna octets, enquanto o texto, para Perl, é Unicode. Você precisa decodificar os octets, para depois recodificar:</div><div><br></div><div>perl -MEncode -MLWP::Simple -e 'my $content = decode_utf8(get("<a rel="nofollow" target="_blank"
 href="http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87">http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87</a>")); open(my $fh, ">:encoding(UTF-8)", "teste.html"); print $fh $content'</div>

<div><br></div><div>Para comparação, recodificando em ISO-8859-1:</div><div><br></div><div>perl -MEncode -MLWP::Simple -e 'my $content = decode_utf8(get("<a rel="nofollow" target="_blank" href="http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87">http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87</a>")); open(my $fh, ">:encoding(ISO-8859-1)", "teste.html"); print $fh $content'</div>

<div><br></div><div>Agora, se a sua intenção é apenas baixar o HTML e guardar num arquivo, preservando a codificação UTF-8... Dispense o Unicode e trabalhe só com octets:</div><div><br></div><div>perl -MLWP::Simple -e 'my $content = get("<a rel="nofollow" target="_blank" href="http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87">http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87</a>"); open(my $fh, ">:raw", "teste.html"); print $fh $content'</div>

<div><br></div><div>Para mais detalhes (como, por exemplo, normalizar arquivos que misturam várias codificações), veja o artigo: <a rel="nofollow" target="_blank" href="http://sao-paulo.pm.org/equinocio/2011/mar/4">http://sao-paulo.pm.org/equinocio/2011/mar/4</a></div>

<div><br>ABS()<br><br>
<br><br><div class="yiv1725135612gmail_quote">2011/6/2 Matheus Lucas <span dir="ltr"><<a rel="nofollow" ymailto="mailto:malsi2@yahoo.com.br" target="_blank" href="/mc/compose?to=malsi2@yahoo.com.br">malsi2@yahoo.com.br</a>></span><br><blockquote class="yiv1725135612gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">

<table border="0" cellpadding="0" cellspacing="0"><tbody><tr><td style="font: inherit;" valign="top">Bom dia amigos !<br>Estou com uma pequena duvida aqui, talvez alguem ai ja passou por isso...<br>estou pegando conteudo de alguns sites com o metodo get() do LWP::Simple<br>

<br> my $urlContent = get("<a rel="nofollow" target="_blank" href="http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87">http://www.cpvs.com.br/cpvs/prodpesquisa.aspx?codigo=87</a>");<br><br>porem, este site esta vindo originalmente em formato ISO(8859-1) e com um monte de caracteres bagunçados, quando eu abro em um navegador configurado para utf8...normal né. <font face="Arial" size="2"><p align="left">

<strong>Administração:<br>
                                                                                </strong>
                                                                                <span style="font-family: Arial;">Administrado na ração para frangos de corte e perus.</span></p><p align="left"><br></p><p align="left">mais eu preciso desse arquivo em utf-8 !!!</p><p align="left">continuando, eu abro um arquivo usando o open com o argumento "encoding(UTF-8)"<br>

</p></font>open( FILE, '>:encoding(UTF-8)', "ttt.htm" );<br>e escrevo da forma tradicional... nao conheço outra forma de escrever arquivos no perl.<br>print FILE $urlContent;<br>e mesmo assim ele vem com os caracteres da codificacao ocidental, porem eu verifico o arquivo com o comando ""file ttt.htm" e ele me fala que o arquivo ta em utf-8.<br>

<br>a pergunta é: alguem ai sabe como pegar esse codigo ou escrever ele ja na codificaçao utf-8 ????<br>espero ter sido claro :-)<br><br>Abraços a todos e obrigado !<br><br>Matheus Lucas<br>Viçosa-MG<br><br><br><br>--- Em <b>seg, 30/5/11, Diogo Leal <i><<a rel="nofollow" ymailto="mailto:estranho@diogoleal.com" target="_blank" href="/mc/compose?to=estranho@diogoleal.com">estranho@diogoleal.com</a>></i></b>
 escreveu:<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"><br>De: Diogo Leal <<a rel="nofollow" ymailto="mailto:estranho@diogoleal.com" target="_blank" href="/mc/compose?to=estranho@diogoleal.com">estranho@diogoleal.com</a>><br>Assunto: [Rio-pm] FSLDC é neste sábado<br>

Para: "Perl Mongers Rio de Janeiro" <<a rel="nofollow" ymailto="mailto:rio-pm@pm.org" target="_blank" href="/mc/compose?to=rio-pm@pm.org">rio-pm@pm.org</a>><br>Data: Segunda-feira, 30 de Maio de 2011, 19:28<br><br><div>Pessoal, <br><br>Será neste sábado o Forum de Software Livre de Duque de Caxias, que contará com uma palestra sobre Perl Moderno. <br>

Acho que será bem válido a presença dos monges lá no evento.<br><br>O site do evento é => <a rel="nofollow" target="_blank" href="http://forumsoftwarelivre.com.br/2011/">http://forumsoftwarelivre.com.br/2011/</a><br>

<br>Eu sei que é em Caxias.. mas pô... Caxias é perto do Rio.<br><br><br><br clear="all">Diogo Leal [aka estranho]<br><a rel="nofollow" target="_blank" href="http://diogoleal.com">http://diogoleal.com</a><br>msn | gtalk: <a rel="nofollow" target="_blank" href="http://mc/compose?to=estranho@diogoleal.com">estranho@diogoleal.com</a><br>



<br>
</div><br>-----Anexo incorporado-----<br><br><div>_______________________________________________<br>Rio-pm mailing list<br><a rel="nofollow" target="_blank" href="http://mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br><a rel="nofollow" target="_blank" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a></div>

</blockquote></td></tr></tbody></table><br>_______________________________________________<br>
Rio-pm mailing list<br>
<a rel="nofollow" ymailto="mailto:Rio-pm@pm.org" target="_blank" href="/mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br>
<a rel="nofollow" target="_blank" href="http://mail.pm.org/mailman/listinfo/rio-pm">http://mail.pm.org/mailman/listinfo/rio-pm</a><br></blockquote></div><br></div>
</div><br>-----Anexo incorporado-----<br><br><div class="plainMail">_______________________________________________<br>Rio-pm mailing list<br><a ymailto="mailto:Rio-pm@pm.org" href="/mc/compose?to=Rio-pm@pm.org">Rio-pm@pm.org</a><br><a href="http://mail.pm.org/mailman/listinfo/rio-pm" target="_blank">http://mail.pm.org/mailman/listinfo/rio-pm</a></div></blockquote></td></tr></table>