[Cascavel-pm] [off] Problemas com charset. Dicas para solução?

Andre Carneiro andregarciacarneiro em gmail.com
Domingo Junho 20 14:27:40 PDT 2010


> Segue um exemplo de pequenas frases com problemas:
> CAF� DA TARDE
> --> deveria ser "CAFÉ DA TARDE"
>
> Café
> --> deveria ser "Café"
>
> REUNI�ES INTERNAS
> --> deveria ser "REUNIÕES INTERNAS"
>
>
>
A codificação de caracteres do mysqldump está diferente da configuração do
'locales' do S.O. de quem criou o dump, e/ou diferente da codificação de
caracteres do próprio mysql. Esse é o problema.


Você pode tentar usar esse script na linha de comando:

<code>

user$ perl -MEncode -e 'open my $ndump ,">","/tmp/meunovodump.sql"
while(<>){my $line = $_; my $nline = decode "iso-8859-1",$line; $nline =
encode "utf-8",$nline; print $ndump $nline;}close $ndump;'
path/para/o/dump/cagado.sql

</code>

Isso lê o arquivo com a codificação errada, linha a linha, converte cada
linha de iso-8859-1 para utf-8 e escreve num novo arquivo em /tmp.


 O que é estranho, é que você disse que a página está em utf-8. O código do
dump também parece estar em UTF-8, portanto não deveria estar exibindo
caracteres 'idiotas'. Sugiro que você vá saber primeiro qual é a codificação
em todo o caminho do fluxo desses dados, desde S.O., máquinas etc. para
saber exatamente para qual codificação você deve converter os seus dados.


Espero que isso ajude!



Cheers!



-- 
André Garcia Carneiro
Analista/Desenvolvedor Perl
(11)82907780
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/cascavel-pm/attachments/20100620/7d50714b/attachment.html>


Mais detalhes sobre a lista de discussão Cascavel-pm