[Cascavel-pm] [off] Problemas com charset. Dicas para solução?
Andre Carneiro
andregarciacarneiro em gmail.com
Domingo Junho 20 14:27:40 PDT 2010
> Segue um exemplo de pequenas frases com problemas:
> CAF� DA TARDE
> --> deveria ser "CAFÉ DA TARDE"
>
> Café
> --> deveria ser "Café"
>
> REUNI�ES INTERNAS
> --> deveria ser "REUNIÕES INTERNAS"
>
>
>
A codificação de caracteres do mysqldump está diferente da configuração do
'locales' do S.O. de quem criou o dump, e/ou diferente da codificação de
caracteres do próprio mysql. Esse é o problema.
Você pode tentar usar esse script na linha de comando:
<code>
user$ perl -MEncode -e 'open my $ndump ,">","/tmp/meunovodump.sql"
while(<>){my $line = $_; my $nline = decode "iso-8859-1",$line; $nline =
encode "utf-8",$nline; print $ndump $nline;}close $ndump;'
path/para/o/dump/cagado.sql
</code>
Isso lê o arquivo com a codificação errada, linha a linha, converte cada
linha de iso-8859-1 para utf-8 e escreve num novo arquivo em /tmp.
O que é estranho, é que você disse que a página está em utf-8. O código do
dump também parece estar em UTF-8, portanto não deveria estar exibindo
caracteres 'idiotas'. Sugiro que você vá saber primeiro qual é a codificação
em todo o caminho do fluxo desses dados, desde S.O., máquinas etc. para
saber exatamente para qual codificação você deve converter os seus dados.
Espero que isso ajude!
Cheers!
--
André Garcia Carneiro
Analista/Desenvolvedor Perl
(11)82907780
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://mail.pm.org/pipermail/cascavel-pm/attachments/20100620/7d50714b/attachment.html>
Mais detalhes sobre a lista de discussão Cascavel-pm