[SP-pm] Malformed UTF-8

Marcio Ferreira marciodesouzaferreira at gmail.com
Wed Sep 22 16:16:49 PDT 2010


No way Renato.

Manja arquivos vindo de uma base latin1, tratados em meios utf8 produzindo
arquivos mixed ? Então...deixa pra lá

[]s,

@webgenes
Marcio Ferreira

"Perl lives as the 'toolbox for Unix' "



2010/9/22 Renato Santos <renato.cron at gmail.com>

> Acho q o xml em questao esta em latin1, e com indicacao de encoding ok.
> Eu n sei sobre o xml bare. La dentro tem um use utf8? Se tiver, urrg...
> saco. Mas da pra ler seM problemas em utf8
>
> Em set 22, 2010 7:42 PM, "Nilson Santos Figueiredo Jr." <acid06 at gmail.com
> >escreveu:
>
>
> 2010/9/22 Marcio Ferreira <marciodesouzaferreira at gmail.com>:
>
> > não achei a solução ideal porque hoje é iso-8859-1 e amanhã vai ser o que
> ? > vou alterar na mão i...
> O XML já deve vir com o encoding definido no topo:
>
>  <?xml version="1.0" encoding="utf-8" ?>
>
> Caso não venha, o XML não pode conter nenhum caracter não-ASCII, caso
> contrário é um XML mal-formado.
> Se vier com a encoding correta, qualquer XML parser de verdade
> consegue tratar isso.
>
> Infelizmente (como foi avisado pra você no passado) o XML::Bare não é
> um parser de verdade e simplesmente assume que tudo está em UTF-8. Se
> você tiver XMLs bem formados e trocar por um parser como XML::LibXML,
> não terá mais problemas com encoding.
>
> -Nilson _______________________________________________ SaoPaulo-pm mailing
> list SaoPaulo-pm at pm.org...
>
>
> _______________________________________________
> SaoPaulo-pm mailing list
> SaoPaulo-pm at pm.org
> http://mail.pm.org/mailman/listinfo/saopaulo-pm
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://mail.pm.org/pipermail/saopaulo-pm/attachments/20100922/4a87a6fc/attachment-0001.html>


More information about the SaoPaulo-pm mailing list