[SP-pm] Malformed UTF-8

Nilson Santos Figueiredo Jr. acid06 at gmail.com
Wed Sep 22 15:42:13 PDT 2010


2010/9/22 Marcio Ferreira <marciodesouzaferreira at gmail.com>:
> não achei a solução ideal porque hoje é iso-8859-1 e amanhã vai ser o que ?
> vou alterar na mão isso ?

O XML já deve vir com o encoding definido no topo:

  <?xml version="1.0" encoding="utf-8" ?>

Caso não venha, o XML não pode conter nenhum caracter não-ASCII, caso
contrário é um XML mal-formado.
Se vier com a encoding correta, qualquer XML parser de verdade
consegue tratar isso.

Infelizmente (como foi avisado pra você no passado) o XML::Bare não é
um parser de verdade e simplesmente assume que tudo está em UTF-8. Se
você tiver XMLs bem formados e trocar por um parser como XML::LibXML,
não terá mais problemas com encoding.

-Nilson


More information about the SaoPaulo-pm mailing list