[Cascavel-pm] Uso de encode/decode para tratar Unicode

Daniel Ruoso daniel em ruoso.com
Quarta Janeiro 10 07:19:11 PST 2007


Qua, 2007-01-10 às 12:51 -0200, Nilson Santos Figueiredo Junior
escreveu:
> On 1/10/07, Daniel Ruoso <daniel em ruoso.com> wrote:
> > O que está acontecendo aqui é que o método LWP::Simple tem um bug, ele
> > deveria utilizar o método $response->get_decoded() ao inves de
> > simplesmente $response->get() (veja HTTP::Response).
> Na verdade, o LWP::Simple nem usa o HTTP::Response. Ele faz todo o
> parsing manualmente com expressões regulares e coisas do tipo, sem
> usar módulos externos.

Qual versão? A da CPAN usa o LWP::UserAgent que por sua vez usa
HTTP::Response...

> > Mas, de todas essas opções, fazer utf8::upgrade() cegamente é a opção
> > mais frágil, mas o único workaround possível no caso do site do outro
> > lado não estiver seguindo as regras corretamente.
> O outro lado manda os cabeçalhos corretamente indicando o encoding. A
> questão é que, a princípio, os datos sempre virão como UTF8. Claro que
> algum dia isso poderia mudar, então é melhor ser future-proof e fazer
> as coisas da melhor maneira mesmo.

Ou seja, é só deixar o trabalho para de quem é a responsabilidade ;)...
e no seu caso a resposta resumida serve :) usar encode/decode
explicitamente não é uma boa idéia... :)

daniel



Mais detalhes sobre a lista de discussão Cascavel-pm