[SP-pm] trabalhando com UTF-8 e ISO-8859-1 simultaneamente

Luis Motta Campos luismottacampos at yahoo.co.uk
Thu Oct 21 01:57:39 PDT 2010


On 10/20/2010 02:44 PM, Stanislaw Pusep wrote:
> Isto verifica se uma *string de octets* está de acordo com o
> "protocolo" do UTF-8. Como dá para ver, não é nada eficiente. E,
> antes de usar, precisa certificar-se de que todos os mecanismos
> internos do Perl de lidar com codificações estejam desativados,
> senão, no melhor caso, gerará uma pancada de warnings de "Wide
> character..." Enfim, deixa pra lá a eficiência, essa foi a melhor
> solução que encontrei depois de *anos* procurando :)

Hum. Na minha curta e humilde experiência com troca de dados (*) e
codificações, a forma mais eficiente de resolver este problema é a que
você aparentemente nunca experimentou: fixar a codificação e informar
seus parceiros / fornecedores / clientes da "limitação" do sistema.

Eu aconselho fortemente a documentar e divulgar amplamente que o sistema
trabalha com UTF8 (i.e., espera input de dados neste formato e devolve
output no mesmo formato), e recusar serviço a todo mundo que não estiver
conformante.

E não me venha com baboseiras políticas sobre não querer desagradar seu
cliente: eles vão ficar muito satisfeitos em saber que existe um padrão,
assim que você quebrar a resistência a mudanças e eles entenderem o que
você está fazendo.

Para convencer seu supervisor, é mais simples: basta mostrar a ele a
zorra heurística que você é obrigado a manter por causa da falta de
padrão, e contabilizar por cima quantas horas de trabalho você teria
disponível para investir em outros projetos por semana.

E pronto, o problema não existe mais. :)
Meus dois centavos.
Putamplexos.
-- 
Luis Motta Campos is a DBA,
Perl Programmer, foodie and photographer.

(*) eu fui Arquiteto e Desenvolvedor Sênior de uma empresa especializada
em conectar fornecedores de conteúdo para telefones celulares e empresas
de telefonia celular em 130 países -- daí você tira uma idéia de quanto
XML cagado eu já vi na minha vida. Hoje, eu sou DBA de um grande grupo
internacional de empresas especializadas em anúncios classificados na
Internet - novamente, você não faz idéia de da quantidade de XML cagado
e character sets errados com que eu tenho de conviver todos os dias.


More information about the SaoPaulo-pm mailing list