[Cascavel-pm] Entidades HTML e caracteres estranhos no Banco

Luciano Giordani Bassani lgbassani em terra.com.br
Quinta Agosto 4 09:09:57 PDT 2005


Existe uma linha de código que "traduz" a UTF-8, mas faz muito tempo que 
eu não uso. Se eu não me engano o código é esse:


$string =~ 
s/([\xC0-\xDF])([\x80-\xBF])/chr(ord($1)<<6&0xC0|ord($2)&0x3F)/eg;


SDS,

Luciano


Joenio Marques escreveu:

>Olá Monges,
>
>Estou tendo problemas ao gravar strings acentuadas no Banco.
>O que estou tentando fazer é o seguinte:
>
>Acesso um URL utilizando LWP que me retorna um XML.
>$string = obter('http://www.endereco.do.xml/');
>
>Esse XML possui algumas entidades HTML. exemplo:
><produto descricao="Urso Bart&#244;" codigo="0010111" />
>
>Dou um parsing utilizando XML::DOM
>$doc = parsestring($string);
>
>Percorro o xml DOM inserindo no banco os dados de meu interesse.
>No banco a informacao retirada do XML acima está ficando assim:
>Urso Bartô
>
>Esse problema nao ocorre quando eu gravo essa mesma informação
>num arquivo texto. No arquivo a string é gravada corretamente:
>Urso Bartô
>
>Já tentei utilizar o parametro ProtocolEncoding => UTF-8 e ISO-8859-1
>no momento do parsing. Tentei também utilizar a pragma utf8. Já usei
>HTML::Entities para traduzir as entidades HTML. Mas nda funcionou.
>
>Detalhes sobre o ambiente:
>Banco de dados: Oracle 8 win2k
>Perl: 5.6 da ActiveState win2k
>
>Alguem poderia me dar uma dica?
>Muito obrigado,
>Joenio Marques
>_______________________________________________
>Cascavel-pm mailing list
>Cascavel-pm em pm.org
>http://mail.pm.org/mailman/listinfo/cascavel-pm
>
>
>  
>


Mais detalhes sobre a lista de discussão Cascavel-pm