[Cascavel-pm] Entidades HTML e caracteres estranhos no Banco
Luciano Giordani Bassani
lgbassani em terra.com.br
Quinta Agosto 4 09:09:57 PDT 2005
Existe uma linha de código que "traduz" a UTF-8, mas faz muito tempo que
eu não uso. Se eu não me engano o código é esse:
$string =~
s/([\xC0-\xDF])([\x80-\xBF])/chr(ord($1)<<6&0xC0|ord($2)&0x3F)/eg;
SDS,
Luciano
Joenio Marques escreveu:
>Olá Monges,
>
>Estou tendo problemas ao gravar strings acentuadas no Banco.
>O que estou tentando fazer é o seguinte:
>
>Acesso um URL utilizando LWP que me retorna um XML.
>$string = obter('http://www.endereco.do.xml/');
>
>Esse XML possui algumas entidades HTML. exemplo:
><produto descricao="Urso Bartô" codigo="0010111" />
>
>Dou um parsing utilizando XML::DOM
>$doc = parsestring($string);
>
>Percorro o xml DOM inserindo no banco os dados de meu interesse.
>No banco a informacao retirada do XML acima está ficando assim:
>Urso Bartô
>
>Esse problema nao ocorre quando eu gravo essa mesma informação
>num arquivo texto. No arquivo a string é gravada corretamente:
>Urso Bartô
>
>Já tentei utilizar o parametro ProtocolEncoding => UTF-8 e ISO-8859-1
>no momento do parsing. Tentei também utilizar a pragma utf8. Já usei
>HTML::Entities para traduzir as entidades HTML. Mas nda funcionou.
>
>Detalhes sobre o ambiente:
>Banco de dados: Oracle 8 win2k
>Perl: 5.6 da ActiveState win2k
>
>Alguem poderia me dar uma dica?
>Muito obrigado,
>Joenio Marques
>_______________________________________________
>Cascavel-pm mailing list
>Cascavel-pm em pm.org
>http://mail.pm.org/mailman/listinfo/cascavel-pm
>
>
>
>
Mais detalhes sobre a lista de discussão Cascavel-pm