[Moscow.pm] Очень плохая музыка с UTF-8

Mike Salnikov msalnikov на parallels.com
Пн Апр 4 23:34:14 PDT 2011


А если encode('cp1251', $text, 1)?
http://perldoc.perl.org/Encode.html#Handling-Malformed-Data

Что говорит is_utf8($text)?

----
Mike Salnikov
Parallels

From: moscow-pm-bounces+msalnikov=parallels.com на pm.org [mailto:moscow-pm-bounces+msalnikov=parallels.com на pm.org] On Behalf Of Денис Ильиных
Sent: Tuesday, April 05, 2011 1:02 PM
To: moscow-pm на pm.org
Subject: [Moscow.pm] Очень плохая музыка с UTF-8

Привет мои дорогие )) Помогите разобраться сломал уже весь моск.

Есть строка в UTF-8 о чем нам говорит Encode::Detect::Detector;

Пытаюсь ее перевести в cp1251 в итоге

--- UTF-8 (Encode::Detect::Detector)
--- Часы мужские CHARMEX VIENNA CH 2031 ― Самые Модные Часы (строка)
--- ~  (тут должен был быть текст Text::Iconv )
--- 'Г—Г Г±Г» ìóæñêèå CHARMEX VIENNA CH 2031 ? Ñà ìûå Ìîäíûå Г—Г Г±Г»' (тут текст encode('cp1251',$text))

Причем другие строки которые детектируются как UTF-8 обрабатываются корректно.
Есть подозрение что в строке есть спецсимволы на которых Iconv не срабатывает или строка не UTF-8, ошибается детектор.

perl 5.10.1

----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20110405/6674ef3c/attachment.html>


Подробная информация о списке рассылки Moscow-pm