[Moscow.pm] Подскажите пожалуйста, как определить кодировку файла? Надо уметь различать UTF-8, cp1251. Encode::Guess не детектит cp1251.

Dmitry Arsentiev dmarsentev на gmail.com
Пт Дек 17 10:25:45 PST 2010


Спасибо, Пётр.

Lingua::DetectCyrillic - это более тонкий инструмент, оставлю его до
следующего раза.
Мне нужно грубо определить: это cp1251 или это utf-8 ?

Пока что остановился на двух модулях:
Encode::Guess или Encode::Detect.

Причём скорее Encode::Guess,
потому что он определяет кодировку,
полученную из Archive::Tar распаковкой на лету,
а вот Encode::Detect не может определить кодировку файлов,
извлечённых на лету из архивов с помощью Archive::Tar.

Так что пока что Encode::Guess



17 декабря 2010 г. 20:51 пользователь Peter Vereshagin
<peter на vereshagin.org> написал:
> Our A&R man said, "I don't hear a single", moscow-pm!
> 2010/12/17 09:36:38 -0800 moscow-pm-request на pm.org => To moscow-pm на pm.org :
>
>> Может ли кто-нибудь подсказать, каким модулем лучше детектить кодировку?
>> Попробовал Encode::Guess - не получается определить cp1251.
>> Считаем. что есть три кодировки: UTF-8, сз1251 и "неправильная кодировка" ;)
>
> Lingua::DetectCyrillic
> ?
>
> 73! Peter pgp: A0E26627 (4A42 6841 2871 5EA7 52AB  12F8 0CE1 4AAC A0E2 6627)
> --
> http://vereshagin.org
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>


Подробная информация о списке рассылки Moscow-pm