[Moscow.pm] определение кодировки файла

Dmitry E. Oboukhov unera на debian.org
Пн Июн 2 14:02:27 PDT 2008


ну во первых можно посмотреть что браузер говорит о предпочтительной
кодировке (правда в случае с файлами это не работает, но для 90% случаев
кодировка файла будет той же)

во вторых

можно делать последовательно для русских кодировок (cp1251, koi8, utf8):

Encode::decode(кодировка=>текст)=~/[a-яА-Я]/

и попутно у encode/decode есть режим выбрасывания исключений

когда-то по работе мне понадобилось разгрести большую (гигов 50) базу
куда робот все сложил без указания кодировки
и вот Encode::decode(кодировка=>текст)=~/[a-яА-Я]/ разобрал ее всю
нормально, даже с исключениями не стал возиться :)


Подробная информация о списке рассылки Moscow-pm