[Moscow.pm] определение кодировки файла
Dmitry E. Oboukhov
unera на debian.org
Пн Июн 2 14:02:27 PDT 2008
ну во первых можно посмотреть что браузер говорит о предпочтительной
кодировке (правда в случае с файлами это не работает, но для 90% случаев
кодировка файла будет той же)
во вторых
можно делать последовательно для русских кодировок (cp1251, koi8, utf8):
Encode::decode(кодировка=>текст)=~/[a-яА-Я]/
и попутно у encode/decode есть режим выбрасывания исключений
когда-то по работе мне понадобилось разгрести большую (гигов 50) базу
куда робот все сложил без указания кодировки
и вот Encode::decode(кодировка=>текст)=~/[a-яА-Я]/ разобрал ее всю
нормально, даже с исключениями не стал возиться :)
Подробная информация о списке рассылки Moscow-pm