[Moscow.pm] Угадать кодировку (перебором)
Victor Efimov
victor на vsespb.ru
Пн Дек 8 12:28:02 PST 2014
8 декабря 2014 г., 21:40 пользователь Харпалёв Иван
<ivan.kharpalev на gmail.com> написал:
> Есть строка, без флага utf8.
> Utf8-консоль отображает строку зюками.
> decode("Detect", $data); не угадывает.
>
> Как правильно перевести в utf8?
>
> Где взять массив всех возможных ENCODING, чтобы переводить из них в utf8 и
> смотреть, угадали или нет?
> в pod Encode::Supported как получить массив не вижу.
perl -MEncode -e 'print join qq{\n}, Encode->encodings(q{:all})'
Только толку от этого мало. Почти любая случайная последовательность
байтов является валидным инпутом почти для всех однобайтовых
кодировок. Так что придётся делать анализ осмысленности получившегося
при декодировании текста.
>
> Вроде насущна проблема,
> как такое делать?
>
> Спасибо!
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
Подробная информация о списке рассылки Moscow-pm