[Moscow.pm] Угадать кодировку (перебором)

Victor Efimov victor на vsespb.ru
Пн Дек 8 12:28:02 PST 2014


8 декабря 2014 г., 21:40 пользователь Харпалёв Иван
<ivan.kharpalev на gmail.com> написал:
> Есть строка, без флага utf8.
> Utf8-консоль отображает строку зюками.
> decode("Detect", $data); не угадывает.
>
> Как правильно перевести в utf8?
>
> Где взять массив всех возможных ENCODING, чтобы переводить из них в utf8 и
> смотреть, угадали или нет?
> в pod Encode::Supported как получить массив не вижу.

perl -MEncode -e 'print join qq{\n}, Encode->encodings(q{:all})'

Только толку от этого мало. Почти любая случайная последовательность
байтов является валидным инпутом почти для всех однобайтовых
кодировок. Так что придётся делать анализ осмысленности получившегося
при декодировании текста.

>
> Вроде насущна проблема,
> как такое делать?
>
> Спасибо!
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>


Подробная информация о списке рассылки Moscow-pm