[Moscow.pm] Угадать кодировку (перебором)

Ivan Petrov i.petro.77.00 на gmail.com
Вт Дек 30 14:42:16 PST 2014


> Есть строка, без флага utf8.
> Utf8-консоль отображает строку зюками.
> decode("Detect", $data); не угадывает.

> Как правильно перевести в utf8?

> Где взять массив всех возможных ENCODING, чтобы переводить из них в utf8 и
> смотреть, угадали или нет?
> в pod Encode::Supported: <https://metacpan.org/pod/distribution/Encode/lib/
> Encode/Supported.pod" style="color:rgb(51,102,204);text-decoration:none;
> font-weight:bold;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;
> font-size:13.333333015441895px;line-height:20px> как получить массив не вижу.

> Вроде насущна проблема,
> как такое делать?

года четыре назад работал я в SEO-бизнесе и мы писали роботов ходящих
по сайтам.
ну так вот, подобной фигней страдали.
названия я уже не помню, но помню что кто-то для Perl делал биндинги к
мозилловскому разгадывателю кодировки.
он весьма качественный (разгадыватель).

попробуйте поискать в эту сторону.


Подробная информация о списке рассылки Moscow-pm