[Moscow.pm] Угадать кодировку (перебором)
Ivan Petrov
i.petro.77.00 на gmail.com
Вт Дек 30 14:42:16 PST 2014
> Есть строка, без флага utf8.
> Utf8-консоль отображает строку зюками.
> decode("Detect", $data); не угадывает.
> Как правильно перевести в utf8?
> Где взять массив всех возможных ENCODING, чтобы переводить из них в utf8 и
> смотреть, угадали или нет?
> в pod Encode::Supported: <https://metacpan.org/pod/distribution/Encode/lib/
> Encode/Supported.pod" style="color:rgb(51,102,204);text-decoration:none;
> font-weight:bold;font-family:'Helvetica Neue',Helvetica,Arial,sans-serif;
> font-size:13.333333015441895px;line-height:20px> как получить массив не вижу.
> Вроде насущна проблема,
> как такое делать?
года четыре назад работал я в SEO-бизнесе и мы писали роботов ходящих
по сайтам.
ну так вот, подобной фигней страдали.
названия я уже не помню, но помню что кто-то для Perl делал биндинги к
мозилловскому разгадывателю кодировки.
он весьма качественный (разгадыватель).
попробуйте поискать в эту сторону.
Подробная информация о списке рассылки Moscow-pm