[Moscow.pm] Перекодировка UTF->CP1251

Akzhan Abdulin akzhan.abdulin на gmail.com
Вс Июл 12 12:30:59 PDT 2015


➜  srs git:(master) ✗ script/repl
$ use URI::Escape qw( uri_unescape );
$ my $s = uri_unescape('%EF%F0%E8%E2%E5%F2');
������

$ use Encode qw( from_to );$ from_to('cp1251', 'utf-8', $s);
$ from_to($s, 'cp1251', 'utf-8');
12

$ $s
привет

12 июля 2015 г., 22:23 пользователь Akzhan Abdulin <akzhan.abdulin на gmail.com
> написал:

> use URI::Escape, кажется
>
> 12 июля 2015 г., 22:19 пользователь Alex Povolotsky <tarkhil на over.ru>
> написал:
>
> Добрый вечер
>>
>> внезапно уперся в проблему.
>>
>> Хочу сделать ссылку на поиск на alib.ru - сайт старый, писан
>> букинистами, и работает до сих пор на cp1251.
>>
>> Соответственно, строку для поиска воспринимает как
>>
>> %EF%F0%E8%E2%E5%F2
>>
>> (это он считает "привет")
>>
>> Я как-то не осилил скомбинировать Text::Iconv, URI::Encode и что-то еще
>> для того, чтобы получить именно такую переработку текста.
>>
>> Лобовое $uri->encode( $w2u->convert( 'привет' ) )
>>
>> выдает нечто полууUTFное
>>
>> %C3%AF%C3%B0%C3%A8%C3%A2%C3%A5%C3%B2
>>
>> а попытки разобраться с Encode::decode_utf вызвали крайне болезненную
>> рекацию энкодера (я его, в общем, понимаю).
>>
>> Что и в каком порядке мне сделать, чтобы осуществить конвертацию?
>>
>> Alex
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
>>
>
>
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20150712/cd661cb1/attachment.html>


Подробная информация о списке рассылки Moscow-pm