[Moscow.pm] перекодировка
Anton Nikishaev
me на lelf.lu
Чт Сен 5 08:41:29 PDT 2013
On Sep 5, 2013, at 8:59 AM, Eugene Toropov <eugene.toropov at gmail.com> wrote:
> Привет,
>
> Если взять то, что работает у них на сайте - http://translate.google.com/translate_a/t?client=t&sl=auto&tl=ru&hl=ru&sc=2&ie=UTF-8&oe=UTF-8&uptl=ru&alttl=en&oc=1&otf=2&ssel=0&tsel=0&q=%D1%87%D0%B8%D1%82%D0%B0%D1%82%D1%8C - и посмотреть параметры, то ie - это видимо input encoding, oe - output encoding - по идее то, что вам нужно
>
+1. Просто добавить ie=utf-8 и oe=utf-8 ничего не меняя, — будет в utf-8 работать.
И консоль в utf-8 перевести. Тогда будет не такой ужас-ужас как сейчас. И у --from/--to действительно появится смысл.
> On Sep 5, 2013, at 8:38 AM, Nikolay Mishin <mi at ya.ru> wrote:
>
>> MoscowPM, добрый день,
>>
>> Есть скрипт
>> перевода гугла из командной строки
>> https://github.com/mishin/gists/blob/master/gtrans.pl
>> запускается
>> gtrans.pl --from en --to ru --text "This is a test"
>>
>> из командной строки
>> гугл выдает строки в KOI
>>
>> я парсю вывод гугла:
>> my @matches =
>> $html =~ m{onmouseout="this.style.backgroundColor='#fff'">(.*?)</span>}g;
>>
>> foreach my $translated_string (@matches) {
>> my $interm_var =
>> Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>> Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>> say $interm_var;
>> }
>>
>> вопрос, можно ли строку
>>
>> Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>> Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>>
>> заменить одним преобразованием, чтобы на выходе был win1251?
>> у меня этого не получилось
>> спасибо
>>
>>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: Message signed with OpenPGP using GPGMail
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20130905/75dc9d50/attachment.bin>
Подробная информация о списке рассылки Moscow-pm