[Moscow.pm] перекодировка

Anton Nikishaev me на lelf.lu
Чт Сен 5 11:15:09 PDT 2013


Betty:~ lelf$ curl -AChrome "http://translate.google.com/translate_a/t?client=t&sl=ru&tl=en&ie=utf-8&oe=utf-8&text=хрю"
[[["oink","хрю","","khryu"]],,"ru",,[["oink",[4],1,0,926,0,1,0]],[["хрю",4,[["oink",926,1,0],["honk",0,1,0],["an oink",0,1,0]],[[0,3]],"хрю"]],,,[["ru"]],1]




On Sep 5, 2013, at 10:03 PM, Nikolay Mishin <mi at ya.ru> wrote:

> спасибо за советы, просто я использую этот перевод в omegaT и там мне нужна строка в win1251
> т.к. там эта кодировка стоит для русского языка
> 
> и кстати эту строку 
> 
> http://translate.google.com/translate_a/t?client=t&sl=auto&tl=ru&hl=ru&sc=2&ie=UTF-8&oe=UTF-8&uptl=ru&alttl=en&oc=1&otf=2&ssel=0&tsel=0&q=%D1%87%D0%B8%D1%82%D0%B0%D1%82%D1%8C
> вставляя в браузер я ничего не получаю в смысле форму, как вы по ней получаете ответ?
> 
> 05.09.2013, 19:42, "Anton Nikishaev" <me at lelf.lu>:
>> On Sep 5, 2013, at 8:59 AM, Eugene Toropov <eugene.toropov at gmail.com> wrote:
>> 
>>>  Привет,
>>> 
>>>  Если взять то, что работает у них на сайте - http://translate.google.com/translate_a/t?client=t&sl=auto&tl=ru&hl=ru&sc=2&ie=UTF-8&oe=UTF-8&uptl=ru&alttl=en&oc=1&otf=2&ssel=0&tsel=0&q=%D1%87%D0%B8%D1%82%D0%B0%D1%82%D1%8C - и посмотреть параметры, то ie - это видимо input encoding, oe - output encoding - по идее то, что вам нужно
>> 
>> +1. Просто добавить ie=utf-8 и oe=utf-8 ничего не меняя, — будет в utf-8 работать.
>> И консоль в utf-8 перевести. Тогда будет не такой ужас-ужас как сейчас. И у --from/--to действительно появится смысл.
>> 
>>>  On Sep 5, 2013, at 8:38 AM, Nikolay Mishin <mi at ya.ru> wrote:
>>>>  MoscowPM, добрый день,
>>>> 
>>>>  Есть скрипт
>>>>  перевода гугла из командной строки
>>>>  https://github.com/mishin/gists/blob/master/gtrans.pl
>>>>  запускается
>>>>  gtrans.pl --from en --to ru --text "This is a test"
>>>> 
>>>>  из командной строки
>>>>  гугл выдает строки в KOI
>>>> 
>>>>  я парсю вывод гугла:
>>>>   my @matches =
>>>>        $html =~ m{onmouseout="this.style.backgroundColor='#fff'">(.*?)</span>}g;
>>>> 
>>>>      foreach my $translated_string (@matches) {
>>>>          my $interm_var =
>>>>            Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>>>>          Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>>>>          say $interm_var;
>>>>      }
>>>> 
>>>>  вопрос, можно ли строку
>>>> 
>>>>            Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>>>>          Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>>>> 
>>>>  заменить одним преобразованием, чтобы на выходе был win1251?
>>>>  у меня этого не получилось
>>>>  спасибо
>> 
>> ,
>> --
>> Moscow.pm mailing list
>> moscow-pm at pm.org | http://moscow.pm.org
> 
> -- 
> С уважением
> Николай Мишин
> 
> -- 
> Moscow.pm mailing list
> moscow-pm at pm.org | http://moscow.pm.org

-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: Message signed with OpenPGP using GPGMail
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20130905/0baa0652/attachment.bin>


Подробная информация о списке рассылки Moscow-pm