[Moscow.pm] перекодировка
Anton Nikishaev
me на lelf.lu
Чт Сен 5 11:15:09 PDT 2013
Betty:~ lelf$ curl -AChrome "http://translate.google.com/translate_a/t?client=t&sl=ru&tl=en&ie=utf-8&oe=utf-8&text=хрю"
[[["oink","хрю","","khryu"]],,"ru",,[["oink",[4],1,0,926,0,1,0]],[["хрю",4,[["oink",926,1,0],["honk",0,1,0],["an oink",0,1,0]],[[0,3]],"хрю"]],,,[["ru"]],1]
On Sep 5, 2013, at 10:03 PM, Nikolay Mishin <mi at ya.ru> wrote:
> спасибо за советы, просто я использую этот перевод в omegaT и там мне нужна строка в win1251
> т.к. там эта кодировка стоит для русского языка
>
> и кстати эту строку
>
> http://translate.google.com/translate_a/t?client=t&sl=auto&tl=ru&hl=ru&sc=2&ie=UTF-8&oe=UTF-8&uptl=ru&alttl=en&oc=1&otf=2&ssel=0&tsel=0&q=%D1%87%D0%B8%D1%82%D0%B0%D1%82%D1%8C
> вставляя в браузер я ничего не получаю в смысле форму, как вы по ней получаете ответ?
>
> 05.09.2013, 19:42, "Anton Nikishaev" <me at lelf.lu>:
>> On Sep 5, 2013, at 8:59 AM, Eugene Toropov <eugene.toropov at gmail.com> wrote:
>>
>>> Привет,
>>>
>>> Если взять то, что работает у них на сайте - http://translate.google.com/translate_a/t?client=t&sl=auto&tl=ru&hl=ru&sc=2&ie=UTF-8&oe=UTF-8&uptl=ru&alttl=en&oc=1&otf=2&ssel=0&tsel=0&q=%D1%87%D0%B8%D1%82%D0%B0%D1%82%D1%8C - и посмотреть параметры, то ie - это видимо input encoding, oe - output encoding - по идее то, что вам нужно
>>
>> +1. Просто добавить ie=utf-8 и oe=utf-8 ничего не меняя, — будет в utf-8 работать.
>> И консоль в utf-8 перевести. Тогда будет не такой ужас-ужас как сейчас. И у --from/--to действительно появится смысл.
>>
>>> On Sep 5, 2013, at 8:38 AM, Nikolay Mishin <mi at ya.ru> wrote:
>>>> MoscowPM, добрый день,
>>>>
>>>> Есть скрипт
>>>> перевода гугла из командной строки
>>>> https://github.com/mishin/gists/blob/master/gtrans.pl
>>>> запускается
>>>> gtrans.pl --from en --to ru --text "This is a test"
>>>>
>>>> из командной строки
>>>> гугл выдает строки в KOI
>>>>
>>>> я парсю вывод гугла:
>>>> my @matches =
>>>> $html =~ m{onmouseout="this.style.backgroundColor='#fff'">(.*?)</span>}g;
>>>>
>>>> foreach my $translated_string (@matches) {
>>>> my $interm_var =
>>>> Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>>>> Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>>>> say $interm_var;
>>>> }
>>>>
>>>> вопрос, можно ли строку
>>>>
>>>> Convert::Cyrillic::cstocs( 'KOI8', 'UTF8', $translated_string );
>>>> Encode::from_to( $interm_var, 'utf-8', 'cp1251' );
>>>>
>>>> заменить одним преобразованием, чтобы на выходе был win1251?
>>>> у меня этого не получилось
>>>> спасибо
>>
>> ,
>> --
>> Moscow.pm mailing list
>> moscow-pm at pm.org | http://moscow.pm.org
>
> --
> С уважением
> Николай Мишин
>
> --
> Moscow.pm mailing list
> moscow-pm at pm.org | http://moscow.pm.org
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: Message signed with OpenPGP using GPGMail
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20130905/0baa0652/attachment.bin>
Подробная информация о списке рассылки Moscow-pm