[Moscow.pm] Конвертация unicode символов в ascii

Maxim Vuets maxim.vuets на gmail.com
Ср Июл 4 13:26:52 PDT 2012


On Wed, Jul 04, 2012 at 11:44:17PM +0500, Naim Shafiev wrote:
>4 июля 2012 г., 23:19 пользователь Maxim Vuets <maxim.vuets на gmail.com> написал:
>> On Wed, Jul 04, 2012 at 06:21:42PM +0500, Naim Shafiev wrote:
>>>unicodных символов ( нужно именно ç ə ğ ı ö ş ü  ) в их ascii аналоги
>> Нет чёткой схемы перевода, раз. Перевод зависит от контекста --- языка,
>> два.
>Мне не нужно переводить на какой то другой язык , мне надо просто
>символы заменить на ascii их аналоги.

Я и говорю, что нету аналогов в отрыве от конкретного языка.

>Эти символы не зависимые(ну то есть никак в фарси, семитских языках ,
>где есть символы которые в зависимости от местоположения по разному
>пишутся).

Это оооочень зависимые символы.

Немецкий умлаут ö нужно заменять диграфом oe. Финскую букву ö нужно
заменять на o. В разных языках и условиях эта графема может передавать
звуки [œ], [ø], [o]. По системе транслитерации Киршенбаума они обозначаются
W, Y, o соответсвенно. А для моего уха звучат примерно как русские э, у,
о, что я бы записал латиницей как e, u, o.

Конкретный метод ascii-зации нужно подбирать в зависимости от
конкретно существующей проблемы.

-- 
maxim.vuets.name


Подробная информация о списке рассылки Moscow-pm