[Moscow.pm] utf8

Alexandr Gomoliako zzz на zzz.org.ua
Пн Мар 12 16:52:26 PDT 2012


On Tue, Mar 13, 2012 at 12:51 AM, Ali Ramazanov <netspamer at gmail.com> wrote:

> Возможно я нарвался на что-то попсовое, но всё равно был удивлён.
> Работая со строками как с октетами, обнаружил, что eq не даёт положительно
> результата на две строки  (при выводе на консоль они  идентичны).
> Перевел их во внутренний формат, обнаружил, что буква 'й' может по-разному
> записываться.

> $ perl -e 'use Encode warn Encode::encode("utf8", "\x{438}\x{306}")'
> $ perl -e 'use Encode warn Encode::encode("utf8", "\x{439}")'

Как раз недавно здесь обсуждалось:

perl -MUnicode::Collate -le 'print
Unicode::Collate->new->eq("\x{438}\x{306}", "\x{439}")'


Подробная информация о списке рассылки Moscow-pm