<div>Вот еще хорошая подборка статей о Perl&Unicode:</div><div>http://www.effectiveperlprogramming.com/blog/category/book/chapters/unicode</div><div> </div><div>мой пост в бложике на тему Unicode:</div><div>http://nordicdyno.github.com/blog/2012/02/17/unicode-basics/</div><div> </div><div>13.03.2012, 11:43, "Ali Ramazanov" <netspamer@gmail.com>:</div><blockquote type="cite">Пробовал, не помогает, так как коды символов отличаются. В общем нужна нормализация, как написали выше. Ещё обнаружил, что на utf8 консоли в mac os эти символы одинаковые, а на linux есть небольшие различия.<br /><br /><div>13 марта 2012 г. 9:27 пользователь Alexandr Alexeev <span dir="ltr"><<a href="mailto:afiskon@gmail.com">afiskon@gmail.com</a>></span> написал:<br /><blockquote style="margin:0 0 0 0.8ex;border-left:1px #ccc solid;padding-left:1ex;">А сделать utf8::decode и сравнить во внутреннем формате перла не помогает?<br /><br /><div>13 марта 2012 г. 3:53 пользователь Ruslan Zakirov <span dir="ltr"><<a href="mailto:ruz@bestpractical.com" target="_blank">ruz@bestpractical.com</a>></span>написал:<div><div> </div><div><br /><blockquote style="margin:0 0 0 0.8ex;border-left:1px #ccc solid;padding-left:1ex;">Привет.<br /> <br /> <a href="http://www.unicode.org/reports/tr15/" target="_blank">http://www.unicode.org/reports/tr15/</a> - тут смотреть таблички и картинки.<br /> <br /> Далее читать и обрабатывать свои данные:<br /> <br /> <a href="http://search.cpan.org/%7Esadahiro/Unicode-Normalize-1.14/Normalize.pm" target="_blank">http://search.cpan.org/~sadahiro/Unicode-Normalize-1.14/Normalize.pm</a><br /> <br /> <a href="http://search.cpan.org/%7Eflora/perl-5.14.2/pod/perlunicode.pod#Unicode_Regular_Expression_Support_Level" target="_blank">http://search.cpan.org/~flora/perl-5.14.2/pod/perlunicode.pod#Unicode_Regular_Expression_Support_Level</a><br /> <br /> Смотрим секцию RL2.1   Canonical Equivalents<br /> <br /> <br /> 2012/3/13 Ali Ramazanov <<a href="mailto:netspamer@gmail.com" target="_blank">netspamer@gmail.com</a>>:<br /><div><div>> Приветствую всех!<br /> ><br /> > Возможно я нарвался на что-то попсовое, но всё равно был удивлён.<br /> > Работая со строками как с октетами, обнаружил, что eq не даёт положительно<br /> > результата на две строки  (при выводе на консоль они  идентичны).<br /> > Перевел их во внутренний формат, обнаружил, что буква 'й' может по-разному<br /> > записываться.<br /> ><br /> > первый вариант:<br /> > $ perl -e 'use Encode warn Encode::encode("utf8", "\x{438}\x{306}")'<br /> > й at -e line 1.<br /> ><br /> > декомпозируется на два символа:<br /> > $ perl -e 'use Encode warn Encode::encode("utf8", "\x{438}")'<br /> > и at -e line 1.<br /> ><br /> > $ perl -e 'use Encode warn Encode::encode("utf8", "\x{306}")'<br /> > ̆ at -e line 1.<br /> > -------------------------------------------------<br /> ><br /> > второй вариант:<br /> > $ perl -e 'use Encode warn Encode::encode("utf8", "\x{439}")'<br /> > й at -e line 1.<br /> ><br /> ><br /> > На консоле первый и второй вариант выглядит абсолютно одинаково, как с этим<br /> > правильно бороться кроме как замены и привидения к одному виду?)<br /> > Потратил какое-то время и не хотел верить свои глазам :)<br /> ><br /> > Спасибо!<br /> ><br /> ></div></div><div>> --<br /> > Moscow.pm mailing list<br /> > <a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br /> ><br /> <br /> <br /> </div><span><span style="color:#888888;">--<br /> Best regards, Ruslan.<br /> </span></span><div><div>--<br /> Moscow.pm mailing list<br /> <a href="mailto:moscow-pm@pm.org" target="_blank">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a></div></div></blockquote></div></div></div><span style="color:#888888;"><br /><br /><br />-- <br />С уважением, Александр<br />Личный блог: <a href="http://eax.me/" target="_blank">http://eax.me/</a><br />Мой форум: <a href="http://it-talk.org/" target="_blank">http://it-talk.org/</a><br /> Мой Twitter: <a href="http://twitter.com/afiskon" target="_blank">http://twitter.com/afiskon</a><br /><br /> </span><br />--<br /> Moscow.pm mailing list<br /> <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br /> </blockquote></div><br /> <span>-- <br />Moscow.pm mailing list<br /><a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org">http://moscow.pm.org</a><br /></span></blockquote>