[Moscow.pm] 2 all & 2 ruz
Ruslan Zakirov
ruz на bestpractical.com
Вт Апр 1 09:31:15 PDT 2008
2008/4/1 Vladimir V. Perepelitsa <inthrax на gmail.com>:
> 2 all:
> Если у кого есть глюки или непонятки с utf8, присылайте плиз тесткейсы и
> вопросы. буду дорабатывать доклад к May Perl
>
> 2 ruz:
> 1. Ты обещал тесткейс для utf8 и latin1
> 2. насчет "неработоспособности" use bytes:
> как минимум меняется поведение функции length.
$ perl -MEncode -e '$a = "\x{0411}"; use bytes; print length($a),"\n"'
2
$ perl -MEncode -e '$a = "\x{00C0}"; use bytes; print length($a),"\n"'
1
Ок, в perldoc perlunicode это исключение записано:
Unicode characters can also be added to a string by using the
"\x{...}" notation. The Unicode code for the desired character, in
hexadecimal, should be placed in the braces. For instance, a smiley
face is "\x{263A}". This encoding scheme only works for characters
with a code of 0x100 or above.
http://use.perl.org/~miyagawa/journal/35700
http://juerd.nl/site.plp/perluniadvice
> 3. ты обещал е-книжку всем желающим.
> собственно подписываюсь первый :)
>
> --
> Vladimir Perepelitsa aka Mons Anderson
> <inthrax на gmail.com> / #99779956
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
> http://mail.pm.org/mailman/listinfo/moscow-pm
--
Best regards, Ruslan.
Подробная информация о списке рассылки Moscow-pm