[Moscow.pm] 2 all & 2 ruz

Ruslan Zakirov ruz на bestpractical.com
Вт Апр 1 09:31:15 PDT 2008


2008/4/1 Vladimir V. Perepelitsa <inthrax на gmail.com>:
> 2 all:
>  Если у кого есть глюки или непонятки с utf8, присылайте плиз тесткейсы и
>  вопросы. буду дорабатывать доклад к May Perl
>
>  2 ruz:
>  1. Ты обещал тесткейс для utf8 и latin1
>  2. насчет "неработоспособности" use bytes:
>    как минимум меняется поведение функции length.

$ perl -MEncode -e '$a = "\x{0411}"; use bytes; print length($a),"\n"'
2
$ perl -MEncode -e '$a = "\x{00C0}"; use bytes; print length($a),"\n"'
1
Ок, в perldoc perlunicode это исключение записано:
Unicode characters can also be added to a string by using the
"\x{...}" notation.  The Unicode code for the desired character, in
hexadecimal, should be placed in the braces. For instance, a smiley
face is "\x{263A}". This encoding scheme only works for characters
with a code of 0x100 or above.

http://use.perl.org/~miyagawa/journal/35700
http://juerd.nl/site.plp/perluniadvice

>  3. ты обещал е-книжку всем желающим.
>    собственно подписываюсь первый :)
>
>  --
>  Vladimir Perepelitsa aka Mons Anderson
>  <inthrax на gmail.com> / #99779956
>  --
>  Moscow.pm mailing list
>  moscow-pm на pm.org | http://moscow.pm.org
>  http://mail.pm.org/mailman/listinfo/moscow-pm



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm