[Moscow.pm] Доклад по utf8

Vladimir V. Perepelitsa inthrax на gmail.com
Вт Сен 2 05:26:52 PDT 2008


On Tuesday 02 September 2008 15:03:50 Vyacheslav Matjukhin wrote:
> > более новая версия:
> > http://taka.xfo.cc/utf8.xul
>
> Спасибо за отличную презентацию, но есть один вопрос.
> В 18 слайде, да и в остальных неявным образом, утверждается, что utf-ный
> флаг у "\x{d0}\x{90}" включен. У меня получается по-другому:
>
> $ perl -MEncode=is_utf8 -le '$x = "\x{d0}\x{90}"; $y = "\x{410}"; $c = sub
> {$_ = shift; print $_, is_utf8($_) ? ": on" : ": off" }; $c->($x);
> $c->($y);'
> А: off
> Wide character in print at -e line 1.
> А: on
>
> То есть флаг выключен, если в строке нет ни одного символа с кодом >255.
> (perl v5.8.8)

1. это "проблемы" функции utf8::is_utf8.
для нее символы <255 utf'ными не являются.
2. wide character in print получается тоже только в том случае, если вы 
печатаете wide character, т.е. символ с кодом > 255 :)

А из чего я взял, что флаг включен - оттуда что я получил такую строку 
включением флага на всей строке. Для дампера есть разница даже для символов с 
кодом < 255 

-- 
Vladimir Perepelitsa aka Mons Anderson
<inthrax на gmail.com> / #99779956


Подробная информация о списке рассылки Moscow-pm