[Moscow.pm] 5.10 + utf8

Vladimir V. Perepelitsa inthrax на gmail.com
Вт Июл 8 00:35:47 PDT 2008


On Tuesday 08 July 2008 11:30:19 Dmitry E. Oboukhov wrote:
> эта хрень хорошо работает только в use utf8

"эта хрень" работает, когда строка - это юникодные символы.
я например в коёвом проекте могу сделать так:

local $_ = Encode::decode('koi8-r', shift);
s{(?:\p{WhiteSpace}|\p{Z})}{ }g;
s{\p{QuotationMark}}{"}g;
return Encode::encode('koi8-r',$_);

> (не знаю, может это изменили в perl 5.10)
вряд-ли

> а вот вышеприведенная хрень работает и без этой прагмы
> (вернее работала, что сейчас - толком не знаю, я не использую
> регулярные выражения по русским буквам вне utf8)
>
> PS: а кстати \p{Cyrillic} не факт что равно /a-яА-Я/
> кирилиц-то много разных
> вполне возможно что в эту проверку кирилик попадет буква i скажем

конечно попадет.
туда попадет все, что отностся к юникодному классу Cyrillic

>
> надо смотреть конкретную реализацию этого выражения



-- 
Vladimir Perepelitsa aka Mons Anderson
<inthrax на gmail.com> / #99779956


Подробная информация о списке рассылки Moscow-pm