[Moscow.pm] 5.10 + utf8

Ruslan Zakirov ruz на bestpractical.com
Вт Июл 8 02:22:47 PDT 2008


2008/7/8 Dmitry E. Oboukhov <unera на debian.org>:
> VVP> On Tuesday 08 July 2008 11:03:43 Dmitry E. Oboukhov wrote:
> VVP> > видимо он делал что-то вроде
> VVP> > $text =~ "[$CYRILLIC]";
>
> VVP> эх :)
> VVP> /\p{Cyrillic}/
> эта хрень хорошо работает только в use utf8 (не знаю, может это изменили
> в perl 5.10)
$ perl -MEncode -e 'my $x = decode_utf8("тест"); print "woot\n" if $x
=~ /\p{Cyrillic}/;'
woot
$ perl -v
This is perl, v5.8.8 built for x86_64-linux

Эта хрень хорошо работает с правильными строками.

> а вот вышеприведенная хрень работает и без этой прагмы
> (вернее работала, что сейчас - толком не знаю, я не использую
> регулярные выражения по русским буквам вне utf8)
>
> PS: а кстати \p{Cyrillic} не факт что равно /a-яА-Я/
> кирилиц-то много разных
> вполне возможно что в эту проверку кирилик попадет буква i скажем
туда попадает http://www.unicode.org/charts/PDF/U0400.pdf


>
> надо смотреть конкретную реализацию этого выражения
>
> --
> ... mpd playing: Helloween - I Can
>
> . ''`. Dmitry E. Oboukhov
> : :'  : unera на debian.org
> `. `~' GPGKey: 1024D / F8E26537 2006-11-21
>  `- 1B23 D4F8 8EC0 D902 0555  E438 AB8C 00CF F8E2 6537
>
> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.6 (GNU/Linux)
>
> iD8DBQFIcxeFq4wAz/jiZTcRAggEAKDobv/yTLm+zDlGzC+FKLM8DFcyKwCcCPoZ
> pFhsYlHgb+XNxdGivELXgQM=
> =Ps3I
> -----END PGP SIGNATURE-----
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>
>



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm