From evdokimov.denis на gmail.com Mon Sep 1 06:19:02 2008 From: evdokimov.denis на gmail.com (Denis Evdokimov) Date: Mon, 1 Sep 2008 17:19:02 +0400 Subject: [Moscow.pm] =?koi8-r?b?9dPUwc7P18vBIFNWTi1XZWIg0NLPwszFzdk=?= In-Reply-To: <589c94400808290944t8c9bb83hfba3b6c99dea8397@mail.gmail.com> References: <435921219938509@webmail63.yandex.ru> <48B8187A.2090306@protey.ru> <846381220025951@webmail41.yandex.ru> <589c94400808290944t8c9bb83hfba3b6c99dea8397@mail.gmail.com> Message-ID: Всё зависит от авторов... К примеру моё письмо авторам PDF::API2::Simple состояло из 3 строк и 2 файлов Hello. See test in t.pl and fix in Simple.pm На которое мне пришло длинное письмо с благодарностью и извинениями, что из-за наступающих новогодних праздников они смогут сделать релиз позже. + письмо в день релиза о том, что мой фикс включён в такой-то версии + упоминание в благодарностях Авторы, которые не в состоянии ответить хотя бы строчкой на bugfix, вызывают искреннее удивления... ----------- следущая часть ----------- Вложение в формате HTML было извлечено… URL: From zhecka на gmail.com Mon Sep 1 08:31:48 2008 From: zhecka на gmail.com (Kaltashkin Eugene) Date: Mon, 01 Sep 2008 19:31:48 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= Message-ID: <48BC0AE4.7000304@gmail.com> Доброе время суток. А я не нашел или доклад по utf8 так и не выложили на веб ? From andy на shitov.ru Mon Sep 1 08:37:30 2008 From: andy на shitov.ru (Andrew Shitov) Date: Mon, 1 Sep 2008 19:37:30 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BC0AE4.7000304@gmail.com> References: <48BC0AE4.7000304@gmail.com> Message-ID: <353f08b80809010837m1e2c5cdcj3eff4f02c106a7c5@mail.gmail.com> > А я не нашел или доклад по utf8 так и не выложили на веб ? Речь про May Perl? http://event.perlrussia.ru/yr2008/media/video.html Ctrl+F UTF. -- Andrew Shitov ______________________________________________________________________ andy на shitov.ru | http://shitov.ru From zhecka на gmail.com Mon Sep 1 08:40:30 2008 From: zhecka на gmail.com (Kaltashkin Eugene) Date: Mon, 01 Sep 2008 19:40:30 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <353f08b80809010837m1e2c5cdcj3eff4f02c106a7c5@mail.gmail.com> References: <48BC0AE4.7000304@gmail.com> <353f08b80809010837m1e2c5cdcj3eff4f02c106a7c5@mail.gmail.com> Message-ID: <48BC0CEE.2080401@gmail.com> Andrew Shitov пишет: >> А я не нашел или доклад по utf8 так и не выложили на веб ? >> > > Речь про May Perl? > > http://event.perlrussia.ru/yr2008/media/video.html > Ctrl+F UTF. > > а не в видео ? то что было в Агаве. вроде обещали выложить в виде текста. From dmarsentev на gmail.com Mon Sep 1 08:52:59 2008 From: dmarsentev на gmail.com (Dmitry Arsentiev) Date: Mon, 1 Sep 2008 19:52:59 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BC0CEE.2080401@gmail.com> References: <48BC0AE4.7000304@gmail.com> <353f08b80809010837m1e2c5cdcj3eff4f02c106a7c5@mail.gmail.com> <48BC0CEE.2080401@gmail.com> Message-ID: Доклад Перепелицы (который Mons Anderson) здесь: http://taka.xfo.cc/takahashi.xul?data=utf8.taka#eva,page1 1 сентября 2008 г. 19:40 пользователь Kaltashkin Eugene написал: > Andrew Shitov пишет: >>> >>> А я не нашел или доклад по utf8 так и не выложили на веб ? >>> >> >> Речь про May Perl? >> >> http://event.perlrussia.ru/yr2008/media/video.html >> Ctrl+F UTF. >> >> > > а не в видео ? то что было в Агаве. вроде обещали выложить в виде текста. > -- > Moscow.pm mailing list > moscow-pm на pm.org | http://moscow.pm.org > From zhecka на gmail.com Mon Sep 1 08:53:54 2008 From: zhecka на gmail.com (Kaltashkin Eugene) Date: Mon, 01 Sep 2008 19:53:54 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: References: <48BC0AE4.7000304@gmail.com> <353f08b80809010837m1e2c5cdcj3eff4f02c106a7c5@mail.gmail.com> <48BC0CEE.2080401@gmail.com> Message-ID: <48BC1012.7070105@gmail.com> Dmitry Arsentiev пишет: > Доклад Перепелицы (который Mons Anderson) здесь: > http://taka.xfo.cc/takahashi.xul?data=utf8.taka#eva,page1 > > спасибо From inthrax на gmail.com Mon Sep 1 23:40:19 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Tue, 2 Sep 2008 10:40:19 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: References: <48BC0AE4.7000304@gmail.com> <48BC0CEE.2080401@gmail.com> Message-ID: <200809021040.19382.inthrax@gmail.com> On Monday 01 September 2008 19:52:59 Dmitry Arsentiev wrote: > Доклад Перепелицы (который Mons Anderson) здесь: > http://taka.xfo.cc/takahashi.xul?data=utf8.taka#eva,page1 более новая версия: http://taka.xfo.cc/utf8.xul -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From mmcleric на gmail.com Tue Sep 2 04:03:50 2008 From: mmcleric на gmail.com (Vyacheslav Matjukhin) Date: Tue, 2 Sep 2008 15:03:50 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= In-Reply-To: <200809021040.19382.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <48BC0CEE.2080401@gmail.com> <200809021040.19382.inthrax@gmail.com> Message-ID: > более новая версия: > http://taka.xfo.cc/utf8.xul > > Спасибо за отличную презентацию, но есть один вопрос. В 18 слайде, да и в остальных неявным образом, утверждается, что utf-ный флаг у "\x{d0}\x{90}" включен. У меня получается по-другому: $ perl -MEncode=is_utf8 -le '$x = "\x{d0}\x{90}"; $y = "\x{410}"; $c = sub {$_ = shift; print $_, is_utf8($_) ? ": on" : ": off" }; $c->($x); $c->($y);' А: off Wide character in print at -e line 1. А: on То есть флаг выключен, если в строке нет ни одного символа с кодом >255. (perl v5.8.8) ----------- следущая часть ----------- Вложение в формате HTML было извлечено… URL: From inthrax на gmail.com Tue Sep 2 05:26:52 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Tue, 2 Sep 2008 16:26:52 +0400 Subject: [Moscow.pm] =?windows-1251?b?xO7q6+DkIO/uIHV0Zjg=?= In-Reply-To: References: <48BC0AE4.7000304@gmail.com> <200809021040.19382.inthrax@gmail.com> Message-ID: <200809021626.52782.inthrax@gmail.com> On Tuesday 02 September 2008 15:03:50 Vyacheslav Matjukhin wrote: > > более новая версия: > > http://taka.xfo.cc/utf8.xul > > Спасибо за отличную презентацию, но есть один вопрос. > В 18 слайде, да и в остальных неявным образом, утверждается, что utf-ный > флаг у "\x{d0}\x{90}" включен. У меня получается по-другому: > > $ perl -MEncode=is_utf8 -le '$x = "\x{d0}\x{90}"; $y = "\x{410}"; $c = sub > {$_ = shift; print $_, is_utf8($_) ? ": on" : ": off" }; $c->($x); > $c->($y);' > А: off > Wide character in print at -e line 1. > А: on > > То есть флаг выключен, если в строке нет ни одного символа с кодом >255. > (perl v5.8.8) 1. это "проблемы" функции utf8::is_utf8. для нее символы <255 utf'ными не являются. 2. wide character in print получается тоже только в том случае, если вы печатаете wide character, т.е. символ с кодом > 255 :) А из чего я взял, что флаг включен - оттуда что я получил такую строку включением флага на всей строке. Для дампера есть разница даже для символов с кодом < 255 -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From mmcleric на gmail.com Tue Sep 2 06:00:12 2008 From: mmcleric на gmail.com (Vyacheslav Matjukhin) Date: Tue, 2 Sep 2008 17:00:12 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= In-Reply-To: <200809021626.52782.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <200809021040.19382.inthrax@gmail.com> <200809021626.52782.inthrax@gmail.com> Message-ID: 2008/9/2 Vladimir V. Perepelitsa > On Tuesday 02 September 2008 15:03:50 Vyacheslav Matjukhin wrote: > > > более новая версия: > > > http://taka.xfo.cc/utf8.xul > > > > Спасибо за отличную презентацию, но есть один вопрос. > > В 18 слайде, да и в остальных неявным образом, утверждается, что utf-ный > > флаг у "\x{d0}\x{90}" включен. У меня получается по-другому: > > > > $ perl -MEncode=is_utf8 -le '$x = "\x{d0}\x{90}"; $y = "\x{410}"; $c = > sub > > {$_ = shift; print $_, is_utf8($_) ? ": on" : ": off" }; $c->($x); > > $c->($y);' > > А: off > > Wide character in print at -e line 1. > > А: on > > > > То есть флаг выключен, если в строке нет ни одного символа с кодом >255. > > (perl v5.8.8) > > 1. это "проблемы" функции utf8::is_utf8. > для нее символы <255 utf'ными не являются. У меня в коде Encode::is_utf8 используется :) А какой функцией тогда вообще можно узнать, включен ли флаг? > > 2. wide character in print получается тоже только в том случае, если вы > печатаете wide character, т.е. символ с кодом > 255 :) Ага, это я понимаю. > > > А из чего я взял, что флаг включен - оттуда что я получил такую строку > включением флага на всей строке. Для дампера есть разница даже для символов > с > кодом < 255 Можно увидеть пример кода? У меня не получается придумать пример, когда бы "\x{d0}\x{90}" можно было отличить от "А". $ perl -MData::Dumper -e '$x = "\x{d0}\x{90}"; $y = "А"; print Dumper $x; print Dumper $y;' $VAR1 = 'А'; $VAR1 = 'А'; Получается вот так: $ perl -MData::Dumper -e 'use utf8; $x = "\x{d0}\x{90}"; $y = "А"; print Dumper $x; print Dumper $y;' $VAR1 = 'А'; $VAR1 = "\x{410}"; Но это объясняется как раз тем, что при use utf8 строка "А" изначально декодирована в utf, поэтому ничего не доказывает. Мне пока кажется, что perl включает флаг только при наличии хотя бы одного символа с кодом >255. > > -- > Vladimir Perepelitsa aka Mons Anderson > / #99779956 > ----------- следущая часть ----------- Вложение в формате HTML было извлечено… URL: From unera на debian.org Tue Sep 2 06:07:31 2008 From: unera на debian.org (Dmitry E. Oboukhov) Date: Tue, 2 Sep 2008 17:07:31 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= In-Reply-To: <48BC0AE4.7000304@gmail.com> References: <48BC0AE4.7000304@gmail.com> Message-ID: <20080902130731.GA16922@work.uvw.ru> > Доброе время суток. > А я не нашел или доклад по utf8 так и не выложили на веб ? кстати в свете CGI и переезда на perl 5.8.10 тут такая проблема, не везде где используется мой скрипт cgi стоит CGI с поддержкой utf8 (в Debian еще CGI старой версии топчется) местами старый, потому написал потомка что-то в стиле (реально посложнее, с wantarray и Vars, тут только суть): use base qw(CGI); sub param { my $class=shift; my @result=$class->SUPER::param(@_); for (@result) { next if (utf8::is_utf8($_)); $_ = decode utf8=>$_; } return @result; } и наткнулся на неприятность на perl 5.10: некоторые строки дают true по флагу utf8::is_utf8, и потому их данный механизм пропускает, а в реале они не utf8 то есть одинаковый код вида $var = myCGI->param('name'); может дать как строку с флагом, так и без, зависимости я не уловил от чего зависит, по видимому от контента который приходит :( пришлось сделать нечто вроде my $tmp = eval {decode utf8=>$_;}; $_=$tmp unless $@; работает, но не очень красиво это все выглядит. по какому критерию он считает некоторые строки что они с установленным флагом я не понял. кто-либо натыкался на аналогичные траблы? -- ... mpd paused: Manowar - Defender . ''`. Dmitry E. Oboukhov : :? : email: unera на debian.org jabber://UNera на uvw.ru `. `~? GPGKey: 1024D / F8E26537 2006-11-21 `- 1B23 D4F8 8EC0 D902 0555 E438 AB8C 00CF F8E2 6537 ----------- следущая часть ----------- A non-text attachment was scrubbed... Name: отсутствует Type: application/pgp-signature Size: 189 bytes Desc: Digital signature URL: From hsw на hsw.pp.ru Tue Sep 2 06:35:27 2008 From: hsw на hsw.pp.ru (Sergey Homenkow) Date: Tue, 02 Sep 2008 17:35:27 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= In-Reply-To: References: <48BC0AE4.7000304@gmail.com> <200809021040.19382.inthrax@gmail.com> <200809021626.52782.inthrax@gmail.com> Message-ID: <48BD411F.6060705@hsw.pp.ru> Vyacheslav Matjukhin пишет: > У меня в коде Encode::is_utf8 используется :) > А какой функцией тогда вообще можно узнать, включен ли флаг? Encode::is_utf8 нормально показывает флаг. \xFF и \x{FF} - эквивалентны. (см. bytes::length("\x{FF}") ). Флаг utf включается только при использовании символов >255. При этом символы \x80-\xFF превращаются в двухбайтные utf8 последовательности. см. http://sergeyx.livejournal.com/5083.html From inthrax на gmail.com Tue Sep 2 06:40:42 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Tue, 2 Sep 2008 17:40:42 +0400 Subject: [Moscow.pm] =?windows-1251?b?xO7q6+DkIO/uIHV0Zjg=?= In-Reply-To: <20080902130731.GA16922@work.uvw.ru> References: <48BC0AE4.7000304@gmail.com> <20080902130731.GA16922@work.uvw.ru> Message-ID: <200809021740.42973.inthrax@gmail.com> On Tuesday 02 September 2008 17:07:31 Dmitry E. Oboukhov wrote: > > Доброе время суток. > > > > А я не нашел или доклад по utf8 так и не выложили на веб ? > > кстати в свете CGI и переезда на perl 5.8.10 > > тут такая проблема, не везде где используется мой скрипт cgi стоит CGI с > поддержкой utf8 (в Debian еще CGI старой версии топчется) > местами старый, потому написал потомка что-то в стиле (реально > посложнее, с wantarray и Vars, тут только суть): > > use base qw(CGI); > > sub param > { > my $class=shift; > my @result=$class->SUPER::param(@_); > for (@result) > { > next if (utf8::is_utf8($_)); > $_ = decode utf8=>$_; > } > return @result; > } > > и наткнулся на неприятность на perl 5.10: > > некоторые строки дают true по флагу utf8::is_utf8, и потому их данный > механизм пропускает, а в реале они не utf8 > > то есть одинаковый код вида > > $var = myCGI->param('name'); > > может дать как строку с флагом, так и без, зависимости я не уловил от > чего зависит, по видимому от контента который приходит :( > > пришлось сделать нечто вроде > > my $tmp = eval {decode utf8=>$_;}; > $_=$tmp unless $@; > > работает, но не очень красиво это все выглядит. а почему-бы не utf8::decode? его eval'ить не нужно, он проапгрейдит, если необходимо и если можно. плюс он раза в 3 быстрее :) > > по какому критерию он считает некоторые строки что они с установленным > флагом я не понял. > > кто-либо натыкался на аналогичные траблы? CGI не юзаем ;) > -- > ... mpd paused: Manowar - Defender > > . ''`. Dmitry E. Oboukhov > > : :? : email: unera на debian.org jabber://UNera на uvw.ru > > `. `~? GPGKey: 1024D / F8E26537 2006-11-21 > `- 1B23 D4F8 8EC0 D902 0555 E438 AB8C 00CF F8E2 6537 -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From inthrax на gmail.com Tue Sep 2 06:49:31 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Tue, 2 Sep 2008 17:49:31 +0400 Subject: [Moscow.pm] =?windows-1251?b?xO7q6+DkIO/uIHV0Zjg=?= In-Reply-To: References: <48BC0AE4.7000304@gmail.com> <200809021626.52782.inthrax@gmail.com> Message-ID: <200809021749.31834.inthrax@gmail.com> On Tuesday 02 September 2008 17:00:12 Vyacheslav Matjukhin wrote: > Можно увидеть пример кода? > У меня не получается придумать пример, когда бы "\x{d0}\x{90}" можно было > отличить от "А". > > $ perl -MData::Dumper -e '$x = "\x{d0}\x{90}"; $y = "А"; print Dumper $x; > print Dumper $y;' $VAR1 = 'А'; > $VAR1 = 'А'; > > Получается вот так: > $ perl -MData::Dumper -e 'use utf8; $x = "\x{d0}\x{90}"; $y = "А"; print > Dumper $x; print Dumper $y;' $VAR1 = 'А'; > $VAR1 = "\x{410}"; >   > Но это объясняется как раз тем, что при use utf8 строка "А" изначально > декодирована в utf, поэтому ничего не доказывает. > > Мне пока кажется, что perl включает флаг только при наличии хотя бы одного > символа с кодом >255. Не вопрос: $ perl -MData::Dumper -Mutf8 $_="А"; utf8::encode($_);utf8::encode($_); utf8::decode($_); print Dumper($_) $VAR1 = "\x{d0}\x{90}"; Если вы смотрите только презентацию, то там непонятна оговорка. я говорил, что я показываю как может выглядеть одна и та-же последовательность байт если ее должным образом покалечить :) в данном случае - строка побита на октеты и на каждый байт выставлен флаг, апгрейдящий его до символа (из latin1-supplement если не ошибаюсь) Если данная строка вне контекста выводится в STDOUT - вы не заметите разницы (работает игнорирование флага на <255) а вот если скормить такую строку TT, который тоже в utf - будет бред на выходе ну и кстати на такой строке не будут корректно работать регулярные выражения. -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From inthrax на gmail.com Wed Sep 3 00:36:50 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Wed, 3 Sep 2008 11:36:50 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BD411F.6060705@hsw.pp.ru> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> Message-ID: <200809031136.51269.inthrax@gmail.com> On Tuesday 02 September 2008 17:35:27 Sergey Homenkow wrote: > Vyacheslav Matjukhin пишет: > > У меня в коде Encode::is_utf8 используется :) > > А какой функцией тогда вообще можно узнать, включен ли флаг? > > Encode::is_utf8 нормально показывает флаг. > \xFF и \x{FF} - эквивалентны. (см. bytes::length("\x{FF}") ). > Флаг utf включается только при использовании символов >255. > При этом символы \x80-\xFF превращаются в двухбайтные utf8 > последовательности. см. http://sergeyx.livejournal.com/5083.html > > -- > Moscow.pm mailing list > moscow-pm на pm.org | http://moscow.pm.org По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From dmarsentev на gmail.com Wed Sep 3 01:05:45 2008 From: dmarsentev на gmail.com (Dmitry Arsentiev) Date: Wed, 3 Sep 2008 12:05:45 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <200809031136.51269.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> Message-ID: Горячо поддерживаю превращение доклада по utf8 хотя бы в веб-страницу, а лучше в две: Howto и FAQ. Всё-таки доклад гиперконспективен, поскольку в нём практически только код, а хотелось бы ещё и слова правильные иметь возможность прочитать. 3 сентября 2008 г. 11:36 пользователь Vladimir V. Perepelitsa написал: > On Tuesday 02 September 2008 17:35:27 Sergey Homenkow wrote: >> Vyacheslav Matjukhin пишет: >> > У меня в коде Encode::is_utf8 используется :) >> > А какой функцией тогда вообще можно узнать, включен ли флаг? >> >> Encode::is_utf8 нормально показывает флаг. >> \xFF и \x{FF} - эквивалентны. (см. bytes::length("\x{FF}") ). >> Флаг utf включается только при использовании символов >255. >> При этом символы \x80-\xFF превращаются в двухбайтные utf8 >> последовательности. см. http://sergeyx.livejournal.com/5083.html >> >> -- >> Moscow.pm mailing list >> moscow-pm на pm.org | http://moscow.pm.org > > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) > > -- > Vladimir Perepelitsa aka Mons Anderson > / #99779956 > -- > Moscow.pm mailing list > moscow-pm на pm.org | http://moscow.pm.org > From hsw на hsw.pp.ru Wed Sep 3 01:53:50 2008 From: hsw на hsw.pp.ru (Sergey Homenkow) Date: Wed, 03 Sep 2008 12:53:50 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <200809031136.51269.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> Message-ID: <48BE509E.8000100@hsw.pp.ru> Vladimir V. Perepelitsa пишет: > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) Делай wiki :) From Kostya на yandex.ru Wed Sep 3 02:30:19 2008 From: Kostya на yandex.ru (=?KOI8-R?B?9MXOIOvP09TR?=) Date: Wed, 03 Sep 2008 13:30:19 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BE509E.8000100@hsw.pp.ru> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> Message-ID: <295601220434219@webmail33.yandex.ru> > Vladimir V. Perepelitsa пишет: > > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) > Делай wiki :) > -- > Moscow.pm mailing list > moscow-pm на pm.org|http://moscow.pm.org > Мож реально где нибудь вики заведем. -- Тен Костя From inthrax на gmail.com Wed Sep 3 02:29:44 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Wed, 3 Sep 2008 13:29:44 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BE509E.8000100@hsw.pp.ru> References: <48BC0AE4.7000304@gmail.com> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> Message-ID: <200809031329.44890.inthrax@gmail.com> On Wednesday 03 September 2008 12:53:50 Sergey Homenkow wrote: > Vladimir V. Perepelitsa пишет: > > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) > > Делай wiki :) Нивапрос. дайте мне хороший движок на перле :) -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From juchkov на gmail.com Wed Sep 3 02:41:24 2008 From: juchkov на gmail.com (Sergey Juchkov) Date: Wed, 3 Sep 2008 13:41:24 +0400 Subject: [Moscow.pm] =?utf-8?b?0JTQvtC60LvQsNC0INC/0L4gdXRmOA==?= In-Reply-To: <200809031329.44890.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <200809031329.44890.inthrax@gmail.com> Message-ID: <615fd2130809030241x7a9693d6s51c8da42b5e4b93d@mail.gmail.com> TWiki 2008/9/3 Vladimir V. Perepelitsa > On Wednesday 03 September 2008 12:53:50 Sergey Homenkow wrote: > > Vladimir V. Perepelitsa пишет: > > > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) > > > > Делай wiki :) > > Нивапрос. > дайте мне хороший движок на перле :) > > -- > Vladimir Perepelitsa aka Mons Anderson > / #99779956 > -- > Moscow.pm mailing list > moscow-pm на pm.org | http://moscow.pm.org > -- Sergey Juchkov http://juchkov.com ----------- следущая часть ----------- Вложение в формате HTML было извлечено… URL: From andy на shitov.ru Wed Sep 3 02:49:09 2008 From: andy на shitov.ru (Andrew Shitov) Date: Wed, 3 Sep 2008 13:49:09 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <615fd2130809030241x7a9693d6s51c8da42b5e4b93d@mail.gmail.com> References: <48BC0AE4.7000304@gmail.com> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <200809031329.44890.inthrax@gmail.com> <615fd2130809030241x7a9693d6s51c8da42b5e4b93d@mail.gmail.com> Message-ID: <353f08b80809030249m567efb72r9e171d061cdb7921@mail.gmail.com> Вы что?! November Wiki - вики на Perl 6! :-) www.november-wiki.org > TWiki >> > Делай wiki :) >> дайте мне хороший движок на перле :) -- Andrew Shitov ______________________________________________________________________ andy на shitov.ru | http://shitov.ru From andy на shitov.ru Wed Sep 3 02:50:18 2008 From: andy на shitov.ru (Andrew Shitov) Date: Wed, 3 Sep 2008 13:50:18 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <295601220434219@webmail33.yandex.ru> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <295601220434219@webmail33.yandex.ru> Message-ID: <353f08b80809030250y17402b31wde74dfa1d3482db4@mail.gmail.com> > Мож реально где нибудь вики заведем. На http://moscow.pm.org/ полгода висит ссылка "Moscow.pm wiki pages". -- Andrew Shitov ______________________________________________________________________ andy на shitov.ru | http://shitov.ru From nordicdyno на yandex.ru Wed Sep 3 03:08:55 2008 From: nordicdyno на yandex.ru (Orlovsky Alexander) Date: Wed, 03 Sep 2008 14:08:55 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <295601220434219@webmail33.yandex.ru> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <295601220434219@webmail33.yandex.ru> Message-ID: <180191220436535@webmail27.yandex.ru> Я уже давно об этом говорю, т.к. давно пора! :) 03.09.08, 13:30, "Тен Костя" : > > Vladimir V. Perepelitsa пишет: > > > По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) > > Делай wiki :) > > -- > > Moscow.pm mailing list > > moscow-pm на pm.org|http://moscow.pm.org > > > Мож реально где нибудь вики заведем. > -- > Тен Костя -- Moscow.pm mailing list moscow-pm на pm.org | http://moscow.pm.org From nordicdyno на yandex.ru Wed Sep 3 03:10:17 2008 From: nordicdyno на yandex.ru (Orlovsky Alexander) Date: Wed, 03 Sep 2008 14:10:17 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <353f08b80809030250y17402b31wde74dfa1d3482db4@mail.gmail.com> References: <48BC0AE4.7000304@gmail.com> <48BD411F.6060705@hsw.pp.ru> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <295601220434219@webmail33.yandex.ru> <353f08b80809030250y17402b31wde74dfa1d3482db4@mail.gmail.com> Message-ID: <248221220436617@webmail17.yandex.ru> Сережкин ее не "мантейнит". :) или :( 03.09.08, 13:50, "Andrew Shitov" : > > Мож реально где нибудь вики заведем. > На http://moscow.pm.org/ полгода висит ссылка "Moscow.pm wiki pages". > -- > Andrew Shitov > ______________________________________________________________________ > andy на shitov.ru | http://shitov.ru > -- > Moscow.pm mailing list > moscow-pm на pm.org | http://moscow.pm.org From inthrax на gmail.com Wed Sep 3 03:36:18 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Wed, 3 Sep 2008 14:36:18 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <248221220436617@webmail17.yandex.ru> References: <48BC0AE4.7000304@gmail.com> <353f08b80809030250y17402b31wde74dfa1d3482db4@mail.gmail.com> <248221220436617@webmail17.yandex.ru> Message-ID: <200809031436.18432.inthrax@gmail.com> On Wednesday 03 September 2008 14:10:17 Orlovsky Alexander wrote: > Сережкин ее не "мантейнит". :) или :( > Вот еще :) писать на пхпшной вики про перл :) -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From Kostya на yandex.ru Wed Sep 3 03:57:40 2008 From: Kostya на yandex.ru (=?KOI8-R?B?9MXOIOvP09TR?=) Date: Wed, 03 Sep 2008 14:57:40 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <200809031436.18432.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <353f08b80809030250y17402b31wde74dfa1d3482db4@mail.gmail.com> <248221220436617@webmail17.yandex.ru> <200809031436.18432.inthrax@gmail.com> Message-ID: <860471220439460@webmail31.yandex.ru> Мож форум тогда... > On Wednesday 03 September 2008 14:10:17 Orlovsky Alexander wrote: > > Сережкин ее не "мантейнит". :) или :( > > > Вот еще :) > писать на пхпшной вики про перл :) > > -- > Vladimir Perepelitsa aka Mons Anderson > / #99779956 > -- > Moscow.pm mailing list > moscow-pm на pm.org|http://moscow.pm.org > -- Тен Костя From inthrax на gmail.com Wed Sep 3 04:07:45 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Wed, 3 Sep 2008 15:07:45 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <860471220439460@webmail31.yandex.ru> References: <48BC0AE4.7000304@gmail.com> <200809031436.18432.inthrax@gmail.com> <860471220439460@webmail31.yandex.ru> Message-ID: <200809031507.45580.inthrax@gmail.com> On Wednesday 03 September 2008 14:57:40 Тен Костя wrote: Не... в форуме "утекать" будет... > Мож форум тогда... > > > On Wednesday 03 September 2008 14:10:17 Orlovsky Alexander wrote: > > > Сережкин ее не "мантейнит". :) или :( > > > > Вот еще :) > > писать на пхпшной вики про перл :) > > -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From alex на kapranoff.ru Wed Sep 3 07:34:10 2008 From: alex на kapranoff.ru (Alex Kapranoff) Date: Wed, 03 Sep 2008 18:34:10 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <200809031329.44890.inthrax@gmail.com> References: <48BC0AE4.7000304@gmail.com> <200809031136.51269.inthrax@gmail.com> <48BE509E.8000100@hsw.pp.ru> <200809031329.44890.inthrax@gmail.com> Message-ID: <48BEA062.1050301@kapranoff.ru> Vladimir V. Perepelitsa wrote: > On Wednesday 03 September 2008 12:53:50 Sergey Homenkow wrote: >> Vladimir V. Perepelitsa пишет: >>> По моему мне по следам доклада пора уже делать сайт про utf8 в перле :) >> Делай wiki :) > > Нивапрос. > дайте мне хороший движок на перле :) Oddmuse. Отличный движок на перле. > From inthrax на gmail.com Wed Sep 3 07:42:33 2008 From: inthrax на gmail.com (Vladimir V. Perepelitsa) Date: Wed, 3 Sep 2008 18:42:33 +0400 Subject: [Moscow.pm] =?koi8-r?b?5M/LzMHEINDPIHV0Zjg=?= In-Reply-To: <48BEA062.1050301@kapranoff.ru> References: <48BC0AE4.7000304@gmail.com> <200809031329.44890.inthrax@gmail.com> <48BEA062.1050301@kapranoff.ru> Message-ID: <200809031842.33406.inthrax@gmail.com> On Wednesday 03 September 2008 18:34:10 Alex Kapranoff wrote: > > Нивапрос. > > дайте мне хороший движок на перле :) > > Oddmuse. Отличный движок на перле. Спасибо, попробую -- Vladimir Perepelitsa aka Mons Anderson / #99779956 From zhecka на gmail.com Wed Sep 3 12:11:31 2008 From: zhecka на gmail.com (Kaltashkin Eugene) Date: Wed, 03 Sep 2008 23:11:31 +0400 Subject: [Moscow.pm] =?utf-8?b?0L7Qv9GA0LXQtNC10LvQtdC90LjQtSDQvdCw0Ls=?= =?utf-8?b?0LjRh9C40Y8g0LIg0YTQsNC50LvQtSDQvdC10L/QtdGH0LDRgtC90YvRhSA=?= =?utf-8?b?0YHQuNC80LLQvtC70L7Qsg==?= Message-ID: <48BEE163.6030902@gmail.com> Доброе время суток. Бьюсь некоторое время над проблемой определения бинарного содержимого файла. Есть файл, в нём есть обычный текст и после текста идёт внедрёный бинарный код. Это .msg от MS Exchange. все мои попытки определить штатными средствами файл на наличие внутри бинарных данных не увенчались успехом. grep, file(magick), binmode с regex не помогают. Может кто подскажет каким образом можно точно определить наличие в файле непечатных символов ? [:cntrl:] тоже не спасает. на все файлы говорит что binary. From maxim.vuets на gmail.com Wed Sep 3 12:36:36 2008 From: maxim.vuets на gmail.com (Maxim Vuets) Date: Wed, 3 Sep 2008 22:36:36 +0300 Subject: [Moscow.pm] =?koi8-r?b?z9DSxcTFzMXOycUgzsHMyd7J0SDXIMbByszFIM7F?= =?koi8-r?b?0MXewdTO2cgg08nN18/Mz9c=?= In-Reply-To: <48BEE163.6030902@gmail.com> References: <48BEE163.6030902@gmail.com> Message-ID: 03.09.08, Kaltashkin Eugene написал(а): > Есть файл, в нём есть обычный текст и после текста идёт внедрёный > бинарный код. > Это .msg от MS Exchange. все мои попытки определить штатными средствами > файл на Если это msg, то наверняка это multipart content MIME, разве нет? То есть, должен ведь быть какой-то разделить. Или заголовок с длинной body и attachment-ов (или что там бинарное идет). Есть еще встроенные операторы для определения типа содержимого. Вот из perldoc -f -X: -T File is an ASCII text file (heuristic guess). -B File is a "binary" file (opposite of -T). Попробуйте, может быть поможет. Как самостоятельное решение, попробуйте сделать поиск по re типа такого /[\x00-\x08\x0b\x0e-\x1f]/, что ли. То есть, управляющие символы (первых 32) без табуляции, возрата карретки и перевода строки. Ну и спросить у Гугла типа how to determine binary file. -- Hoc est simplicissimum! maxim.vuets.name From zhecka на gmail.com Wed Sep 3 12:55:01 2008 From: zhecka на gmail.com (Kaltashkin Eugene) Date: Wed, 03 Sep 2008 23:55:01 +0400 Subject: [Moscow.pm] =?koi8-r?b?z9DSxcTFzMXOycUgzsHMyd7J0SDXIMbByszFIM7F?= =?koi8-r?b?0MXewdTO2cgg08nN18/Mz9c=?= In-Reply-To: References: <48BEE163.6030902@gmail.com> Message-ID: <48BEEB95.8010900@gmail.com> Maxim Vuets пишет: > 03.09.08, Kaltashkin Eugene написал(а): > >> Есть файл, в нём есть обычный текст и после текста идёт внедрёный >> бинарный код. >> Это .msg от MS Exchange. все мои попытки определить штатными средствами >> файл на >> > > Если это msg, то наверняка это multipart content MIME, разве нет? > То есть, должен ведь быть какой-то разделить. > нету, Microsoft удивляет с каждым разом всё больше и больше. пример --- хрум --- X-MimeOLE: Produced By Microsoft Exchange V6.5 Received: by mx.xxxx.ru id <01C8F7A4.79674211 на mx.xxxx.ru>; Wed, 6 Aug 2008 13:11:56 +0400 MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="----_=_NextPart_001_01C8F7A4.79674211" Content-class: urn:content-classes:message Subject: FW: ERM report Date: Wed, 6 Aug 2008 13:11:56 +0400 Message-ID: <546257E146388F42A4ECAAC5EA6586F11B039F на mx.xxxx.ru> X-MS-Has-Attach: yes X-MS-TNEF-Correlator: Thread-Topic: ERM report thread-index: Acjz7Cpp8OXcPWZeSGueKo0UAoz4mQDuEapQ From: "Alexander" To: =?koi8-r?B?8d7Nxc7F1yDhzMXL08HOxNIg98HMxc7Uyc7P18ne?= This is a multi-part message in MIME format. ------_=_NextPart_001_01C8F7A4.79674211 Content-Type: multipart/related; type="text/html"; boundary="----_=_NextPart_002_01C8F7A4.79674211" ------_=_NextPart_002_01C8F7A4.79674211 Content-Type: text/html; charset="koi8-r" Content-Transfer-Encoding: binary