[Minsk-pm] Идея для доклада.
Yuri Pac
yu.pats на gmail.com
Пт Май 29 02:08:13 PDT 2009
Ну вообще-то основная идея вышеупомянутого доклада П. Кудинова была
именно в том, что ну его нах парсить ХМЛ (любым способом) не используя
граф ядра видюхи :)
2009/5/29 Andrei <andrei.protasovitski на gmail.com>:
>
>
> 2009/5/29 Andrew Shitov <andy на shitov.ru>
>>
>> > Прошу простить моё невежество, а что такое рекурсивные регэкспы?
>>
>> Это рулез, который может парсить, например, вложенные скобки.
>>
>> my $expr = '1 + (2 + (3 + (4 + 5) + 6))';
>>
>> $expr =~ s/
>> \(
>> (
>> [^()]+
>> )
>> |
>> (?1) ## Вот здесь рекурсивно вызывается выражение,
>> которое матчится первыми скобками
>> \)
>> /say $1;/xge;
>
> Да, я уже нашёл. Но что-то мне подсказывает, что этот рулез нервно курит в
> сторонке, когда речь идёт об XML со всеми его комментариями, областями
> CDATA, инструкциями обработки (processing instructions), неймспейсами и
> прочими полезными вещами. Опять же, много мегабайтный XML, который валится
> через сокет даже такими регэкспами вряд ли удасться эффективно распарсить.
>
>>
>> --
>> Andrew Shitov
>> ______________________________________________________________________
>> andy на shitov.ru | http://shitov.ru
>> _______________________________________________
>> Minsk-pm mailing list
>> Minsk-pm на pm.org
>> http://mail.pm.org/mailman/listinfo/minsk-pm
>
>
>
> --
> Andrei Protasovitski
> < andrei[dot]protasovitski[at]gmail[dot]com >
> Minsk, Belarus
>
> _______________________________________________
> Minsk-pm mailing list
> Minsk-pm на pm.org
> http://mail.pm.org/mailman/listinfo/minsk-pm
>
>
--
WBR, Yuri Pac
Подробная информация о списке рассылки Minsk-pm