[Minsk-pm] Идея для доклада.
Yuri Pac
yu.pats на gmail.com
Пт Май 29 02:15:06 PDT 2009
Полное построение дерева будет медленее существующих решений, но если
надо вырвать из ХМЛ только часть данных, то быстрее :)
2009/5/29 Andrei <andrei.protasovitski на gmail.com>:
>
>
> 2009/5/29 Yuri Pac <yu.pats на gmail.com>
>>
>> Ну вообще-то основная идея вышеупомянутого доклада П. Кудинова была
>> именно в том, что ну его нах парсить ХМЛ (любым способом) не используя
>> граф ядра видюхи :)
>
> А моя идея в том, что на pure perl с re можно парсить! Главное, знать, как
> читать XML. :)
>
>>
>> 2009/5/29 Andrei <andrei.protasovitski на gmail.com>:
>> >
>> >
>> > 2009/5/29 Andrew Shitov <andy на shitov.ru>
>> >>
>> >> > Прошу простить моё невежество, а что такое рекурсивные регэкспы?
>> >>
>> >> Это рулез, который может парсить, например, вложенные скобки.
>> >>
>> >> my $expr = '1 + (2 + (3 + (4 + 5) + 6))';
>> >>
>> >> $expr =~ s/
>> >> \(
>> >> (
>> >> [^()]+
>> >> )
>> >> |
>> >> (?1) ## Вот здесь рекурсивно вызывается выражение,
>> >> которое матчится первыми скобками
>> >> \)
>> >> /say $1;/xge;
>> >
>> > Да, я уже нашёл. Но что-то мне подсказывает, что этот рулез нервно курит
>> > в
>> > сторонке, когда речь идёт об XML со всеми его комментариями, областями
>> > CDATA, инструкциями обработки (processing instructions), неймспейсами и
>> > прочими полезными вещами. Опять же, много мегабайтный XML, который
>> > валится
>> > через сокет даже такими регэкспами вряд ли удасться эффективно
>> > распарсить.
>> >
>> >>
>> >> --
>> >> Andrew Shitov
>> >> ______________________________________________________________________
>> >> andy на shitov.ru | http://shitov.ru
>> >> _______________________________________________
>> >> Minsk-pm mailing list
>> >> Minsk-pm на pm.org
>> >> http://mail.pm.org/mailman/listinfo/minsk-pm
>> >
>> >
>> >
>> > --
>> > Andrei Protasovitski
>> > < andrei[dot]protasovitski[at]gmail[dot]com >
>> > Minsk, Belarus
>> >
>> > _______________________________________________
>> > Minsk-pm mailing list
>> > Minsk-pm на pm.org
>> > http://mail.pm.org/mailman/listinfo/minsk-pm
>> >
>> >
>>
>>
>>
>> --
>> WBR, Yuri Pac
>> _______________________________________________
>> Minsk-pm mailing list
>> Minsk-pm на pm.org
>> http://mail.pm.org/mailman/listinfo/minsk-pm
>
>
>
> --
> Andrei Protasovitski
> < andrei[dot]protasovitski[at]gmail[dot]com >
> Minsk, Belarus
>
> _______________________________________________
> Minsk-pm mailing list
> Minsk-pm на pm.org
> http://mail.pm.org/mailman/listinfo/minsk-pm
>
>
--
WBR, Yuri Pac
Подробная информация о списке рассылки Minsk-pm