[Minsk-pm] Идея для доклада.
Andrei
andrei.protasovitski на gmail.com
Пт Май 29 02:22:35 PDT 2009
2009/5/29 Yuri Pac <yu.pats на gmail.com>
> Полное построение дерева будет медленее существующих решений, но если
> надо вырвать из ХМЛ только часть данных, то быстрее :)
Построение дерева -- это не парсинг, это следующий уровень после парсинга.
> 2009/5/29 Andrei <andrei.protasovitski на gmail.com>:
> >
> >
> > 2009/5/29 Yuri Pac <yu.pats на gmail.com>
> >>
> >> Ну вообще-то основная идея вышеупомянутого доклада П. Кудинова была
> >> именно в том, что ну его нах парсить ХМЛ (любым способом) не используя
> >> граф ядра видюхи :)
> >
> > А моя идея в том, что на pure perl с re можно парсить! Главное, знать,
> как
> > читать XML. :)
> >
> >>
> >> 2009/5/29 Andrei <andrei.protasovitski на gmail.com>:
> >> >
> >> >
> >> > 2009/5/29 Andrew Shitov <andy на shitov.ru>
> >> >>
> >> >> > Прошу простить моё невежество, а что такое рекурсивные регэкспы?
> >> >>
> >> >> Это рулез, который может парсить, например, вложенные скобки.
> >> >>
> >> >> my $expr = '1 + (2 + (3 + (4 + 5) + 6))';
> >> >>
> >> >> $expr =~ s/
> >> >> \(
> >> >> (
> >> >> [^()]+
> >> >> )
> >> >> |
> >> >> (?1) ## Вот здесь рекурсивно вызывается выражение,
> >> >> которое матчится первыми скобками
> >> >> \)
> >> >> /say $1;/xge;
> >> >
> >> > Да, я уже нашёл. Но что-то мне подсказывает, что этот рулез нервно
> курит
> >> > в
> >> > сторонке, когда речь идёт об XML со всеми его комментариями, областями
> >> > CDATA, инструкциями обработки (processing instructions), неймспейсами
> и
> >> > прочими полезными вещами. Опять же, много мегабайтный XML, который
> >> > валится
> >> > через сокет даже такими регэкспами вряд ли удасться эффективно
> >> > распарсить.
> >> >
> >> >>
> >> >> --
> >> >> Andrew Shitov
> >> >>
> ______________________________________________________________________
> >> >> andy на shitov.ru | http://shitov.ru
> >> >> _______________________________________________
> >> >> Minsk-pm mailing list
> >> >> Minsk-pm на pm.org
> >> >> http://mail.pm.org/mailman/listinfo/minsk-pm
> >> >
> >> >
> >> >
> >> > --
> >> > Andrei Protasovitski
> >> > < andrei[dot]protasovitski[at]gmail[dot]com >
> >> > Minsk, Belarus
> >> >
> >> > _______________________________________________
> >> > Minsk-pm mailing list
> >> > Minsk-pm на pm.org
> >> > http://mail.pm.org/mailman/listinfo/minsk-pm
> >> >
> >> >
> >>
> >>
> >>
> >> --
> >> WBR, Yuri Pac
> >> _______________________________________________
> >> Minsk-pm mailing list
> >> Minsk-pm на pm.org
> >> http://mail.pm.org/mailman/listinfo/minsk-pm
> >
> >
> >
> > --
> > Andrei Protasovitski
> > < andrei[dot]protasovitski[at]gmail[dot]com >
> > Minsk, Belarus
> >
> > _______________________________________________
> > Minsk-pm mailing list
> > Minsk-pm на pm.org
> > http://mail.pm.org/mailman/listinfo/minsk-pm
> >
> >
>
>
>
> --
> WBR, Yuri Pac
> _______________________________________________
> Minsk-pm mailing list
> Minsk-pm на pm.org
> http://mail.pm.org/mailman/listinfo/minsk-pm
>
--
Andrei Protasovitski
< andrei[dot]protasovitski[at]gmail[dot]com >
Minsk, Belarus
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/minsk-pm/attachments/20090529/ec5494b5/attachment.html>
Подробная информация о списке рассылки Minsk-pm