[Moscow.pm] Бааальшие XML: потоковый парсинг

Orlovsky Alexander nordicdyno на yandex.ru
Чт Апр 12 05:20:55 PDT 2012


Файлы ~100–300 мб нормально парсятся из Perl (потоково, конечно), LibXML рулит*! (быстрый, обновляется часто, есть все что нужно)

Кстати, про XML. Не забывайте в своих XML-читалках отключать поддержку внешних entities – это потенциальная дыра в безопасности (http://stackoverflow.com/questions/1906927/xml-vulnerabilities)


* но XML вообще не рулит ни разу )

11.04.2012, 21:07, "Andrew Shitov" <andy на shitov.ru>:
> 2011/11/11 Maxim Vuets <maxim.vuets на gmail.com>:
>
>>  Сейчас Андрей Шитов скажет "libxml2" (:
>
> А вот сейчас скажу: да :-)
>
> Попробовал написать SAX-парсер больших (~150 МБ) файлов на С++ и
> получилось. Одним словом, libxml2 пригоден и для этого.


Подробная информация о списке рассылки Moscow-pm