[Moscow.pm] Бааальшие XML: потоковый парсинг
Orlovsky Alexander
nordicdyno на yandex.ru
Чт Апр 12 05:20:55 PDT 2012
Файлы ~100–300 мб нормально парсятся из Perl (потоково, конечно), LibXML рулит*! (быстрый, обновляется часто, есть все что нужно)
Кстати, про XML. Не забывайте в своих XML-читалках отключать поддержку внешних entities – это потенциальная дыра в безопасности (http://stackoverflow.com/questions/1906927/xml-vulnerabilities)
* но XML вообще не рулит ни разу )
11.04.2012, 21:07, "Andrew Shitov" <andy на shitov.ru>:
> 2011/11/11 Maxim Vuets <maxim.vuets на gmail.com>:
>
>> Сейчас Андрей Шитов скажет "libxml2" (:
>
> А вот сейчас скажу: да :-)
>
> Попробовал написать SAX-парсер больших (~150 МБ) файлов на С++ и
> получилось. Одним словом, libxml2 пригоден и для этого.
Подробная информация о списке рассылки Moscow-pm