[Moscow.pm] Бааальшие XML: потоковый парсинг
Ivan Petrov
i.petro.77.00 на gmail.com
Пт Ноя 11 22:41:03 PST 2011
> В догонку: речь идет об одноразовой обработке ?
> 12 ноября 2011 г. 1:39 пользователь Aliaksandr Zahatski
> <zahatski на gmail.com> написал:
>> Доброго времени суток !
>> По своему опыту, советую сразу смотреть в сторону низкоуровневых API.
>> Если необходимо _извлечь_ простые структуры из подобных размеров XML
>> максимум XML::Parser :-)
>>
>> ЗЫ: оптимально, если условия позволяют работать с XML как с тестом (
>> да, регекспами !)
решение полуодноразовое. то есть первый парсинг делаем из полного XML,
а потом уже из приходящих дополнений.
ща сделано просто: читается блок в районе мегабайта, парсится,
непарсенный хвост остается - к нему читается еще мегабайт итп
парсится просто регекспами
Подробная информация о списке рассылки Moscow-pm