[Moscow.pm] Бааальшие XML: потоковый парсинг

Ivan Petrov i.petro.77.00 на gmail.com
Пт Ноя 11 22:41:03 PST 2011


> В догонку: речь идет об одноразовой обработке ?

> 12 ноября 2011 г. 1:39 пользователь Aliaksandr Zahatski
> <zahatski на gmail.com> написал:
>> Доброго времени суток !
>> По своему опыту, советую сразу смотреть в сторону низкоуровневых API.
>> Если необходимо _извлечь_  простые структуры из подобных размеров  XML
>>  максимум XML::Parser :-)
>> 
>> ЗЫ: оптимально, если условия позволяют работать с XML как с тестом (
>> да, регекспами !)

решение полуодноразовое. то есть первый парсинг делаем из полного XML,
а потом уже из приходящих дополнений.

ща сделано просто: читается блок в районе мегабайта, парсится,
непарсенный хвост остается - к нему читается еще мегабайт итп

парсится просто регекспами


Подробная информация о списке рассылки Moscow-pm