[Moscow.pm] Быстрый парсинг email-сообщений

Walery Studennikov despairr на gmail.com
Пт Фев 6 03:25:00 PST 2009


В общем, сплиттер header / body оптимизировали, это хорошо ;)

Теперь наибольшим тормозом стал парсер mbox-ов.
Сейчас используется такая конструкция:

    while ($_ = <$fh>) {
	if (m/^(From .* \w\w\w \w\w\w (\d|\s)\d \d\d:\d\d:\d\d \d+)\n$/) {
	    _do_process_message( \$out, %param ) if $out;
	    $out = '';
	}
	else {
	    $out .= $_;
	}
    }

Можно ли придумать что-то быстрее для ПОТОКОВОГО парсинга?

-- 
Walery Studennikov
http://www.reg.ru/


Подробная информация о списке рассылки Moscow-pm