Регекспами тоже на ура парсится, но не всегда мы их выбираем.<br><br><div class="gmail_quote">On Thu, Apr 12, 2012 at 4:20 PM, Orlovsky Alexander <span dir="ltr"><<a href="mailto:nordicdyno@yandex.ru">nordicdyno@yandex.ru</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Файлы ~100–300 мб нормально парсятся из Perl (потоково, конечно), LibXML рулит*! (быстрый, обновляется часто, есть все что нужно)<br>

<br>
Кстати, про XML. Не забывайте в своих XML-читалках отключать поддержку внешних entities – это потенциальная дыра в безопасности (<a href="http://stackoverflow.com/questions/1906927/xml-vulnerabilities" target="_blank">http://stackoverflow.com/questions/1906927/xml-vulnerabilities</a>)<br>

<br>
<br>
* но XML вообще не рулит ни разу )<br>
<br>
11.04.2012, 21:07, "Andrew Shitov" <<a href="mailto:andy@shitov.ru">andy@shitov.ru</a>>:<br>
<div class="im">> 2011/11/11 Maxim Vuets <<a href="mailto:maxim.vuets@gmail.com">maxim.vuets@gmail.com</a>>:<br>
><br>
>>  Сейчас Андрей Шитов скажет "libxml2" (:<br>
><br>
> А вот сейчас скажу: да :-)<br>
><br>
> Попробовал написать SAX-парсер больших (~150 МБ) файлов на С++ и<br>
> получилось. Одним словом, libxml2 пригоден и для этого.<br>
--<br>
</div><div><div></div><div class="h5">Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>С уважением,<br> Анатолий Шарифулин.<br>