[Moscow.pm] Ускорение регэкспа
Михаил Монашёв
postmaster на softsearch.ru
Чт Июл 11 22:31:49 PDT 2013
Здравствуйте, Anton.
>> Есть регэксп /(.{15})(.+\1){5}/o . Написан, чтобы искать повторяющиеся
>> 6 раз и более подстроки длинной 15 и более символов. На большом тексте
>> работает очень долго, что объяснимо. Как бы его ускорить или решить
>> задачу иначе?
>>
> Во-первых: (.+ \1) — почему “+”?
Между искомыми подстроками должен был быть хотя бы один
символ-разделитель. Хотя сейчас понимаю, что "*" подойдёт вполне.
> Искать нужно первые попавшиеся?
Да. Нужно ответить на вопрос: есть повторяющиеся подстроки или нет?
Сами повторяющиеся подстроки нас не интересуют.
--
С уважением,
Михаил mailto:postmaster на softsearch.ru
Подробная информация о списке рассылки Moscow-pm