[Moscow.pm] Ускорение регэкспа

Михаил Монашёв postmaster на softsearch.ru
Чт Июл 11 22:31:49 PDT 2013


Здравствуйте, Anton.

>> Есть регэксп /(.{15})(.+\1){5}/o . Написан, чтобы искать повторяющиеся
>> 6 раз и более подстроки длинной 15 и более символов. На большом тексте
>> работает  очень  долго,  что объяснимо. Как бы его ускорить или решить
>> задачу иначе?
>> 

> Во-первых: (.+ \1) — почему “+”?

Между   искомыми   подстроками   должен   был   быть   хотя   бы  один
символ-разделитель. Хотя сейчас понимаю, что "*" подойдёт вполне.

> Искать нужно первые попавшиеся?

Да.  Нужно  ответить  на вопрос: есть повторяющиеся подстроки или нет?
Сами повторяющиеся подстроки нас не интересуют.


-- 
С уважением,
 Михаил                          mailto:postmaster на softsearch.ru



Подробная информация о списке рассылки Moscow-pm