[Moscow.pm] Поиск одинаковых текстов по смыслу

Ivan Petrov i.petro.77.00 на gmail.com
Вт Сен 11 07:16:47 PDT 2012


> А если загнать оба текста в индекс какой-нибудь искалки типа Lucene/Lucy и сравнить score по ключевым словам. Правда ключевые слова надо как-то вычленить еще.

если имеется база "эталонов", то можно приделать байес. будет довольно
хороший процент совпадений с категориями. причем можно постоянно базу
"учить" и "отучивать"


Подробная информация о списке рассылки Moscow-pm