[Moscow.pm] Поиск одинаковых текстов по смыслу

Михаил Монашёв postmaster на softsearch.ru
Ср Сен 12 11:03:09 PDT 2012


Здравствуйте, Grigory.

> Думаю, вполне возможно сделать это средствами сфинкса ≈ нужно "лишь"
> научиться  выделять ключевые слова для произвольного текста, а потом
> задавать в поиск запросы из этих слов.═

> Не  знаю, как у сфинкса устроена формула релевантности и есть ли там
> какой-то  аналог  нестрогого  поиска  или  возможность  хоть  как-то
> задавать словам веса, но если есть, то это облегчает решение.

BM25  немного  доработанная  вроде.  Сфинкс  -  это та же база данных,
только  заточенная  под  поиск. Использовать её для выделения ключевых
слов и потом использовать их для поиска можно. Но зачем себя к Сфинксу
привязывать? У него много своих заморочек. Он хорошо выполняет базовые
задачи,  а  чуть  в  стороны  -  начинаются  разные ограничения. Автор
Сфинкса готов их даже преодолевать, если у Вас есть для этого деньги.

-- 
С уважением,
 Михаил                          mailto:postmaster на softsearch.ru



Подробная информация о списке рассылки Moscow-pm