[Moscow.pm] Поиск одинаковых текстов по смыслу
Михаил Монашёв
postmaster на softsearch.ru
Ср Сен 12 11:03:09 PDT 2012
Здравствуйте, Grigory.
> Думаю, вполне возможно сделать это средствами сфинкса ≈ нужно "лишь"
> научиться выделять ключевые слова для произвольного текста, а потом
> задавать в поиск запросы из этих слов.═
> Не знаю, как у сфинкса устроена формула релевантности и есть ли там
> какой-то аналог нестрогого поиска или возможность хоть как-то
> задавать словам веса, но если есть, то это облегчает решение.
BM25 немного доработанная вроде. Сфинкс - это та же база данных,
только заточенная под поиск. Использовать её для выделения ключевых
слов и потом использовать их для поиска можно. Но зачем себя к Сфинксу
привязывать? У него много своих заморочек. Он хорошо выполняет базовые
задачи, а чуть в стороны - начинаются разные ограничения. Автор
Сфинкса готов их даже преодолевать, если у Вас есть для этого деньги.
--
С уважением,
Михаил mailto:postmaster на softsearch.ru
Подробная информация о списке рассылки Moscow-pm