[Moscow.pm] Поиск одинаковых текстов по смыслу
Grigory V.Sapunov
grigory.sapunov на gmail.com
Ср Сен 12 21:00:18 PDT 2012
2012/9/13 Михаил Монашёв <postmaster на softsearch.ru>
> Здравствуйте, Grigory.
>
> > Для выделения ключевых слов её использовать не надо, а вот для
> > поиска похожих текстов по уже выделенным словам можно было бы. Как
> > достаточно быстрое решение, думаю, это годится. Незачем в этом месте
> > писать свою работу с индексом. Но если дальше алгоритм планируется
> > увести за пределы использования ключевых слов, то да, нужно нечто
> > большее.
>
> Всё верно.
>
> А как быть вот с такими текстами? К ним ведь тоже можно подыскивать
> что-то схожее, если научиться понимать их смысл:
>
==cut==
Безусловно, для каждого конкретного алгоритма можно найти тексты, на
которых он работать не будет :)
На изначально заявленные новостные материалы оба примера не очень подходят,
так что здесь вопрос, какую конкретно задачу кто решает. При желании и с
такими текстами можно как-то быть, вопрос для чего? Это любовь к искусству
или какая-то бизнес-задача?
> Тут или невозможно вычленить какие-то объекты или они не имеют смысла,
> ибо упоминании имени ни о чём не говорит, кроме связи между автором и
> человеком с этим именем, коих миллионы. Ту то ли структуру предложений
> надо анализировать, то ли ещё что-то...
>
>
Лучше создавать сильный ИИ :)
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20120913/ceb6748d/attachment.html>
Подробная информация о списке рассылки Moscow-pm