[Moscow.pm] Поиск одинаковых текстов по смыслу

Grigory V.Sapunov grigory.sapunov на gmail.com
Ср Сен 12 21:00:18 PDT 2012


2012/9/13 Михаил Монашёв <postmaster на softsearch.ru>

> Здравствуйте, Grigory.
>
> > Для  выделения  ключевых  слов  её  использовать  не надо, а вот для
> > поиска  похожих  текстов по уже выделенным словам можно было бы. Как
> > достаточно быстрое решение, думаю, это годится. Незачем в этом месте
> > писать  свою  работу с индексом. Но если дальше алгоритм планируется
> > увести  за  пределы  использования ключевых слов, то да, нужно нечто
> > большее.
>
> Всё верно.
>
> А как быть вот с такими текстами? К ним ведь тоже можно подыскивать
> что-то схожее, если научиться понимать их смысл:
>

==cut==

Безусловно, для каждого конкретного алгоритма можно найти тексты, на
которых он работать не будет :)

На изначально заявленные новостные материалы оба примера не очень подходят,
так что здесь вопрос, какую конкретно задачу кто решает. При желании и с
такими текстами можно как-то быть, вопрос для чего? Это любовь к искусству
или какая-то бизнес-задача?


> Тут или невозможно вычленить какие-то объекты или они не имеют смысла,
> ибо  упоминании имени ни о чём не говорит, кроме связи между автором и
> человеком с этим именем, коих миллионы. Ту то ли структуру предложений
> надо анализировать, то ли ещё что-то...
>
>
Лучше создавать сильный ИИ :)
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20120913/ceb6748d/attachment.html>


Подробная информация о списке рассылки Moscow-pm