[Moscow.pm] Поиск одинаковых текстов по смыслу

alpha6 denis.fedoseev на gmail.com
Вт Сен 11 06:55:24 PDT 2012


А если загнать оба текста в индекс какой-нибудь искалки типа Lucene/Lucy и сравнить score по ключевым словам. Правда ключевые слова надо как-то вычленить еще.


С уважением,
Денис Федосеев

On 11 Sep 2012, at 5:50 PM, Nikolay Mishin <mi на ya.ru> wrote:

> ну да, получается ключевые слова+синонимы, хотя это очень упрощенно,
> но, как правило в новости есть рыба (начало(завязка) и конец), которая бывает разной на разных сайтах и тело новости, которое может быть достаточно похожим или заменено синонимами,
> получается что-то искусственного интеллекта, который выводит смысл текста и потом сравнивать эти смыслы
> 
> 11.09.2012, 17:26, "Alexandr Alexeev" <afiskon на gmail.com>:
>> Обычно смотрят по ключевым словам или меткам, если есть.
>> 
>> 11 сентября 2012 г., 17:20 пользователь Анатолий Шарифулин
>> <sharifulin на gmail.com> написал:
>> 
>>>  Привет!
>>> 
>>>  Есть два или более текстов, нужно узнать одинаковые (похожие) ли эти тексты
>>>  по смыслу.
>>>  Например, есть три новости, нужно понять, про одно и то же они или разные?
>>> 
>>>  Есть ли какие-нибудь готовые решения или наработки?
>>> 
>>>  --
>>>  С уважением,
>>>   Анатолий Шарифулин.
>>> 
>>>  --
>>>  Moscow.pm mailing list
>>>  moscow-pm на pm.org | http://moscow.pm.org
>> 
>> --
>> С уважением, Александр
>> Личный блог: http://eax.me/
>> Мой форум: http://it-talk.org/
>> Мой Twitter: http://twitter.com/afiskon
>> --
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
> 
> --
> Nikolay Mishin
> -- 
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org



Подробная информация о списке рассылки Moscow-pm