[Moscow.pm] Анализ русскоязычных текстов

Олег Малёваный deer_oleg на mail.ru
Пт Окт 30 02:18:39 PDT 2009


День добрый

На лекциях по ИИ в институте так  и учили.
Есть таблицы с окончаниями, есть таблицы в приставками и т.п.
Перебираем возможные приставки, суффиксы, окончания. Получаем общую часть -
корень.

Сейчас уже ничего не сохранилось, но в Интернете, я думаю можно найти.
Ищите по предмету "Искусственный Интеллект"

 
 
------
С Уважением, Олег Малёваный
 
> >-----Original Message-----
> >From: moscow-pm-bounces+deer_oleg=mail.ru на pm.org [mailto:moscow-pm-
> >bounces+deer_oleg=mail.ru на pm.org] On Behalf Of Andrew Shitov
> >Sent: Friday, October 30, 2009 12:07 PM
> >To: Moscow.pm group
> >Subject: Re: [Moscow.pm] Анализ русскоязычных текстов
> >
> >> На входе подаются слова "красный" "краснота" и "покраснеть" а на
> >> выходе должны получить одно и тоже, благодаря чему можно их
> >> сгруппировать по смыслу. (Еще пример: "пообедать", "обедать",
> >> "обеденный")
> >
> >Простой алгоритм можно сделать, если от слова отбросить окончание,
> >суффикс и приставку.
> >
> >Берем "пообедать". Словоформы: пообедав, пообедаем, пообедает,
> >пообедаете, пообедаешь, пообедай, пообедайте, пообедал, пообедала,
> >пообедали, пообедало, пообедаю, пообедают. Из словоформ выделяем общую
> >часть "пообеда". Убираем приставку "по" (должен быть набор известных),
> >остается "обеда".
> >
> >Если проделать с "обедать", то окончание исчезает тем же способом, а
> >приставки нет, опять остается "обеда".
> >
> >Но вообще лучше так не делать :-)
> >
> >--
> >Andrew Shitov
> >______________________________________________________________________
> >andy на shitov.ru | http://shitov.ru
> >--
> >Moscow.pm mailing list
> >moscow-pm на pm.org | http://moscow.pm.org


Подробная информация о списке рассылки Moscow-pm