Интересная задача, по-моему готовых решений нет.<div>Все морфологические системы обычно останавливаются на уровне основы.</div><div><br></div><div>Если такое сделать, то можно задорого продавать :)</div><div><br></div><div>
Я думаю, что надо взять большой словарь и какую-нибудь морфологию и действовать как предложил Андрей. Но будет много кропотливой человеческой работы по проверке каждого корня, по сбору словарей приставок и суффиксов и т.д.</div>
<div><br clear="all">-- <br>Alex Kapranoff.<br>
<br><br><div class="gmail_quote">2009/10/30 xames <span dir="ltr"><<a href="mailto:xamess@gmail.com">xamess@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
На входе подаются слова "красный" "краснота" и "покраснеть" а на<br>
выходе должны получить одно и тоже, благодаря чему можно их<br>
сгруппировать по смыслу. (Еще пример: "пообедать", "обедать",<br>
"обеденный")<br>
<br>
30 октября 2009 г. 11:50 пользователь Alex Kapranoff<br>
<<a href="mailto:kapranoff@gmail.com">kapranoff@gmail.com</a>> написал:<br>
<div><div></div><div class="h5">> А на самом деле задача какая? :) Сравнивать тексты с учётом морфологических<br>
> форм?<br>
><br>
> --<br>
> Alex Kapranoff.<br>
><br>
><br>
> 2009/10/30 xames <<a href="mailto:xamess@gmail.com">xamess@gmail.com</a>><br>
>><br>
>> Может кто сталкивался с задачей нахождения корней в словах ?<br>
>> Посоветуйте в какую сторону копать.<br>
>> --<br>
>> Moscow.pm mailing list<br>
>> <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
><br>
><br>
> --<br>
> Moscow.pm mailing list<br>
> <a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
><br>
><br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br></div>