<div class="gmail_quote">2012/9/13 Михаил Монашёв <span dir="ltr"><<a href="mailto:postmaster@softsearch.ru" target="_blank">postmaster@softsearch.ru</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


Здравствуйте, Grigory.<br>

<div class="im"><br>

> Для  выделения  ключевых  слов  её  использовать  не надо, а вот для<br>

> поиска  похожих  текстов по уже выделенным словам можно было бы. Как<br>

> достаточно быстрое решение, думаю, это годится. Незачем в этом месте<br>

> писать  свою  работу с индексом. Но если дальше алгоритм планируется<br>

> увести  за  пределы  использования ключевых слов, то да, нужно нечто<br>

> большее.<br>

<br>

</div>Всё верно.<br>

<br>

А как быть вот с такими текстами? К ним ведь тоже можно подыскивать<br>

что-то схожее, если научиться понимать их смысл:<br></blockquote><div><br></div><div>==cut==</div><div><br></div><div>Безусловно, для каждого конкретного алгоритма можно найти тексты, на которых он работать не будет :)</div>


<div><br></div><div>На изначально заявленные новостные материалы оба примера не очень подходят, так что здесь вопрос, какую конкретно задачу кто решает. При желании и с такими текстами можно как-то быть, вопрос для чего? Это любовь к искусству или какая-то бизнес-задача? </div>


<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>

Тут или невозможно вычленить какие-то объекты или они не имеют смысла,<br>

ибо  упоминании имени ни о чём не говорит, кроме связи между автором и<br>

человеком с этим именем, коих миллионы. Ту то ли структуру предложений<br>

надо анализировать, то ли ещё что-то...<br>

<div class="HOEnZb"><div class="h5"><br></div></div></blockquote><div><br></div><div>Лучше создавать сильный ИИ :)</div><div> </div></div>