<div class="gmail_quote">2012/9/13 Михаил Монашёв <span dir="ltr"><<a href="mailto:postmaster@softsearch.ru" target="_blank">postmaster@softsearch.ru</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Здравствуйте, Grigory.<br>
<div class="im"><br>
> Для  выделения  ключевых  слов  её  использовать  не надо, а вот для<br>
> поиска  похожих  текстов по уже выделенным словам можно было бы. Как<br>
> достаточно быстрое решение, думаю, это годится. Незачем в этом месте<br>
> писать  свою  работу с индексом. Но если дальше алгоритм планируется<br>
> увести  за  пределы  использования ключевых слов, то да, нужно нечто<br>
> большее.<br>
<br>
</div>Всё верно.<br>
<br>
А как быть вот с такими текстами? К ним ведь тоже можно подыскивать<br>
что-то схожее, если научиться понимать их смысл:<br></blockquote><div><br></div><div>==cut==</div><div><br></div><div>Безусловно, для каждого конкретного алгоритма можно найти тексты, на которых он работать не будет :)</div>

<div><br></div><div>На изначально заявленные новостные материалы оба примера не очень подходят, так что здесь вопрос, какую конкретно задачу кто решает. При желании и с такими текстами можно как-то быть, вопрос для чего? Это любовь к искусству или какая-то бизнес-задача? </div>

<div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Тут или невозможно вычленить какие-то объекты или они не имеют смысла,<br>
ибо  упоминании имени ни о чём не говорит, кроме связи между автором и<br>
человеком с этим именем, коих миллионы. Ту то ли структуру предложений<br>
надо анализировать, то ли ещё что-то...<br>
<div class="HOEnZb"><div class="h5"><br></div></div></blockquote><div><br></div><div>Лучше создавать сильный ИИ :)</div><div> </div></div>