<div>Если совсем введение интересует, можно начать с книги Мэннинга, Шютце и Рагхавана (<a href="http://www-nlp.stanford.edu/IR-book/">http://www-nlp.stanford.edu/IR-book/</a>), главы про кластеризацию, статья в википедии во многом по ней построена: <a href="http://en.wikipedia.org/wiki/Cluster_labeling">http://en.wikipedia.org/wiki/Cluster_labeling</a></div>

<div><br></div><div>Введение в аннотирование есть у Мартина с Журафским в 23-й главе:</div><div><a href="http://www.amazon.com/speech-language-processing-daniel-jurafsky/dp/0131873210">http://www.amazon.com/speech-language-processing-daniel-jurafsky/dp/0131873210</a></div>

<div><br></div><div>Если нужно более глубоко, то скорее придётся по публикациям в тематических журналах и трудах конференций копать. Готовых книг, посвящённых именно этой проблеме, мне в руки не попадалось. Хотя у Springer что-то было...</div>

<div><br></div><div>2011/10/30 Михаил Монашёв <span dir="ltr"><<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a>></span></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Здравствуйте, Grigory.<br>
<br>
Я хотел теорию почитать.<br>
<div class="im"><br>
> А какая конкретно задача? Этому целая область посвящена -- Multiple<br>
> Document Summarization.<br>
<br>
> Где-то для этого достаточно выбрать заголовок одного из документов,<br>
> где-то достаточно наиболее представительного тэга или именной группы,<br>
> а где-то нужно ещё и сделать обобщение, например, с использованием<br>
> тезаурусов и создать аннотацию, которая ни в каком конкретном<br>
> документе не содержится. Сложность соответственно тоже очень разная,<br>
> от простого подсчёта и выбора наиболее частотной сущности до сложных<br>
> алгоритмов машинного обучения с использованием лингвистического<br>
> обеспечения.<br>
<br>
</div><div class="im">>> Может кто знает алгоритмы поиска названий кластеров, когда на кластеры<br>
>> разбиваются текстовые документы?<br>
>><br>
<br>
<br>
<br>
</div><div><div></div><div class="h5">--<br>
С уважением,<br>
 Михаил                          mailto:<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a><br>
<br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
</div></div></blockquote></div><br>