[Moscow.pm] Имена кластеров.

Grigory V.Sapunov grigory.sapunov на gmail.com
Вс Окт 30 02:47:05 PDT 2011


А какая конкретно задача? Этому целая область посвящена -- Multiple
Document Summarization.

Где-то для этого достаточно выбрать заголовок одного из документов,
где-то достаточно наиболее представительного тэга или именной группы,
а где-то нужно ещё и сделать обобщение, например, с использованием
тезаурусов и создать аннотацию, которая ни в каком конкретном
документе не содержится. Сложность соответственно тоже очень разная,
от простого подсчёта и выбора наиболее частотной сущности до сложных
алгоритмов машинного обучения с использованием лингвистического
обеспечения.

2011/10/29 Михаил Монашёв <postmaster на softsearch.ru>:
>
> Может кто знает алгоритмы поиска названий кластеров, когда на кластеры
> разбиваются текстовые документы?
>


Подробная информация о списке рассылки Moscow-pm