[Moscow.pm] Имена кластеров.
Михаил Монашёв
postmaster на softsearch.ru
Вс Окт 30 09:40:39 PDT 2011
Здравствуйте, Grigory.
Я хотел теорию почитать.
> А какая конкретно задача? Этому целая область посвящена -- Multiple
> Document Summarization.
> Где-то для этого достаточно выбрать заголовок одного из документов,
> где-то достаточно наиболее представительного тэга или именной группы,
> а где-то нужно ещё и сделать обобщение, например, с использованием
> тезаурусов и создать аннотацию, которая ни в каком конкретном
> документе не содержится. Сложность соответственно тоже очень разная,
> от простого подсчёта и выбора наиболее частотной сущности до сложных
> алгоритмов машинного обучения с использованием лингвистического
> обеспечения.
>> Может кто знает алгоритмы поиска названий кластеров, когда на кластеры
>> разбиваются текстовые документы?
>>
--
С уважением,
Михаил mailto:postmaster на softsearch.ru
Подробная информация о списке рассылки Moscow-pm