|
М.В. Хачумов "Задача кластеризации текстовых документов" |
|
Аннотация.
В статье рассмотрены вопросы совершенствования технологии кластеризации тек-стовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты под-тверждают эффективность предложенного подхода. Ключевые слова:
текст, кластеризация, класс, вектор, метрика, центр кластера, рубрика, эксперимент.
|