|
П.Е. Велихов "Меры семантической близости статей Википедии и их применение к обработке текстов" |
|
Аннотация.
Рассмотрены меры семантической близости статей Википедии и их применение к задачам обработки текстов и информационного поиска. Приведены требования к мерам семантической близости для задач вычисления близости между парой статей и для ранжирования всех статей Википедии относительно заданной. Предложены эвристические методы эффективного ранжирования для отдельного класса мер. Приведены экспериментальные данные, подтверждающие эффективность предложенного подхода. Кратко рассмотрены методы, реализованные в системе Texture. Ключевые слова:
семантическая близость, Википедия, анализ текстов, информационный поиск. Автор:
Велихов Павел Евгеньевич. Научный сотрудник НИИСИ РАН. Окончил Калифорнийский университет, Сан-Диего в 2000 году. Имеет 9 публикаций. Круг научных интересов: базы данных и искусственный интеллект.
|