Математическое моделирование
П.Е. Велихов "Меры семантической близости статей Википедии и их применение к обработке текстов"
Управление и принятие решений
Распознавание образов
Высокопроизводительные вычислительные системы
Прикладные аспекты информатики
Аналитика
Abstracts
П.Е. Велихов "Меры семантической близости статей Википедии и их применение к обработке текстов"

Аннотация.

Рассмотрены меры семантической близости статей Википедии и их применение к задачам обработки текстов и информационного поиска. Приведены требования к мерам семантической близости для задач вычисления близости между парой статей и для ранжирования всех статей Википедии относительно заданной. Предложены эвристические методы эффективного ранжирования для отдельного класса мер. Приведены экспериментальные данные, подтверждающие эффективность предложенного подхода. Кратко рассмотрены методы, реализованные в системе Texture.

Ключевые слова:

семантическая близость, Википедия, анализ текстов, информационный поиск.

Автор:

Велихов Павел Евгеньевич.
Научный сотрудник НИИСИ РАН. Окончил Калифорнийский университет, Сан-Диего в 2000 году. Имеет 9 публикаций. Круг научных интересов: базы данных и искусственный интеллект.

Полная версия статьи в формате pdf.

 

2024 / 01
2023 / 04
2023 / 03
2023 / 02

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".