МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
А.О. Шигаров, И.В. Бычков, Г.М. Ружников, А.Е. Хмельнов, Р.К. Федоров "Система трансформации таблиц"
ИНТЕРНЕТ-ТЕХНОЛОГИИ
КОМПЬЮТЕРНАЯ ГРАФИКА
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ТЕКСТОВ
ПРИКЛАДНЫЕ АСПЕКТЫ ИНФОРМАТИКИ
БИОИНФОРМАТИКА И МЕДИЦИНА
А.О. Шигаров, И.В. Бычков, Г.М. Ружников, А.Е. Хмельнов, Р.К. Федоров "Система трансформации таблиц"

Аннотация.

Работа посвящена вопросам анализа логической компоновки таблицы в задаче структурирования табличной информации, содержащейся в неструктурированных документах и изначально предназначенной для восприятия человеком, а не для машинной обработки. Предлагается система трансформации таблицы от слабоструктурированного представления к отношению реляционной модели данных. Эта система обеспечивает полуавтоматическое восстановление используемых в таблице измерений (доменов). Трансформация ориентирована на таблицы, сформированные из баз данных.

Ключевые слова:

анализ и распознавание документов, извлечение информации из таблиц, анализ и обработка таблиц, преобразование таблиц.

Стр. 15-26.

A.O. Shigarov, I.V. Bychkov, G.M. Ruzhnikov, A.E. Hmelnov, R.K. Fedorov

"Table transformation system"

In the paper issues of table (logical) layout analysis are discussed. The task of structuring table information presented on unstructured documents and addressed to human comprehension to structured representation is particularly considered. The table transformation (conversion) system from semistructured
representation to relation in database is proposed. The system provides a semi-automatic recovering dimensions (domains) used in a table. Proposed transformation is focused on tables originally generated from databases.

Keywords: document analysis and recognition, information extraction from tables, table analysis and processing, table conversion.

 Полная версия статьи в формате pdf.

2024 / 01
2023 / 04
2023 / 03
2023 / 02

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".