ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ
РАСПОЗНАВАНИЕ ОБРАЗОВ
ГЛОБАЛЬНЫЕ ПРОЕКТЫ И РЕШЕНИЯ
ПРИКЛАДНЫЕ АСПЕКТЫ ИНФОРМАТИКИ
П.В.Безматерных, Е.Л.Плискин и В.В.Фарсобина "Вычислительный комплекс для контроля качества распознавания структурированных документов"
П.В.Безматерных, Е.Л.Плискин и В.В.Фарсобина "Вычислительный комплекс для контроля качества распознавания структурированных документов"

Аннотация.

На сегодняшний день вычислительный эксперимент остаётся ежедневной рутинной процедурой при разработке программного обеспечения (ПО) с использованием методов обучения машин (МОМ). Известный под названием «непрерывной интеграции» подход к разработке ПО является естественным выбором при создании программ МО и, со своей стороны, предполагает частую централизованную сборку программы и выполнение стендовых испытаний. При этом генерируется большой объём результатов испытаний, которые должны быть оперативно доступны разработчикам для анализа ошибок и сравнения версий ПО. Авторами статьи разработана архитектура системы автоматического контроля качества программы распознавания структурированных документов, включая сбор, хранение и отображение результатов стендовых испытаний. Результаты испытаний ПО записываются в базу данных. Стендирование ПО может выполняться на виртуальных серверах под управлением различных операционных систем (ОС). Для устойчивости веб-сервер и база данных физически отделены от сборочного сервера. Веб-технологии используются как для автоматической загрузки результатов испытаний в БД, так и для обслуживания запросов пользователей.

Ключевые слова:

компьютерный эксперимент, методы обучения машин, реляционные базы данных, веб-технологии, регрессионное тестирование, непрерывная интеграция, контроль качества.

Стр. 94-102.

Литература

1. Duvall PM, Glover A, Matyas S. Continuous integration. Addison-Wesley Professional; 2007.
2. Elbaum, S., Rothermel, G. and Penix, J., 2014, November. Techniques for improving regression testing in continuous integration
development environments. In Proceedings of the22nd ACM SIGSOFT International Symposium on Foundations of Software Engineering (pp. 235-245). ACM.
3. Касторнова В. А., Можаева М. Г. Искусственные нейронные сети как современные средства информатизации. Информационная среда образования и науки, 2012, №1 (7).
4. Сервер автоматизации сборки и тестирования ПО Jenkins: https://jenkins.io/.
5. Smart, J.F. «Jenkins: The Definitive Guide». O'Reilly Media, Inc. 2011. ISBN: 1449305350 9781449305352.
6. Косенко Д.В., Воронова Л.И., Воронов В.И. Разработка программного обеспечения для обработки сложно-структурированных данных научного эксперимента.
Вестник Нижневартовского государственного университета, 2014, № 3.
7. Полевой Д.В., Самойлов, О.С. Задача контроля качества при создании и развитии систем оптического распознавания печатного текста. Технологии программирования и хранения данных/Труды Института системного анализа РАН 45 (2009): 251-259.
8. Полевой Д.В. Актуальные задачи создания систем массового ввода с использованием оптического распознавания для преобразования сложно структурированных бумажных документов в гибридных информационных системах // Системный анализ и информационные технологии: тр. Четвертой междунар. конф. (Абзаково, Россия, 17-23 августа 2011 г.): в 2 т. Т.2. Челябинск: Изд-во Челяб. гос. ун-та, 2011. С. 192-195.
9. Арлазаров В.Л., Куратов П.А., Славин, О.А. Распознавание строк печатных текстов. Сб. трудов ИСА РАН «Методы и средства работы с документами». М.: Эдиториал УРСС, 2000, с.31-51.
10. Bulatov K., Arlazarov V., Chernov T., Slavin O. and Nikolaev D. Smart IDReader: Document recognition in video stream // The 14th IAPR International Conference on Document Analysis and Recognition (ICDAR 2017), Workshops and Tutorials: November 9-12, Kyoto, Japan, 2017 – p. 39-44. ISSN: 2379-2140 http://ieeexplore.ieee.org/document/8270294/, doi: 10.1109/ICDAR.2017.347.
11. Полевой Д., Булатов К., Скорюкина Н., Чернов Т., Арлазаров В.В., Шешкус А.В. Ключевые аспекты распознавания документов с использованием малоразмерных цифровых камер. Вестник РФФИ, 2016, № 4 (92), С. 97-108.
12. Skoryukina N., Chernov T., Bulatov K., Nikolaev D. and Arlazarov V.L. Snapscreen: TV-stream frame search with projectively distorted and noisy query. Proc. SPIE 10341, Ninth International Conference on Machine Vision (ICMV 2016), 103410Y, pp. 1-5. doi:10.1117/12.2268735.
13. В.Л. Арлазаров, А. Марченко, Д. Шоломов. Накопительные контексты в задаче распознавания. Труды ИСА РАН, 2014, Т. 64. №4, с. 64-72.
14. Будаковский М.В., Михайлов А.А. Проблемы формализации разметки графического образа документа. Труды ИСА РАН, 2014, Т.64. № 4. С. 84-88.
 

2018 / 02
2018 / 01
2017 / 04
2017 / 03

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".