МЕТОДЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
РАСПОЗНАВАНИЕ ОБРАЗОВ
М. А. Поволоцкий, Д. В. Тропин, Т. С. Чернов, Б. И. Савельев "Метод сегментации структурированных текстовых объектов на изображении с помощью динамического программирования"
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
М. А. Поволоцкий, Д. В. Тропин, Т. С. Чернов, Б. И. Савельев "Метод сегментации структурированных текстовых объектов на изображении с помощью динамического программирования"

Аннотация.

Рассматривается задача сегментации изображений текстовых фрагментов с известными ограничениями на взаимное расположение элементов. Рассматривается модель, в которой граф ограничений является простой цепью. Показано, что задача сегментации в этом случае может быть решена точно с помощью алгоритма динамического программирования, причем этот алгоритм обладает оптимальной асимптотической трудоемкостью. Данный алгоритм был встроен в две системы распознавания. Первая система предназначена для распознавания документов, удостоверяющих личность, таких как паспорта и водительские права. Вторая система предназначена для распознавания автомобильных номеров, в ней предложенный алгоритм был использован для сегментации номеров на отдельные символы. Проведены эксперименты на закрытом наборе данных по замеру качества и производительности полученных решений на мобильном телефоне. Экспериментальные результаты показали, что полученные решения превосходят по качеству алгоритмы, не использующие ограничения на взаимное расположение элементов, а их трудоемкость позволяет работать на мобильных устройствах в режиме реального времени.

Ключевые слова:

сегментация текста, динамическое программирование, распознавание документов, обработка изображений, OCR.

Стр. 66-78.

DOI 10.14357/20718632190306

 Полная версия статьи в формате pdf.

Литература

1. Nagy G. Disruptive developments in document recognition //Pattern Recognition Letters. – 2016. – V. 79. – P. 106-112.
2. Арлазаров, В. В., Жуковский, А. Е., Кривцов, В. Е., Николаев, Д. П., Полевой, Д. В. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов //Информационные технологии и вычислительные системы. – 2014. – Т. 3. – С. 71-81.
3. Konovalenko I. A., Shemiakina J. A. Error values analysis for inaccurate projective transformation of a quadrangle //Journal of Physics: Conference Series. – IOP Publishing, 2018. – V. 1096. – №. 1. – P. 012038.
4. Feldbach M., Tönnies K. D. Robust Line Detection in Historical Church Registers //Joint Pattern Recognition Symposium. – Springer, Berlin, Heidelberg, 2001. – P. 140-147.
5. Арлазаров В. В., Постников В. В., Шоломов Д. Л. Cognitive Forms-система массового ввода структурированных документов //Труды Института системного анализа Российской академии наук. – 2002. – Т. 1. – С. 35-46.
6. Felzenszwalb, P. F., Girshick, R. B., McAllester, D., Ramanan, D. Object detection with discriminatively trained part-based models //IEEE transactions on pattern analysis and machine intelligence. – 2010. – V. 32. – №. 9. – P. 1627-1645.
7. Chrysos, G. G., Antonakos, E., Zafeiriou, S., Snape, P. Offline deformable face tracking in arbitrary videos //Proceedings of the IEEE International Conference on Computer Vision Workshops. – 2015. – P. 1-9.
8. Zhang, L., Kong, H., Liu, S., Wang, T., Chen, S., Sonka, M. Graph-based segmentation of abnormal nuclei in cervical cytology //Computerized Medical Imaging and Graphics. – 2017. – V. 56. – P. 38-48.
9. Sheshkus, A., Nikolaev, D. P., Ingacheva, A., Skoryukina,N. Approach to recognition of flexible form for credit card expiration date recognition as example //Eighth International Conference on Machine Vision (ICMV 2015). – International Society for Optics and Photonics. – 2015. – V. 9875. – P. 98750R.
10. Слугин Д. Г., Арлазаров В. В. Поиск текстовых полей документа с помощью методов обработки изображений //Труды Института системного анализа Российской академии наук. – 2017. – Т. 67. – №. 4. – С. 65-73.
11. Louloudis, G., Gatos, B., Pratikakis, I., Halatsis, C. Text line and word segmentation of handwritten documents //Pattern Recognition. – 2009. – V. 42. – №. 12. – P. 3169-3183.
12. Wang K., Belongie S. Word spotting in the wild //European Conference on Computer Vision. – Springer, Berlin, Heidelberg, 2010. – P. 591-604.
13. Epshtein B., Ofek E., Wexler Y. Detecting text in natural scenes with stroke width transform //2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – IEEE, 2010. – P. 2963-2970.
14. Turki H., Halima M. B., Alimi A. M. A hybrid method of natural scene text detection using MSERs masks in HSV space color //Ninth International Conference on Machine Vision (ICMV 2016). – International Society for Optics and Photonics, 2017. – V. 10341. – P. 1034111.
15. Felzenszwalb P. F., Zabih R. Dynamic programming and graph algorithms in computer vision //IEEE transactions on pattern analysis and machine intelligence. – 2011. – V. 33. – №. 4. – P. 721-740.
16. Van Herk M. A fast algorithm for local minimum and maximum filters on rectangular and octagonal kernels //Pattern Recognition Letters. – 1992. – V. 13. – №. 7. – P. 517-521.
17. Otsu N. A threshold selection method from gray-level histograms //IEEE transactions on systems, man, and cybernetics. – 1979. – V. 9. – №. 1. – P. 62-66.
18. Viola P., Jones M. Rapid object detection using a boosted cascade of simple features //Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. – IEEE, 2001. – V. 1. – P. I-I.
19. Bulatov K. B., Arlazarov V. V., Chernov T. S., Slavin O. A., Nikolaev D. P. Smart IDReader: Document Recognition in Video Stream // 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – IEEE, 2017. – V. 6. – P. 39-44. ISSN 2379-2140, ISBN 978-15-38635-86-5, doi: 10.1109/ICDAR.2017.347.
20. Povolotskiy M. A., Tropin D. V. Dynamic programming approach to template-based OCR //Eleventh International Conference on Machine Vision (ICMV 2018). – International Society for Optics and Photonics, 2019. – V. 11041. – P. 110411T.
21. Yujian L., Bo L. A normalized Levenshtein distance metric //IEEE transactions on pattern analysis and machine intelligence. – 2007. – V. 29. – №. 6. – P. 1091-1095.
22. Povolotskiy M. A., Kuznetsova E. G., Khanipov T. M. Russian license plate segmentation based on dynamic time warping //European Conference on Modelling and Simulation. – 2017. – P. 285-291.
23. Поволоцкий М. А., Кузнецова Е. Г., Уткин Н. В., Николаев Д. П.. Сегментация регистрационных номеров автомобилей с применением алгоритма динамической трансформации временной оси //Сенсорные системы. – 2018. – Т. 32. – № 1. – С. 50-59. doi: 10.7868/S0235009218010080
24. Visillect. МАРИНА — Модуль распознавания номеров автомобилей. 2019. URL: http://visillect.com/ru/alpr
 

2024 / 03
2024 / 02
2024 / 01
2023 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".