Журнал «Информационные технологии и вычислительные системы» - О. А. Славин "Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов"

Просматривается номер 2022 / 04

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

V. V. Arlazarov, A. V. Chuiko, O. A. Slavin "A Model for Assessing the Reliability of Document Text Field Recognition"

О. А. Славин "Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов"

А. В. Мальцев, Д. В. Омельченко "Моделирование систем видео наблюдения в 3D сценах для виртуального окружения"

ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ И СЕТИ

В. И. Зубов, А. Ф. Албу "О методах численного решения одной спектральной задачи"

А. Е. Маслов, А. А. Зорин "Анализ производительности векторизованных алгоритмов"

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

V. D. Ilyin "S-Modeling: an Introduction to Updated Theory

Ю. А. Дубнов, А. В. Булычев "Приближенное оценивание с помощью ускоренного метода наибольшей энтропии. Часть 1. Постановка задачи и реализация для задачи регрессии"

Е. В. Страшнов, И. Н. Мироненко, Л. А. Финагин "Моделирование посадки космического аппарата на Луну в системах виртуального окружения"

Г. С. Смирнова, Р. А. Сабитов, Р. Т. Сиразетдинов, А. В. Епонешников, Ш. Р. Сабитов "Модель процессов устойчивого развития для цифрового двойника сельскохозяйственного производства"

А. А. Сидоров "Объектно иерархический подход к созданию Workflow для задач геологического моделирования"


	О. А. Славин "Применение дескрипторов объектов для привязки структурных элементов зашумленных образов деловых документов"
Аннотация. Рассматривается задача извлечения из распознанного образа документа элементов заполнения (полей) с помощью дескрипторов – описаний одного или нескольких структурных элементов. Структурными элементами могут быть слова статического текста и линии разграфки, используемые для оформления дизайна документа. Рассматриваются деловые документы с упрощенной структурой и ограниченным словарем. Рассматриваются гибкие деловые документы, допускающие существенные модификации дизайна страницы. Дескрипторы создаются с учетом значительного числа возможных ошибок распознавания страниц документов. Описываются комбинированные дескрипторы, состоящие из нескольких термов и отрезков линий. Приводится алгоритм привязки, базирующийся на дескрипторах. Экспериментально показывается, что извлечение комбинированных дескрипторов улучшает точность распознавания полей документа при распознавании на 17%, а точность извлечения информации из образа документа – на 16%. В качестве OCR в эксперименте использовалась система SDK Smart Document Engine. Ключевые слова: зашумленный образ, распознавание документа, текстовая особая точка, дескриптор. Стр. 13-24. DOI 10.14357/20718632220402 Литература 1. Башкатова, A. Цифровая экономика плодит все больше бумаг: Россияне не скоро перестанут носить в организации справки / Независимая Газета. – 2019 – 14 ноя. https://www.ng.ru/economics/2019-11- 14/4_7727_paper.html (Доступ 22.09.2022) 2. Rusiñol M., Frinken V., Karatzas, D., Bagdanov, A. D., Lladós, J.: Multimodal page classification inadministrative document image streams. In: IJDAR. Vol. 17(4), pp. 331 Image Classification by Mixed Finite Element Method and Orthogonal Legendre Moments 341. (2014). https://doi.org/10.1007/s10032-014-0225-8 3. Jain, R., Wigington, C.: Multimodal Document Image Classification. pp. 71–77. (2019). https://doi.org/10.1109/ICDAR.2019.00021 4. Qasim, S. Rukh., Mahmood, H., Shafait, F.: Rethinking Table Recognition using Graph Neural Networks. pp. 142–147. (2019). https://doi.org/10.1109/ICDAR.2019.00031 5. Марченко, А. Е., Ершов, Е. И., Гладилин, С. А. Система разбора документов, заданных атрибутами элементов структуры и отношениями между элементами / Труды ИСА РАН, Т. 67(4). сс. 87–97. (2017). 6. Postnikov V. V.: Identification and Recognition of Documents with a Predefined Structure // Pattern Recognition and Image Analysis. Vol. 13. № 2. pp. 332–334. (2003) 7. Smart Document Engine – automatic analysis and data extraction from business documents for desktop, server and mobile platforms / https://smartengines.com/ocrengines/ document-scanner (Доступ 22.09.2022) 8. Bellavia, F.: SIFT Matching by Context Exposed. IEEE Transactions on Pattern Analysis and Machine Intelligence. (2022). https://doi.org/10.1109/TPAMI.2022.3161853 9. Bay, H., Tuytelaars, T., Van Gool, Luc.: SURF: Speeded Up Robust Features. Computer Vision and Image Understanding - CVIU. Vol. 110. No. 3, pp. 404–417. (2006). 10. Slavin, O., Andreeva, E., Paramonov, N.: Matching Digital Copies of Documents Based on OCR, 2019 XXI International Conference Complex Systems: Control and Modeling Problems (CSCMP), pp. 177–181, (2019). https://doi.org/10.1109/CSCMP45713.2019.8976570 11. Slavin, O., Arlazarov, V., Tarkhanov, I.: Models and Methods Flexible Documents Matching Based on the Recognized Words. Cyber-Physical Systems: Advances in Design & Modelling. Springer Nature Switzerland AG. Vol. 350, pp. 173–184 (2021). https://doi.org/10.1007/978-3-030-67892-0_15 12. Matas, J., Galambos, C., Kittler, J.: Robust Detection of Lines Using the Progressive Probabilistic Hough Transform, Computer Vision and Image Understanding, Vol. 78, Issue 1, pp. 119–137, (2000). https://doi.org/10.1006/cviu.1999.0831 13. Grompone von Gioi, R., Jakubowicz, J., Morel, JM. et al.: On Straight Line Segment Detection. J Math Imaging Vis. Vol. 32, pp. 313–347. (2008). https://doi.org/10.1007/s10851- 008-0102-5 14. Grompone von Gioi R., Jakubowicz J., Morel J.-M., Randall G.: LSD: A Fast Line Segment Detector with a False Detection Control / IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 32, Issue 4. pp. 722–732. (2010). https://doi.org/10.1109/TPAMI.2008.300 15. Emaletdinova, L. & Nazarov, M.: Construction of a Fuzzy Model for Contour Selection. Construction of a Fuzzy Model for Contour Selection. In: Kravets, A.G., Bolshakov, A.A., Shcherbakov, M. (eds) Cyber-Physical Systems: Intelligent Models and Algorithms. Studies in Systems, Decision and Control, Vol. 417. pp. 243–246. (2022). https://doi.org/10.1007/978-3-030-95116-0_20. 16. Zlobin, P., Chernyshova, Y., Sheshkus A., Arlazarov V. V.: Character sequence prediction method for training data creation in the task of text recognition. Proc. SPIE 12084, Fourteenth International Conference on Machine Vision (ICMV 2021), 120840R. (2022). https://doi.org/10.1117/12.2623773 17. Matalov, D., Usilin, S., Arlazarov, V.V.: About Viola- Jones image classifier structure in the problem of stamp detection in document images. Proc. SPIE 11605, Thirteenth International Conference on Machine Vision, 116050V (2021). https://doi.org/10.1117/12.2586842 18. Arlazarov, V., Voysyat, Ju. S., Matalov, D., Nikolaev, D., Usilin, S.A.: Evolution of the Viola-Jones Object DetectionMethod: A Survey. Vol. 14. pp. 52–23. (2021). https://doi.org/10.14529/mmp210401

2024 / 01

2023 / 04

2023 / 03

2023 / 02