Аннотация.
В работе приведено решение для двух классических задач геометрической нормализации цифрового образа текста: компенсация глобального угла наклона документа и устранение локальных наклонов его текстовых фрагментов. Для обеих задач, отличающихся видом геометрических искажений, решение построено на базе единого метода анализа образа быстрого преобразования Хафа. Проведена конкретизация данного метода и предложены два алгоритма для решения указанных задач, а также проведена их апробация: для задачи нормализации наклона текста – на множестве как известных корпусов данных, так и на специально собранном и опубликованном корпусе кириллических фрагментов KRUS; для задачи нормализации наклона документа – на популярном корпусе DISEC. Показано, что отличительной особенностью предложенного метода является высокое быстродействие с возможностью обработки большого диапазона углов, а сам метод может быть успешно применен в системах автоматической обработки изображений документов.
Ключевые слова:
нормализация изображений, быстрое преобразование Хафа, анализ изображений документов.
DOI 10.14357/20718632240401
EDN VOYYXQ
Стр. 3-16.
Литература
1. Arlazarov V.V., Andreeva E.I., Bulatov K.B., Nikolaev D.P., Petrova O.O., Savelev B.I., Slavin O.A. Document image analysis and recognition: A survey // Компьютерная оптика. — 2022. — Т. 46. — № 4. — С. 567-589. — 10.18287/2412-6179-CO-1020. 2. Брухтий А.В., Куратов П.А. “Использование полутонового изображения при поиске границ символов”, Труды ИСА РАН, 2014, Т. 64, № 4, С. 80-83. 3. Чернов Т.С., Ильин Д.А., Безматерных П.В., Фараджев И.А., Карпенко С.М. “Исследование методов сегментации изображений текстовых блоков документов с помощью алгоритмов структурного анализа и машинного обучения”, Вестник РФФИ, 2016, № 4, С. 55-71, 10.22204/2410-4639-2016-092-04-55-71. 4. Chernyshova Y.S., Sheshkus A.V., Arlazarov V.V. Two-step CNN framework for text line recognition in camera-captured images // IEEE Access. — 2020. — Т. 8. — С. 32587-32600. — DOI: 10.1109/ACCESS.2020.2974051. 5. Brady M.L., Yong W., “Fast parallel discrete approximation algorithms for the Radon transform,” SPAA’92, 91–99, ACM, New York, NY, USA (1992). 6. Nikolaev D. P., Karpenko S. M., Nikolaev I. P., Nikolayev P. P. Hough transform: underestimated tool in the computer vision field // ECMS 2008, 2008, pp. 238-243, DOI: 10.7148 / 2008. 7. Ершов Е.И., Терехин А.П., Карпенко С.М., Николаев Д.П. “О точной оценке неточностей аппроксимации прямых в алгоритме быстрого преобразования Хафа”, ИТиС 2015, 2015, ISBN 978-59-01158-28-9, С. 858-868. 8. Hull J.J., “Document image skew detection: Survey and annotated bibliography,” DAS 1996, Malvern, PA, USA, October 14-16, 1996, Selected papers., 40–66 (1996). 9. Eynard L., Emptoz H., “Italic or roman: Word style recognition without a priori knowledge for old printed documents.” in ICDAR, 823–827, IEEE Computer Society (2009). 10. Brodic D., Milivojevic Z., “Text skew detection using combined entropy algorithm,” Information Technology And Control 46 (Sept. 2017). 11. Papandreou A., Gatos B., Perantonis S., Gerardis I., “Efficient skew detection of printed document images based on novel combination of enhanced profiles,” IJDAR 17, 433–454 (Sept. 2014). 12. Srihari S., Govindaraju V., “Analysis of textual images using the hough transform,” Machine Vision and Applications 2, 141–153 (jun 1989). 13. Boukharouba A., “A new algorithm for skew correction and baseline detection based on the randomized Hough transform,” Journal of King Saud University - Computer and Information Sciences 29, 29–38 (01 2017). 14. Yu B., Jain A., “A robust and fast skew detection algorithm for generic documents,” Pattern Recognition 29, 1599–1629 (10 1996). 15. Stahlberg F., Vogel S., “Document skew detection based on Hough space derivatives,” in 2015 13th International Conference on Document Analysis and Recognition (ICDAR), IEEE (08 2015). 16. Bozinovic R., Srihari S., “Off-line cursive script word recognition,” IEEE Trans. Pattern Anal. Mach. Intell. 11, 68–83 (Jan. 1989). 17. Uchida S., Taira E., Sakoe H., “Nonuniform slant correction using dynamic programming,” in ICDAR, 434– 438, IEEE Computer Society (2001). 18. Zhang L., Lu Y., Tan C., “Italic font recognition using stroke pattern analysis on wavelet decomposed word images,” in ICPR (4), 835–838, IEEE Computer Society (2004). 19. Fan K., Huang C., “Italic detection and rectification,” J. Inf. Sci. Eng. 23(2), 403–419 (2007). 20. Pastor M., Toselli A., Vidal E., “Projection profile based algorithm for slant removal.,” in ICIAR(2), Lecture Notes in Computer Science 3212, 183–190, Springer (2004). 21. Stahlberg F., Vogel S., “The QCRI recognition system for handwritten arabic,” 276–286 (2015). 22. Алиев М.А., Кунина И.А., Николаев Д.П., Полевой Д.В. “О практических аспектах вычисления Хаф-образа алгоритмом Брейди-Ёна” // Информационные процессы, 2023, Т. 23, № 2, С. 250-273, 10.53921/18195822_2023_23_2_250. 23. Бочаров Д.А. “Метод линейной регрессии, устойчивый к экстремальным стационарным помехам”, Сенсорные системы, 2020, Т. 34, № 1, С. 44-56, 10.31857/S0235009220010059. 24. Papandreou A., Gatos B., Louloudis G., Stamatopoulos N., “ICDAR 2013 document image skew estimation contest (DISEC 2013),” in ICDAR, (2013). 25. Bera S., Chakrabarti A., Lahiri S., Barney Smith E., Sarkar R., “Normalization of unconstrained handwritten words in terms of slope and slant correction,” Pattern Recognition Letters 128, 488–495 (Dec. 2019).
|