ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
РАСПОЗНАВАНИЕ ОБРАЗОВ
В.В. Арлазаров, А.Е. Жуковский, В.Е. Кривцов, Д.П. Николаев, Д.В. Полевой "Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов"
ПРИКЛАДНЫЕ АСПЕКТЫ ИНФОРМАТИКИ
ОБЗОРЫ
В.В. Арлазаров, А.Е. Жуковский, В.Е. Кривцов, Д.П. Николаев, Д.В. Полевой "Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов"

Аннотация.

Статья посвящена актуальной проблеме распознавания текстовых документов с использованием стационарных и мобильных малоразмерных цифровых камер в качестве устройств получения изображения. Авторами показаны различия в постановках задач, связанных, во-первых, с природой устройств, особенностями процесса формирования изображения и, во-вторых, с возможностью использования для распознавания текста видеопотока взамен одиночных изображений. На примере документов удостоверяющих личность рассмотрены основные проблемы и новые задачи, возникающие в процессе распознавания документа.

Ключевые слова:

распознавание текста, видеопоток, мобильные видеокамеры.

Стр. 71-81.

V.V. Arlasarov, A.E. Zhukovsky, V.E. Krivtsov, D.P. Nikolaev, D.V. Polevoy

"PATTERN RECOGNITION"

This article is devoted to problems of the optical recognition of the text documents captured by web and mobile digital cameras. The authors show difference in the statement problems of optical recognition based on nature of capturing devices and video-stream text recognition approach. Authors used ID documents to show main difference in problems and for new problems that comes from capturing device and process.

Keywords: OCR, video-stream text recognition, mobile and web cameras

Полная версия статьи в формате pdf.

REFERENCES

1.   Polevoy D.V. Aktualnye zadachi sozdaniya sistem massovogo vvoda s ispolzovaniem opticheskogo raspoznavaniya dlya preobrazovaniya slozhno strukturirovannykh bumazhnykh dokumentov v gibridnykh informatsionnykh sistemakh // Sistemnyy analiz i informatsionnye tekhnologii: tr. Chetvertoy  mezhdunar. konf. (Abzakovo, Rossiya, 17-23 avgusta 2011 g.): v 2 t. T.2. Chelyabinsk: Izd-vo Chelyab. gos. un-ta, 2011. S. 192-195.
2.   Arlazarov V.V., Postnikov V.V., Sholomov D.L. Cognitive Forms - sistema massovogo vvoda strukturirovannykh dokumentov // Trudy ISA RAN. 2002 S.35-46.
3.   Postnikov V.V., Sholomov D.L., Marchenko A.E. Flexi-Docs: The Template Driven Document Recognition Technology. Proceedings of the 6th German-Russian Work-shop on Pattern Recognition and Image Understanding (OGRW-6), 2003.
4.   Image scanner. –  URL: http://en.wikipedia.org/wiki/Image_scanner
5.   Konushin A. Geometriya kamery i struktura dvizheniya //  Kompyuternaya  grafika  i  multimedia.  –  URL: http://cgm.computergraphics.ru/content/view/141
6.   Image noise.   –   URL: http://en.wikipedia.org/wiki/Image_noise
7. Tropchenko A.A., Tropchenko A.Yu. Metody szhatiya izobrazheniy, audiosignalov i video. – SPb: SPbGU ITMO, 2009.
8.   Compression artifact.  –   URL: https://en.wikipedia.org/wiki/Compression_artifact
9.  Hartley R., Zisserman A.. Multiple view geometry in computer  vision  //  New  York:  Cambridge  University Press, 2003.
10. Nagy  G.  Twenty years  of  document image analysis in PAMI // Pattern Analysis and Machine Intelligence, IEEE Transactions on In Pattern Analysis and Machine Intelligence, IEEE Transactions on, Vol. 22, No. 1. (2000), pp. 38-62
11. Arlazarov V.L., Kuratov P.A., Loginov A.S., Slavin O.A. Algoritmy poiska granits pechatnykh simvolov, ispolzuemye pri opticheskom raspoznavanii simvolov // Informatsionnye tekhnologii i vychislitelnye sistemy № 4, 2004, C. 59-70.
12. Sposoby zashchity dokumentov. –  URL: http://www.bnti.ru/showart.asp?aid=940&lvl=02.09.05.
13. Arlazarov V.V., Krivtsov V.Ye., Polevoy D.V., Slugin D.G., Yanishevskiy I.M. Ot graficheskogo obraza k universalnomu predstavleniyu Formy dokumenta // Trudy ISA RAN, tom 63, vypusk 3, 2013. S. 95-05.
14. Kim S.K., Nikolayev D.P. Method and apparatus for sectioning image into plurality of regions // US patent. Application No. 09/983032, Publication No. US 2002/0102017 A1, 2002, Issued 11.07.2006 No. 7076095, 25 pp.
15. Nikolaev D.P., Karpenko S.M., Postnikov V.V. Preobrazovanie tsvetnogo izobrazhenie v monokhromnoe s sokhraneniem gradientnoy struktury // Iskusstvennye intellektualnye  sistemy  i  intellektualnye SAPR. Trudy mezhdunarodnoy konferentsii IEEE AIS'04 i CAD-2004. M.: Izd-vo Fizmatlit, 2004. T. 2, str. 320-323.
16. Queiroz R. De, Buckley R., Xu M. Mixed Raster Content (MRC)  Model  for  Compound  Image  Compression.  – 2000. – P. 1–12.
17. Usilin S., Nikolaev D., Sholomov D. Guilloche Elements Recognition Applied to Passport Page Processing // Proceedings of the 8th Open German-Russian Workshop “Pattern Recognition and Image Understanding” OGRW-8-2011, 2011. Pp. 303-306.
18. Usilin S.A., Nikolaev D.P., Postnikov V.V. Identifikatsiya izobrazheniy dokumentov metodami, prednaznachennymi dlya poiska lits // Informatsionnye tekhnologii i sistemy (ITiS’10): sbornik trudov konferentsii. M., 2010. S. 132–137.
19. Zhukovskiy A.Ye., Tarasova N.A., Usilin S.A., Nikolaev D.P. Sintez obuchayushchey vyborki na osnove realnykh dannykh v zadachakh raspoznavaniya izobrazheniy// Informatsionnye tekhnologii i sistemy (ITiS'12): sbornik trudov konferentsii. M., 2012. C. 377-382.
20. Usilin S.A., Nikolaev D.P., Postnikov V.V. Bystryy algoritm sovmeshcheniya izobrazheniy dokumentov v proizvolnoy geometricheskoy modeli // Trudy konferentsii "Informatsionnye tekhnologii i sistemy". - 2008. - S. 471 - 477.
21. Usilin S.A., Nikolaev D.P., Postnikov V.V. Lokalizatsiya, orientatsiya i identifikatsiya dokumentov s fiksirovannoy geometriey na izobrazhenii // Trudy Instituta sistemnogo analiza RAN. Obrabotka informatsionnykh i graficheskikh resursov / pod red. V.L. Arlazarov. M.: KRASAND, 2010. S. 248–261.
22. Slugin D.G. Osobennosti kontekstnogo raspoznavaniya rossiyskogo zagranichnogo    pasporta v sisteme Cognitive Passport. // Trudy Instituta sistemnogo analiza RAN, 2009. S. 174–183.
23. Arlazarov V.V., Bulatov K.B., Karpenko S.M.. Metod opredeleniya nadezhnosti raspoznavaniya v zadache raspoznavaniya tisnenykh simvolov. // Trudy ISA RAN, tom 63, vypusk 3, 2013. S. 117-122.
24. Arlazarov V.V., Malykh V.A., Sholomov D.L. Raspoznavanie izobrazheniy dokumentov s ispolzovaniem algoritma «ruletki» // Trudy ISA RAN, tom 63, vypusk 4, 2013. S. 35-38.
25. Polevoy D.V., Samoylov O.S. Zadacha kontrolya kachestva pri sozdanii i razvitii sistem opticheskogo raspoznavaniya pechatnogo teksta. // Tekhnologii programmirovaniya i khraneniya dannykh /Pod     red. V.L. Arlazarova, N. Ye. Yemelyanova, Trudy Instituta sistemnogo  analiza  RAN;  T.  45.  —  M.:  LYeNAND, 2009. S. 251-259
26.  Polevoy  D.V., Samoylov  O.S.  Otsenka  kachestva segmentatsii izobrazheniy pechatnykh dokumentov na primere sistemy opticheskogo raspoznavaniya tekstov OpenOCR / Obrabotka informatsionnykh i graficheskikh resursov / Pod red. V.L. Arlazarova. - M.: KRASAND, 2010. (Trudy Instituta sistemnogo analiza RAN; t.58.) S. 164-171.
 

2024 / 03
2024 / 02
2024 / 01
2023 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".