СИСТЕМЫ УПРАВЛЕНИЯ
ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ
Д. П. Маталов, Е. Л. Плискин "Веб-сервис на основе SDK для распознавания документов"
МЕТОДЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
КВАНТОВАЯ ИНФОРМАТИКА
ПРОБЛЕМЫ БЕЗОПАСНОСТИ
Д. П. Маталов, Е. Л. Плискин "Веб-сервис на основе SDK для распознавания документов"

Аннотация.

Статья обобщает опыт разработки веб-службы на основе SDK для распознавания документов (OCR). Рассматриваются вопросы устойчивости и производительности веб-службы: способность не терять данные при высокой нагрузке и после перезапуска; способность своевременно обнаруживать ошибки, ограничивать их распространение и длительность; а также свойство детерминированности веб-службы в условиях параллельной обработки множества запросов. Высокая производительность подразумевает умеренные накладные расходы, связанные с приёмом запросов и отправкой ответов клиентам, помимо собственно распознавания. Описанное решение может применяться для создания веб-службы из любого SDK, который позволяет обрабатывать входные документы и получать из них выходные файлы, в том числе не обязательно в связи с технологиями оптического распознавания.

Ключевые слова:

SDK, SOAP, REST, Java, Web service, оптическое распознавание, OCR, многопоточность.

Стр. 32-43.

DOI 10.14357/20718632190204

Полная версия статьи в формате pdf. 

Литература

1. Арлазаров В. В., Булатов К. Б., Усков А. В. Модель системы распознавания объектов в видеопотоке мобильного устройства // Труды ИСА РАН. — 2018. — Спецвыпуск, 2018. — С. 73-82. — DOI: 10.14357/20790279180508.
2. V. V. Arlazarov, O. A. Slavin, A. V. Uskov and I. M. Yanishevskiy, “Modelling the flow of character recognition results in video stream,” Bulletin of the South Ural State University. Ser. Mathematical Modelling, Programming & Computer Software, vol. 11, no 2, pp. 14-28, 2018, DOI: 10.14529/mmp180202.
3. K. B. Bulatov, V. V. Arlazarov, T. S. Chernov, O. A. Slavin and D. P. Nikolaev, “Smart IDReader: Document Recognition in Video Stream,” ICDAR2017, IEEE Computer Society, ISSN 2379-2140, ISBN 978-15-38635-86-5, pp. 39-44, 2017, DOI: 10.1109/ICDAR.2017.347.
4. Zur Muehlen M., Nickerson J. V., Swenson K. D. Developing web services choreography standards—the case of REST vs. SOAP //Decision Support Systems. – 2005. – Т. 40. – №. 1. – С. 9-29.
5. Amin Z., Singh H., Sethi N. Review on fault tolerance techniques in cloud computing //International Journal of Computer Applications. – 2015. – Т. 116. – №. 18.
6. Jhawar R., Piuri V. Fault tolerance and resilience in cloud computing environments //Computer and information security handbook. – Morgan Kaufmann, 2017. – С. 165-18.
7. Lamiroy B., Lopresti D. P. The DAE platform: a framework for reproducible research in document image analysis //International Workshop on Reproducible Research in Pattern Recognition. – Springer, Cham, 2016. – С. 17-29.
8. Jayathilaka H., Krintz C., Wolski R. Service-level agreement durability for web service response time //2015 IEEE 7th International Conference on Cloud Computing Technology and Science (CloudCom). – IEEE, 2015. – С. 331-338.
9. Wittern E. et al. Opportunities in software engineering research for web API consumption //Proceedings of the 1st International Workshop on API Usage and Evolution. – IEEE Press, 2017. – С. 7-10.
10. Dragoni N. et al. Microservices: yesterday, today, and tomorrow //Present and Ulterior Software Engineering. – Springer, Cham, 2017. – С. 195-216.
11. Karlsson E. The evolution and erosion of a serviceoriented architecture in enterprise software: A study of a service-oriented architecture and its transition to a microservice architecture. – 2018.
12. Würsch M., Ingold R., Liwicki M. Sdk reinvented: Document image analysis methods as restful web services //2016 12th IAPR Workshop on Document Analysis Systems (DAS). – IEEE, 2016. – С. 90-95.
13. Würsch M. et al. Turning Document Image Analysis Methods into Web Services-An Example Using OCRopus //2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – IEEE, 2017. – Т. 4. – С. 48-52.
14. Watching a Directory for Changes. https://docs.oracle.com/javase/tutorial/essential/io/notification.html
15. Cholia S., Skinner D., Boverhof J. NEWT: A RESTful service for building High Performance Computing web applications //2010 Gateway Computing Environments Workshop (GCE). – IEEE, 2010. – С. 1-11.
16. Boettiger C. An introduction to Docker for reproducible research //ACM SIGOPS Operating Systems Review. – 2015. – Т. 49. – №. 1. – С. 71-79.
17. Apache Tomcat. http://tomcat.apache.org/
18. Building RESTful Web Services with JAX-RS. https://docs.oracle.com/cd/E19798-01/821-1841/6nmq2cp1v/index.html
19. Building Web Services with JAX-WS. https://docs.oracle.com/cd/E19798-01/821-1841/bnayl/index.html
20. Google Cloud Vision API. https://cloud.google.com/vision/
21. Microsoft’s Computer Vision API. https://azure.microsoft.com/en-us/services/cognitiveservices/computer-vision/
22. FreeOCR API. https://ocr.space/ocrapi
23. OCR Cloud 2.0 API. http://www.ocr-it.com/ocr-cloud-2-0-api/
24. Tabex-OCR-REST-API-Precise-Developers-OCR. http://pdfextractoronline.com/tabex-ocr-rest-api/
25. https://blog.iron.io/the-overhead-of-docker-run/
26. https://www.docker.com/
27. Xu Y. et al. A privacy-preserving content-based image retrieval method in cloud environment //Journal of Visual Communication and Image Representation. – 2017. – Т. 43. – С. 164-172.
28. Zhang L. et al. Pic: Enable large-scale privacy preserving content-based image search on cloud //IEEE Transactions on Parallel and Distributed Systems. – 2017. – Т. 28. – №. 11. – С. 3258-3271.
29. Hu H. et al. Web-scale responsive visual search at bing //Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. – ACM, 2018. – С. 359-367.
30. Aweya J. et al. An adaptive load balancing scheme for web servers //International Journal of Network Management. – 2002. – Т. 12. – №. 1. – С. 3-39.
 

2021 / 03
2021 / 02
2021 / 01
2020 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".