ОБЗОРЫ
МЕТОДЫ И АЛГОРИТМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
КВАНТОВАЯ ИНФОРМАТИКА
АНАЛИЗ ДАННЫХ
К.Б. Булатов "Выбор оптимальной стратегии комбинирования покадровых результатов распознавания символа в видеопотоке"
МАШИННОЕ ОБУЧЕНИЕ
МЕТОДЫ МОДЕЛИРОВАНИЯ
ОПТИМИЗАЦИЯ БИЗНЕС-ПРОЦЕССОВ
К.Б. Булатов "Выбор оптимальной стратегии комбинирования покадровых результатов распознавания символа в видеопотоке"

Аннотация.

Работа посвящена задаче комбинирования результатов классификации нескольких наблюдений одного и того же объекта. Задача рассматривается как частный случай задачи коллективного принятия решений группой экспертов с вычисляемыми оценками уровней их компетентности. Произведено исследование точности различных методов комбинирования результатов классификации в зависимости от моделей входных данных на примере задачи объединения результатов покадрового распознавания символов в видеопотоке. Экспериментально показано преимущество стратегии выбора единственного наиболее компетентного эксперта в случае модели входных данных, предполагающей отсутствие нерелевантных наблюдений (в контексте распознавания символов в видеопотоке — отсутствие ошибок локализации и сегментации символов). Одновременно с этим показано преимущество стратегии объединения результатов классификации нескольких наиболее компетентных экспертов, согласно правилу произведения оценок или голосования, в случае наличия нерелевантных наблюдений.

Ключевые слова:

принятие решений, распознавание образов, распознавание в видеопотоке, комбинирование классификаторов.

Стр. 45-55.

Полная версия статьи в формате pdf. 

Литература

1. Doermann D., Liang J., Huiping L. Progress in camerabased document image analysis // Proceedings of Seventh International Conference on Document Analysis and Recognition, Vol. 1, 2003, pp. 606-616.
2. В.В. Арлазаров, А. Жуковский, В. Кривцов, Д. Николаев, Д. Полевой. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов // Информационные технологии и вычислительные системы, № 3, 2014, С. 71-78.
3. К.Б. Булатов, Д.А. Ильин, Д.В. Полевой, Ю.С. Чернышова. Проблемы распознавания машиночитаемых зон с использованием малоформатных цифровых камер мобильных устройств // Труды ИСА РАН, Том 65/3, 2015, С. 85-93.
4. Т.С. Чернов, Д.А. Ильин, П.В. Безматерных, И.А. Фараджев, С.М. Карпенко. Исследование методов сегментации изображений текстовых блоков документов с помощью алгоритмов структурного анализа и машинного обучения // Вестник РФФИ. Обработка изображений и распознавание образов, № 4 (92), 2016, С. 55-71.
5. Rokach L. Ensemble-based classifiers. Artificial Intelligence Review, V. 33, Issue 1-2, 2010, pp. 1-39, doi:10.1007/s10462-009-9124-7.
6. Fumera G., Roli F. Linear combiners for classifier fusion: some theoretical and experimental results // Proceedings of the 4th International Conference on Multiple Classifier Systems, 2003, pp. 74-83.
7. Schwenk H., Gauvain J.-L. Combining multiple speech recognizers using voting and language model information // IEEE International Conference on Speech and Language Processing, 2000, pp. 915-918.
8. Zhang C.-X., Duin R. An experimental study of one-and two- level classifier fusion for different sample sizes // Pattern Recognition Letters 32, 2011, pp. 1756-1767, doi:10.1016/j.patrec.2011.07.009.
9. Chen D. Text detection and recognition in images and video sequences. Thesis №2863, Lausanne, EPFL, 2003, 141 pages.
10. Wemhoener D., Yalniz I.Z., Manmatha R. Creating an improved version using noisy OCR from multiple editions // Proceedings of the 12th International Conference on Document Analysis and Recognition, 2013, pp. 160-164.
11. Lopresti D., Zhou J. Using consensus sequence voting to correct OCR errors // Computer Vision and Image Understanding, V. 67(1), 1997, pp. 39-47.
12. Fiscus J.G. A post-processing system to yield reduced word error rates: Recognizer Output Voting Error Reduction (ROVER) // Proceedings of IEEE Workshop on Automatic Speech Recognition and Understanding, 1997, pp. 347-354, doi:10.1109/ASRU.1997.659110.
13. Kittler J. On combining classifiers // IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 20, № 3, 1998, pp. 226-239.
14. Rogova G. Combining the results of several neural network classifiers // Neural Networks, Vol. 7, № 5, pp. 777-781, 1994.
15. Quost B., Masson M.-H., Denoeux T. Classifier fusion in the Dempster-Shafer framework using optimized t-norm based combination rules // International Journal of Approximate Reasoning, Vol. 52, Issue 3, 2011, pp. 353-374.
16. Ting K.M., Witten I.H. Issues in stacked generalization // Journal of Artificial Intelligence Research, Vol. 10, 1999, pp. 271-289.
17. Kuncheva L.I., Bezdek J.C., Duin R.P.W. Decision templates for multiple classifier fusion: an experimental comparison // Pattern Recognition, Vol. 34, 2001, pp. 299-314.
18. Merz C. Using correspondence analysis to combine classifiers // Machine Learning, Vol. 36, 1999, pp. 33-58.
19. Nguyen T.T., Nguyen T.T.T., Pham X.C., Liew A.W.-C. A novel combining classifier method based on variational inference // Pattern Recognition, Vol. 49, 2016, pp. 198-212.
20. Ye P., Doermann D. Document image quality assessment: a brief survey // Proceedings of 12th International Conference on Document Analysis and Recognition, 2013, pp. 723-727.
21. Bulatov K., Polevoy D. Reducing overconfidence in neural networks by dynamic variation of recognizer relevance // Proceedings of 29th European Conference on Modelling and Simulation, 2015, pp. 488-491.
22. Д.П. Николаев, Д.В. Полевой, Т.С. Чернов. Метод автоматической оценки качества цветовой сегментации в задаче упаковки изображений печатных документов // Труды ИСА РАН, Том 63/3, 2013, С. 78-84.
23. Арлазаров В.Л., Емельянов Н.Е. (Ред.) Документооборот. Прикладные аспекты. М.: Едиториал УРСС, 2005, 184 с.
24. В.В. Арлазаров, К.Б. Булатов, С.М. Карпенко. Метод определения надежности распознавания в задаче распознавания тисненых символов // Труды ИСА РАН, Том 63/3, 2013, С. 117-122.
25. Berend D., Kontorovich A. Consistency of weighted majority votes // Advances in Neural Information Processing Systems, Vol. 27, Issue 2, 2014, pp. 3446-3454.
26. Dzeroski S., Zenko B. Is combining classifiers better than selecting the best one? // Machine Learning, Vol. 45, Issue 3, 2004, pp. 255-273.
27. Ilin D., Krivtsov V. Creating training datasets for OCR in mobile video stream // Proceedings of 29th European Conference on Modelling and Simulation, 2015, pp. 516-520.
28. Nitzan S., Paroush J. Collective decision-making and jury theorems // The Oxford Handbook of Law and Economics: Volume 1: Methodology and Concepts, 2017, doi:10.1093/oxfordhb/9780199684267.013.035.


 

2024 / 01
2023 / 04
2023 / 03
2023 / 02

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".