Аннотация. Работа посвящена задаче комбинирования результатов классификации нескольких наблюдений одного и того же объекта. Задача рассматривается как частный случай задачи коллективного принятия решений группой экспертов с вычисляемыми оценками уровней их компетентности. Произведено исследование точности различных методов комбинирования результатов классификации в зависимости от моделей входных данных на примере задачи объединения результатов покадрового распознавания символов в видеопотоке. Экспериментально показано преимущество стратегии выбора единственного наиболее компетентного эксперта в случае модели входных данных, предполагающей отсутствие нерелевантных наблюдений (в контексте распознавания символов в видеопотоке — отсутствие ошибок локализации и сегментации символов). Одновременно с этим показано преимущество стратегии объединения результатов классификации нескольких наиболее компетентных экспертов, согласно правилу произведения оценок или голосования, в случае наличия нерелевантных наблюдений. Ключевые слова: принятие решений, распознавание образов, распознавание в видеопотоке, комбинирование классификаторов. Стр. 45-55. Полная версия статьи в формате pdf. Литература1. Doermann D., Liang J., Huiping L. Progress in camerabased document image analysis // Proceedings of Seventh International Conference on Document Analysis and Recognition, Vol. 1, 2003, pp. 606-616. 2. В.В. Арлазаров, А. Жуковский, В. Кривцов, Д. Николаев, Д. Полевой. Анализ особенностей использования стационарных и мобильных малоразмерных цифровых видео камер для распознавания документов // Информационные технологии и вычислительные системы, № 3, 2014, С. 71-78. 3. К.Б. Булатов, Д.А. Ильин, Д.В. Полевой, Ю.С. Чернышова. Проблемы распознавания машиночитаемых зон с использованием малоформатных цифровых камер мобильных устройств // Труды ИСА РАН, Том 65/3, 2015, С. 85-93. 4. Т.С. Чернов, Д.А. Ильин, П.В. Безматерных, И.А. Фараджев, С.М. Карпенко. Исследование методов сегментации изображений текстовых блоков документов с помощью алгоритмов структурного анализа и машинного обучения // Вестник РФФИ. Обработка изображений и распознавание образов, № 4 (92), 2016, С. 55-71. 5. Rokach L. Ensemble-based classifiers. Artificial Intelligence Review, V. 33, Issue 1-2, 2010, pp. 1-39, doi:10.1007/s10462-009-9124-7. 6. Fumera G., Roli F. Linear combiners for classifier fusion: some theoretical and experimental results // Proceedings of the 4th International Conference on Multiple Classifier Systems, 2003, pp. 74-83. 7. Schwenk H., Gauvain J.-L. Combining multiple speech recognizers using voting and language model information // IEEE International Conference on Speech and Language Processing, 2000, pp. 915-918. 8. Zhang C.-X., Duin R. An experimental study of one-and two- level classifier fusion for different sample sizes // Pattern Recognition Letters 32, 2011, pp. 1756-1767, doi:10.1016/j.patrec.2011.07.009. 9. Chen D. Text detection and recognition in images and video sequences. Thesis №2863, Lausanne, EPFL, 2003, 141 pages. 10. Wemhoener D., Yalniz I.Z., Manmatha R. Creating an improved version using noisy OCR from multiple editions // Proceedings of the 12th International Conference on Document Analysis and Recognition, 2013, pp. 160-164. 11. Lopresti D., Zhou J. Using consensus sequence voting to correct OCR errors // Computer Vision and Image Understanding, V. 67(1), 1997, pp. 39-47. 12. Fiscus J.G. A post-processing system to yield reduced word error rates: Recognizer Output Voting Error Reduction (ROVER) // Proceedings of IEEE Workshop on Automatic Speech Recognition and Understanding, 1997, pp. 347-354, doi:10.1109/ASRU.1997.659110. 13. Kittler J. On combining classifiers // IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 20, № 3, 1998, pp. 226-239. 14. Rogova G. Combining the results of several neural network classifiers // Neural Networks, Vol. 7, № 5, pp. 777-781, 1994. 15. Quost B., Masson M.-H., Denoeux T. Classifier fusion in the Dempster-Shafer framework using optimized t-norm based combination rules // International Journal of Approximate Reasoning, Vol. 52, Issue 3, 2011, pp. 353-374. 16. Ting K.M., Witten I.H. Issues in stacked generalization // Journal of Artificial Intelligence Research, Vol. 10, 1999, pp. 271-289. 17. Kuncheva L.I., Bezdek J.C., Duin R.P.W. Decision templates for multiple classifier fusion: an experimental comparison // Pattern Recognition, Vol. 34, 2001, pp. 299-314. 18. Merz C. Using correspondence analysis to combine classifiers // Machine Learning, Vol. 36, 1999, pp. 33-58. 19. Nguyen T.T., Nguyen T.T.T., Pham X.C., Liew A.W.-C. A novel combining classifier method based on variational inference // Pattern Recognition, Vol. 49, 2016, pp. 198-212. 20. Ye P., Doermann D. Document image quality assessment: a brief survey // Proceedings of 12th International Conference on Document Analysis and Recognition, 2013, pp. 723-727. 21. Bulatov K., Polevoy D. Reducing overconfidence in neural networks by dynamic variation of recognizer relevance // Proceedings of 29th European Conference on Modelling and Simulation, 2015, pp. 488-491. 22. Д.П. Николаев, Д.В. Полевой, Т.С. Чернов. Метод автоматической оценки качества цветовой сегментации в задаче упаковки изображений печатных документов // Труды ИСА РАН, Том 63/3, 2013, С. 78-84. 23. Арлазаров В.Л., Емельянов Н.Е. (Ред.) Документооборот. Прикладные аспекты. М.: Едиториал УРСС, 2005, 184 с. 24. В.В. Арлазаров, К.Б. Булатов, С.М. Карпенко. Метод определения надежности распознавания в задаче распознавания тисненых символов // Труды ИСА РАН, Том 63/3, 2013, С. 117-122. 25. Berend D., Kontorovich A. Consistency of weighted majority votes // Advances in Neural Information Processing Systems, Vol. 27, Issue 2, 2014, pp. 3446-3454. 26. Dzeroski S., Zenko B. Is combining classifiers better than selecting the best one? // Machine Learning, Vol. 45, Issue 3, 2004, pp. 255-273. 27. Ilin D., Krivtsov V. Creating training datasets for OCR in mobile video stream // Proceedings of 29th European Conference on Modelling and Simulation, 2015, pp. 516-520. 28. Nitzan S., Paroush J. Collective decision-making and jury theorems // The Oxford Handbook of Law and Economics: Volume 1: Methodology and Concepts, 2017, doi:10.1093/oxfordhb/9780199684267.013.035.
|