|
Ю.В. Виноградова, Д.П. Николаев, Д.Г. Слугин "Расслоение изображений печатных документов с использованием цветовой кластеризации" |
|
Аннотация. В работе предлагается новый метод расслоения цветного изображения печатного документа для сжатия по расширенной модели MRC. В основе предлагаемого метода лежит анализ распределения цветовых характеристик изображения документа в цветовом пространстве, причем выбранное пространство дает хорошую разделимость кластеров. Задается класс рассматриваемых документов и определяется математическая модель формы цветовых распределений. В результате задача поиска распределений в трехмерном пространстве сводится к кластеризации одномерной гистограммы. Ключевые слова: расслоение изображений, цветовое пространство, сжатие изображений, технология смешанного растрового содержимого, PDF/A. Стр. 40-49. Yu.V. Vinogradova, D.P. Nikolaev, D.G. Slugin"Image segmentation of color documents using color clustering"In this paper, a novel method for segmentation of color images of documents for MRC compressions is proposed. The method is based on analyze of the color characteristic distribution of an image in the selected color space which gives good separability of the color clusters. The class of the considered documents is set and the mathematical model of the form of color distributions is determined. As the result, the three-dimensional color distribution is reduced to one-dimensional clustering of the histogram. Keywords: image segmentation, color space, image compression, mixed raster content, MRC, PDF/A Полная версия статьи в формате pdf. REFERENCES 1. Arlazarov V.L., Bezmozgiy I.M., Yemelyanov N.Ye. Problema perekhoda k bezbumazhnomu deloproizvodstvu // Razvitie bezbumazhnoy tekhnologii v organizatsionnykh sistemakh. 1999. P. 3–11. 2. ISO/IEC IS 10918-1 | ITU-T Recommendation T.81 Lossless and near-lossless coding of continuous tone still images (JPEG-LS). 3. ISO/IEC 15444-10:2011 Information technology — JPEG 2000 image coding system: Extensions for three-dimensional data. 4. ISO/IEC 14492:2001 | ITU-T Recommendation T.88 JBIG2. 5. Bottou L. et al. High quality document image compression with DjVu // Journal of Electronic Imaging. SPIE, 1998. Vol. 7, № 3. P. 410–425. 6. Queiroz R. De, Buckley R., Xu M. Mixed Raster Content (MRC) Model for Compound Image Compression // Group. 2000. P. 1–12. 7. INTERNATIONAL STANDARD ISO / IEC 16485:2000. 8. ITU-T T.44 (01/2005) Mixed Raster Content (MRC). 2005. Vol. 44. 9. ISO 19005-1:2005(E) PDF/A. 10. djvu.org [Online]. URL: http://djvu.org/ (accessed: 28.08.2014). 11. Usilin S., Nikolaev D.P., Postnikov D.V. Cognitive PDF / A — tekhnologiya otsifrovki tekstovykh dokumentov dlya publikatsii v Internete i dolgovremennogo arkhivnogo khraneniya // Sbornik trudov ISA RAN. 2009. Vol. 45. P. 159–173. 12. Haneda E., Bouman C. a. Text segmentation for MRC document compression. // IEEE transactions on image processing : a publication of the IEEE Signal Processing Society. 2011. Vol. 20, № 6. P. 1611–1626. 13. Haffner P. et al. A general segmentation scheme for DjVU document compression // Proc. of Int. Symp. on Math. Morph (VI). 2002. 14. Antonacopoulos A., Gatos B., Bridson D. ICDAR2007 Page Segmentation Competition // Society. 2007. № Sep- tember. P. 1279–1283. 15. Bottou U., Haffner P., LeCun Y. Efficient conversion of digital documents to multilayer raster formats // Document Analysis and Recognition. Proceedings. Sixth Internation- al Conference on. 2001. 16. Wong K.Y., Casey R.G., Wahl F.M. Document Analysis System // IBM Journal of Research and Development. 1982. Vol. 26, № 6. P. 647–656. 17. Nagy G., Seth S., Viswanathan M. A prototype document image analysis system for technical journals // Computer. 1992. Vol. 25, № 7. P. 10–22. 18. Haneda E. MARKOV RANDOM FIELD MODEL BASED TEXT SEGMENTATION AND. 2011. 19. Haffner P. et al. A general segmentation scheme for DjVU document compression // Proc. of Int. Symp. on Math. Morph (VI). 2002. 20. Gonsales R., Vuds R. Tsifrovaya obrabotka izobrazheniy. Tekhnosfera, 2005. 21. Vinogradova Yu.V., Nikolaev D.P., Polevoy D.V. Razlozhenie izobrazheniya pechatnogo dokumenta na informatsionnye sloi // Trudy 54-y nauchnoy konferentsii MFTI. Problemy fundamentalnykh i prikladnykh estestvennykh nauk v sovremennom informatsionnom obshchestve. Sektsiya “Innovatsii i vysokie tekhnologii”. 2011. P. 46. 22. Nikolaev D.P., Nikolayev P.P. Linear color segmentation and its implementation // Computer Vision and Image Understanding. V. 94 (Special issue on colour for image indexing and retrieval). 2004. P. 115–139. 23. Ahmed S. et al. Text/Graphics Segmentation in Architectural Floor Plans // 2011 International Conference on Document Analysis and Recognition. Ieee, 2011. P. 734–738.
|