ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
КОМПЬЮТЕРНАЯ ГРАФИКА
РАСПОЗНАВАНИЕ ОБРАЗОВ
Ю.В. Виноградова, Д.П. Николаев, Д.Г. Слугин "Расслоение изображений печатных документов с использованием цветовой кластеризации"
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Ю.В. Виноградова, Д.П. Николаев, Д.Г. Слугин "Расслоение изображений печатных документов с использованием цветовой кластеризации"

Аннотация.

В работе предлагается новый метод расслоения цветного изображения печатного документа для сжатия по расширенной модели MRC. В основе предлагаемого метода лежит анализ распределения цветовых характеристик изображения документа в цветовом пространстве, причем выбранное пространство дает хорошую разделимость кластеров. Задается класс рассматриваемых документов и определяется математическая модель формы цветовых распределений. В результате задача поиска распределений в трехмерном пространстве сводится к кластеризации одномерной гистограммы.

Ключевые слова:

расслоение изображений, цветовое пространство, сжатие изображений, технология смешанного растрового содержимого, PDF/A.

Стр. 40-49.

Yu.V. Vinogradova, D.P. Nikolaev, D.G. Slugin

"Image segmentation of color documents using color clustering"

In this paper, a novel method for segmentation of color images of documents for MRC compressions is proposed. The method is based on analyze of the color characteristic distribution of an image in the selected color space which gives good separability of the color clusters. The class of the considered documents is set and the mathematical model of the form of color distributions is determined. As the result, the three-dimensional color distribution is reduced to one-dimensional clustering of the histogram.

Keywords: image segmentation, color space, image compression, mixed raster content, MRC, PDF/A

REFERENCES

1.   Arlazarov V.L., Bezmozgiy I.M., Yemelyanov N.Ye. Problema perekhoda k bezbumazhnomu deloproizvodstvu // Razvitie bezbumazhnoy tekhnologii v organizatsionnykh sistemakh. 1999. P. 3–11.
2.   ISO/IEC IS 10918-1 | ITU-T Recommendation T.81 Lossless and near-lossless coding of continuous tone still images (JPEG-LS).
3.   ISO/IEC 15444-10:2011 Information technology — JPEG 2000   image   coding   system:   Extensions   for   three-dimensional data.
4.   ISO/IEC  14492:2001  |  ITU-T  Recommendation  T.88 JBIG2.
5.   Bottou L. et al. High quality document image compression with DjVu // Journal of Electronic Imaging. SPIE, 1998. Vol. 7, № 3. P. 410–425.
6.   Queiroz R. De, Buckley R., Xu M. Mixed Raster Content (MRC)  Model  for  Compound  Image  Compression  // Group. 2000. P. 1–12.
7.   INTERNATIONAL STANDARD ISO / IEC 16485:2000.
8.   ITU-T  T.44  (01/2005)  Mixed  Raster  Content  (MRC). 2005. Vol. 44.
9.   ISO 19005-1:2005(E) PDF/A.
10. djvu.org    [Online].    URL:    http://djvu.org/   (accessed: 28.08.2014).
11. Usilin S., Nikolaev D.P., Postnikov D.V. Cognitive PDF / A — tekhnologiya otsifrovki tekstovykh dokumentov dlya publikatsii v Internete i dolgovremennogo arkhivnogo  khraneniya  //  Sbornik  trudov  ISA  RAN. 2009. Vol. 45. P. 159–173.
12. Haneda E., Bouman C. a. Text segmentation for MRC document  compression.  //  IEEE  transactions  on  image processing : a publication of the IEEE Signal Processing Society. 2011. Vol. 20, № 6. P. 1611–1626.
13. Haffner P. et al. A general segmentation scheme for DjVU document compression // Proc. of Int. Symp. on Math. Morph (VI). 2002.
14. Antonacopoulos A.,  Gatos  B., Bridson D.  ICDAR2007
Page Segmentation Competition // Society. 2007. № Sep- tember. P. 1279–1283.
15. Bottou U., Haffner P., LeCun Y. Efficient conversion of digital documents to multilayer raster formats // Document Analysis and Recognition. Proceedings. Sixth Internation- al Conference on. 2001.
16. Wong K.Y., Casey R.G., Wahl F.M. Document Analysis System  //  IBM  Journal of  Research and  Development. 1982. Vol. 26, № 6. P. 647–656.
17. Nagy G., Seth S., Viswanathan M. A prototype document image analysis system for technical journals // Computer. 1992. Vol. 25, № 7. P. 10–22.
18. Haneda   E.   MARKOV   RANDOM   FIELD   MODEL BASED TEXT SEGMENTATION AND. 2011.
19. Haffner P. et al. A general segmentation scheme for DjVU document compression // Proc. of Int. Symp. on Math. Morph (VI). 2002.
20. Gonsales R., Vuds R. Tsifrovaya obrabotka izobrazheniy. Tekhnosfera, 2005.
21. Vinogradova Yu.V., Nikolaev D.P., Polevoy D.V. Razlozhenie izobrazheniya pechatnogo dokumenta na informatsionnye sloi // Trudy 54-y nauchnoy konferentsii MFTI. Problemy fundamentalnykh i prikladnykh estestvennykh nauk v sovremennom informatsionnom obshchestve. Sektsiya “Innovatsii i vysokie tekhnologii”. 2011. P. 46.
22. Nikolaev D.P., Nikolayev P.P. Linear color segmentation and its implementation // Computer Vision and Image Understanding. V. 94 (Special issue on colour for image indexing and retrieval). 2004. P. 115–139.
23. Ahmed S. et al. Text/Graphics Segmentation in Architectural Floor Plans // 2011 International Conference on Document Analysis and Recognition. Ieee, 2011. P. 734–738.
 

2017 / 01
2016 / 04
2016 / 03
2016 / 02

© ФИЦ ИУ РАН 2008-2016. Создание сайта "РосИнтернет технологии".