Бинаризация «Фон - объект» предобработкой изображения и нечетким алгоритмом k-means

Остапов Дмитрий Сергеевич

УДК 004.9

Д. С. Остапов

БИНАРИЗАЦИЯ «ФОН - ОБЪЕКТ» ПРЕДОБРАБОТКОЙ ИЗОБРАЖЕНИЯ И НЕЧЁТКИМ АЛГОРИТМОМ K-MEANS

Рассмотрен этап бинаризации цветного 2D-изображения на связные области с пикселями объекта и фона в задачах идентификации с детальной оценкой системами компьютерного зрения состояния объектов природного происхождения и их массового количества, с высокой вариабельностью внутри классов, и близости самих классов. Предложен эффективный алгоритм бинаризации на основе кластеризации &-means с евклидовой метрикой, позволяющий устранить ряд сложностей при подборе алгоритмов для программной реализации в системах компьютерного зрения и удовлетворяющий требованиям к скорости и точности. Алгоритм сочетает в себе предобработку изображения с применением вспомогательного «нечёткого» кластера в алгоритме &-means для контроля качества отделения объекта от фона. Предобработка при определённых условиях исключает светлоту L цветовой шкалы CIELab (CIE 1976 Lab) из &-means.

Ключевые слова: бинаризация 2D-изображений, отделение объекта от фона, нечёткая кластеризация &-means.

Введение

Бинаризация цветного 2D-изображения на связные области с пикселями объекта и фона важна для решения задачи идентификации с детальной оценкой системами компьютерного зрения состояния объектов природного происхождения и их массового количества, с высокой вариабельностью внутри классов, и близости самих классов. Основная сложность подбора алгоритмов решения рассматриваемой задачи - высокая вариабельность характеристик пикселей изображения (что свойственно объектам природного происхождения), внимание к мелким деталям на поверхности каждого объекта, необходимость количественной оценки этих деталей и обеспечение дальнейшего сбора информации о состоянии массового количества объектов, большой объём данных и высокие требования к скорости и точности [1-4]. Наиболее популярным методом бинаризации цветных изображений является алгоритм £-means. В [3] предложен способ предобработки для повышения его эффективности, но он не решает проблемы теней, бликов и прочих пиксельных «выбросов» и «помех». Подходы, основанные на использовании графовых или агломеративных методов, могут дать хороший результат (особенно в том случае, когда учитывается критерий связности), но характеризуются очень низким быстродействием [5-7]. Методы, основанные на выделении границ, использовании порогов, а также метод Оцу неприменимы для работы с цветными изображениями с наличием «помех» [6, 7].

В данной работе предложен алгоритм бинаризации на основе кластеризации £-means с евклидовой метрикой, удовлетворяющий требованиям к скорости и точности, сочетающий предобработку изображения с применением вспомогательного «нечёткого» кластера в алгоритме £-means для контроля качества отделения объекта от фона. Особенностью работы алгоритма является то, что он не использует «тяжёлые» агломеративные или графовые технологии; повышение точности основано на предобработке изображений; контроле качества бинаризации, основанном на «нечетком» кластере в алгоритме £-means. Ни одна из составляющих алгоритма не является вычислительно сложным процессом.

Общая схема алгоритма отделения пикселей объекта от фона и предобработка 2D-изображения

Общая схема алгоритма показана на рис. 1. Следует отметить, что при кластеризации £-means необходимо применять евклидову метрику: она даёт стабильные средние результаты по сравнению с остальными известными метриками (Манхэттен, Махаланобис и др.). Ряд экспериментов с использованием различных метрик позволил выявить, что евклидова метрика даёт наиболее стабильные и качественные результаты, при использовании других метрик часть объектов сливается с фоном, появляется скопление единичных пикселей, ложные объекты и т. д.

а

б

Рис. 1. Алгоритм отделения пикселей объекта от фона: а - общая схема; б - схема блока контроля качества бинаризации

Предобработка при определённых условиях исключает светлоту L цветовой шкалы CIELab (CIE 1976 Lab), далее LAB, из £-means. Помехи, связанные с бликами, тенями и неравномерностью освещения, отражены преимущественно на оси L пространства LAB, и при исключении её влияния результат бинаризации будет более высокого качества. Однако в ряде случаев информация, представленная на изображении, содержится преимущественно в компоненте L: монохромное изображение, однотонное или фото с чёрными объектами на белом фоне, или с белыми на чёрном и т. п. Один из способов оценки информативности каждой оси - расчёт среднеквадратичных отклонений проекций пикселей на эти оси и их сравнение. Информативность компоненты L рассчитывается по формуле (1):

IL , =J11(L -L)2, (1)

где oL, oB, oA - среднеквадратичное отклонение пикселей изображения по компонентам L, A и B

соответственно; n - число точек-пикселей; L - среднее значение характеристики L по всем пикселям; Lt - значение компоненты L для i-го пикселя (среднеквадратичное отклонение проекций точек на оси A и B рассчитывается аналогично).

В зависимости от значения IL необходимо по-разному выполнять предобработку изображения (рис. 1, а). Параметры a и b подбираются эмпирически для каждого типа изображений: в данном случае a = 100, b = 8 (рассматривался случай с множественным количеством объектов на однородном фоне). Экспериментально установлено, что при IL > a = 100 - класс монохромных изображений; при 100 > IL > b = 8 - класс изображений, в которых компонента L цветового пространства LAB содержит важную информацию, но информация содержится не только в этой компоненте.

Как видно из рис. 1, а, при IL > 100 информация об изображении содержится преимущественно в компоненте L, и из этого можно сделать вывод, что выполнять его бинаризацию следует с использованием методов бинаризации однотонных изображений - метода Оцу и т. п. В случае, когда 100 > IL > 8, перед тем как исключать компоненту L цветового пространства LAB, необходимо выполнить дополнительную обработку изображения в цветовом пространстве RGB:

- определить среднеарифметические по всем пикселям значения {Cj}, j = 1; 2; 3 цветовых компонент изображения в цветовом пространстве RGB;

- выбрать компоненту, среднее значение которой максимально: max{Cj} = C;

- получить новые значения C.0 = {R.0, G°, B¿D} компонент RGB каждого i-го пикселя по следующей формуле:

ÍC.. + х, при (C.. + 255 - C) < 255, C'. =<¡ j j (2)

j [255, при C . + х, при (C.. + 255 - C) > 255.

Пример результатов после выполнения операции добавления оттенков цвета, исключения компоненты L и бинаризации по £-means показан на рис. 2.

Как видно из рис. 2, добавление оттенков цвета даёт положительный эффект при высоких значениях IL.

На изображениях, имеющих объекты с цветовыми характеристиками, близкими к фону, предварительная обработка по L может не принести желаемого результата. Индикатором этого может выступать информационная энтропия H, показывающая однородность элементов в множестве: чем энтропия выше, тем множество более однородно. Информационная энтропия изображения рассчитывается по формуле

I J T

H=-ZZZ Pjt lo§2(Pjt ь (3)

1=0 j=0 t=0

где p.t - вероятность попадания в заданные диапазоны (R., G., Bt), на которые разбиты интервалы [0; 255] цветовых RGB-шкал координат пикселей (здесь I = J = T = 255 в интервалах [0; 255] RGB-шкал).

д е

Рис. 2. Бинаризация изображения, где 100 > 1Ь > 8: а - исходное изображение; б - результат бинаризации исходного изображения по &-теаш; в - результат бинаризации с предварительной обработкой по Ь; г - изображение после предобработки по (2); д - изображение после предобработки по Ь и (2); е - результат бинаризации по &-теаш с предобработкой по Ь и (2)

На изображениях с высокой энтропией возможно негативное влияние предварительной обработки, т. к. переход из трёхмерного цветового пространства в двухмерное сопровождается потерей информации, и если на разнородных изображениях (с низкой энтропией) повышение однородности оказывает положительное влияние, то на изображениях с высокой энтропией влияние будет негативным. Пример изображения с высокой энтропией представлен на рис. 3.

б

а

в

г

б

а

в

г

Рис. 3. Бинаризация изображения с Н > 9,8: а - исходное изображение с высокой энтропией; б - результат бинаризации по &-теаш; в - результат бинаризации с предобработкой по Ь; г - результат бинаризации по &-теаш с «нечётким» кластером

Как видно из рис. 3, б, в, для изображений с высокой энтропией предварительная обработка по Ь оказывает негативное воздействие. Порог для Н подбирается эмпирически для каждого типа изображений: в данном случае с = 9,8 (рис. 1, а), т. е. для изображений, энтропия которых больше с, использование предварительной обработки по Ь будет давать отрицательный результат.

Применение вспомогательного «нечёткого» кластера в алгоритме А-теаш для контроля качества отделения объекта от фона

В примере с изображением на рис. 3, а бинаризация выполнена некачественно: часть объектов искажена и потеряна. В подобных случаях необходимо осуществить дополнительный контроль с использованием «нечёткого» кластера в £-теап8. Как видно из рис. 1, б, предлагаемый алгоритм обеспечивает полностью автоматизированный контроль качества бинаризации.

Определение, к какому кластеру «фон - объект» относится рассматриваемый пиксель, осуществляется следующим образом.

1. От каждой / -й точки-пикселя Р вычисляются расстояния d1 и d2 до центров кластеров т = 1 и т = 2.

2. Точка Р относится к тому кластеру, расстояние до центра которого является наименьшим. Степень принадлежности гт точки Р к кластеру т можно вычислить по следующей формуле:

d

rm = 1 -"Г+V . (4)

d1 + d 2

Если гт > 0,5, то рассматриваемая точка Р относится к кластеру т. Но это решение надёжно только при р1 или р2, близких к 1: например, если d1 << d2, тогда можно однозначно утверждать, что Р относится к кластеру 1. В случае, если d1 и d2 отличаются друг от друга незначительно, такое решение ненадёжно. Выделим такие пиксели в «нечёткий» кластер т = 3: пусть точки, для которых не выполняется условие d1 << d2, составляют множество Е. Это множество Е состоит из «нечётких» пикселей (рис. 1, б), определяемых из следующего неравенства:

min{d1, d2}

d1 + d2

> k , (5)

где k - эмпирический коэффициент: k = 0,6. Заметим, что неравенство (5) эквивалентно неравенству тах{р1, р2} < k. Проблемные точки результатов бинаризации, представленные на рис. 3, б, в, показаны на рис. 3, г.

3. Рассчитывается количество рЕ пикселей множества Е от всего изображения, %:

ре = ^. (6)

ГЕ ^ |

Если рЕ > у, где эмпирический порог у = 3 %, присутствует высокая вероятность некачественной бинаризации, когда надёжно отделить пиксели фона от пикселей объекта этим способом невозможно (в «нечётком» кластере могут быть участки изображения объекта, но это неизвестно). Например, для изображения на рис. 3, а рЕ = 11,344 %, что говорит о существенных проблемах при бинаризации. Расчёт показателя рЕ позволяет системе компьютерного зрения определить, насколько качественно была сделана бинаризация, а выделение «нечёткого» кластера позволяет визуально определить причину проблем (неравномерность освещения, тени, блики, искажённый спектр, механические повреждения фоновой поверхности и т. п.).

Выделение связных областей с пикселями единичных объектов

Этап бинаризации позволяет перейти, с применением алгоритма Хафа, от анализа изображения массового количества объектов к работе по отдельности с изображением единичного объекта - для распознавания, сбора статистики о распределении вероятностей определённых характеристик по поверхности единичных зёрен и т. д.

Алгоритм Хафа относится к градиентным методам и может выполнить выделение единичных объектов только в том случае, если они окружены пикселями фона. Однако, если некоторые объекты соприкасаются друг с другом либо налагаются друг на друга, тогда результатом работы алгоритма будет изображение с группой таких касающихся или наложенных объектов (рис. 4). В этом случае алгоритм расценивает их как единый невыпуклый объект. Если же объекты находятся близко друг к другу, но не соприкасаются, тогда с помощью алгоритма Хафа происходит сегментирование исходного 2D-изображения на многоугольники и дальнейшее «разрезание» на изображения единичных объектов (рис. 4).

Следует заметить, что применение методов сегментирования сразу ко всему исходному изображению массового количества объектов, для работы по отдельности с изображениями единичных объектов без этапа бинаризации, не оптимально ни по скорости, ни по точности и создает ряд дополнительных трудностей.

Представляет интерес сравнение результатов работы предлагаемого алгоритма с подходом, не учитывающим конкретного приложения, - оценкой качества работы метода тестированием на общей базе изображений [8, 9], для которых известна «правильная» сегментация (например, Berkeley Segmentation Dataset and Benchmark - BSD [8] (рис. 5)).

а б в

Рис. 4. Результат работы алгоритма Хафа: а - определение границ каждого объекта; б - выделение единичного объекта в отдельное изображение; в - выделение группы касающихся объектов

а б в г

Рис. 5. Бинаризация изображения из базы BSD: а - пример исходного изображения BSD; б - бинаризация BSD; в - результат бинаризации по k-means и (1)-(6); г - контроль качества бинаризации по (4)-(6)

Как видно из рис. 5, предлагаемый алгоритм успешно справляется с бинаризацией изображения и выделяет пиксели, бинаризация которых, возможно, была выполнена неправильно.

Заключение

Предложенный алгоритм бинаризации на основе кластеризации &-means с евклидовой метрикой удовлетворяет требованиям к скорости и точности, сочетает в себе предобработку изображения с применением вспомогательного «нечёткого» кластера в алгоритме &-means для контроля качества отделения объекта от фона. Использование предварительной обработки по компоненте L пространства LAB (когда IL < 8 и H < 9,8) позволяет сделать изображение более однородным и повышает качество его бинаризации по методу &-means, в котором целесообразно применять евклидову метрику. Когда H > 9,8, выполнять предварительную обработку нецелесообразно из-за высокой однородности изображения. Когда IL > 8 и H < 9,8, перед исключением L необходимо добавить оттенок цвета по (2). Данная операция повышает качество бинаризации, контролировать которое позволяет расчёт показателя pE. Если pE > y, где эмпирический порог y = 3 %, тогда присутствует высокая вероятность некачественной бинаризации, когда надёжно отделить пиксели фона от пикселей объекта этим способом невозможно.

Применение методов сегментирования сразу ко всему исходному изображению массового количества объектов для работы по отдельности с изображениями единичных объектов, без этапа бинаризации не оптимально ни по скорости, ни по точности и создает ряд дополнительных трудностей.

Разработанный алгоритм позволяет устранить ряд сложностей, связанных с бинаризацией разного рода изображений: монохромных, с бликами, тенями и другими выбросами. Алгоритм имеет высокую точность и скорость; он способен функционировать в реальном времени благодаря использованию операций, имеющих низкую вычислительную сложность.

СПИСОК ЛИТЕРА ТУРЫ

1. Computer Vision Technology for Food Quality Evaluation. Ed. by Da-Wen Sun, Published by Elsevier Academic Press, San Diego, CA, USA, 2011. 600 p.

2. Зиятдинова В. А., Шаззо А. Ю., Усатиков С. В., Погорелова И. И. Оценка качества риса с использованием современных методов анализа цветовых характеристик единичных зерен // Изв. вузов. Пищевая технология. 2015. № 2-3 (344-345). С. 100-104.

3. Остапов Д. С. Предобработка изображений для повышения эффективности бинаризации методом k-средних // Актуальные направления научных исследований 21 века: теория и практика: сб. науч. тр. по матер. Междунар. заоч. науч.-практ. конф. Воронеж: ВГЛТУ, 2015. № 8, ч. 1 (19-1). С. 108-112.

4. Остапов Д. С. Адаптивный алгоритм k-means сегментации изображений объектов природного происхождения // VII науч.-техн. конф. «Техническое зрение в системах управления - 2016» (Москва, 15-17 марта 2016 г.). М.: ИКИ РАН, 2016. С. 70-71.

5. Kharinov M. V. Reclassification formula that provides to surpass K-means method // arXiv preprint, ar-Xiv:1209.6204, 28 Sep 2012. 10 p. URL: http://arxiv.org/ftp/arxiv/papers/1209/1209.6204.pdf.

6. Stathis P., Kavallieratou E., Papamarkos N. An evaluation technique for binarization algorithms // Journal of Universal Computer Science. 2008. Vol. 14, no. 18. P. 3011-3030.

7. Белим С. В., Кутлунин П. Е. Выделение контуров на изображениях с помощью алгоритма кластеризации // Компьютерная оптика. 2015. Т. 39, № 1. C. 119-124.

8. Martin D., Fowlkes C. The Berkeley segmentation database and benchmark. Computer Science Department, Berkeley University, 2001. URL: http://www.eecs.berkeley.edu/Research/Projects/CS/vision/bsds/.

9. Харинов М. В. База данных оптимальной сегментации. URL: http://oogis.ru/index.php/tekhnologii/21-baza-dannykh-optimalnoj-segmentatsii.

Статья поступила в редакцию 6.04.2016

ИНФОРМАЦИЯ ОБ АВТОРЕ

Остапов Дмитрий Сергеевич — Россия, 350072, Краснодар; Кубанский государственный технологический университет, аспирант кафедры общей математики; [email protected].

D. S. Ostapov

BINARIZATION OF "BACKGROUND - OBJECT" BY USING PRETREATMENT OF AN IMAGE AND FUZZY K-MEANS ALGORITHM

Absract. The paper considers the stage of binarization of color 2D-image into the connected areas with the pixels of an object and background while identifying the state of the objects of natural origin and their mass quantity with detailed evaluation by means of the systems of computer vision, with high variability inside the classes and their proximity. Binarization algorithm is suggested on the basis of k-means clusterization with Euclid's metrics, which helps eliminate a number of difficulties while choosing the algorithms for software actualization in the computer vision systems and satisfies the demands for velocity and accuracy. The algorithm combines pretreatment of an image by using additional "fuzzy" cluster in the ¿-means algorithm for the control of quality of separation of an object from background. The pretreatment under certain conditions excludes the lightness

L of color scale CIELab (CIE 1976 Lab) from ¿-means.

Key words: binarization of 2D-images, separation of an object from background, fuzzy ¿-means clusterization.

REFERENCES

1. Computer Vision Technology for Food Quality Evaluation. Ed. by Da-Wen Sun, Published by Elsevier Academic Press, San Diego, CA, USA, 2011. 600 p.

2. Ziiatdinova V. A., Shazzo A. Iu., Usatikov S. V., Pogorelova I. I. Otsenka kachestva risa s ispol'zova-niem sovremennykh metodov analiza tsvetovykh kharakteristik edinichnykh zeren [Evaluation of rice quality using the present methods of analysis of colour characteristics of single grains]. Izvestiia vuzov. Pishchevaia tekhnologiia, 2015, no. 2-3 (344-345), pp. 100-104.

3. Ostapov D. S. Predobrabotka izobrazhenii dlia povysheniia effektivnosti binarizatsii metodom k-srednikh [Pretreatment of images to increase the effectiveness of binarization by k-means method]. Aktual'nye napravleniia nauchnykh issledovanii 21 veka: teoriia i praktika. Sbornik nauchnykh trudov po materialam Mezhdunarodnoi zaochnoi nauchno-prakticheskoi konferentsii. Voronezh, VGLTU, 2015, no. 8, part 1 (19-1), pp. 108-112.

4. Ostapov D. S. Adaptivnyi algoritm k-means segmentatsii izobrazhenii ob"ektov PRIRODNOGO proisk-hozhdeniia [Adaptive k-means algorithm of segmentation of images of the objects of NATURAL origin]. VII Nauchno-tekhnicheskaia konferentsiia «Tekhnicheskoe zrenie v sistemakh upravleniia - 2016» (Moskva, 15-17 marta 2016 g.). Moscow, IKI RAN, 2016. P. 70-71.

5. Kharinov M. V. Reclassification formula that provides to surpass K-means method. arXiv preprint, ar-Xiv:1209.6204, 28 Sep 2012. 10 p. Available at: http://arxiv.org/ftp/arxiv/papers/1209/1209.6204.pdf.

6. Stathis P., Kavallieratou E., Papamarkos N. An evaluation technique for binarization algorithms. Journal of Universal Computer Science, 2008, vol. 14, no. 18, pp. 3011-3030.

7. Belim S. V., Kutlunin P. E. Vydelenie konturov na izobrazheniiakh s pomoshch'iu algoritma klasterizatsii [Silhouetting of the images by means of clustering algorithm]. Komp'iuternaia optika, 2015, vol. 39, no. 1, pp. 119-124.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Martin D., Fowlkes C. The Berkeley segmentation database and benchmark. Computer Science Department, Berkeley University, 2001. Available at: http://www.eecs.berkeley.edu/Research/Prqjects/CS/vision/bsds.

9. Kharinov M. V. Baza dannykh optimal'noi segmentatsii [Database of optimal segmentation]. Available at: http://oogis.ru/index.php/tekhnologii/21-baza-dannykh-optimalnoj-segmentatsii.

The article submitted to the editors 6.04.2016

INFORMATION ABOUT THE AUTHOR

Ostapov Dmitriy Sergeevich - Russia, 350072, Krasnodar; Kuban State Technological University, Postgraduate Student of the Department of General Mathematics; [email protected].

Бинаризация «Фон - объект» предобработкой изображения и нечетким алгоритмом k-means Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Остапов Дмитрий Сергеевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Остапов Дмитрий Сергеевич

BINARIZATION of "BACKGROUND - OBJECT" BY USING PRETREATMENT OF AN IMAGE AND FUZZY K-MEANS ALGORITHM

Текст научной работы на тему «Бинаризация «Фон - объект» предобработкой изображения и нечетким алгоритмом k-means»