Научная статья на тему 'Применение графовой модели и априорного классификатора для сегментации изображения в задачах распознавания лица человека'

Применение графовой модели и априорного классификатора для сегментации изображения в задачах распознавания лица человека Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
301
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ / ГРАФОВАЯ МОДЕЛЬ / ГРАФ / КЛАССИФИКАТОР / РАЗРЫВНОСТЬ / ОДНОРОДНОСТЬ / ИНТЕНСИВНОСТЬ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ / ВОССТАНОВЛЕНИЕ ИЗОБРАЖЕНИЯ ПО ГРАФОВОЙ МОДЕЛИ / ПОДГРАФ / PATTERN RECOGNITION / IMAGE SEGMENTATION / GRAPH MODEL / GRAPH / CLASSIFIER / DISCONTINUITY / UNIFORMITY / THE INTENSITY OF THE COLOR IMAGE / RECOVERY IMAGE ON THE GRAPH MODEL / SUB GRAPH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Штанчаев Хайрутин Баширович

Распознавание лица человека является одной из сложной задачи такого направления как распознавание образов. Правильно выбранный метод сегментации изображения помогает получить хорошую точность при распознавании. Статья посвящена исследованию априорного классификатора для сегментации изображения, который основан на разрывности и неоднородности изображения. Предложено, представление изображения в виде графовой модели и ее использование для сегментации. В статье приведено описание действий над графовой моделью. Описан математический аппарат для исследуемого классификатора. Опытным путем определена точность классификатора, исходя из таких количественных характеристик как количество ложных срабатываний и количество верных срабатываний. В статье проводится сравнительный анализ классификатора и классификаторов предложенными различными авторами. Для проведения анализа была разработана программа для определения наилучших коэффициентов для классификатора. Представлены промежуточные результаты поиска коэффициентов для одного изображения из тренировочного набора. В качестве таблиц приведены результаты анализа классификаторов и сделаны соответствующие выводы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Штанчаев Хайрутин Баширович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using of the graph model and a priori image segmentation classifier in human face recognition

Human face recognition is one of the difficult problem in pattern recognition area. Properly selected image segmentation method of helps to get good accuracy for recognition. The article describes a priori classifier for the image segmentation, which is based on discontinuity and heterogeneity of the image. Proposed an image in the form of a graph model and its use for segmentation. The article describes the action of the graph model. Describes a mathematical tool for the test of the classifier. Empirically determine the accuracy of the classifier based on the quantitative characteristics such as the number of false positives and the number of true positives. The article presents a comparative analysis of the classifier and classifiers proposed by different authors. For analysis, program was developed, to determine the best coefficients for the classifier. Presented results for the coefficients of a single image from the training set. As the table shows the results of the analysis of classifiers and draw appropriate conclusions.

Текст научной работы на тему «Применение графовой модели и априорного классификатора для сегментации изображения в задачах распознавания лица человека»

Интернет-журнал «Науковедение» ISSN 2223-5167 http ://naukovedenie.ru/ Том 7, №2 (2015) http ://naukovedenie. ru/index.php?p=vol7-2 URL статьи: http://naukovedenie.ru/PDF/130TVN215.pdf DOI: 10.15862/130TVN215 (http://dx.doi.org/10.15862/130TVN215)

УДК 004.9

Штанчаев Хайрутин Баширович

ОАО «Каспийский завод листового стекла» ФГБОУ ВПО «Дагестанский государственный технический университет»

Россия, Махачкала1 Инженер АСУ ТП Аспирант

E-mail: shtanchaev.h@gmail.com

Применение графовой модели и априорного классификатора для сегментации изображения в задачах

распознавания лица человека

1 367026, Россия, Республика Дагестан, Махачкала, проспект Имама Шамиля, д. 32, корпус «Б», кв. 9

Аннотация. Распознавание лица человека является одной из сложной задачи такого направления как распознавание образов. Правильно выбранный метод сегментации изображения помогает получить хорошую точность при распознавании. Статья посвящена исследованию априорного классификатора для сегментации изображения, который основан на разрывности и неоднородности изображения. Предложено, представление изображения в виде графовой модели и ее использование для сегментации. В статье приведено описание действий над графовой моделью. Описан математический аппарат для исследуемого классификатора. Опытным путем определена точность классификатора, исходя из таких количественных характеристик как количество ложных срабатываний и количество верных срабатываний. В статье проводится сравнительный анализ классификатора и классификаторов предложенными различными авторами. Для проведения анализа была разработана программа для определения наилучших коэффициентов для классификатора. Представлены промежуточные результаты поиска коэффициентов для одного изображения из тренировочного набора. В качестве таблиц приведены результаты анализа классификаторов и сделаны соответствующие выводы.

Ключевые слова: распознавание образов; сегментация изображения; графовая модель; граф; классификатор; разрывность; однородность; интенсивность цветных изображений; восстановление изображения по графовой модели; подграф.

Ссылка для цитирования этой статьи:

Штанчаев Х.Б. Применение графовой модели и априорного классификатора для сегментации изображения в задачах распознавания лица человека // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, №2 (2015) http://naukovedenie.ru/PDF/130TVN215.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10.15862/130TVN215

Сегментация изображения связана с процессом разбиения изображения на области или объекты по некоторым признакам [1-3]. Алгоритмы сегментации изображений основываются на одном из двух базовых свойств яркости сигнала: разрывности и однородности. Наиболее подходящим методом сегментации изображения является априорный метод, который базируется на жестком задании набора правил. Правильно выбранный метод сегментации изображения помогает получить хорошую точность при распознавании лица человека на изображении. Человеческая кожа имеет характерный оттенок, позволяющий успешно сегментировать кожу на цветных изображениях. Цвет кожи разных людей отличается в основном интенсивностью. Независимость оттеночной компоненты цвета кожи от ориентации лица, а также его небольшая зависимость от яркости освещения, делают цвет устойчивым признаком кожи. На точность сегментации изображения по признаку принадлежности той или иной области к лицу человека влияет освещение, количество источников света, фенотип людей, различные помехи (борода, очки и т.д.). При имеющихся задачах фильтрации, преобразования и сегментации изображений стандартная модель представления изображения не всегда оказывается целесообразной. В этой связи может быть использована графовая модель для представления изображения.

Графовая модель изображения может быть представлена следующим образом: в = (V, Е), V = [ра], Е = [е12], Ие]А/ *Н,12е1...к

где: V - множество вершин графа^ - множество ребер графа; W - ширина изображения; H - высота изображения.

В качестве вершин графовой модели выступают пиксели исходного изображения, а ребра графа представляют связь пикселей между собой. Следует отметить, что графовая модель наращивается постепенно и в самом начале:

V = 0,Е = 0

Формула для получения графовой модели для изображения img выглядит следующим образом:

УРк&иУ]) е 1тд,в = [V и рк(хьу ¡),Е и (рк,рк+г)}, (1)

где: x,y -координаты пикселя рк; / = 1,2,..., Ш; ] = 1,2, ...,Н; к = 1,2,..., * Н)

Графически модель для изображения img представлена на рисунке 1.

А

С

Рис. 1. Обобщенная графовая модель изображения: A,B,C,D - стороны решетки графовой

модели, (составлено автором)

Введем некоторые определения графовой модели.

Определение 1. Цвет вершины графа (z) - цвет в который окрашена вершина графовой модели исходя из цвета пикселя составившей эту вершину. Цвет z исходя из поставленный задачи можно выразить численно как в цветовой системе RGB (например черный - 000000) или лингвистически ("черный цвет" или "black").

Если окрасить все вершины графа G в соответствующий цвет z получим цветную графовую модель. Тогда вместо графа G имеем тройку:

Gcoior = (V, Е, Z), V = [vi3], E = {eM}, Z = [zi5], i3 = i5 E W * H,i4 E 1,2.....k (2)

где: V - множество вершин графа; E - множество ребер графа; W - ширина изображения; H - высота изображения; Z - множество цветов вершин графа.

Например, на рисунке 2 показана цветная графовая модель у которой первые и последние вершины черного цвета.

Рис. 2. Цветная графовая модель изображения, (составлено автором)

Такую графовую модель очень удобно использовать для сегментации изображения.

Определение 2. Восстановление изображения по графовой модели - получение изображения из графа представляя вершину графа как пиксель. Т.е. для некоторого графа G имеем: Е в^тд = Ьтд и г^^,у).

Определение 3. Сегментация графовой модели - разделение графовой модели G на ! подграфов по определенному признаку. Признак зависит от поставленной задачи. Обозначим признак как P = "черный цвет". Тогда сегментацию графовой модели Gcolor можно представить, как ее разбиение на две области: одна из которых содержит вершины черного цвета, а другая содержит вершины всех остальных цветов. Это разбиение может быть представлено как удаление из графовой модели Gcolor вершин цвет которых не черный с целью получения подграфа в которой остаются все вершины черного цвета.

Е Ссо1ог, если * Р, ^{рзедт) = У(СС010Г)\{Р1б},Е(Сзедт) = Е(СС010Г)\{(Р16,Р16+к)\Р16 Е У(Ссо1ог)} (3)

Например если сегментировать графовую модель изображенную на рисунке 2 по черному цвету, мы получим подграф следующего вида:

Рис. 3. Сегментированная графовая модель изображения, (составлено автором)

Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, №2 (март - апрель 2015)

http://naukovedenie.ru publishing@naukovedenie.ru

Результатом восстановления изображения по графовой модели Gsegm будет сегментированное изображение по признаку P. Вместо признака P введем в графовую модель составной классификатор. Для этого рассмотрим цветную графовую модель G для исходного изображения img=I(x,y) где х Е 1,2, ...,W, у Е 1,2, ...,Н. В связи с тем, что в большинстве автоматизированных систем распознавания используется цветовая система RGB, представим множество цветов Z будет иметь вид Z(R,G,B).

В связи с этим перепишем (2) как:

G={VU рк(х,у),Е U (pk,pk+r),Z U z(R[pk(x,y)],G[pk(x,y)],B[pk(x,y)])} (4)

где: R,G,B - красная зеленая и синяя компоненты пикселя Pk(x,y).

Для удобной работы с изображением необходимо нормализовать компоненты всех вершин графовой модели. Для этого имеем:

V Vi Е G

R[Vi]

Г [Vi] =

g[vi] =

R[Vi] + G[Vi]+B[Vi] G[ Vi]

R[Vi] + G[Vi]+B[Vi]

где: R[Vi ], G[Vi ], B[Vi ] - красная, зеленая, и синяя компонента i-ой вершины графа соответственно до нормализации;

r[Vi], g[Vi] - красная и зеленая нормализованные компоненты i-ой вершины графа соответственно.

Следует заметить, что не нормализуется синяя компонента. В этом нет необходимости, так как в предлагаемом методе сегментации не используем ее в дальнейшем. Это является одним из действий для оптимизации метода сегментации и увеличения быстродействия. Тем самым получим новый нормализованный граф:

G = Gnormalized = (V,E,Z ) (5)

где: Z'(Vi) = {R[Vi], G[Vi],B[Vi],r[Vi],g[Vi]} - нормализованное множество цветов Z.

Для сегментации нормализованного графа GnormaUzed будем использовать составное пятиуровневое правило классификатор P:

(g[Vi] > h[Vi]) and (g[Vi] < h.2 [Vi]) and (R[Vi] > G[Vi]) and

(G[Vi] > B[Vi])and (R[Vi] - G[Vi] > h3) (6)

где: r[ Vi], g[ Vi] - красная и зеленая нормализованные компоненты вершины Vi;

R[ Vi], G[ Vi], B[ Vi] - красная, зеленая, и синяя компонента вершины Vi

h3=45.

А h1 и h2 находятся по следующим формулам:

hi[Vi] = kl * r[Vi]2 + * r[Vi] + Ц

h2[Vi]=k2*r[Vi]2+k2*r[Vi]+kl ()

Изменяя коэффициенты k^, kkk2, k%, k3 в выражении 7, можно получить сегментацию того или иного цвета и с нужной степенью точности.

Вышеописанное означает, что если для вершины Vi, выполняются указанные ограничения 7, то ее с высокой долей вероятности можно определить как относящийся к коже. Т.е. наоборот:

VVi, если для vt Р Ф 1,

то Z( = white, иначе Zi = black, т.е. если вершина отвечает условию P то ее выкрашивают в черный цвет иначе в белый. Если мы восстановим изображение по графу мы получим сегментированное изображение по признаку P.

Для определения оптимальных значений коэффициентов параметров классификатора была разработана программа внешний вид которой представлен на рисунке 4. Загружая цветное изображение нажатием кнопки "Загрузка изображения" и меняя коэффициенты можно видеть результат сегментации данного изображения описываемым классификатором. Промежуточный результат работы программы отражен в таблице 1. В ней указаны различные коэффициенты и соответствующий им результат сегментации одного и того исходного изображения представленного на рисунке 5.

Рис. 4. Внешний вид программы для определения оптимальных значений коэффициентов,

(составлено автором)

Таблица 1

Результаты сегментации при различных коэффициентах (составлено автором)

Результат сегментации

]4

к1

-0.3

0.98

0.989

-0.6567

0.68

0.1766

-1.56

0.89

-0.62

0.1332

0.9887

0.56

-0.4

0.234

0.9896

-1.3767

1.0345

0.123

-0.63

0.5112

3

3

6

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

Рис. 5. Исходное цветное изображение для сегментации

Для проведения эксперимента по определению оптимальных значений коэффициентов программе был предложен тренировочный набор из двух тысяч изображений на которых были изображены люди с различным фенотипом, расовой принадлежностью и помехами. Все изображения были сегментированы в графическом редакторе. Т.е. заранее известно какой пиксель относится к коже. Те значения коэффициентов при которых были правильно сегментированы более 98 % вершин относящихся к коже и выбраны для подсчета ошибки. Для каждой последовательности коэффициентов и каждого изображения из набора была вычислена ошибка E:

Е =

Р

(8)

Где: F - множество вершин, заранее известных, что относятся к коже человека (изображение img'=Дx,y) для эксперимента в графическом редакторе сегментируется и фильтруется); F - множество вершин детектированных как кожа человека; N - множество всех вершин, т.е. N=x*y.

Тот набор у которого для большинства изображений ошибка наименьшая и выбран для описываемого классификатора.

А именно: к1 = -1.3767, к1 = 1.0743, к1 = 0.1452, к? = -0.776, к? = 0.5601, к? = 0.1706.

Стоит отметить, что в основе выражения (6) лежат эмпирические наблюдения. Они касаются того, что для кожи человека красная компонента является преобладающей над зеленой и синей (Б). Этим обусловлено наличие красной нормализованной компоненты г в выражении (7). Так же заметим, что компоненты должны быть расположены слишком близко друг к другу, иначе образуется серый оттенок.

Для оценки точности классификатора введем два показателя:

1. Количество ложных срабатываний КЛС - определяется как отношение количества ложных обнаружений ЛО к общему числу пикселей ОЧП.

ЛО

КЖ=Ш1* 100% (9)

2. Количество верных срабатываний - определяется как отношение количества правильно сегментированных пикселей КПС к общему числу пикселей ОЧП.

Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, №2 (март - апрель 2015)

http://naukovedenie.ru publishing@naukovedenie.ru

КПС

КВС= — *100% (10)

Подсчитаем КЛС и КВС для описанного выше классификатора сегментации на наборе из 200 фотографий, и сравним результат с классификаторами предлагаемыми авторами и представим результате в качестве таблицы.

Таблица 2

Значения КЛС и КВС для различных классификаторов (составлено автором)

Классификатор КЛС,% КВС,%

Предлагаемый классификатор 5.98 93.3

Классификатор литературы [3] из 8.5 80

Классификатор литературы [5] из 28,3 88,3

Классификатор литературы [11] из 14.5 89

Классификатор литературы [8] из 20 89.79

Классификатор литературы [7] из 22 90

Классификатор литературы [9] из 28.29 90.83

Классификатор литературы [6] из 23 89.20

Классификатор литературы [4] из 22.76 90.1

Классификатор литературы [10] из 3 85.7

Как следует из таблицы описываемый классификатор имеет наибольший процент положительных срабатываний. Это означает что описываемый метод сегментации наиболее точно производит сегментацию. Однако следует обратить внимание на второй показатель. Процент ложных срабатываний меньше чем у большинства предложенных классификаторов, но больше чем у классификатора предложенного автором [10]. В связи с этим можно сделать вывод, что классификатор работает лучше и проводит сегментацию лучше, чем остальные. А процент ложных срабатываний снижается более тщательной подборкой коэффициентов для выражения (7).

Заключение

В статье предложен метод формирования графовой модели изображения, которая является качественной заменой стандартной модели при фильтрации, преобразовании и сегментации изображении. Представлен математический аппарат графовой модели и ее построения. Так же рассмотрен априорный классификатор для сегментации изображения при распознавании человека по признаку кожи. Проведен подробный анализ классификатора и его сравнения с классификаторами представленными различными авторами. По результатам анализа сделаны соответствующие выводы.

ЛИТЕРАТУРА

1. Красильников Н.Н. Цифровая обработка изображений. / Н.Н. Красильников -М.: Вузовская книга, 2001. - 320 с.

2. Методы компьютерной обработки изображений / под. ред. В.А. Сойфера-М.: ФИЗМАТЛИТ, 2003. - 784 с.

3. Петрашко А.А. Сегментация в контексте задачи обнаружения лиц на изображениях // Доклады ТУСУРа. - 2007. - №2(16). - С. 129-133.

4. Ульд Ахмед Талеб Махфуд Комбинированные алгоритмы сегментации цветных изображений: Автореф. дис. канд. техн. наук. - Минск, 2002. - 20 с.

5. Хомяков М.Ю. Классификация цвета кожи на цветных изображениях// Компьютерная оптика. - 2011. - том 35. № - С. 373-379.

6. Chai, D. Face segmentation using skin-color map in videophone applications / D. Chai; K.N. Ngan // IEEE Trans. Circuits and Systems for Video Technology. - 1999. - Vol.9(4). - P. 551-564.

7. Martinkauppi, B. Detection of Skin Color under Changing Illumination: A Comparative Study / B. Martinkauppi, M. Soriano, M. Pietikainen // Proc. of the 12th International Conference on Image Analysis and Processing (ICIAP'03), September 17-19. - Mantova, Italy: IEEE Computer Society, 2003. - P. 652-657.

8. Phung, S.L. Skin segmentation using color pixel classification: analysis and comparison / S.L. Phung, A. Bouzerdoum, D. Chai // IEEE Trans. Pattern Analysis and Machine Intelligence. - 2005. - Vol. 27(1). - P. 148-154.

9. Rahman, N.A. RGB-H-CbCr Skin Colour Model for Human Face Detection / N.A. Rahman, K.C. Wei, J. See // Proc. of The MMU International Symposium on Information & Communications Technologies (M2USIC 2006), November 16-17. -Petaling Jaya, Malaysia: Multimedia University, 2006.

10. Sayantan Thakur, Sayantanu Paul, Ankur Mondal Face Detection Using Skin Tone Segmentation.

11. Vezhnevets, V.A survey on pixel-based skin color detection techniques / V. Vezhnevets, V. Sazonov, A. Andreeva // Proc. of International Conference on the Computer Graphics and Vision (GraphiCon'2003), September 5-10. Moscow, Russia: "Moscow State University" Publisher, 2003. - P. 85-92.

Рецензент: Мелехин Владимир Борисович, заведующий кафедры «Вычислительной техники», доктор технических наук, профессор, ФГБОУ ВПО «Дагестанский государственный технический университет».

Shtanchaev Khayrutin Bashirovich

Caspian Flat Glass / Dagestan State Technical University Russia, Dagestan republic, Makhachkala E-mail: shtanchaev.h@gmail.com

Using of the graph model and a priori image segmentation classifier in human face recognition

Abstract. Human face recognition is one of the difficult problem in pattern recognition area. Properly selected image segmentation method of helps to get good accuracy for recognition. The article describes a priori classifier for the image segmentation , which is based on discontinuity and heterogeneity of the image. Proposed an image in the form of a graph model and its use for segmentation. The article describes the action of the graph model. Describes a mathematical tool for the test of the classifier. Empirically determine the accuracy of the classifier based on the quantitative characteristics such as the number of false positives and the number of true positives. The article presents a comparative analysis of the classifier and classifiers proposed by different authors. For analysis, program was developed, to determine the best coefficients for the classifier. Presented results for the coefficients of a single image from the training set. As the table shows the results of the analysis of classifiers and draw appropriate conclusions.

Keywords: pattern recognition; image segmentation; graph model; graph; classifier; discontinuity; uniformity; the intensity of the color image; recovery image on the graph model; sub graph.

REFERENCES

1. Krasil'nikov N.N. Tsifrovaya obrabotka izobrazheniy. / N.N. Krasil'nikov - M.: Vuzovskaya kniga, 2001. - 320 s.

2. Metody komp'yuternoy obrabotki izobrazheniy / pod. red. V.A. Soyfera-M.: FIZMATLIT, 2003. - 784 s.

3. Petrashko A.A. Segmentatsiya v kontekste zadachi obnaruzheniya lits na izobrazheniyakh // Doklady TUSURa. - 2007. - №2(16). - S. 129-133.

4. Ul'd Akhmed Taleb Makhfud Kombinirovannye algoritmy segmentatsii tsvetnykh izobrazheniy: Avtoref. dis. kand. tekhn. nauk. - Minsk, 2002. - 20 s.

5. Khomyakov M.Yu. Klassifikatsiya tsveta kozhi na tsvetnykh izobrazheniyakh// Komp'yuternaya optika. - 2011. - tom 35. № - S. 373-379.

6. Chai, D. Face segmentation using skin-color map in videophone applications / D. Chai; K.N. Ngan // IEEE Trans. Circuits and Systems for Video Technology. - 1999. - Vol.9(4). - P. 551-564.

7. Martinkauppi, B. Detection of Skin Color under Changing Illumination: A Comparative Study / B. Martinkauppi, M. Soriano, M. Pietikainen // Proc. of the 12th International Conference on Image Analysis and Processing (ICIAP'03), September 17-19. - Mantova, Italy: IEEE Computer Society, 2003. - P. 652-657.

8. Phung, S.L. Skin segmentation using color pixel classification: analysis and comparison / S.L. Phung, A. Bouzerdoum, D. Chai // IEEE Trans. Pattern Analysis and Machine Intelligence. - 2005. - Vol. 27(1). - P. 148-154.

9. Rahman, N.A. RGB-H-CbCr Skin Colour Model for Human Face Detection / N.A. Rahman, K.C. Wei, J. See // Proc. of The MMU International Symposium on Information & Communications Technologies (M2USIC 2006), November 16-17. -Petaling Jaya, Malaysia: Multimedia University, 2006.

10. Sayantan Thakur, Sayantanu Paul, Ankur Mondal Face Detection Using Skin Tone Segmentation.

11. Vezhnevets, V.A survey on pixel-based skin color detection techniques / V. Vezhnevets, V. Sazonov, A. Andreeva // Proc. of International Conference on the Computer Graphics and Vision (GraphiCon'2003), September 5-10. Moscow, Russia: "Moscow State University" Publisher, 2003. - P. 85-92.

i Надоели баннеры? Вы всегда можете отключить рекламу.