Научная статья на тему 'МЕТОДИКА ОБУЧЕНИЯ БИНАРНЫХ КЛАССИФИКАТОРОВ В ЗАДАЧАХ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ'

МЕТОДИКА ОБУЧЕНИЯ БИНАРНЫХ КЛАССИФИКАТОРОВ В ЗАДАЧАХ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
102
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕГМЕНТАЦИЯ КОЖИ / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ / КЛАССИФИКАТОР БАЙЕСА / КЛАССИФИКАТОР ГАУССА / ROC-КРИВАЯ / ROC-АНАЛИЗ / SKIN DETECTION / IMAGE SEGMENTATION / BYAESIAN CLASSIFIER / GAUSSIAN CLASSIFIER / ROC CURVE / ROC ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Воротнёв Д.В., Голованов Р.В.

Сегментация кожи человека на изображении широко применяется в качестве алгоритмов компьютерного зрения. Наиболее распространенным подходом к повышению качества сегментации кожи является обучение бинарного классификатора, отделяющего цвета кожи человека от цветов фона. В работе рассмотрена проблема обучения бинарных классификаторов. Предложен новый метод получения обучающей выборки с унификацией цветов на каждом изображении. Построена сглаженная ROC-кривая. Даны рекомендации по подготовке тестовой выборки для правильного сравнения бинарных классификаторов. С использованием предложенного метода проведено обучение классификаторов Гаусса и Байеса. Представлены результаты тестирования и сравнения полученных классификаторов. Показано, что рассмотренный метод может улучшить качество сегментации кожи до 4 % по метрике TPR и до 10 % по метрике FPR. Классификатор Байеса, обученный согласно предложенному методу, обеспечивает наилучшие результаты сегментации среди всех рассмотренных классификаторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Воротнёв Д.В., Голованов Р.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BINARY CLASSIFIERS TRAINING APPROACH FOR IMAGE SEGMENTATION

One of the commonly used algorithms in computer vision is the human skin segmentation in the image. The most common approach to skin segmentation is training a binary classifier to separate human skin (foreground) pixels from the background ones. In the paper the problem of training such binary classifiers has been discussed. A smoothed ROC curve has been constructed. The recommendations for a test set obtaining for correction comparison of binary classifiers have been given. Using the proposed method the training of single Gaussian and Bayesian classifiers by the proposed method has been carried out. The results of testing and comparison of the obtained classifiers have been given. It has been shown that this method can improve the quality of skin segmentation up to 4 % of TRP metric and up to 10% of FRP. The Bayesian classifier, trained according to the proposed method provides the best segmentation results among all considered classifiers.

Текст научной работы на тему «МЕТОДИКА ОБУЧЕНИЯ БИНАРНЫХ КЛАССИФИКАТОРОВ В ЗАДАЧАХ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ»

ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫЕ

ТЕХНОЛОГИИ INFORMATION-COMMUNICATION TECHNOLOGIES

УДК 004.932 DOI: 10.24151/1561-5405-2019-24-3-279-290

Методика обучения бинарных классификаторов в задачах сегментации изображений

1 12 Д.В. Воротнёв , Р.В. Голованов '

1АО НПЦ «ЭЛВИС», г. Москва, Россия

2

Национальный исследовательский университет «МИЭТ», г. Москва, Россия

Сегментация кожи человека на изображении широко применяется в качестве алгоритмов компьютерного зрения. Наиболее распространенным подходом к повышению качества сегментации кожи является обучение бинарного классификатора, отделяющего цвета кожи человека от цветов фона. В работе рассмотрена проблема обучения бинарных классификаторов. Предложен новый метод получения обучающей выборки с унификацией цветов на каждом изображении. Построена сглаженная ROC-кривая. Даны рекомендации по подготовке тестовой выборки для правильного сравнения бинарных классификаторов. С использованием предложенного метода проведено обучение классификаторов Гаусса и Байеса. Представлены результаты тестирования и сравнения полученных классификаторов. Показано, что рассмотренный метод может улучшить качество сегментации кожи до 4 % по метрике TPR и до 10 % по метрике FPR. Классификатор Байеса, обученный согласно предложенному методу, обеспечивает наилучшие результаты сегментации среди всех рассмотренных классификаторов.

Ключевые слова: сегментация кожи; сегментация изображений; классификатор Байеса; классификатор Гаусса; ROC-кривая; ROC-анализ

Финансирование работы: работа выполнена при финансовой поддержке РФФИ (грант №18 - 31 - 00141).

Для цитирования: Воротнёв Д.В., Голованов Р.В. Методика обучения бинарных классификаторов в задачах сегментации изображений // Изв. вузов. Электроника. - 2019. - Т. 24. - № 3. - С. 279-290. DOI: 10.24151/1561-5405-2019-24-3279-290

© Д.В. Воротнёв, Р.В. Голованов, 2019

Binary Classifiers Training Approach for Image Segmentation

1 12 D. V. Vorotnev , R.V. Golovanov '

JSC RnD Center ELVEES, Moscow, Russia

2

National Research University of Electronic Technology, Moscow, Russia

Abstract: One of the commonly used algorithms in computer vision is the human skin segmentation in the image. The most common approach to skin segmentation is training a binary classifier to separate human skin (foreground) pixels from the background ones. In the paper the problem of training such binary classifiers has been discussed. A smoothed ROC curve has been constructed. The recommendations for a test set obtaining for correction comparison of binary classifiers have been given. Using the proposed method the training of single Gaussian and Bayesian classifiers by the proposed method has been carried out. The results of testing and comparison of the obtained classifiers have been given. It has been shown that this method can improve the quality of skin segmentation up to 4 % of TRP metric and up to 10% of FRP. The Bayesian classifier, trained according to the proposed method provides the best segmentation results among all considered classifiers.

Keywords: skin detection; image segmentation; Byaesian classifier; Gaussian classifier; ROC curve; ROC analysis

Funding: the work has been financial supported by RFBR according to the research (proj ect No18-31-00141).

For citation: Vorotnev D.V., Golovanov R.V. Binary classifiers training approach for image segmentation. Proc. Univ. Electronics, 2019, vol. 24, no. 3, pp. 279-290. DOI: 10.24151/1561-5405-2019-24-3-279-290

Введение. Одна из основных прикладных задач компьютерного зрения - сегментация кожи на изображении. В качестве примеров приложений, в которых используется сегментация кожи, можно привести алгоритмы распознавания лиц, верификацию людей по фотографиям, алгоритмы видеонаблюдения и человеко-машинные интерфейсы. Во всех этих задачах предварительная сегментация кожи на изображении позволяет ускорить обработку за счет снижения количества «объектов интереса». Подобная предобработка существенно уменьшает количество вычислений и позволяет значительно снизить требования, предъявляемые к электронной аппаратуре конечного устройства. Наиболее распространенным методом сегментации кожи является построение бинарного классификатора. Классический метод обучения таких классификаторов заключается в объединении всех пикселей одного класса с каждого изображения в обучающую выборку.

В настоящей работе предлагается новый метод обучения бинарных классификаторов, основная идея которого заключается в добавлении в обучающую выборку с каждого изображения только уникальных пикселей каждого класса.

Бинарные классификаторы. В настоящее время разработано множество алгоритмов сегментации изображения. Основная задача этих алгоритмов - извлечение семан-

тически значимых областей. Это позволяет существенно уменьшить количество хранимой, передаваемой и обрабатываемой информации на последующих этапах анализа изображения. Одно из применений таких алгоритмов - обнаружение человека на изображении. Во многих приложениях оказывается достаточным определить это по цвету, характерному для кожи человека [1-3]. В общем случае задача сводится к разработке алгоритма A: C ^ D для классификации всевозможных цветов пикселей C : {ci} по категориям D: {dj}.

Ограничимся рассмотрением 8-битного 3-канального изображения I(x,y) и будем проводить классификацию цветов {сг },0 < i < 2553 по двум категориям {bg,skin} : фон и кожа. Результатом сегментации будет бинарное изображение B(x, y): {0,1} (рис.1) [4].

Рис.1. Примеры входного изображения (а) и ручной сегментации изображения (б). Белый цвет - пиксели кожи, черный - фон Fig. 1. Examples of input image (a) and manually segmented image (b). White color - skin pixels,

black color - background

Классификатор Гаусса (1С) является одной из самых простых и распространенных параметрических моделей, применямых для сегментации изображений. Для сегментации кожи алгоритму, использующему данную модель, необходимо предварительно определить вектор математического ожидания ц и матрицу ковариаций Е, т.е. требуется обучить классификатор. Для этого используется обучающая выборка, содержащая образцы точек кожи и точек фона. Для каждого образца определена пара (с, ), где с -

цвет пикселя, - истинный класс пикселя. Параметры классификатора вычисляются с помощью обучающей выборки по формулам

1А 1

-> с

^ = - Ё cj, Е = —1 Ё(с;

n i=i n 1 j=1

где п - суммарное количество образцов точек кожи с..

Классификация проводится независимо для каждого пикселя:

Р (с) = (27Г • ехР (-1 (с- - ц)г (с- - ц)) • (1)

Чувствительность алгоритма регулируется общим порогом Th . Для каждого пикселя изображения I(x, y) = c, а именно: если P (c ) > Th, то B(x, y) = 1, иначе B(x, y) = 0.

Классификатор Байеса также получил большую популярность [5-8]. Основная идея данной модели сводится к сравнению двух условных вероятностей: P(c | bg) и P(C | skin) - вероятности принадлежности цвета c к фону, если известно, что наблюдается цвет фона, и, напротив, если наблюдается цвет кожи. Чувствительность алгоритма регулируется общим порогом Th для каждого пикселя изображения I(x, y) = c :

P(C | skin)

P(c | bg)

> Th.

(2)

Если отношение превышает порог, то B( x, y) = 1, иначе B(x, y) = 0.

Для использования классификатора Байеса необходимо иметь таблицы условных вероятностей ^ (c.) = P(c | skin) и Tbg (ci) = P(ci | bg) для каждого цвета. Данные таблицы строятся в результате обучения классификатора с помощью обучающей выборки.

Алгоритм построения таблиц условных вероятностей Tb (c), TsMn (c) по обучающей выборке сводится к равномерному квантованию цветового пространства {с.},О <7 <2553 с шагом Лс^ в новое пространство {с .},0< j <тъ, т = |~255/Дсика.~|. Далее для каждого значения с , вычисляются вероятности P(cj \ bg) и 1){cj \ skin). Полученные вероятности приписываются соответствующим ячейкам таблиц:

Tbg (c) = P(Lc7Acmax J | bg), (3)

Tkn (c) = P(Lc/Acmax J | skin), (4)

которые используются при классификации в (2).

Методики обучения. Классический подход к формированию обучающей выборки учитывает все пары (c, dref), даже если они повторяются на одном и том же изображении. Это означает, что площадь объекта на изображении и размеры исходного изображения оказывают влияние на расчетные условные вероятности в таблицах (3), (4), а это, в свою очередь, негативно сказывается на результатах работы классификатора.

Основным недостатком использования классического способа формирования обучающих выборок является чувствительность к площади объектов на изображении. Два разных по цвету объекта, пиксели которых принадлежат одному классу, могут различаться по размеру на изображении. В результате цвет пикселей большего по площади объекта будет иметь большую вероятность в обучающей выборке (рис.2). На данном рисунке приведено квадратное изображение размером N х N, фон на котором имеет два цвета: черный и белый. В центре данного

Рис. 2. Синтетическое изображение кожи и фона

Fig.2. Artificial image model with skin and background

изображения находится квадратный объект размером M х M, принадлежащий классу кожи. Пиксели данного объекта также имеют два цвета: белый и серый.

Значения условных вероятностей P(class | ci) для каждого цвета при использовании классического метода формирования обучающей выборки приведены в табл.1. Для каждого цвета показана расчетная вероятность принадлежности каждому классу. Видно, что вероятности для белого цвета зависят от размеров объекта на изображении и самого изображения.

Таблица 1

Значения условных вероятностей для трех цветов при обучении классическим и предложенным методами

Table 1

Conditional probabilities for modelling samples with classical training approach and new training approach

Класс Белый Серый Черный

Классический метод

Фон 1 - m2/n2 0 1

Кожа m2/n2 1 0

Предложенный метод

Фон 0,5 0 1

Кожа 0,5 1 0

Основная идея нового метода формирования обучающей выборки заключается в добавлении с каждого размеченного изображения только уникальных образцов пикселей требуемого класса. В результате этого при формировании обучающей выборки площадь объекта на изображении не учитывается. При этом цвета могут повторяться, если эти цвета кожи и фона встречаются на разных изображениях. Как показано в табл.1, для рассмотренного примера условные вероятности будут иметь фиксированные значения, не зависящие от размеров объекта и изображения. В результате на условные вероятности (1) и (2) будет влиять только количество размеченных изображений, на которых присутствовали пиксели цвета c, а не размеры объектов. Для проверки целесообразности рассматриваемого метода предлагается из размеченных изображений сформировать четыре варианта обучающих выборок: 1) Classical -классический метод (по всем доступным данным); 2) Unique skin - унификация только пикселей кожи; 3) Unique background - унификация только пикселей фона; 4) Unique -унификация пикселей всех классов.

Для каждого варианта выборок будут обучены классические классификаторы 1G и Байеса и проведено тестирование качества сегментации полученных классификаторов.

ROC-анализ. Метод сравнения классификаторов. Для оценки качества сегментации классификатора используется тестовая выборка, которая формируется из размеченных данных. Тестовая выборка, так же как и обучающая, является набором пар значений (c, dre/). Далее проводится оценка ответов классификатора на тестовой выборке.

Для этого используются базовые метрики, которые являются оценками ошибок I и II рода и широко применяются в статистике.

Результаты сегментации 1G классификатора и классификатора Байеса зависят от единственного параметра Th, отвечающего за разделение точек кожи от точек фона по вероятности. Поэтому для разных значений параметра значения базовых метрик могут

отличаться. Общепринятым методом сравнения подобных классификаторов является построение ROC-кривой для каждого из них [5, 7].

Построение ROC-кривых. Для построения ROC-кривой необходимо классифицировать точки из тестовой выборки при различных значениях Th. Далее для каждого значения Th вычисляется пара базовых метрик (FPR-false positive rate, TPR-true positive rate), которые будут точками ROC-кривой. Подробное описание базовых метрик приведено в [9]. При построении с фиксированным шагом по значениям Th ROC-кривая в большинстве случаев получается с изломами. Это происходит из-за того, что значение FPR зависит от Th нелинейным образом.

Предлагается использовать оригинальный способ построения ROC-кривой для получения практически равномерной сетки значений FPR. Сначала задается максимально возможное расстояние d^ между значениями по оси FPR. Далее находится максимально возможный порог для данной тестовой выборки:

max

С P(c | skin) Л P(C | bg)

= Th

Щ = Thmax

После этого вычисляются пары значений (FPR, TPR) для параметров Th = 0 и . Если расстояние между полученными значениями FPR больше, чем d ,

то вычисляется новая пара значений при Th, ={Th2 - Th ) /2. Процедура разбиения повторяется до тех пор, пока расстояние между всеми точками по оси FPR не станет меньше d . В результате получается визуально

«гладкая» кривая. Однако этого оказывается недостаточно для того, чтобы сравнивать ROC-кривые, так как в локальной окрестности каждой точки имеются резкие изменения кривой (до 3 %), что хорошо видно на графике производной для классического метода (рис.3). Поэтому предлагается сравнивать не сами ROC-кривые, а их сглаженные модели.

Эксперименты показали, что для сглаживания ROC-кривой достаточно использовать квадратичную аппроксимацию по пяти соседним точкам (табл.2). Она заметно превосходит линейную аппроксимацию и незначительно уступает кубической. Среднеквадратичная ошибка между истинными значениями ROC-кривой X и сглаженными X* составляет ~0,12 %, что качественно не влияет на дальнейшее сравнение ROC-кривых.

Таблица 2

Аппроксимация ROC-кривой (ошибка аппроксимации, ||А—A"*||L2, х10 )

Table 2

ROC-curves approximation

Рис.3. Пример первой производной для ROC-кривой Fig.3. Example of 1st derivative of the ROC-curve

Тип аппроксимации Classical Unique Unique background Unique skin

Линейная 3,96 4,11 4,06 3,87

Квадратичная 1,13 1,17 1,11 1,47

Кубическая 1,08 1,10 0,95 1,33

Общие выборки для тестирования. Обучение и тестирование разных алгоритмов сегментации рекомендуется проводить на одних и тех же предварительно сгенерированных обучающей и тестовой выборках. Использование различных обучающих и тестовых выборок для тестируемых алгоритмов может привести к недостоверным результатам.

Для обоснования данного утверждения сгенерированы две различные тестовые выборки со следующим количеством точек кожи и фона соответственно: 391 510, 1 197 448 и 391 177, 1 388 444.

На полученных выборках проведено тестирование обученного ранее классификатора Байеса. Построенные ROC-кривые приведены на рис.4. Видно, что один и тот же алгоритм показывает разные результаты при тестировании на разных выборках. Это можно объяснить тем, что в одной из выборок содержится больше точек, на которых проводилось обучение классификатора. Поэтому одна из выборок является более «выгодной» для классификатора.

Исходя из этого можно сделать вывод, что для всех тестируемых алгоритмов должны использоваться одинаковые обучающая и тестовая выборки, сгенерированные заранее.

Размеры тестовой выборки. Отметим, что количество точек в тестовой выборке не оказывает существенного влияния на результаты тестирования. Для проверки этого факта из тестовой выборки сгенерировано пять подвыборок, на которых проведено тестирование классификатора 1G и классификатора Байеса. В табл.3 указаны размеры тестовых выборок и максимальные отклонения полученных ROC-кривых от исходной.

Таблица 3

Характеристики тестовых подвыборок

Table 3

Characteristics of the test subsets

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Уменьшение Абсолютная ошибка

выборки, % Кожа Фон Классификатор Гаусса Классификатор Байеса

0 396359 1 187 458 0,0 0,0

20 317 087 949 966 0,0016 0,0005

40 237 815 712 474 0,0026 0,0028

60 158 543 474 983 0,0018 0,0021

80 79 271 237 491 0,0024 0,0031

Приведенные в табл.3 размеры исходной тестовой выборки (в первой строке) и меньших тестовых выборок получены с помощью урезания 20-80% образцов из исходной выборки. В двух последних колонках приведены абсолютные значения ошибок между ROC-кривыми, полученными на уменьшенных выборках и на исходной, для обоих классификаторов. Максимальная ошибка составляет около 0,003 при удалении 80 % выборки, что не является существенным и не влияет на результаты сравнения.

Л!

/J у f S

/У //

I А ft

// //

// //

V,—,—,—,—,—,—,—

О 0,1 0,2 0,3 0,4 0,5 0,6 FPR

Рис.4. ROC-кривые, построенные с использованием сгенерированных выборок Fig.4. ROC-curves, constructed by generated sets

Образцы из тестовой выборки следует удалять случайным образом для сохранения распределения оставшихся образцов. Если удалить точки только из какого-нибудь определенного диапазона, то это окажет существенное влияние на результаты тестирования. Кроме того, соотношение классов в тестовой выборке также не влияет на результаты тестирования благодаря использованию нормированных метрик FPR и TPR.

Воспроизводимость экспериментов. Результаты тестирования алгоритмов сегментации не зависят от способа разбиения данных на обучающую и тестовую выборки. Для проверки этой гипотезы случайным образом сформировано 10 различных пар тестовых и обучающих выборок одинакового размера. На каждой из полученных пар выборок проведено обучение и тестирование бинарных классификаторов 1G и Байеса. Для полученных классификаторов построены по десять аппроксимированных ROC-кривых и затем их значения усреднены.

Абсолютные значения максимальных отклонений полученных ROC-кривых от усреднения для каждого типа обучающей выборки приведены в табл. 4. Видно, что максимальная абсолютная величина ошибки составляет около 0,0013. Из этого следует, что обучение и тестирование бинарных классификаторов для сравнения достаточно проводить только один раз.

Таблица 4

Ошибки при повторении эксперимента для четырех вариантов обучающих выборок

Table 4

Error of experiment repeating

Классификатор Classical Unique Unique background Unique skin

Гаусса 0,0008 0,0010 0,0009 0,0009

Байеса 0,0009 0,0013 0,0010 0,0015

Унификация цветов пикселей в тестовой выборке. В тестовой выборке для каждого класса не должны присутствовать пиксели одного цвета. В результате классификации такие пиксели будут иметь одинаковое значение отношения вероятностей. Это может привести к резкому изменению значения TPR или FPR, так как сразу несколько пикселей будут одинаково классифицированы. Из-за возникновения подобных скачков добиться гладкости ROC-кривой будет невозможно.

Тестирование. Входные данные. Для тестирования выбрано цветовое пространство YCrCb, как рекомендуется в [7]. В модели классификатора использовались все три компоненты цветового пространства. Диапазон цветов по каждой компоненте равномерно проквантован на m = 64 значения (Дстх = 4 ) [7].

Размеченные данные для формирования обучающих и тестовой выборок получены путем объединения общедоступных дата-сетов: Pratheepan Dataset [4]; Database for hand gesture recognition [10]; IBDT Dataset for Skin Detection [11].

Размеры сформированных выборок приведены в табл.5.

Таблица 5

Размеры выборок

Table 5

Sets sizes

Тестовая выборка

Категория Classical Unique Unique background Unique skin

Фон 310 383 594 24 699 303 24 699 303 310 383 594 1 187 458

Кожа 65 509 216 16 928 633 65 509 216 16 928 633 396359

Для проверки качества всех полученных классификаторов использовалась одна тестовая выборка, сформированная в соответствии с предложенными рекомендациями.

Анализ ЯОС-кривых. На рис.5,а приведены результаты тестирования классификаторов Ш, обученных описанными методами. Из графика видно, что классификатор, обученный по предложенной методике, превосходит классификатор, обученный классическим способом при всех значениях FPR. При этом значение TPR увеличилось в среднем на 0,0075 по абсолютной величине, или на 1,1% по относительной. Максимальный прирост TPR составил 0,01 по абсолютной величине, или 1,8 %. Отметим, что поскольку для обучения данного классификатора используется только выборка, содержащая образцы точек кожи, унификация точек фона не влияет на результат. Поэтому в сравнении участвовали только классификатор, обученный по классической методике, и классификатор, обученный при унификации точек кожи.

TPR

0,90 0,85 0,80 0,75 0,70 0,65 0,60

S s/

у //

V

/ — Unique skin — Classical method

TPR

0,95 0,90 0,85 0,80 0,75 0,70

0,25 0,30 0,35 0,40 0,45 0,50 0,55 FPR а

0,65

V

// s

'//f f/

//// /// //' — Unique background — Unique — Classical method — Unique skin

V

0,25 0,30 0,35 0,40 0,45 0,50 0,55 FPR г)

TPR

0,90 0,80 0,70 0,60 0,50

0,40

/

/

/

/

* /

— Bayes (Unique background) -Gaussian (Unique skin) -1-1-r-1---,-

0,15

0,25

0,35 0,45 в

0,55 FPR

Рис.5. Сравнение классификаторов; а - IG; б - Байеса; в - 1G и Байеса Fig.5. Classifiers comparison; а - IG; b - Bayesian; с - 1G and Bayesian

На рис. 5,б приведены ROC-кривые для четырех классификаторов Байеса, обученных описанными методами. Использование Unique и Unique background обучающих выборок дает заметно лучший результат по сравнению с классическим подходом. При этом Unique background незначительно превосходит Unique. Это означает, что унификация точек фона в обучающих выборках является первостепенной задачей при подготовке к обучению классификатора Байеса.

В среднем классификаторы Unique background и Unique обеспечивают прирост TPR на 0,0190 и на 0,0176 соответственно по абсолютной величине, или на 2,3 и 3,7 % по относительной. Максимальный прирост TPR составил соответственно 0,0318 и 0,0294,

или 3,7 и 3,5 %. Классификатор Unique skin, напротив, показал результат хуже в среднем на 0,0086, или 1,1 %, и максимально до 0,0183, или 2,3 %.

Из рис.5,а,б видно, что при использовании новых подходов к обучению классификатора можно добиться улучшения в качестве сегментации до 4 % по метрике TPR и уменьшения ошибок классификации FPR до 10 %.

ROC-кривая, полученная для классификатора, обученного классическим методом, отличается от ROC-кривой, приведенной в [7]. Скорее всего, это связано с различием обучающих выборок, так как авторы [7] использовали закрытый дата-сет.

На рис. 5,в приведены ROC-кривые для классификаторов 1G Unique skin и Байеса Unique background, показавших лучшие результаты. При сравнении ROC-кривых видно, что классификатор Байеса показывает результаты, заметно превосходящие результаты классификатора 1 G на всем основном рабочем диапазоне значений FPR.

Пример сегментации. На рис.6 приведены результаты сегментации изображения на рис.1,а с помощью классического и предложенного классификаторов Байеса соответственно. На данном примере видно, что предложенный способ обучения позволяет уменьшить количество ложных срабатываний алгоритма, практически не ухудшая при этом качество выделения объектов.

Рис.6. Результаты сегментации изображения (см. рис.1) классическим классификатором Байеса (а) и предложенным классификатором Байеса с унификацией всех образцов классов (б) Fig.6. Segmentation results for image from figure 1 with classical training approach for Bayesian classifier (a) and new proposed training approach with all unique samples for Bayesian classifier (b)

Заключение. Новая методика обучения бинарных классификаторов на основе унификации цветов пикселей между изображениями позволяет повысить качество сегментации кожи до 4 % по TPR и уменьшить ошибки сегментации до 10 % по FPR по сравнению с классическим подходом.

Результаты предложенного метода и рекомендации по его использованию можно сформулировать в следующем виде:

1. Унификация цветов в соответствии с предложенной методикой уменьшает размеры обучающей выборки и уменьшает время, необходимое на обучение классификаторов.

2. Для получения промежуточных значений ROC-кривой рекомендуется использовать предложенную процедуру автоматического выбора значений параметра алгоритма.

3. При сравнении бинарных классификаторов обучение и тестирование следует проводить на одинаковых обучающей и тестовой выборках.

4. Размеры тестовой выборки не влияют на результаты тестирования.

5. При повторной генерации выборок результаты практически не изменяются.

6. Для сравнения ROC-кривых рекомендуется использовать квадратичную аппроксимацию в локальной окрестности каждой сравниваемой точки.

7. Тестовые выборки должны быть правильно составлены, чтобы ROC-кривая не содержала дублирующихся точек одного класса, так как это приводит к резким скачкам значений TPR.

Таким образом, предлагаемый метод обучения позволяет улучшить результаты выделения кожи на изображении. В итоге существенно уменьшается количество данных и вычислений, необходимых для обучения классификатора, что позволяет выполнять обучение классификаторов на менее производительной электронной аппаратуре.

Литература

1. Vorotnev D., Golovanov R., Umnyashkin S. Training Bayesian classifier with scaling unique colors among image samples // Young Researchers in Electrical and Electronic Engineering (EIConRus), 2018 IEEE Conference of Russian. - IEEE, 2018. - P. 1835-1839.

2. Comparative study of skin color detection and segmentation in HSV and YCbCr color space / K.B. Shaik, P. Ganesan et al. // Procedia Computer Science. - 2015. - Vol. 57. - P. 41-48.

3. Santos A., Pedrini H. Human skin segmentation improved by saliency detection // International Conference on Computer Analysis of Images and Patterns. - Cham: Springer, 2015. - P. 146-157.

4. Chan C., Chee Seng Chan. Pratheepan Dataset. - 2017. -

URL: cs-chan.com/downloads_skin_dataset.html (дата обращения: 10.12.2018).

5. Jones M.J., Rehg J.M. Statistical color models with application to skin detection //International Journal of Computer Vision. - 2002. - Vol. 46. - No. 1. - P. 81-96.

6. Vezhnevets V., Sazonov V., Andreeva A. A survey on pixel-based skin color detection techniques // Proc. Graphicon. - 2003. - Vol. 3. - P. 85-92.

7. Vezhnevets V., Andreeva A. A comparative assessment of pixel-based skin detection methods // GML Computer Vision Group. - 2005. - URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi= 10.1.1.101.4728&rep=rep 1&type=pdf (дата обращения 10.12.2018).

8. Kakumanu P., Makrogiannis S., Bourbakis N. A survey of skin-color modeling and detection methods // Pattern recognition. - 2007. - Vol. 40. - No. 3. - P. 1106-1122.

9. Голованов Р.В., Воротнёв Д.В. Методика сравнения алгоритмов сегментации движения // 18-я Международная конференция «Цифровая обработка сигналов и ее применение» (Москва, 2016 г.). -М., 2016. - С. 633-638

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Michal Kawulok, Tomasz Grzejszczak, Jakub Nalepa, Mateusz Knyc. Database for hand gesture recognition. - 2017. - URL: http://sun.aei.polsl.pl/~mkawulok/gestures/ (дата обращения: 10.12.2018).

11. Learning-Based Multimedia Lab. Dataset for Skin Detection. - 2017. -

URL: http://lbmedia.ece.ucsb.edu/resources/dataset/ibtd.zip (дата обращения: 10.12.2018).

Поступила в редакцию 10.12.2018 г.; после доработки 10.12.2018 г.; принята к публикации 19.03.2019 г.

Воротнёв Дмитрий Викторович - инженер-программист АО НПЦ «ЭЛВИС» (Россия, 124498, г. Москва, г. Зеленоград, пр. №4922, д. 4, стр. 2), vorotnyov.dmitriy@gmail .com

Голованов Роман Вячеславович - кандидат физико-математических наук, ведущий инженер АО НПЦ «ЭЛВИС» (Россия, 124498, г. Москва, г. Зеленоград, пр. №4922, д. 4, стр. 2), доцент кафедры высшей математики № 1 Национального исследовательского университета «МИЭТ» (Россия, 124498, г. Москва, г. Зеленоград, пл. Шокина, д. 1), golovanovrv@gmail.com

References

1. Vorotnev D., Golovanov R., Umnyashkin S. Training Bayesian classifier with scaling unique colors among image samples. Young Researchers in Electrical and Electronic Engineering (EIConRus), 2018 IEEE Conference of Russian. IEEE, 2018, pp. 1835-1839.

2. Shaik K. B., Ganesan P. et al. Comparative study of skin color detection and segmentation in HSV and YCbCr color space. Procedia Computer Science, 2015, vol. 57, pp. 41-48.

3. Santos A., Pedrini H. Human skin segmentation improved by saliency detection. International Conference on Computer Analysis of Images and Patterns. Springer, Cham, 2015, pp. 146-157.

4. Chan C., Chee Seng Chan. Pratheepan Dataset, 2017. Available at: http://cs-chan.com/downloads_skin_dataset.html (accessed: 10. 12. 2018).

5. Jones M. J., Rehg J. M. Statistical color models with application to skin detection. International Journal of Computer Vision, 2002, vol. 46, no. 1, pp. 81-96.

6. Vezhnevets V., Sazonov V., Andreeva A. A survey on pixel-based skin color detection techniques. Proc. Graphicon, 2003, vol. 3, pp. 85-92.

7. Vezhnevets V., Andreeva A. A comparative assessment of pixel-based skin detection methods. GML Computer Vision Group, 2005. Available at: http://citeseerx.ist.psu.edu/viewdoc/download?doi= 10.1.1.101.4728&rep=rep 1&type=pdf (accessed: 10.12. 2018).

8. Kakumanu P., Makrogiannis S., Bourbakis N. A survey of skin-color modeling and detection methods. Pattern recognition, 2007, vol. 40, no. 3, pp. 1106-1122.

9. Golovanov R.V., Vorotnev D.V. The method of motion detection algorithms comparison. 18th International Conference on Digital Signal Processing and its Applications. IEEE/DSPA'16, Moscow, 2016, vol. 2, pp. 633-638. (In Russian).

10. Kawulok M., Grzejszczak T., Nalepa J., Knyc M. Database for hand gesture recognition, 2017. Available at: http://sun.aei.polsl.pl/~mkawulok/gestures/ (accessed: 10.12. 2018).

11. Learning-Based Multimedia Lab. Dataset for Skin Detection, 2017. Available at: http://lbmedia.ece.ucsb.edu/resources/dataset/ibtd.zip (accessed 10.12. 2018).

Received 10.12.2018; Revised 10.12.2018; Accepted 19.03.2019. Information about the authors:

Dmitry V. Vorotnev - Software Engineer of the JSC RnD Center ELVEES (Russia, 124498, Moscow, Zelenograd, pass. 4922, 4, bldg. 2), vorotnyov.dmitriy@gmail.com

Roman V. Golovanov - Cand. Sci. (Rhys.-Math.), Lead Engineer of the JSC RnD Center ELVEES (Russia, 124498, Moscow, Zelenograd, pass. 4922, 4, bldg. 2), Assistant Professor of the Higher Mathematics № 1 Department, National Research University of Electronic Technology (Russia, 124498, Moscow, Zelenograd, Shokin sq., 1), golovanovrv@gmail.com

Информация для читателей журнала «Известия высших учебных заведений. Электроника»

Полные тексты статей журнала с 2009 по 2018 гг. доступны на сайтах Научной электронной библиотеки: www.elibrary.ru и журнала «Известия высших учебных заведений. Электроника»: http://ivuz-e.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.