Научная статья на тему 'Метод обнаружения лиц с использованием иерархической структуры признаков'

Метод обнаружения лиц с использованием иерархической структуры признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
165
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Волынец М. Ю., Майков К. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод обнаружения лиц с использованием иерархической структуры признаков»

Метод

обнаружения лиц с использованием иерархической структуры признаков

М.Ю. Волынец,

магистр кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Баумана

К.А. Майков,

профессор кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Баумана

Введение

Задача обнаружения лиц характеризуется рядом факторов: высокой вариативностью лиц, обусловленной анатомическими особенностями людей; различным уровнем освещенности объектов, зависящих от типа, количества и характеристик направленности источников света; необходимостью обнаружения лиц, имеющих различное пространственное положение.

Существующие потребности в создании систем, реализующих решение подобных задач, накладывают жесткие ограничения на скорость работы алгоритмов, которые должны работать в режиме, близком к реальному времени.

Для успешного решения задачи по обнаружению лиц обеспечение высокой скорости работы должно также сочетаться с малым (порядка 5%) количеством ложных обнаружений. В системах, реализующих существующие методы обнаружения, при увеличении уровня обнаружений свыше 90% наблюдается экспоненциальный рост числа ложных решений, что затрудняет их практическое использование [1].

Целью данной работы является построение метода обнаружения лиц, обеспечивающего повышение достоверности обнаружения объектов анализа, снижение уровня ложных обнаружений, уменьшение времени обучения классификатора и времени предварительной

139

обработки изображения. Для достижения указанных функциональных особенностей в работе предлагается применить модификацию и комбинирование методов адаптивного усиления (AdaptiveBoosting) [9] и нейронных сетей [8].

Методы обнаружения лиц

Среди большинства известных методов обнаружения лиц (AdaptiveBoosting [9], нейронные сети [8], машины опорных векторов [5], линейный дискриминантный анализ [4]) на изображении могут быть выделены две следующие категории [6]:

1. Методы, основанные на построении некоторого набора правил для обнаружения лица на изображении [8], одним из представителей которых является метод Виолы-Джонса. Данные методы используют инвариантные свойства изображений лиц и включают в себя два основных этапа:

• обнаружение элементов и особенностей, характерных для изображения лица;

• анализ обнаруженных особенностей, формирование решения о количестве и пространственном положении лиц;

2. Методы, в которых изображению (или его фрагменту) ставится в соответствие вычисленный вектор признаков, используемый в последствии для классификации изображений на два класса - лицо/не лицо. Каждый пиксель анализируемого изображения становится компонентом вектора, трансформируя черно-белое изображение в вектор пространства [2]. К таким методам относятся методы опорных векторов [5] и линейный дискриминантный анализ [4].

Выбор категории и метода для обнаружения зависит от ограничений и условий задачи обнаружения лиц. В качестве ограничений, влияющих на выбор метода решения задачи, следует выделить:

• наличие или отсутствие ограничений на возможные искусственные помехи на лице;

• пространственные характеристики положения лиц;

• цветность изображения;

• масштаб лиц и разрешение изображения;

• количество лиц на изображении;

• условия освещенности объектов;

• приоритет в минимизации ложных обнаружений или в количестве обнаруженных лиц.

Для решения задачи обнаружений лиц построим метод, представляющий собой комбинацию базовых компонентов метода адаптивного усиления (AdaptiveBoosting) [2] и метода нейронных сетей [3].

Метод адаптивного усиления

В основе рассматриваемого метода лежит метод Виолы-Джонса, позволяющий обрабатывать изображения с довольно боль-

140

шой скоростью по сравнению с другими методами обнаружения лиц, при этом достигая высокого уровня распознавания [10]. В основу метода положены три основных принципа:

• использование интегрального представления изображения для быстрого вычисления признаков, используемых детектором;

• использование признаков Хаара, с помощью которых происходит поиск нужного объекта (лица и его черт) и последующий бустинг (от англ. boost - улучшение, усиление) для выбора наиболее подходящих признаков искомого объекта на анализируемой части изображения;

• комбинирование классификаторов, полученных на предыдущем этапе, в каскад для быстрого отбрасывания окон, не содержащих изображение лица.

К преимуществам метода адаптивного усиления относится скорость решения задачи обнаружения, что дает возможность использовать его в режиме реального времени.

Однако как показано в [10], алгоритмическая реализация метода адаптивного усиления предъявляет высокие требования к аппаратным и временным ресурсам, а также накладывает жесткие ограничения на пространственное положение лица и его освещенность.

Метод обнаружения с использованием нейронных сетей

В данном методе на вход нейронной сети подается участок изображения, после чего алгоритм выносит решение по наличию или отсутствию лица на входном участке. Процедура применяется для каждого участка изображения. Для обнаружения лица, размер которого больше входного участка, анализируемая область разбивается на несколько подобластей, и обнаружение выполняется для каждой полученной подобласти.

Преимущественной особенностью данного метода является возможность обработки лицевых структур при различном угле наклона относительной вертикальной оси. В то же время алгоритм имеет ряд недостатков: относительно долгое время обнаружения лица не позволяет применять метод в режиме реального времени и ложное обнаружение объектов, отдаленно напоминающих лицо.

Данный метод требует предварительной обработки изображения, заключающийся в приведении анализируемых на изображении лиц к базовым размерам, а также в выравнивании яркости и контрастности на изображениях.

Представим лицо в виде эллипса: оси анализируемого объекта и оси лиц на тестовых изображениях должны отличаться не более чем на 12%, что помогает уменьшить различия в положении, ориентации и

141

масштабе лиц между тестовым изображением и изображениями из обучающего набора [3]. Объекты считаются расположенными на одной прямой, если квадратичное расстояние между парой соответствующих признаку точек минимально. Это может быть достигнуто путем масштабирования и поворота лица на изображении, что может быть описано в виде:

(t > Lx -b tx ' (X)

( SCOS0 -ssin0^| (X ( a

= 1 1 1 + Vty J = 1 Y

Y J Vssin0 scos0J VY j Vb a ty J V1 J

(1)

Для нескольких наборов координат формула (1) принимает следующий вид:

X -Y

Y X

X2 — Y

Y2 X

V •

1 0 ^ 0 1 1 0 0 1

• • J

( а ^ b

Vty J

( X \ Y<

X

Y/

(2)

В результате преобразования по формуле (2) пространственное расположение лица на тестовом изображении трансформируется к виду, наиболее близкому к положению лиц на изображениях из обучающего набора.

В [6] показано, что различия в изображениях с различной яркостью могут быть убраны путем применения ряда методик, в частности, для начального выравнивания яркости на изображении строится функция, принимающая яркостные значения на всем изображении внутри овального окна. Пиксели снаружи окна отображают фон, поэтому их интенсивность не учитывается. Параметры a, b, c этой функции удовлетворяют условию [3]:

( а\

(XY 1)

b

VCJ

= /(X,Y),

(3)

где (x, y) - яркость пикселя (x, y).

Для увеличения контрастности анализируемых областей применяется бинаризация методом Отсу [9], где значения яркостей пикселей изображения можно рассматривать как случайные величины, а их гистограмму - как оценку плотности распределения вероятностей принадлежности объекту либо фону, либо искомому объекту. Если плотности распределения вероятностей известны, то определяется оптимальный порог для сегментации изображения на два класса с0 и с1 (объекты

142

и фон). Порог между классами задается таким образом, чтобы каждый из них был как можно более «плотным», что достигается минимизацией внутриклассовой дисперсии, определяющейся как взвешенная сумма дисперсий двух классов

5w2 = W1 • СТ2 + w2- СТ22 , (4)

где 5w - внутриклассовая дисперсия; ст1 и ст2 - дисперсии, а w1 и w2 -вероятности принадлежности фрагмента анализируемого изображения либо к фону, либо к искомому объекту соответственно.

Комбинированный метод

Преимуществом метода AdaBoost по сравнению с другими методами обнаружения лиц (метод главных компонент, метод опорных векторов) [10] является высокая скорость обнаружения лиц на входном изображении. Это дает возможность использовать данный алгоритм в режиме реального времени. Основным недостатком метода является высокий процент ложных обнаружений.

Нейронные сети показывают лучший результат для изображений, на которых лица расположены под значительным углом, более 20° относительно вертикальной оси, и для изображений, сделанных при искусственном освещении.

Как следует из приведенного выше анализа, для обнаружения лиц целесообразно использовать преимущества каждого из рассмотренных алгоритмов.

Предлагаемый метод обнаружения лиц представляет комбинацию двух компонентов методов: адаптивного усиления и нейронных сетей. Комбинация строится следующим образом: компонент метода адаптивного усиления обеспечивает принятие решения, есть ли на изображении лицо или нет, и отклоняет изображения без лиц. Метод нейронных сетей, получив на вход изображение, обработанное методом адаптивного усиления, выносит окончательное решение - содержится ли лицо на входном изображении. Ниже на рис. 1 представлена схема комбинированного метода. Применение на первом этапе комбинационного метода адаптивного усиления позволяет использовать предложенный метод в режиме реального времени. На втором этапе нейронные сети повторно выполняют проверку на присутствие лица на участке изображения, тем самым позволяя исправить ошибку ложного обнаружения метода адаптивного усиления.

Заключение

С использованием преимущественных особенностей методов адаптивного усиления и нейронных сетей предложен комбинированный метод обнаружения лиц, обладающий повышенной скоростью обработки изображений и более высокой достоверностью обнаружения относительно известных методов.

143

Рис. 1. Функциональная схема комбинированного метода обнаружения лиц

144

Для ускорения обучения каскадной модели в методе адаптивного усиления предложено:

• задавать количество классификаторов, с которых необходимо начинать отсчет при обучении, и количество классификаторов, которые необходимо добавлять для выполнения условия останова;

• в случае добавления нового классификатора, начинать обучение с добавленного классификатора посредством сохранения весов последнего уровня каскадной модели.

• в случае возникновения ошибки при обучении, дальнейшее обучение начинать с этапа, на котором возникла ошибка.

Библиографический список

1. Кудряшов ПП Алгоритм обнаружения лица человека для решения прикладных задач анализа и обработки изображений / П.П. Кудряшов // Издательство физико-математической литературы. -М., 2007. - Т. 2. - С. 132-134.

2. Yang M.H., Kriegman DJ, Ahuja N. Detecting faces in images // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2002. -Vol. 24. - P. 34-58.

3. Gonzales R.C., Woods R.E. Digital Image Processing. - New Jersey: Prentice-Hall, - 2001. - 190 p.

4. Etemad K, Chellapa R. Discriminant Analysis for face recognition of human face images // Journal of the Optical Society of America. - 2006. - P. 1724-1733.

5. MaydtJ, LienhartR. Face Detection with Support Vector Machines and a Very Large Set of Linear Features // IEEE ICME. - 2002.

6. Henry R. Neural Network-Based Face Detection // School of Computer Science. - 2009.

7. Viola P, Jones MJ. Rapid object detection using a boosted cascade of simple features // In conference on computer vision and pattern. -2001.

8. Kotropoulos C, Pitas I Rule-Based Face Detection in Frontal Views // Proc. Int'l Conf. Acoustics, Speech and Signal Processing (ICASSP). - 1997. - Vol. 4. - P. 2537-2540.

9. Otsu N. A Threshold selection method from gray-level histograms // IEEE Transactions on Systems and Cybernetics, - 1979. -Vol. 9. - P. 62-66.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Freund Y, Schapire R.E. A Short Introduction to Boosting // Journal of Japanese Society for Artifical Intelligence. - 1999.

145

i Надоели баннеры? Вы всегда можете отключить рекламу.