Научная статья на тему 'Метод распознавания лиц, учитывающий специфические анатомические особенности объектов анализа'

Метод распознавания лиц, учитывающий специфические анатомические особенности объектов анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
452
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Волынец М.Ю., Майков К.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод распознавания лиц, учитывающий специфические анатомические особенности объектов анализа»

Метод

распознавания лиц,

учитывающий

специфические

анатомические

особенности

объектов

анализа

М.Ю. Волынец,

магистр кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Баумана

К.А. Майков,

профессор кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Баумана

Введение

Задача распознавания лиц характеризуется рядом факторов, а именно: высокой вариативностью лиц, обусловленной анатомическими особенностями людей; различным уровнем освещенности объектов, зависящих от типа, количества и характеристик направленности источников света; необходимостью обнаружения лиц, имеющих различное пространственное положение.

Существующие потребности в создании систем, реализующих решение подобных задач, накладывают жесткие ограничения на скорость работы алгоритмов, которые должны работать в режиме, близком к реальному времени.

Для успешного решения задачи по распознаванию лиц обеспечение высокой скорости работы должно также сочетаться с малым (порядка 5%) количеством ложных распознаваний.

Целью данной работы является построение метода распознавания лиц, обеспечивающего повышение достоверности распознавания объектов анализа, снижение уровня ложных распознаваний, уменьшение времени обучения классификатора и времени предварительной

146

обработки изображения. Для достижения указанных функциональных особенностей в работе предлагается применить модификацию и комбинирование метода, основанного на методе «подпространство LDA» [8] и методе вейвлет-преобразований Габора [7].

Распознавание лиц

Выделим три базовых группы методов к распознаванию лиц [6].

• Группа методов, в основе которой лежит целостный поход. Методы этой группы обрабатывают всю поверхность лица как последовательность строк без учета индивидуальных анатомических признаков. Метод главных компонент (PCA) [3] и линейный дискриминантный анализ (LDA) [4] являются примерами целостного похода по распознаванию лиц.

• Группа методов, в основе которой лежит подход, основанный на анатомических признаках. Эти методы рассматривают анатомические признаки и выполняют сравнение этих признаков. Примерами таких методов являются: метод распознавания, основанный на вейвлет-преобразованиях Габора [7], метод эластичных связанных графов (EBGM) [5].

• Группа методов, в основе которых лежит гибридный подход, представляющий объединение целостного подхода и подхода, основанного на признаках.

Выбор категории и метода для распознавания зависит от ограничений и условий задачи распознавания лиц. В качестве ограничений, влияющих на выбор метода решения задачи, следует выделить:

• наличие или отсутствие ограничений на возможные искусственные помехи на лице;

• пространственные характеристики положения лиц;

• цветность изображения;

• масштаб лиц и разрешение изображения;

• количество лиц на изображении;

• условия освещенности объектов;

• приоритет в минимизации ложных распознаваний или в количестве распознанных лиц.

Для решения задачи распознавания лиц построим метод, представляющий собой комбинацию базовых компонентов метода подпространства линейного дискриминантного анализа [8] и метода, основанного на вейвлет-преобразованиях Габора [7].

Метод «подпространство LDA»

Метод «подпространство LDA» является гибридным методом, объединяющим два независимых метода PCA [3] и LDA [4].

147

В методе PCA, предложенном Пентландом и Тарком, изображение рассматривается как точка в пространстве изображений путем преобразования изображения в вектор. Метод определяет пространство низшей размерности для представления лиц на изображениях с помощью устранения противоречий с изображениями, на которых отсутствуют лица. Признаки изображений из обучающей выборки получаются путем поиска максимального отклонения каждого изображения от значений, полученных от усредненных изображений.

Пространство собственных лиц получается с помощью применения метода главных компонент к обучающим изображениям, а обучающие изображения проектируются на пространство собственных лиц. Далее тестовое изображение проектируется на новое пространство и вычисляется расстояние между спроецированным тестовым изображением и изображениями из обучающего набора, которые используются для классификации тестового изображения. Принимается, что тестовое изображение, расстояние проекции которого является минимальным, содержит лицо из обучающей выборки.

Метод LDA, в противоположность методу PCA, группирует как можно ближе изображения с одним и тем же лицом и одновременно отдаляет друг друга изображения с разными лицами.

Подпространство LDA - гибридный метод, одновременно использующий оба метода PCA и LDA: LDA используется как основной классификатор, принимающий решение о присутствии лица на изображении, PCA - как этап для уменьшения размерности. Таким образом, изначально создаются собственные вектора в подпространстве PCA c помощью обучающих изображений. Полученные векторы подаются на вход алгоритма LDA, который создает новое векторное подпространство. При классификации тестовое лицо сначала проектируется на подпространство PCA, затем на полученное при обучении подпространство LDA. После чего выбирается единообразная метрика, которая используется для сравнения расстояния между индивидуальными проекциями векторов и происходит классификация тестового лица.

Диаграмма метода «подпространство LDA» представлена на

рис. 1.

Метод преобразования Габора

Рассмотрим второй компонент комбинации - метод, предложенный Брюсом Кепенекси и использующий вейвлеты Габора для обнаружения лицевых признаков на изображении [7]. Данный метод более устойчив к изменениям в освещении, поскольку не использует напрямую значения оттенков серого каждого пикселя, а извлекает характеристические признаки лица.

148

Рис. 1. Диаграмма метода подпространства LDA для распознавания лиц

Вейвлет Габора (фильтр Габора) - линейный фильтр, им-

пульсная переходная характеристика которого представляется в виде произведения функции Гаусса на гармоническую функцию [7].

gx,y) = w(x,yWx,y). (1)

Здесь составная синусоида s(x,y) = е/(2 *(ux+vy)+P), (2)

где u, v- пространственные частоты.

В полярных координатах:

/ = VU^+V2, (3)

где u=F0cosw, v=/sinw; w — полярный угол; P— сдвиг фаз.

Функция Габора w(x,y) = Ke“*(a2xr+b2yr), (4)

где K — константа масштабирования; (a, b) — константы масштабирования вдоль осей координат; 0 — определяет ориентацию нормали параллельных полос функции Габора;

xr = xcos 0 + ysin 0; (5)

yr = —xsin 0 + ycos 0. (6)

Вейвлеты Габора используются для обнаружения анатомических признаков лица на изображениях оттенка серого [7]. Для недопущения потери признаков лица, из-за различий в освещении между тестовым изображением и изображениями из обучающего набора формула приобретает вид [8]

gx,y) = Ke~™2(x2 +y2)

e’(2n/0(xcosw+ysinw)) — (

2 ЛЛ

а

2

(7)

Метод включает в себя два этапа обработки: извлечение признаков и их сопоставление с обучающим набором. Извлечение призна-

149

ков отвечает за автоматическую идентификацию признаков лица (нос, рот, уши и т. п.) и генерирует вектор признаков для каждой точки признака. Полученные пики вейвлета Габора являются точками признака. Поэтому метод позволяет идентифицировать различные структурные особенности лиц. Сопоставление признаков включает в себя сравнение векторов признаков тестового изображения с векторами признаков изображения из обучающей выборки.

Рис. 2. Диаграмма, показывающая процедуру сопоставления признака

Сравнительный анализ выбранных методов-прототипов

Как показано в [8] достоверность распознавания метода «подпространство LDA», который является методом целостного подхода, не зависит от разрешения тестового изображения. Метод способен распознавать лица до тех пор, пока на изображении содержится общая структура лица, что позволяет использовать его для распознавания лиц в видеопотоках и в режиме реального времени с приемлемым уровнем точности.

Производительность распознавания метода Кепенекси, в основе которого лежит подход, основанный на признаках, зависит от разрешения обучающих (пробных) изображений с лицами [7]: высокое разрешение изображений позволяет обнаруживать различные признаки лица (борода, шрам, родинка) и использовать их во время процесса сравнения. Большое количество выявленных признаков гарантирует высокую точность в процессе распознавания. Однако зависимость от качества изображения и сравнение большого количества признаков пробного изображения с признаками всех обучающих изображений делает его не применимым для использования в режиме реального времени.

Производительность метода LDA уменьшается при значительном различии в освещении на обучающем и пробном изображениях и при повороте распознаваемого лица. Для метода, предложенного Кепенекси [7], производительность зависит от выбора параметров комбинации размера окна и от частоты синусоиды (w), что осложняет задачу подбора оптимальных значений параметров для наилучших характеристик производительности.

150

Для метода Кепенекси время переобучения невелико [7], так как учитывается время вычисления признаков новых изображений и дополнение новыми данными обучающей базы. Для подпространства LDA процесс переобучения довольно сложен и требует временных затрат -нуждается в повторном вычислении подпространства LDA при добавлении новых изображений.

Таким образом, предложен метод распознавания лиц, представляющий комбинацию двух методов — подпространство LDA и метода, основанного на вейвлет-преобразованиях Габора (алгоритм Кепенекси). Комбинация строится следующим образом: алгоритм Кепенекси обрабатывает только те пробные изображения, расстояние которых, подсчитанное алгоритмом подпространства LDA, для каждого класса лиц приблизительно равно. В этом случае разрешение входных изображений должно быть среднего качества — не менее 64x64 пикселей. Структура метода представлена на рис. 3. Применение на первом этапе

Рис. 3. Функциональная схема комбинированного метода распознавания лиц

151

комбинационного метода подпространства LDA позволяет использовать предложенный метод в режиме реального времени. На втором этапе метод Кепенекси выполняет сравнение обнаруженного лица с лицами из обучающего набора на наличие сходства.

Заключение

Предложен комбинированный метод, включающий в себя две компоненты - метод вейвлет-преобразований Габора и подпространство LDA, что позволяет повысить качество распознавания лиц, сохранив скорость распознавания, которой будет достаточно для работы метода в режиме реального времени.

Подпространство LDA показывает лучшую производительность для изображений низкого качества (разрешения), однако производительность заметно ухудшается для изображений, содержащих отклонение в освещении и при повороте распознаваемых лиц. Метод Кепенекси, напротив, устойчив к изменению освещения, но результаты распознаванию приемлемы только при высоком разрешении входного изображения.

Библиографический список

1. Кудряшов П.П. Алгоритм обнаружения лица человека для решения прикладных задач анализа и обработки изображений / П.П. Кудряшов// Издательство физико-математической литературы. -М., 2007. - Т. 2. - С. 132-134.

2. EtemandK, Chellapa R. Discriminant analysis for recognition of human faces image // Journal of optical society of America A. - 2005. -P. 1724-1733.

3. Zhao W, Chellapa R,, Krlshnaswamy A, Swets D, WengJ. Discriminant analysis of principle components for face recognition // 2nd International Conference on Automatic Face and Gesture Recognition. - April 1998. - P. 336-341.

4. Belhumeur P, Hespanha J, Kriegman D. Eigenfaces vs fisherfaces: Recognition using class specific linear projection // IEEE Transactions on pattern analysis and machine intelligence. - 2007. - Vol. 19. -No. 7.

5. Wiskott L, Fellous J.M, Kruger N, Malsburg C. Face Recognition by Elastic Bunch Graph Matching // I9 Transactions on Pattern Analysis and Machine Intelligence. - 1997. - Vol. 19. - P. 775-779.

6. Turk M, Pentland A. Face recognition using eigenfaces // In Journal of Cognitive Neuroscience. - 2001. - Vol. 3. - P. 7286.

7. KepenekciB. Face recognition using gabour wavelet transform // Thesis, the Middle East Technical University. - September 2001.

8. Zhao W, Chellapa R, Philips P.J. Subspace linear discriminant analysis for face recognition // Technical Report CAR-TR-914. - 1999.

152

i Надоели баннеры? Вы всегда можете отключить рекламу.