Научная статья на тему 'Анализ методов распознавания лиц людей'

Анализ методов распознавания лиц людей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1463
272
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ЛИЦ / АЛГОРИТМ EIGENFACE / АЛГОРИТМ FISHERFACE / АЛГОРИТМ LBP / ВИЗУАЛЬНАЯ ИДЕНТИФИКАЦИЯ / FACE RECOGNITION / ALGORITHMS EIGENFACE / ALGORITHMS FISHERFACE / ALGORITHMS LBP / VISUAL IDENTIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кадров Максим Сергеевич, Туркевич Александр Сергеевич, Князева Алина Алексеевна

Данная статья посвящена трем подходам к распознаванию лиц, реализованным в программном комплексе визуальной идентификации. Описаны соответствующие алгоритмы, приведены графики и фрагменты их программной реализации, проанализированы результаты их использования на основе проведенных исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis methods recognition of human faces

This paper is devoted to three approaches of the face recognition realized in solving a complex program of visual identification. We described the corresponding algorithms. Graphs and fragments of their program realization are provided; the application of the results on the basic of the research is analyzed.

Текст научной работы на тему «Анализ методов распознавания лиц людей»

Анализ методов распознавания лиц людей Analysis methods recognition of human faces

Кадров Максим Сергеевич ,Туркевич Александр Сергеевич,Князева Алина Алексеевна,

Московский Государственный Технический Университета им. Н. Э. Баумана

Kadrov M.S., Turkevich, A.S., Knyazeva A.A.

Аннотация: Данная статья посвящена трем подходам к распознаванию лиц, реализованным в программном комплексе визуальной идентификации.

Описаны соответствующие алгоритмы, приведены графики и фрагменты их программной реализации, проанализированы результаты их использования на основе проведенных исследований.

Summary: This paper is devoted to three approaches of the face recognition realized in solving a complex program of visual identification. We described the corresponding algorithms. Graphs and fragments of their program realization are provided; the application of the results on the basic of the research is analyzed.

Ключевые слова: распознавание лиц, алгоритм Eigenface, алгоритм Fisherface, алгоритм LBP, визуальная идентификация.

Keywords: face recognition; algorithms Eigenface; algorithms Fisherface; algorithms LBP; visual identification.

Система идентификации по визуальным данным предназначена для распознавания лиц в местах массового скопления людей, в зонах контроля, на стратегических объектах [1,2]. Различия в характеристиках алгоритмов позволяют оценивать целесообразность применения их в

различных применениях, а одновременное использование повышает надежность идентификации. В статье рассматривается сами алгоритмы, некоторые аспекты их реализации и интегрирования в систему.

Фрагменты программного кода написаны на языке Python OpenCV. Важной частью этой структуры является распознавание лиц, в котором реализованы три независимых алгоритма распознавания, отличающиеся точностью, скоростью и ресурсоемкостью.

Анализ методов распознавания лиц.

В задачах распознавания лиц используется ограниченное число апробированных алгоритмов. В OpenCV на текущий момент реализованы 3 алгоритма распознавания лиц:

- Алгоритм Eigenface (метод главных компонент в приложении к распознаванию лиц).

- Алгоритм Fisherface (линейный дискриминантный анализ).

- Алгоритм LBP (локальный бинарный шаблон).

Eigenfaces и Fisherfaces находят математическое описание наиболее доминирующих признаков обучающей выборки в целом. LBP анализирует каждое лицо в обучающей выборке отдельно и независимо.

Алгоритм Eigenface.

Работа алгоритма Eigenface основана на методе главных компонент. Предположим, что имеется база данных лиц, где изображения имеют размер N x N пикселей. Каждое изображение из базы данных представляют точкой в пространстве размерностью N * N.

Основная идея алгоритма состоит в том, чтобы найти такой базис меньшей размерности, после проекции в который максимально сохраняется информация по осям с большой дисперсией и теряется информация по осям с маленькой дисперсией. Это нужно для того, чтобы оставить только ту информацию, которая бы характеризовала различия лиц и удалить ненужную информацию, которая не помогает правильно идентифицировать человека [3, 4].

Из формулы линейной алгебры известно, что у матрицы N * N, N > N может быть только N - 1, собственных значений отличных от нуля.

Таким образом, возможно использовать собственное значение разложения S = X T X , размера N * N вместо

Также мы получили исходные собственные векторы S = XT X с левым умножением матрицы данных:

Основными недостатками алгоритма EigenFaces является отсутствие устойчивости к изменению условий освещенности и отсутствие инвариантности к аффинным преобразованиям.

Алгоритм Fisherface.

Алгоритм Fisherface предполагает наличие множества фотографий при разных условиях освещенности у каждой персоны в базе данных. В алгоритме, как и в Eigenface,

Международный журнал прикладных наук и технологий «Integral» №3 2019

предполагается поиск базиса, но такого, который позволил бы максимизировать дисперсию между множествами изображений лиц и одновременно минимизировать дисперсию внутри каждого множества [3, 4].

Матрица W для проецирования пространства изображения на пространство признаков выбирается из следующего условия:

где Sв — матрица межклассовой дисперсии, Sw - матрица внутриклассовой дисперсии:

ЛЯ и. А: и

d W Т I I

За счет множества фотографий каждой персоны алгоритм получается устойчивым к изменениям условий освещенности, но сохраняет недостаток алгоритма Eigenface — отсутствие инвариантности к аффинным преобразованиям.

Алгоритм ЬБР

Этот алгоритм берёт своё начало с анализа 2D текстуры [4, 5]. Суть алгоритма заключается в том, что мы разбиваем изображение на части и в каждой такой части каждый пиксель сравнивается с соседними восьмью пикселями. Если значение центрального пикселя больше соседнего, то пишем 0, в противном случае 1.

Итак для каждого пикселя у нас получается некоторое число. Далее на основе этих чисел для всех частей, на которые мы разбивали фотографию, считается гистограмма. Все гистограммы со всех частей объединяются в один вектор характеризующий изображение в целом. Если мы хотим узнать насколько похожи два лица, нам придется вычислить для каждого из них такой вектор и сравнить их. Рисунок 1 отражает ход алгоритма:

5 3 1 Thresholding 1 1 0

4 4 6 1 1

7 2 3 1 0 0

Binary:11010011 Decimal

Рисунок. 1. Алгоритм ЬВР

Математически алгоритм LBP выглядит так:

LBP{ iv

)=Е

p=Q

2PS(ip h)

где - (xc, yc) центральные пиксели с интенсивностью, inИнтенсивность соседнего пикселя, S — это знак функции, который определяется следующим образом:

Описанный подход позволяет захватывать очень мелкозернистые детали, позже оказалось, что LBPH не мог кодировать детали разного масштаба, из-за этого он был расширен, и теперь число соседей может варьироваться. Идея расширения заключалась в том, чтобы расположить соседей по кругу определенного радиуса, и, таким образом, выделялись признаки окрестностей в соответствии с рисунком 2.

Рисунок 2, Признаки круговой окрестности Формулы для расчета координат соседей:

2 лр

хр=хс, + Я со*

У,=

У +/fsitl(

р J

где xp, yp — координаты соседа; xc, yc — координаты центра; R - радиус окружности; p — номер соседа; P — количество соседей.

Если координаты точек не соответствуют координатам изображения, к ним будет применен метод интерполяции.

Сравнение характеристик алгоритмов.

Применимость алгоритмов распознавания лиц в различных ситуациях может быть оценена исходя из результатов проведенных исследований. Алгоритм LBP является эффективным средством формирования локальных признаков цифрового изображения.

На рисунке (3) и (4) представлены результаты исследования достоверности алгоритмов. В данном случае, достоверность понимается как отношение количества корректных результатов распознавания лица к общему количеству попыток.

Мы использовали всего 480 эталонных фотографий (на каждого индивида 6 фото). Фотографии клиентов формировались с различных расстояний от камеры. Алгоритм LBP отличался среди рассмотренных высшим качеством распознавания, чем другие.

Рисунок 4. Достоверность алгоритмов распознавания лиц с разных

расстояний

Скорость распознавания одного кадра зависит от количества фотографий в базе данных XML файла (рис.5). В данной работе, с помощью Микро-ЭВМ Raspberry Pi2 (Процессор 1.3GHz, Оперативная память 2G, Ядро 4), полученные результаты доказывают, что алгоритм LBP работает быстрее, чем другие алгоритмы.

Рисунок 5. Зависимость времени распознавания от количества

изображений в оазе данных В процессе проведения эксперимента были проанализированы три алгоритма распознавания лиц и их сравнительные характеристики.

Метод главных компонент хорошо зарекомендовал себя в практических приложениях. Однако, в тех случаях, когда на изображении лица присутствуют значительные изменения в освещенности или выражении лица, эффективность метода значительно падает.

Все дело в том, что PCA выбирает подпространство с такой целью, чтобы максимально аппроксимировать входной набор данных, а не выполнить дискриминацию между классами лиц.

Алгоритм Fisherface решает эту проблему, так что в условиях сильного бокового и нижнего затенения изображений лиц Fisherface показал 95% эффективность по сравнению с 53% Eigenface.

В тоже время LBP и его варианты сейчас один из самых часто применяемых для распознавания лиц, так как инвариантен к небольшим изменениям в условиях освещения и небольшим поворотам изображения.

Учитывая вышеизложенное, представляется, что перспективным может являться создание гибридных методов, использующих преимущества и нивелирующих недостатки рассмотренных выше различных частных подходов.

Список использованной литературы

1. P. Viola and M. Jones. "Robust real time face detection", Received September 10, 2001, Revised July 10, 2003, Accepted July 11, 2003.

2. http://docs.opencv.org/2.4/ (дата доступа 01.06.2019).

3. Md. Abdur Rahim, Md. Najmul Hossain, Tanzillah Wahid and Md. Shafiul Azam. "Face recognition using local binary patterns (LBP)", Global journal of computer science and technology graphics & vision, Vol - 13, Issue 4, Version 1.0, 2013.

4. docs.opencv.org/2.4/modules/contrib/doc/facerec/facerec_tutorial.ht ml (дата доступа 01.06.2019).

5. Dr. Sushma Jaiswal, Smt. Sarita Singh Bhadauria, Dr. Rakesh Singh Jadon. "Comparison between face recognition algorithm Eigenfaces, Fisherfaces and elastic bunch graph matching", Journal of global research in computer science, vol 2, No 7, July 2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.