Научная статья на тему 'Анализ математических подходов к идентификации лиц'

Анализ математических подходов к идентификации лиц Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
445
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DATABASES / FACE RECOGNITION / PATTERN RECOGNITION / HIDDEN MARKOV MODELS / PRINCIPAL COMPONENT ANALYSIS / NEURAL NETWORKS / БАЗЫ ДАННЫХ / РАСПОЗНАВАНИЕ ЛИЦ / ВЫДЕЛЕНИЕ ОБЪЕКТОВ / СКРЫТЫЕ МАРКОВСКИЕ МОДЕЛИ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / НЕЙРОННАЯ СЕТЬ / НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Земцов А.Н., Зунг Хань Чан

В работе проведено исследование реализованных в разработанной системе распознавания человека по изображению лица алгоритмов по различным критериям. Рассматриваются три основные подхода к распознаванию лиц, приводятся, выявленные при реализации, достоинства и недостатки подходов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Земцов А.Н., Зунг Хань Чан

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of mathematical approaches to the identification of faces

In this work, we carried out a study of algorithms implemented by the system of human identification based on various criteria. Three main approaches to face recognition are considered. The advantages and disadvantages of approaches revealed during implementation are given.

Текст научной работы на тему «Анализ математических подходов к идентификации лиц»

Анализ математических подходов к идентификации лиц

А.Н. Земцов1, Зунг Хань Чан2

1 Волгоградский государственный технический университет 2Национальный экономический университет

Аннотация: В работе проведено исследование реализованных в разработанной системе распознавания человека по изображению лица алгоритмов по различным критериям. Рассматриваются три основные подхода к распознаванию лиц, приводятся, выявленные при реализации, достоинства и недостатки подходов.

Ключевые слова: Базы данных, распознавание лиц, выделение объектов, скрытые марковские модели, метод главных компонент, нейронная сеть, нейросетевые алгоритмы.

Одним из основных направлений исследований в решении задачи распознавания лиц является уменьшение вычислительной сложности на этапе классификации за счет снижения размерности данных. Метод главных компонент [1, 4, 9], дискретное косинусное преобразование [5, 6], линейный дискриминантный анализ [4, 9] являются основными методами снижения размерности данных. Особое внимание при этом уделяется методам классификации, таким как: метрические [3, 4], нейросетевые [4, 7] и на основе скрытых Марковских моделей [2]. Необходимо отметить, что сокращение времени решения задачи классификации, в том числе, может достигаться за счет распараллеливания вычислений [10].

Для анализа влияния разрешения входных изображений на процент распознавания, время создания, а также время обучения моделей, был проведен ряд экспериментов, часть результатов из которых представлены в данной работе. В качестве экспериментов были взяты оптимальные внутренние параметры метода главных компонент, метода на основе скрытых марковских моделей и многослойного персептрона [4]. Эксперименты проводились с использованием базы 40 наборов по 10 изображений размером 92х112 ОЯЬ, изображений размером 512х768 базы БЕЯЕТ [8], а также собственной азиатской базы, которая представляет собой

J

100 наборов изображений по 20 изображений в каждом. Как показано на рис. 1, изображения лиц представлены в различных параметрах освещенности, ракурса, мимики и возраста людей.

Рис. 1. - Вариативность параметров освещенности, ракурса и мимики. Предварительное исследование показало, что процент распознавания резко снижается при уменьшении размера входного изображения менее чем 40х40 пикселей, и слабо возрастает после увеличения размера более чем 256х256 пикселей.

Рис. 2. - Изменение процента распознавания в зависимости от качества

входных изображений на проверочной выборке. Время обучения увеличивается с увеличением размера входного изображения. При увеличении разрешения с 50х50 до 256х256 пикселей время для обучения базиса пространства собственных лиц увеличивается в 5

раз, для двухслойного персептрона - в 2 раза, для скрытой Марковской модели - в 3 раза.

100

40 -

20 40 60 80 100 120 140 160 130

Количество изображений в обучающей выборке ^—Двухслойная нейр онная сеть Псевдодвумерные скрытые марковские модели

Рис. 3. - Зависимость процента распознавания от количества лиц в обучающей выборке.

По результатам исследований можно сделать вывод о том, что разрешение изображения прямо пропорционально времени обучения и распознавания для любого метода. Другими словами, увеличение разрешения изображения приводит к увеличению времени, и наоборот, снижение разрешения входного изображения приводит к ускорению работы системы, но уменьшению процента распознавания.

Для анализа влияния количества лиц в обучающей выборке на процент распознавания, время создания и обучения моделей, были проведены эксперименты, результаты которых представлены на рис. 3-4. Эксперименты проводились для двух методов [2, 7], т. к. реализованный метод главных компонент не предполагает изменения количества лиц в наборе для 20 изображений лиц каждого человека, не принадлежащих обучающему набору.

По результатам анализа можно сделать вывод, что при количестве обучающих примеров, лежащем в интервале [25,45], большую эффективность показал метод на основе скрытых Марковских моделей, а более стабильная работа обоих алгоритмов наблюдается в интервале [65^95], на котором оба метода достигают высокого процента распознавания.

25 —

О

20 40 60 50 100 120 140 160 180

Количество изображений в обучающей выборке

^—Двухслойная нейр онная сеть Псевдодвумерные скрытые марковские модели

Рис. 4. - Зависимость времени обучения от количества обучающих лиц

изображений.

Дальнейшее увеличение количества обучающих лиц формирует прямую зависимость процента распознавания и возрастания времени обучения.

По результатам исследований можно сделать вывод о том, что увеличение количества элементов в обучающей выборке приводит к увеличению времени обучения. Наименьшее время обучения показала двухслойная нейронная сеть, что показывает трудоемкость вычислений в методе распознавания на основе скрытых Марковских моделей.

Оптимальное количество обучающих лиц лежит в интервале [65,95] в зависимости от общего количества человек в базе изображений и поставленной задачи.

Метод главных компонент показал приемлемые результаты на нормированной базе изображений - 86.8%. При изменении различных параметров съемки, происходит заметное снижение процента распознавания, что обуславливает необходимость применения подсистемы предварительной обработки изображений: геометрическая обработка особенностей лица, нормализация интенсивности, удаление шума, повышение резкости и др. Также метод главных компонент показал наименьшее значение времени распознавания и обучения - около 5 секунд, что обусловлено обучением на одном лице каждого человека, это делает метод главных компонент перспективным для решения задачи поиска в больших базах данных, содержащих собственные векторы и значения ковариационной матрицы.

Двухслойная нейронная сеть показала наиболее высокий процент распознавания в условиях вариативности освещенности - 73.6%. По сравнению с методом на основе скрытых Марковских моделей, двухслойная нейронная сеть уступает малозначительно, а также характеризуется меньшим временем обучения и распознавания. Этот факт делает актуальным применение многослойных нейронных сетей для решения задачи контроля доступа на крупные предприятия, где с одной стороны необходимы незначительные показатели ошибок FRR и FAR, а с другой стороны необходимо небольшое время выполнения вычислений для режимов обучения и классификации.

Скрытые Марковские модели показали устойчивость и надежность в условиях существенного изменения ракурса, мимики лица, распознавания затемненных малоинформативных изображений с сохранением высокого процента распознавания - 87.4%, 96% и 88.2% соответственно. Однако, также было выявлено, что данный метод имеет самые большие показатели времени обучения базы скрытых марковских моделей, и как следствие,

требует высокой производительности вычислительной системы, что

сказывается на поиске в больших базах данных.

Литература

1. Kirby M. Application of the KL procedure for the characterization of human faces // IEEE Trans. on Pattern Analysis, 1990. Vol. 12. pp. 103-108.

2. Othman H., Aboulnasr T. A separable low complexity 2d hmm with application to face recognition // IEEE Trans. on Pattern Analysis, 2003. Vol. 25. pp. 12291238.

3. Седов В. А., Седова Н.А. Методы оценки качества полученных решений // Южно-сибирский научный вестник, 2012. № 1. С. 88-91.

4. Земцов А.Н. Алгоритмы распознавания лиц и их применение в системах биометрического контроля доступа. LAP Academic Publishing, 2011. 128 c.

5. Земцов А.Н. Сравнительный анализ эффективности методов сжатия изображений на основе дискретного косинусного преобразования // Прикладная информатика, 2011. № 5. С. 77-84.

6. Земцов А.Н. Сравнительный анализ эффективности методов сжатия изображений на основе дискретного косинусного преобразования // Прикладная информатика, 2011. № 4. С. 90-104.

7. Пучков Е.В. Сравнительный анализ алгоритмов обучения искусственной нейронной сети // Инженерный вестник Дона, 2013, №4. URL: ivdon.ru/ru/magazine/archive/n4y2013/2135.

8. Phillips P.J. The FERET evaluation methodology for face recognition algorithms // IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000. Vol. 22. pp. 1090-1104.

9. Mokeev A.V., Mokeev V.V. Pattern recognition by means of linear discriminant analysis and the principal components analysis // Pattern recognition and image analysis, 2015. Vol. 25. pp. 685-691.

10.Серов С.С., Андреев А.Е., Кравченя П.Д., Гущин Р.И., Чеботарев П.П. Сокращение времени оценки схожести текстовых документов на неоднородной многопроцессорной вычислительной системе // Инженерный вестник Дона, 2015, №2(2). URL: ivdon.ru/ru/magazine/archive/n2p2y2015/3031.

References

1. Kirby M. IEEE Transactions on Pattern Analysis, 1990. Vol. 12. pp. 103-108.

2. Othman H., Aboulnasr T. IEEE Transactions on Pattern Analysis, 2003. Vol. 25. pp. 1229-1238.

3. Sedov V.A., Sedova N.A. South-Siberian Scientific Bulletin, 2014. № 4. pp. 456-463.

4. Zemtsov A.N. Algoritmy raspoznavanija lic i ih primenenie v sistemah biometricheskogo kontrolja dostupa. LAP Academic Publishing, 2011. 128 p.

5. Zemtsov A.N. Prikladnaja informatika. 2011. № 5. pp. 77-84.

6. Zemtsov A.N. Prikladnaja informatika. 2011. № 4. pp. 90-104.

7. Puchkov Е^. Inzenernyj vestnik Dona (RUS), 2013, №4. URL: ivdon.ru/ru/magazine/archive/n4y2013/2135.

8. Rodríguez-García M.A. Knowledge-Based Systems, 2014. Vol.56. pp.15-25.

9. Mokeev A.V., Mokeev V.V. Pattern recognition and image analysis, 2015. Vol. 25. pp. 685-691.

10.Serov S.S., Andreev A.E., Kravchenja P.D., Gushhin R.I., Chebotarev P.P. Inzenernyj vestnik Dona (RUS), 2015, №2(2). URL: ivdon.ru/ru/magazine/archive/n2p2y2015/3031.

i Надоели баннеры? Вы всегда можете отключить рекламу.