Научная статья на тему 'РАСПОЗНАВАНИЕ ЛИЦ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ: СОВРЕМЕННЫЕ ТЕХНОЛОГИИ'

РАСПОЗНАВАНИЕ ЛИЦ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ: СОВРЕМЕННЫЕ ТЕХНОЛОГИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
700
95
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА / НЕЙРОННЫЕ СЕТИ / РАСПОЗНАВАНИЕ ЛИЦ / КОМПЬЮТЕРНОЕ ЗРЕНИЕ / ВИДЕОНАБЛЮДЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Безгачев Ф.В.

В статье показана актуальность повсеместного использования технологии компьютерного зрения на примере распознавания лиц с использованием нейронных сетей. Системы идентификации личности нашли широкое применение во всем мире, и в частности в России, поэтому существуют множество методов для выделения лиц на исходном изображении, но все же наиболее перспективным является применение алгоритмов на основе нейронных сетей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Безгачев Ф.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FACE RECOGNITION BASED ON NEURAL NETWORKS: MODERN TECHNOLOGIES

The article shows the relevance of the widespread use of computer vision technology on the example of face recognition, using neural networks, personality identification systems are widely used throughout the world and in Russia, therefore there are many methods for selecting faces in the original image, but still the most promising is the use algorithms based on neural networks.

Текст научной работы на тему «РАСПОЗНАВАНИЕ ЛИЦ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ: СОВРЕМЕННЫЕ ТЕХНОЛОГИИ»

УДК 004

РАСПОЗНАВАНИЕ ЛИЦ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ: СОВРЕМЕННЫЕ ТЕХНОЛОГИИ

FACE RECOGNITION BASED ON NEURAL NETWORKS: MODERN TECHNOLOGIES

Безгачев Федор Владимирович,

старший преподаватель кафедры информационно-правовых дисциплин и специальной техники Сибирского юридического института МВД России (г. Красноярск)

fedos82-82@mail.ru

Ключевые слова:

интеллектуальная система, нейронные сети, распознавание лиц, компьютерное зрение, видеонаблюдение.

В статье показана актуальность повсеместного использования технологии компьютерного зрения на примере распознавания лиц с использованием нейронных сетей. Системы идентификации личности нашли широкое применение во всем мире, и в частности в России, поэтому существуют множество методов для выделения лиц на исходном изображении, но все же наиболее перспективным является применение алгоритмов на основе нейронных сетей.

Keywords:

intelligent system, neural networks, face recognition, computer vision, video surveillance.

The article shows the relevance of the widespread use of computer vision technology on the example of face recognition, using neural networks, personality identification systems are widely used throughout the world and in Russia, therefore there are many methods for selecting faces in the original image, but still the most promising is the use algorithms based on neural networks.

В настоящее время все большую популярность получает применение нейронных сетей в различных сферах [3], например при мониторинге местности для обнаружения подозрительных лиц.

Искусственные интеллектуальные системы, благодаря богатым возможностям и эффективности использования, получили в мире заслуженную популярность. Интеллектуальные системы являются уникальным инструментом для решения задач в области анализа и обработки большого объема данных, решения задач разного уровня сложности. Широкое практическое применение они находят в экономике, бизнесе, робототехнике, медицине, математике, авионике, биофизике, системах безопасности и в охранных системах и т.д. [3; 4]. Большой интерес вызывает возможность распознавания лиц.

В системах искусственного интеллекта активно используются искусственные нейронные сети, состоящие из искусственных нейронов, каждый из которых представляет собой упрощенную модель биологического нейрона [1; 2]. Нейронная сеть - это математическая модель, а также ее программное и аппаратное воплощение, построенная по принципу организации и функционирования сетей нервных клеток живого организма.

Задача распознавания лиц актуальна как в области интеллектуальных сред, так и в системах безопасности. Решение данной задачи имеет большое практическое применение. Подсистемы идентификации личности с использованием технологии распознавания лиц могут быть использованы в автоматизированных системах безопасности, например на государственных пунктах пропуска, в крупных аэропортах, различных общественных местах, с целью идентификации разыскиваемых лиц, для идентификации личности в следственной практике и т.д. [5].

Рассмотрим два метода, работающих не с помощью нейронных сетей: метод гибкого сравнения на графах и метод главных компонент.

Из самого названия первого метода уже понятно, что основной сутью его работы является сопоставление двух графов. Каждый из этих графов является описанием лица, то есть хранит информацию о нем в своих ребрах и вершинах. Первый из этих графов является образцом, так называемый «эталонный» граф. Он не меняется. Второй же, напротив, изменчивый, способный подстраиваться под образец. В этих вариациях графы могут являть собой как обычные прямоугольные сетки, так и более сложные, построенные по форме лица.

Рис. 1. Прямоугольная сетка

Рис. 2. Сетка по форме лица

Деформация графа происходит по следующему алгоритму. Каждая из вершин графа смещается из своего первоначального местоположения. При этом она перемещается на такую позицию, чтобы в двух соответствующих вершинах каждого из графов разница признаков в вершинах была как можно меньше. Как только все вершины сместятся на максимально возможную дистанцию, при которой будет достигнуто минимальное различие между признаками графов, деформация считается законченной [8].

Рис. 3. Изменение сетки графа

Несмотря на то что данный метод является очень точным (точность распознавания - 95-97%), он применяется редко из-за высокой вычислительной сложности и долгого времени работы при большом количестве лиц.

В качестве второго метода распознавания лиц, работающего не с помощью нейронных сетей, выбран метод главных компонент.

Для правильной работы с данным методом создается матрица, куда добавляются все лица баз данных - по одному лицу на каждую строчку. После этого все данные в матрице нормируются, и высчитывается матрица ковариа-ции по приведенным к нулевому среднему и единичной дисперсии строкам. Применительно к получившейся матрице решается задача собственных значений, после чего формируются группы векторов с присвоенными им собственными лицами.

Рис. 4. Собственные вектора и лица

Данный метод часто применяется на практике, в приложениях. Однако при плохом освещении или недостаточной точности изображения результативность метода сильно падает.

Сейчас существует достаточно большое количество разновидностей нейронных сетей, пригодных для реализации систем обнаружения и распознавания лиц [9].

В этой статье проанализируем две популярных в каждом из направлений нейронных сети для распознавания лиц: MTCNN и FaceNet.

Нейронная сеть обнаружения лиц MTCNN (Multi Task Convolutional Neural Network). Эта сеть является составной, поскольку является каскадом из трех сверточных нейронных сетей. Каждая из них имеет собственное название -P-net, R-net и O-net и, соответственно, отвечает за собственное действие [6].

Перед тем, как мы будем описывать работу каждой из подсетей, необходимо уточнить, что данная сеть распознает лица при помощи так называемых пяти «якорей» - пяти точек-ориентиров на лице.

Рис. 5. Пять точек-«якорей»

Эти точки обозначают глаза, нос и рот. По этим точкам строится граф, характеризующий отдельно взятое лицо по расстояниям между указанными точками. В общем, это имеет некое сходство с методом гибком сравнения графов, однако далее в ход вступают нейронные сети.

Первая из трех сетей - Р-пе1. Она генерирует несколько так называемых кадров-кандидатов. Другими словами, с помощью этой сети находятся области с предполагаемыми лицами и «отрезаются» от остального изображения. Именно в этой сети задаются пять точек лица, и записываются все вектора.

Следующим шагом является И-пе^ Смысл ее работы максимально противоположен предыдущей сети - теперь необходимо выбрать все, что точно не может быть лицами на изображении. Эти области также отсекаются от основного изображения.

Третья же сеть - 0-пе1 - выбирает из выданных ей первой итерации кандидатов наиболее достоверных. Поскольку глубина нейронной сети уже достаточно глубока, то лица распознаются с высокой точностью.

Почему же используются сразу три сети, если все равно главный результат выдает только одна? Ответ достаточно прост: все дело в оптимизации процесса. Ведь если изначально будет использована только 0-пе1, то производитель-

ность будет очень низкой, ведь там будет произведен очень большой набор работ. Поэтому первые две итерации необходимы для того, чтобы сделать изначальную фильтрацию областей на изображении, и уже после это передавать эту информацию для выделения областей лиц. Это позволяет сократить время работы основного процесса [9].

Нейронная сеть распознавания FaceNet, так же как и предыдущая сеть, является компонентной. Однако FaceNet состоит всего из двух подсетей. Эти две сети абсолютно одинаковые, поэтому такая система называется сиамской. Такие сети обучаются дифференцированию, то есть в данном случае сеть учится понимать, какие изображения похожи, а какие нет.

FaceNet использует особую функцию потерь, называемую TripletLoss. Она минимизирует дистанцию между якорем и изображениями, которые содержат похожую внешность, и максимизирует дистанцию между разными.

Рис. 6. Функция TripletLoss

Технологии обнаружения и распознавания лиц идут «рука об руку», поскольку существование одной из них почти не имеет смысла без наличия другой. Даже две рассмотренные нами сегодня сети на самом деле являются двумя составными частями одной сети Google FaceNet и работают, обрабатывая общую информацию.

Рис. 7. Принцип работы общей сети

Каждая модель имеет собственные достоинства и недостатки, но вместе эти две сети образуют самую популярную систему обнаружения и распознавания лиц с наиболее высокой точностью работы. Это показывает важность правильного и оптимизированного решения по организации работы нейронных сетей. Кроме того, при использовании нейронной сети обнаружения лиц МТСКК на должном уровне обеспечивается безопасность информации, хранящейся в базе данных, так как хранятся не изображения (не фото), а графы изображений лиц. А для расшифровки графов потребуется специализированное или даже уникальное программное обеспечение.

Данные технологии можно практически реализовать в автоматизированной системе распознавания лиц, находящихся в розыске. Для этого из базы данных фотографий лиц, находящихся в розыске, необходимо сформировать базу графов этих лиц. С использованием полученных графов разыскиваемых лиц автоматизированная система может быстро и качественно осуществлять идентификацию людей в непрерывном потоке, что повысит эффективность поиска лиц, находящихся в розыске.

Библиографический список

1. Minu, M.S. Face recognition system based on haar cascade classifier / M.S. Minu, K. Arun, A. Tiwari, P. Rampuria // International Journal of Advanced Science and Technology. - 2020. - T. 29. - № 5. - C. 3799-3805.

2. Raveendra, К. Performance evaluation of face recognition system by concatenation of spatial and transformation domain features / K. Raveendra, J. Ravi // International Journal of Computer Network and Information Security. -2021. - T. 13. - № 1. - C. 47-60.

3. Shamova, U. Face recognition in healthcare: general overview / U. Shamo-va // Languages in professional communication : сборник материалов международной научно-практической конференции преподавателей, аспирантов и студентов ; отв. ред. Л.И. Корнеева. - 2020. - С. 748-752.

4. Власенко, А.В. Обзор инструментов машинного обучения и их применения в области кибербезопасности / А.В. Власенко, П.И. Дзьобан, Р.В. Жук // Прикаспийский журнал: управление и высокие технологии. -2020. - № 1. - С. 144-155.

5. Ворожейкин, М.Р. Общие сведения о системе распознавания лиц / М.Р. Ворожейкин, С В. Чернова // Актуальные вопросы науки. - 2019. - № 47. -С. 35-37.

6. Демин, К.С. Методы распознавания движений человека с применением технологий нейронных сетей / К.С. Демин, А.Н. Марьенков // Математические методы в технике и технологиях ММТТ. - 2020. - Т. 8. - С. 135-138.

7. Марьенков, А.Н. Система выявления агрессивного поведения людей на основе анализа видеоматериалов с применением рекуррентной сверточной нейронной сети / А.Н. Марьенков, Е.О. Кузнецова, А.А. Приходько // Проблемы проектирования, применения и безопасности информационных систем в условиях цифровой экономики : материалы XIX Международной научно-практической конференции. - Ростов : Ростовский государственный экономический университет, 2019. - С. 207-210.

8. Рудинская, Е.А. Разработка алгоритма детектирования лиц с использованием комбинаций каскадов Хаара / Е.А. Рудинская, Р.А. Парингер // Сборник трудов ИТНТ-2019. - 2019. - С. 6-12.

9. Сиротин, Д.В. Перспективы внедрения мобильной идентификации СКУД в корпоративные IT-системы // Алгоритм безопасности. - 2019. - № 2. - С. 38-39.

i Надоели баннеры? Вы всегда можете отключить рекламу.