Научная статья на тему 'РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОНТРОЛЯ УПРАВЛЕНИЯ ДОСТУПОМ'

РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОНТРОЛЯ УПРАВЛЕНИЯ ДОСТУПОМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАЗРАБОТКА / ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / УПРАВЛЕНИЕ ДОСТУПОМ / СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / РАСПОЗНАВАНИЕ ЛИЦА / GOOGLENET / FACENET / VGGFACE2

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Головко Ярослав Юрьевич

Статья посвящена разработке интеллектуальной системы контроля управления доступом. Актуальность работы заключается в том, что сотрудники учреждений часто теряют пропуска. Внедрение системы контроля доступа на основе распознавания лица позволило бы сотрудникам не носить пропуска, которые можно легко потерять. Также повысилась бы безопасность учреждений, поскольку если пропуск сотрудника попадет в руки третьему лицу, он спокойно сможет проникнуть внутрь. Целью является разработать интеллектуальную систему контроля управления доступом. Для достижения цели поставлены следующие задачи: исследовать методологию распознавания лица, разработать алгоритм работы системы, реализовать приложение и провести тестирование.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Головко Ярослав Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF AN INTELLIGENT ACCESS CONTROL SYSTEM

The article is devoted to the development of an intelligent access control system. The relevance of the work lies in the fact that employees of institutions often lose passes. The introduction of a face recognition access control system would allow employees not to wear badges that can be easily lost. The security of institutions would also be improved, since if an employee's pass falls into the hands of a third party, he can easily get inside. The goal is to develop an intelligent access control system. To achieve the goal, the following tasks were set: to study the face recognition methodology, develop an algorithm for the system, implement the application and conduct testing.

Текст научной работы на тему «РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОНТРОЛЯ УПРАВЛЕНИЯ ДОСТУПОМ»

Научная статья Original article УДК 004.896

РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОНТРОЛЯ

УПРАВЛЕНИЯ ДОСТУПОМ

DEVELOPMENT OF AN INTELLIGENT ACCESS CONTROL SYSTEM

Головко Ярослав Юрьевич, студент 2 курс, факультет «Математики и информатики», Институт инженерных и цифровых технологий, Россия, г. Белгород

Golovko Iaroslav Iurevich, 2nd year student, Faculty of Mathematics and Computer Science, Institute of Engineering and Digital Technologies, Russia, Belgorod

Аннотация

Статья посвящена разработке интеллектуальной системы контроля управления доступом. Актуальность работы заключается в том, что сотрудники учреждений часто теряют пропуска. Внедрение системы контроля доступа на основе распознавания лица позволило бы сотрудникам не носить пропуска, которые можно легко потерять. Также повысилась бы безопасность учреждений, поскольку если пропуск сотрудника попадет в руки третьему лицу, он спокойно сможет проникнуть внутрь. Целью является разработать интеллектуальную систему контроля управления доступом. Для достижения

гл

Столыпинский вестник

2029

цели поставлены следующие задачи: исследовать методологию распознавания лица, разработать алгоритм работы системы, реализовать приложение и провести тестирование.

S u m m a r y

The article is devoted to the development of an intelligent access control system. The relevance of the work lies in the fact that employees of institutions often lose passes. The introduction of a face recognition access control system would allow employees not to wear badges that can be easily lost. The security of institutions would also be improved, since if an employee's pass falls into the hands of a third party, he can easily get inside. The goal is to develop an intelligent access control system. To achieve the goal, the following tasks were set: to study the face recognition methodology, develop an algorithm for the system, implement the application and conduct testing.

Ключевые слова: разработка, интеллектуальные системы, управление доступом, сверточные нейронные сети, распознавание лица, GoogleNet, FaceNet, VGGFace2.

Keywords: development, intelligent systems, educational organizations, access control, convolutional neural networks, face recognition, GoogleNet, FaceNet, VGGFace2.

Введение

Распознавание лиц стало очень важной темой в последние годы. Распознавание лиц эффективно применяется в различных приложениях, таких как системы безопасности, аутентификация, входной контроль, система наблюдения, разблокировка смартфонов и систем социальных сетей и т. д. Система распознавания лиц должна иметь возможность автоматически идентифицировать лица на изображении или видео. Основной принцип работы системы распознавания лиц можно свести к следующим шагам.

1. Получение изображения.

2030

2. Обнаружение.

3. Предварительная обработка.

4. Извлечение признаков.

5. Классификация.

6. Обучение.

7. Решение. Сверточные нейронные сети

Сверточные нейронные сети (СКЫ) — это класс глубоких нейронных сетей, которые могут распознавать и классифицировать определенные функции изображений и широко используются для анализа визуальных изображений. Их приложения варьируются от распознавания изображений и видео, классификации изображений, анализа медицинских изображений, компьютерного зрения и обработки естественного языка. Слои свертки

Существует три типа слоев, которые составляют CNN: сверточные слои, слои объединения и полносвязные (FC) слои. Когда эти слои сложены, будет сформирована архитектура CNN. В дополнение к этим трем слоям есть еще два важных параметра: слой отсева и функция активации, которые определены ниже.

1. Сверточный слой

Основная задача сверточного слоя — обнаружить локальные соединения объектов из предыдущего слоя и сопоставить их внешний вид с картой объектов. В результате свертки в нейронных сетях изображение разбивается на перцептроны, создавая локальные рецептивные поля и, наконец, сжимая персептроны в карты признаков. В каждом слое есть банк фильтров. Количество фильтров, применяемых за один этап, эквивалентно глубине объема выходных карт объектов. Каждый фильтр обнаруживает определенную функцию в каждом месте на входе.

2. Слой объединения

2031

Основная цель этого слоя — уменьшить размер свернутой карты объектов, чтобы снизить вычислительные затраты. Это выполняется путем уменьшения связей между слоями и независимо работает на каждой карте объектов.

3. Полностью связанный слой

Целью полной полносвязной структуры является настройка весовых параметров для создания стохастического представления правдоподобия каждого класса на основе карт активации, сгенерированных объединение слоев свертки, нелинейности, выпрямления и объединения слоев.

4. Отсев: используется для предотвращения переобучения

5. Функции активации: используются для изучения и аппроксимации любых непрерывных и сложных отношений между переменными сети. GoogLeNet

GoogLeNet разработан на основе идеи о том, что несколько соединений между слоями неэффективны и имеют избыточную информацию из-за корреляции между ними. Соответственно, он использует «начальный модуль», разреженную CNN, с 22 уровнями в параллельном рабочем процессе обработки и использует несколько вспомогательных классификаторов на промежуточных уровнях для улучшения способности различения на нижних уровнях.

Общая архитектура состоит из 22 слоев. Архитектура была разработана с учетом вычислительной эффективности. Архитектура также содержит два вспомогательных слоя классификатора.

Архитектура вспомогательных классификаторов следующие:

— средний объединяющий слой с размером фильтра 5*5 и шагом 3;

— свертка 1 * 1 со 128 фильтрами для уменьшения размерности и активации ReLU;

— полностью подключенный слой с 1025 выходами и активацией ReLU;

— регуляризация отсева с коэффициентом отсева = 0,7;

2032

— классификатор softmax с выводом 1000 классов, аналогичный основному классификатору softmax

Наиболее эффективной моделью, созданной на архитектуре GoogleNet является FaceNet. FaceNet обеспечивает унифицированное встраивание для задач распознавания лиц, проверки и кластеризации. Он отображает каждое изображение лица в евклидово пространство таким образом, что расстояния в этом пространстве соответствуют сходству лиц, т. е. изображение человека А будет помещено ближе ко всем другим изображениям человека А по сравнению с изображениями любого другого человека, присутствующего в пространстве набора данных.

Основным преимуществом является эффективность GoogleNet: можно достичь высокой производительности (рекордная точность 99,63% в LFW, 95,12% в базе данных Youtube Faces), используя всего 128 байт на лицо. FaceNet использует сверточную нейронную сеть (CNN). Сеть обучается таким образом, чтобы квадрат расстояния между вложениями соответствовал сходству лиц. Изображения, используемые для обучения, масштабируются, трансформируются и плотно обрезаются вокруг области лица. Триплетная функция потерь

Еще одним важным аспектом FaceNet является функция потерь. Он использует функцию тройных потерь. Чтобы рассчитать потерю триплета, нам нужно 3 изображения, а именно якорное, положительное и отрицательное. Суть заключается в том, что мы хотим, чтобы наш якорный образ (изображение конкретного человека А) был ближе к положительным изображениям (всем изображениям человека А) по сравнению с отрицательными изображениями (все остальные изображения). Формула триплетной функции представлена ниже.

£ [ll/W) - /(*Г)Н2 - II/W) - /W) 112 + я

i

Формула 1. Триплетная функция потерь

+

2033

Выбор триплета

Выбор правильных пар изображений чрезвычайно важен, так как будет много пар изображений, удовлетворяющих этому условию, и, следовательно, наша модель мало что из них извлечет, а также из-за этого будет медленно сходиться.

Чтобы обеспечить быструю сходимость, крайне важно выбрать триплеты, которые нарушают ограничение триплетов. Формулы выбора треплетов представлены ниже.

2

Л^шах ||/(*?)-/*?||2 (1)

Л^шт №?)-/*? 112 (2) Формула 2. Выбор триплета

Уравнение (1) означает, что при заданном якорном образе человека А мы хотим найти позитивный образ А, такой, чтобы расстояние между этими двумя изображениями было наибольшим.

Уравнение (2) означает, что для данного якорного изображения человека А мы хотим найти негативное изображение, такое, что расстояние между этими двумя изображениями будет наименьшим. Разработка алгоритма процесса распознавания

В процессе распознавания лиц система начинает с ввода живого видео или неподвижных изображений. После получения видео или изображений он считывает кадры с библиотекой ОрепСУ. На кадрах система определяет лица с помощью МТСЫМ После обнаружения лица он создает признаки лица с помощью FaceNet. После создания точек встраивания система классифицирует результат и сопоставляет результат с набором обучающих данных. Если совпадение удовлетворяет пороговому значению, то отображается имя человека и процент совпадения с лицом человека, сохраненным в базе данных. Если результат не удовлетворяет порогу, то это

2034

показывает, что человек неизвестен, и сохраняет лицо вместе со временем для дальнейшего использования. Алгоритм представлен на рисунке 1.

Рисунок 1. Алгоритм процесса распознавания

Разработка и тестирование

Обучение модели производилось с использованием набора данных VGGFace2. Набор данных содержит 3,31 миллиона изображений 9131 субъекта (идентификации), в среднем 362,6 изображения для каждого субъекта. Изображения имеют большие различия в позе, возрасте, освещении, этнической принадлежности и профессии (например, актеры, спортсмены, политики).

Для тестирования были выбраны следующие критерии: условия освещения и положение головы испытуемого. Примеры работы распознавания представлены на рисунке 2. Испытания были проведены с 20 участниками, для каждого критерия было сделано 10 попыток, в результате чего были получены результаты, представленные в таблице 1 и таблице 2.

2035

Рисунок 2. Пример работы распознавания с разным положением головы и освещением

Условия освещения

Средняя точность, %

Дневной свет

99.61

Ночной Неравномерное освещение

свет снизу/сверху/слева/справа

97.89

95.32

Таблица 1. Результаты работы распознавания с разным освещением

Положени Прямое С разворотом С наклоном С разворотом

е головы влево/вправо вверх/вниз влево/вправо и

одновременным наклоном вверх/вниз

Средняя 99.62 96.5 94.45 92.37

точность,

%

Таблица 2. Результаты работы распознавания с разным положением головы Заключение

2036

Таким образом, удалось разработать интеллектуальную систему контроля управления доступом. В рамках выполнения работы поставленная цель была достигнута, а также была исследована методология распознавания лица, исследованы сверточные нейронные сети, проанализирована архитектура GoogleNet, описаны основные механизмы работы FaceNet, разработан алгоритм работы системы, разработана и протестирована интеллектуальная система контроля управления доступом.

Литература

1. LeCun Y., Bengio Y. Convolutional Networks for Images, Speech, and Time-Series // The Handbook of Brain Theory and Neural Networks. MIT Press, 1995. P. 255-258.

2. Федотов Д. В., Попов Е. А., Охорзин В. А. Оптимизация структуры сверточной нейронной сети с помощью самоконфигурируемого эволюционного алгоритма в одной задаче идентификации // Вестник СибГАУ.

3. Гелиг А.Х., Матвеев А.С. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие: моногр., СПб.: Изд. СПбГУ, 2014. -224 c.

4. Олескин А.В. Сетевые структуры в биосистемах и человеческом обществе. - М.: Едиториал УРСС, Либроком, 2015. - 304 c.

5. Таганов А.И. Нейросетевые системы искусственного интеллекта в задачах обработки изображений - М.: Телеком, 2016. - 148 c.

6. Хайкин С. Нейронные сети. Полный курс - М.: Вильямс, 2016. - 973 c.

Literature

1. LeCun Y., Bengio Y. Convolutional Networks for Images, Speech, and Time-Series // The Handbook of Brain Theory and Neural Networks. MIT Press, 1995. P. 255-258.

2037

2. Fedotov D. V., Popov E. A., Okhorzin V. A. Optimisation of convolutional neural network structurewith self-configuring evolutionary algorithm in one identification problem // Vestnik SibGAU. 2015. Vol. 16, no. 4. P. 857-863.

3. Gelig A.H., Matveev A.S. Introduction to the mathematical theory of trainable recognition systems and neural networks. Textbook: Monogr. - St.Peter.: Publishing House of St. Petersburg State University, 2014. - 224 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Oleskin A.V. Network structures in Biosystems and human society. - M: Editorial URSS, Librocom, 2015. - 304 p.

5. Taganov A.I. Neural network systems of artificial intelligence in image processing problems - M: Telecom, 2016. - 148 p.

6. Haykin S. Neural networks. A complete course - M: Williams, 2016. - 973 p.

© Головко Я.Ю., 2022 Научный сетевой журнал «Столыпинский вестник» №4/2022

Для цитирования: Головко Я.Ю. РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КОНТРОЛЯ УПРАВЛЕНИЯ ДОСТУПОМ// Научный сетевой журнал «Столыпинский вестник» №4/2022

2038

i Надоели баннеры? Вы всегда можете отключить рекламу.