ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ

П.А. Яровой; М.Н. Фаворская

УДК 004.9

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В ЗАДАЧЕ РАСПОЗНАВАНИЯ

ИЗОБРАЖЕНИЙ ЛИЦ

П. А. Яровой Научный руководитель - М.Н. Фаворская

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: yarovoi.p.98@gmail.com

Задача распознавания лица является одной из главных проблем в области машинного обучения, в особенности, где требуется отслеживать положение человека, основываясь на информации, полученной с видеокамер. Не менее сложной является задача обнаружения лица на изображении или эскизе. В работе рассматриваются методы решения данной проблемы, а также приводится сравнение точности их работы.

Ключевые слова: интеллектуальные системы, нейронные сети, обнаружение лица, эскиз лица.

INTELLIGENT SYSTEM IN THE PROBLEM OF IMAGE RECOGNITION

P.A. Yarovoi Scientific supervisor - M.N. Favorskaya

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation Е-mail: yarovoi.p.98@gmail.com

The problem of face recognition is one of the main problems in the field of machine learning, especially where it is required to track position based on information received from video cameras. But, no less difficult is the task of detecting a face in an image or sketch. The paper discusses methods for solving this problem, and also compares the accuracy of their work.

Keywords: intelligent systems, neural networks, detection, face image, face sketch.

Задача обнаружения объектов на изображении является одной из главных проблем компьютерного зрения. Данная технология позволяет анализировать информацию на изображениях и видеофайлах, например, читать текст или находить местоположение определенных объектов. Помимо этого, данная задача может найти свое применение в другой области - распознавание лиц на изображениях. Эта задача может применяться в разных случаях, в том числе в развлекательных целях, таких как приложение Snapchat, или в системах биометрической безопасности.

Одной из областей применения обнаружения лица является задача его поиска на изображении или эскизе для дальнейшей обработки, например, для построения по найденному на эскизе лицу его реалистичного изображения. Решение данной задачи позволит интеллектуальной системе обнаруживать человеческое лицо на эскизе, чтобы в последующем преобразовать его в реалистичное изображение [1].

Суть задачи обнаружения объектов заключается в следующем. Интеллектуальной системе необходимо выделить искомые объекты на изображении с помощью ограничивающих рамок,

Секция «Программные средства и информационные технологии»

и далее присвоить метки известных классов для выделенных объектов. Основное отличие от задачи классификации заключается в том, что число возможных объектов, присутствующих на изображении, заранее неизвестно [2].

Первым подходом к решению задачи является метод локальных бинарных шаблонов. Данный алгоритм представляет собой описание окрестности пиксела изображения в двоичном представлении. Результатом работы данного алгоритма является восьмиразрядный бинарный код, который описывает окрестности центрального пикселя. Применяя метод локальных бинарных шаблонов к каждому пикселу изображения, можно построить гистограмму, в которой каждому равномерному коду соответствует отдельный столбец.

Изображения лиц рассматриваются как набор всевозможных локальных особенностей, которые хорошо описываются с помощью локальных бинарных шаблонов. Однако гистограмма, построенная для всего изображения в целом, кодирует лишь наличие тех или иных локальных особенностей, но при этом не содержит никакой информации об их расположении на изображении. Для учета такого рода информации изображение разбивается на подобласти, в каждой из которых вычисляется своя гистограмма. Путем конкатенации этих гистограмм может быть получена общая гистограмма, учитывающая как локальные, так и глобальные особенности изображения [3].

Однако следует отметить, что качество работы системы существенным образом зависит от предобработки входных изображений. Также стоит отметить, что отсутствие этапа фильтрации приводит к снижению вероятностей правильной идентификации и верификации.

Другим из не менее известных подходов к решению данной задачи являются каскады Хаара. Обученный каскад Хаара, принимая на вход изображение, определяет, есть ли на нем искомый объект, то есть выполняет задачу классификации, разделяя входные данные на два класса:

1. Искомый объект присутствует.

2. Искомый объект отсутствует.

Данный метод представляет собой набор масок, то есть прямоугольных областей, примыкающих друг к другу, каждая из которых представляет собой изображение с неким черно-белым узором. Таких масок может быть неограниченное множество, как и сложность разнообразных узоров.

Детектирование происходит следующим образом: маски накладываются на разные части кадра, и с помощью этого наложения программа определяет присутствие лица на изображении (рис. 1). Наложение маски на определенную часть кадра дает числовое значение - результат свертки маски с кадром: программа складывает яркость всех пикселов изображения, попавших при наложении в белую часть маски, а также яркость всех пикселов, попавших в черную часть маски, затем вычисляет разность полученных значений. Результат свертки сравнивается с пороговой величиной [4].

Й

Рисунок 1 - Выделение объектов на изображении по методу Виолы-Джонса

^ I ЖГ^ о«»

Популярность данного подхода обусловлена следующим преимуществом: свертка вычисляется очень быстро и просто, поскольку достаточно выполнить всего три операции для каждого прямоугольного элемента маски.

И последним, наиболее точным подходом для обнаружения лиц является применение глубоких нейронных сетей. Принцип работы которых заключается в следующем:

1. На первом этапе изображение обрабатывается с помощью детектора: алгоритма, определяющего прямоугольный фрагмент с лицом;

2. Далее происходит нормализация данного фрагмента, с целью упрощения обработки нейронной сетью;

3. Нормализованное изображение подается на вход нейронной сети, которая в свою очередь строит уникальный вектор признаков.

В конце, при необходимости, полученный вектор признаков может переноситься в базу данных для дальнейшего сравнения с уже имеющимися там векторами (рис. 2). Это сравнение дает возможность идентифицировать определенного человека [5].

Рисунок 2 - Процесс распознавания лица

Применение глубоких нейронных сетей в задаче обнаружения объектов является эффективным средством для обнаружения объектов как на фото, так и в видеопоследовательности, в том числе и в задаче обнаружения лиц на изображениях или эскизах.

Библиографические ссылки

1. Желтов С.Ю. Обработка и анализ изображений в задачах машинного зрения. Москва: Физматкнига, 2010. 672 с.

2. Гонсалес Р.С. Принципы распознавания образов / Дж. Ту. Москва, 2015. 407 с.

3. Guang D., Shan C., Ardabilian M., Wang Y., Chen L. Local binary patterns and its application to facial image analysis: A survey. TSMC, 2011, pp. 135-160.

4. Mikhailov D.M., Samoylov A.S., Minim P.E., Egorov A.D. Face detection and tracking from image and statistics gathering. SITIS, 2014, pp. 37-42.

5. Chokkadi S., Sannidhan M.S, Sudeepa K.B, Bhandary A. Learnin A Study on various state of the art of the Art Face Recognition System using Deep Techniques. IJATCSE Journal, 2019, vol. 8, pp. 1590-1600.

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — П.А. Яровой, М.Н. Фаворская

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — П.А. Яровой, М.Н. Фаворская

INTELLIGENT SYSTEM IN THE PROBLEM OF IMAGE RECOGNITION

Текст научной работы на тему «ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ»