Научная статья на тему 'АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ РАСПОЗНАВАНИЯ И СОПОСТАВЛЕНИЯ ЛИЦ ДЛЯ СИСТЕМ БИОМЕТРИЧЕСКОГО КОНТРОЛЯ'

АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ РАСПОЗНАВАНИЯ И СОПОСТАВЛЕНИЯ ЛИЦ ДЛЯ СИСТЕМ БИОМЕТРИЧЕСКОГО КОНТРОЛЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
140
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЯ ЛИЦ / АВТОМАТИЧЕСКИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ЛИЦ / БИОМЕТРИЯ / МЕТОД ВИОЛЫ-ДЖОНСА / ГРАФЫ / ФИЛЬТР ГАБОРА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Эмомов М.И.

В статье рассматривается задача из области распознавания объектов - это задача распознавания лиц для идентификации. При написании данной статьи были проанализированы основные методы распознавания лиц. В работе представлен алгоритм слежения в виде блок-схемы, предложена общая идея структуры базы данных и поиска в рамках разрабатываемой системы динамического распознавания лиц для идентификации и аутентификации сотрудников горнодобывающей промышленности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Эмомов М.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ РАСПОЗНАВАНИЯ И СОПОСТАВЛЕНИЯ ЛИЦ ДЛЯ СИСТЕМ БИОМЕТРИЧЕСКОГО КОНТРОЛЯ»

УДК 62

М.И. Эмомов

АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ РАСПОЗНАВАНИЯ И СОПОСТАВЛЕНИЯ ЛИЦ ДЛЯ СИСТЕМ БИОМЕТРИЧЕСКОГО КОНТРОЛЯ

В статье рассматривается задача из области распознавания объектов - это задача распознавания лиц для идентификации. При написании данной статьи были проанализированы основные методы распознавания лиц. В работе представлен алгоритм слежения в виде блок-схемы, предложена общая идея структуры базы данных и поиска в рамках разрабатываемой системы динамического распознавания лиц для идентификации и аутентификации сотрудников горнодобывающей промышленности.

Ключевые слова: распознавания лиц, автоматические системы распознавания лиц, биометрия, метод Виолы-Джонса, графы, фильтр Га-бора.

Распознавание лиц - повседневных задача для человеческого мозга, который справляется с этим, не прилагая особых усилий. Доступность достаточно мощной и недорогостоящей техники породила огромный интерес к автоматизации данного процесса в различных системах: от систем контроля доступа при пересечении международных границ и управлении банковскими транзакциями до криминалистической экспертизы и идентификации преступников при рецидиве и многие другие. Кроме того, подтверждение личности требуется практически каждый день: при входе в офис, при работе с государственными организациями, при оформлении документов.

В настоящее время задача эффективного поиска и идентификации лица человека, не является сложной для компьютерных систем и вполне очевидной для разработчиков специализированного программного обеспечения (ПО). Наиболее значимым для развития искусственного интеллекта в области компьютерного зрения, является работа со слабоконтрастными объектами (с точки зрения восприятия лица человека компьютерной системой, в отличие от естественной идентификации лица человеческим глазом), которые помимо процедур распознавания обеспечивают кодирование/декодирование и хранение цифровых изображений лиц. Такие системы можно рассматривать как в свете классической проблемы восприятия, так и в свете новых подходов к распознаванию объектов. [1]

Общая структура распознавания лиц

При наличии большого количества разнообразных алгоритмов распознавания лиц, можно определить наиболее общую структуру данного процесса [2], которая представлена ниже на рис. 1.

Рис. 1. Общая структура распознавания лиц

© Эмомов М.И., 2019.

Научный руководитель: Зайцева Елена Вячеславовна - кандидат технических наук, доцент, Национально исследовательский технологический университет «МИСиС», Россия.

На первом этапе производится детектирование и локализация лица на изображении (наиболее эффективным является метод Виолы-Джонса).

На этапе распознавания производится выравнивание изображения лица (геометрическое и яркост-ное), вычисление признаков и непосредственно распознавание - сравнение вычисленных признаков с заложенными в базу данных эталонами. Основным отличием всех представленных алгоритмов будет вычисление признаков и сравнение их совокупностей между собой.

Вторым этапом выполняется выравнивание изображения в обнаруженной области (применение фильтров, геометрическое и яркостное преобразование). Вычисление и сопоставление этих признаков варьируется между методами, и при этом все сводится к определенному сравнению всех вычисленных признаков с заложенными в базу данных эталонами.

Метод Виолы-Джонса

В основу этого метода заложены: интегральное представление изображения по признакам Хаара, построение классификатора на основе алгоритма адаптивного бустинга и способ комбинирования классификаторов в каскадную структуру. Данный метод демонстрирует высокую эффективность при решении задачи поиска объектов на изображениях и видеопоследовательностях в режиме реального времени.

Так же метод использует в себе технологию скользящего окна. То есть существует рамка, размером, меньшим, чем исходное изображение, которая двигается с некоторым шагом по изображению, и с помощью каскада слабых классификаторов определяет, есть ли в рассматриваемой области лицо. Метод состоит из двух подалгоритмов: алгоритм обучения и алгоритм распознавания.

Имеет следующие преимущества:

• обнаружение более одного объекта(лица) на изображении;

• использование простых классификаторов показывает хорошую скорость и позволяет использовать этот метод в видеопотоке.

• низкий процент ложных срабатываний;

• простота программной реализации (благодаря штатным средствам библиотеки компьютерного зрения ОрепСУ). [3]

Рис. 2. Обобщенная структура распознавания лица в алгоритме Виолы-Джонса

Перед началом процесса распознавания алгоритм на основе тестовых изображений обучает базу данных, которая состоит из признаков, их паритета и границы. Следующим алгоритм распознавания ищет объекты на разных разрешениях изображения, используя созданную базы данных. На выходе алгоритм Виолы-Джонса дает всё множество найденных необъединенных объектов на разных масштабах. Следующая задача - принять решение, какие из найденных объектов действительно присутствуют в кадре, а какие являются дублями.

Формирование алгоритма слежения при повороте лица

Метод Виолы-Джонса считается быстрым и приемлемым в использовании для потоковых видео, однако он так же имеем свои ограничения. Метод не работает при повороте лица на ~30°. Так как полученные свертки точны, есть возможность подгрузить дополнительные описатели фронтального лица или профильного, что приводит к потере результата, при повороте головы.

Аналогично если не настроить параметры точности данного метода (размер максимального и минимального кадра поиска, количество пересечений найденных областей и т.д.), то быстродействие понижается, но вероятность правильного результата повышается. Однако данное значение также может колебаться, так как качество этого изображения может быть получено из веб-камер (плохое или среднее) или с камер видео наблюдений до HD либо HQ (более высокое качество). При низком разрешении может исказиться лицо за счет шумов или артефактов, это может привести к тому, что даже человек не сможет провести идентификацию по имеющемуся видеоряду. Некоторые группы артефактов также могут образовать подобие лица, что в сою очередь приведет к ложному распознаванию, это в свою очередь приведет к потребности настройки точности аппаратно-программного комплекса, чтобы в будущем избежать подобных ошибок. Все эти особенности усложняют повторное обнаружение лица на следующих кадрах и делают слежение в реальном времени невозможным.

Можно уменьшить область повторного поиска для его ускорения. При частоте 30 кадров в секунду, рассматривая возможность нахождение объекта на предыдущем кадре, можно предположить, что за 33 миллисекунды он сдвинется незначительно и тем самым при повторном поиске искать уже не на всем кадре, а только в увеличенном (x1.5) квадрате предыдущего результата (ROI). Так и при сдвиге или приближении объекта он будет найден в этой области.

Для решения проблемы потери лица при развороте объекта неизвестной стороной, можно применить алгоритм соответствия (Template Matching) [4]. Сохраняя предыдущее изображение и поиск подобного на ROI нового кадра. Особенность данного метода в том, что он всегда возвращает результат. Этот метод имеет также свои недостатки так как со временем окно может сползти в область, где нет лица и продолжать попытки сравнивание с последовательно предыдущим кадром тем самым оставаться на месте потеряв лицо. Поэтому ставятся ограничения по времени использования этого метода. При отказе основного метода распознания, начинает работать шаблонное соответствие, и одновременно с этим запускается таймер. Если таймер будет превышает ограничение (например, 2 секунды), лицо считается потерянным и предыдущие значения будут сброшены. Однако такое ограничение будет неуместным если лицо будет долго оставаться повернутым на некоторый неприемлемый для метода угол.

Таким образом, вышеописанный алгоритм работы программы представлен в виде блок-схемы на

рис. 3.

Общая идея структуры базы данных и поиска

По результатам данной работы планируется разработать систему динамического распознавания лиц и идентификации личности.

1.Для этого с помощью метода Виолы-Джонсона локализировать лицо на изображении.

2.Используя фильтр Габора с набором динамических параметров определить антропологические точки лица. По ним построить граф.

3.Используя различные методы сравнения графов определить или разработать наиболее эффективный.

4.Создать динамическую базу данных с набором описателей лиц, привязанных к личностям.

В базе данных предполагается делать две записи каждого лица: одна — с коэффициентами, рассчитанными на меньшем изображении (хуже качество), вторая — в оригинальном или большем формате (выше качество). Второй записи у некоторых пользователей может и не быть (рис. 5), так как оригинальное изображение не было достаточно велико для его создания (увеличение изображения приводит к размытию и потери качества).

Теоретически такая структура записей (рис. 6) дает возможность ускорить поиск, делая сначала упрощённое сравнение всех записей, а после уточнить уже на полученном множестве.

Рис. 3. Блок-схема работы алгоритма слежения

Рис. 5. Предложенное хранение минимум двух записей для каждого лица

Рис. 6. Предложенная структура записей лица

Так же в базе данных планируется реализация возможности динамического добавления записей, нераспознанных лиц, привязанных к датам их обнаружения.

В рамках данной темы рассматривается возможность разработки и применения фильтров для повышения качества изображения и решения проблем с плохим освещением.

Выводы

Компьютерное зрение - на сегодняшний день стремительно развивающаяся и востребованная отрасль программирования, которая имеет широкий спектр применения. Функцию идентификации людей активно используют в различных ПО так же система находит свое применение в системах безопасности, например при распознавании пассажиров в аэропортах, распознавании сотрудников различных учреждений.

ПО данного проекта до конца не реализована, однако выполнены нахождение лица и распознавание части признаков с помощью всего двух параллельных вейвлет Габора. С увеличением ряда фильтров и калибровки их параметров, возможны нахождение большего числа признаков и устранения шумов.

На данном этапе выполнения проекта главными трудностями является настройка параметров фильтра Габора и разработка алгоритмов построения и сравнения графов.

В будущем планируется использование средств и методов пост-бинарного компьютинга [5, 6] для повышения вычислительной точности.

Библиографический список

1. Коломиец В. Анализ существующих подходов к распознаванию лиц. [Электронный ресурс] / Блог компании Синезис. — Режим доступа: http://habrahabr.ru/company/synesis/blog/238129.

2. Вежневец А.П. Методы классификации с обучением по прецедентам в задаче распознавания объектов на изображениях // Труды конференции Graphicon-2006. - 2006. - С. 166-173.

3. А.Ю. Забашта, С.А. Хохлов, С.А. Скорикова, Журнал "Современная наука: актуальные проблемы теории и практики" [Электронный ресурс]. — Режим доступа: http://www.vipstd.ru/index.php.

4. Fast and robust face detection and tracking: mc-jesus/face_detect_n_track. [Электронный ресурс]. — Режим доступа: https://github.com/mc-jesus/face_detect_n_track.

5. Аноприенко А. Я. Постбинарный компьютинг и интервальные вычисления в контексте кодо-логической эволюции. / А. Я. Аноприенко, С. В. Иваница — Донецк, ДонНТУ, УНИТЕХ, 2011. — 248 с

6. Аноприенко А. Я. Тетралогика, тетравычисления и ноокомпьютинг. Исследования 2010-2012. / А. Я. Аноприенко, С. В. Иваница — Донецк: ДонНТУ, Технопарк ДонНТУ УНИТЕХ, 2012. — 308 с.

13. Зайцева Е.В., Степанова А.Л. Классификация современных методов трекинга объекта в интеллектуальных системах видеонаблюдения. // Горный информационно-аналитический бюллетень. Отдельный выпуск № 5, 2013.

ЭМОМОВ МУНИР ИЛХОМОВИЧ - магистрант, Национально-исследовательский технологический университет «МИСиС», Россия.

i Надоели баннеры? Вы всегда можете отключить рекламу.