Научная статья на тему 'ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ИЗОБРАЖЕНИИ'

ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ИЗОБРАЖЕНИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
73
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / БИОМЕТРИЯ / ИДЕНТИФИКАЦИЯ ПО ГЕМЕТРИИ ЛИЦА / NEURAL NETWORK / BIOMETRICS / THE IDENTITY USING FACE GEOMETRY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лаврентьев С.А.

В этой статье рассмотрены существующие современные средства и методы распознавания образов на изображениях. Кроме того была приведена классификация, а также достоинства и недостатки этих подходов. В результате был проведен анализ рассматриваемых методов и предложен путь уменьшения недостатков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OVERVIEW OF EXISTING SOLUTIONS FOR PATTERN RECOGNITION ON THE IMAGE

This article discusses the existing modern tools and methods for image recognition. In addition, the classification was given, as well as the advantages and disadvantages of these approaches. As a result, the analysis of the methods under consideration was carried out and a way to reduce the disadvantages was proposed.

Текст научной работы на тему «ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ИЗОБРАЖЕНИИ»

УДК 004.93

Лаврентьев С.А. студент магистратуры 2 курса факультет ИБ МФ МГТУ им. Н. Э. Баумана Россия, г. Москва

Научный руководитель: Коннова Н.С., кандидат технических наук

доцент

ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ИЗОБРАЖЕНИИ

Аннотация: В этой статье рассмотрены существующие современные средства и методы распознавания образов на изображениях. Кроме того была приведена классификация, а также достоинства и недостатки этих подходов. В результате был проведен анализ рассматриваемых методов и предложен путь уменьшения недостатков.

Ключевые слова: нейронная сеть, биометрия, идентификация по геметрии лица.

Lavrentyev S.A. graduate student 2 course Faculty IB MF MSTU them. N.E. Bauman Russia, Moscow

scientific advisor: Konnova N.S., Candidate of Engineering Sciences

Associate professor

OVERVIEW OF EXISTING SOLUTIONS FOR PATTERN RECOGNITION ON THE IMAGE

Annotation: This article discusses the existing modern tools and methods for image recognition. In addition, the classification was given, as well as the advantages and disadvantages of these approaches. As a result, the analysis of the methods under consideration was carried out and a way to reduce the disadvantages was proposed.

Key words: neural network, biometrics, the identity using face geometry.

Обзор разных подходов распознавания образов

В современном мире технологии оказывают огромное влияние на повседневную жизнь каждого человека. Они делают ее удобней, комфортней и легче. Уже не является чем то новым оплачивать покупки бесконтактным способом с помощью телефона, или заказать практически

любой товар через сеть Интернет и оплатить его. Более того, в метро вводится бесконтактный пропуск, а в Америке запускаются магазины без наличия на выходе терминалов оплаты за покупки. Все это достигается за счет использовании систем биометрической идентификации.

В одних случаях это реализовано с помощью поиска уникальных черт в узорах отпечатка пальца, другие используют геометрию лица. Последний способ в настоящее время является наиболее актуальным виду введения ограничений или сокращение контактов.

Существует множество подходов, позволяющих распознать образы на изображении. Их можно разделить на следующие виды: эмпирические, неадаптивные и адаптивные.

Эмпирические методы являются одним из основных способов распознавания лиц на изображениях. Данные процедуры основываются на попытках алгоритмически объяснить действия человека по распознаванию образа. С их помощью автоматические системы выстраивают алгоритм действий, на основе которого строится формализованное представление лица.

Существует ряд существенных достоинств эмпирических методов распознавания лица на изображении. К ним можно отнести [1]:

• простая реализация, которая не требует больших вычислительных мощностей;

• построение шаблона, который будет проверять полученные образы на совпадение признаков, которыми обладают лица;

• возможна модификация некоторых параметров для более гибкой настройки.

При этом к главным недостаткам эмпирических методов можно отнести:

• высокая вероятность обнаружений ложных образов, не являющихся лицами;

использование ограниченного число параметров для обнаружения образа и характеристических черт на нем.

К неадаптивным методам распознавания образов относятся методы для тестирования, от которых требуется подача только тех изображений, на которых есть лицо.

К данным методам относятся [2]:

1) Метод главных компонент (PCA — Principle Component Analysis);

2) Факторный анализ.

Метод главных компонент [2] применяется для уменьшения пространства признаков, при этом не потеряв информативности тестового набора. Также он может быть использован для поиска лица на изображении или сопоставления нескольких образов, для чего у входного изображения ищутся от 5 до 200 главных компонент. При этом остальные компоненты

будут считаться несущественными или шумом. На изображениях, в которых присутствуют лица, главные компоненты принимают высокие значения, а на изображениях на которых их нет то значения будут близкие к нулю.

Эффективность метода главных компонент возрастает если ее применять к отдельным участкам лица: нос, щеки, глаза.

Факторный анализ (ФА) [3] - это совокупность моделей и методов по выявлению скрытых зависимостей между наблюдаемыми переменными. Целью ФА является получение модели образа лица, с конечным числом параметров и провести оценку схожести тестового изображения с входным.

Главным недостатком неадаптивных методов является то, что подаются на тестирование только изображения, в которых точно есть лица. Поэтому можно использовать адаптивные методы.

Существует ряд адаптивных методов распознавания образов [4]:

• Метод линейного дискриминантного анализа (Л ДА);

• Метод опорных векторов;

• Метод главных компонент (PCA - Principle Component Analysis);

• Алгоритм Виолы - Джонса.

Главной задачей ЛДА [5] является поиск такой проекции в пространство, при котором разница межу разными классами образов максимальна. Это нужно для того, чтобы разграничить классы с изображениями, на которых присутствуют лица и те на которых они отсутствуют, что приведет к упрощению классификации входных изображений и минимизирует ошибку классификации на тестовом наборе.

Метод опорных векторов [6] применяется для минимизации верхней ожидаемой ошибки классификации, для того чтобы потом использовать изображения, ранее не входившие в тестовый набор. При этом данный метод не приводит к увеличению вычислительных затрат, поэтому его можно использовать для линейно неразделимых классов.

Метод машинного обучения (алгоритм Виолы-Джонса) [7], является адаптивным - каждый следующий классификатор строится по объектам, неверно классифицированным классификаторами.

Нейронные сети

Для моделирования нелинейных характеристик электрохимических процессов, происходящих в биологическом нейроне [8], была определена нелинейная передаточная функция, называемая активностью, а также найдена S-образная сигмоидальная функция, дающая наилучшие результаты.

Изменяя значения весовых коэффициентов, можно научить сеть, идентифицировать множество входных векторов, в определенной степени имитируя тем самым биологические процессы обучения. Количество входных элементов искусственной нейронной сети соответствует

элементам вектора признаков конкретной задачи, тогда как количество выходных элементов задается числом классов или состояний процесса, которые необходимо идентифицировать [8].

Выводы

Рассмотренные раннее существующие методы распознавания образов имеют как достоинства, так и ряд существенных недостатков. К последним можно отнести распознавание образов путем математических расчетов, которые применимы только для задач узкой направленности.

Кроме того, некоторые методы, несмотря на простоту реализации, при работе с большим объемом входных данных, имеют низкую производительность и при этом - большой процент ошибок первого и второго рода.

При этом ряд существующих реализаций алгоритмов, как алгоритм Виолы-Джонса, требуют больших вычислительных затрат и большой объем времени для обнаружения образа.

Таким образом, для минимизации недостатков и обеспечения универсальности метода целесообразно использовать алгоритм, построенный на основе нейронных сетей. В этом случае алгоритм будет иметь следующие достоинства:

• высокое качество распознавания образов;

• применимость к широкому спектру задач;

• самообучаемость.

Однако, несмотря на существующие достоинства, нейронные сети:

• конечный результат зависит от качества обучающей выборки;

• требовательность к большим вычислительным ресурсам.

Использованные источники

1. Кокуев Т.Н // Исследование алгоритмов распознавания лиц [Электронный документ] URL: https://www.sibsutis.ru/upload/86f/diplom4_3 .pdf (Дата обращения 15.09.2019).

2. Баранов И.А. // Создание системы поиска участников массовых спортивных мероприятий на фотографиях на основе сравнения изображений лица [Электронный документ] URL: http://library.eltech.ru/file s/vkr/2017/bakalavri/3373/2017ВКР337302БАРАНОВ.pdf (Дата обращения 15.09.2019).

3. Чуйков Р.Ю. и Юдин Д.А. // Обнаружение транспортных средств на изображениях загородных шоссе на основе метода single shot multibox detector [Электронный документ] URL: http://dspace.bsu.edu.ru/bitstream/123 456789/21454/1/Chuikova_Obnarujenie_17.pdf (Дата обращения 15.09.2019).

4. Чуйков Р.Ю. и Юдин Д.А. // Обнаружение транспортных средств на изображениях загородных шоссе на основе метода single shot multibox detector [Электронный документ] URL: http://dspace.bsu.edu.ru/bitstream/123 456789/21454/1/Chuikova_Obnarujenie_17.pdf (Дата обращения 15.09.2019).

5. М.Ю. Никитин, В.С. Конушин , А.С. Конушин // Нейросетевая модель распознавания человека по лицу в видеопоследовательности с оценкой полезности кадров [Электронный документ] URL: http://www.computeroptic s.smr.ru/KO/PDF/KO41-5/410517.pdf (Дата обращения 15.09.2019).

6. Научная электронная библиотека «Киберленинка» // Метод обнаружения лиц на изображении с использованием комбинации метода Виолы-Джонса и алгоритмов определения цвета кожи [Электронный документ] URL: https://cyberleninka.ra/artide/v/metod-obnarazheniya-Hts-na-izobrazhenii-s-ispolzovaniem-kombinatsii-metoda-violy-dzhonsa-i-algoritmov-opredeleniya-tsveta-kozhi (Дата обращения 15.09.2019).

7. Чуйков Р.Ю. и Юдин Д.А. // Обнаружение транспортных средств на изображениях загородных шоссе на основе метода single shot multibox detector [Электронный документ] URL: http://dspace.bsu.edu.ru/bitstream/123 456789/21454/1/Chuikova_Obnarujenie_17.pdf (Дата обращения 15.09.2019).

8. М.Ю. Никитин, В.С. Конушин , А.С. Конушин // Нейросетевая модель распознавания человека по лицу в видеопоследовательности с оценкой полезности кадров [Электронный документ] URL: http://www.computeroptic s.smr.ru/KO/PDF/KO41-5/410517.pdf (Дата обращения 15.09.2019).

i Надоели баннеры? Вы всегда можете отключить рекламу.