Научная статья на тему 'Анализ существующих решений в области распознавания образов (на примере капсульных сетей)'

Анализ существующих решений в области распознавания образов (на примере капсульных сетей) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
760
93
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / МЕТОДЫ РАСПОЗНАВАНИЯ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / КАПСУЛЬНЫЕ СЕТИ / PATTERN RECOGNITION / RECOGNITION METHODS / ARTIFICIAL NEURAL NETWORKS / CAPSULE NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Головинов Андрей Олегович

Проведен сравнительный анализ существующих методов распознавания образов, выделены их основные преимущества и недостатки, а также рассмотрен альтернативный метод распознавания с использованием капсульных сетей, основанный на действии нейронных сетей, но имеющий свои особенности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF THE EXISTING SOLUTIONS IN THE FIELD OF PATTERN RECOGNITION (ON THE EXAMPLE OF CAPSULE NETWORKS)

The article provides a comparative analysis of the existing methods of pattern recognition. Their main advantages and disadvantages are highlighted. It considers an alternative method of recognition using capsule networks based on the action of neural networks, but having its own peculiarities.

Текст научной работы на тему «Анализ существующих решений в области распознавания образов (на примере капсульных сетей)»

УДК 004.032.26

АНАЛИЗ СУЩЕСТВУЮЩИХ

РЕШЕНИЙ В ОБЛАСТИ РАСПОЗНАВАНИЯ ОБРАЗОВ (НА ПРИМЕРЕ КАПСУЛЬНЫХ СЕТЕЙ) Головинов А. О.

Донской государственный технический университет, Ростов-на-Дону, Российская Федерация

nerobycrazy@yandex.ru

Проведен сравнительный анализ

существующих методов распознавания образов, выделены их основные преимущества и недостатки, а также рассмотрен альтернативный метод распознавания с использованием капсульных сетей,

основанный на действии нейронных сетей, но имеющий свои особенности. Ключевые слова: распознавание образов, методы распознавания, искусственные нейронные сети, капсульные сети.

UDC 004.032.26

ANALYSIS OF THE EXISTING SOLUTIONS IN THE FIELD OF PATTERN RECOGNITION (ON THE EXAMPLE OF CAPSULE NETWORKS) Golovinov A. O.

Don State Technical University, Rostov-on-Don,

Russian Federation

nerobycrazy@yandex.ru

The article provides a comparative analysis of the existing methods of pattern recognition. Their main advantages and disadvantages are highlighted. It considers an alternative method of recognition using capsule networks based on the action of neural networks, but having its own peculiarities.

Keywords: pattern recognition, recognition methods, artificial neural networks, capsule networks.

Введение. Различные технологии повсеместно внедряются в современную жизнь человека. Каждый день открывается что-то новое: новые устройства, новая техника, изобретения, которые помогают в разрешении тех или иных проблем. Количество научных направлений растёт, так как появляются новые алгоритмы, методы и средства для решения задач. Распознавание образов — одно из таких направлений, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности данного объекта к одному из заранее выделенных классов объектов. Существуют различные способы для реализации таких систем на практике. В данной работе анализируется каждое из них, проводится сравнительный анализ, а также приводится альтернатива имеющимся способам распознавания, а именно использование капсульных сетей.

Методы распознавания. В целом можно выделить три метода распознавания образов, каждый из которых обладает как достоинствами, так и недостатками [1].

Метод перебора. Суть данного метода достаточно проста — существует определенная база данных, где для каждого объекта распознавания представлены все возможные варианты его отображения. Например, для распознавания футбольного мяча на фотографии посредством метода перебора можно рассматривать базу данных, где содержится большое множество мячей под различными углами, с разным масштабом, с искажением и деформацией. Плюсом данного метода можно назвать его простоту — алгоритм просто производит сравнение полученного объекта со всеми объектами, находящимися в базе данных, и выдает результат на основе этих данных. Очевидным минусом является то, что данная система может распознать только те объекты, которые содержатся в базе данных, и точность алгоритма будет зависеть от того, насколько данная база полна.

Второй метод оценивает характеристики полученного образа посредством глубокого анализа — для того же футбольного мяча такими характеристиками могут служит различные геометрические составляющие: форма, округлость, наличие углов и т.д. Данный метод может

i \QQ/ *

использоваться в узких направлениях, где необходимо различать объекты по их характеристикам, как графическим, так, например, и звуковым (частотный, амплитудный анализ звука и т.д.), но для более сложных задач используются более точные методы анализа.

Искусственные нейронные сети. Применение искусственных нейронных сетей для распознавания образов является одним из наиболее популярных методов в силу своей эффективности и производительности [2]. Он основан на обучении — на входе в нейронную сеть подается пример для распознавания, который преобразуется в сигнал, проходящий по сети, и в результате на выходе получают ответ. Если данный ответ содержит большую долю ошибки, то происходит корректировка весовых коэффициентов внутри сети, и процесс начинается сначала и идет до тех пор, пока ошибка сети не будет минимальной. Сложность использования сетей состоит лишь в правильном построении её внутренней структуры, которая будет эффективна для решения данной задачи. Достоинством этого метода, как уже было упомянуто ранее, является его производительность и эффективность на фоне других. Одним из главных недостатков нейронной сети является возможная потеря пространственных отношений между функциями — работа сети устроена так, что сначала начинается поиск краев, затем различных примитивов, а после фактических объектов. Пример, объясняющий этот недостаток, прост — если системе необходимо распознать на фотографии лицо человека, но при этом саму фотографию повернуть на 180 градусов, сеть этого сделать не сможет, и результат распознавания будет совершенно иным. Решение данной проблемы было найдено ученым Джеффри Хинтоном, которого называют «отцом глубокого обучения». В октябре 2017 года он предложил концепцию так называемых капсульных сетей (Capsule Networks) [3].

Капсульные сети. Капсула представляет собой набор из вложенных нейронных слоев. При проектировании обычной нейронной сети по мере необходимости добавляются новые слои, а в капсульных сетях новый, дополнительный слой добавляется внутрь другого слоя. Иными словами, внутри одного слоя существует гнездо из других слоев. Обработки сигнала в капсулах происходят следующим образом: нейроны внутри капсулы захватывают свойства одного объекта внутри изображения. Капсула выводит вектор для представления существования объекта, при этом ориентация вектора представляет его свойства. Вектор отправляется всем возможным родителям в нейронной сети, и затем рассчитывается вектор прогноза на основе умножения собственного веса и весовой матрицы. Связь капсулы, у которой родитель имеет наибольший скалярный вектор предсказания, увеличивается. Остальные родители уменьшают свою связь [4].

С помощью капсульных сетей можно избавится от той проблемы пространственных связей, которая присуща текущим искусственным нейронным сетям, но на данный момент эта технология до конца не изучена и требует доработки прежде чем использоваться повсеместно.

Заключение. Технология распознавания образов активно внедряется в современные устройства — разблокировка смартфонов посредством анализа лица через фронтальную камеру, распознавание объектов на дороге для автомобилей с автопилотом (например, текущая разработка компании Яндекс — беспилотное такси). Эффективность и производительность существующих решений достигается за счёт использования искусственных нейронных сетей, которые обучаются на примерах для решения конкретной задачи, но и они не идеальны, отсутствие пространственного восприятия объектов делает нейронные сети в некоторых случаях бесполезными [5]. Решение данной проблемы — капсульные сети, слои которых состоят из групп нейронов, позволяющих учитывать расположение объектов относительно друг друга, как бы это делал человек. На данный момент нельзя говорить о полноценной замене нейронных сетей капсульными для распознавания образов, но работа в данном направлении активно ведется [6].

i \QQ/ *

Библиографический список

1. Чичварин, Н. В. Распознавание образов / Н. В. Чичварин [Электронный ресурс] / Национальная библиотека им. Н. Э. Баумана. — Режим доступа: кйр8://ги.Ьт81;и.,шк1/Распознавание_образов (дата обращения: 15.03.18).

2. Сердюков, В. И. Использование элементов искусственного интеллекта для повышения надежности технических изделий / В. И. Сердюков, Н. А. Сердюкова, С. И. Шишкина // Вестник машиностроения. — 2017. — № 10. — С. 29-32.

3. Исследователи представили альтернативу традиционным нейронным сетям [Электронный ресурс] / Tproger. — Режим доступа: https://tproger.ru/news/capsule-neural-network/ (дата обращения: 01.02.18).

4. Vorhies W. - What Comes After Deep Learning / Data Science Central - the online resource for big data practitioners - Режим доступа: https://www.datasciencecentral.com/profiles/blogs/what-comes-after-deep-learning (дата обращения: 21.03.18).

5. Сердюков, В. И. Повышение безотказной работы изделий с использованием элементов искусственного интеллекта / В. И. Сердюков, Н. А. Сердюкова, С. И. Шишкина // Вестник Московского государственного технического университета им. Н.Э. Баумана. Серия: машиностроение. — 2017. — №1 (112). — С.62-72.

6. Artificial Intelligence Trends To Watch In 2018 / Cbinsights.com - Режим доступа: https://www.cbinsights.com/research/report/artificial-intelligence-trends-2018/ (дата обращения: 20.03.18).

i Надоели баннеры? Вы всегда можете отключить рекламу.