Научная статья на тему 'УСТОЙЧИВОСТЬ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ'

УСТОЙЧИВОСТЬ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
21
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейрон / алгоритм / раздражитель / нейронная сеть / объект / массив / neuron / algorithm / stimulus / neural network / object / array

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д.Ф. Лоботов, Я.А. Соколов, Е.А. Юронен

Алгоритмы машинного обучения, основанные на сверточной нейронной сети, в настоящее время являются одними из самых перспективных в получении результатов при решении задач компьютерного зрения, распознавании объектов и других задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Д.Ф. Лоботов, Я.А. Соколов, Е.А. Юронен

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STABILITY OF CONVENTIONAL NEURAL NETWORK

Machine learning algorithms based on a convolutional neural network are currently one of the most promising in obtaining results in solving computer vision problems, object recognition, and other problems.

Текст научной работы на тему «УСТОЙЧИВОСТЬ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ»

УДК 004.032.26

УСТОЙЧИВОСТЬ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ

Д.Ф. Лоботов *, Я. А. Соколов Научный руководитель - Е.А. Юронен

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31.

*E-mail: dopthanne@gmail.com

Алгоритмы машинного обучения, основанные на сверточной нейронной сети, в настоящее время являются одними из самых перспективных в получении результатов при решении задач компьютерного зрения, распознавании объектов и других задач.

Ключевые слова: нейрон, алгоритм, раздражитель, нейронная сеть, объект, массив.

STABILITY OF CONVENTIONAL NEURAL NETWORK

D.F. Lobotov *, Ya.A. Sokolov Scientific supervisor - E.A. Yuronen

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation

*E-mail: dopthanne@gmail.com

Machine learning algorithms based on a convolutional neural network are currently one of the most promising in obtaining results in solving computer vision problems, object recognition, and other problems.

Key words: neuron, algorithm, stimulus, neural network, object, array.

Введение. Сверточная нейронная сеть применяется при обработке данных, представленных в виде сетки, таких как изображение. Цифровое изображение может быть растровым или векторным, но работать будем только с растровым типом цифрового изображения. Растровое изображение представляется как прямоугольный двумерный массив из чисел, при этом каждое число соответствует одному пикселю и указывает, насколько ярким и какого цвета должен быть пиксель. Цель данной статьи разобраться в вопросе устойчивости сверточной нейронной сети, к изменяемым входным данным, насколько можно изменить входные данные, а также возможно ли изменять данные на уровне физических атрибутов. Первой основополагающей работой, заложившей основной теоретический фундамент для создания искусственных нейронных сетей следует считать модель нейрона Уоррена С. Мак-Каллока и Вальтера Питтса [3].

В приведенном ниже рисунке, представлена разработанная Мак-Каллоком и Питтсом. Имеется n количество входных величин х ..., xn бинарных признаков, описывающих объект х. Значение этих бинарных признаков будем считать, как величины импульсов, поступающих

Актуальные проблемы авиации и космонавтики - 2021. Том 2

на вход нейрона через п количество входных синапсов. Импульсы, попадая в нейрон, складываются с весами ч ..., чп.

Если вес оказывается положительным то соответствующий синапс возбуждающий, если отрицательный то тормозящий. Если суммарный импульс превышает заданный порог активации, то нейрон возбуждается и выдает на выходе 1, в противном случае 0 [4].

Уоррен С. Мак-Каллок и Вальтер Питтс впервые установили, что нейронные сети могут выполнять любые логические операции. С момента их открытия, нейронные сети становились глубже, повысилась результативность. В данный момент, исходя из полученного опыта, лучше всего для работы с видеоматериалом и изображениями лучший вариант - сверточная нейронная сеть.

Мозг человека обрабатывает большое количество информации. В тот момент, как только мы видим изображение. Каждый нейрон работает в своем собственном восприимчивом поле и связан с другими нейронами таким образом, что они покрывают все поле зрения. Подобно тому, как каждый нейрон реагирует на раздражители только в своем ограниченном поле зрения, каждый нейрон в сверточной нейронной сети обрабатывает данные только в своем поле. Слои нейронов расположены таким образом, что сначала они обнаруживают простые объекты, а затем более сложные. Но и сверточные нейронные сети имеют ряд недостатков.

Одной из самых существенных проблем сверточной нейронной сети является трансляционная инвариантность. Инвариантность означает, что объект может быть распознан, даже если внешний вид объекта меняется, то есть сохранение идентичности объекта при изменении специфики визуального ввода, например, положение камеры или объекта [1]. Можно внести практически незаметные для человеческого глаза изменения или возмущения во входные данные, которые полностью изменят вывод сверточной нейронной сети, пример приведен на рис. 1.

Собака, Собака, Собака

Поезд,

Корова,

Человек

Рис. 1. Результаты внесения возмущений входных данных.

Такие, практически незаметные нашему глазу возмущения, меняющие выход нейронной сети называют состязательными примерами, или атаками.

Данный вид проблем имеют не только нейронные сети типа классификационных, но и детектирующие и даже сегментационные сети. Одна из самых весомых причин, почему возможно существование таких состязательных примеров, это недостаточная обобщающая

способность нейронных сетей. По этой причине, границы классификации, строящиеся при обучении нейронной сети, часто проходят на границе, и очень часто возможен выход за границы одного класса и попадание в область другого класса.

Одним из наиболее выгодных решений данного вопроса является техника аугментации [2]. При использовании данной техники, ко входным данным добавляются немного преобразованные данные. За счет использования метода деформации увеличивается качество модель и повышается устойчивость к различным шумам входных данных. Одним из самых существенных преимуществ аугментации является значительное увлечение разнообразия данных, за время обучения нейронная сеть получит для обучения большее количество данных. Но и тут есть нюанс. Необходимо брать во внимание только сложные данные, в которых границу классов легко нарушить и перейти в иной класс. Следует учитывать данные, принимаемые для обучения. Некорректно настроенные преобразованные данные могут исказить обучение и результат обучения нейронной сети, нужно правильно подбирать данные для обучения.

Библиографические ссылки

1. Lee H., Grosse R., Ranganath R., Ng A.Y. Convolutional Deep Belief Networks for

Scalable Unsupervised Learning of Hierarchical Representations. Proceedings of the 26th

Annual International Conference on Machine Learning. 2009.

2. Bengio Y. Learning deep architectures for AI // Foundations and Trends in Machine Learning, 2009.

3. Hinton G.E., Salakhutdinov R.R. Reducing the dimensionality of data with neural networks // Science. 2006.

4. А.В. Смирнов, Е.С. Иванов. Использование механизма сверточных нейронных сетей для поиска объектов на аэрофотоснимках // Программные системы: теория и приложения, том 8, выпуск 4, 85-99, 2017.

© Лоботов Д.Ф., Соколов Я.А., 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.