ШЕСТОЙ ТЕХНОЛОГИЧЕСКИЙ УКЛАД: МЕХАНИЗМЫ И ПЕРСПЕКТИВЫ РАЗБИТИЯ
13-14 ноября 2015 г.
УДК004.855
СПОСОБ ИДЕНТИФИКАЦИИ ОБРАЗОВ
В. М. Татьянкин
Введение. В настоящее время направление "распознавание образов", приобрело огромную популярность среди исследователей. Это связанно с тем, что решение задач в рассматриваемой области, находит всё большое прикладное применение в повседневной деятельности человека. В качестве примера можно привести распознавание: штрих кодов, автомобильных номеров, лиц, речи, болезней. Постоянное развитие теоритического, математического аппарата, так же является немало важным фактором в популярности "распознавания образов". Среди основных подходов для решения задач распознавания образов стоит выделить: классификации с помощью решающих функций и функцией расстояния; различные алгоритмы кластеризации; машины опорных векторов; нейронные сети и различные статистические методы [3].
Нейронные сети глубокого доверия. Особый интерес представляют искусственные нейронные сети, в частности нейронные сети глубокого доверия. По мнению исследователей Массачусетского технологического института, нейронные сети глубокого доверия (deepbe-liefneuralnetworks), входят в список 10 наиболее прорывных высоких технологий, способных в ближайшее время значительно изменить повседневную жизнь человечества [2]. Данное мнение, подтверждается и множественными практическими исследованиями в области распознавания образов, где в качестве тестовой выборки выступают открытые базы различных изображений.
Однаизсамыхпопулярных, являетсябазарукописныхсимволов MNIST (Mixed National Institute of Standards and Technology) [1]. База состоит из 60000 изображений рукописных цифр для обучения и 10000 для тестирования. Размер изображения составляет 28 на 28 пикселей. Пример изображений представлен на рисунке 1.
Рисунок 1. Пример рукописных цифр базы MNIST.
Одним из самых лучших результатов, полученный при распознавание цифр для представленной базы, относится к нейронным сетям глубокого доверия, где ошибка идентификации тестовой выборки составила 0.3%. Полученный результат, позволяет говорить о том, что нейронной сети глубокого доверия являются эффективным инструментом для обнаружения сложных закономерностей в исследуемых данных. Что подтверждается, использование нейронных сетей глубокого доверия в повседневной жизни [5]. Однако есть сферы деятельности человека, где требуется 100% точность идентификации, например в банковском секторе.
Решать эту проблему можно несколькими направлениями: разработка новых способов обучения нейронных сетей; увеличение "объёма" нейронной сети, то есть наращивание слоёв и количество обрабатываемых нейронов; предварительная обработка обучающих данных; разработка новых способов формирования архитектуры нейронной сети.
В. М. Татьянкин
Рассмотрим классический подход к формированию архитектуры нейронной сети, на примере распознавания рукописных цифр MNIST: формируется входной слой размером в 784 (28*28) нейрона, то есть за каждый пиксель изображения отвечает один нейрон; формируются обрабатывающие слои, в зависимости от объёма обучающей выборки и от мощности электронной вычислительной машины; формируется выходной слой размером в 10 нейронов, то есть каждому нейрону соответствует одна цифра.
Далее в статье будет приведен новый подход к формированию архитектуры нейронной сети.
Способ идентификации образов. Представленный далее способ, будет базироваться на следующих личных рассуждениях. Человек при идентификации сложных, неизвестных образов руководствуется методом от противного, то есть, он начинает перебирать все известные ему образы и производит сравнение. Спроецируем данный подход и на обучение нейронных сетей глубокого доверия. В качестве примера так же, рассмотрим базу рукописных цифр MNIST. Идея будет заключаться в том, что нейронная сеть будет обучаться распознаванию только двух цифр. Тогда понадобится 9 нейронных сетей для идентификации одной цифры (одна цифра будет сравниваться с каждой). А так как цифр 10, то всего понадобится 90 нейронных сетей для полноценного распознавания чисел.
Реализуем рассмотренную идею в виде численного эксперимента. Выберем из рукописной базы цифр MNIST все нули и единички, в нашем случае их получилось около 1000 нулей и 300 единиц. Так как их количество разное, то дополним повторяющимися изображениями единицы, чтоб тоже было около 1000. Сформируем обучающую выборку так, чтобы было чередование цифр. Входной слой оставим без изменения 784 нейрона, обрабатывающие слои выберем следующего размера: 1000-500-300-100. Выходной слой соответственно будет равняться двум нейронам. Далее произведём обучение нейронной сети глубокого доверия в два этапа [2]:
1. Предобучение нейронной сети автоэкодерным методом обучения, начиная с первого слоя, данный этап обучения осуществляется без учителя.
2. Настройка синаптических связей всей сети при помощи модифицированного алгоритма обратного распространения ошибки [4].
После этого повторим выше предложенную процедуру для нуля и двойки, нуля и тройки и так далее. В итоге у нас есть укрупненная группа нейронных сетей для идентификации нуля. Аналогично сделаем и для других цифр.
Теперь можем проверить получившуюся нейронную сеть, с целью точности распознавания, на всей обучающей выборки. В нашем случае, получаем одну неверно идентифицированную цифру.
Заключение. В ходе численной апробации, предложенного способа идентификации образов, на примере базы рукописных изображений, была получена близко к нулевому значению ошибка распознавания в ходе обработки обучающей выборки. Проведённое исследование, создаёт предпосылки для создания автоматических систем интеллектуальной обработки данных, где требуется 100 % точность идентификации образов.
ЛИТЕРАТУРА
1. База изображений рукописных цифр ММБТ. Режим доступа: http://yann.lecun.com/exdb/mnist/ (дата обращения 1.10.2015).
2. Головко В.А. Применение нейронных сетей глубокого доверия для выделения семантически значимых признаков. Режим доступа:
http:/Лibeldoc.bsшr.by/Ыtstream/123456789/4Ш/Шрименение%20нейронньIх0/o20сете й.PDF. (дата обращения 1.10.2015).
3. Лепский А. Е. Броневич А. Г. Математические методы распознавания образов. Курс лекций. Таганрог 2009 год. Режим доступа:
http://lepskiy.ucoz.com/lect_Lepskiy_Bronevich_pass.pdf (дата обращения 1.10.2015).
Способ идентификации образов
4. Татьянкин В. М. Модифицированный алгоритм обратного распространения ошибки [Текст] / В. М. Татьянкин // Приоритетные направления развития науки и образования : материалы III междунар. науч.-практ. конф. (Чебоксары, 04 дек. 2014 г.) / редкол.: О. Н. Широков [и др.]. - Чебоксары: ЦНС «Интерактив плюс», 2014. Режим доступа: http://interactive-plus.ru/e-articles/collection-20141204/collection-20141204-5263.pdf (дата обращения 1.10.2015).
5. Третье поколение нейросетей: "Глубокие нейросети". Режим доступа: https://www.mql5.com/ru/articles/1103 (дата обращения 1.10.2015).