Научная статья на тему 'Методика системы распознавания образов с помощью самоорганизующихся карт Кохонена нейронных сетей на основе Matlab'

Методика системы распознавания образов с помощью самоорганизующихся карт Кохонена нейронных сетей на основе Matlab Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2621
374
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / НЕЙРОННЫЕ СЕТИ / САМООРГАНИЗУЮЩИЕСЯ КАРТЫ / ОБУЧЕНИЕ ОБРАЗОВ / ПРЕОБРАЗОВАНИЕ / ОБРАБОТКА ИЗОБРАЖЕНИЙ / PATTERN RECOGNITION / NEURAL NETWORKS / SELF-ORGANIZING MAPS / TRAINING IMAGE / CONVERSION / IMAGE PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тант Зин Пьо, Тин Чжо, Пья Сон Ко Ко., Пайе Тэйн Наинга

В статье рассматриваются методики распознавания разнообразных образов на изображении с помощью нейронных сетей (самоорганизующиеся карты Кохонена), которые используют для проектирования многомерных данных, аппроксимации плотности и кластеризации. Параметры сети включают в себя размерность массива нейронов, число нейронов в каждом измерении, форму окрестности, закон сжатия окрестности и скорость обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тант Зин Пьо, Тин Чжо, Пья Сон Ко Ко., Пайе Тэйн Наинга

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods of image recognition system using self-organizing maps Kohonen neural networks on base of Matlab

The article discusses techniques for recognizing variety of images using by neural networks (Kohonen self-organizing maps), which are used for the design of multi-dimensional data density approximation and clustering. Network settings include the dimension of an array of neurons, the number of neurons in each dimension, shape neighborhood, the neighborhood of the law of compression and speed of learning.

Текст научной работы на тему «Методика системы распознавания образов с помощью самоорганизующихся карт Кохонена нейронных сетей на основе Matlab»

Тант Зин Пьо

Национальный исследовательский университет “МИЭТ” Аспирант кафедры “Вычислительная техника”

Thant Zin Phyo

National Research University of Electronic Technology Postgraduate student of department of “Computer Engineering”

E-Mail: thantzin.miet@gmail.com

Тин Чжо

Национальный исследовательский университет “МИЭТ” Аспирант кафедры “Вычислительная техника”

Htin Kyaw

National Research University of Electronic Technology Postgraduate student of department of " Computer Engineering "

E-Mail: thantzin.miet@gmail.com

Пья Сон Ко Ко

Санкт-Петербургский Государственный Морской Технический Университет Аспирант кафедры вычислительной техники и информационных технологий

Pyae Sone Ko Ko St.Petersburg State Marine Technical University Postgraduate student of department of computer engineering and information technology

E-Mail: thantzin.miet@gmail.com

Пайе Тэйн Наинга

Национальный исследовательский университет “МИЭТ” Аспирант кафедры “Система автоматического управления и контроля”

Pyae Thein Naing

National Research University of Electronic Technology Postgraduate student of department of the automatic control and monitoring

E-Mail: thantzin.miet@gmail.com

05.13.01 - Системный анализ, управление и обработка информации

Методика системы распознавания образов с помощью самоорганизующихся карт Кохонена нейронных сетей на основе Matlab

Methods of image recognition system using self-organizing maps Kohonen neural

networks on base of Matlab

Аннотация: В статье рассматриваются методики распознавания разнообразных образов на изображении с помощью нейронных сетей (самоорганизующиеся карты Кохонена), которые используют для проектирования многомерных данных, аппроксимации плотности и кластеризации. Параметры сети включают в себя размерность массива нейронов, число нейронов в каждом измерении, форму окрестности, закон сжатия окрестности и скорость обучения.

Abstract: The article discusses techniques for recognizing variety of images using by neural networks (Kohonen self-organizing maps), which are used for the design of multi-dimensional data density approximation and clustering. Network settings include the dimension of an array of neurons, the number of neurons in each dimension, shape neighborhood, the neighborhood of the law of compression and speed of learning.

Ключевые слова: Распознавание образов; нейронные сети; самоорганизующиеся карты; обучение образов; преобразование; обработка изображений.

Keywords: Pattern recognition; neural networks; self-organizing maps; training image; conversion; image processing.

Введение

Самоорганизующиеся карты (Self Organizing Maps - SOM) представляют собой нейронные сети, обучаемые без учителя. Они используются для классификации и распознавания образов, которые могут быть использованы на многих этапах обработки изображений [1- 3]. Алгоритм SOM был реализован в программе MATLAB с различными дополнительными параметрами, позволяющими настройку модели в соответствии с требованиями пользователя. Для более легкого применения SOM был разработан графический интерфейс пользователя (GUI).

На рис. 1 предлагается блок-схема системы распознавания образов. На первом этапе, вычисляется 2D-DCT (двумерное дискретное косинусное преобразование) для каждого изображения, и из коэффициентов DCT (дискретное косинусное преобразование) образуются векторы признаков. На втором этапе, SOM (самоорганизующаяся карта) используется методом «Обучение без учителя» для классификации векторов на группы, чтобы распознавать объект, который во входном изображении присутствует или нет в базе данных изображений. Если объект классифицируется как присутствующий, то изображение наилучшего совпадения, найденного в базе данных обучения, отображается как результат, иначе результат показывает, что объект не найден в базе данных изображений [4,5].

Изображение I---N

SOM г

2D-DCT 1 > нейронных 1 > результат

сетей У

Рис. 1. Предложенный метод для системы распознавания образов

Дискретное косинусное преобразование

DCT представляет изображение в виде суммы синусоид с различной амплитудой и частотой. Функция dct2 в приложении инструментария обработки изображений реализует 2D-DCT изображений. Одна из особенностей дискретного преобразования Фурье состоит в том, что некоторые локальные участки изображения можно охарактеризовать небольшим количеством коэффициентов дискретного преобразования Фурье. Это свойство очень часто используется при разработке методов сжатия изображений. Например, DCT является основой международного стандарта, который используется в алгоритме сжатия изображений с потерями JPEG. Название формата “JPEG” состоит из первых букв названия рабочей группы, которая принимала участие в разработке этого стандарта (Joint Photographic Experts Group).

DCT обладает тем свойством, что для типичного изображения большинство визуально значимая информация об изображении сосредоточена в нескольких коэффициентах. Извлеченные коэффициенты DCT могут быть использованы как тип подписи, которая является полезной для задач распознавания, таких как распознавание образов и лиц [4, 5].

2D-DCT матрицы А с размерами М X N определяется согласно следующему выражению

где 0 < р < М — 1 и 0 < q < N — 1;

Значения называют коэффициентами DCT матрицы А. DCT - обратимое преобразование, и 2D-IDCT (двумерное обратное дискретное косинусное преобразование) определяется следующим образом:

Предлагаемый метод использует матрицу преобразования DCT в МАТЬАВ окне инструментария обработки изображений. Этот метод является эффективным для небольших квадратных входов, таких как блоки изображения с размером 8 х 8 пикселей. М X М матрица преобразования Т определяется по формуле:

Предварительная обработка изображений

Входные изображения предварительно обрабатываются в MATLAB. Процесс изготовления изображения показан на рис. 2. Предварительная обработка изображений включает в себя следующие этапы:

М-1N-1

п(2т + 1)р

II*

т=0п=0

р=0 q=0

где 0 < т < М — 1 и 0 < п < N — 1;

Значения <хр и <Хц в (1) и (2) имеют вид:

1

(3)

1

р = 0,0 < ц < М — 1

(4)

уровни автоматической регулировки оттенки и насыщения; регулировка яркости и отличие от фиксированного масштаба; разбавление 24 бит RGB цвета в 8-битные оттенки серого; сокращение размера изображений до 512 х 512 пикселей; сохранение изображений в формате JPEG.

Рис. 2. Процесс изготовления изображения

2D-DCT сжатие изображений

Интерполяция по соседним элементам выполняется с помощью MATLAB Image Processing Toolbox для изменения размера предварительных изображений из размера 512 х 512 пикселей до блоков изображений с размером 8 х 8 пикселей, как показано на рис. 2. Предлагаемый метод проектирования рассчитывает 2D-DCT блоков изображений размера 8 х 8 пикселей с использованием '8 'из 64 коэффициентов DCT для маскировки. Остальные 56 коэффициентов отбрасываются (устанавливать на нуль). Затем изображение реконструируется путем вычисления 2D-IDCT каждого блока с использованием DCT метода расчета матрицы преобразования (DCT transform matrix computation method). Наконец, на выходе получается набор массивов. Каждый массив имеет размер 8x8 пикселей и представляет собой одно изображение. Эти этапы представлены на рис.3 для типового изображения. Эмпирически, в левом верхнем углу каждая 2D-DCT матрица содержит наиболее важные данные, потому что они соответствуют низкочастотным компонентам в обработанном блоке изображения [6,7].

сжатое изображение

Входное 8 из 64 коэффициентов, после выполнения

изображение используемых для маскировки 2D-DCT и 2D-IDCT

Рис. 3. Вычисление 2D-DCT изображения

Распознавание образов

Распознавание образов является одним из важных шагов в обработке изображений и из немногих биометрических методов, которые обладают достоинствами, как высокой точности, так и низкого вмешательства. Если есть образец, первый шаг в распознавании образов заключается в выборе набора признаков или атрибутов из всех доступных признаков, которые будут использоваться для классификации образца. Далее, исходный образец должен быть преобразован в представление, которым легко манипулировать программно. После того, как данные обработаны с целью удаления шумов, находят признаки в данных как относящиеся к соответствующему образцу. На стадии классификации данные классифицируются на основе измерений сходства с другими образцами. Процесс распознавания образов заканчивается, когда данным на основе их принадлежности к классу назначается метка. В системе распознавания образов, у нас есть база данных изображений, хранящихся в системе. Когда получили новое изображение, оно сравнивается с базой данных изображений, уже хранящихся или не хранящихся в системе. Сначала в эксперименте строилась база данных различных образов, как показано на рис.4 и блок-схема распознавания образов на рис.5, SOM работает в двух режимах: обучение и отображение.

- Обучение строит карту с помощью входных примеров. Это конкурентный процесс, называемый также квантизацией векторов.

- Отображение автоматически классифицирует новый входной вектор.

ОБУЧЕНИЕ

Рис. 4. Сравнение нового изображения с базой данных

Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Интернет-журнал «НАУКОВЕДЕНИЕ» №5 2013

А. Обучение

База данных Выделение SOM для обучения

изображений признаков

Б. Отображение

Обученные SOM Распознавание

образов

Рис. 5. Блок-схема распознавания образов

Самоорганизующиеся карты

Самоорганизующиеся карты (Self Organizing Maps - SOM) также известны как карта Кохонена. это одна из разновидностей нейросетевых алгоритмов. Основным отличием данной технологии от рассмотренных нами ранее нейросетей, обучаемых по алгоритму обратного распространения, является то, что при обучении используется метод обучения без учителя, то есть результат обучения зависит только от структуры входных данных. В нейронных алгоритмах обучения без учителя и SOM Кохонена широко использованы в области распознавания образов. Важным отличием алгоритма SOM является то, что в нем все нейроны (узлы, центры классов...) упорядочены в некоторую структуру (обычно двумерную сетку). При этом в ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. Все нейроны в некоторой окрестности нейрон-победителя обновляются с использованием правила Кохонена. Правило Кохонена позволяет веса нейронов для обучения входного вектора, и из-за этого оно полезно в приложениях распознавания. Поэтому в этой системе SOM используется для классификации векторов DCT на группы, чтобы распознавать объект во входном изображении присутствует или нет в базе данных изображений [7]. SOM может быть одномерной, двумерной или многомерной. Количество входных соединений в сети SOM зависит от количества атрибутов, которые будут использоваться в классификации [8].

Рис. 6. Архитектура SOM

На рис. 6 входным вектором Р является строка пикселей DCT сжатия изображения. Блок ||dist|| принимает входной вектор Р и матрицу входных весов IW1,1, которая производит вектор, имеющий S1 элементов. Элементы являются отрицательными расстояниями между входным вектором и векторы IW1,1 формируются из строки матрицы входного веса. Блок

Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Интернет-журнал «НАУКОВЕДЕНИЕ» №5 2013

||й1§1:|| вычисляет входную сеть п1 конкурентного слоя путем нахождения Евклидово расстояния между входным вектором Р и весовыми векторами. Функция конкурентной передачи С принимает сеть входного вектора для слоя и возвращается выходные нейроны 0 для всех нейронов за исключением победителя, нейрон связан с самым положительным элементом входной сети п1. Выход победителя - 1. Весовой вектор нейрона ближе к входному вектору и имеет наименее отрицательную сеть входа, поэтому для выхода победитель - 1. Таким образом, функция конкурентной передачи С производит 1 на выходе элемента а1 , соответствующего /* «победитель». Все другие элементы выхода в а1 - 0 [3].

SOM подразумевает использование упорядоченной структуры нейронов. Обычно используются одно и двумерные сетки. При этом каждый нейрон представляет собой n-мерный вектор-столбец w = [w1( w2, ...,wn]T, где п определяется размерностью исходного пространства (размерностью входных векторов).

Обучение без учителя

Во время обучения, нейрон с весами, наиболее близкими к вектору входных данных, объявляется победителем. Тогда веса всех нейронов в окрестности нейрона-победителя корректируются на величину, обратно пропорционально Евклидову расстоянию. Кластеры и классификаторы набора данных используются на основе набора атрибутов.

Алгоритм обучения можно резюмировать следующим образом :

Инициализация (Ш0): Выбор случайных значений для начальных весовых векторов Wj(0), весовые векторы, различные для j = 1,2,..., l где l — это общее число нейронов.

Сходство в соответствие (Ш2): Найти нейрон-победитель i(x) в момент времени t, 0 < t < n с помощью минимального критерия Евклидова расстояния:

i(x) = arg minj ||x(n) — Wj||, j = 1,2,..., l (3)

Обновление (Ш3): настройка весового вектора всех нейронов с помощью формулы обновления:

Wj(n + 1) = Wj(n) + n(n)hj,ix(n)(x(n) — Wj(n)), (4)

где n(n) является параметр коэффициента обучения, и hj,jx(n) — функция окрестности (neighborhood function) сосредоточена вокруг нейрона-победителя i(x). Как n(n), так и hj,ix(n) изменяются динамически в процессе обучения для достижения наилучших результатов.

Ш4. Повторяется шаг Ш1 до тех пор, пока выходные значения не наблюдается в карте признаков.

Wi = [Wi1,Wi2, ...,wn]T G (1)

Выборка (Ш1): выборка x из входного пространства с определенной вероятностью. Х= [X1,X2,...,Xi]T G ^n (2)

Обучение изображений отображается в меньшей размерности с использованием сети SOM и матрицы весов каждого изображения, храненного в базе данных обучения. При распознавании обученные изображения восстановлены с использованием весовых матриц.

Распознавание осуществляется через необученные тестовые изображения с использованием евклидово расстояния как мера сходства. Обучение и тестирование для нашей системы проводились с использованием MATLAB Neural Network Toolbox.

Этап обучения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На этапе обучения, обозначенные DCT-векторы, которые представляются SOM по одному. Для каждого узла, число "победитель" записано вместе с меткой входной выборки. Для каждого узла, число "победы" записано вместе с меткой входной выборки. Для узлов весовые векторы обновляются, как описано в этапе обучения без учителя. В конце этого этапа, каждый узел SOM имеет два записанных значений: суммарное число побеждающих раз для объекта, присутствующего в базе данных изображений и суммарное число побеждающих раз для объекта, не присутствующего в базе данных изображений [6].

Этап тестирования

На этапе тестирования, каждый входной вектор сравнивается со всеми узлами SOM и нейрон-победитель найден на основе минимального евклидова расстояния, как указано в этапе Ш2 [6]. Окончательный выход системы на основе её распознавания отображает, если тестовое изображение присутствует или не присутствует в базе данных изображений.

База данных изображения разделяется на два подмножества: обучение и тестирование. Во время обучения SOM использовались 20 изображений. Рис. 4 показывает базу данных обучения и тестирования изображение. Предварительно обработанные полутоновые изображения с размером 8 х 8 пикселей изменены в MATLAB, чтобы сформировать 64 х 1 массив с 64 строками и 1 столбцом для каждого изображения. Этот метод выполняется на всех 5 тестовых изображений, чтобы сформировать входные данные для тестирования системы распознавания. В работе авторами получены экспериментальные результаты на основе MATLAB (рис.7).

Рис. 7. Экспериментальные результаты на основе MATLAB

Заключение

Таким образом, данная работа посвящена применению нейросетевого алгоритма Кохонена для классификации образов без учителя, т.е. кластеризации. При такой постановке задачи дан набор объектов, каждому из которых сопоставлена строка таблицы (вектор значений признаков). Требуется разбить исходное множество на классы, т.е. для каждого объекта найти класс, которому он принадлежит. В результате получения новой информации о классах возможна коррекция существующих правил классификации объектов.

ЛИТЕРАТУРА

1. S. Samarasinghe. Neural Networks for Applied Sciences and Engineering: From Fundamentals to Complex Pattern Recognition. Auerbach Publications, 2006.

2. L. Ma, Y. Xiao, and K. Khorasani, “A new facial expression recognition technique using 2D DCT and k-means algorithm”, in Proc. International Conference on Image Processing, Oct. 2004, pp. 1269-1272.

3. А. Abdallah, M. Abou El-Nasr, and A. Lynn Abbott, “A New Face Detection Technique using 2D DCT and Self Organizing Feature Map” in Proc. of World Academy of Science, Engineering and Technology, Vol. 21, May 2007, pp. 15-19.

4. J. Nagi, “Design of an Efficient High-speed Face Recognition System”, Department of Electrical and Electronics Engineering, College of Engineering, Universiti Tenaga Nasional, March 2007.

5. D. Kumar, C.S. Rai, and S. Kumar, “Face Recognition using Self-Organizing Map and Principal Component Analysis” in Proc. on Neural Networks and Brain, ICNNB 2005, Vol. 3, Oct 2005, pp. 1469-1473.

6. Тант Зин Пьо, Кочетков М.П. Обработка изображений в системах

технического зрения робототехнических комплексов// Информационно -управляющие вычислительные системы: алгоритмы, аппаратные и

программные средства: межвузовский сборник/ Под ред. В.А. Бархоткина. -M.: МИЭТ, 2011. - 148с. С. 130-135.

7. Тант Зин Пьо. Адаптивные алгоритмоы распознавания// Микроэлектроника и информатика - 2013. 20-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - M.: МИЭТ, 2013г. -323с. С. 221.

Рецензент: НИУ МИЭТ, д.т.н., профессор О.И. Лисов.

i Надоели баннеры? Вы всегда можете отключить рекламу.