Научная статья на тему 'Структурное распознавание изображений с применением моделей интеллектуальной обработки и самоорганизации признаков'

Структурное распознавание изображений с применением моделей интеллектуальной обработки и самоорганизации признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
497
102
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компьютерное зрение / структурное распознавание изображений / характерные признаки / дескрипторы / структурное описание / метод SURF / самоорганизация / кластеризация / сеть Кохонена / подобие векторных описаний / матрица характеристик кластеров / computer vision / structural image recognition / features / descriptors / structural description / SURF / self-organization / clustering / Kohonen network / descriptions similarity vector / matrix of cluster characteristics / комп’ютерний зір / структурне розпізнавання зображень / характерні ознаки / дескриптори / структурний опис / метод SURF / самоорганізація / кластеризація / мережа Кохонена / подібність векторних описів / матриця характеристик кластерів

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гороховатский В. А., Гороховатский А. В., Берестовский А. Е.

Статья посвящена исследованию проблемы распознавания изображений в компьютерном зрении на основе множества структурных SURF-признаков. В пространстве структурных признаков выполнена самоорганизация с целью увеличения быстродействия процесса распознавания. В качестве аппарата самоорганизации использована нейронная сеть Кохонена. Объектом исследования есть метод вычисления подобия описаний и модели интеллектуальной обработки в новом пространстве признаков. Предметом исследования является систематизация и группирование множеств структурных признаков визуальных объектов. Цель работы – построение метода структурного распознавания с применением входных данных в виде множества кластеров структурных признаков, полученных в результате самоорганизации. Задачами исследования есть изучение особенностей и анализ моделей для вычисления характеристик кластеров, построение модифицированных мер структурного подобия, экспериментальное оценивание качества распознавания для разных способов сопоставления описаний в прикладной базе визуальных образцов. Предложено построение метода распознавания изображений на основе эталонных описаний в кластерном виде, а распознавание базируется на классификации структурных признаков объекта в пространстве кластеров с дальнейшим вычислением и оптимизацией подобия векторных описаний. Проведено моделирование и экспериментальные исследования предложенного метода распознавания на тестовом множестве изображений с применением признаков SURF. Подтверждена работоспособность и эффективность метода в плане быстродействия, получены оценки качества распознавания для разнообразия вариантов обработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гороховатский В. А., Гороховатский А. В., Берестовский А. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRUCTURAL IDENTIFICATION OF IMAGE RECOGNITION BASED WITH MODELS OF INTELLECTUAL SELFORGANIZATION FEATURES

Paper describes an investigation about the problem of image recognition in computer vision based on a set of structural SURF-features. Self-organization process is proposed to be performed in space of structural features with a goal to increase recognition process performance. Kohonen neural network is used as self-organization method. The object of research is the method of similarity calculations and models of intelligent data processing in the new feature space. The subject of research is the systematization and grouping of sets of structural features of visual objects. Goal of a paper is to construct structural recognition method based on input data as a set of cluster structural features obtained as a result of self-organization. The objectives of the research are the investigation of the features and analysis of models to calculate clusters of features, the construction of the modified measures of structural similarity, the experimental evaluation of the recognition quality for different ways of descriptions comparison in the application-based visual image database. Construction of an image recognition method based on etalon descriptions as a cluster was proposed, recognition is based on the classification of the structural features of an object in cluster space with further calculation and optimization of the similarity vector descriptions. Experimental investigations and simulations of the proposed recognition method on the test image set with the use of SURF characteristic features were performed. Performance boost and efficiency of the method were confirmed, estimation of recognition quality for different processing options was performed.

Текст научной работы на тему «Структурное распознавание изображений с применением моделей интеллектуальной обработки и самоорганизации признаков»

УДК 004.932.2:004.934

Гороховатский В. А.1, Гороховатский А. В.2, Берестовский А. Е.3

1Д-р техн. наук, профессор, профессор кафедры информационных технологий, Харьковский учебно-научный институт государственного высшего учебного заведения «Университет банковского дела», Харьков, Украина 2Канд. техн. наук, доцент, доцент кафедры информатики и компьютерной техники, Харьковский национальный

экономический университет имени Семена Кузнеца, Харьков, Украина 3Аспирант кафедры информатики, Харьковский национальный университет радиоэлектроники, Харьков, Украина

СТРУКТУРНОЕ РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ С ПРИМЕНЕНИЕМ МОДЕЛЕЙ ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ _И САМООРГАНИЗАЦИИ ПРИЗНАКОВ_

Статья посвящена исследованию проблемы распознавания изображений в компьютерном зрении на основе множества структурных SURF-признаков. В пространстве структурных признаков выполнена самоорганизация с целью увеличения быстродействия процесса распознавания. В качестве аппарата самоорганизации использована нейронная сеть Кохонена.

Объектом исследования есть метод вычисления подобия описаний и модели интеллектуальной обработки в новом пространстве признаков. Предметом исследования является систематизация и группирование множеств структурных признаков визуальных объектов.

Цель работы - построение метода структурного распознавания с применением входных данных в виде множества кластеров структурных признаков, полученных в результате самоорганизации. Задачами исследования есть изучение особенностей и анализ моделей для вычисления характеристик кластеров, построение модифицированных мер структурного подобия, экспериментальное оценивание качества распознавания для разных способов сопоставления описаний в прикладной базе визуальных образцов.

Предложено построение метода распознавания изображений на основе эталонных описаний в кластерном виде, а распознавание базируется на классификации структурных признаков объекта в пространстве кластеров с дальнейшим вычислением и оптимизацией подобия векторных описаний.

Проведено моделирование и экспериментальные исследования предложенного метода распознавания на тестовом множестве изображений с применением признаков SURF. Подтверждена работоспособность и эффективность метода в плане быстродействия, получены оценки качества распознавания для разнообразия вариантов обработки.

Ключевые слова: компьютерное зрение, структурное распознавание изображений, характерные признаки, дескрипторы, структурное описание, метод SURF, самоорганизация, кластеризация, сеть Кохонена, подобие векторных описаний, матрица характеристик кластеров.

НОМЕНКЛАТУРА

SURF - Speeded up robust features (ускоренное выделение устойчивых особенностей);

ХП - характерный признак;

Z с Rn - описание объекта;

{Zj }J=1 - множество (база) эталонных описаний;

s j = card (Zj ) - число элементов эталона Zj;

Cj - множество кластеров ХП;

q - число кластеров;

mj - объем j -ого кластера;

T = {{tj }j=1,...j }j=1,...,q - матрица характеристик кластеров;

L[T ] - интеллектуальная обработка матрицы T;

{c1, С2,..., Cq } - множество центров кластеров;

p(ca, z) - расстояние до центра ca кластера с номером a = 1, q ;

J - множество номеров классов;

Vu - сформированное из u элементов подмножество номеров кластеров или классов; M = {1,2,...} - ограниченное множество целых чисел;

Ind - процедура индексирования по множеству A (значения tjj или расстояния до центров кластеров); М- - мера подобия;

Н-тах 2 - второй элемент в списке ранжированных по убыванию

значений |Н для эталонов; /Д.] - векторное кластерное представление объекта и эталона,

соответствующее строке матрицы данных Т; У - нормированный коэффициент корреляции.

ВВЕДЕНИЕ

В структурных методах распознавания изображений, получивших распространение в системах компьютерного зрения, описание визуального объекта представляют множеством характерных признаков (ХП) - векторов, закрепленных в координатах ключевых точек изображения и инвариантных к геометрическим преобразованиям объектов в поле зрения [1-4]. Это множество однотипных признаков отражает конструкцию образа объекта в виде списка точек пространства векторов. Углубленное исследование пространства структурных признаков показывает, что влияние ХП на результат распознавания напрямую зависит от их взаимосвязей в рамках описания, характеризуемых подобием внутри эталона и между разнообразием описаний списка эталонов.

Ценные для распознавания параметры признаков вычисляют путем обучения в соответствии с процедурой, базирующейся на степени их взаимного подобия в пределах топологической окрестности элемента многомерного пространства. Другим способом установления параметров связи может быть экспертное оценивание составляющих множества ХП, включающее взаимное пространственное расположение и значимость для распознавания.

© Гороховатский В. А., Гороховатский А. В., Берестовский А. Е., 2016 DOI 10.15588/1607-3274-2016-3-5

1 ПОСТАНОВКА ЗАДАЧИ

Возникает целесообразность создания и применения таких интеллектуальных моделей обработки данных в структурном распознавании, где сопоставление признаков осуществляется с учетом полученных в результате самоорганизации параметров, отражающих их ключевые свойства: взаимосвязь, взаимное влияние, близость в признаковом пространстве, значимость и действие на результат. Параметры моделей определяются эталонным множеством и схемами обработки, они способны перестраиваться путем самообучения системы при необходимости обновления базы изображений.

Целью статьи есть изучение и оценивание эффективности применения самоорганизации и интеллектуальной обработки в методах структурного распознавания в плане построения правил принятия решений о классе объектов на основе данных прикладной базы изображений. За счет самоорганизации множество структурных элементов преобразуется к вектору, что сокращает объем вычислительных затрат и повышает быстродействие распознавания.

Задачи исследования - изучение особенностей и анализ вариантов вычисления характеристик, а также построение мер структурного подобия применительно к описаниям изображений в виде множеств дескрипторов структурных признаков, а также экспериментальное оценивание качества распознавания в прикладной базе визуальных образцов.

2 ОБЗОР ЛИТЕРАТУРЫ

Применение самоорганизации для системы структурных признаков путем кластерного представления в рамках множества элементов базы эталонных образов на этапе обучения позволяет вскрыть внутреннюю структуру признакового пространства и свести распознавание к значительно более эффективному сопоставлению, где эталоны описываются векторами, а релевантность эталону характеризуется числовым коэффициентом, имеющим смысл функции принадлежности [1-4].

Самоорганизация может быть выполнена с использованием аппарата сетей Кохонена [3, 5, 7]. Осуществление кластеризации-классификации структурирует библиотеку эталонных признаков путем внедрения механизма их коллективного взаимодействия, который реализуется как адаптивный процесс соревновательного обучения. За счет кластеризации совершается преобразование описаний эталонов из пространства «множество дескрипторов» к пространству «числовые вектора», что ускоряет распознавание [8]. Задачи построения оптимального классификатора и оптимальной системы признаков здесь считают тождественными [6]. Интеллектуальная обработка данных в системах голосования признаков, как правило, реализуется в виде набора эвристик [10].

Проведенные нами исследования говорят о том, что выигрыш в быстродействии распознавания в результате структурирования пространства признаков возрастает с увеличением параметров размера описаний, числа эталонов и уменьшением числа кластеров, и для конкретных приложений составляет несколько десятков раз [1, 3].

3 МАТЕРИАЛЫ И МЕТОДЫ

В рамках структурных подходов описания объектов рассматривают в виде множества дескрипторов - числовых векторов из К". Описание 2 с К" объекта представляют как мультимножество [1].

Пусть имеем базу {23 описаний из 3 эталонов, а эталон, в свою очередь, есть множество 2] = {гд },

е К", 23 с К", ] - номер эталона, к - номер ХП внутри описания эталона, параметр п фиксирован. Результатом самоорганизации есть кластерное представление базы {23 [3, 4]. Если воспользоваться аппаратом сети Кохонена [7], объединяющим нелинейное проецирование и кластеризацию, то множество {23 трансформируется к разбиению множеством кластеров

{2 3 }3=1 ^ С, С = С,, причем С1 п Са = 0.

Распознавание на основе кластерных характеристик предполагает реализацию следующих шагов предварительной обработки:

1) формирование эталонного множества {23 }у=1;

2) кластеризация {23 }^=\ с получением множества

центров {cl,c2,...,сд}, са е К" - центр кластера, q - число кластеров; т, - объем ,-го кластера;

3) вычисление множества Т = t2,...ta,..., tq ] векторов-столбцов ta = ^, tl.fi ], которые образуют матрицу Т данных, характеризующую кластеры в аспекте числа элементов, отнесенных к эталону;

4) обработка матрицы Т в целях отбора значимых данных.

Постоим матрицу данных Т для {23 }3=1. Вычислим к, (3) = сагё[{г е С, | г е 23 }] - число элементов эталона 23, отнесенных к С,. Заполним значениями к, (3) целочисленную матрицу данных Т = }3=1...у }г=1,...,д .

Обязательными этапами обработки матрицы Т, на наш взгляд, есть:

1) устранение из анализа незначимых (по числу элементов) кластеров, в результате число столбцов сократится; на практике можно исключить кластеры с числом элементов 1-2% от общего объема;

2) нормирование строк матрицы путем деления на

число элементов эталона

^ = ^ / sJ .

(1)

При этом для исходной матрицы будет выполнено соотношение

а для нормированной - = 1.

Соотношение (1) соответствует распространенной в интеллектуальном анализе данных модели оценивания плотности распределения элементов j-го объекта, принадлежащих i -му кластеру [5, 8]. Нормированием (1) устраняем влияние размера эталона. Кроме соотношений (2), очевидно, в исходной матрице данных выполнено ^ ,Sj т, т.к. элементы {Zj }J= принадлежат

одному из кластеров, образующих нового разбиения.

Значения строк T отражают подобие множеств признаков в аспекте эталон-кластер, а после нормировки к 1 фактически характеризуют вероятности отнесения признака j-го эталона к одному из кластеров. Матрица T -это результат обучения с учителем, т.к. принадлежность признака эталону априорно задана в базе изображений.

Заметим, что важную роль играет степень равномерности распределения элементов эталона по построенной системе кластеров. Идеальной ситуацией есть принадлежность точек эталона одному из кластеров, что упрощает процесс статистического распознавания. Однако, наше моделирование показало, что в действительности такая ситуация встречается редко.

С другой стороны, столбец матрицы T характеризует весовое распределение точек кластера по системе эталонов. Здесь идеальным случаем также была бы принадлежность точек кластера одному из эталонов, что соответствует tj ^ 1. Нежелательным вариантом есть равномерное разделение точек кластера по множеству эталонов (равноценные элементы в столбце), что делает такой кластер бесполезным в распознавании. Напрашивается мысль о необходимости целенаправленной трансформации матрицы T для обеспечения качества распознавания. Немаловажным также представляется построение численного критерия, отражающего неравномерность значений элементов в строках/столбцах матрицы T.

Наряду с (1) представляет также интерес нормирование в столбце матрицы T вида: tf = tf /mi, что исключило бы влияние размера кластера. При этом можно было бы говорить о распределении элементов кластера по эталонам. Однако это предполагает выравнивание объемов кластеров, что на практике обеспечить трудно, ибо результат кластеризации меняется в зависимости от параметров применяемого метода и состава базы изображений. Обеспечить же примерно равноценное число элементов в эталонах можно применением фильтрации, что делает более целесообразной нормировку (1).

Отметим, что при определении числа кластеров устанавливается компромисс между желаемой точностью аппроксимации данных в виде показателя качества (вероятность правильного распознавания) и быстродействием распознавания [7].

Результат самоорганизации - множество центров {с1,С2,...,Cq}, Ci е Rn составляют векторы из пространства Rn. Для признаков SURF [2] (вектор размерности 64) кластеризация приводит к сжатому представлению в

виде матрицы C = {{ca^ }q=1 }Ь=1. Строки C образуют набор опорных точек пространства при распознавании (рис. 1).

Рисунок 1 - Схема предварительной обработки эталонных данных

Эффективным представляется проведение на этапе формирования эталонных характеристик интеллектуальной обработки Ц[Т] матрицы Т = {//} в целях акцентирования внимания на значимой для распознавания информации. Часто такая обработка имеет вид множества эвристик [10]. Признак-столбец с равными значениями компонентов сигнализирует, что кластер с ^ «не различает» эталоны. Наиболее подходящая ситуация - когда один из компонентов / стремится к 1 или значительно превышает значение 0,5. Именно здесь допустима бинарная обработка. Можно также обработать вектор , чтобы выделить 1-3 значимые компоненты. Вариантами обработки могут быть:

- нормирование матрицы Т, исключая влияние размера эталонного описания (строка) и/или объема кластеров (столбец);

- изъятие из кластерного представления состава малочисленных кластеров, например, общая доля которых составляет менее 10% объема описания базы; при этом число столбцов матрицы Т сократится, что способствует упрощению обработки;

- анализ содержания столбцов матрицы Т : построение укороченного вариационного ряда из 1-3 элементов; обнуление малых по значению элементов (например, меньших 0,05), если только они не составляют весь столбец; бинарная обработка путем выделения максимума, превышающего значение 0,5, и т.п.;

- в случае равноценных элементов в столбце целесообразно исключить лишь незначимые элементы.

Важно, чтобы вследствие обработки ЦТ] у эталонов осталось представительство ненулевых элементов в кластерах. В противном случае распознавание станет проблематичным. Традиционными подходами к нормированию положительных данных есть деление на их сумму или на максимум [5].

На этапах построения матрицы данных и в процессе распознавания применимы следующие модели обработки Т:

1) «бинарная» - выбирается единственный весомый кластер или наиболее подходящий из эталонов;

2) «расширенное множество альтернатив» - формируется подмножество значимых кластеров и/или эталонов;

3) «полная матрица данных» - используются характеристики кластеров и эталонов в полном объеме;

4) комбинирование - применяются модели 1-3 в сочетаниях.

Бинарный путь отнесения признака к классу - простая модель, в то время как причисление к нескольким кластерам или классам с разными весами соответствует мягкой классификации (нечеткое представление). Учитывая, что при распознавании изображений из-за влияния фона, помех и других объектов наблюдается значительное число ложных ХП, в условиях высокого уровня искажений отдают предпочтение первому способу [1]. В то же время в задачах, где эталоны имеют существенное пересечение в пространстве признаков, лучшей восприимчивостью к различиям объектов обладает способ мягкой классификации.

Предлагаемая здесь аппроксимация пространства признаков путем кластерного представления вносит коррекцию в применение моделей распознавания. Может оказаться, что при незначительном числе кластеров отдельные классы при упрощенной бинарной обработке естественным образом станут неразличимы. Возможным выходом есть: использование полного объема данных, увеличение числа кластеров и др.

Известны две основные модели структурного распознавания [1]:

1) раздельный анализ ХП объекта и отнесение их к эталону; победителем считается класс, набравший наибольшее число голосов;

2) построение интегрального векторного описания объекта и выбор эталона с наивысшим подобием путем сопоставления со списком эталонов.

Первая модель устойчива к локальным помехам. Второй способ применяют в ситуациях преобладающего влияния флуктуационных помех, он эффективнее в вычислительном плане. Примером векторного представления для второй модели есть описание в виде q-вектора из количеств кластерных элементов.

Фактически здесь нами предложен новый способ структурного распознавания, где эталонные описания подаются в кластерном виде, а классификация базируется на предварительном отнесении к кластерам или на оптимизации подобия векторных описаний.

Распознавание объекта по описанию 2 приобретает вид двухэтапного отображения

Выбор класса элемента после оптимизации (4) уг е 2 можно осуществить как

R _ R2(R1[Z]),R : Z ^ J.

(3)

На первом этапе К^ : 2 ^ С признаки 2 относят к одному/нескольким кластерам, а затем отображение К2 : С ^ У агрегировано по множеству 2 оптимально определяет класс объекта из списка эталонов. На обоих этапах принятия решений (3) вычисляем и применяем характеристики отдельных ХП, а также значения параметров кластеров. Реализацию (3) осуществим оптимизацией меры подобия по результатам анализа всех признаков объекта.

Этот путь намного эффективнее в плане объема вычислений, чем сопоставление типа множество-множество. Навигация по кластерам является результативной альтернативой поиска по объемному множеству эталонных признаков.

Модель определения номера и оптимального кластера для г е 2:

и = arg min{p(ca, z)}q=1

a_1,q

b _ arg max{ tU }J

j=1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(5)

В итоге бинарной обработки (5) Vz еZ получим номер b класса, а для всего объекта - вектор классов

h _ {hj }J=i, где hj - число элементов Z, назначенных в

соответствии с моделью (5) в класс с номером j. При

этом теоретически выполнено ^J_ihj = s, где

s _ card(Z). В приложениях это условие часто нарушается, т. к. признаки в ходе обработки частично могут быть потеряны, а также могут появиться ложные признаки.

Подмножество кластеров/классов будем формировать путем редукции

Vu _{иеM |Ind[{A},u]}, (6)

В результате обработки (6) для z е Z получим u значений ai,a2,...,au , агрегацией которых реализуется R2. Примером (6) есть правило «три наибольших» - при построении (4) определяем три наиболее подходящих кластера по расстоянию, или в столбце T формируем тройку классов с наибольшими значениями. В результате редукции анализируется некоторая подматрица T , и как результат - для элемента z е Z формируется вектор

t*[z] _ {t1,...,tJ} значений функции принадлежности к

*

эталонам. Накоплением векторов t на объекте из s элементов получим J-компонентный вектор классов h :

h _IS_/[z].

(7)

В выражении (5) анализируем целое значение, а в (7) -вещественное. Класс объекта определим как

к _ argmax{h,}

_1.

(8)

(4)

Метод распознавания на основе кластерного представления изобразим последовательностью этапов (схема приведена на рис. 2).

1. Построение описания 2 для распознаваемого изображения.

2. Уг е 2 определяем в соответствии с (4) номер кластера или в виде (6) формируем подмножество Уи.

3. По номеру кластера приписываем 2 номер класса в соответствии с (5) или вектор характеристик ^ [ г].

4. В зависимости от модели обработки: определяем

*

класс элемента согласно (6), либо агрегируем вектор t в соответствии с (7).

5. Повторяем шаги 2-4 У г е 2.

6. Согласно модели (8) устанавливаем класс объекта 2.

В обсуждаемом методе вместо традиционной оптимизации подобия ХП на множестве эталонов осуществляется значительно менее масштабная в вычислительном плане оптимизация на множестве кластеров, опре-

деляется значение параметров кластера и агрегировано формируется вектор характеристик классов объекта. Разработанные процедуры однозначно устанавливают процесс распознавания на основе анализа вектора h, содержащего степени принадлежности к классам.

Универсальным прикладным критерием П при оценивании эффективности метода распознавания есть отношение ближайшего локального максимума подобия к глобальному максимуму [9]

П_Ц max 2 / Ц max, Ц max _ max ^(Z, Z' ). (9) j_1,..., J

Чем меньше п, тем увереннее распознается объект. При этом (9) априори предполагает правильное определение класса объекта.

Соотношение (7) есть пример меры Ц в (9). Примером ц может быть также нормированный коэффициент корреляции Y

y(z , z^ ) _ ^q_1 (t,- [z yt [Z j ]) /Ц ^q_1(ti [z ] zq_1(ti [Zj ] )2) .(10)

Отметим также, что процедурные меры взвешенного голосования вида (7) есть мерами подобия и являются несимметричными по своей природе, в то время как (10) обладает симметрией относительно своих аргументов. 4 ЭКСПЕРИМЕНТЫ

Продемонстрируем работу и выявим особенности предложенного метода путем программного моделирования на примере. Вычисление множества ХП методом SURF осуществлено для базы из 25 изображений гербов городов Украины. На рис. 3, а-г приведены примеры изображений. Проведена кластеризация множества дескрипторов методом сети Кохонена [3]. Рис. 4 включает изображение одного из центров кластеров. Табл. 1 содержит матрицу данных в разрезе «эталон-кластер» после кластеризации 5-ти эталонов базы и распределения признаков по 8-ми кластерам.

Вначале исключим малочисленные кластеры 5, 7, содержащие менее 2% объема данных. В результате обязательной нормировки в строке получим табл. 2 (матрица данных). Моделирование показало, что в данной си-

Рисунок 2 - Распознавание на основе кластеров-классов ХП

а б в г

Рисунок 3 - Изображения из базы гербов городов Украины: а - Днепр, б - Львов, в - Киев, г -Харьков

туации простая бинарная обработка в строке и столбце не приводит к успеху, т.к., например, все 253 точки герба Днепра будут отнесены к другим классам в силу того, что ни по одному кластеру у герба Днепра максимума в столбце нет. Не совсем приемлемым оказался и вариант с тремя максимальными элементами в столбце.

Возможным выходом может быть увеличение числа кластеров или классов. Зато при вычислении подобия (10) достигается верное распознавание.

Использование полной матрицы данных также обеспечивает уверенное правильное распознавание для обои вариантов нормирования: на сумму и на максимум в столбце матрицы. Табл. 3 содержит значения подобия классов (7) при нормировании на максимум в столбце. На главной диагонали стоят максимальные элементы в строке, что соответствует факту правильного распознавания. Степень уверенности оценивается критерием (9).

Рисунок 4 - Пример центра кластера

Таблица 1 - Количества ХП в кластерном представлении эталонов

Изображения гербов Номер кластера

1 2 3 4 5 6 7 8

Днепр 29 24 111 5 61 23 29 24

Львов 83 26 83 24 43 70 83 26

Киев 40 46 82 31 74 31 40 46

Харьков 58 19 188 29 7 41 58 19

Кременчуг 29 26 159 54 39 8 29 26

База 239 141 623 143 224 173 141 623

Таблица 2 - Нормированная матрица данных

Изображения Номер кластера

гербов 1 2 3 4 6 8

Днепр 0,115 0,095 0,439 0,020 0,241 0,091

Львов 0,252 0,079 0,252 0,073 0,131 0,213

Киев 0,132 0,151 0,270 0,102 0,243 0,102

Харьков 0,170 0,056 0,550 0,085 0,020 0,120

Кременчуг 0,092 0,083 0,505 0,171 0,124 0,025

Таблица 3 - Пример матрицы подобия классов

1 2 3 4 5

1 187,637 150,356 168,589 159,868 164,37

2 195,522 237,971 200,842 203,269 173,911

3 202,574 185,58 214,396 164,801 187,322

4 216,106 211,301 185,401 271,999 241,612

5 204,65 167,468 194,101 222,538 245,556

Значения критерия (9) для трех видов обработки в варианте «полная матрица данных»: нормирование на сумму, нормирование на максимум в столбце, вычисление коэффициента корреляции (10) составили: 0,88, 0,90, 0,93. Как видим, обсуждаемые меры подобия здесь имеют преимущество перед коэффициентом (10), т. к. они меньше по величине.

Моделирование для 15-ти кластеров при тех же исходных данных обнаружило, что значения критерия (9) равны: 0,89, 0,91, 0,93, что практически равноценно значениям для 8 кластеров. Отметим, что при этом объем кластеров уменьшается, элементы матрицы данных становятся менее весомыми. Несмотря на то, что степень уверенности для решений (отношение числа голосов к объему описания) увеличилась, бинарная обработка и «три максимальных элемента в столбце» здесь также не обеспечивают распознавание. Учитывая, что с увеличением числа кластеров время обработки возрастает, можно рекомендовать на предварительном этапе одноразово определиться с минимальным числом кластеров, которые обеспечивают адекватное распознавание. Не стоит забывать также, что результат распознавания, основанный на интеллектуальном анализе, целиком зависит от данных базы изображений. Для других данных он может оказаться иным.

5 РЕЗУЛЬТАТЫ

Основным результатом исследования есть построение метода структурного распознавания, где эталонные описания подаются в кластерном виде, а распознавание базируется на классификации структурных признаков объекта в пространстве кластеров с дальнейшим вычислением и оптимизацией подобия векторных описаний. Проведенные эксперименты для различных вариантов обработки подтверждают работоспособность метода. Навигация по кластерам является действенной альтернативой поиска по объемному множеству эталонных признаков базы. Ее применение ускоряет процесс распознавания в десятки раз.

6 ОБСУЖДЕНИЕ

Отсутствие перспективы улучшения характеристик с увеличением числа кластеров для рассмотренного примера можно объяснить тем, что данные этой базы изображений достаточно хорошо сгруппированы, и кластеризация, проведенная в целях повышения быстродействия, увеличивает значение ошибки квантования [3]. Наше моделирование показало, что ошибка квантования в рамках единого кластера для этого примера ниже, чем для 8 или 15 кластеров. Другие исходные данные могут дать обратный эффект.

Инвариантность распознавания к геометрическим преобразованиям визуальных объектов обеспечивается на этапе построения дескрипторов характерных признаков.

В условиях локальных искажений предпочтение имеет модель принятия решения о классе раздельно для каждого ХП. В случае существенного пересечения классов в пространстве признаков, где нужна повышенная восприимчивость к различиям объектов, применим способ мягкой классификации отнесения ХП синхронно к подмножеству классов.

Некоторые упрощения обработки, связанные, например, с бинаризацией решений о классе характерных признаков объекта, могут оказаться неэффективными в силу высокой степени подобия для подмножеств структурных признаков эталонов.

ВЫВОДЫ

В результате кластеризации описание объектов приведено к принятой в интеллектуальной обработке данных системе координат объект-признаки, где значениями признаков выступают характеристики кластерного представления. За счет введенной интеллектуальной обработки описаний эталонов и распознаваемого объекта происходит усиление чувствительности метода распознавания к различиям в имеющихся данных.

Научная новизна исследования состоит в построении метода структурного распознавания на основе применении интеллектуального анализа данных путем построения кластерного сжатого представления признакового пространства, а также вычисления и использования его характеристик. Получено векторное описание пространства признаков, за счет чего существенно повышается быстродействие распознавания.

Практическая ценность работы - получение экспериментальных оценок и результатов анализа качества распознавания на основе кластеризации признаков для примеров прикладных баз изображений.

Перспективой исследования может быть проведение анализа значений параметров эталонных структурных признаков в целях построения новых значимых агрегированных характеристик. Целесообразно также исследовать вопрос о выборе оптимального параметра числа кластеров для обеспечения качественной аппроксимации данных в целях распознавания.

СПИСОК ЛИТЕРАТУРЫ

1. Гороховатский В. А. Структурный анализ и интеллектуальная обработка данных в компьютерном зрении : монография / В. А. Гороховатский. - Х. : Компания СМИТ, 2014. - 316 с.

2. Bay H. Surf: Speeded up robust features / H. Bay, T. Tuytelaars, L.Van Gool // Computer Vision: Ninth European Conference on Computer Vision, Graz, 7-13 May, 2006: proceedings. - Berlin : Springer, 2006. - P. 404-417.

3. Берестовский А. Е. Нейросетевые технологии самообучения в системах структурного распознавания визуальных объектов / А. Е. Берестовский, А. Н. Власенко, В. А. Гороховатский // Реестращя, зберщання i обробка даних. - 2015. - Т. 17, № 1. - С. 108-120.

4. Гороховатский В. А. Построение и применение функции принадлежности для результативного структурного анализа изображений / В. А. Гороховатский, Ю. А. Куликов, А. Е. Берестовский // Бионика интеллекта. - 2015. - №1 (84). - C. 13-18.

5. Паклин Н.Б. Бизнес-аналитика: от данных к знаниям : учеб. пособ. / Н. Б. Паклин, В. И. Орешков. - СПб. : Питер, 2013. -704 с.

6. Duda R. O. Pattern classification / R. O. Duda, P. E. Hart, D. G. Stork. - 2ed., Wiley, 2000. - 738 p.

7. Кохонен Т. Самоорганизующиеся карты / Т. Кохонен ; пер. 3-го англ. изд. - М. : БИНОМ, Лаборатория знаний, 2013. - 655 с.

8. Маннинг К. Д. Введение в информационный поиск / К. Д. Маннинг, П. Рагхаван, Х. Шютце ; пер. с англ. - М. : ООО И. Д. Вильямс, 2011. - 528 с.

9. Quality Criteria for Multidimensional Object Recognition Based

Upon Distance Matrices / A. V. Gorokhovatsky, V. A. Gorokhovatsky, A. N. Vlasenko, N. V. Vlasenko // Telecommunications and Radio Engineering. - 2014. - Vol. 73, No. 18. - P. 1661-1670.

10. Мулеса О. Ю. Методи врахування суб'ективного характеру вхщних даних для задачi голосування / О. Ю. Мулеса // Схщно-европейський журнал передових технологш. Серiя: процеси управлшня. - 2015. - Том 1, № 3 (73). - С. 20-25.

Статья поступила в редакцию 10.02.2016.

После доработки 05.03.2016.

Гороховатський В. О.1, Гороховатський О. В.2, Берестовський А. Е.3

'Д-р техн. наук, професор, професор кафедри шформацшних технологш, Харгавський навчально-науковий шститут ДВНЗ «Уш-верситет бангавсько! справи», Харгав, Украша

2Канд. техн. наук, доцент, доцент кафедри шформатики та комп'ютерно! техшки, Харгавський нащональний економiчний ушверси-тет iменi Семена Кузнеця, Харгав, Украша

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3Асшрант кафедри шформатики, Харгавський нащональний ушверситет радюеелектрошки, Харгав, Украша СТРУКТУРНЕ РОЗП1ЗНАВАННЯ ЗОБРАЖЕНЬ З ВИКОРИСТАННЯМ МОДЕЛЕЙ 1НТЕЛЕКТУАЛЬНО1 ОБРОБКИ I САМООРГАН1ЗАЩ1 ОЗНАК

Статтю присвячено дослщженню проблеми розшзнавання зображень у комп'ютерному зорi на основi множини структурних SURF-ознак. У простер структурних ознак виконано самооргашзащю з метою збшьшення швидкоди процесу розшзнавання. В якост апарату для самооргашзаци використано нейронну мережу Кохонена.

Об'ектом дослщження е метод обчислення подiбностi опиав i моделi штелектуально! обробки у новому простер ознак. Предметом дослщження е систематизащя i групування множин структурних ознак вiзуальних об'екпв.

Метою роботи е побудова методу структурного розшзнавання iз застосуванням вхщних даних у виглядi множини кластерiв структурних ознак, отриманих в результат самооргашзаци. Завданнями дослщження е вивчення особливостей i аналiз моделей для обчислення характеристик кластерiв, побудова модифжованих заходiв структурно! подiбностi, експериментальне ощнювання якост розшзнавання для рiзних способiв зютавлення опиав у прикладнш базi вiзуальних зразгав.

Запропоновано побудову методу розпiзнавання зображень на основi еталонних описiв у кластерному вид^ а розпiзнавання базуеть-ся на класифiкацii структурних ознак об'екта в простер кластерiв з подальшим обчисленням i оптимiзацiею подiбностi векторних описiв.

Проведено моделювання та експериментальш дослiдження запропонованого методу розшзнавання на тестовш множинi зображень iз застосуванням характерних ознак SURF. Пщтверджено працездатнiсть i ефективнiсть методу в плащ швидкоди, отримаш оцiнки якога розпiзнавання для рiзноманiття варiантiв оброблення.

Ключовi слова: комп'ютерний зiр, структурне розшзнавання зображень, характерш ознаки, дескриптори, структурний опис, метод SURF, самооргашзащя, кластеризащя, мережа Кохонена, подiбнiсть векторних опиав, матриця характеристик кластерiв.

Gorokhovatsky V. A.1, Gorokhovatskyi A.V.2, Berestovskyi A. E.3

'Dr.Sc., Professor, Professor of the Information Technologies Department, Kharkiv Educational and Scientific Institute SHEI "The University of banking", Kharkiv, Ukraine

2Ph.D., Associate Professor, Associate Professor of Informatics and Computer Technologies Department, Simon Kuznets Kharkiv National University of Economics, Kharkiv, Ukraine

3Post-graduate student of the Informatics Department, Kharkiv National University of Radioelectronics, Kharkiv, Ukraine

STRUCTURAL IDENTIFICATION OF IMAGE RECOGNITION BASED WITH MODELS OF INTELLECTUAL SELF-ORGANIZATION FEATURES

Paper describes an investigation about the problem of image recognition in computer vision based on a set of structural SURF-features. Self-organization process is proposed to be performed in space of structural features with a goal to increase recognition process performance. Kohonen neural network is used as self-organization method.

The object of research is the method of similarity calculations and models of intelligent data processing in the new feature space. The subject of research is the systematization and grouping of sets of structural features of visual objects.

Goal of a paper is to construct structural recognition method based on input data as a set of cluster structural features obtained as a result of self-organization. The objectives of the research are the investigation of the features and analysis of models to calculate clusters of features, the construction of the modified measures of structural similarity, the experimental evaluation of the recognition quality for different ways of descriptions comparison in the application-based visual image database.

Construction of an image recognition method based on etalon descriptions as a cluster was proposed, recognition is based on the classification of the structural features of an object in cluster space with further calculation and optimization of the similarity vector descriptions.

Experimental investigations and simulations of the proposed recognition method on the test image set with the use of SURF characteristic features were performed. Performance boost and efficiency of the method were confirmed, estimation of recognition quality for different processing options was performed.

Keywords: computer vision, structural image recognition, features, descriptors, structural description, SURF, self-organization, clustering, Kohonen network, descriptions similarity vector, matrix of cluster characteristics.

REFERENCES

1. Gorokhovatsky V. Strukturny'j analiz i intellektual'naya obrabotka danny'x v komp'yuternom zrenii: monografiya. Kharkiv, Kompaniya SMIT, 2014, 316 p.

2. Bay H., Tuytelaars T., Van Gool L. Surf: Speeded up robust features, Computer Vision: Ninth European Conference on Computer Vision, Graz, 7-13 May, 2006: proceedings. Berlin, Springer, 2006, pp. 404-417. DOI: 10.1007/11744023.

3. Berestovskyi A., Vlasenko A. N., Gorokhovatsky V. A. Nejrosetevy'e texnologii samoobucheniya v sistemax strukturnogo raspoznavaniya vizual'ny'x ob"ektov, Reestraciya, zberigannya i obrobka danix, 2015, Vol. 17, No. 1, pp. 108-120.

4. Gorokhovatsky V. A., Kulikov Yu. A., Berestovskyi A. E. Postroenie i primenenie funkcii prinadlezhnosti dlya rezul'tativnogo strukturnogo analiza izobrazhenij, Bionika intellekta, 2015, No. 1 (84), pp. 13-18.

5. Paklin N. B., Oreshkov V. I. Biznes-analitika: ot danny'x k znaniyam: uch posob. Sankt-Peterburg, Piter, 2013, 704 p.

6. Duda R. O., Hart P. E., Stork D. G. Pattern classification. Second edtition. New-York, Wiley-Interscience, 2000, 738 p.

7. Koxonen T. per. 3-go angl. izd. Samoorganizuyushhiesya karty'. Moscow, BINOM, Laboratoriya znanij, 2013, 655 p.

8. Manning K. D., Ragxavan P., Shyutce X. ; per. s angl. Vvedenie v informacionnyj poisk Moscow OOO I. D. Vil'yams, 2011, 528 p.

9. Gorokhovatskyi A. V., Gorokhovatsky V. A., Vlasenko A. N., Vlasenko N. V. Quality Criteria for Multidimensional Object Recognition Based Upon Distance Matrices, Telecommunications and Radio Engineering, 2014, Vol. 73, No. 18, pp. 1661-1670.

10. Mulesa O. Yu. Metodi vraxuvannya sub'ektivnogo xarakteru vxidnix danix dlya zadachi golosuvannya, Sxidno-evropejs'kij zhurnalperedovix texnologij. Seriya: procesi upravlinnya, 2015, Vol. 1, No. 3 (73), pp. 20-25.

i Надоели баннеры? Вы всегда можете отключить рекламу.