Научная статья на тему 'Распознавание изображений в пространстве инвариантных локальных признаков'

Распознавание изображений в пространстве инвариантных локальных признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1031
179
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Путятин Евгений Петрович, Гороховатский Владимир Алексеевич, Кузьмин Сергей Владимирович

Приводятся результаты исследований по распознаванию изображений двумерных объектов путем сравнения их представлений на множествах локальных признаков. Предложенные структурные методы обеспечивают инвариантность к геометрическим преобразованиям объектов и обладают высокой устойчивостью к действию локальных искажений. Обсуждаются вопросы помехозащищенности и качества работы алгоритмов, реализующих описанный метод.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Путятин Евгений Петрович, Гороховатский Владимир Алексеевич, Кузьмин Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Image recognition in space of local invariant features

Researched the problem of the image recognition in space of local invariant features. Offered structured methods possess the resistance to action of the background and local distortion. Present the results of the research to noiseproof factor and speed of algorithms, realizing described methods.

Текст научной работы на тему «Распознавание изображений в пространстве инвариантных локальных признаков»

УДК 681.3.07

РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ В ПРОСТРАНСТВЕ ИНВАРИАНТНЫХ ЛОКАЛЬНЫХ ПРИЗНАКОВ

ПУТЯТИН Е.П., ГОРОХОВАТСКИЙ В.А., КУЗЬМИН С.В.______________________________

Приводятся результаты исследований по распознаванию изображений двумерных объектов путем сравнения их представлений на множествах локальных признаков. Предложенные структурные методы обеспечивают инвариантность к геометрическим преобразованиям объектов и обладают высокой устойчивостью к действию локальных искажений. Обсуждаются вопросы помехозащищенности и качества работы алгоритмов, реализующих описанный метод.

1. Введение

Эффективным методом распознавания является структурный анализ, основанный на разбиении области определения изображения на фрагменты [1]. Такое представление обладает большей общностью по сравнению с целостным анализом объекта, так как позволяет раздельно анализировать составные части объекта, в частности при их искажении под воздействием локальных помех. Появляется возможность управлять интерпретируемым представлением анализируемого объекта, оперируя множествами его отдельных частей. В частности, предполагается вариант принятия решения по неполной совокупности фрагментов, что необходимо для некоторых технических применений [2].

На анализе структурных признаков основаны методы: частных корреляций [1,2], преобразования Хо, формирования максимальной клики, логической фильтрации [3], распознавания с использованием шаблонов [4], грамматического разбора. Эти методы находят практическое применение при распознавании изображений лиц, сортировке деталей бытовой техники, слежения за движущимися о бъектами, так как успешно функционируют в условиях неравномерного фона и помех.

Цель исследования - построение универсальных методов распознавания объектов на изображениях на базе структурного анализа инвариантных признаков.

Задачи исследования - формирование системы инвариантных признаков, создание подхода к установлению сходства и поиска на множестве эталонов, сравнение эффективности предложенного метода с известными, исследование быстродействия и помехозащищенности.

2. Описание метода

Один из ключевых аспектов подхода заключается в использовании для распознавания наиболее информативных участков изображения, заданных некоторой системой локальных признаков. Для выделения

таких участков применяются так называемые «точки интереса» [5-8], под которыми подразумеваются некоторые локальные особенности сигнала изображения, например, углы, резкие перепады яркости и т. д. Эти универсальные признаки не зависят от вида распознаваемого изображения [8] и могут формироваться в виде инвариантов к геометрическим преобразованиям.

Детектор Харриса [7] для нахождения точек, в которых подчеркиваются значительные двумерные изменения, использует матрицу A(x, у) взаимной корреляции соседних точек изображения, построенную на определении первых частных производных сигнала в

точке (x, у) , вычисленных по окрестности D размером 3 х 3:

A (0,0)= £ w (Ix(xk,yk))2,

(xk,yk)eD k>k

A (1,0)= Z wxkykIx(xk,yk)Iy (xk,yk),

(xk,yk)eD

A (0,1)= Z wxkykIx(xk,yk)Iy (xk,yk),

(xk.yk)eD

A (1,1)= Z wxkyk (Iy(xk,yk)) ,

(xk,yk^D

где Ix (x, у), ly (x, у) - частные производные функции яркости; (xk, yk) — пиксели окна D с центром в

точке (x,у); wxk Vk = exp (xk + Vk )/2° - сглаживающая маска Г ауссиан, используемая в целях снижения прямоугольных свойств фильтра путем его приближения к форме круга.

Матрица взаимной корреляции формируется на базе разложения функции взаимной корреляции:

2

f(x,y) = Z wxk,yk (I(xk,yk) - I(xk + Ax,yk + АУ)) в точке (x, у) в ряд Тейлора с использованием членов второго порядка. Элементы матрицы А (x, у) вычисляются путем суммирования значений соответствующих производных, полученных для точек окрестности, при этом окно для определения производных осуществляет сканирование по всем точкам окрестности. Например, для окрестности 3x3 суммирование производится по 9 значениям производных. При этом вид окна для формирования производных не связан с видом локальной области D .

Для выделения из всего множества только информативных фрагментов, обладающих существенными характеристиками, в подходе Харриса используется величина степени информативности In фрагмента с центром в точке (x, у) , которую определяет функция

In = det (А) - atrace( А) ,

РИ, 2006, № 1

69

где det (А) - определитель матрицы А; trace (А) -сумма главной диагонали (след) матрицы; а є [0,1] -нормирующая константа, влияющая на строгость отбора точек интереса.

Величина In отражает степень схожести анализируемого изображения в окне с координатами (x, у) с образом изображения произвольного угла, независимо от его геометрических преобразований [1-3]. После обработки детектором Харриса для реальных изображений, содержащих сложный фон, все-таки имеем значительное количество выбранных точек. Возникает необходимость повторного более тщательного анализа уже отобранных детектором точек для целей распознавания путем построения системы инвариантных признаков небольшой размерности. Это дает более точное представление о свойствах искомого объекта и в результате способствует улучшению характеристик распознавания.

Для реализации этой цели служит второй аспект подхода, связанный с формированием системы инвариантных признаков для каждого из фрагментов в виде некоторого вектора V.

Инвариантные признаки можно сформировать несколькими способами. К ним относятся, например, момент-ные инварианты, отклики текстурных локальных фильтров, признаки наличия границ [1-3] и другие. Интересными с точки зрения универсальности и устойчивости к помехам являются признаки, которые формируются на основе понятия “ локального потока”[6], представляющего собой набор специальным образом вычисленных коэффициентов разложения функции изображения фрагмента в ряд Тейлора.

«Локальный поток» порядка N в точке изображения p = (х, у) со степенью сглаживания а формально определяется как множество функций, заданное в некоторой локальной окрестности D точки p :

JN[I](p ,о) = (Ц...іп (p,o) | (p,o)є D х R+ ;n = 0,...,N},

где Li ...i (p,о)- свертка фрагмента D изображения I с производной от функции гауссиана Gi.in (p,о), причем значения ik задают тип производных, используемых в потоке, т.е. ik є {x, у}. Параметр гауссиана а может меняться в целях формирования множества «смазанных» сверток различной степени.

Например, потоки от 0-го до 2-го порядка имеют вид

множеств функций: J0[I](p, о) = {L(p, о)}- непосредственно свертка гауссиана с функцией яркости фрагмента, J^IKp^) = {L(p^),Lx(p, о)^уф, о)}- свертки функции яркости и производных 1-го порядка (всего 3 функции в потоке),

2

J [I](p , о) = {L(p,о)^хф,о)^у (p,о)^ххФ,о),

L ху (p, о), Lyy (p, о)} - набор из 6-ти различных функций, в котором максимальный порядок производной равен 2 (с учетом условия Lyx (p, о) = Lxy (p, о)).

Физический смысл локального потока состоит в представлении функции яркости, заданной на фрагменте, в виде множества функций - признаков, отражающих, в основном, степень изменчивости функции яркости, так как в основе их построения лежит дифференцирование. В работе [8] на основе набора функций “локального потока” формируются инварианты для группы движений (смещение и поворот). Эти инварианты можно отнести к дифференциальным инвариантам в отличие от известных моментных инвариантов, которые формируются путем интегрирования функции яркости[1]. Ниже приведен набор дифференциальных инвариантов на базе потока второго порядка:

V[0...3] =

LxLx + ^у^у

LxxLxLx + 2LxyLxLy + LyyLyLy Lxx + L уу

LxxLxx + 2LxyLxy + LyyLyy

Распознавание происходит путем вычисления и оптимизации некоторого расстояния между векторами признаков V анализируемого объекта и множества эталонов.

В качестве метрики в пространстве локальных признаков может использоваться расстояние Махаланобиса:

dm(Vi,Vj) = ^(Vi -Vj)TЛ-1(V1 -Vj) ,

где Vi, Vj - векторы-признаки сравниваемых фрагментов; Л_1 - обратная матрица ковариации, имеющая размеры инвариантного вектора признаков и вычисленная на множестве точек интереса эталонов.

На время распознавания формирование матрицы ковариации не влияет, так как это производится на этапе обучения. Расстояние Махаланобиса обладает важным свойством учета корреляционных связей между значениями признаков эталонов, что в целом усиливает эффективность процедуры группового ср авнения признаков. В случае некоррелированности признаков матрица Л является единичной, и тогда расстояние Махаланобиса приобретает более простой вид:

dm(Vi,Vj) = ^(Vi - Vj)T(Vi - Vj) .

Минимизация расстояния dm производится в соответствии со следующей алгоритмической схемой, которая фактически строится на процедуре голосования [4,8]. В результате этой процедуры при сравнении объекта с эталонами каждый инвариантный (и в то же время информативный) признак объекта сопоставляется с признаками всех информативных фрагментов каждого из эталонов. В аккумуляторе накапливается количество фрагментов, отдавших предпочтение этому признаку. Затем подсчитывается количество голосов,

70

РИ, 2006, № 1

отданных фрагментами объекта за тот или иной эталон. Эти голоса хранятся в векторе T(k). Объект считается

принадлежащим эталону Б, * , если

*

k = argmaxT(k). k

Групповое сравнение признаков фрагментов можно построить и другими способами. Например, может быть сформирована мера сходства для непосредственного сравнения вектора информативных признаков объекта и текущего эталона, использованная в предложенном нами ранее методе частных корреляций [1]. В качестве локальных признаков в его классическом варианте применяется непосредственно значение функции яркости. Решение о классе изображения здесь принимается путем оптимизации сходства как в пространстве эталонов, так и в пространстве преобразований в соответствии с формулой

*k k = arg {opt {opt Z(Ikg,I)}}

k G

где g - элемент группы преобразований G; z -структурная мера сходства, заданная на множестве сопоставляемых фрагментов.

В формулах для определения класса изображения, как и во всех процедурах голосования, важную роль играет предельно допустимое априорно заданное количество фрагментов, по которым непосредственно вычисляется сходство, так как естественно возникает вопрос о пороговом количестве фрагментов, которым можно доверять принятие решений за весь эталон.

3. Эксперименты

Экспериментальные исследования проводились в целях сравнительного анализа методов локальных корреляций и описанного метода инвариантных локальных признаков в плане оценки их работоспособности, а также быстродействия и помехозащищенности в условиях шума и локальных помех. На рис.1 приведены примеры использованных эталонов (полутоновые изображения), а на рис. 2 - анализируемого изображения, которое формировалось путем применения геометрических преобразований и влияния фона. Использовались полутоновые изображения эталонов размером 64 х 64 с яркостью в пределах 0...255, размер окна для вычисления производных и значений элементов матрицы взаимной корреляции был выбран 3 х 3, параметр а выбран экспериментально для данного набора эталонов и составил а =0,06. Маски для вычисления

производных от гауссианы w при а = 1 имеют вид,

dw

приведенный в табл. 1: а) ,б)

dw d2w

dy , в dx2 .

При оценке вероятности распознавания для различных методов от величины сигнал/шум были осуществлены следующие эксперименты. Один из случайно выбранных эталонов (см. рис.1) подвергался преобразованиям смещения (в пределах поля зрения) и поворота в диапазоне 0-180 градусов с дискретностью в 5 градусов. Затем преобразованный эталон размещался на сложном фоне, в результате формировалось и в дальнейшем распознавалось изображение, пример которого показан на рис.2.

а

б

в

Рис. 1. Примеры эталонов

Рис. 2. Пример входного изображения при отсутствии помех

Далее изображение подвергалось воздействию аддитивного шума с нормальным распределением амплитуды. Пример зашумленного изображения представлен на рис. 3.

Для аддитивной гауссовой помехи с нулевым мато-жиданием соотношение сигнал-шум оценивалось как

Н-1 _ Im/u,

где Im - наиболее часто встречающийся цвет пикселя на изображении эталона (мода яркости); и - корень из дисперсии шума.

Рис. 3. Входное изображение, подвергнутое аддитивному шуму с уровнем Д1 = 2

Вероятность распознавания получена как частота правильных решений в серии испытаний. Результаты экспериментов по анализу помехозащищенности приведены в табл. 2.

Таблица 1

а б в

0,368 0 -0,368 0,368 0,607 0,368 0 -0,607 0

0,607 0 -0,607 0 0 0 0 -1 0

0,368 0 -0,368 -0,368 -0,607 -0,368 0 -0,607 0

РИ, 2006, № 1

71

Таблица 2

41 1 2 3 4 5 6 7 8

Частные корреляции 0,46 0,82 0,96 0,98 0,99 1 1 1

Локальные инварианты 0 0,1 0,23 0,42 0,84 0,95 0,99 1

Из табл. 2 видим, что при действии случайного шума метод частных корреляций имеет несколько более высокую помехозащищенность, чем метод локальных инвариантов. Так, при р1 =2 для частных корреляций вероятность распознавания P=0,82, а соответствующий показатель метода инвариантных локальных признаков равен всего 0,1. Лишь при р1=6 исследуемый метод распознает объекты с высокой вероятностью Р= 0,95.

Для оценки вероятности распознавания при наличии локальных помех производились преобразования смещения с последующим частичным заслонением эталона рамкой, состоящей из полос, яркость которых распределена по равномерному закону в пределах 0-255.

Для локальной помехи соотношение сигнал-шум оценивалось как р 2 = (m _ mi)/mi, где m - общее число точек, mi - число точек локальной помехи.

Пример входного изображения, подвергнутого действию локальной помехи, приведен на рис. 4.

Рис. 4. Входное изображение под действием локальной помехи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 3

р2 0.2 0.25 0.35 0.45 0.55 1

Частные корреляции 0,46 0,72 0,89 0,95 0,98 1

Локальные инварианты 0,87 0,95 0,99 100 1 1

Зависимость вероятности распознавания от уровня локальной помехи представлена в табл. 3.

Здесь видим (в отличие от действия случайных помех) существенное преимущество метода инвариантных локальных признаков по отношению к методу частных корреляций. При локальной помехе с уровнем, равным 0,35, соответствующие вероятности равны 0,89 и 0,99. При дальнейшем увеличении уровня заслонения эффект еще более усиливается. При р2=0,2 вероятности соответственно равны 0,46 и 0,87.

Следует отметить, что обе рассмотренные здесь модификации метода пофрагментной обработки являются эффективными к действию локальных помех. Даже при р 2=1 (что соответствует 50% заслонению) вероятность распознавания в приведенном эксперименте для обоих методов равна 1. А исследуемый метод инвариантных локальных признаков даже при р2 =0,25 (75% -е заслонение) обеспечивает вероятность, равную 0,95.

4. Анализ быстродействия

Быстродействие метода инвариантных локальных признаков в существенной мере определяется числом выделенных (информативных) и проанализированных локальными фильтрами признаков. Например, для изображения эталона (64*64) (см. рис. 1,а) количество таких признаков в эксперименте было равно 35. На входном изображении (см. рис.2) общее число признаков равно 41, что составляет всего 0,004% от общего числа точек изображения (128*85). Такая эффективная фильтрация наиболее информативных точек изображения и является основной причиной значительного преимущества в быстродействии метода локальных инвариантов над методом частных корреляций, работающим на полном множестве точек изображения. Количество вычислений меры сходства в методе частных корреляций составило для данных размеров изображений значение, близкое к (128-64)*(85-64)*3=4032, где 3 - количество эталонов. Фактическое время распознавания для сравниваемых методов составило 4 и 21 секунду.

5. Выводы

Научная новизна предложенного метода локальных инвариантных признаков состоит в построении и обосновании иерархической меры для структурного сопоставления изображений в пространстве признаков, что позволяет существенно повысить эффективность процедур распознавания в условиях фона и неполной информации об анализируемых изображениях объектов.

Практическая значимость работы заключается в повышенном быстродействии метода по сравнению с классическими подходами и устойчивости к локальным помехам, что подтверждается экспериментами на реальных полутоновых изображениях.

Несомненным достоинством рассмотренного метода является автоматическое установление структуры объекта в процессе распознавания, дающее возможность настройки на произвольную форму объекта, а также формирование частичной, оставшейся неискаженной структуры объекта, по которой производится распознавание. Этой интеллектуальной способнос-

72

РИ, 2006, № 1

тью и обеспечивается универсальность применения метода в условиях локальных помех и фона, что для известных методов вызывает затруднения.

Примененный в классическом методе частных корреляций способ определения сходства предусматривает фиксированную структуру множества фрагментов объекта (идентичную эталону) и имеет в результате более простую структуру решающих правил. Этот метод обладает несколько большей устойчивостью к случайным шумам, хотя и уступает в быстродействии и устойчивости к локальным помехам рассмотренному подходу.

Дальнейшие перспективы разрабатываемого метода связаны с построением комбинаций локальных признаков, позволяющих еще в большей степени сократить время распознавания с обеспечением высокой надежности при влиянии шума.

Литература: І.ПутятинЕ.П., АверинС.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320с. 2. Гороховатский В.А. Распознавание изображений в условиях неполной информации. Харьков: ХНУРЭ, 2003. 112 с. 3. Гороховатский В.А., Ересько Ю.Н., Путятин Е.П., Стрельченко В.И. Локализация объектов на изображениях визуальных сцен // Автометрия. Новосибирск. 1990, №6, С. 3-7. 4. Форсайт Д., Понс Ж. Компью-

УДК330.45:330.47

О СОСТОЯНИИ И КОНЦЕПЦИЯХ УПРАВЛЕНИЯ РАЗВИТИЕМ ВЫЧИСЛИТЕЛЬНЫХ СЕТЕЙ И СИСТЕМ ТЕЛЕКОММУНИКАЦИЙ В УКРАИНЕ

КЛИМОВА Е.Ю., ШЕВЧЕНКО С.В._______________

Исследуется современное состояние мирового рынка телекоммуникационных услуг, глобальные тенденции развития систем телекоммуникаций, национальных рынков услуг связи и влияние этих тенденций на отрасль связи в Украине. Предлагаются концептуальные основы построения системы прогнозирования и оценки эволюции вычислительных сетей.

1. Введение

Разработка и создание информационно-телекоммуникационной инфраструктуры является одним из приоритетных направлений в стратегическом развитии Украины, поскольку создание современной динамичной рыночной экономики с механизмом саморегуляции невозможно без надёжной системы телекоммуникаций, которая является важным фактором инвестиционного климата и непременным условием развития бизнеса. Для достижения Украиной мирового телекоммуникационного уровня необходима комплексная реализация ряда задач, связанных как с поставкой и производством систем телеком-муника-ций, так и с их эффективным использованием.

терное зрение. Современный подход: Пер. с англ. М.: Издательский дом «Вильямс», 2004. 928 с. 5. Harris C. Stephens M. A combined corner and edge detector Alvey Vision Conf., 1988. Р. 147-151.6.KoenderinkJ.J. andDoorn A.J. Representation of local geometry in the visual system. Biological Cybernetics, 1987. №55. P. 367-375. 7. Schmid C., Mohr R. Local greyvalue invariants for image retrieve. IEEE Trans.Pattern Analysis and Machine Inteligence,1997, V. 5, №19. P. 530-535. 8. Schmid С., Mohr R.,Bauckhage C. Evalution of interest point detectors. Internation Journal of Computer Vision, 2000. V. 2, № 37. P. 151-172.

Поступила в редколлегию 25.11.2005

Рецензент: д-р техн. наук, проф. Кривуля Г.Ф.

Путятин Евгений Петрович, д-р техн. наук, профессор, зав. каф. информатики ХНУРЭ. Научные интересы: анализ и распознавание изображений в интеллектуальных системах. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419.

Гороховатский Владимир Алексеевич, канд. техн. наук, доцент каф. информатики ХНУРЭ. Научные интересы: методы анализа и распознавания изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419.

Кузьмин Сергей Владимирович, стажер-исследователь каф информатики ХНУРЭ. Научные интересы: методы анализа и распознавания изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-419.

Актуальность работы определяется необходимостью совершенствования теоретических положений по управлению развитием вычислительных и телекоммуникационных сетей, что позволит прогнозировать эволюцию сетей и управлять процессами их развития с минимальными затратами и минимальными возможными рисками, связанными с нестабильными условиями финансирования.

Целью исследования является разработка концепций построения системы прогнозирования и оценки эволюции вычислительных сетей и сетей телекоммуникаций.

Для достижения этой цели необходима реализация следующих задач:

- ретроспективный анализ рынка телекоммуникационных услуг Украины;

- оценка разрыва между Украиной и передовыми странами по степени развития информационных технологий и возможности расширения доступа к мировым информационным ресурсам;

- рассмотрение особенностей тенденций развития телекоммуникаций на глобальном уровне и на уровне отечественного рынка связи, а также влияние этих тенденций на отрасль связи в Украине;

- выделение основных тактических и теоретических задач для достижения Украиной мирового уровня инфотелекоммуникационной инфраструктуры;

- обеспечение стимулирования развития теоретических положений, в том числе по совершенствованию управления развитием вычислительных сетей и сетей телекоммуникаций.

РИ, 2006, № 1

73

i Надоели баннеры? Вы всегда можете отключить рекламу.