РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИИ ПРОСТРАНСТВЕННЫХ ТОЧЕЧНЫХ ОБЪЕКТОВ
Хафизов Д.Г.
Поволжский государственный технологический университет Аннотация
Рассмотрены вопросы распознавания и оценки параметров вращений изображений пространственных точечных объектов на основе применения метода главных компонент. Применение данного метода позволяет получить оценку параметров вращения пространственного точечного объекта при отсутствии информации о нумерации точек в объекте, что существенно упрощает решение задачи распознавания пространственных точечных объектов.
Ключевые слова: пространственный точечный объект, распознавание изображений, гиперкомплексное число, кватернионы, кватернионные сигналы, вращающий кватернион,
параметры вращения, матрица вращений.
Введение
Одним из основных факторов, обеспечивающих успешное решение задачи распознавания изображений, расположенных в пространстве точечных объектов, является наличие их адекватных математических моделей и применение такого математического аппарата, который позволяет получить требуемые результаты. Одним из подходов к обработке изображений трёхмерных точечных объектов является подход, основанный на применении теории кватернионного анализа [1], что, в свою очередь, было следствием развития методов теории комплекснозначного контурного анализа [2], применяемого для обработки плоских изображений. В этих работах применён так называемый сигнальных подход, когда изображение отождествляется с сигналом и все алгоритмы обработки строятся на основе методов единой теории обработки дискретных сигналов. С этих позиций в работах [1, 3] была обоснована целесообразность привлечения алгебры кватернионов для обработки точечных пространственных изображений. При этом были введены такие понятия, как кватернионный сигнал (КС) и мера схожести кватернионных сигналов. Т акже рассмотрены вопросы согласованной фильтрации, спектрального и корреляционного анализа КС.
Вместе с тем применение аппарата теории кватернионов для анализа изображений пространственных точечных объектов (ПТО) выявило неинвариантность меры схожести кватернионных сигналов к операции вращения точечного объекта в пространстве, что усложнило решение задачи распознавания подобных изображений.
В данной работе представлен подход к распознаванию изображений пространственных точечных объектов с неизвестными масштабом, параметрами вращений и порядком нумерации точек. Сопутствующими являются задача оценки параметров вращения и задача идентификации точечных отметок, которые решаются относительно эталонных ПТО.
Постановка задачи формулируется следующим образом. Имеется алфавит изображений эталонных ПТО
” = { И , где ^ (П) = ^,1 ^ ^,2 (п) ^,3 (п)) - ко-
точки, заданных кватернионными
Г
ординаты п-й сигналами
=К (п )}0
Ч/ (п) = 41,1 (п) > + 4/,2 (п ) \ + 41,з (п ) к ,
где / = 0,1,...,L -1, L - объём алфавита; и наблюдаемый ПТО Е(с) = {^(с) (п)}0-1, заданный кватернионным сигналом О(с) = {ч (с) (т)}-1, полученный на основе одного из эталонов путём масштабирования на масштабный коэффициент ц поворота вокруг произвольной оси, задаваемой векторным кватернионом г = г11 + г2] + г3к на произвольный угол 2у . Кроме то-
но, кватернионов в О(с) отличается от исходного. Необходимо вынести обоснованное решение о том, что О(с) соответствует эталону с номером V, а также оценить параметры вращения.
Таким образом, КС О(с) формируется следующим образом:
О(с) =цЬОгЬ-1, 0 < V < L , тождественное равенство здесь означает, что в О(с) изменён порядок нумерации кватернионов в сигнале.
Выравнивание ПТО и оценка параметров вращений
Для исключения влияния пространственного положения и масштабных размеров необходимо выполнить выравнивание изображений всех эталонных ПТО. Выполним центрирование и нормировку, тогда компоненты кватернионов, входящих в состав КС, задающих соответствующие эталонные ПТО, могут быть вычислены по формуле:
3
4і,
( П ) = -
х = 1,2,3.
¿-1 3
Ив,
І У=0 і=1
( і )-^і і )
Для выравнивания по пространственному положению применим метод главных компонент [4].
і=1
^=К(п )}Г'>
«1,1 (п ) = ()„,„ 4,,1 (п) + ()1,0 4,,2 (п) + ()2,„ 4,,з (п );
«1,1 (п) = (^ )„,14, ,1 (п )+(^ )и4, ,2 (п )+(^, )2,14, ,з (п);
4,2 (п ) = ()„,2 4,,1 (п ) + (™, )1>2 4,,2 (п) + ()2,2 4,,3 (п) •
Здесь (w, )„, (w, )1, (w, )2 - собственные вектора
ковариационных матриц вычисленных по координатам каждого из L нормированных и центрированных ПТО О,.
Аналогичные операции выполняются и с сигнальным КС , что, как было показано в [3], позволяет нам получить оценку параметров вращений по матрицам Т,, составленным из соответствующих собственных векторов с учётом возможных неоднозначностей оценок [6], т.е.
2ф/ = arccos
Р/д =
№ )0,0 + ( )1 2
2
V
Ґ2,1 . р ~ , \ > р/.2 Ґ2,0
1 2
Р/,3 =-
ґ — Ґ
*0,1 *1,С
2sin (2ф) ’ 1 ’2 2sin (2ф) ’ 1 ’3 2sin (2ф)
(1)
(2)
Применив данные параметры вращений к сигнальному КС, получим набор КС, оптимально совмещённых с каждым из эталонов по критерию минимума расстояния или максимума скального произведения.
Устранение неоднозначности
Разложение по методу главных компонент не является единственным, так как возможно изменение знаков у компонент собственных векторов ковариационной матрицы, что приводит к изменению направлений главных компонент на противоположные [6]. Это свойство метода главных компонент называется вращательной неопределённостью и может привести к неправильной оценке параметров вращений и, соответственно, к неправильному совмещению изображений ПТО. Чтобы исключить подобные ошибки, был предложен следующий метод устранения данной неоднозначности.
Введём в рассмотрение так называемые поправочные матрицы вращений. Так как речь идёт о трёхмерном пространстве и у каждой из осей возможна неоднозначность только в выборе положительного или отрицательного направления, то таких матриц будет 23 = 8:
\ 1 mod2
Т =
(-1)”
(-1)'
0
(/div2) mod2 0
(-1)
0
0
(/div4) mod2
(3)
і = 0,1,..., 7.
Тогда оценка параметров вращений может быть записана в виде 8 матриц следующего вида Ті- = Т-1 Ті'Т (с) , только одна из которых является матри-
цей вращений, соответствующей истинной оценке искомых параметров. Чтобы вынести обоснованное решение относительно номера искомой матрицы, необходимо применить данные операторы вращения к ^ .
<3(і)={ч(т )}^ =
<?1(і) (т )Л 1 ^-1 ?!с) (т )^ 5-
<?2 ’ (т ) > =■ т. «2с) (т) >
^^ (т )у 0 ч «3с) (т )у 0
(4)
а также выполнить идентификацию точечных отметок и определить, для какого из О(,), 1 = „,1,...,7 нормированное скалярное произведение совмещённых и эталонного КС достигает своего максимума:
тах
Г( о(і), о)
_ \ ' п
= тах
X Ч(і) (п) Ч* (п)
2 И-1,
X ч(і)(п) \Х|ч*(п)|
і = 0,1,..., 7 .
Здесь ^ соответствует с переупорядоченными отсчётами [5].
Тогда в качестве матрицы для вычисления параметров вращений (оси вращения и угла) по формулам (1) и (2) может быть принята матрица
(5)
Т = Т-0 Т,ах V
где 1тах - это номер поправочной матрицы, при которой достигнут максимум скалярного произведения как меры схожести КС [1, 2], описывающих изображения ПТО. Рассчитанная мера схожести затем используется при решении задачи распознавания.
Задача идентификации точечных отметок
Каждая точка ПТО, подвергающаяся воздействию координатного шума, представляющего собой независимую трёхмерную центрированную случайную величину, подчиняющуюся нормальному закону распределения, образует в пространстве геометрическое место точек или сферическую область D. Размер данной области определяется вероятностью попадания точки в область р1{д1-а, R(п) = q(п)+ й(п), где q(п)
- п -я точка ПТО, а п) - шумовой вектор длиной Х = (п)| . Найдём совместную вероятность распределения координат зашумлённого вектора W3 (|^|,у,ф) в сферической системе координат.
Согласно [8], если известны совместная плотность вероятности wn (х1,...,хп) случайных величин х1,...,хп и якобиан преобразования от случайных величин х1,...,хп к случайным величинам у1,...,уп
п=0
2
+
2
дх1 дх1
д( х1-. ., хп ) дУі . дУп
д( У1-. .. Уп ) дхп дУ: ’ дхп ' дуп
то распределение преобразованных случайных величин равно
О
К (У 2 ) =
д( *1* — хпк,
,(Х1,...> Хп ) =
д( У1,..., Уп)
где хк - к -я ветвь обратного преобразования (/ = 1,..., п).
Тогда для нашего случая будем иметь
/, , ч \я\2sin(ш)
к(|*1-ш.ф)=' 3„ :;2':
а (2п)
(6)
(8Іп(ш)с08(ф)-«] ) +(8Іп(ш)8Іп(ф)-«2 ) +(сО§(ш)-«3 )
ХЄ
Найдём одномерное распределение модуля шумового вектора подчиняющееся трёхмерному нормальному распределению со среднеквадратическим отклонением а и нулевым математическим ожиданием:
т.е.
к (и)=11к (ш, ф, |с|) йф лш=
1 (|с|)=4Л - £
v ' а V п
и
(7)
Последнее выражение называется распределением Максвелла [8] или сферическим распределением (рассеиванием).
Известно, что если случайная величина X задана плотностью распределения f (х), то вероятность того, что X примет значение, принадлежащее интервалу („, р), такова:
Р(0 <X <Р) = |/(х)Лх.
(8)
Так как модуль шумового вектора описывается распределением Максвелла (7), то выражение (8) примет вид
л л ы2 гг _ Н!
р („ <н<л)=|»; (|?|) ^ьш-е
„ „ ° V я
0 0 Преобразуя последнее выражение, получим
Р (0 <|С|<Х) = 2
(9)
л
— 1>-12 I I
/ЛЛ 1 а _^~ п где ф| — I = —¡= Г е 2а^ —. Пользуясь функцией Ла-
^ л/2п „ ст
1 х г2
пласа Ф(х) = .— Г е 2dz и зная величины Л и а ,
v ' {
можно определить величину вероятности Р („ <|^<Л). Так как для вычисления функции
Ф( х) используют специальные таблицы (неопределённый интеграл в этой функции не может быть выражен через элементарные функции и вычисляется с применением численных методов), то, соответственно, для функции
Ф( х)-;
-\/2л
(10)
тоже можно составить подобную таблицу.
Величина Л выбирается в соответствии с заданным значением вероятности, с которой зашумлённая точка должна находиться в пределах области D• Для определения величины Л при заданном
Р („ <|(^|<Л) = р1П1а и известной величине СКО а
необходимо:
1) определить величину х, при которой W (х) близко к величине Р („ < |^| < Л);
2) умножить найденную величину х на а .
Используя формулу для расстояния между точками исходного и совмещённого зашумлённого объектов и зная величину Л, можно рассчитать матрицу F:
3
Б1 = {/ [т,п]} = X2 - X (Рі (п) - Ч, (т))
(11)
где т = 0,1,..., 5 -1 - номер точки эталона,
п = 0,1,...,5-1 - номер точки (зашумлённой) сигнального КС после выполнения совмещения.
Результаты вычислений по формуле (11) можно свести в матрицу
( /(0,0) /(0,1) ... /(0,5-1) 1
/ (1,0) / (1.1) ... / (1,5 -1)
Б =
/ (к - 1,0) / (к - 1,1) ... / (к - 1, 5 - 1)
.(12)
Из всех элементов матрицы работаем только с теми, которые удовлетворяют условию / (т, п) > 0, т.е.
рассматриваем элементы, попадающие в стробы (области D).
Затем находим максимальный элемент во всей матрице Б, запоминаем номер строки и столбца - т1 и п1, после этого вычёркиваем из матрицы столбец с номером п1 и строку с номером т1 и т.д. Когда будут вычеркнуты все элементы матрицы либо когда останутся только отрицательные элементы, т.е. элементы,
1
2а
2а
2
і=1
0
не попадающие ни в один из стробов, процесс идентификации закончен. В итоге мы получаем два набора чисел, содержащих номера векторов эталонного и сигнального КС, сопоставленных друг с другом
N = {n},
м = {
m.
причём 5 - число успешно идентифицированных отметок.
Заметим, что изначально точки, входящие в состав сигнального ПТО, могут быть пронумерованы в произвольном порядке.
Решение задачи распознавания
Решение задачи идентификации точечных отметок позволяет применить для расчёта меры схожести между изображениями пространственных точечных объектов величину скалярного произведения кватер-нионных сигналов. Данное обстоятельство позволяет реализовать устройство распознавания изображений пространственных точечных объектов (рис. 2).
Рис. 1. Устройство распознавания ПГТО с неизвестным углом поворота и неизвестной нумерацией точек в объекте
Здесь введены следующие обозначения: УС - устройство совмещения, ИТО - идентификатор точечных отметок, ФСП - формирователь скалярного произведения, РУ - решающее устройство.
Кроме того, при известном распределении вероятностей координатного шума возможно применение байесовского алгоритма. Каждой точке ПГТО по величине отклонения от соответствующей точки эталона можно поставить в соответствие условную вероятность Р^('т“)(п)/ Ql). В результате можно сформировать матрицу Р условных вероятностей принадлежности точек точечного объекта классам Ql, I = 0,1,..., L -1:
P = {P (q('"“)( n )/ Q, )[
=0..У-1,/=0..:L-1
(13)
При наличии матрицы P в качестве меры схожести ПГТО Q (,max) и Q/ удобно использовать значения апостериорной вероятности P (Q, / Q ('max)) принадлежности ПГТО Q ('m“) к /-му классу:
Q('”“^ е Q/ при P(q/ /Q(,max^——max . (14)
Данная вероятность пошагово определяется с помощью формулы Байеса. Апостериорная вероятность
s
s
принадлежности к 1-му классу, найденная по его первым 51 точкам, равна
Р(Ql / ч(ітх)(5')) =
= Р(д(і“>(5')/Ql)• P(Ql /д(іт">(5'-1))
Ь-1 •
X Р( Ч(і-] (5') / Q,) • P(Q, / ц(і-] (5'-1)) і=0
Здесь Р^ /q('т-х))(5'-1)) - апостериорная вероятность принадлежности ПГТО к 1-му классу, набранная по (5' -1) его первым точкам, принимаемая в качестве априорной вероятности для 5-го шага.
Моделирование работы алгоритма В качестве алфавита эталонных пространственных точечных объектов были сгенерированы трёхмерные точечные сцены геометрических объектов (рис. 2): сфера, полусфера, параллелепипед, конус, цилиндр (количество точек в каждой сцене - 1000).
Рис. 2. Примеры сцен с изображениями пространственных точечных объектов: сфера, полусфера, параллелепипед, конус, цилиндр (количество точек N = 1000)
На данных сценах была выполнена апробация предложенных алгоритмов и рассчитаны характеристики оценки точности определения параметров вращения в виде зависимости ошибки оценки угла поворота от отношения сигнал/шум при неизвестной нумерации точечных отметок в объекте (рис. 3); и оценки величины меры схожести между эталонными и совмещённым объектом от отношения сигнал/шум (рис. 4).
|2ср-2ф|
Рис. 3. Зависимость ошибки оценки угла поворота от отношения сигнал /шум
По результатам анализа полученных характеристик можно отметить, что предложенные алгоритмы работоспособны и позволяют решать задачу оценки параметров вращений изображений пространственных точечных объектов при неизвестной нумерации точечных объектов, а также задачу распознавания.
(Q('m“), Qдпогт
Рис. 4. Зависимость величины меры схожести между эталонным и совмещённым объектом от отношения сигнал/шум, при I = 0
Заключение
Использование метода главных компонент, основанного на свойствах характеристических векторов ковариационной матрицы, рассчитанной по координатам точек пространственного точечного объекта, позволяет получить оценку параметров вращений. Достоинством является то, что при этом порядок следования точек в исходном и повёрнутом объектах может не совпадать.
Приведён метод устранения неоднозначности, возникающей при оценке параметров вращений.
Представлен алгоритм идентификации (сопоставления) точек совмещённого (зашумлённого) и исходного (эталонного) пространственных точечных объектов, позволяющий применять для решения задачи распознавания таких изображений методы теории дискретного кватернионного анализа и, в частности, ввести меру схожести изображений ПТО, описанных с помощью кватернионных сигналов в виде скалярного произведения в гиперкомплексном пространстве.
Предложен метод распознавания изображений пространственных точечных объектов на основе последовательной стратегии Байеса.
Выполнен расчёт характеристик в виде зависимости ошибки оценки угла поворота от отношения сигнал/шум при неизвестной нумерации точечных отме-
ток в объекте; и оценки величины меры схожести
между эталонными и совмещённым объектом от отношения сигнал/шум.
Литература
1. Комплекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов / под ред. Я.А. Фурмана. - М.: ФИЗМАТЛИТ, 2004. - 456 с.
2. Введение в контурный анализ и его приложения к обработке изображений и сигналов / под ред. Я.А. Фурмана.
- 2-е изд., испр. - М.: ФИЗМАТЛИТ, 2003. - 592 с.
3. Хафизов, Д.Г. Определение параметров вращения пространственного группового точечного объекта при неизвестной нумерации точечных отметок / Д.Г. Хафизов // Компьютерная оптика. - 2011. - Т. 35, № 1. - С. 117-122.
4. Хафизов, Д.Г. Метод получения инвариантного к параметрам вращения изображения пространственного группового точечного объекта / Д.Г. Хафизов //Автометрия.
- 2011. - Т. 47, № 6. - С. 28-33.
5. Хафизов, Д.Г. Упорядочение точек пространственного изображения группового точечного объекта на базе амплитудно-фазового представления / Д.Г. Хафизов // Автометрия. - 2007. - Т. 43, № 1. - С. 10-23.
6. Хафизов, Д.Г. Метод устранения неоднозначности при оценке параметров вращений изображений пространственных точечных объектов / Д.Г. Хафизов // Вестник компьютерных информационных технологий. - 2012. -№ 7. - С. 11-15
7. Дронов, С.В. Многомерный статистический анализ: учебное пособие / С.В. Дронов. - Барнаул: Изд-во Алт. гос. ун-та, 2003. - 213 с.
8. Корн, Г. Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн. - М.: Наука, 1968. - 720 с.
References
1. Complex and hypercomplex systems at tasks of multidimensional signal processing / edited by Ya.A. Furman. -Moscow: “Fizmatlit” Publisher, 2004. - 456 p. - (In Russian).
2. Contour Analysis introduction and its image and signal processing application / edited by Ya.A. Furman. - Secondary Edition - Moscow: “Fizmatlit” Publisher, 2003. - 592 p. -(In Russian).
3. Khafizov, D.G. Definition of rotation parameters of spatial group point object at unknown numbering of dot marks / D.G. Khafizov//Computer Optics. - 2011. - V. 35, N 1. -P. 117-122. - (In Russian).
4. Khafizov, D.G. Method of obtaining rotation-invariant images of spatial group point objects / D.G. Khafizov // Av-tometriya. - 2011. - V. 47, N 6. - P. 28-33. - (In Russian).
5. Khafizov, D.G. Sequencing points of the spatial image of a group point object based on amplitude-phase representation / D.G. Khafizov // Avtometriya. - 2007. - V. 43, N 1. -P. 10-23. - (In Russian).
6. Khafizov, D.G. Solution to the problem of ambiguity at combination of spatial point images by using principal component analysis / D.G. Khafizov // Journal of computer information technologies. - 2012. - N7. - P. 11-15. - (In Russian).
7. Dronov, S.V. The multidimensional statistical analysis / S.V. Dronov. - Barnaul: Publishing house of the Altay state university, 2003. - 213 p. - (In Russian).
8. Korn, G. The directory on the mathematician for scientist and engineers / G. Korn, T. Korn. - Moscow: “Nauka” Publisher, 1968. - 720 p. - (In Russian).
THE RECOGNITION OF SPATIAL POINT OBJECT IMAGES
D.G. Khafizov Volga State University of Technology
Abstract
Questions of image recognition and estimation of rotation parameters of spatial point objects images on the basis of the main things method are considered. The application of the given method allows to receive an estimation of rotation parameters of spatial point object at the absence of the information on numbering of points in object that essentially simplifies the decision of problems of recognition of spatial points objects.
Key words: spatial point object, image recognition, hypercomplex number, quaternion, quaternion signals, rotation quaternion, rotational variables, rotational matrix.
Сведения об авторе
Хафизов Динар Гафиятуллович, 1978 года рождения, в 2001 окончил Марийский государственный технический университет по специальности «Вычислительные машины, комплексы, системы и сети». Кандидат технических наук (2004), доцент кафедры радиотехнических и медико-биологических систем Поволжского государственного технологического университета (г. Йошкар-Ола). Область научных интересов: обработка изображений и распознавание образов. Публикации: 70 научных трудов.
E-mail: HafizovDG@, volgatech.net .
Dinar Gafiyatullovich Khafizov, (b. 1978), graduated (2001) from Mari State Technical University (MarSTU), majoring in “Computer System, Complexes, Systems and Networks”. He received his Candidate of Science in engineering (2004). He is the associate professor of radio engineering and medical and biologic systems department at Volga State University of Technology (Yoshkar-Ola). Research interests: image processing and pattern recognition. Author of 70 scientific papers.
Поступила в редакцию 25 февраля 2013г.
Дизайн: Я.Е. Тахтаров. Оформление и верстка: М.А. Вахе, С.В. Смагин и Я.Е. Тахтаров.
Подписано в печать 15.06.2013 г. Усл. печ. л. 16,17.
Отпечатано в типографии ООО «Предприятие «Новая техника».
Заказ № 11/2. Тираж 312 экз. Печать офсетная. Формат 62х84 1/8.