Научная статья на тему 'Image invariants to the effect of turns and stretching'

Image invariants to the effect of turns and stretching Текст научной статьи по специальности «Математика»

CC BY
63
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Image invariants to the effect of turns and stretching»

128 Вестник СамГУ — Естественнонаучная серия. 2007. №9/1(59).

УДК 512.761.5

ИНВАРИАНТЫ ИЗОБРАЖЕНИЯ ОТНОСИТЕЛЬНО ПОВОРОТОВ И РАСТЯЖЕНИЙ

© 2007 О.В. Самарина,1 В.В. Славский2

В современных методах обработки цифровых изображений, например при вейвлет анализе, используют кратномасштабное представление изображения. Поэтому желательно иметь такие характеристики изображения, которые не зависели бы от масштаба, ориентации, качества снимка. Эти характеристики можно использовать для определения характерных (особых) точек изображения.

В данной работе определяются и исследуются четыре дифференциальных инварианта точки изображения относительно изменения масштаба и поворота. Аналогичные исследования проводились ранее в работах [1], [2] и [3], там же можно найти важные приложения для подобных инвариантов.

Введение

Будем рассматривать одноканальное изображение. В математической постановке это означает, что задана неотрицательная функция в некоторой области на плоскости. Будем предполагать, что функция дважды непрерывно дифференцируема, тогда справедливо разложение Тейлора второго порядка с центром в произвольной точке области. Можно считать, не ограничивая общности, что данная точка — начало координат на плоскости, тогда

f(x, y) = a + pix + Р2У + 2 (¿11 x2 + 2b 12xy + ¿22/) + <? (x2 + y2),

где

a = f (0,0), pi = df (0,0), p2 = dy (0,0),

d2 f d2 f d2 f bii = tt(°> 0), b22 = ^(0,0), bi2 = 1xr (0,0).

dx2 dy2 dxdy

Предположим, что снимок подвергся преобразованию

0 (к, р, ф) : f (x, y) ek f (ep (x С08(Ф) - y 8ш(ф)), ep (x 8Ш(ф) + y С08(Ф))) ,

1 Самарина Ольга Владимировна (batgauer-olga@mail.ru), Югорский государственный университет, 628011, Россия, г.Ханты-Мансийск, ул.Студенческая 7, кор. 7, 107.

2Славский Виктор Владимирович (slavsky@uriit.ru), кафедра высшей математики Югорского государсвенного университета, 628011, Россия, г.Ханты-Мансийск, ул.Мира, 151, ЮНИ-ИИТ.

т.е. повороту, растяжению. Множитель еК можно интерпретировать как фактор поглощения среды, действующий в окрестности исследуемой точки. Нетрудно видеть, что преобразования 0 (К, р, ф) удовлетворяют тождеству

0 (К1 , р1 , ФО ° 0 (К2> р2, ф) = 0 (К1 + К2, р1 + р2, ф1 + Ф2)

и образуют трехмерную коммутативную группу Ли О.

Рассматривая действие группы О на пространстве /2(Я2,0) 2-струй функций (тейлоровских разложений 2 порядка) получим, что группа О действует в пространстве параметров I = {а,р1, р2, Ь11, Ь22, Ь12} € Я6.

Определение 1. Будем называть функцию I (а, р1, р2, Ьц, Ь22, Ьп) нетождественно равную константе инвариантом 2-го порядка, если под действием преобразований группы О она не меняется.

Пусть для произвольной функции параметров Е (а, р1, р2, Ьц, Ь22, Ьп) определены инфинитезимальные дифференциальные операторы ХКЕ, ХрЕ, ХфЕ;

А

¿К

А ¿р'

А.

¿ф

Е (Р (0) = Хк Е

К=0,р=0,ф=0

е (р «) = Хр Е

К=0,р=0,ф=0

Е (Р (0) = Хф Е

К=0,р=0,ф=0

1. Случай непрерывного изображения

Будем считать, что исходное физическое изображение представляет собой дважды непререрывно дифференцируемую числовую функцию /(л, у) со значениями в диапазане [0,1].

Теорема 1. Дифференциальные операторы ХКЕ, ХрЕ, ХфЕ равны

дЕ дЕ дЕ дЕ дЕ дЕ

Хк Е = — а + — р1 + — р2 + -777— Ь11 + -777— Ь22 + -777— Ь12,

да др1 д р2 дЬц дЬ22 дЬп

дЕ дЕ дЕ дЕ дЕ дЕ

ХрЕ = ~я~ 0 + Та— р1 + 7з— р2 + Ий— 2Ь11 + Ий— 22 + -777— 2Ь^

да др1 д р2 дЬп дЬ22 дЬп

дЕ дЕ дЕ дЕ дЕ дЕ

ХфЕ = — 0 +— р2 - — р1 + -777— 2Ь12 - -777— 2Ь12 + -777— (-Ьц + Ь22) .

да др1 д р2 дЬц дЬ22 дЬп

(1.1)

Доказательство. Действие группы О на параметр ? € Я6 определяется формулами I ^ Р(0, т.е.

р1

р2

Ь11

Ь12

Ь22

—¥

(р1 С08(ф) + р2 ВШ(ф)) еК+р - (р1 8Ш(ф) - р2 С08(ф)) еК+р

е2р+К (Ьц С082 (ф) + Ь12 (ф) С08 (ф - Ь22 С082 (ф + ^2) ,

-е2р+К (Ь11 8Ш (ф С08 (ф + Ь12 - 2Ь12 С082 (ф - Ь22 С08 (ф 8т (ф) -е2р+К (-Ь11 + Ь11 С082 (ф) + 2Ь12 8Ш (ф) С08 (ф) - Ь22 С082 (ф))

Применив данное преобразование и проведя необходимые вычисления при указанных начальных условиях, получим искомые выражения (1.1) для значения дифференциальных операторов (1).

Замечание 1. Непосредственно проверяется, что следующие функции являются инвариантами:

і2 -

їз -

P? + fl

(¿22 + ¿ll) a’ 2

b 11 Pf + 2bi2 Pl P2 + ¿22 p2

(¿22 + ¿11 + 2b12) a -2b 12 Pl P2 + ¿11P2 + ¿22 ff

(¿;

22 + ¿21 +

^12)*

I4 - 2

-¿22 + ¿11 ¿22 ¿22 + ¿11 + 2 ¿12

Обозначим через

J2 - - -

2 I1

(¿22 + ¿11) (¿11 p\ + 2^2P1P2 + ¿22p2)

(¿22 + ¿ll + + P2) ’

І3 (¿22 + ¿11) (¿11РІ - 2Ьі2Р1Р2 + ¿22Р?)

3 11 (¿22 + ¿?1 + 2Ь?2)(Р2 + Р2)

Замечание 2. Инвариант І4 выражается через инварианты І1, І2, І3, /2, /3 следующим образом:

І2 + І3 - І1

І4 - ----“----- - /2 + /3 - 1 (І-2)

І1

Теорема 2. Для инвариантов /2, /3 справедлива точная оценка:

(1.3)

Доказательство. Пусть

-611 - ¿11 + ¿22 — 2bl2b22 — 2bll ¿12 + 2¿

- ¿11 — ¿:

22

2

22’

12

612

622 - ¿11 + ¿22 + ^¿^¿22 + 2^12 + 2¿22.

Выражение (1.3) представимо в виде:

f 1 \2 І 1 \2 S1 ■ S 2

/2 — 2 + J — 2 -^Т~ ’

где

ВП pl + 2ßU pi P2 + #22 p2 (¿11 +¿22 + Pi + P2)’

В22P2 - 2Bi2PiP2 + В11 p2

(bii + ¿22 + 2b12)(p1 + P2) '

Заметим, что S1 + S2 = 2. Введем обозначения

¿11 ¿12 ¿21 ¿22

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

S1=

S2=

6=

611

621

612

622

¿=

Если К1, К2 — собственные числа симметричной матрицы ||Ьу ||;,/=1,2, то 2К2, 2К2 — собственные числа симметричной матрицы ||В;у||;,у=1,2. Следовательно, 51, 52 —неотрицательные и в силу известного неравенства о том, что среднее геометрическое

Рис. 1. Область значений /2, /з

меньше или равно среднему арифметическому получаем: 51 ■ 52 ^ 1, что и требовалось доказать.

Следствие 1. В силу формул (1.2) и (1.3) получаем область значений для инвариантов /2, /э представленную на рисунке 1.

Следствие 2. Для инвариантов /2, /э и /4 = /2 + /э - 1 справедливы точные оценки:

2. Инварианты дискретного изображения

Определим дискретный вариант инвариантов /1, /2, /3, /4. Обозначим через Дj значения функции f (х, у) в узлах прямоугольной сетки с шагом сетки Й1 и Й2 по горизонтали и вертикали соответственно.

0---0

<2,2)

{3,2}

к,

Рис. 2. Прямоугольная сетка

Возьмем тейлоровское разложение второго порядка функции f (х, у) с центром в точке (2,2). Найдем значение данного разложения в узлах сетки согласно рисунку

2 и приравняем их данным Ду. В результате получим систему из 9 уравнений на 6 неизвестных коэффициентов тейлоровского разложения. В матричной форме ее

можно записать в виде:

Л ■ X = ¥,

где X столбец из неизвестных коэффициентов а, Р1, Р2, ¿11, ¿12, ¿22; Р — столбец значений функции в узлах /2,2, /1,2, /2,1, /2,3, /3,2, /1,1, /1,з, /з.з, /3,1; матрица Л равна:

A =

' 1 0 0 0 0 0

-h1 0 h1 2 0 0

0 —h2 0 h2 2 0

0 h2 0 h2 2 0

hi 0 h1 2 0 0

-h1 -h2 h1 2 h22 2 h1 h2

-h1 h2 h1 2 h22 2 —h1h2

h1 h2 h1 2 h22 2 h1 h2

h1 -h2 h1 0 О —h1h2

Решая эту систему методом наименьших квадратов получим

X = A-1 ■ F,

A =

(2.1)

A а и р т а м я а н т а р vn 1 равна:

5 2 2 2 2 1 1 1 1

9 9 9 9 9 — 9 — 9 — 9 — 9

0 1 0 0 1 1 1 1 1

6h1 6h 1 6h1 6h1 6h1 6h1

0 0 1 1 0 1 1 1 1

6h2 6h2 6h2 6h2 6h2 6h2

2 1 2 2 1 1 1 1 1

3Й2 2 3Й2 2 ph 1 m ^ 1 ph 31 1 3hf 2 3hf 1 3hf 1 3hf 1 3hf 1

3hf 3hf 3h2 3h2 3h| 2 3 2 3 3hf 3h|

0 0 0 0 0 1 1 1 1

4h1h2 4h1h2 4h1h2 4h1h2

Теорема 3. Для квадратичной функции f(x, у) формулы (2.1) дают точные значения коэффициентов тейлоровского разложения 2 порядка с центром в данной точке.

Доказательство. Проверяется непосредственно.

Следствие. Для квадратичной функции f(x,у) формулы (2.1) позволяют вычислить точные значения инвариантов.

Замечание 3. В общем случае это решение даст приближение коэффициентов тейлоровского разложения. Тем более это справедливо для инвариантов.

Замечание 4. В процессе реальной обработки изображения используется дискретизация (квантование), следствием которой является возникновение погрешностей при вычислении тейлоровского разложения и инвариантов.

В следующих разделах статьи эти эффекты разбираются более подробно.

2.1. Квантование изображения

На этапе передачи изображения по каналу связи, оно неизбежно подвергается дискретизатиции. В силу технических ограничений при этом возникает прямоугольная решетка точек изображения. Рассмотрим этот важный этап обработки изображения чуть подробнее. Память компьютера способна хранить только дискретные числа. Поэтому непрерывная величина должна быть подвергнута преоб-

дискретизации с шагом А.

д

0 1 1 1 1 1 1

Рис. 3. Дискретизация непрерывной величины c шагом А

Операцию дискретизации случайной непрерывной величины по уровням часто называют квантованием. Число уровней квантования равно

В практических задачах обработки изображения величина квантования варьируется в широких пределах от K = 2 (’’бинарные” (черно-белые) изображения) до K = 216 (true color — практически непрерывные значения яркости). Наиболее часто выбираются K = 28, при этом пиксел изображения кодируется одним байтом информации. Из всего вышеуказанного делаем вывод, что пикселы, хранящиеся в памяти компьютера, представляют собой результат дискретизации исходного непрерывного изображения по аргументам и по уровням.

1 /28

1/210

1/29

Рис. 4. Величины К и А

При практической реализации данного алгоритма возникают проблемы, связанные с эффектом квантования изображения. Будем предполагать, что выбрано число уровней квантования равное К = 28 и шаг квантования А = ^. Для частичной

нейтрализации этого эффекта, при вычислении X, использован следующий метод. К значениям в узлах сетки прибавляются сгенерированные случайным образом

значения (флуктуации) равные ± (см. рис. 4). Далее вычисляются производные и находятся медианные значения (т.е. проводится робастная фильтрация) для числителя и знаменателя инвариантов отдельно.

Теорема 4. Для функции /(л,у) и для флуктуаций 5 = Нб^Ну^ з, в силу линейности, формулы (2.1) дают следующие значения коэффициентов тейлоровского разложения:

X = (а, р\, р2, ¿ц, ¿12, ¿22) + А-15, где компоненты (А-15); вектора строки А-15 равны:

(А 15)1 = 9 (-51,1 + 251,2 - 51,з + 252,1 + 552,2 + 252,з - 5з,1 + 25з,2 - 5з,з),

-51,1 + 51,з - 52,1 + 52,з - 5з,1 + 5з,з

6Н1

-51,1 - 51,2 - 51 ,з + 5з,1 + 5з,2 + 5з,з

(А-15)2

(А-15)з ,

6Й2

(А 15)4 = (5!,! - 251,2 + 51,з + 52,1 - 252,2 + 52,з + 5з,1 - 25з,2 + 5з,з) ,

(А 15)5 = (51,1 + 51,2 + 51,з - 2^2,1 - 2^2,2 - 252,з + 5з,1 + 5з,2 + 5з,з) ,

(А-15)б

зт2 51,1 - 51,з - 5з,1 + 5з,; 4Т1Т2

Следствие. При условии, что 5ilj независимы и распределены по нормальному закону N(0, о), для компонентов вектора X получаем:

**4,¡#), **^,ь^Г-), Xз *^

о

X4 € N

и

¿11,

2

т21

, * € N ^ ¿12,2Т0Т1 • X6€ N

¿22, ■

т2

2

Как следствие этого, возникает ограничение на значения ¡1, ¡2 - они не могут быть малыми.

2.2. Оценки погрешностей тейлоровского разложения

Рассмотрим тейлоровское разложение 3-его порядка для произвольной функции /(л, у) с центром в данной точке

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/(л, у) = а + р1 л + р2у + 2 (¿11 л2 + 2¿l2лу + ¿22У2) +

+ 6 (¿111 лз + ^¿112л2у + 3¿122лу2 + ¿222Уз) + О ((л2 + у2)з/2) .

Теорема 5. Для функции /(л, у) порядка т формулы (2.1) дают следующие значения коэффициентов тейлоровского разложения:

X = (а, р1, р2, ¿11, ¿12, ¿22) + ез + ■ ■ ■ + £т,

где

ез =

Є4 =

6 (б, Ь(30)А, + 2Ь(12)Н12Ь(2,1)А? + ¿(0'3)А2,0,0,0),

6

1

12

4Ь(2,2) А2А2

- 3 1 2, 0,0, й(4-0)а2 + 4Й(2-2)А2, 4й(2-2)а2 + ¿(0-4) а2,

2 (¿(3-1)А2 + ¿(1'3)А2) .

(2.2)

(2.3)

Остальные слагаемые имеют порядок малости ^ 4.

Доказательство. Проверка формул (2.2), (2.3) была проведена при помощи пакета МаШешайса.

Следствие. В общем случае погрешность имеет порядок С(А2 + А|), где константа С зависит лишь от третьей и четвертой производной.

3. Экспериментальная часть

Было рассмотрено три тематических типа изображений: космические снимки, фотографии естественного и искусственного происхождений (рис. 5а). В результате проведенных экспериментов были выбраны инварианты —, /2, /3, как наи-

І1

более устойчивые с вычислительной точки зрения. Гистограммы распределения значений инвариантов —, /2, /3 для тестовых изображений приведены на рис. 5.

Л 1

Матрица корреляции величин —, /2, /3 для изображения ІевИ

І1

С1 =

1.0000 0.0009 0.0005

0.0009 1.0000 -0.0291

0.0005 -0.0291 1.0000

1

Матрица корреляции величин —, /2, /3 для изображения 1ез12:

І1

С2 =

1.0000 0.0036 0.0026 0.0036 1.0000 0.0649 0.0026 0.0649 1.0000

1

Матрица корреляции величин —, /2, /3 для изображения ІЄ8І3:

І1

С3 =

1.0000 0.1808 -0.2920

0.1808 1.0000 0.0191

-0.2920 0.0191 1.0000

Заключение

На основании проведенных экспериментов можно сделать вывод о том, что рассмотренные в данной статье инварианты —, /2, /3 слабо коррелируют между

Л

собой и, следовательно, данный набор числовых характеристик можно использовать в задачах распознавания изображений, отыскания снимков по образцу, задачах фотограмметрии.

с)

игп

d)

Рис. 5. Гистограммы распределения значений инварианта: а)—Тестовые изображения

1ев11, 1ев12, 1ев13; Ь) — инвариант —; с)—инвариант /2; ¿) — инвариант ]3

п

Литература

[1]

[2]

Cambridge

[3]

Peter, J. Olver. Equivalence, Invariants, and Symmetry / J. Peter University Press, 1995.

Walker, K.N. Locating Salient Facial Features Using Image Invariants / K.N. Walker, T.F. Cootes, C.J. Taylor // Medical Biophysics. - UK: Manchester University. - 1998.

Gouet, M.V. Stereo Matching of Color Images Using Differential Invariants / M.V.Gouet, P. Montesinos, D.Pele // International Conference on Image Processing. - 1999.

Поступила в редакцию 17/I/2007; в окончательном варианте — 17/I/2007.

IMAGE INVARIANTS TO THE EFFECT OF ROTATIONS AND ELONGATION

© 2007 O.V. Samarina? V.V. Slavsky4

In modern methods of digital images processing multiresolution representation of a image is used, for example, at wavelet analysis. Therefore it is desirable to have such characteristics of the image which would not depend on orientations, qualities and scale of a picture. Those characteristics can be used for definition of characteristic (special) points of the image. In the paper we define and investigate four differential invariant points of the image concerning change of scale and turn. Similar researches were given earlier in works [1], [2] and [3]. There it is possible to find important appendices for similar invariants.

Paper received 17/I/2007. Paper accepted 17/I/2007.

3 Samarina Olga Vladimirovna (batgauer-olgaamail.ru), Ugorsk State University, Khanty-Mansiysk, 628011, Russia.

4Slavsky Viktor Vladimirovich (slavskySuriit.ru), Ugorsk State University, Khanty-Mansiysk, 628011, Russia.

i Надоели баннеры? Вы всегда можете отключить рекламу.