Научная статья на тему 'Применение метода диффеоморфного преобразования кривых при решении задач распознавания образов'

Применение метода диффеоморфного преобразования кривых при решении задач распознавания образов Текст научной статьи по специальности «Математика»

CC BY
154
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / ИНВАРИАНТНОСТЬ / ДИФФЕОМОРФНЫЕ ПРЕОБРАЗОВАНИЯ / БИОМЕТРИЯ / МЕТОД PSO / PATTERN RECOGNITION / INVARIANCE / DIFFEOMORPHIC TRANSFORMATION / BIOMETRICS / PSO METHOD

Аннотация научной статьи по математике, автор научной работы — Чуканов С.Н., Абрамов Д.Б., Баранов С.О., Лейхтер С.В.

Рассмотрена задача оценивания нормы расстояния между двумя замкнутыми гладкими кривыми при распознавании образов. Описаны диффеоморфные преобразования кривых на основе модели больших деформаций. Для оценивания нормы расстояния между двумя замкнутыми кривыми формируется функционал, соответствующий норме расстояния между двумя кривыми, и уравнение эволюции диффеоморфных преобразований. Предложен алгоритм решения уравнения диффеоморфного преобразования, построенный на основе метода PSO, который позволяет значительно сократить объём вычислительных операций по сравнению с градиентными методами решения. Разработанные в статье алгоритмы могут использоваться в биоинформатике и биометрических системах, классификации изображений и объектов, системах машинного зрения, при распознавании образов и объектов, системах трекинга.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of Diffeomorphic Transform of Curves for Solving Pattern Recognition Problems

The problem of estimating the norm of the distance between the two closed smooth curves for pattern recognition is considered. Diffeomorphic transformations of curves based on the model of large deformations are described. For estimating of the norm of the distance between two closed curves the functional, corresponding normalized distance between the two curves, and the equation of diffeomorphic transformations evolution are formed. An algorithm for solving the equation of diffeomorphic transformation is proposed, built on the basis of PSO which can significantly reduce the number of computing operations compared with gradient methods for solving. The developed algorithms can be used in bioinformatics and biometrics systems, classification of images and objects, machine vision systems, for pattern recognition and object tracking systems.

Текст научной работы на тему «Применение метода диффеоморфного преобразования кривых при решении задач распознавания образов»

структуры и моделирование 2016. №4(40). С. 72-80

УДК 004.932.2

ПРИМЕНЕНИЕ МЕТОДА ДИФФЕОМОРФНОГО ПРЕОБРАЗОВАНИЯ КРИВЫХ ПРИ РЕШЕНИИ ЗАДАЧ РАСПОЗНАВАНИЯ ОБРАЗОВ

С.Н. Чуканов1

профессор, д.т.н., ведущий научный сотрудник, e-mail: ch_sn@mail.ru

Д.Б. Абрамов2 аспирант, e-mail: cuntz@mail.ru

С.О. Баранов2 аспирант, e-mail: serj@doctor.com

С.В. Лейхтер2 аспирант, e-mail: leykhter@mail.ru

1ФГБУН Институт математики им. С.Л. Соболева СО РАН, Омский филиал 2ФГБОУ ВО Сибирская автомобильно-дорожная академия

Аннотация. Рассмотрена задача оценивания нормы расстояния между двумя замкнутыми гладкими кривыми при распознавании образов. Описаны диффеоморфные преобразования кривых на основе модели больших деформаций. Для оценивания нормы расстояния между двумя замкнутыми кривыми формируется функционал, соответствующий норме расстояния между двумя кривыми, и уравнение эволюции диффеоморфных преобразований. Предложен алгоритм решения уравнения диффеоморфного преобразования, построенный на основе метода PSO, который позволяет значительно сократить объём вычислительных операций по сравнению с градиентными методами решения. Разработанные в статье алгоритмы могут использоваться в биоинформатике и биометрических системах, классификации изображений и объектов, системах машинного зрения, при распознавании образов и объектов, системах трекинга.

Ключевые слова: распознавание образов, инвариантность, диффеоморф-ные преобразования, биометрия, метод PSO.

Введение

Распознавание объектов по изображениям независимо от их расположения, ориентации, масштаба и перспективы — является важным направлением информационных технологий в области распознавания образов и машинного зрения. В задачах математической морфологии важной является задача сопоставления близких форм, а не точное определение каждой формы; деформация сложной фигуры может привести к пониманию формы. Изучение формы и изменчивости изображения в рамках теории распознавания образов можно свести к оцениванию преобразований, которые последовательно деформируют изображения.

Вычисление многомерных нежёстких преобразований изображений привело к развитию стратегии эластичного сравнения, при этом преобразование линеаризуется относительно системы координат исходного изображения и генерируется векторное поле смещений. Стоимость преобразования измеряется функционалом — нормой разности между преобразованным исходным изображением и эталонным изображением; оптимальному преобразованию этого функционала соответствует векторное поле смещений с наибольшей гладкостью. Измерение гладкости достигается указанием нормы в пространстве векторных полей с использованием дифференциального оператора. Одним из ограничений данного подхода является то, что не гарантируется биективность преобразования. Представляет интерес вычисление диффеоморфных преобразований, которые сами являются гладкими, но и обратные преобразования сохраняют свойства гладкости. Модель больших деформаций для вычисления преобразований изображений [1] гарантирует, что преобразования, вычисленные между изображениями, диффеоморфны. При этом преобразование исходных точек области в требуемые формируется на основе зависящего от времени векторного поля скоростей, которое определяется системой обыкновенных дифференциальных уравнений (ODE).

В работе рассмотрена задача оценивания нормы расстояния между двумя замкнутыми гладкими кривыми при распознавании 2D-образов. Рассмотрены действия групп переноса, вращения и масштабирования на 2D замкнутую кривую, инварианты к действию этих групп. Для оценивания нормы расстояния между кривыми положение кривых нормализуется центрированием, приведением главных осей инерции изображения к осям системы координат и приведением к единице площади замкнутой кривой соответствующим масштабированием. Для оценивания нормы расстояния между двумя замкнутыми кривыми формируется функционал, соответствующий норме расстояния между двумя кривыми, и уравнение эволюции диффеоморфных преобразований. Предложен алгоритм решения уравнения диффеоморфного преобразования, построенный на основе метода PSO, который позволяет значительно сократить объём вычислительных операций по сравнению с градиентными методами решения.

Разработанные алгоритмы могут использоваться в биоинформатике и биометрических системах, классификации изображений и объектов, системах машинного зрения, нейровизуализации, при распознавании образов и объектов, системах трекинга. Алгоритм оценивания нормы расстояния между замкнутыми кривыми методом диффеоморфного преобразования может быть распространён на пространственные объекты (кривые, поверхности, многообразия).

1. Построение инвариантов переноса, вращения и масштабирования

Для нахождения инвариантов при распознавании образов необходимо найти группу G, действующую на множестве аргументов функции изображения. Изображение объекта может быть описано функцией f (x,y) = 1, если (x,y) Е S С R2 (f (x,y) = 0, иначе), где (x,y) — декартовы координаты

изображения с границей c = dS множества S. Действие группы переноса на функцию f (x,y) в направлении оси X: gex f (x,y) = f (x + ex,y); оси Y: geyf (x,y) = f (x,y + ).

Действие группы масштабирования на функцию f (x, y):

g¿, f (x,y) = f ((1 + ф) x, (i + y).

Действие группы вращения (поворот на угол а): gaf (x,y) = f (x cos а — y sin а,х sin а + y cos а).

Инвариантность по отношению к группе переноса может быть обеспечена нахождением центра (x0,yo) с последующим переносом. Для действия группы переноса на функцию 2D-изображения нахождение центра изображения сводится к методу моментов [2]. Сформируем моменты порядка (p + q) 2D-функции f (x,y) : mp,q = f xpyqf (x,y) dS; p, q G Z+ ; например, площадь изоб-

S

ражения: m0,0 = f f (x,y) dS .

S

Центр (x0,y0) функции изображения f (x,y) определяется из соотношений: x0 = mi,0m-0 ; y0 = m0,im-J . Центрированная функция является инвариантной по отношению к действию группы переносов. Нормализованные моменты: f (x + x0,y + y0) являются инвариантами масштабирования. Подействуем на f (x,y) таким элементом группы масштабирования g^s , что значение будет m0,0 = 1 .

Для выделения определённой ориентированной системы координат построим тензор изображения: J = ( 2,0 1,1 ). При повороте объекта с

-mi,i m0,2

— i

cos а — sin а

матрицей направляющих косинусов T = ( ) тензор инерции

sin а cos а

изменяется по закону: J' = Тт ■ J ■ T. При повороте объекта на угол: а = 0,5 ■ arctg (2Jxy (Jyy — Jxx)_1), тензор инерции будет иметь диагональный

вид Jd = diag ^ Jx Jy j G R2x2, где Jx, Jy — собственные числа тензора инерции J. При Jx = Jy можно провести такое преобразование координат:

^ x' y'j = T ^ x y j — формированием поворота T, что оси X, Y будут направлены по главным осям тензора инерции 2D-изображения.

Для нормализации изображения необходимо решить задачу нахождения центра изображения и выделенной ориентации группы вращения с последующим центрированием и масштабированием изображения.

2. Действие элементов групп на кривые

Действие матричных групп на кривые можно представить: А ^ А о с, где А : К2 ^ К2 — действие матричной группы в К2. Приведём примеры матричных групп [3].

• СЬ (2) — линейная группа матриц СЬ (2) = {А е К2х2; А = 0} с законом композиции — умножением матриц.

• БО (2) е СЬ (2) — специальная ортогональная группа может быть представлена матрицами БО (2) := [А е К2х2|ААт = АтА = ¡а; ае1 (А) = 1}.

• Группа масштабирования может быть представлена диагональными матрицами А = ( Р 0 1 р е К+.

0 р

• БЕ (2) — специальная группа Евклида определяется полупрямым произведением БЕ (2) ~ БО (2) 0 К2.

Дифференцируемая кривая в СЬ (2) — это функция: gt : (а,Ь) ^ СЬ (2), для которой существует производная СдУсь; V е (а,Ь). Уравнение первого порядка для элемента матричной группы: ^/(ь = А • д^ д=0 = ¡а, где А е К2х2 — матрица с постоянными элементами имеет решение: gt = ехр(ЬА), которое обладает групповыми свойствами.

Кривая, соединяющая элементы до,д1 е СЬ (2), минимизирующая функционал:

1 1

/ ы1 СЬ = У {Ььг,vt>2 СЬ; Ь е К2х2 (1)

оо

и удовлетворяющая уравнению ^/(ь = vt • gt, является решением уравнения Эйлера [4]:

С (Ь^)М = (Ь^) VI - VI . (2)

3. Группа диффеоморфных преобразований

Будем считать, что замкнутые кривые принадлежат открытому подмножеству X с К2. Диффеоморфизм X является обратимым непрерывно дифференцируемым преобразованием X ^ X; существует тождественное отображение (¡а — композиция прямого и обратного диффеоморфизма). Множество диффеоморфизмов БШ (X) определяет структуру группы. Диффеоморфизмы изменяют количественные характеристики объектов, которые определены на множестве X. Матричные группы диффеоморфизмов имеют конечную размерность и кодируются с помощью параметров матриц. Рассмотрим группу бесконечномерных диффеоморфизмов, действующих на ограниченном множестве X с К2. Определим диффеоморфизм д : X ^ X с обратным элементом д-1 и определим группу преобразований С, как подгруппу диффеоморфизмов с законом композиции о: д од' = д (д') е С. Для формирования диффеоморфных отображений диффеоморфизмы рассматриваются как потоки ODE. Предположим, диффеоморфизмы gt (х); х е X эволюционируют во времени Ь е [0,1] с векторным полем vt (•):

dgt (х)/СЬ = vt ^ (х)); до (х) = х. (3)

Формированием требуемого векторного поля vt (•) в любой момент времени Ь е [0... 1] можно добиться такого действия элементов группы д^; (•) на точки пространства X с К2, что д0 (х) = х; д1 (х) = у; Vx, у е X.

Допустим, что задана норма ||^||у = (£г>4,г>4)2 = J (Lvt)* где

а = Lvt; Ь е [0,1] — момент векторного поля. Для д е С существуют скорости VI (д^) = минимизирующие функционал:

1 1

Ф (vt) = J |Ы|У ^ = / (Lvt,Vt)2 ^ (4)

0 0

на траектории, соединяющей элементы группы д0 = д^=0 и д1 = . Представим обратную связь между скоростью vt и моментом а в форме:

^ = L-1аt = Ка^. (5)

Для дифференциального оператора: L = — аУ2 в Е2 — обратный оператор К = L-1 аппроксимируем функцией:

— 1|| и 2

К (ж) = ве-7 11X1 . (6)

Уравнения эволюции диффеоморфизмов Эйлера-Пуанкаре можно получить решением уравнений вариационной задачи с функционалом Ф [5]:

т

= — ^ — atVvt — а^, (7)

где Д/ = (д/г/дж^-); г,^ = 1,2. Если объектами являются точечные множества, то векторные поля в точках ж = (ж1 (¿) (¿)) принимают вид:

N

Vt (■) = К (-,жг) аг. 1=1

Уравнение вариационной задачи позволяет перемещать объекты вдоль траекторий, которым соответствуют диффеоморфные преобразования. Диффеоморфизмы не позволяют изменить топологию вдоль геодезических траекторий. Неточный вид диффеоморфизмов [6,7] обеспечивает механизм, который позволяет при эволюции геодезических траекторий отклоняться от точных деформаций. В задаче неточного сравнения минимизируемый функционал содержит член, который оценивает точность попадания точек д1 (жП); п = 1,..., N в требуемые позиции ж^:

/ |М|У^ + а 2 ^ ЦжП— д1 (жП) (8)

0 п=1

при этом в уравнения Эйлера-Пуанкаре диффеоморфных преобразований вводится параметр а2:

/^ — vt (жй) = а2а;

N N (9)

Vt (■) = ^ К (-,жг) а/^ = — ^ У1К (жй,жг) ата, 1=1 1=1

здесь У1К представляет собой градиент функции (ж, у) ^ К (ж, у) по отношению к первой координате. Примем для оператора L функцию К (ж, ■) в виде: К (ж, ■) = . Тогда:

У1К (ж*, ж1) = —27-1 (ж* — ж1) е-^1""1"2.

1

4. Решение задачи методом PSO

При решении уравнения (9) необходимо определить краевые условия а0 = (а1 (0) ,...,aN (0)) и а1 = (а1 (1) ,...,aN (1)) при известных x0 = (x1 (0),..., xN (0)) и x1 = (x1 (1),..., xN (1)). Применение градиентных методов решения задачи (9) требует значительного количества вычислительных операций. Для решения этой задачи в работе предлагается применение метода пристрелки (shooting) с использованием алгоритма PSO (particle swarm optimization). Метод пристрелки заключается в нахождении такого начального вектора а0 = (а1 (0),..., aN (0)), что значение функционала (8) минимизируется.

Метод PSO основан на имитации поведения роя насекомых и был предложен J. Kennedy в 1995 году [8]. В контексте многопараметрической оптимизации рой (swarm) имеет фиксированный размер; каждая частица первоначально расположена в случайных местах в многомерном пространстве проектирования. Частицы имеют две характеристики: положение и скорость. Положение частицы определяется значением целевой функции. Частицы обмениваются информацией (лучшими позициями) и могут корректировать свои позиции и скорости. Алгоритм метода PSO приведён в приложении.

Пример. Рассмотрим пример диффеоморфного преобразования замкнутой кривой — окружности единичного радиуса (эллипс с эксцентриситетом е = 0 и длиной окружности 2п) в отрезок прямой длиной п (эллипс с е = 1) за единичный период времени. Для этого выберем N =12 точек на эллипсе, соответствующих параметру 9i = 2niN-1;i = 1,...,N. Выберем параметр уравнения диффеоморфных преобразований: а2 = 10-4; параметр метод PSO: д = 0,7; число частиц: 10. В таблице 1 представлены результаты моделирования диф-феоморфных преобразований точек эллипса от значения эксцентриситета е = 0 до е = 1 для четырёх точек (из 12) замкнутой кривой.

Таблица 1. Результаты моделирования диффеоморфных преобразований

t x0 x0 x0 x3 x0 x6 x0 x9 x0 x0 е

0 (0,00;1,00) (1,00;0,00) (0,00;-1,00) (-1,00;0,00) (0,00;1,00) 0,000

2 (0,01;0,77) (1,41;-0,01) (-0,01;-0,77) (-1,43;0,02) (0,01;0,77) 0,840

4 (0,02;0,55) (1,83;-0,01) (-0,02;-0,55) (-1,84;0,02) (0,02;0,55) 0,954

6 (0,02;0,36) (2,22;-0,01) (-0,02;-0,36) (-2,22;0,03) (0,02;0,36) 0,987

8 (0,02;0,18) (2,56;-0,01) (-0,02;-0,18) (-2,54;0,03) (0,02;0,18) 0,998

10 (0,03;0,00) (2,85;-0,02) (-0,03;0,00) (-2,82;0,05) (0,03;0,00) 1,000

x0 x3 x6 x9 x0

x1 (0,00;0,00) (3,14;0,00) (0,00;0,00) (-3,14;0,00 (0,00;0,00) 1,000

В результате получена дисперсия неточности попадания

К — (ЖП)||2 = 0,34 и среднее отклонение одной точки от цели

п=1

I 12 ;;

4/12-1^ ||хП — (хП)|2 = 0,17. Для повышения точности попадания У П=1

необходимо увеличить число итераций и количество частиц в методе РБО, а также уменьшить параметр дисперсии а2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заключение

Рассмотрена задача оценивания расстояния между замкнутыми 2Э кривыми. Представлены методы нахождения инвариантов к действию групп переноса, вращения и масштабирования на замкнутую кривую, не зависящие от координатного описания изображения. Для оценивания нормы расстояния между двумя замкнутыми кривыми формируется функционал, соответствующий норме расстояния между двумя кривыми, и уравнение эволюции диффеоморфных преобразований, полученное решением вариационной задачи. Предложен алгоритм решения уравнения диффеоморфного преобразования, построенный на основе метода РБО, который позволяет значительно сократить объём вычислительных операций по сравнению с градиентными методами решения. В дальнейшем алгоритм решения уравнения диффеоморфного преобразования будет распространен на 3Э объекты: точечные множества, кривые и поверхности. Следует рассмотреть задачу распознавания динамически изменяющихся объектов методом решения уравнений диффеоморфного преобразования.

Приложение. Метод PSO [9]

Рассмотрим задачу оптимизации (максимизации) без ограничений: Maximize/ (X); X(1) ^ X ^ X(u), где X(1), X(u) - нижняя (lower) и верхняя (upper) границы X. Пусть число частиц N. Процедура PSO применяется с использованием следующих шагов.

1. Сформируем случайное начальное множество Xi (0),..., XN (0). Положение и скорость частицы j при итерации i: Xf, Vf, соответственно. Определим значение целевой функции: / [X1 (0),..., XN (0)].

2. Найдём скорости частиц. Начальные скорости всех частиц принимаются равными нулю и номер итерации: i = 1.

(i) V(i) j

3. На итерации г найдём параметры XV (а) Историческое лучшее значение положения РЬе^,.7 с лучшим значением

частицы j: (i):

целевой функции /

X(i)

частицы j на всех предыдущих итерациях. Исто-(i):

рическое лучшее значение положения X:-: Gbesi с лучшим значением целевой

функции /

X

(i)

на всех предыдущих итерациях для всех N частиц; (Ь) найдём

скорость частицы j на итерации i:

Vj(i) j

tf ■ Vji-1) + С1Г1

P

bestj

X

(i-1)

+ С2Г2

Gfeest — X

(i-1)'

-i/+ C3 ■ Г3 ■ 2 /i0,

где с1,с2,с3 — скорости обучения, г1,г2,г3 е [0... 1] — равномерно случайно распределённые числа; (с) найдём положение частицы ] на итерации г: Х^ = Х^-1) + У^ и соответствующее значение целевой функции

I [х(1г),..., х$].

4. Шаг 3 повторяется с г = г + 1 и новыми значениями Pьest,j, GЬest. Процесс продолжается до тех пор, пока все частицы не сойдутся к значению, обеспечивающему оптимум целевой функции.

Литература

1. Beg M.F. et al. Computing large deformation metric mappings via geodesic flows of diffeomorphisms // International journal of computer vision. 2005. Т. 61, N. 2. P. 139-157.

2. Чуканов С.Н. Преобразование Фурье функции трехмерного изображения, инвариантное к действию групп вращения и переноса // Автометрия. 2008. Т. 44, № 3. С. 80-87.

3. Baker A. Matrix groups: An introduction to Lie group theory. Springer, 2012.

4. Arnold V.I., Khesin B.A. Topological methods in hydrodynamics. Springer, 1998.

5. Holm D.D. et al. Geometric mechanics and symmetry: from finite to infinite dimensions. London : Oxford University Press, 2009.

6. Miller M.I., Trouve A., Younes L. Geodesic shooting for computational anatomy // Journal of mathematical imaging and vision. 2006. Т. 24, № 2. С. 209-228.

7. Bruveris M., Holm D.D. Geometry of image registration: The diffeomorphism group and momentum maps // Geometry, Mechanics, and Dynamics. Springer New York, 2015. P. 19-56.

8. Kennedy J. et al. Swarm intelligence. Morgan Kaufmann, 2001.

9. Yang X. S. Nature-inspired optimization algorithms. Elsevier, 2014.

APPLICATION OF DIFFEOMORPHIC TRANSFORM OF CURVES FOR SOLVING PATTERN RECOGNITION PROBLEMS

S.N. Chukanov1

Dr.Sc.(Eng.), Professor, Senior Scientist Researcher, e-mail: ch_sn@mail.ru

D.B. Abramov2 Graduate Student, e-mail: cuntz@mail.ru

S.O. Baranov2 Graduate Student, e-mail: serj@doctor.com

S.V. Lejhter2 Graduate Student, e-mail: leykhter@mail.ru

1Sobolev Institute of Mathematics of the Siberian Branch of the Russian Academy of

Sciences, Omsk branch 2Department of "Computer Information Automated Systems", State Automobile and

Highway Academy

Abstract. The problem of estimating the norm of the distance between the two closed smooth curves for pattern recognition is considered. Diffeomorphic transformations of curves based on the model of large deformations are described. For estimating of the norm of the distance between two closed curves the functional, corresponding normalized distance between the two curves, and the equation of diffeomorphic transformations evolution are formed. An algorithm for solving the equation of diffeomorphic transformation is proposed, built on the basis of PSO which can significantly reduce the number of computing operations compared with gradient methods for solving. The developed algorithms can be used in bioinformatics and biometrics systems, classification of images and objects, machine vision systems, for pattern recognition and object tracking systems.

Keywords: pattern recognition, invariance, diffeomorphic transformation, biometrics, PSO method.

Дата поступления в редакцию: 16.08.2016

i Надоели баннеры? Вы всегда можете отключить рекламу.