Научная статья на тему 'Применение методов непараметрической статистики в задачах идентификации изображения'

Применение методов непараметрической статистики в задачах идентификации изображения Текст научной статьи по специальности «Математика»

CC BY
99
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧИ ИДЕНТИФИКАЦИИ / ПОСТРОЕНИЕ ОПОРНОЙ ГИПЕРПЛОСКОСТИ ПУТЕМ РАЗМНОЖЕНИЯ ФОРМАЛИЗОВАННЫХ ХАРАКТЕРИСТИК / ОПИСАНИЕ ИЗОБРАЖЕНИЯ МЕТОДОМ НЕПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ

Аннотация научной статьи по математике, автор научной работы — Губанов Николай Юрьевич, Калайда Владимир Тимофеевич

Рассматривается подход к решению задачи идентификации, основанный на построении опорной гиперплоскости путем размножения формализованных характеристик описания изображения методом непараметрической статистики

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение методов непараметрической статистики в задачах идентификации изображения»

УДК 004.93'12

Н.Ю. Губанов, В.Т. Калайда

Применение методов непараметрической статистики в задачах идентифткации изображения

Рассматривается подход к решению задачи идентификации, основанный на построении опорной гиперплоскости путем размножения формализованных характеристик описания изображения методом непараметрической статистики.

Проблема идентификации личности человека является одной из наиболее актуальных задач (известных как «биометрические системы безопасности») в системах распознавания. Интерес к таким системам вызван бурным развитием информационных технологий, которые находят все большее применение в различных сферах человеческой деятельности: банковская деятельность, шоу-бизнес, в оборонных системах обеспечения доступа к системам вооружения и документации, а также все большую значимость приобретают в связи с нарастающей глобальной угрозой терроризма.

Идентификация человека по чертам лица — одно из самых динамично развивающихся направлений в биометрической индустрии. Привлекательность данного метода основана на том, что он наиболее близок к тому, как люди обычно идентифицируют друг друга.

Развитие мультимедийных технологий, благодаря которым можно увидеть все больше видеокамер, установленных на городских улицах и площадях, аэропортах, вокзалах и других местах скопления людей, определило развитие этого направления как наиболее перспективного.

Среди представленных на рынке программных продуктов следует отметить системы, основанные на методах поэлементного сравнения участков изображения [1], статистическом сравнении (факторный и кластерный анализ [2]) и ряде других. Однако представленные системы обладают рядом существенных недостатков, таких как высокая стоимость и достаточно невысокая достоверность.

В работе предлагается метод идентификации, основанный на принятии решения о принадлежности анализируемого изображения к одному из известных классов по оценке меры близости изображения к опорной гиперплоскости класса.

Под опорной гиперплоскостью класса подразумевается плоскость, наименее уклоняющаяся от всего множества численных характеристик каждого изображения из данного класса.

В качестве формализованных численных характеристик описания изображений используются алгебраические моменты:

таЬ = И f (х, у) xaybdxdy, (а,Р) = (0й), (1)

где f (х, у) — значение интенсивности изображения в точке (х, у) [3].

Параметры опорной гиперплоскости вычисляют из решения оптимизационной задачи

пт . 2

Ь = Е Е (А*х{ + Л)) ® k=l ]=1

где Xk — ограниченная (длиной т ) последовательность моментов (1) ] -го изображения, принятая для описания данного класса; п — количество изображений в классе.

Для выполнения данного условия необходимо, чтобы все производные целевой функции Ь,

д1 п ъ

-= 0 . В результате получается нормальная система однородных уравнений относительно неизвест-

д^

ных А1,А2,...,А) :

дЬ пт .

тт = ЕЕ (АХ + Ао К = о; дА1 k=1 ] =г '

дЬ пт .

дА- = ЕЕ (+ Ао )х2 =

' дА2 k=1 ] = Т '

лг пт .

дЬ = Е Е (Akx{ + Ао) = 0.

дАо k=1 ] =Г '

Полученная нормальная система является однородной и, следовательно, имеет нетривиальное решение только при условии, что ранг матрицы меньше ее размерности [4]. Отличительной особенностью данной нормальной системы является большой разброс коэффициентов ее матрицы. Это обусловлено большим динамическим разбросом моментных характеристик (10-7 - 106 ).

Н.Ю. Губанов, В.Т. Калайда. Применение методов непараметрической статистики ... 41

Для решения системы линейных уравнений наиболее целесообразно использовать метод, основанный на методе разложения матрицы в виде В = USVT (сингулярное разложение), поскольку последнее обладает высокой точностью и устойчивостью вычислительного процесса [5], где В — действительная матрица размером т х п , матрица и сформирована из п ортонормированных собственных

т

векторов, соответствующих п наибольшим собственным значениям матрицы ВВ , а матрица V — из

т

ортонормированных собственных векторов матрицы В В . Диагональные элементы матрицы S — нет

отрицательные значения квадратных корней из собственных значений матрицы ВВ . Для оценки принадлежности анализируемого изображения к классу будем использовать следующую величину: N

X + А

8 =

k=1

N

расстояние до гиперплоскости, где х'^ — формализованные характеристики ана-

IX А?

и=1

лизируемого изображения.

Принятие решения о принадлежности к классу изображений осуществляется сравниванием внутриклассовых расстояний и расстояния до анализируемого изображения.

Из-за небольшого количества изображений, участвующих в вычислении коэффициентов опорной гиперплоскости, оценка параметров гиперплоскости ненадежна.

Для достоверной идентификации человека необходимо использовать методы, позволяющие повысить точность оценки. Это достигается путем размножения измерений на основе непараметрической оценки функции плотности распределения моментных характеристик класса изображений и генерации дополнительных характеристик по оцененному распределению:

f (х ) = ■

1

V =1

п X ф

V =1 i =1

хп Х7)

где f (х) — совместная функция плотности вероятности; Ф — ядерная функция; т — количество мо-ментных характеристик; п — количество изображений; сп — коэффициент размытости ядерной функции, который характеризует область её определения (расплывчатость ядра) [6].

В работе используется ядерная функция Епанечникова, вид которой представлен на рис. 1:

,.2

I и I < л/5;

Ф (и) =

3

3 и2

475 20л/5 0

> л/5 .

Оценка совместной функции плотности распределения проводилась путем рис. 1. вид ядерной вычисления оптимального значения параметра размытости с в функции плотно- функции

сти распределения, обеспечивающего минимальную внутриклассовую дисперсию Епанечникова о , методом деформируемого многогранника (метод Нелдера—Мида) [7].

Для минимизации функции п переменных f (х) в п -мерном пространстве строится многогранник, содержащий (п +1) вершину. Очевидно, что каждая вершина соответствует некоторому вектору х (в нашем случае вектор параметров размытости с ).

Вычисляются значения целевой функции f(x) в каждой из вершин многогранника, определяется максимальное из этих значений и соответствующая ему вершина х [А].

Через эту вершину и центр тяжести остальных вершин проводится проецирующая прямая, на которой находится точка х ^] с меньшим значением целевой функции, чем в вершине х [А] (рис. 2). Затем исключается вершина х [А].

Из оставшихся вершин и точки х строится новый многогранник, с которым повторяется описанная процедура. В процессе выполнения данных операций многогранник изменяет свои размеры, что и обусловило название метода.

Целевой функцией, значение которой вычисляется в каждой из вершин многогранника, является дисперсия

Рис. 2. Геометрическая интерпретация метода деформируемого многогранника

л

с

V

V

и

о = +

1

n -

1X (dt - s)2, если Ci > 0 , i = (l, n);

1=1

о = отах, если ^ < 0,

где п — количество изображений; 8i — отклонение i -го изображения от гиперплоскости класса;

х — штрафная функция.

Структурная схема алгоритма приведена на рис. 3.

Расчет межклассового математического ожидания и дисперсии отклонений от опорной гиперплоскости

т

Вывод результатов

Рис. 3. Структурная схема алгоритма

Результаты тестовых расчетов по 237 изображениям 23 классов показали, что использование размножения параметров с оптимальными значениями коэффициентов размытия ядерных функций по-

изображений в 106раз (от

зволило уменьшить внутриклассовую дисперсию

первоначального

10-5 -10-6

до

10-11 -10-12 ).

Работа выполнена при поддержке РФФИ, проект № 06—08—00751. Литература

1. Samal A. and Iyengar P. A. Automatic recognition and analysis of human faces and facial expressions: a survey// Pattern Recognition. - 1992. - Vol. 25, № 1. - P. 65-77.

2. Загоруйко Н.Г. Методы распознавание и их применение. - М.: Сов. радио, 1972.

3. Калайда В.Т. Некоторые проблемы представления и поиска в электронной форме филиграней (водяных знаков) на бумаге книжных памятников / А. И. Елизаров, В. А. Есипова, В. Т. Калайда [и др.] // Охрана и реставрация культурного наследия Сибири. — Томск: Изд. дом «Курсив», 2002. - С. 110-119.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Курош А. Г. Курс высшей алгебры. - М.: Наука, 1968. - 431 с.

5. Уилкинсон Р. Справочник алгоритмов на языке АЛГОЛ. - М.: Машиностроение, 1976. - 491 с.

6. Лапко А.В. Непараметрические системы классификации / А.В. Лапко, В.А. Лапко, М.И. Соколов, С.В. Ченцов. - Новосибирск: Наука, 2000. - 240 с.

7. Химмельблау Д. Прикладное нелинейное программирование. - М.: Мир, 1975. - 534 с.

Губанов Николай Юрьевич

Томский государственный университет, студент 5-го курса, гр. 720 Эл. адрес: [email protected].

Калайда Владимир Тимофеевич

ГОУ ВПО «Томский государственный университет систем управления и радиоэлектроники» Д.т.н., профессор кафедры АСУ

N.U. Gubanov, V.T. Kalayda

Non-parametric statistic method application on picture identification problem

Approach on picture identification problem basis production support hyper-plane by copy formalizing characteristic description of picture of non-parametric statistic method.

i Надоели баннеры? Вы всегда можете отключить рекламу.