Научная статья на тему 'Параметрические методы распознавания образов динамической биометрии'

Параметрические методы распознавания образов динамической биометрии Текст научной статьи по специальности «Математика»

CC BY
749
122
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКИЕ БИОМЕТРИЧЕСКИЕ СИСТЕМЫ АУТЕНТИФИКАЦИИ / МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ БИОМЕТРИЧЕСКИХ ПАРАМЕТРОВ / ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ РАСПОЗНАВАНИЯ / ДИСКРИМИНАНТНАЯ ФУНКЦИЯ / ОБУЧЕНИЕ / ВЕРИФИКАЦИЯ / DYNAMIC BIOMETRIC AUTHENTICATION SYSTEM / A MULTIVARIATE NORMAL DISTRIBUTION OF BIOMETRIC PARAMETERS / PARAMETRIC METHODS OF PATTERN RECOGNITION / DISCRIMINANT FUNCTION / TRAINING / VERIFICATION

Аннотация научной статьи по математике, автор научной работы — Брюхомицкий Юрий Анатольевич

Рассматриваются три параметрических метода распознавания биометрических параметров, предназначенные для использования в динамических биометрических системах аутентификации личности по рукописному и клавиатурному почеркам. Первый метод основан на вычислении квадратичной дискриминантной функции, коэффициенты которой определяются по характеристикам распределения биометрических параметров «своего» пользователя. Во втором методе дискриминантная функция представлена и вычисляется как многомерная функции плотности распределения биометрических параметров пользователя. Третий метод использует канонический вид квадратичной дискриминантной функции. Предлагаемые методы обладают повышенной точностью распознавания и простотой обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETRIC METHODS OF RECOGNITION FORM A DYNAMIC BIOMETRICS

We consider three parametric method of pattern recognition biometrics for use in dynamic biometric authentication systems by individual handwriting and keyboard writing style. The first method is based on the computation of the quadratic discriminant function coefficients are determined by the characteristics of the distribution of biometrics "own" the user. In the second method discriminant function is presented and evaluated as a multivariate density function biometric user. The third method uses the canonical form of the quadratic discriminant function. The proposed methods have a high recognition accuracy and ease of learning.

Текст научной работы на тему «Параметрические методы распознавания образов динамической биометрии»

Раздел V. Биометрические и иммунологические методы

защиты информации

УДК 004.065

Ю.А. Брюхомицкий ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ ДИНАМИЧЕСКОЙ БИОМЕТРИИ

Рассматриваются три параметрических метода распознавания биометрических па,

аутентификации личности по рукописному и клавиатурному почеркам. Первый метод основан на вычислении квадратичной дискриминантной функции, коэффициенты которой определяются по характеристикам распределения биометрических параметров «своего» .

как многомерная функции плотности распределения биометрических параметров пользо-.

функции. Предлагаемые методы обладают повышенной точностью распознавания и про.

Диномические биометрические системы аутентификации; многомерное нормальное распределение биометрических параметров; параметрические методы распознавания; ; ; .

Yu.A. Bryukhomitsky

PARAMETRIC METHODS OF RECOGNITION FORM A DYNAMIC

BIOMETRICS

We consider three parametric method of pattern recognition biometrics for use in dynamic biometric authentication systems by individual handwriting and keyboard writing style. The first method is based on the computation of the quadratic discriminant function coefficients are determined by the characteristics of the distribution of biometrics "own" the user. In the second method discriminant function is presented and evaluated as a multivariate density function biometric user. The third method uses the canonical form of the quadratic discriminant function. The proposed methods have a high recognition accuracy and ease of learning.

Dynamic biometric authentication system; a multivariate normal distribution of biometric parameters; parametric methods of pattern recognition; discriminant function; training; verification.

В биометрических системах аутентификации личности (БСА), использующих в качестве идентификационных признаков динамику рукописного и клавиатурного почерков, большое влияние на конечные характеристики системы оказывают принципы сопоставления (классификации, верификации) биометрических признаков. Эти функции реализуются специальным блоком БСА - мэтчером, который осуществляет сопоставление машинных репрезентаций предъявляемых и эталонных биометрических признаков и по результатам сопоставления выносит соответствующее аутентификационное решение [1].

В теории распознавания известно множество методов классификации образов, которые могут быть положены в основу работы мэтчеров динамических БСА:

, , , . них имеет свои характеристики, особенности и области применения.

В данной работе изложены принципы верификации образов на основе параметрических методов обучения и распознавания, которые в наибольшей степени , -писному и клавиатурному почеркам.

В БСА задача идентификации входных биометрических данных пользователя , -мися в биометрической базе данных (ББД) эталонами к = 1,М зарегистрирован-( 1: ). , -тавления мэтчер БСА решает более узкую задачу - верификации предъявленных , (

1:1). -ет, что предъявленные биометрические данные принадлежат «своему» или «чужому» пользователю соответственно.

Задача разделения (верификации) множества входных данных на «своих» и « » -чительной (дискриминантной) функции gQJ), реализующей это разделение. В свою очередь метод построения ^(F) зависит от характера классифицируемых .

Если решаются задачи классификации, для которых a priori известно, что каждый класс объектов характеризуется некоторой системой параметров, но значения этих параметров не известно, то такие задачи целесообразно решать с помощью параметрических методов. При этом дискриминантная функция ,g(F) задается в явном виде с использованием m действительных параметров, называемых :

в 00 = a(y>w1,w2,...,wm) . (1)

Из множества различных функций g(V), которые могут быть заданы выра-

(1), : , -линейные, квадратичные и др. После чего, из каких ■-либо практических соображений (точность, быстродействие, простота и т.п.) выбирается один определенный .

функций ,g(F) сводится к некоторой процедуре подбора весов wt, w2, •••, wm [2].

, - , которые используют обучающее множество объектов для получения оценок вели,

функций [2].

В динамических БСА биометрические параметры пользователей, в большин,

характеристиками математических ожиданий и центральных моментов. Следова-

,

.

Метод верификации на основе квадратичной дискриминантной функ. ,

(1), , -ры пользователей подчиняются нормальному закону распределения.

В соответствии с реальными условиями использования БСА, зададим область распределения биометрических параметров «своего» пользователя ограниченным , , -странстве En ортогональной системы координат:

.

Центр распределения векторов Vci, i = 1,L находится в точке £ = -<fjv),

которая определяются математическими ожиданиями: jU(vi) = f1( ц(v2) = ■■■ »

мС^л/) = Центральные моменты второго порядка распределения векторов \с1> I = 1Д образуют квадратную матрицу (ковариационную матрицу):

^12 ■■ Л-1 к

II Л! II а ^21 <*гг .. ^2 к

Ад лп :

где

, _ , _ , ч _ [ а1' ПРИ ) = к'

^]к ~ ^к] ~ М(у>] /^у) (ук Цк) — •! , - : ± I,

(соу^-, ук), при ) + к.

Биометрические параметры в силу своей природы обладают внутренней корреляцией, и смешанные моменты в ковариационной матрице = ЦЯдЦ в общем случае не равны нулю.

Для построения оптимального классификатора воспользуемся симметричной функцией потерь [2]:

7](]\к) = 1 -8}к, где 6]к - дельта функция, равная

_ Г1,если; = к;

;7с (0, если у Ф к.

Указанная функция уменьшается на единицу при любой ошибке классификации (объект ./-класса отнесен к ^-классу и наоборот, объект ^-класса отнесен к /-классу) и остается неизменной при правильной классификации.

Установлено [2], что при классификации нормально распределенных объектов с использованием симметричной функции потерь, оптимальный классификатор должен строиться на основе квадратичных дискриминантных функций.

В общем случае квадратичная дискриминантная функция имеет вид

(2)

или в матричной форме

д(У) = ¥т ■ А ■ V + ¥ТВ + С, (3)

где V - вектор-столбец;

¥т- транспонированный вектор V (вектор-строка);

- , , ,

.

Член ¥т■А ■ ¥ в (3) является квадратичной формой.

Функция (2) имеет ^+1)^+2)/2 весов, в том числе N весов и^- при квадратичных членах; N весов при линейных членах; NN - 1)/2 весов при сме-

шанных квадратичных членах (/ Ф к) и один свободный член wN+1.

(2)

представим ее М-мерным вектором

,

компоненты которого являются функциями V/, у = 1,Ы. Первые N компонент равны Vj,j = 1,Л?, следующие N(N-1)/2 компонент равны всевозможным парным сочетаниям Р]ШРк, последние N компонент равны V], ) = 1,Л?. Очевидно, что .

Р(¥) является однозначным преобразованием, при котором для каждого ¥ е Еы существует единственный вектор Р е Ем. Это позволяет представить дискриминантную функцию $(¥) в виде линейной функции компонент вектора Р:

д(У) = \vJ-l + И/2/2 + ... + И/м/м + 1¥м+1. (4)

(4) -

.

(4) -

метры распределения векторов Ус1. Очевидно, первые N коэффициентов IV!, и/2, •••, соответствуют дисперсиям стД следующие N(N-1X2 коэффициентов №ы+1, №ы+2, ■■■< 1%+а/(а/-1)/2 соответствуют смешанным моментам соуО^), следующие N коэффициентов И',Д(+1+Л/(А/-1)/2< и;л/+2+л/(л/-1)/2. ■■■-И'м соответствуют смещениям Ьу, компонент V; вектора относительно начала ко ординат и определяются математическими ожиданиями Последний коэффициент

У?м+г является свободным членом.

Необходимые для получения весовых коэффициентов оценки математических ,

имеющейся выборке примеров объема Ь по обычным статистическим формулам:

I

0/42 "и’

1=1

I

1=1

ь

соу(>;-, 1?*) « - ДС17;)]^ - ДО/с)]-

1=1

(3)

квадратичной дискриминантной функции д(У) матрица А становится положительно определенной, а член ¥т ■ А ■ V - соответственно положительно определенной квадратичной формой. Поверхность, описываемая функцией д(У), представляют собой ^мерный эллипсоид равной плотности, осями которого являются собственные векторы матрицы А:

¥т-А-¥ + ¥тВ = С2. (5)

Константа С задает коэффициент пропорциональности между длинами главных полуосей эллипсоида и соответствующими среднеквадратическими отклонениями. Для учета рассеивания векторов ¥С1 можно ограничиться единичным эллипсоидом рассеивания, в котором С = 1.

В БСА при обработке биометрических данных рассматриваются распределения выборочных статистик, поэтому нормальный закон рассеивания векторов Ус1 целесообразно задавать с учетом ошибки «своего» пользователя (ошибки первого рода). Для этого целесообразно применить ^распределение (Стьюдента), которое «расширяет» эллипсоид рассеивания векторов Ус1 на коэффициент Стьюдента г, определяемый как

,

где Р1 - вероятность ложного отказа «своему» пользователю (ошибка первого рода); Ь - число предъявленных образцов КП.

Для распределения Стьюдента выражение (5) можно представить в виде ¥т ■ А ■ ¥ + ¥ТВ - £2 = 0.

При классификации неизвестных биометрических признаков в виде векторов V по принципу «свой-чужой» уравнение д(У) = 0 будет определять разделяющую

поверхность между классами, а знак функции д(У) - принадлежи ость предъявленного вектора V к одному из двух классов: «свой» или «чужой»:

Рис. 1. Метод верификации на основе квадратичной дискриминантной функции в

Мэтчер БСА, реализующий изложенный метод верификации, работает следующим образом.

В режиме обучения по биометрическим образцам векторов «своего» пользователя Vci, i = \,L из обучающей выборки определяются оценки математических ожиданий fij, дисперсий of и смешанных моментов соv(vj,vk). Совокупность па, , -метрических признаков данного пользователя и выступают в роли его эталона. Процедура повторяется для всех к = \,М пользователей. Результатом обучения является набор из М эталонов, помещаемый в ББД БСА.

В режиме верификации пользователь, претендующий на доступ, предъявляет БСА свои биометрические данные в виде вектора V, а также - дополнительный идентификатор своей личности (ID). По дополнительному идентификатору БСА извлекает из ББД единственный эталон, соответствующий данному пользователю ID ( ).

на основе предъявленного вектора V и содержащихся в эталоне параметров /2у, of, cdv(vj,vk) вычисляется дискриминантная функция g(V). Знак функции g(V) определяет принадлежность предъявленного вектора V к одному из двух классов: « », « », .

Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе квадратичной дискриминантной функции (4) приведена на рис. 2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Иллюстрация метода в пространстве Е2 приведена на рис. 1.

Граница областей «свой» и «все чужие»

Эллипс рассеивания области «свой»

Область допуска, определяемая коэффициентом t

пространстве Е2

Рис. 2. Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе квадратичной дискриминантной функции

Метод верификации на основе функции плотности распределения. Если закон распределения клавиатурных параметров известен, то задачу разделения (верификации) множества входных биометрических векторов V на «своих» (вектор V,,) и «чужих» (вектор Уч) можно решить путем аналитического задания дискриминантной функции (1).

, -, (1) функции плотности нормального распределения М-мерных векторов Мс1, £ = 1,1,:

/Ок ^2...V")

1

: ехр

у=1 к = 1

(6)

1(271)" ■ Йе£||я/й||

где с^ЦЯдЦ - определитель ковариационной матрицы = ЦЯдЦ.

Коэффициенты Л]к составляют матрицу Л = ||у1ук ||, обратную ковариационной .

Л}к = (-іу+/с-

м,

Чк

где М]к - минор определителя с^ЦЯ^Ц, получаемый вычеркиванием ^строки и к-столбца.

,

нормального распределения (6), является положительно определенной квадратич-. , , -стями равных плотностей вероятностей в пространстве Еы и представляют собой ^мерные эллипсоиды равной плотности, которые группируются вокруг центральной точки (а<11<М12< Обозначая указанную форму через С2, получим

2Ґ]=ііЛ=іЛік (Ч - М/)0/с - М/с) = с2

(7)

Используя распределение Стьюдента, введем коррекцию на ошибки «своего» пользователя в условиях ограниченного объема выборки Ь. Выражение для дискриминантной функции д(¥) будет иметь вид

лік (л

■ М;)0/с - М/с) - №і, (1 - Рі)}}2

(8)

Вычисления значений функции д(У) производятся непосредственно по выражению (8). При этом уравнение д(У)) = 0 будет определять разделяющую поверхность между классами, а знак функции д(У) - принадлежность предъявленно-

: « » « »:

V Є

Vc, если sign д(У) = 0;

(V«y

lv4<

ГЧ, если sign g(V) = 1,

Совокупность выражений, необходимых для верификации неизвестного входного вектора биометрических параметров V:

ь

i=i

L

1 ч -i2

°]

-^Ь;-£(л)Г

1=1

cov(vj, Vfc) « -[zr^Jyij - fr{vj)\ivik - £Ofc)L i=i

З/* = = Kvj - A/) (yk - Afc) =

I <?/ при j = k;

[covO;, vk) при j Ф k,

Л]к = (-iy+fe-

Af.

[jk

detPifc||

N N

д(У) = 'Ya Ajk (•Vj - fi.j)(yk - £fc) - {t[L, (1 - Pi)]}2,

j=1k=1 V Є

Vc, если sign g(y) = 0;

(Vc,

lv4<

.ч, если sign g(y) = 1,

Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе вычисления функции плотности распределения показана на рис. 3.

Рис. 3. Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе вычисления функции плотности распределения

Метод верификации на основе канонического вида дискриминантной . -

ному закону распределения, возможен и другой подход к их верификации. Суть его заключается в использовании канонического вида квадратичной дискрими-, (2) , неквадратичных членах и равны нулю:

N

д(У) = ^ М] ■ у/ + \¥Ы+1. (9)

7 = 1

Чтобы использовать такой вид дискриминантной функции для классификации биометрических данных, представленных векторами V, необходимо предварительно преобразовать к каноническому виду их распределение. Для этого необходимо выполнить две последовательные операции: центрирования и декорреляции исходного нормального распределения. Применим указанные операции к распределению биометрических параметров «своего» пользователя, представленному .

Центрирование осуществляется путем совмещения центра распределения векторов Ус1 с началом координат:

,

где УС1 - центрированные значения векторов Усг;

- . Декоррелирующее преобразование в общем случае имеет вид

Vd = Vt, • D

-i

где D-1 - матрица декоррелиру ющих преобразований.

Процедуру декорреляции векторов Vcii удобно проводить с использованием алгоритма ортогонализации Грама-Шмидта [3].

После указанных преобразований конфигурация области распределения векторов Vci, i = 1Д представляет собой N-мерный эллипсоид, точка математических ожиданий которого совмещена с началом координат, а главные оси совмещены с . -нантной функции (9):

'Ej=1wj-vf -wN+1 = 0, (10)

где

1

wf=—, wN+1 = C*.

Здесь (jj - дисперсии распределения центрированных декоррелированных .

В результате дискриминантная функция для классификации векторов Vci будет иметь вид

g{y) = Ylf=1wrbj-C2. (11)

Введем коррекцию на ошибки «своего» пользователя в условиях ограниченного объема выборки L. Для этого нормальное распределение заменим распреде-.

виду

д (v) = Y.U WJ ■ Ч - №i' о- - РЖ- (12)

Весовые коэффициенты Wj в (12) определяются в процессе обучения БСА

при вычислении смещенных и декоррелированных оценок математических ожида-

ний (йу и дисперсий а2 распределения векторов УсЬ а затем используются для построения дискриминантной функции (12). Для вычисления математических ожиданий Ду и дисперсий а2 могут использоваться приведенные выше обычные оценки. Иллюстрация метода в пространстве Е2 приведена на рис. 4.

Рис. 4. Метод верификации на основе канонического вида дискриминантной

функции

Мэтчер БСА, реализующий изложенный метод верификации, работает сле-.

В режиме обучения образцы векторов из обучающей «своего» пользователя вначале центрируются: Мс1 -» УсЬ 1 = 1,1 и декоррелируются: Vс1 -» Ус1. Затем для распределения векторов Ус;- определяются оценки математических ожиданий и .

репрезентацию биометрических данных пользователя и выступают в роли его эталона. Процедура повторяется для всех к = 1,М пользователей. Результатом обучения является набор из М эталонов, помещаемый в ББД БСА.

В режиме верификации пользователь, претендующий на доступ, предъявляет БСА свои биометрические данные в виде вектора V, а также - дополнительный идентификатор своей личности (ГО). По дополнительному идентификатору БСА извлекает из ББД единственный эталон, соответствующий данному пользователю с именем ГО (если этот пользователь был ранее зарегистрирован). В мэтчере БСА на основе вектора V и содержащихся в эталоне параметров а2 вычисляется функция д (V). Знак этой функции определяет принадлежность предъявленного векто-

paV к одному из двух классов: «свой», если sign д (V) = 0 и «чужой»,

Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе канонического вида квадратичной дискриминантной функции приведена на рис. 5.

Граница областей «свой» и «все чужие»

Единичный эллипс рассеивания области «свой»

Kviz)

Область допуска, определяемая коэффициентом г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 5. Структурная схема классификатора, реализующего верификацию пользователей по принципу «свой-чужой» на основе квадратичной дискриминантной функции

Методы параметрической верификации обладает рядом преимуществ перед геометрическими и нейросетевыми методами.

По сравнению с геометрическими методами точность верификации сущест-,

. « » -

тельным объемом вычислений, связанным с получением функции д{¥). Но, учитывая, что эти вычисления производятся по стандартным, фиксированным во вре-, .

По сравнению с нейросетевыми методами классификации исчезает необходимость неопределенно длительного обучения БСА в классическом его понимании ( ). -новения тупиков и «паралича» сети, а также проблема обучения на «чужих» поль.

Методы прошли экспериментальную проверку при создании БСА БюБшд и БюКеу [4], которые использовались в учебном процессе на кафедре безопасности информационных технологий Южного федерального университета. Проведенные на программах БюБтд и БюКеу экспериментальные исследования показали, что выигрыш в точности классификации при переходе от геометрического метода к параметрическому составил 30-40 раз. Проведенные исследования позволили одновременно установить оптимальные значения коэффициентов Стьюдента г при заданной мерности N пространства входных данных Еы.

, -, , фиксированное малое время обучения и принятия решения. Эти качества позволяют широко использовать их в мэтчерах БСА самого различного назначения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Болл Р.М., Коннел Дж.Х., Панканти Ш., Рахта Н.К., Сеньор ЭХ). Руководство по биометрии. - М.: Техносфера, 2007. - 386 с.

2. Нильсон Н. Обучающиеся машины: Пер. с англ. - М.: Мир, 1967. - 180 с.

3. Беклемишев ДМ. Курс аналитической геометрии и линейной алгебры. - М.: Наука, 1971. - 328 с.

4. . ., . .

по рукописному и клавиатурному почеркам // Сборник научных трудов XIII Всероссийской научной конференции «Проблемы информационной безопасности в системе высшей школы». - М.: Изд-во МИФИ, 2006. - С. 33-34.

Статью рекомендовал к опубликованию к.т.н. М.Ю. Руденко.

Брюхомицкий Юрий Анатольевич

Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.

E-mail: [email protected].

34792S, . , . , 2.

Тел.: 88б34371905.

Кафедра безопасности информационных технологий; доцент.

Bryukhomitsky Yuriy Anatoly

Taganrog Institute of Technology - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”.

E-mail: [email protected].

2, Chekhov Street, Taganrog, 34792S, Russia.

Phone: +78б34371905.

The Department of Security in Data Processing Technologies; Associate Professor.

УДК 681.324

В.Д. Котов, В.И. Васильев

СИСТЕМА ОБНАРУЖЕНИЯ СЕТЕВЫХ ВТОРЖЕНИЙ НА ОСНОВЕ МЕХАНИЗМОВ ИММУННОЙ МОДЕЛИ

Системы обнаружения аномалий обладают большим потенциалом в области сетевой безопасности, однако на практике подобных систем реализовано мало. Хотя они способны обнаруживать атаки нулевого дня с приемлемым уровнем ложных срабатываний,

,

трафика, содержащего атаки. Подобные данные тяжело и дорого производить. В данной статье представлен адаптивный подход, основанный на иммунных механизмах. Поведение предлагаемой искусственной иммунной системы заимствует стратегию защиты у иммунной системы человека. В статье представлены результаты экспериментов, демонстрирующих перспективность технологии искусственных иммунных систем.

Система обнаружения вторжений; искусственные иммунные системы; адаптивные .

V.D. Kotov, V.I. Vasilyev

NETWORK ATTACKS DETECTION SYSTEM BASED ON THE MECHANISMS OF IMMUNE MODEL

The anomaly detection systems have big potential in the network security, but still too few of them are realized in practice. Although such systems can detect 0-day attacks with acceptable false alarm rate, the problem is that they have to be trained with the data, containing labeled attacks. And such data is hard and expensive to produce. This paper offers an adaptive solution based on the immunity mechanisms. The behavior of artificial immune system we proposed deploys the defense strategy of the human immunity. We show experimental results which demonstrate the efficiency of the artificial immune system technology.

Intrusion detection system; artificial immune systems; adaptive systems.

Введение. Система обнаружения вторжений (СОВ) является важным компонентом защиты компьютерных сетей. Её основная задача - это мониторинг сети или системы на предмет вредоносной активности. Несмотря на то, что проблема детектирования сетевых атак является довольно старой, она до сих пор актуальна. Не-

i Надоели баннеры? Вы всегда можете отключить рекламу.