Научная статья на тему 'Метод обучения нейросетевых биометрических систем на основе построения аппроксимированных областей'

Метод обучения нейросетевых биометрических систем на основе построения аппроксимированных областей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1054
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод обучения нейросетевых биометрических систем на основе построения аппроксимированных областей»

Ю.А. Брюхомицкий, М.Н. Казарин

Россия, г. Таганрог, ТРТУ

МЕТОД ОБУЧЕНИЯ НЕЙРОСЕТЕВЫХ БИОМЕТРИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ПОСТРОЕНИЯ АППРОКСИМИРОВАННЫХ ОБЛАСТЕЙ

Принцип биометрической аутентификации пользователя ПК по рукописному и клавиатурному почерку сводится обычно к распознаванию некоторого Ы-мерного вектора информативных биометрических параметров V = (уь У2, ..., Ур ..., }, у = ,

представленного в ортогональной системе координат, который содержит особенности биометрии определенной личности.

Последующая процедура аутентификации может строиться различными способами, в том числе:

- на основе измерения близости предъявляемого вектора V к биометрическому эталону VЭ (мерой Хэмминга, Евклидовой мерой и др.), позволяющего классифицировать предъявляемый вектор V как «свой» - Vc или «чужой» - ^;.

- на основе применения искусственной нейронной сети (ИНС), предварительно обучаемой на распознавание образцов векторов V «своих» и «чужих» пользователей. Отклик обученной сети непосредственно классифицирует предъявляемый вектор V как «свой» Vc или «чужой» - Vч (рис. 1).

■►Уч

Рис.1. Схема аутентификации вектора V на основе ИНС Реализация первого способа аутентификации с использованием в качестве биометрических параметров рукописный почерк и разложение Фурье показана, в частности, в работе [1]. Способ достаточно прост в реализации, однако имеет ограниченную точность аутентификации, обусловленную тем, что используемая в нем мера близости фактически не учитывают конфигурацию областей распределения векторов V биометрических параметров.

Второй способ аутентификации - с использованием ИНС - потенциально обладает большей точностью. При больших обучающих выборках многослойная ИНС способна достаточно точно разделить гиперплоскостями в Ж-мерном пространстве биометрических признаков области «свой» и «чужой». Однако использование ИНС для биометрической аутентификации помимо собственных проблем, присущих нейронным сетям, встречает дополнительную трудность, обусловленную биометрической природой распознаваемых образов. Обучение ИНС на «своих» и на «чужих» пользователей в классическом варианте может осуществляться на основе обучающего множества Т, состоящего из подмножества ТС - образцов биометрических векторов Ус и подмножества ТЧ - образцов векторов Уч:

Тс = {Ус1, VС2, ..., Ус, ...,Усы}, г = й,,

ТЧ = {УЧЬ VЧ2, •••, УЧЬ •••, УЧЬ2} г = 2 .

Но если формирование обучающего подмножества ТС обычно не вызывает трудностей, то как формировать обучающее подмножество ТЧ? Получение ТЧ на основе биометрических образцов произвольных «чужих» пользователей не решает проблему, поскольку ограниченное число Ь2 областей произвольных «чужих» не могут дать ИНС полное «представление» обо всех возможных «чужих». Следова-

V

Искусственная нейронная сеть

тельно, всегда остается вероятность появления такого «чужого» пользователя, область распределения биометрических параметров которого будет воспринята ИНС как «свой» (рис. 2).

Область

«свой»

Область, которая будет восприниматься ИНС как «свой»

Разделяющие

гиперплоскости

Рис. 2. Пример построения ИНС разделяющих гиперплоскостей В предельном, худшем случае многочисленные области «чужой» могут полностью охватывать компактную область «свой», образуя вокруг большую интегральную область «все чужие». Очевидно, что именно на этот предельный случай и следует ориентироваться при обучении ИНС (рис. 3).

Формирование обучающего подмножества ТЧ, моделирующего интегральную область «все чужие» вокруг области «свой» на основе биометрических образцов «реальных чужих» пользователей, на практике встречает известные трудности. Один из вариантов решения этой проблемы изложен в данной работе. Он основан на методе искусственной генерации обучающего подмножества ТЧ, приближенно моделирующего интегральную область «все чужие». Изложение метода проводится для случая наличия одного «своего» пользователя и многих «чужих». Это не нарушает общности, поскольку к этому случаю может быть сведена и задача со многими «своими» пользователями.

Область

Интегральная

область

Рис. 3. Образование интегральной области «все чужие» вокруг области «свой» Метод заключается в следующем. Распределение биометрических векторов Ус,-, 1 = 1,Ц обучающего подмножества ТС в Ж-мерном пространстве обычно близко к распределению Гаусса, следовательно, векторы Ус, лежат внутри Ж-мерной области, которая при Ь ^ ж описывается гиперэллипсоидом рассеивания. При этом центр распределения векторов Ус, находится в точке (§ь |2, •••, |Ж), которая определяется Ж математическими ожиданиями ту1 = ту2 = |2, •••, туЖ = '%Ж- Центральные моменты второго порядка распределения векторов Ус, образуют квадратную матрицу моментов (ковариационную матрицу):

^■11 Л-12 . ..

д = я21 Ху2 . .. ^2 N

Лу1 ^ 2 . .. ^NN

где

а у при ] = к,

со\{V ,,уъ) при ] ф к.

В общем случае компоненты биометрических векторов Ус, коррелированы между собой, и для проведения последующих построений, связанных с метрикой векторов Ус,, необходимо их декоррелирующее преобразование:

Ус = Уа • О1,

где Б-1 - матрица декоррелирующих преобразований, которая находится обращением собственной матрицы Б, состоящей из собственных векторов ковариационной матрицы О. Задача непосредственного определения собственных векторов и обращение матрицы Б для реальных биометрических данных может вызвать значительные вычислительные затраты. Более приемлемой является процедура синтеза декоррелирующей матрицы Б-1 через ортогонализирующее преобразование Грама-Шмидта [2, 3]. Пересечение Ж осей декоррелированного гиперэллипсоида с его поверхностью определят 2Ж точек (Сс/ъ Сс/2), ]' = 1,№, которые аппроксимируют

область рассеивания векторов Ус. Расширим эту аппроксимированную область

на некоторую величину Д, отмеряя ее от точек (Сс/ъ Сс/2) в наружное пространство гиперэллипсоида, вдоль его осей. Результатом такого построения будут новые 2Ж точек (Сся+Д, Сс/2-Д), ] = 1,^ пространства, которые можно рассматривать как ближайшие точки интегральной области «все чужие», окружающей компактную область «свой», т.е. - координаты векторов УЧг.

Величину Д - допуска между областями «свой» и «все чужие» целесообразно задать в виде коэффициента Стьюдента, исходя из величины ошибки первого рода (вероятности Р1 ложного отказа «своему» пользователю):

Д = С[Ьь (1 - Р1)].

Координаты точек (Сс/ь Сс?2), ] = 1,№ определяются соотношениями:

С С]1 = [ т*п ~ck, 1 (т*п ~ск + тах ~ск)];

к=] 2 кф] кф]

С С] 2 = [ тах ~ck, 1 (т1п ~ск + тах ~ск )], к = 1,м-

к= ] 2 кф ] кф ]

Координаты точек (С/ Сч/2), ] = 1Й, в свою очередь, определятся соотношениями:

С ] = [ т‘п~Ск - Д, 1 (™п~ск + тах ~ск)];

к=] 2 кф] кф]

СЧ]2 = [тах ~Ск + Д, 1 (тАп~Ск + тах ~Ck)], ],к = ^

к= ] 2 кф ] кф ]

Полученные точки (С/ Сч2), ] = 1,^ задают координаты векторов

УЧ]1, УЧ] 2 , которые можно использовать в качестве векторов обучающего подмножества ТЧ для задания интегральной области «все чужие»: Уч-, 1 = 1,Ь 2. При

этом размер обучающего подмножества ТЧ будет Ь2=2Ж.

Для иллюстрации метода (рис.4) положим Ж=2. Тогда эллипс рассеивания, аппроксимирующий начало области «все чужие», будет задаваться точками:

СЧ11 = [min~C1 - A, — (min~C2 + max~C2 )];

= [ max vcl + A, 1 (min —C2 + max vC2)];

С ч21 = [min~c2 - A,1 (min~ci + max—a)];

СЧ22 = [maxvC2 + A, 1 (min~C1 + max—C1)], j,k = 1,N.

Такой метод формирования подмножества ТЧ может быть использован при малых размерах подмножества ТС. При больших значениях L1 (20 и более) вычисление координат точек (Счд, Сч2), j = 1,N целесообразно выполнять на основе вероятностных характеристик распределения векторов VCj подмножества ТС.

Введем обозначение k = C[L1 ,(1 - P1)] .

Тогда координаты этих точек (Сч/i , Сч/2), j = 1,N определятся из соотношений

СЧ/1 = [m(~ck)-k■^~k, m(~Ck];

k=j k*j

СЧУ2 = [m(vCk) + k ■~~k, m(—Ck], j,k = 1,N.

k*j

;2 .

k = j

Математическое ожидание m(vCj) и дисперсия — j определяются по формулам:

L1

L

(vCj ) = -12 VCj ,

L1 i=1

1 -^1,

L — 2[~Cj -m(VCj)]2-

Рис. 4. Формирование границ интегральной области «все чужие» Недостатком этих формул является то, что при обучении приходится помнить значения всех измеренных ранее параметров. Эта проблема усугубляется тем, что в неопределенном будущем может понадобиться дообучение биометрической системы и, следовательно, все данные обучения необходимо хранить неопределенно долго. Поэтому более удобными для реализации являются рекуррентные вычисления математического ожидания и дисперсии по формулам:

— I i— 1

'li(vCj ) =^— ■ mi 1

— . 1 — \(vCj) + -■ vCij

— 2 i — 2 — 2 Ст,- =-----—-I +

1

i — 1

1 +—j- ■ [vCij - mi(v Cj )]

При их использовании приходится помнить только общее число уже использованных примеров и текущие значения математического ожидания и дисперсии.

2

На каждом последующем шаге появляется новое значение математического ожидания и запоминается / - число учтенных примеров.

Преимущество метода состоит в возможности приближенного формирования области «все чужие» при малых размерах обучающего подмножества ТЧ (£2=2Ж). Однако это преимущество может и негативно отразиться на точности идентификации. Аппроксимация области «все чужие» ограниченным числом точек (2Ы) может привести в процессе обучения ИНС к неконтролируемым «выбросам» области «свой» в периферийные зоны гиперпространства. При случайном попадании биометрических параметров реального «чужого» в область «выброса» это приведет к ошибке идентификации второго рода (ложный допуск «чужого»). Такую ситуацию в двумерном пространстве иллюстрирует рис. 5.

Моделируемая интегральная область «все чужие»

Реальная область «свой»

Область реального «чужого» в зоне «выброса» области «свой»

Рис. 5. Возникновение ошибки идентификации

Тем не менее, метод позволяет обойти весьма трудную проблему - обучение ИНС без наличия биометрических параметров всех возможных «чужих» пользователей.

Библиографический список

1. Брюхомицкий Ю.А., Казарин М.Н. Система аутентификации личности по почерку / Сборник трудов научно-практической конференции с международным участием «Информационная безопасность». Таганрог: изд-во ТРТУ, 2002. С. 22-29.

2. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений. Пенза: Изд-во ПГУ, 2000. 188 с.

3. Хорн Р., Джонсон Ч. Матричный анализ: Пер. с англ. М.: Мир, 1989. 655

Кулагин О.В.

Россия, г. Пенза, ФГУП ПНИЭИ

ДЕКОМПИЛЯТОР ИСПОЛНЯЕМЫХ МОДУЛЕЙ ПРОГРАММ

Принципы открытой архитектуры средств вычислительной техники, на основе которых строятся разнообразные информационные системы (ИС), делают их весьма уязвимыми для вирусных атак. Защитить ИС от вирусов можно за счет аппаратного выполнения алгоритмов обработки информации (в том числе и при помощи аппаратной компиляции [1], позволяющей напрямую выполнять алгоритм любой программы в виде схемы на ПЛИС), позволяющего исключить процессоры из состава ИС.

Создан прототип аппаратного компилятора (АК), обрабатывающий исполняемые модули программ разных процессоров (для сравнения - все зарубежные АК обрабатывают исходные тексты программ на каком-то одном языке высокого уровня). Его основой является описываемый далее декомпилятор исполняемых модулей программ. Для программ разных процессоров он должен восстанавливать ассемблерный (мнемонический) текст и одновременно формировать текст программы в виде раннеоператорных польских инверсных (постфиксных) записей

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.