Извлечение биометрических данных при рукописном вводе текста

Ажмухамедов Искандар Маратович; Варварина Светлана Вадимовна

УДК 004.056.53

И. М. Ажмухамедов, С. В. Варварина Астраханский государственный технический университет

ИЗВЛЕЧЕНИЕ БИОМЕТРИЧЕСКИХ ДАННЫХ ПРИ РУКОПИСНОМ ВВОДЕ ТЕКСТА

Введение

Биометрические методы аутентификации личности можно разделить на два типа - статические и динамические.

Статические системы используют в качестве признаков неизменные данные личности -отпечаток пальца, геометрия лица, радужная оболочка глаза и т. д.

Динамические системы основаны на использовании в качестве признаков некоторых динамических параметров и характеристик личности. Одной из таких характеристик является динамика рукописного почерка.

Биометрические системы, построенные на анализе рукописного почерка, являются весьма перспективными. Это связано в первую очередь с тем, что подобные системы не требуют применения дорогостоящего оборудования. Кроме того, данный способ привычен для человека, и, как следствие, отсутствует проблема социальной неприемлемости метода.

Разработка надежных алгоритмов, использующих ввод рукописного текста в качестве признака аутентификации, требует тщательной теоретической проработки вопросов, связанных с технологией построения подобных систем, что поможет увеличить их эффективность.

Изучению данного вопроса посвящено несколько работ отечественных [1-3] и зарубежных авторов [4]. Однако многие вопросы остались без должного внимания. В частности, рассмотрены далеко не все возможные математические преобразования для извлечения информативных данных из исходной биометрической информации и не проведена их оценка. Кроме того, не уделено должного внимания сравнению различных алгоритмов принятия решения об аутентификации. Недостаточно проработаны вопросы, связанные с влиянием стабильности почерка человека на результат аутентификации.

Выбор параметров для биометрической идентификации

При биометрической идентификации на основе ввода рукописного текста анализируются зависимости движения пера по осям X и У от времени. Важным моментом на этом этапе является точность измерения, поэтому промежутки времени между измерениями должны быть очень короткими.

Следующим этапом после получения функций Х(0 и У(У) является извлечение биометрических данных. Функции Х(0, У(0 можно трактовать как описание процессов, протекающих в интервале 0 < ^ < Т, соответствующем времени воспроизведения текста (пароля).

Именно поэтому эти функции можно представить, например, в виде ряда Фурье с некоторым конечным числом членов разложения п:

п п

X (*) = а0 + £ аХ1 совО^) + £ ЬХ1, (1)

¡=1 ¡=1

пп

У (() = «0 + £ ауг С08(7Ю0^) + £Ьу, 8Ш(,Ю00 , (2)

¡=1 ,=1

где ю0 = - основная угловая частота; а0, ах,, Ьх,, ау,, Ьу, - коэффициенты разложения.

Коэффициенты разложения вычисляются по следующим формулам:

1 т

ахк = т IХ (0СО8(к—№, (3)

т 0 т

1 т

Ьхк = -1Х(08Ш(*—Х)&, (4)

т 0 т

1 T 2П

ayk = T ÍY (t)cos(k Tt)dt, (5)

T 0 T

1 T 2p

byk = 7JY(t)sin(k—t)dt, к = 1 ... « (6)

T о T

и являются искомыми информативными параметрами для процедуры аутентификации биометрической системы.

В упомянутых выше работах анализ динамики почерка сводится к анализу этих коэффициентов при « = 16 или « = 32.

Однако использование других представлений функций X(t), Y(t) может дать более информативные результаты.

Рассмотрим преобразования Хартли. Для него базисными также являются тригонометрические функции. Но образуются они иначе, чем для преобразований Фурье. Базисные для преобразований Хартли функции обозначаются как cas x:

cas x ° cos x + sin x.

Для функций X(t), Y(t) преобразование Хартли принимает вид:

п

X (t) = £ hx1cas{iWoot ), (7)

i=0

п

Y (t) = £ hy.cas(iWot ), (8)

i=0

2p

где w0 = ; cas(x) ° cos x + sin x ; п - некоторое конечное число членов разложения.

Обратное преобразование Хартли:

1 T 2Р

hA = - J X(t)cas(k T t)dt, (9)

T 0 T

1 T 2p

hyk = - J Y(t)cas(k—t)dt, (10)

T 0 T

к = 1 ... «,

где, по определению, cas(2pk« / N )= cos(2pk« / N )+sin (2pKn / N )

Другим представлением результатов может служить функция Z (t) = X (t ) • Y (t ), являющаяся суперпозицией функций X(t) и Y(t). Разложение в ряд Фурье для этой функции будет

иметь вид

п

Я({) = Е ая С08(/Ю</) + Е Ьгг , (11)

г=1 г=1

2л

где ю0 = ; П - некоторое конечное число членов разложения.

Коэффициенты разложения вычисляются по формулам:

1 т 2Р

агк = т IХ(*)'7(0сов(к, (12)

т 0 т

1 т 2р

Ъгк = тIX(0' 7(081и(к■— №, (13)

т 0 т

где к = 1 ... п .

Коэффициенты разложения ахг, Ъх, ауг, Ъу, агЬ ЪгЬ Су йу кхЪ куг, вычисленные для п членов разложения согласно формулам (3)-(6), (9)-(10) или (12)-(13), в совокупности рассматриваются как Л-мерный вектор информативных биометрических параметров V = (VI, у2, ..., }.

Вектор V является исходным для последующей процедуры аутентификации, которой предшествует этап обучения системы.

Процедура аутентификации

Биометрический эталон формируется на этапе обучения и должен отражать как стабильную, так и нестабильную составляющие биометрических данных идентифицируемой личности. Роль биометрического эталона может играть вектор значений математических ожиданий измеряемых динамических параметров и вектор значений дисперсий этих параметров.

Они могут формироваться несколькими способами в зависимости от принятого в системе решающего правила. Удобным для реализации является рекуррентное вычисление математического ожидания:

При использовании выражения (14) приходится помнить только общее число уже использованных примеров и текущее значение математического ожидания. На каждом последующем шаге появляется новое значение математического ожидания и запоминается текущее г - число учтенных примеров.

Аналогичная ситуация возникает и при вычислении дисперсии контролируемых параметров. Наиболее удобно рекуррентное вычисление дисперсии:

После того как сформирован биометрический эталон, возможна реализация процедур аутентификации зарегистрированного пользователя.

Процедура аутентификации может строиться различными способами. В [2-4] для анализа близости вектора V к эталону предлагается использовать меру Хэмминга.

Пусть система при идентификации осуществляет измерение вектора V = (уь у2, ..., уЛ), состоящего из Л существенно коррелированных биометрических параметров. На этапе обучения пользователь предъявил Ь своих динамических образов, что соответствует Ь реализациям векторов биометрических параметров V;.

На этапе аутентификации пользователь предъявляет подпись, которой будет соответствовать некоторый вектор информативных биометрических параметров и = (щ, и2, ..., иЛ). Система аутентификации производит анализ предъявленных параметров иг (г = 1 ... Л) на попадание в установленные биометрическим эталоном интервалы пользователя, зарегистрированного под заявленным именем, формируя вектор Е = (еь е2, ., еЛ}.

Если параметр иг попадает в интервал, то ег = 0, в противном случае ег = 1. В результате для претендента на доступ будет сформирован вектор Хэмминга Е.

Для «своего» пользователя этот вектор должен состоять практически из одних нулей. Для «чужого», предъявившего иные биометрические параметры, вектор Е будет иметь много несовпадений с биометрическим эталоном (много единиц).

Абсолютное значение расстояния Хэмминга Еи до биометрического эталона определяется как общее число несовпадений с биометрическим эталоном. Расстояние Хэмминга Еи всегда положительно и может изменяться от 0 до Л.

При объеме обучающей выборки в 5 и более примеров становится целесообразным вычисление математического ожидания значений параметров т(уг ) и их дисперсий а2(уг- ). В этом случае значение минимальной и максимальной границ принято вычислять следующим образом:

(14)

(15)

ш1и(у; ) = т(Уу) - 5 [Ь,(1 - р)]' а2 у ), тах(у;-) = т(Уу) + 5 [Ь, (1 - Р,)]а2 у),

(16)

(17)

где L — число использованных при обучении примеров; P1 — заданное значение вероятности ошибок первого рода; S (L, (1 - Pi)) — коэффициенты Стьюдента.

При осуществлении процедур аутентификации «свой» пользователь редко ошибается и, соответственно, мера Хемминга оказывается малой. При попытках аутентификации «чужих» пользователей ошибки оказываются гораздо более частыми.

При использовании достаточно большого числа контролируемых биометрических параметров распределение значений меры Хэмминга близко к нормальному. В этом случае пороговое значение меры Хэмминга Еп можно определить через математическое ожидание и дисперсию значений меры Хэмминга для «своего» пользователя Ес:

Еп = ш(Ес) + S (L,(1 - Р))с2(Ес ), (18)

где S(L, (1 — P1)) - коэффициент Стьюдента, задаваемый из числа использованных примеров L и величины ошибки первого рода (вероятности P1 ложного отказа «своему» пользователю).

Вопрос о применимости изложенных выше подходов для практической реализации в системах аутентификации не нашел отражения в литературе, поэтому требует экспериментальной проверки.

Выводы

Результаты исследования позволяют приступить к созданию программного продукта с целью проверить впоследствии применимость сочетания различных представлений измеряемых биологических параметров при аутентификации пользователей на основе анализа динамики вводимого рукописного текста.

СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Иванов А. И. Биометрическая идентификация личности по динамике подсознательных движений. -Пенза: Изд-во Пенз. гос. ун-та, 2000. - 48 с.

2. Брюхомицкий Ю. А., Казарин М. Н. Параметрический метод обучения биометрических систем аутентификации по клавиатурному и рукописному почеркам // Искусственный интеллект. Интеллектуальные и многопроцессорные системы-2004: Материалы Междунар. науч.-техн. конф. - Таганрог, 2004. - С. 327-332.

3. Залманзон Л. А. Преобразование Фурье, Уолша, Хаара и их применение в управлении и других областях. - М.: Наука, 1989. - 495 с.

4. Plomondon R., Lorette G. Automatic signature verification and writer identification - the state of the art // Pattern Recognition. - 1989. - 22, N 2. - Р. 107-131.

Статья поступила в редакцию 28.11.2007

THE EXTRACTION OF BIOMETRIC DATA AT HAND-WRITTEN INPUT OF THE TEXT

I. M. Azhmukhamedov, S. V. Varvarina

The technique of the extraction of biometric data at hand-written input of the text is described in the paper. Various mathematical transformations for the extraction of informative data from the initial biometric information are considered, and their estimation is given. The mechanism of the formation of a vector of informative biometric parameters, which is initial for autentification procedure, is also described. At the development of a biometric standard both stable and not stable component of biometric data of the identified person is considered. During autentification it is offered to use the vector of Hamming that allows to lower a probability of errors of the first and second sort.

Извлечение биометрических данных при рукописном вводе текста Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Ажмухамедов Искандар Маратович, Варварина Светлана Вадимовна

Похожие темы научных работ по математике , автор научной работы — Ажмухамедов Искандар Маратович, Варварина Светлана Вадимовна

THE EXTRACTION OF BIOMETRIC DATA AT HAND-WRITTEN INPUT OF THE TEXT

Текст научной работы на тему «Извлечение биометрических данных при рукописном вводе текста»