Научная статья на тему 'Использование линейных разделяющих функций в биометрической идентификации'

Использование линейных разделяющих функций в биометрической идентификации Текст научной статьи по специальности «Математика»

CC BY
134
68
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Кальянова А.И., Демин А.В.

В статье рассмотрен алгоритм биометрической идентификации объектов. Предложен алгоритм формирования вектора биометрических параметров и метод его классификации на «свой» и «чужой», использующий линейные разделяющие функции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кальянова А.И., Демин А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование линейных разделяющих функций в биометрической идентификации»

ИСПОЛЬЗОВАНИЕ ЛИНЕЙНЫХ РАЗДЕЛЯЮЩИХ ФУНКЦИЙ В БИОМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ

А.И. Кальянова Научный руководитель - д.т.н., профессор А.В. Демин

В статье рассмотрен алгоритм биометрической идентификации объектов. Предложен алгоритм формирования вектора биометрических параметров и метод его классификации на «свой» и «чужой», использующий линейные разделяющие функции.

Биометрическую аутентификацию пользователя компьютерной системы во многих случаях можно рассматривать как задачу классификации некоторого N -мерного вектора информативных биометрических параметров

V = {уъуъ...,ур...^ }, ] = Щ (1)

который содержит особенности биометрии данного пользователя.

Способ формирования вектора V и его характеристики определяются типом биометрических данных. Для динамических методов аутентификации личности по рукописному и клавиатурному почеркам компоненты вектора V можно формировать в результате вычисления линейных ортогональных функционалов Фурье, Уолша, Хаара по полной реализации вводимой пользователем парольной фразы [1]. Компоненты вектора V в общем случае обладают внутренней корреляцией. Если биометрическая система находится в режиме обучения, векторы параметров у поступают в блок правил обучения, который формирует биометрический эталон личности. В простейшем случае биометрический эталон может формироваться в виде двух векторов: вектора математических ожиданий контролируемых параметров - т(у) и вектора дисперсий этих параметров ^(у) .

В режиме аутентификации вектор контролируемых параметров у, полученный из предъявленного образа, сравнивается решающим правилом с биометрическим эталоном. Если предъявленный вектор оказывается близок к биометрическому эталону, принимается положительное аутентификационное решение. При значительных отличиях предъявленного вектора и его биометрического эталона осуществляется отказ в аутентификации. Если протокол аутентификации не слишком жесткий, то пользователю предоставляются дополнительные попытки повторной аутентификации [1].

Процедура аутентификации пользователя, т.е. классификации предъявляемого вектора V на «свой» - Vc или «чужой» - Vч, может быть реализована с применением решающего правила, использующего линейные разделяющие функции. Популярность этот класса решающих правил обусловлена пионерскими работами Маккалока и Питт-сона, вышедшими в 1943-1947 годах, и активной поддержкой Винером этого научного направления. Позднее Розенблатт дал доказательство теоремы о возможности обучения персептронов, осуществляющих деление многомерного пространства значений признаков некоторой гиперплоскостью. Персептрон описывается следующими уравнениями:

п

свой при д{-у{ - С} > 0, (2)

¿=1

п

чужой при (^дi ■vi - С} > 0, (3)

¿=1

где - весовые коэффициенты, подбираемые при настройке персептрона (при его

обучении на примерах), С - смещающая гиперплоскость постоянная составляющая (подбирается при настройке) [2].

Персептрон или искусственный нейрон может быть представлен как сумматор входных сигналов и некоторый нелинейный элемент (пороговый элемент - компаратор). Отклик сумматора (линейная часть персептрона) может быть записан в обычной форме:

у = {¿| -V, - С}. (4)

г=1

Аналогично отклик линейной части персептрона может быть записан в векторной форме:

у = |Т • V - С, (5)

где |Т - вектор-строка из п коэффициентов весового суммирования, V - вектор-столбец из п измеренных биометрических параметров.

Удобнее всего рассматривать суть персептронов, реализующих линейные разделяющие правила, на их простейшем варианте с двумя входами. В этом случае задача синтеза оптимального решающего правила сводится к проведению на плоскости прямой, наилучшим образом разделяющей множества биометрических параметров «свой» и «чужой». Пример решения этой задачи приведен на рис. 1.

Рис. 1 иллюстрирует тот факт, что путем вращения и сдвига исходной системы координат иногда удается добиться полного разделения областей «свой» и «чужой», разместив их в разных четвертях новой системы координат. Следует подчеркнуть, что на рис. 1 изображена достаточно простая ситуация с одинаковыми корреляционными связями параметров областей «свой» и «чужой», последнее несколько упрощает задачу в силу параллельности главных осей эллипса «свой» и «чужой». Для ситуации равных корреляционных связей внутри вектора биометрических параметров,

Г Свой = уЧужой (6)

поиск оптимального поворота системы координат совпадает с решением задачи декор-реляции биометрических параметров. Фактически, для получения оптимального преобразования системы координат необходимо домножить вектор входных параметров на соответствующую декорреляционную матрицу В1, ослабляя, насколько это возможно, взаимное влияние биометрических параметров:

у = еТч • В ^ •V - С , (7)

где еТ - вектор-строка единичных весовых коэффициентов.

Соотношение (7) эквивалентно получению весовых коэффициентов персептрона (нейрона) суммированием элементов декоррелирующей матрицы:

I- =¿4-, (8)

г=1

где ф- - элементы декоррелирующей матрицы В-1, / - номер строки элемента матрицы, - - номер столбца соответствующего элемента матрицы В-1.

Следует подчеркнуть, что основным достоинством процедуры вычисления весовых коэффициентов персептрона (нейрона) вида (8) является ее детерминированность. Детерминированность вычислительных процедур является весьма важным свойством для биометрических систем, так как эти системы должны гарантированно обучаться на нескольких предъявленных примерах, а поиск весовых коэффициентов должен быть осуществлен за достаточно малый интервал времени (от 5 до 60 секунд). Процедуры декорреляции, построенные на обращении матриц или их ортогональном разложении, имеют квадратичную сложность, в то время как другие известные алгоритмы, построенные на подборе параметров, имеют экспоненциальную сложность по отношению к числу входов нейрона [3].

В настоящее время известно более сотни алгоритмов стохастического итерационного подбора значений весовых коэффициентов, однако каждый из них следует применять в биометрии с определенной осторожностью. Применение итерационных методов случайного побора весовых коэффициентов линейной части нейрона (персептрона), во-первых, может длиться неограниченное время (зацикливание), во-вторых, могут быть получены ошибочные значения коэффициентов, соответствующие одному из локаль-

ных минимумов функции настройки. Все это делает случайные методы настройки (подбора) нейровесов |- нежелательными в биометрических системах, так как они

достаточно часто приводят систему в один из возможных тупиков настройки.

Рис. 1. Декоррелирующий поворот системы координат, позволяющий добиться

линейной разделимости множеств

Рис. 2. Оптимальное декоррелирующее преобразование системы с учетом внутренних

корреляций разделяемых множеств

Кроме того, различные методы случайного подбора (поиска) коэффициентов | -

следует рассматривать лишь как способы некоторого сокращения времени полного перебора всех возможных комбинаций значений нейровесов. С этой точки зрения детерминированные процедуры вычисления нейровесов через синтез декоррелирующей матрицы и суммирование ее элементов всегда будут иметь максимально возможную скорость поиска решения.

Следует обратить особое внимание на то, что все проведенные выше рассуждения относятся к достаточно простой ситуации, когда область «свой» и область «чужой» имеют одинаковые коэффициенты внутренней корреляции между параметрами (главные оси эллипсов обоих областей параллельны (см. рис. 1). Эта простейшая ситуация

не приводит к неопределенности при синтезе матрицы декорреляции П1 по исходным корреляционным матрицам Ясвои и Ячужои в силу их полной тождественности.

Неопределенность возникает только в том случае, когда Ясвои ^ ячужои. в этом случае преобразование системы координат для устранения корреляционных связей биометрических параметров подлинного пользователя не может привести к аналогичному результату для других пользователей. Выход из этой неоднозначной ситуации состоит в усреднении корреляционных матриц областей «свой» и «чужой», отраженном на рис. 2.

Можно показать, что для областей «свой» и «чужой», соответствующих многомерному нормальному закону распределения значений и имеющих разные коэффициенты корреляции между одноименными параметрами, оптимальным является преобразование системы координат, диагонализирующее корреляционную матрицу

Я = ( ясвои + ячужои )/2. (9)

При диагонализации матрицы (9) получается новая система координат ± у, в которой коэффициенты корреляции между параметрами в двух разделяемых областях совпадают по модулю, но имеют разные знаки:

^ ГСвои = — ^ гЧУжои (10)

Естественно, что стартовые условия для синтеза декоррелирующей матрицы в виде (10) оказываются достаточно точны только для нормального многомерного закона распределения значений. Однако с ростом размерности матриц необходимость в гипотезе о нормальном распределении ослабевает, так как сказывается эффект нормализации суммы большого числа случайных отклонений. Сказывается то, что диагонализа-ция корреляционной матрицы выполняется не сама по себе, а только с целью последующего суммирования линейной частью персептрона.

Кроме подбора весовых коэффициентов искусственного нейрона (персептрона), еще одной важной задачей является правильный выбор смещающей постоянной составляющей. Глядя на рис. 1 и 2, нетрудно убедиться в том, что произвольное изменение значения постоянной составляющей С приводит к появлению множества параллельных разделяющих прямых. Необходимо, исходя из некоторых соображений, выбрать одну из множества разделяющих прямых. В общем случае эта задача оказывается неоднозначной и достаточно сложной, но она имеет простое точное решение в рамках гипотезы нормального закона распределения плотностей (р(у)}свои и (р(у)}чужои. Если гипотеза нормального закона хорошо выполняется, то постоянная С может быть найдена путем проведения разделяющей линии через точку равновероятных ошибок первого и второго рода. Эта ситуация отображена на рис. 3.

1 РО) «Свой»

У -Р-

о я1! С т*

Рис. 3. Размещение разделяющей линии (гиперплоскости) так, чтобы ее проекция совпала с точкой равновероятных ошибок первого и второго рода

Точка равновероятных ошибок первого рода (отказ подлинному владельцу биометрии) и ошибок второго рода (пропуск злоумышленника) находится из условия

Р1 = Р2 , (11)

где Р1 - площадь хвоста распределения «свой», отсеченного справа порогом С, Р2 -площадь хвоста распределения «чужой», отсеченного слева порогом С на рис. 3.

В свою очередь, выполнения (11) можно легко добиться, зная значения весовых коэффициентов . Для этого достаточно предъявить почти настроенному персептрону несколько примеров подлинных биометрических образов и математическое ожидание т1 и стандарт отклонения о1 области «свой». Кроме того, необходимо предъявить почти настроенному персептрону несколько образов биометрии «чужой» и вычислить для них математическое ожидание т2 и стандарт отклонения о2 . После этого точка равновероятных ошибок находится путем деления отрезка [т1, т2] пропорционально стандартам о1 и о2 . Расстояние до точки С от центра биометрического эталона может быть вычислено следующим образом:

|т,( у) - С№.( >•)•""'( У\-"2™. (12)

О1( У) + О2( У)

Аналогично может быть вычислено расстояние от проекции разделяющей линейной функции (дискриминанты) до центра второй области «чужой»:

✓ ч ✓ ч I т1(у) - т2(у) | | т2 (у) - С |= о2 (у) •-^. (13)

О1(У) + О 2 (У)

Очевидно, что, пользуясь уравнениями (12), (13), нетрудно найти положение проекции линейной разделяющей функции (гиперплоскости), близкое к оптимальному. При необходимости положение проекции разделяющей линии дополнительно может быть уточнено путем требуемого изменения соотношения между вероятностями ошибок первого и второго рода. Проекция линии (гиперплоскости) может быть сдвинута в любую сторону из точки равновероятных ошибок [1]/

Система биометрической аутентификации на основе линейных разделяющих функций обладает рядом неоспоримых преимуществ.

По сравнению с геометрическими методами распознавания точность аутентификации с помощью линейных разделяющих функций возрастает, вследствие более точной аппроксимации области распределения векторов Ус. Повышение точности «оплачивается» при этом дополнительным объемом вычислений. Вместе с тем, дополнительные вычисления производятся по стандартным фиксированным процедурам и могут быть реализованы в масштабе времени, близкому к реальному.

Литература

1. Иванов А.И. Биометрическая идентификация личности по динамике подсознательных движений: Монография./ Пенза, Изд-во Пенз. гос ун-та, 2000. 188 с.

2. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991. 432 с.

3. Цыпкин ЯЗ. Основы информационной теории идентификации. М.: Наука, 1984. 320 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.