Научная статья на тему 'Особенности тестирования биометрико-нейросетевых преобразователей после их обучения'

Особенности тестирования биометрико-нейросетевых преобразователей после их обучения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
107
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов А. И., Безяев В. С., Надеев Д. Н., Зюзин Ю. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Особенности тестирования биометрико-нейросетевых преобразователей после их обучения»

Иванов А.И. , Безяев В.С., Надеев Д.Н, Зюзин Ю.М. ОСОБЕННОСТИ ТЕСТИРОВАНИЯ БИОМЕТРИКО- НЕЙРОСЕТЕВЫХ ПРЕОБРАЗОВАТЕЛЕЙ ПОСЛЕ ИХ ОБУЧЕНИЯ

На конкретных примерах иллюстрируется необходимость ускоренного тестирования нейросетевых преобразователей биометрия-код после их обучения.

В настоящее время мировое сообщество в лице международного комитета по стандартизации 1Б0/1ЕС .1ТС1 БС37 разработало порядка 50 биометрических стандартов, регламентирующих требования к биометрическим фрагментам нового поколения паспортно-визовых документов. Все эти стандарты ориентированы на использование относительно слабых классических решающих правил с окончательной формализацией решения в форме «последнего» бита ДА/НЕТ. Из-за слабости биометрии с классическими решающими правилами она не предназначена для работы в полностью автоматическом режиме. Все международные биометрические стандарты ориентированы на то, что соответствующая система полуавтоматической биометрической идентификации человека работают под управлением контролирующего их человека. Контролирующий должен убедиться в том, что проверяемый правильно предъявляет биометрический образ «Свой» и если автомат ошибся, то контролирующий человек в праве отменить решение автомата. В связи с принятой выше идеологией для систем с относительно слабой биометрии не предусмотрено их экспресс тестирование после каждого обучения. По умолчанию предполагается, что общего тестирования системы достаточно [1 -5].

Положение резко меняется при переходе к использованию средств полностью автоматической высоконадежной биометрической аутентификации. При применении средств этого типа национальный стандарт РФ [6] безоговорочно требует проведения экспресс тестирования после каждого их обучения. Последнее связано с тем, что пользователь может неосознанно выбрать очень слабый биометрический пароль и в место высоконадежной защиты получит очень слабую биометрическую защиту. После каждого обучения высоконадежное средство биометрической защиты должно автоматически осуществлять экспресс контроль своей стойкости и предупреждать пользователя о значении реальной стойкости его биометрического образа.

Для примера рассмотрим два рукописных биометрических пароля «Пенза», написанных двумя разными почерками и использованных при обучении нейросетевого преобразователя биометрия-код. Очевидно, что разные почерка будут иметь различную стабильность воспроизведения одного и того же слова. Кроме того, каждый почерк будет иметь свой уровень уникальности динамики воспроизведения каждой конкретной буквы слова-пароля и соединений между соседними буквами.

Для того, что бы оценить стойкость нейросетевой защиты, обученной на первом почерке подадим на входы обученной нейронной сети тестовую последовательность из 3 0 0 примеров образов «Чужой». Тестовая выборка формировалась почерками разных людей, которые воспроизводили рукописно 300 случайно выбранных из словаря слов, имеющих длину от 4 до 7 букв. Так как слова выбирались случайно, то и выходные коды нейросети оказываются случайными. Для сравнения выходных кодов воспользуемся мерой Хемминга - числом не совпавших разрядов контролируемого кода и кода ключа обучения.

Так как выходные коды тестовой выборки случайны наиболее вероятное значение меры Хемминга для них составляет 128 (половину длины всего кода - 256 бит) . «Чужой» случайно угадывает примерно половину разрядов выходного кода, но он не знает какие разряды кода ключа ему удалось угадать. Гистограмма распределения меры Хемминга для первого почерка приведена на рисунке 1.

0.04

0.02

0 О 50 100 150 200 250

Рис. 1. Гистограмма распределения значений меры Хемминга и описывающий ее нормальный закон распределения для первого почерка

Гистограмма меры Хемминга отклонений случайных кодов от кода ключа обучения для второго почерка приведена на рисунке 2. Сравнивая рисунок 1 и рисунок 2 легко убедится в том, что дисперсия

распределения расстояний Хемминга для второго почерка существенно выше, чем для первого почерка.

Это означает, что стойкость к атакам подбора нейросетевой защиты, обученной на втором почерке ниже, чем на первом почерке.

0.04

0.03

0.02

0.01

J 0 0 3>0 100 150 200 250

Рис. 2. Гистограмма распределения значений меры Хемминга для второго почерка на фоне нормальных плотностей распределения значений двух почерков

Проведенные исследования показали, что для корректно спроектированного и корректно обученного

нейросетевого преобразователя распределения меры Хемминга случайных кодов «Чужой» с высокой точностью описывается нормальным законом распределения значений. В связи с этим вероятность ошибок второго рода для распределений значений меры Хемминга может быть вычислена следующим образом:

Р2 *0.5-Ф0(TV1) = 0.5-Ф0(9) (1), a(I )

где Ф0 (.) - функция Лапласа; m(H) - математическое ожидание меры Хемминга; б(Н) - среднеквад-

ратическое отклонение меры Хемминга; q - качество разделения множеств «Свой» и «Чужой».

Необходимо отметить, что для высоконадежных средств биометрико-нейросетевой аутентификации вероятности ошибок второго рода крайне малы, что затрудняет использование таблиц функций Лапласа, обычно приводимых в справочниках. В связи с этим мы ниже приводим номограмму перевода качества разделения образов «Свой», «Чужой» в логарифм вероятности ошибок второго рода (рис. 3).

Рис. 3. Номограмма связи показателя качества - q с десятичным логарифмом вероятности ошибок второго рода.

Для практических целей в место номограммы, приведенной на рисунке 3 можно использовать ее квадратичное приближение. Связь показателя качества с показателем степени вероятности ошибок второго рода хорошо описывается квадратичной аппроксимацией. То есть для практических вычислений можно использовать следующую формулу:

О 1 л-(0.87+0.221 о2)

Р2 - 10 (2)

или

1оё10(Р2)--0.87 - 0.221-ц2 (2а).

В том случае, когда требуется оценивать стойкость биометрико-нейросетевой защиты к атакам подбора (обратную величину вероятности ошибок второго рода) достаточно изменить знак функции номограммы рисунка 3. Соответственно в аппроксимирующем функцию связи квадратичном полиноме необходимо сменить знаки:

Щ - 10(а87+0221 ■ ^ (3)

или

1о^10(Л^2) - 0.87 + 0.221-ц2 (3а)

Применительно к ситуации, отображенной на рисунке 1 качество составляет величину 10.67, что соответствует N2 -1026 . Для ситуации отображенной на рисунке 2 качество существенно ниже и составляет 5.82, что соответствует N2 ~108'4 Примерно двукратное снижение качества решения приводит к потере примерно 18 порядков стойкости биометрико-нейросетевой защиты к атакам подбора. Именно по причине возможного существенного ослабления системы защиты из-за неудачного обучения необходимо после каждого обучения осуществлять ускоренное тестирование стойкости защиты или вероятности ошибок второго рода.

ЛИТЕРАТУРА

1. 1Б0/1ЕС 1.37.197 95 Процедуры выполнения тестирования и отчетов в биометрии.

2. 1Б0/1ЕС 1.37.197 95.1 Процедуры выполнения тестирования и отчетов в биометрии. Часть 1:

Принципы и структура.

3. 1Б0/1ЕС 1.37.197 95.2 Процедуры выполнения тестирования и отчетов в биометрии. Часть 2: Методики тестирования.

4. 1Б0/1ЕС 1.37.197 95.3 Процедуры выполнения тестирования и отчетов в биометрии. Часть 3: Специальные методики тестирования.

5. 1Б0/1ЕС 1.37.197 95.4 Процедуры выполнения тестирования и отчетов в биометрии. Часть 4: Специальные программы тестирования.

6. ГОСТ Р 52633.0 - 2006 «Защита информации. Техника защиты информации. Требования к средствам высоконадежной биометрической аутентификации».

i Надоели баннеры? Вы всегда можете отключить рекламу.