Иванов А.И., Малыгин А.Ю, Безяев А.В., Зюзин Ю.М. СИНТЕЗ ТАБЛИЦ ВЕРОЯТНОСТИ ОШИБОК ПЕРВОГО И ВТОРОГО РОДА ДЛЯ НЕЙРОСЕТЕВЫХ ПРЕОБРАЗОВАТЕЛЕЙ БИОМЕТРИЯ-КОД
Приведены таблицы вероятностей ошибок первого и второго рода для биометрико-нейросетевых преобразователей с 25 6 выходами.
При использовании технологии высоконадежной биометрической аутентификации нужно иметь правильную и адекватную вероятностную модель описания выходных состояний нейросетевых преобразователей. Российский национальный стандарт в идеале требует от нейросетевых преобразователей биометрия-код [1 ] независимости (некоррелированности) выходных состояний при тестировании нейронной сети случайными входными образами «Чужой», не знающий пароля, частично скомпрометированными образами «Чужой», знающий одну букву пароля и полностью скомпрометированными образами «Чужой», знающий пароль . Для того, чтобы оценивать вероятности ошибок первого и второго рода нужно знать закон распределения меры Хэмминга разрядов ключа. Исследования показывают, что нельзя обходиться классическим нормальным законом для оценки вероятностей в точках, близких по математическому ожиданию и с.к.о. меры Хэмминга к нулю (образ «Своего»). Хорошо описывает реальные распределения на выходе нейросетевых преобразователей биномиальный зависимый закон, регулируемыми параметрами которого являются вероятность успешного исхода события, число испытаний и коэффициент корреляции.
При испытаниях по оценке вероятности ошибок первого рода макета программного продукта «Нейрокриптон-КПК» было осуществлено 3 0 0 опытов, из них 17 попытки аутентификации оказались неудачными. Прямая оценка вероятности ошибки первого рода составляет Рх«0.057. Математическое ожидание ненормированной меры Хэмминга равно т=0,363, а ее с.к.о. - б=2.59. Гистограмма распределения ненормированной меры Хэмминга для биномиального зависимого закона показано на рис. 1. Для этой ситуации коэффициент парной корреляции генератора составляет г=0.512, вероятность ошибки первого рода Рх*=
0.032.
Для получения гистограмм распределения этого закона проведено имитационное моделирование, при котором на вход коррелятора подаются вектора нормально-распределенных случайных величин с нулевым математическим ожиданием и единичной дисперсией, что соответствует умножению их на некоторую матрицу связности. Нейросетевое преобразование этих векторов и вычисление мер Хэмминга дает распределения, по которым мы оцениваем вероятности ошибок идентификации.
0 2 4 6 8
Рис. 1. Дискретное и непрерывное распределение ненормированной меры Хэмминга для биномиального
зависимого закона макета нейросетевого преобразователя «Нейрокриптон-КПК»
Для практических целей тестирования нейросетевых преобразователей важно оценить вероятности ошибок распознавания для «Своего» и «Чужого» не знающего пароль. Сначала имитационным моделированием определим ошибки первого рода и построим для них таблицу вероятностей. Интервал по матетема-тическому ожиданию выбран - 0,25, по с.к.о. выбран -0.5 исходя из данных тестирования макета «Нейрокриптон-КПК». Таблица построена на 100 0 примерах, что позволяет достоверно оценить 2 значащие цифры, этого вполне достаточно для практики экспресс-тестирования. При полном тестировании воспроизведение 1000 образов «Свой» обычный человек способен осуществить за несколько часов, что естественно неприемлемо.
Таблица X - Вероятности ошибок первого рода (ошибочного отказа «Своему» в идентификации) для биометрико-нейросетевого преобразователя с 25 6 выходами________________________________________
т=0.25 т=0.5 т=0.75 т=1.0 т=1.25 т=1.5 т=1.75 т=2.0
б256=0 ,5 0,06 0.12 0.18 0.28 0.37 0.47 0.59 0.68
б256=1 ,0 0,05 0,1 0,17 0,25 0,34 0,43 0,51 0.61
б256=Х,5 0,04 0,09 0,15 0,22 0,29 0,37 0,47 0.55
б256=2 ,0 0,03 0,09 0,14 0,18 0,26 0,33 0,42 0.5
б256=2 ,5 0,03 0,08 0,12 0,16 0,22 0,3 0,38 0.45
б256=3 ,0 0,03 0,07 0,11 0,15 0,2 0,27 0,34 0.41
б256=3 ,5 0,02 0,06 0,09 0,14 0,19 0,25 0,32 0.38
б256=4 ,0 0,02 0,05 0,08 0,13 0,17 0,23 0,29 0.34
Таблица построена на 1000 примерах, что позволяет оценить только 2 значащие цифрь
По данным таблицы 1 построена номограмма приведенная на рисунке 2, на ней отражены зависимости вероятности ошибок «Своего» от с.к.о. ненормированной меры Хэмминга. Из номограммы видно, что зависимости хорошо линеаризуются, для крайней точки ш(Н2$ =2,0 вероятность отказа «Своему» не
выше 0,7.
Р(Н256)
0,6
0,5
0.4
0,3
0,2
0,1
0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 т(Н256)
Рис. 2. Номограмма зависимости вероятности ошибок «Своего» от с.к.о. ненормированной меры
Хэмминга
То же самое проделаем для образов «Чужого» не знающего пароль. Для получения таблицы зададим шаг по математическому ожиданию - 2 и шаг по с.к.о так же зададим - 2. В отличие от предыдущей, таблица 2, вычисление вероятностей ошибок второго рода требует, кроме знания закона распределения, гораздо большего числа примеров. Здесь приведены десятичные логарифмы вероятности (1одю (Р2)) ошибок распознавания, тоже округленные до второго знака после запятой, сохраняя пригодность для оценки стойкости преобразователя к атакам подбора случайными входными образами.
Таблица 2 - Десятичный логарифм вероятности (logхo (Р2)) ошибок второго рода (ошибочной идентификации «Чужого») для биометрико-нейросетевого преобразователя с 25 6 выходами
т=122 т=12 4 т=12 6 т=12 8 т=13 0 т=132 т=13 4 т=13 6
б256=8 -52.08 -53.76 -55.46 -57.19 -58.95 -60.73 -62.54 -64.38
б256=1 0 -33.81 -34.88 -35.97 -37.08 -38.21 -39.35 -40.52 -41.69
б256=12 -23.85 -24.60 -25.36 -26.13 -26.92 -27.71 -28.52 -29.34
б256=1 4 -17.83 -18.38 -18.94 -19.51 -20.09 -20.68 -21.27 -21.88
б256=1 6 -13.91 -14.33 -14.76 -15.20 -15.65 -16.10 -16.55 -17.02
б256=1 8 -11.21 -11.55 -11.89 -12.24 -12.59 -12.95 -13.31 -13.68
б256=2 0 -9.27 -9.54 -9.82 -10.11 -10.39 -10.68 -10.98 -11.28
б256=22 -7.83 -8.06 -8.29 -8.52 -8.76 -9.01 -9.25 -9.50
Таблица построена на 100000 примерах, что позволяет оценить только 2 значащие цифры
Номограмма зависимости вероятности ошибок «Чужого» от с.к.о. ненормированной меры Хэмминга (рис. 3) тоже демонстрирует почти линейные зависимости. Интервал по вероятности получается от 1010 до 10-65. Видна неравномерность роста Р( Н256) по мере изменения б256 как функции - т.
124 126 128 130 132 134 136
Рис. 3 - Номограмма зависимости вероятности ошибок «Чужого» от с.к.о. ненормированной меры
Хэмминга
Таким образом, полученные таблицы и номограммы биномиального зависимого закона могут использоваться при экспресс-тестировании биометрико-нейросетевых преобразователей с 25 6 выходами. При использовании образов «Свой» и оценке вероятности ошибок первого рода применение экспресс-тестирования сокращает время (трудозатраты) со стороны пользователя в 16 раз. При использовании образов «Чужой» и оценке вероятности ошибок второго рода применение экспресс-тестирования сокращает время тестирования и трудозатраты на формирование больших и сверхбольших баз биометрических образов на десятки порядков.
ЛИТЕРАТУРА
1. Иванов А.И., Надеев Д.Н. Оценка вероятностей состояний выходных разрядов преобразователя
биометрия/код: моделирование закона распределения // Труды научно-технической конференции «БЕЗОПАСНОСТЬ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ» Том № 6, 2005 г., Пенза, изд-во ПНИЭИ, с.41-45.
(http://beda.stup.ac. ги/КУ-соп^у0 6/011)
2. Малыгин А.Ю., Волчихин В.И., Иванов А.И., Фунтиков В.А. Быстрые алгоритмы тестирования нейросетевых механизмов биометрико-криптографической защиты информации /Пенза-2006 г., Издательство Пензенского государственного университета., 121 с.