Научная статья на тему 'Симметрия биномиального зависимого закона распределения относительно среднего модуля коэффициентов корреляции входных данных преобразователя биометрия/код'

Симметрия биномиального зависимого закона распределения относительно среднего модуля коэффициентов корреляции входных данных преобразователя биометрия/код Текст научной статьи по специальности «Математика»

CC BY
88
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Надеев Д. Н., Иванов А. И., Малыгин А. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Симметрия биномиального зависимого закона распределения относительно среднего модуля коэффициентов корреляции входных данных преобразователя биометрия/код»

Надеев Д. Н., Иванов А.И., Малыгин А.Ю.

СИММЕТРИЯ БИНОМИАЛЬНОГО ЗАВИСИМОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ ОТНОСИТЕЛЬНО СРЕДНЕГО МОДУЛЯ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ ВХОДНЫХ ДАННЫХ ПРЕОБРАЗОВАТЕЛЯ БИОМЕТРИЯ/КОД

Проблема доказательства соответствия распределений кодов «ВСЕ Чужие» зависимому биномиальному закону связана с тем, что реальные выходные коды многомерных нейросетевых преобразователей не могут иметь однозначных коэффициентов парной корреляции. Они всегда имеют некоторое практически непрерывное распределение значений коэффициентов парной корреляции р(г) (см. рисунок 1) . Естественно, что это распределение будет иметь моду и математическое ожидание. Для симметричных функций распределения значений они совпадают, однако в более общем случае несимметричных функций распределения значений мода и математическое ожидание перестают совпадать.

Из проведенных экспериментов установлено, что дисперсия меры Хемминга, как и сам закон распределения значений меры Хемминга множества «ВСЕ Чужие», сильно зависит от связанности (коррелиро-ванности) разрядов случайных кодов. Возникает вопрос о том какова эта связь. Необходимо путем численных экспериментов идентифицировать эту связь.

Для идентификации вида связи, например, а(г) были сделаны проверки на чувствительность зависимости к знаку коэффициентов парной корреляции.

^ Аппроксимация закона распределения выходного кода

Функция р аспр ед ел ения ^ разрядов выходного кода

о J 1

Рис. 1. Гистограмма распределения коэффициентов парной корреляции выходных кодов «ВСЕ Чужие» преобразователя «Нейрокриптон», предварительно обученного на рукописном образе слова «Пенза»

Для этой цели сравнивались значения о (г) и вид функций распределения значений p (Н) для всех положительных коэффициентов:

ri,2 =+0.5, ri,3 =+0.5, ri,4 =+0.5,.., ri,j =+0.5;

для всех отрицательных коэффициентов:

ri,2 =-0.5, ri,3 =-0.5, ri,4 =-0.5,.., ri,j =-0.5;

для коэффициентов поочередно изменяющих свой знак: ri,2 =+0.5, ri,3 =-0.5, ri,4 =+0.5,.., ri,j =±0.5.

Результаты численного эксперимента показали, что знаки коэффициентов парной корреляции вообще не влияют на вид закона распределения значений и его дисперсию. То есть с точностью до ошибки, определяемой конечной обучающей выборкой, выполняется тождество:

о( r =+0.5 ) = о( r = -0.5 ) = о( r = ± 0.5 ) (i)

В точке r = ± 0.5 форма закона распределения значений p (Н, р=0.5) равномерная и она продолжает оставаться равномерной при любом распределении знаков коэффициентов парной корреляции. Неизменность формы плотности распределения значений - p (n, Н, р=0.5, |r| = 0.5) проще всего констатиро-

вать именно при наблюдении равномерного закона распределения значений как самого простого.

При других значениях модулей коэффициентов корреляции соотношение (1) и неизменность формы p(n, Н, р=0.5, |r | = 0.5) продолжает выполняться. Это означает, что тождество (1) может быть за-

писано в более общем виде:

о ( + r ) = о ( -r ) = о ( ±r ) = о (|r|) (2).

Аналогичное соотношение может быть записано и для функций распределения значений в центральной точке симметрии:

p(n,^ р=0.5, +r ) = p(n,^ р=0.5, -r ) = p(n,Н, р=0.5, ±r ) = p(n,Н, р=0.5, | r | ) (3),

а так же в любой иной точке:

p(n,^ р, + r ) = p(n,Н, р, -r ) = p(n,Н, р, ±r ) = p(n, Н, р, | r| ) (4).

Подчеркнем, что все выше сказанное выполняется только для одинаковых по модулю коэффициентов корреляции, имеющих разные знаки.

В случае, если модуль коэффициентов парной корреляции может принимать несколько значений, например |r| = 0.0, 0.25, 0.5 , то ситуация усложняется, и мы будем получать разные значения дисперсий и разные функции плотности распределения значений в зависимости от вероятности состояний |r| = 0.0, 0.25, 0.5. То есть можно говорить только о том, что дисперсии и функции плотности распределения значений будут совпадать при совпадении плотностей распределения значений модулей коэффициентов парной корреляции.

Для учета множества возможных значений состояний можно было бы выполнять весовое суммирование результата каждой компоненты. Наиболее просто это осуществляется через синтез необходимого числа примеров с заданными значениями коэффициентов парной корреляции, объединением всех примеров в одну тестовую группу и последующее ее статистическое исследование.

Рис. 2. Эволюция функции распределения корреляции выходного кода в диапазоне 0.05 (| г| ( 0.99

Более сложным путем является синтез специальных генераторов, которые дают выходные коды с заранее заданным распределением значений коэффициентов парной корреляции. В обоих случаях нужно учитывать обстоятельство, что при определении вероятности появления разных значений корреляции (второго уровня вероятностного моделирования) характеристики распределения изменяются (см. рис. 2), происходит рост дисперсии по мере приближения корреляции к единице. Если бы для всех коэффициентов корреляции выполнялось условие единообразия распределения, то о речь бы шла о простом применении принципа суперпозиции, как для случая линейных систем. Но при тестировании биометрических преобразователей мы имеем дело с (в первую очередь) нелинейными объектами, для которых было получено, что значения корреляции для данных, находящихся вблизи (на малых расстояниях по Хэммингу) к образу «СВОЙ», будут увеличивать долю неклассических компонент в распределении значительнее, чем коэффициенты с меньшими значениями. Поэтому важно при построении аппроксимаций распределений выходных разрядов системы определять уровень корреляции входных данных при симметричном биномиальном зависимом законе и проводить численные эксперименты по проверке гипотезы закона распределения для разных значений модуля коэффициентов парной корреляции.

ЛИТЕРАТУРА

1. Проект ГОСТ Р (ТК3 62, первая редакция) «Защита информации. Техника защиты информации. Требования к высоконадежным биометрическим средствам аутентификации» Пенза-Воронеж-2 00 5 г. , ФГУП ПНИЭИ, ГНИИИ ПТЗИ ФСТЭК России.

i Надоели баннеры? Вы всегда можете отключить рекламу.