Научная статья на тему 'Учет уровня неопределенности малых биометрических выборок при многомерных статистических оценках'

Учет уровня неопределенности малых биометрических выборок при многомерных статистических оценках Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
80
39
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Серикова Н. А., Качалин С. В., Перфилов К. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотр
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Учет уровня неопределенности малых биометрических выборок при многомерных статистических оценках»

7. Дядьков Н.А. Взаимнокорреляционная функция рассеянных протяженной поверхностью сигналов, принятых на разнесенные антенны / Н.А. Дядьков Известия вузов России. Радиоэлектроника. Специальный выпуск "60 лет Институту радиоэлектроники и информационных технологий - РТФ Уральского федерального университета" 2012. С. 31-36.

8. Калмыков Н.Н. Результаты отработки алгоритмов когерентной импульсно-доплеровской радиовысо-томерной системы с расширенными функциональными возможностями и повышенной скрытностью излучения / Н.Н. Калмыков, В.И. Вербицкий, В.Г. Важенин, Л.И. Пономарев, С.А. Мельников, Н.А. Дядьков Ра-диовысотометрия - 2010: сборник трудов Третьей Всероссийской НТК. Екатеринбург: Форт Диалог-Исеть, 2010 . С. 66 - 71.

9. Белов А.Г. Обеспечение влагозащитного покрытия печатных узлов датчика протечки / Белов А.Г., Баннов В.Я., Трусов В.А., Кочегаров И.И., Лысенко А.В., Горячев Н.В., Юрков Н.К. // Труды международного симпозиума Надежность и качество. 2014. Т. 2. С. 151-154.

10. Важенин В.Г. Результаты отработки алгоритмов функционирования и перспективы применения комбинированных радиолокационных измерителей в составе бортового комплекса управления полетом летательного аппарата / В.Г. Важенин, Н.А. Дядьков, Ю.А. Иванов и др. Вестник Южно-Уральского государственного университета. Серия «Компьютерные технологии, управление, радиоэлектроника». Вып. 14. 2011. С. 116-119.

УДК 57.087.1

Серикова Н.А., Качалин С.В., Перфилов К.А.

ФГБОУ ВПО «Пензенский государственный университет», Пенза, Россия

УЧЕТ УРОВНЯ НЕОПРЕДЕЛЕННОСТИ МАЛЫХ БИОМЕТРИЧЕСКИХ ВЫБОРОК ПРИ МНОГОМЕРНЫХ СТАТИСТИЧЕСКИХ ОЦЕНКАХ

В системах распознавания биометрических образов человека используется порядка 512 признаков. Наиболее эффективным для решения задачи на сегодняшний день является аппарат искусственных нейронных сетей [1-6]. Эффективность применения искусственных нейронных сетей при анализе биологических и биометрических данных обусловлена тем, что они способны обучаться, подстраиваясь под особенности объекта исследования. Чем больше размерность используемой при обработке данных искусственной нейронной сети, тем эффективнее оказывается обработка биометрических данных. Предположительно, что новые методики нейросетевой обработки данных, созданные в период с 2000 года по настоящее время, найдут применение и для обработки экспериментально полученных биологических данных.

Первой из основных проблемой биометрии на сегодня является обучение болыпи:': нейронных 1

сетей на малых обучающих выборках, содержащих параметры от 11 до 21 примеров распознаваемого образа. Второй из основных проблемой является проблема надежного тестирования полученных результатов нейросетевой обработки на тестовых выборках из ограниченного объема от 21 до 42 примеров [2].

Очевидно, что чем больше реальных данных в обрабатываемой выборке, тем точнее получится результат. То есть путем численного моделирования можно спрогнозировать величину интервала относительной ошибки вычисления математического &Е(г1)

ожидания

как функцию от числа данных в

а(у1)

используемой выборке для нормального закона распределения значений [3]. Эти зависимости при разном значении коэффициента доверия отображены на рисунке 1.

АЕ 6

Р=0,99 /

Р=0,< )5

/

Р= =0,90

Рисунок 1 - Номограммы нормированной по среднеквадратическому отклонению интервал ошибок, установленный с доверительной вероятностью 0.99, 0,95 и 0.90

Аналогичным образом можно получить относительное значение ожидаемого интервала ошибки вычисления среднеквадратического отклонения. 1

Кривые связи ошибки среднеквадратического отклонения и размеров исследуемой выборки приведены на рисунке 2.

0.8

0.Ö

0.4

0.2

Л6 6

Р=0.99

¿Р=0.95

Р=0.90

10

20

30

40

50

00

70

S0

Рисунок 2 - Относительная ошибка оценки среднеквадратического отклонения для интервалов, соответствующих доверительной вероятности 0.99, 0,95 и 0.90

Третьим из младших статистических моментов являются коэффициенты корреляции. Связь относительной ошибки оценки значения коэффициентов

корреляции биометрических параметров исходных данных дана на рисунке 3.

с объемом

1

0.8

0.2

0

Ar г 5S = 00

\ 2

vX = 0.4

/ г = 0.8

10 20 30 40 50 ои |и аи ки п

Рисунок 3 - Относительная ошибка вычисления коэффициентов корреляции, обусловленная конечным числом примеров в тестовой выборке при доверительной вероятности 0.99

60

70

S0

90

Из приведенных выше рисунков видно, что ошибка измерения младших статистических моментов монотонно снижается, однако при малых объемов тестовой (обучающей) выборки ошибки оказываются значительными и составляют порядка 50% от оцениваемого параметра. Столь значительная величина ошибок делает практически невозможным использование классических квадратичных форм даже относительно низкого порядка.

Например, если мы попытаемся оценить число обусловленности для корреляционных матриц с одинаковыми коэффициентами корреляции г = 0.4 (эта величина близка к среднему значению модулей коэффициентов корреляции, смотри рисунок 1), то мы получим следующие значения последовательности чисел обусловленности:

cond

1 0.4 0.4 1

( 1 0.4 0.4^

= 2.762,

cond

0.4 1 \0.4 0.4

= 4.81 Я

cond

( 1 0.4 0.4 0.4>

0.4 1 0.4 0.4

0.4 0.4 1 0.4

\0.4 0.4 0.4 1 /

= 7.11,

По мере роста размерности корреляционной матрицы монотонно растет число ее обусловленности. Известно, что коэффициент обусловленности можно рассматривать как коэффициент усиления ошибок исходных данных, то есть даже при попытках решать двухмерные задачи мы должны получать результаты с ошибкой 50%х2.7 6 ~ 138% . Именно по этой причине в биометрии, биологии и медицине нельзя использовать простую и понятную линейную алгебру. Даже низкоразмерные квадратичные формы линейной алгебры начинают эффективно работать при нескольких сотнях примеров, используемых для обучения (обращения матрицы) или для тестирования.

Если же мы отказываемся от использования классики (2) и применяем большие искусственные нейронные сети, то для их обучения по ГОСТ

Р 52633.5-2011 достаточно от 20 до 30 примеров образа «Свой» и столько же примеров «Свой» и «Чужой» необходимо для тестирования качества принимаемых решений [2] . Искусственным нейронным сетям при обработки биометрических, биологических, медицинских, социологических, экономических данных нет альтернативы.

Выводы

По каждому из наблюдаемых параметров (номограммы на рисунках 1 - 2) можно оценить интервал возможных ошибок, возникающих из-за конечного числа примеров в наблюдаемой выборке. Приведенный выше материал, можно рассматривать как достаточно простую методику оценки ошибок вычисления математического ожидания и среднеквад-ратического отклонения в одномерном случае.

ЛИТЕРАТУРА

1. Волчихин В.И., Иванов А.И., Фунтиков В.А., Назаров И.Г., Язов Ю.К. Нейросетевая защита персональных биометрических данных. // М.: Радиотехника, 2012., 157 с., ISBN 97 8-5-8 8 07 0-0 4 4-8.

2. Ахметов Б.С., Волчихин В.И., Иванов А.И., Малыгин А.Ю. Алгоритмы тестирования биометрико-нейросетевых механизмов защиты информации Казахстан, Алматы, КазНТУ им. Сатпаева, 2013 г.- 152 с. ISBN 978-101-228-586-4, http://portal.kazntu.kz/files/publicate/2 014-01-0 4-1194 0.pdf

3. Ахметов Б.С., Волчихин В.И., Куликов С.В., Малыгина Е.А. Моделирование длинных биометрических кодов, воспроизводящих корреляционные связи выходных данных нейросетевого преобразователя М.: Радиотехника, Нейрокомпьютеры: разработка, применение, №3, 2012. С. 40-43.

4. B. Akhmetov, A. Doszhanova, A. Ivanov, T. Kartbaev and A. Malygin "Biometrie Technology in Securing the Internet Using Large Neural Network Technology. World Academy of Science, Engineering and Technology. Issue 79, July, 2013, Singapore, p. 129-138, pISSN 2010-376X, elSSN 20103778, www.waset.org

5. Ахметов Б.С., Алисов В.А., Малыгин А.Ю., Вятчанин С.Е.,Сауанова К.Т., Иванов А.И. Нейросетевая мультибиометрическая аутентификация личности гражданина в системе электронного правительства В сборнике трудов Международного симпозиума «Надежность и качество - 2 012». Пенза: Изд-во ПГУ, 2012. Том 1 - С. 227-229.

6. Артемов И.И. Акустическая эмиссия в условиях "скрытого" подрастания микротрещин / Артемов И.И., Кревчик В.Д. // Проблемы машиностроения и надежности машин. 2005. № 4. С. 92-95.

7. Майоров А.В., Малыгин А.Ю., Шашков Б.Д., Урнев И.В., Сауанова К.Т. Повышение качества работы преобразователей биометрия-код с помощью регуляции избыточности. В сборнике трудов Международного симпозиума «Надежность и качество - 2012». Пенза: Изд-во ПГУ, 2012. Том 1 - С. 290-292.

i Надоели баннеры? Вы всегда можете отключить рекламу.