Научная статья на тему 'Расширение многообразия статистических критериев, используемых при проверке гипотез распределения значений биометрических данных'

Расширение многообразия статистических критериев, используемых при проверке гипотез распределения значений биометрических данных Текст научной статьи по специальности «Математика»

CC BY
43
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Перфилов Константин Александрович, Иванов Александр Иванович, Проценко Екатерина Дмитриевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Расширение многообразия статистических критериев, используемых при проверке гипотез распределения значений биометрических данных»

Рис.2 Радиальный сферический подшипник скольжения

Рис.3. Подшипник с антифрикционным слоем

Рис.4. Полусферический шарнир с разнотолщинным антифрикционным слоем

Для таких подшипников ресурс определяется допустимым износом и антифрикционного слоя, который зависит от интенсивности изнашивания J антифрикцион-

ного материала во зависимостью (1):

времени, в соответствии с

J =

dU dt

(1)

В свою очередь, интенсивность изнашивания при определенной скорости скольжения зависит от величины контактного давления р в шарнире и может быть найдена, согласно обобщению данных лабораторных исследований [Л7] из выражения (2):

1 = (2)

Где К- экспериментальный коэффициент, зависящий от скорости скольжения. Контактное давление определяется как отношение радиальной нагрузки на подшипник Р к площади поверхности заны контакта. Отметим, что упрощение при определении площади поверхности контакта вносит погрешность, не превышающую несколько процентов, что существенно меньше погрешностей экспериментально определяемых параметров. Тогда выражение (2) примет следующий вид:

J = K-

P2

4d2 7 d 12 ( А2 + А rd-S21 2

l_V 2 J l 2S у

(3)

Где d-диаметр шарнира, Дг -допустимый зазор, 5-смещение оси охватываемой детали шарнира при износе и. Отбросив величины второго порядка малости, придем к выражению:

а dU .4

dt =-- d

KP2

1 -

А.

VU + А Г У

(4)

Из выражения (4) после интегрирования получим формулу для определения ресурса £

t =

d4

U

KP2

1 + А

V U у

(5)

что позволяет оценить долговечность подшипника, ограничив допустимый износ антифрикционного слоя.

1.

2.

3.

4.

5.

6.

7.

Литература

Коллинз Дж. Повреждение материалов в конструкциях. Анализ, предсказание, предотвращение: Пер. с англ. М.:Мир.1984.-624с.

Панова И.М. Особенности конструирования изделий из керамических материалов. Известия высших учебных заведений «Машиностроение» №4,2013г. Патент на изобретение №2476736 РФ Зубарев Г.И., Климов Д.А. и др. 27.02.2013г. Дроздов Ю.Н. и др. Трение и износ в экстремальных условиях. Справочник, М.: «Машинострое-ние».1986-224с.

Интернет-ресурс: http ://www.podshipnik. ru Патент на изобретение №2095648 РФ Дерлугян И.Д.; Логинов В.Т. и др.10.11.1997г. Панов А.Д. Панова И.М. Особенности определения долговечности полимерных подшипников скольжения. «Естественные и технические науки». Изд-во «Спутник+» №2, 2014г.

2

РАСШИРЕНИЕ МНОГООБРАЗИЯ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ, ИСПОЛЬЗУЕМЫХ ПРИ ПРОВЕРКЕ ГИПОТЕЗ РАСПРЕДЕЛЕНИЯ ЗНАЧЕНИЙ

БИОМЕТРИЧЕСКИХ ДАННЫХ

Перфилов Константин Александрович

аспирант ФГБОУ ВПО "Пензенский государственный университет", г.Пенза

Иванов Александр Иванович

д.т.н., доцент - начальник лаборатории биометрических и нейросетевых технологий ОАО "Пензенский научно-исследовательский электротехнический институт", г.Пенза Проценко Екатерина Дмитриевна

студентка ФГБОУ ВПО "Пензенский государственный университет" кафедра "Защита информации и безопасность

автоматизированных систем", г.Пенза

Одним из наиболее популярных при статистическом анализе данных является критерий Пирсона. Хи-квадрат критерию Пирсона полностью посвящена первая часть рекомендаций Госстандарта [1], тогда как все

остальные критерии описаны во второй части рекомендаций [2]. Наиболее популярные критерии проверки гипотез даны в таблице 1 [3].

Таблица 1

Наиболее популярные статистические критерии_

№ Название критерия и год создания Формула критерия

1 Хи-квадрат критерий или критерий Пирсона 1900 г. 7{p(x) - ~(x)}2 dx i ~(x)

2 Критерий Крамера-фон Мизеса 1928 г. J{P(x) - P(x)}2 • dx —L

3 Критерий Колмогорова-Смирнова 1933 г. sup P(x) — P(x) — L< x < +L

4 Критерий Смирнова-Крамера-фон Мизеса 1936 г. + L J{P(x) — P(x)}2 • dP(x) —L

5 Критерий Джини 1941 г. +L J P(x) — P(x) • dx —L

6 Критерий Андерсона-Дарлинга 1952 г. T fob ~~x)}2 • dP(x) —JLP(x) — P(x)}

7 Критерий Купера 1960 г. sup {p(x)—P(x)}+ sup {P(x) — P(x)} —L< x < +L —L< x< +L

8 Критерий Ватсона 1961 г. jLJ P(x) — P(x) — J ¡P(x) — P(x)]^ dP(x) | • dP(x) —L ^ —L J

9 Критерий Фроцини 1978 г. +L J P(x) — ~(x) • dP(x) —L

10 Дифференциальный вариант критерия Джини 2006 г. [4] +L J| p(x) — ~(x)| • dx —L

Из таблицы 1 видно, что работа по созданию различных статистических критериев продолжается уже более 100 лет. Создано большое число статистических критериев, которые дополняют друг друга. Однако работу по созданию многообразия критериев нельзя считать законченной. К сожалению, хи-квадрат критерий для надежных оценок с доверительной вероятностью 0.99 требует иметь тестовую выборку порядка 400 опытов. Для биометрии это неприемлемо, так как обучение и тестирования нейросетевых преобразователей биометрия-код идет на выборках примерно из 20 примеров.

Требования к размеру тестовой выборки может быть снижено, если использовать более эффективные статистические критерии (лучше, чем другие известные критерии). В связи с этим актуальной задачей является дополнение уже найденных критериев новыми.

Следует подчеркнуть, что хи-квадрат критерий (строка 1, таблица 1) можно рассматривать как критерий нормированного среднего арифметического квадратов отклонения. На ряду с критерием среднего арифметического может быть построен критерий среднего геометрического сравниваемых между собой функций вероятности:

sg =

JVP(x) • (1 - P(x)) • dx

где:

• _ P(x) _

(1)

теоретическая функция вероятности,

P(x)

практически полученная функция изменения вероятности.

При организации численного эксперимента будем исходить из того, что должны проверяться две статистические гипотезы. Первая гипотеза состоит в том, что данные тестовой выборки имеют нормальный закон распределения значений. Вторая гипотеза состоит в том, что данные этой же выборки могут иметь нормальный закон распределения значений. Как следствие, при организации численного эксперимента необходимо использовать два программных генератора псевдо случайных данных, как это показано на блок-схеме рисунка 1.

Каждый из генераторов случайных данных Г1 (нормальные данные) и Г2 (данные с равномерным законом распределения) случайным образом подаются на вход вычислителя значения хи-квадрат критерия (1). Далее значения хи-квадрат критерия должны сравниваться с некоторым порогом квантователя. Если значение хи-квадрат менее порога, то принимается решение о нормальности исследуемых входных данных. Если значение хи-квадрат критерия (1) оказывается выше или ниже порога, то принимается решение о наибольшей справедливости одной из гипотез.

Проведенный численный эксперимент показал, что новый критерий среднего геометрического на выборках от 25 до 49 опытов оказывается примерно в два раза мощнее классического хи-квадрат критерия. При проверки гипотезы нормальности законно распределения биометрических данных удается примерно в 2 раза снизить вероятности ошибок первого и второго рода. Данные о равных вероятностях ошибок первого и второго рода приведены в таблице 2.

Нормальный

Г ] /| V

Равномерный

1

Г2

Квантователь

«1» «0»

Автомат случайного переключения

ср

Порог батывания

Рисунок 1. Блок-схема организации численного эксперимента по оценке мощности одномерного критерия хи-квадрат

0.1 0.15 0.2 0.25 0.3 0.35 Рисунок 2. Плотности распределения значений для нормального и равномерного законов распределения значений для критерия среднего геометрического значения

Таблица 2

Значения равных вероятностей ошибок первого и второго рода при проверке гипотезы нормального и гипотезы

Число опытов в тестовой выборке

9 16 25 36 49 64 81 100 121

Значения равнове] роятных ошибок Р1=Р2=РЕЕ

Критерий Джини 1941 г. 0.50 0.497 0.482 0.417 0.348 0.269 0.225 0.205 0.186

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Критерий Смирнова-Колма-горова 1933 г. 0.46 0.44 0.345 0.315 0.239 0.232 0.215 0.201 0.177

Критерий Фроцини 1978 г. 0.439 0.38 0.325 0.268 0.212 0.172 0.154 0.107 0.089

Хи-квадрат критерий Пирсона 1900 г. 0.42 0.32 0.29 0.256 0.207 0.153 0.131 0.101 0.083

Среднее геометрическое 2015 г. 0.414 0.331 0.238 0.166 0.113 0.058 0.034 0.017 0.012

Критерий Крамера-фон Мезиса 1928 г. 0.356 0.306 0.240 0.215 0.155 0.121 0.102 0.082 0.061

Дифф. критерий Джини 2006 г. 0.281 0.202 0.162 0.101 0.07 0.05 0.03 0.02 0.01

Очевидно, что статистики среднего геометрического и среднего арифметического взаимно дополняют друг друга. В этом отношении новый критерий (1), видимо будет еще более эффективным если его рассматривать в совокупности с хи-квадрат критерием (би-критериальная оценка достоверности).

Предположительно в ближайшем будущем будут использоваться мультикритериальные статистические оценки, когда при проверке одной или нескольких статистических гипотез будут использоваться два и более критериев. Выбор совокупности статистических критериев должен исходить из условия их существенной независимости (слабой коррелированности). Чем слабее связаны оказываются статистические критерии, используемые в паре, тем эффективнее будет их совместная работа. То есть необходимо не только расширять номенклатуру статистических критериев, но подбирать из них наиболее эффективные группы (пары, тройки, четверки,...). Простой оценки мощности статистических критериев (таблица 2) недостаточно. Необходимо инициировать работы по исследованию совместимости статистических критерием и поиску оптимальных правил их объединения.

Формальной оценкой коррелированности критериев является их испытание по блок схеме рисунка 1 при одинаковых порогах заданной достоверности и при воздействии одной и той же выборкой случайных данных. Тогда математическое ожидание коэффициента коррели-рованности выходных кодов можно оценить по нормированному расстоянию Хэмминга между ними:

с/ л h —ih E(r) ~---

n n

(2)

где: - h - расстояние Хэмминга между сравниваемыми кодами длинной - п, - расстояние Хэмминга между кодами, один из которых инвертирован.

Список литературы

1. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа х2. Госстандарт России. -Москва: 2001. - 140 с.

2. Р 50.1.037-2002. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть II. Непараметрические критерии. Госстандарт России. Москва: 2002. -123 с.

3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников.

- Москва: Изд-во ФИЗМАТЛИТ, 2006. - 816 с.

4. Малыгин А.Ю., Волчихин В.И., Иванов А.И., Фунтиков В.А. Быстрые алгоритмы тестирования нейросетевых механизмов биометрико-крипто-графической защиты информации. - Пенза: Изд-во Пензенского государственного университета, 2006.

- 161 с.

АЛГОРИТМ ИНТЕРАКТИВНОГО ТРЕНАЖЕРА ДАКТИЛЬНОИ АЗБУКИ ГЛУХИХ

Приходько Алексей Леонидович

Магистрант Новосибирского государственного технического университета в г. Новосибирске

Гунько Андрей Васильевич

Кандидат технических наук, доцент кафедры автоматики Новосибирского государственного технического

университета в г. Новосибирске

В результате предшествующих исследований [3] был публикован обзор методов и технологий распознавания жестов для интерактивного тренажера дактильной азбуки глухих, которые можно считать методами обучения

[1, с.17], позволяющим взаимодействовать между глухими и слышащими посредством дактильной речи.

Рисунок 1. Диаграмма развёртывания из UML

В состав интерактивного тренажера, структура которого приведена на рисунке. 1, входят датчик и компьютер (или ноутбук). Датчик (Leap Motion) возможно применять в операционной системе Window 8.1 с инструментом программирования Visual Studio 2012, причем в комплект программ, поставляемых с датчиком (Leap SDK) [4], для разработчика доступны данные трехмерной модели руки,

положение которой можно отслеживать в режиме реального времени по входным данным из 24 точек суставов руки и кончиков пальцев с тремя векторами (х,у^). Очевидно, что проще разработать модуль распознавания статических жестов руки (модуль распознавания конфигурации руки). Недостатками такого подхода являются: распознавание не всех вариантов конфигурации руки, ограничение на максимальное расстояние от датчика до

i Надоели баннеры? Вы всегда можете отключить рекламу.