ISSN 0868-5886 НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2016, том 26, № 3, c. 64-74
- МАТЕМАТИЧЕСКИЕ МЕТОДЫ -
И МОДЕЛИРОВАНИЕ В ПРИБОРОСТРОЕНИИ
УДК 519.2
© А. С. Ильин
СВОЙСТВА МЕДИАНЫ С УЧЕТОМ ДРЕЙФА ОДНОГО ИЗ ГРУППЫ ИЗМЕРИТЕЛЕЙ ПРИ НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ
Предполагается, что данные, поступающие от каждого измерителя, распределяются по нормальному закону. Получены формулы вычисления математического ожидания и дисперсии медианы, когда данные от одного из группы измерителей подвержены дрейфу. В качестве медианы берем значение, оказавшееся в середине сортированного списка значений от нечетного количества измерителей. Оказалось возможным взять интегралы и получить аналитические формулы при использовании приближенной формулы интеграла вероятности (функции Лапласа). На основе результатов численного интегрирования в полученные формулы добавлены поправочные функции. Определены границы предпочтительности медианы в сравнении со средним арифметическим.
Кл. сл.: медиана, нормальное распределение, среднее арифметическое, математическое ожидание, дисперсия, дрейф чувствительности
ВВЕДЕНИЕ
Настоящая статья является продолжением и развитием темы нашей предыдущей статьи [1]. Предметом изучения, как и там, является ситуация с некоторым нечетным количеством одинаковых датчиков, регистрирующих радиацию, и дрейфом чувствительности одного из них. Анализируются способы оценки измерений. В [1] рассмотрены свойства медианы для равномерного (прямоугольного) распределения плотности вероятности значений, получаемых от каждого измерителя (датчика), в условиях дрейфа чувствительности одного из группы измерителей. Равномерное распределение позволило вычислить требуемые интегралы аналитически точно. Но на практике мы имеем дело с данными, которым свойственно распределение Пуассона. Как известно, оно мало отличается от нормального распределения, являющегося более удобным для математических выкладок. В данной статье для нормального распределения получены формулы математического ожидания и дисперсии медианы в условиях дрейфа одного из группы измерителей. Однако эти формулы являются приближенными, поэтому для их уточнения введены поправочные функции, полученные сравнением с результатами численного интегрирования.
БАЗОВЫЕ ФОРМУЛЫ
Пусть задана функция р(а,х) — плотность вероятности распределения измеряемой величины х
в области значений, ширина которой характеризуется параметром а.
Запишем и интегральную функцию вероятности распределения:
л.
P (а, X)= J p (а, х) dx
Обозначим N количество чувствительных элементов (датчиков). Ограничимся вариантом нечетного набора: N = 2п + 1.
Обозначим L величину дрейфа в сторону занижения. Это значит, что плотность вероятности приобретает вид р(а, х + L).
Начнем с рассмотрения исходного состояния, когда L = 0. Формулы для этого случая известны из [2, с. 17-18], [3, с. 96].
Вероятность получения значения медианы в интервале от X до X + ¿X
Q ( а, п, X ) ¿X =
= Ж (п ) Р (а, X )п (1 - Р (а, X ))" р (а, X ) ¿X. (1)
Здесь мы имеем "перестановки с повторениями" [4, с. 48], количество которых определяется мультиномиальным коэффициентом
W ( n ) =
( 2n +1)!
n!
Формула моментов порядка К (для вычисления математического ожидания и дисперсии) имеет вид:
да _()!
M (K, a, n,0)=f Q (a, n, X ) XKdX. (2) = f [nP ( a, x)n p (a, x)x
П! _да
При наличии дрейфа формула вычисления мо- Х(1 - Р (а, х ))"р (а, х + L)
ментов порядка К имеет вид суммы трех слагае-
dx +
мых, соответствующих трем вариантам получения (2n)! ¡-г-
- - +---¿г I [P (a, x) n x
значения от дрейфующего датчика в сравнении с медианой
n!
\n_l / ч /
dx _
М(К,а,п,L) = Я (К,а,п,L)+ х(1 -Р(а,х)Г р(а,х)р(а,х + L)х
+ Я2(K,аn,L) + Яза,n, !). (3) -М11 р(а,х)п (1 -Р(а,х))пр(а,х + L)КхК-^.
1) Значение от дрейфующего датчика оказа- ' -м
лось медианой: В полученном выражении первые два интегра-
ла, рассматриваемые с обратными знаками, полно-Я1 (К,а,п,L )= стью совпадают с производными выражений (5)
и (6) по параметру L. Поэтому после сокращений
( 2n )!
n!2
_да
| Р (а, х)п (1 - Р (а, х))п р (а, х + L) хК5х. (4) остается только один интеграл
<1 ( 2п )!
2) Значение от дрейфующего датчика оказа- —М(К,а,п,L) = -К-—Х
лось больше медианы: 5! п!
Я (К,а,п,^ = ^р(а,х)п х Х-(Р<*х)"(1 - Рх<*х + !>(7)
1 В частности, при L = 0 и К = 1 полученная форму-
х(1 -Р(а,х))п (1 -Р(а,х + L))р(а,х)хК^5х. (5) ла (7) похожа на формулу (2) при К = 0, которая
при этом тождественно равна единице. Поэтому, 3) Значение от дрейфующего датчика оказа- учитывая отличие коэффициентов, получаем лось меньше медианы:
5 -1
(2»)! -гг„,..лп. 5!МКа'п,°>=2Г+7. (8)
Это означает, что при малых значениях дрейфа
х(1 - Р (а, х))пР (а, х +!) р (а, х) хК >. (6) математическое ожидание медианы совпадает
^ \ с математическим ожиданием среднего арифмети-
(K, a, n,L) = ЯP (a, x)n1 x
ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ
ческого
_ L
x
тг Ммрдм (К, а, п,! ) =-. (9)
Для начала проанализируем производные по 4 2п +1
параметру !. Они пригодятся в дальнейшем для тт , ,„ч
л. На основе формулы (7) далее запишем и вто-повышения точности формул:
рую производную:
—Я (К,а,п,!)= а2 , ч (2п)!
5! Н ' -^М(К,а,п,!) = -К^-
(2п)! ю я „а 5! п!2
= -—т- [ Р(а,х)п(1 -Р(а,х))п—р(а,х + !)хК5х. ^ , чЧп 5 , ч К1
п!2 ^ ^ ' ^ v " 5х ^ ' х| Р(а,х)п(1 -Р(а,х)) —р(а,х +!)хК-15х.
Имея в подынтегральном выражении произ- ™
водную по параметру x, совпадающую с произ- В частности, при К = 2 для нормального распреде-
водной по параметру L, вы11олним интегрирование ления в Приложении обосновывается получение
"по частям". Множитель х не мешает обнулению формулы (10): в бесконечности, поэтому получаем:
а2 2
5 Т\ -^М(2,а,п,°) = --— М(2,а,п,0). (1°)
—Ях (К, а, п, !)= ^ ' (2п + 1)а2 ^ ' ' ' ^
НАЧАЛЬНОЕ ПРЕОБРАЗОВАНИЕ ФОРМУЛ ДЛЯ ИНТЕГРИРОВАНИЯ
Далее нам будет удобнее пользоваться следующими обозначениями:
Р (а, х ) = 1 (1 + Ф ( а, х )), р (а, х) = 1Ф* (а, х).
(11)
(12)
(2ПП+1! Я1 -Ф2(^х))"р(^х)
-Ф2(а,х)) р(а,х)хК¿х. (13)
Формулы (4)-(6) приобретают вид:
R1 ( К, а, п, L ) =
1(1 - Ф2 (а, х ))"Р (^ х + L ) хК а
(14)
( 2п )!
да
|[(1 - Ф2 (а, х ))"-1
Я (К, а, п, L) = - , ч ^ ' ' ' ' 4пп!( п -1)!
х(1 + Ф(а,х))(1 - Ф(а,х + L))р(а,х)хК]¿х, (15)
Я3 (К • L ) = ^птт^п21!)!Ш1 - ф2 (а. х ))"-'х
х(1 - Ф(а,х))(1 + Ф(а,х + L))р(а,х)хК]¿х. (16)
При сложении величин Я2 и Я3, раскрывая скобки, обнаруживаем возможность сокращения слагаемых, поэтому получаем
Я2 (К, а, п, L ) + Я3 (К, а, п, L ) =
= Я4 ( К, а, п, L ) + Я5 ( К, а, п, L ).
Здесь обозначены:
Я4 ( К, а, п, L ) =
= 2(2п)\ ? (1 - Ф2 (а, х))п-1 р (а, х) хК¿х, (17) 4пп!(п -1)! V У '
Я5 (К, а, п, L) =
-2 (2п)! 4пп!( п-1)! _
да
|[(1 - Ф2 (а, *))-'
х Ф (а, х) Ф (а, х + Ь) р (а, х) хК ] ¿х. (18)
Заметим, что Я4 не зависит от L и может быть выражено как
Я4 (К, а, п) = (2п -1) Я (К, а, п -1,0) . (19)
При К = 1 нечетность подынтегрального выражения порождает тождество
Я4 (1, а, п ) = 0.
(20)
Предельные значения пригодятся при интегрировании: Ф (а, -да) = -1, Ф (а, да) = 1. Формула (2) приобретает вид:
М ( К, а, п,0) =
Приступим к преобразованию интеграла Я5. Учитываем, что
р (а, х ) = ( а, х ),
Ф*( а, х + L ) = 2 р (а, х + L ). Интегрируя по частям, получаем
Я5 ( К, а, п, L ) = 1
( 2п )!
2п
4пп!(п -1)!
(1 - Ф2 (а, х))" Ф (а, х + L ) хК
1 да
- |(1 -Ф2(а,х))"р(а,х + L)хК¿х-
о да
|(1 - Ф2 (а, х))" Ф (а, х + L) хК^ I.
К_ 2п
(21)
В этом выражении при подстановке пределов интегрирования получается ноль, а первый из двух интегралов по абсолютной величине совпадает с интегралом Я\(К,а,п,Ь) и сокращается с ним. Поэтому получаем
М (К, а, п, L ) = Я4 (К, а, п) - Я6 (К, а, п, L) . (22) Здесь обозначено Я6 ( К, а, п, L ) =
=К
^^ |(1 - Ф2 (а, х))" Ф (а, х + L)хК ^ (23)
2 п!
Заметим, что
¿Я6 ( К, а, п, L )
^^ ' = КЯ,( К -1, а, п, L ).
(24)
ФОРМУЛЫ ДЛЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
В полученных формулах (22)-(24) может быть произвольная гладкая функция плотности распределения. Теперь возьмем нормальное распределение:
х
х
p (a, x) = -
1у[2я
exp
( x2^
2a2
Ф (a, x ) = erf
42a
(25)
(26)
Используемая функция Лапласа (функция ошибок) имеет вид
2 x
erf (x ) = ^= | exp (_t2) dt. Vn 0
Известна приближенная формула [5]:
erf ( x) « Здесь обозначено:
1_exp
Г 4 2 — + yx
_x2 л--
1 + yx
У =
8 (3 _n) 3n(n _4) '
Ф(a,x) - l1_exp
( 2 x2^
v na j
1_Ф2 (a, x ) = exp
( 2 x2>
v na j
(28)
R (K, a, n, L) =
( 2n )!
4nn!2 aV2n
exp
L2
2a2
x f exp
V
г x2 Г 2n 1 1 xL 1 K
21 - + -|_ 2 a V n 2 j a
ux + vx = u\ x +
-2 ....._-I „ , _V. 1
2u j 4u
Для нашего случая обозначим:
u = -
4n + n 2na2
L
v = -
Тогда
v nL 2u 4n + n
%L
% L
4u 2a2 (4n + n)' 4u2 (4n + n)2
(30)
(31)
(32)
(27)
Воспользуемся также свойствами функции вероятности нормального распределения:
exp
( t2 >
v 2a j
dt = a/ — erf I —i 2 V V2a
f exp
x2
2a2
dx = a •л— ,
Столь громоздкая формула нам никак не поможет брать интегралы аналитически. Поэтому воспользуемся менее точным, но вполне приемлемым вариантом у = 0 .
По аналогии, как в [3, с. 103-104] записана приближенная формула плотности вероятности медианы, здесь мы получим приближенные формулы математического ожидания и дисперсии медианы в условиях дрейфа одного из группы измерителей.
Формула (26) с учетом (27) приобретает вид
exp
(.xLл
2a2
2dx = a3 л/2—.
(33)
(34)
(35)
Выполняя замену переменной х путем смещения на величину (31), используя (30), (32) и (34), перепишем формулу (29) при К = 0 в следующем виде:
R (0, a, n, L) =
(2n )!
n
(
4nn!2 V 4n + n
exp
2nL
2 Л
a2 (4n + n)
По формуле (19) сразу же запишем: R4 (0, a, n) = (2n _ 1) R (0, a, n _ 1,0) =
При этом появляется возможность записать весьма удобную формулу:
( 2n _1)!
n
4п-1 (п -1)!2 ^ 4(п -1) + л
На основе формулы (24) при К = 1 выполняем интегрирование по формуле (33):
Формула (14) с учетом (25) и (28) приобретает вид:
R6 (1, a, n, L ) = -22^ " erf
2 n! V2n
L
2n
a \ 4n + n
+1
xK dx. (29)
Чтобы взять этот интеграл, надо сначала записать полином в удобном виде по формуле
Для формулы (29) при К = 1, выполняя замену переменной путем смещения на величину (31), обнаруживаем, что смещение приобретает роль множителя:
-лт
Я1(1, а, п,! ) =-Я( 0, а, п,! ) =
' 4п + л 1У '
1
x
2
a
2
2
v
v
x
( 2n )!L
ж
4nn!2 I 4n + ж
exp
2nL
2 Л
а2 (4n + ж)
По формуле (19) сразу же запишем: Я4 (1,а,п) = (2п -1)Я (1,а,п -1,0) = 0.
(36)
На основе формулы (24) при К = 2 выполняем интегрирование, получаем
, ч 2 (2п -1)!
Я (2, а, п, Ь ) = па --х
' ' ' ) 4пп!2
ж
4n + ж
( f
exp
V v
2nL2
а2 (4n + ж)
-1
J J
+ С2-
(37)
Для формулы (29) при К = 2, выполняя замену переменной путем смещения на величину (31), обнаруживаем два ненулевых слагаемых, вычисляемых по формулам (34) и (35). При этом квадрат смещения приобретает роль множителя
R1 ( 2, a, n, L ) =
(2n )!
4nn!2 a-j2ñ'
f L2
x exp
( 2n )!
2a2 + 2a2(4n + ж)
(
ж.L2
\
■sÍ2na"
ж
+
ж
exp
2nL
4n +ж
^ „2 7-2
% L
+
4"п!2Ч4п + п Эти слагаемые можно объединить:
3
( 2п )!|
a (4n + ж) J (4n + ж)2'
R1 ( 2, a, n, L ) =
ж
4nn!2 V 4n + ж
x exp
2nL
v a2(4n+ж)J
a2 + L2
ж
4n + ж
Однако полученное выражение нам требуется только при Ь = 0:
R4 (2, a, n) = (2n -1) R (2, a, n -1,0) =
= a
(2n -1)!
ж
3 ^ 2
4n-1 (n -1)!2 V4(n -1) + ж
Приступим к вычислению констант, появившихся при интегрировании.
Константу с определим на основе исходного значения математического ожидания по формуле (22) при К = 1, Ь = 0:
М (1, а, п,0) = 0 = Я4 (1,а,п) - Я6 (1,а,п,0) . Учитывая (36), получаем с = 0.
Константу С2 определим на основе исходного значения дисперсии по формуле (22) при К = 2, Ь = 0. Заметим, что Я6(2, а, п, 0) = с2, поэтому получаем уравнение
М(2,а,п,0) = Я4(2,а,п)-с2.
Это означает, что можно взять С2 = 0, но при этом надо вместо Я4(2, а, п) брать М(2, а, п, 0), вычисляемое на основе формулы (2).
Формула (3) при Ь = 0 полностью совпадает с формулой (2), однако при использовании приближенных выражений вероятности совпадение этих формул неизбежно получается также приближенным.
Подставляя (25) и (28) в (1) и (2), применяя (35), получаем
M ( 2, a, n,0) =
(2n +1)!
a-j2n4"n!2
f
x I exp
2a2
, 4n
1 + — ж
, , (2n +1)!
x2dx = a --2-
4nn!2
ж
4n + ж
Полному множеству событий соответствует тождество М(0, а, п, 0) = 1. Однако при использовании приближенных выражений вероятности это равенство соблюдается также приближенно.
Подставляя (25) и (28) в (1) и (2), применяя (35), получаем
M ( 0, a, n,0) = _ (2n +1)! "aV2^4nn!2 _ (2n +1)! = 4nn!2
í
exp
2a2
, 4n
1 + — ж
dx =
ж
4n + ж
(38)
Каждый из интегралов, вычисленных здесь приближенно, имеет ошибку, близкую к ошибке вычисления интеграла М(0, а, п, 0). Поэтому для повышения точности формул выражение (38) можно использовать в качестве поправочного коэффициента-делителя. В [3] использование этого коэффициента называется нормировкой. При этом получаются выражения более удобные (без факториалов).
Запишем только три требуемых выражения:
R6 (1, a, n, L) =
R6 (2, a, n, L) =
4ña
2( 2n + 1)V 2n
4n + ж
L 2n
a V 4n + ж
, (39)
жa
2n (2n + 1)
f f exp
v
2nL
v a2 (4n + ж)J
-1
(40)
x
x
2
x
2
x
М ( 2, а, п,0 ) =
ла
4п + л
(41) М2, (1,^) = -^
М (1, а, п, да) =
-л/ла |4п + л
2 (2п +1)
2п
М2п ( К, a, п ) = -
( 2п )!
М2п (2, а, п) = М (2, а, п -1,0)
и имеем дисперсию нормального распределения
М2п ( 2, а,1) = М (2, а,0,0 ) = а2.
22пп!( п-1)!
ВЫЧИСЛЕНИЕ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ
В соответствии с формулой (22) выражение (39), взятое со знаком минус, определяет математическое ожидание медианы М(1, а, п, !).
В частности, при малых значениях !, разлагая (39) в ряд по известной формуле [6, с. 119], обнаруживаем, что первый член ряда совпадает с (9).
Рассмотрим также асимптотику математического ожидания
|(1-Ф2(а,х))п Ф(а,х)Ф*(а,х)х5х
-(2п)!
22п+1 п!2
|(1-Ф2 (а, х ))п ах.
Пользуясь приближенной формулой (28) и точной формулой (34), получаем
М2п (I a, п ) =
-( 2п )!
п)! ла
22п+1 п!2 42п
(47)
(42)
На основе (44) запишем выражение, соответствующее полной вероятности (при К = 0):
Очевидно, что при ! ^ да мы имеем право полностью игнорировать дрейфующий датчик. Поэтому асимптотическую величину (42) уместно сравнить с математическим ожиданием центральной (с индексом п-1 или п) порядковой статистики на множестве 2п датчиков. Для этого воспользуемся формулой из [7, с. 96], запишем формулу момента К-го порядка в следующем виде:
(2п)!
М2п (К, a, п ) = Х
п!(п-1)!
да
х | Р (а, х)п 1 (1 - Р (а, х))п р (а, х) хК5х. (43)
да
С учетом формулы (11) имеем
М2п (0 ^ п) =
( 2п )!
22п-1 п!( п-1)!^л/2л
|(1-Ф2 (а, х))п ехр
( х2^
2а2
5х.
Пользуясь приближенной формулой (28) и точной формулой (34), получаем:
М2п ( 0, а, п ) =
(2п )!
22п-1 п!(п -1)! у 4(п-1) + л
л
(48)
Формулу (47) перепишем с учетом нормировки, т. е. выполняя деление на (48):
М2п (1, a, п ) = -
4ла 4(п -1) + л
22п-1 п!(п -1)!
да
х| (1 - Ф2 (а, х))"1 (1 - Ф (а, х))р (а, х) хКах. (44)
да
Множитель (1 - Ф(а, х)) дает возможность выбирать из него только одно слагаемое (в зависимости от К), при котором подынтегральное выражение будет четным.
В частности, сравнивая (13) и (44), нетрудно убедиться, что справедливо тождество
4п
2п
(49)
(45)
(46)
Учитывая (12), для математического ожидания (при К = 1) получаем выражение, интегрируемое по частям:
Разницу между приближенными выражениями (42) и (49) можно считать оценкой их точности. А чтобы найти ответ на вопрос о том, какое из них предпочтительнее, целесообразно выполнить численное интегрирование формулы (43) при К = 1 с использованием (25) и (26).
Между тем, при наличии результатов численного интегрирования необходимость использования формул (42) и (49) отпадает. Принимая во внимание их вид, теперь уместно вместо формулы (39) записать похожую формулу с поправочной функцией р(п), обеспечивающей совпадение с асимптотическими значениями, которые получены численным интегрированием. При этом соблюдаем требование: при малых значениях параметра ! формула должна совпадать с (9)
Я6 (1, а, п,! ) =
Х
Х
вероятности, который должен быть равен единице. По мере увеличения Ь происходит занижение результата численного интегрирования, т. к. в численном эксперименте "хвост" распределения дрейфующего датчика постепенно уходил за границы интервала интегрирования. Очевидно, что и другие результаты численного интегрирования, представленные в соответствующих колонках, занижены в той же мере. Тем не менее из табл. 2 видно, что формула (50) вполне удовлетворительна.
Табл. 1. Поправочная функция ф(п) для формулы математического ожидания медианы
Функция Число N датчиков
3 5 7 9 11 13 15
ф 0.75772 0.81160 0.82804 0.83729 0.84038 0.84398 0.84578
Табл. 2. Математическое ожидание медианы в зависимости от дрейфа одного датчика. (Формат данных: Я6 согласно (50), Я6 по численному интегрированию)
Число N датчиков Ь/а
0.5 1.0 1.5 2.0 2.5 3.0 1000.0
3 0.16294, 0.30522, 0.41373, 0.48598, 0.52800, 0.54934, 0.56419
0.16291 0.30508 0.41332 0.48490 0.52451 0.53759
5 0.09711, 0.17859, 0.23596, 0.26985, 0.28665, 0.29364, 0.29701
0.09711 0.17856 0.23586 0.26946 0.28500 0.28761
7 0.06915, 0.12610, 0.16473, 0.18631, 0.19624, 0.20000, 0.20155
0.06915 0.12609 0.16468 0.18606 0.19514 0.19592
9 0.05368, 0.09743, 0.12646, 0.14217, 0.14909, 0.15157, 0.15251
0.05368 0.09742 0.12643 0.14199 0.14826 0.14849
11 0.04387, 0.07937, 0.10261, 0.11491, 0.12019, 0.12202, 0.12267
0.04387 0.07936 0.10258 0.11477 0.11952 0.11954
13 0.03709, 0.06696, 0.08631, 0.09642, 0.10066, 0.10210, 0.10259
0.03709 0.06695 0.08629 0.09630 0.10011 0.10002
15 0.03213, 0.05790, 0.07448, 0.08304, 0.08659, 0.08777, 0.08816
0.03213 0.05790 0.07447 0.08294 0.08611 0.08599
Теор. значение Р Вычисленное значение полной вероятности Р
Р = 1 0.99999 0.99997 0.9998 0.9988 0.9946 0.9798 -
4па 4п -р(п)
4п
2п
егГ
2пЬ 2п
Д 2п +1) а\ 4п - р(п)
(50)
В табл. 1 представлены значения поправочной функции р(п), а в табл. 2 — набор значений функции Я6(1, а, п, Ь), вычисленных по формуле (50). Для сравнения под каждым значением указан результат численного интегрирования.
В нижней строке табл. 2 для каждого значения Ь указан результат вычисления интеграла полной
свойства медианы с учетом дрейфа...
71
Табл. 3. Условная граница существенного преимущества медианы
Функция Число N датчиков
3 5 7 9 11 13 15
i -1 Ia Л, 3.3398 2.9303 2.7839 2.7084 2.6626 2.6316 2.6094
Чтобы представить ход изменения математического ожидания медианы, найдем значение дрейфа, при котором математическое ожидание медианы становится равным половине математического ожидания среднего арифметического. Иначе говоря, запишем уравнение
0.5-
L
2n +1
4na 4n n)
erf
2nL 2n
J 2n +1) a\ 4n - (p(n)
4n V 2n Удобно применить обозначение 2nL
t =
( 2n +1) a\
2n
4n - (p(n)
(52)
L I = tn
i+—
2n
2-
y(n )
2n
(53)
M2„ ( 2, a, n ) =
( 2n )!
22nn!(n -1)!
да
J (1 - Ф2 (a, x))"1 Ф* (a, x) x2dx.
С учетом (25) и (28) можно выполнить интегрирование по формуле (35):
. (51) M2n (2, a, n ) =
a' (2n)!
22n-1 n!(n-1)!I 4(n-1) + n
n
3
^ 2
. (54)
Выполним нормировку, т. е. разделим (54) на (48), получаем
M2n ( 2, a, n ) =
na
Уравнение (51) приобретает вид t = Vn erf (t). Решение этого уравнения является константой t0.5 = 1.748709 .
Соответственно имеем erf (t05) = 0.98660 .
Это означает, что в данной точке математическое ожидание близко к своему асимптотическому значению (42). С учетом (52) получаем решение уравнения (51):
4 (n -1) + n
(55)
Как видно, тождества (45) и (46) справедливы и для полученных приближенных формул (41) и (55).
Выполнив численное интегрирование формулы (13) или (44) при К = 2, имеем возможность в приближенные формулы (41) и (55) добавить поправочную функцию у(п) . При этом удобно сделать обозначение
coin
( n ) = -
1
Результаты вычислений по формуле (53) представлены в табл. 3. Когда величина дрейфа превышает указанные значения, медиана приобретает существенное преимущество в сравнении со средним арифметическим. При п ^ да получается предельное значение 2.4730.
УТОЧНЕНИЕ МОМЕНТОВ ВТОРОГО ПОРЯДКА
Формула (44) при К = 2 имеет вид
4n + n - у( n ) Формулы (41) и (55) приобретают вид: M (2, a, n,0) = na2a (n), M2n (2,a,n) = na2c (n -1).
(56)
(57)
Значения поправочной функции у/(п) представлены в табл. 4.
Заметим, что у/( 0) = 0 в соответствии с тождеством (46).
Тем самым получаем возможность в формуле (40) применить более точный коэффициент, записываемый на основе разности между значениями (57) и (56). Формула (40) приобретает вид
х
a
0.5
Табл. 4. Поправочная функция ц для формулы момента второго порядка
Функция Число N датчиков
1 3 5 7 9 11 13 15
¥ 0 0.13958 0.18879 0.21362 0.22773 0.23701 0.24440 0.24777
z(a, п, L)
1
......................\'"п = 1 : п = 2
"С.—^ ~~~---- -
---- - —'- - - -
° ' 5 Ь / а
Семейство кривых нормированной дисперсии
R6 (2,а,п,Ь) = па2 (ю (п -1) - ю (п)) х ехр
( ' Ь2Я(п)^
(58)
Я( п ) = -
ю(п
(п)
D (а, п, Ь ) = М ( 2, а, п, Ь ) - М (1, а, п, Ь )2 = = М ( 2, а, п,0 ) - R6 ( 2, а, п, Ь ) - (R6 (1, а, п, Ь ))2 =
= па2 х
В показателе экспоненты требуемый множитель п) можно брать на основе приближенных формул (37) или (40). Но лучше воспользоваться уравнением (10), в которое можно подставить (56) и вторую производную от (58), т. к. именно она определяет вторую производную момента второго порядка. В итоге нетрудно получить
со (п) + (ю (п -1) - со (п)) 4п - (р( п )
1 - ехр
( Ь2Л(п
//
32п
-егГ
2пЬ 2п ^ 2
Д 2п +1) а\ 4п - (р(п) ^
Для сравнения запишем дисперсию среднего арифметического:
,(а, п, Ь) =
2п +1
(2п + 1)(ю(п -1)- ю(п))'
ВЫЧИСЛЕНИЕ ДИСПЕРСИИ
Пользуясь известной формулой вычисления дисперсии [7, с. 103], учитывая (22), подставляя (50), (56) и (58), получаем
На рисунке представлено семейство кривых дисперсии медианы, деленной на дисперсию среднего арифметического
D (а, п, Ь )
г ( а, п, Ь ) =
DMEAN ( а, п
( а, п, Ь )
При п = 1 кривая идет наиболее круто, а по мере увеличения количества измерителей кривая становится более пологой, стремящейся к горизонтальной линии на уровне п/2 . Как видно, все кривые связаны своими точками перегиба в единый узел с координатами приблизительно (1.4, 1.6).
х
2
а
2
а
Табл. 5. Граница предпочтительности использования медианы
Функция Число N датчиков
3 5 7 9 11 13 15
(-) V a /PRFF 2.0119 2.0224 2.0861 2.1553 2.2228 2.2870 2.3480
Улучшение математического ожидания медианы в сравнении со средним арифметическим природа дает нам ценой ухудшения дисперсии. Для ответа на вопрос о том, в какой мере оправдана такая цена, границу предпочтительности использования медианы предлагается определить как решение следующего уравнения, содержащего среднеквадратические отклонения, приравнивающего границы статистического разброса:
mmean (1,
a, n, L) +^/D
MEAN
(a, n, L ) = = M(1, a, n, L) + ^D (a, n, L ).
Решение этого уравнения, полученное программированием, представлено в табл. 5.
В сравнении с табл. 3 мы видим более широкую область предпочтительности медианы.
ВЫВОДЫ
Полученные формулы и результаты вычислений предоставляют возможность оценивать параметры медианы в сравнении с параметрами среднего арифметического в зависимости от количества датчиков и от дрейфа одного датчика. Тем самым обеспечена возможность выбора количества датчиков в соответствии с задаваемыми требованиями по точности измерений случайной величины (мощности дозы).
СПИСОК ЛИТЕРАТУРЫ
1. Ильин А.С. Свойства медианы с учетом дрейфа одного из группы измерителей (на примере равномерного распределения) // Научное приборостроение. 2016. Т. 26, № 2. С. 93-100. URL: http://213.170.69.26/ mag/2016/full2/Art12.pdf.
2. Дэйвид Г. Порядковые статистики. М.: Наука, 1979. 336 с.
3. Гильбо Е.П., Челпанов И.Б. Обработка сигналов на основе упорядоченного выбора (мажоритарное и близкие к нему преобразования). М.: Советское радио, 1976. 344 с.
4. Виленкин Н.Я., Виленкин А.Н., Виленкин П.А. Комбинаторика. М.: ФИМА, МЦНМО, 2006. 400 с.
5. Функция ошибок. URL: https://ru.wikipedia.org/wiki/ Функция_ошибок (дата обращения 30.05.2016).
6. Двайт Г.Б. Таблицы интегралов и другие математические формулы. Пер. с англ. Издание четвертое. М.: Наука, 1973. 228 с.
7. Чистяков В.П. Курс теории вероятностей: Учеб. 3-е изд., испр. М.: Наука, 1987. 240 с.
Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики, г. Санкт-Петербург
ПРИЛОЖЕНИЕ
При К = 2 для нормального распределения, используя (25) и сравнивая с (2), получаем:
Контакты: Ильин Анатолий Степанович, TOLY@RTC.RU
d
—M ( 2, a, n,0) =
2
dL
( 2n +i)<
-M ( 2, a, n,0 ).
Материал поступил в редакцию: 15.04.2016
2
ISSN 0868-5886
NAUCHNOE PRIBOROSTROENIE, 2016, Vol. 26, No. 3, pp. 64-74
PROPERTIES OF MEDIAN UNDER DRIFT OF ONE OF GROUP OF MEASURING INSTRUMENTS AT NORMAL DISTRIBUTION
A. S. Ilyin
(ORCID: 0000-0001-8426-5580)
State Scientific Center for Robotics and Technical Cybernetics, Saint-Petersburg, Russia
It is supposed that the data arriving from each measuring instrument are distributed under the normal law. Formulas of calculation of expected value and dispersion of median when data from one of group of measuring instruments are subject to drift are received. As a median we take the value which has appeared in the middle of the sorted list of values from the odd number of measuring instruments. It was possible to take integrals and to receive analytical formulas, - when using approximate formula of integral of probability (Laplace's function). On the basis of results of numerical integration correction functions are added to the received formulas. Limits of preference of median in comparison with arithmetic average are defined.
Keywords: median, normal distribution, arithmetic mean, expected value, dispersion, sensitivity drift
REFERENСES
1. Ilyin A.S. [Properties of median under drift of one of group of measuring instruments (on the example of uniform distribution)]. Nauchnoe Priborostroenie [Scientific Instrumentation], 2016, vol. 26, no. 2, pp. 93-100. Doi: 10.18358/np-26-2-i93100.
2. David H., Nagaraja H. Order statistics. 3rd ed. Wiley, 2003. (Russ. ed.: Dehjvid G. Poryadkovye statistiki. Moscow: Glavnaya redakciya fiziko-matematicheskoj litera-tury Publ., 1979. 336 p.). Doi: 10.1002/0471722162.
3. Gil'bo E.P., Chelpanov I.B. Obrabotka signalov na osnove uporjadochennogo vybora (mazhoritarnoe i blizkie k ne-mu preobrazovanija) [Processing of signals on the basis of the ordered choice (majority and other transformations)]. Moscow, Sovetskoe radio Publ., 1976. 344 p. (In Russ.).
4. Vilenkin N.Ja., Vilenkin A.N., Vilenkin P.A. Kombinato-
rika [Combinatorics]. Moscow, FIMA Publ. and Moscow center of continuous mathematical education Publ., 2006. 400 p. (In Russ.).
Error function. URL: https://en.wikipedia.org/wiki/ Error_function (Accessed 30.05.2016). Dwight H.B. Tables of integrals and other mathematical data. New York, The Macmillan company, 1961 (Russ. ed.: Dvajt G.B. Tablicy integralov i drugie matemati-cheskie formuly. Moscow, Nauka Publ., 1973. 228 p.). Chistjakov V.P. Kurs teorii verojatnostej [Probability theory course]. Textbook, 3rd edition. Moskow, Nauka Publ., 1987. 240 p. (In Russ.).
Contacts: Ilyin Anatolij Stepanovich, TOLY@RTC.RU
Article received in edition: 15.04.2016