ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013 Управление, вычислительная техника и информатика № 1(22)
УДК 621.396
И.М. Рудько
СТАТИСТИЧЕСКИЕ СВОЙСТВА СУММЫ ЧЛЕНОВ УСЕЧЕННОГО ВАРИАЦИОННОГО РЯДА
Введено понятие усеченной порядковой статистики. Выведены аналитические выражения для математических ожиданий и дисперсий усеченных порядковых статистик для двух вариантов задания порога отсечения: порога, определяемого квантилем функции распределения, и порога, определяемого номером члена вариационного ряда.
Ключевые слова: порядковая статистика, моменты случайной величины, системы обнаружения, математическое моделирование.
Рассматривается задача определения математического ожидания и дисперсии суммы членов вариационного ряда (порядковой статистики) в случае, когда отбрасывается фиксированное число меньших членов вариационного ряда (усеченная порядковая статистика (УПС)) для двух вариантов задания порога отсечения: порога, фиксированного по заданному квантилю функции распределения, и порога, фиксированного по заданному номеру члена вариационного ряда, при условии, что статистические свойства членов вариационного ряда могут быть описаны центральным ^-распределением с п степенями свободы.
Задачи, которые могут быть описаны такой моделью, возникают при обработке результатов спектрального анализа, вибрационных испытаний, обработке гидроакустической информации и в других задачах, в которых используется энергетический критерий обнаружения [1]. Ранее в работе [2] методами математического моделирования была исследована модель эвристической двухпороговой системы обнаружения сигнала, в которой применение усеченной порядковой статистики в случае, когда известны дисперсии сигнала и шума, позволяет при фиксированной вероятности ложных тревог получить существенный выигрыш в вероятности обнаружения по сравнению с традиционной системой обнаружения. В настоящей работе приводится теоретическое обоснование алгоритма работы этой эвристической двухпороговой системы обнаружения сигнала.
1. Моменты усеченной порядковой статистики
Рассмотрим выборку, состоящую из т случайных величин X: {Х1,..., X,..., Хт}. Пусть случайная величина X описывается функцией плотности распределения
/ (X) = -1 кп (С2), х > 0 , (1)
где &„(•) - плотность центрального х2-распределения с п степенями свободы, с2 -дисперсия.
Сравним статистические свойства случайных величин 2, V и Ж, сформированных из случайной выборкиX (1 ^ ^ т) тремя различными способами:
т
1) 2 = ^ Х1 имеет центральное х2-распределение с пт степенями свободы,
1=1
математическим ожиданием
|az = nmo , o2Z = 2nmo4,
(2)
дисперсиеи
и в силу центральной предельной теоремы при достаточно больших значениях т ее функция плотности распределения нормализуется, т.е. 2 ~ N(ц2, <з1х).
т
2) V = £ Х0.), (4)
1=1
где Х(.) (1 < / < т) - упорядоченные величины (порядковые статистики) статистики Х, такие, что Х(1) < Х(2) <... <Хо <...< Х(т). Если случайные величины Х статистически независимы и одинаково распределены, то случайные величины Хо зависимы из-за неравенств между ними, 1 выбирается из условия Х(1 -1) - Х(
L(i);
h = const - фиксированный порог. Таким образом, l - случайная величина, зависящая от порядковых статистик выборки Xi>
Рассмотрим случайную величину Y , которая связана со случайной величиной Х нелинейным преобразованием
X, если X > h,
0, если X <h.
Функция плотности g(x) случайной величины определяется следующим об-
разом (рис. 1):
g (х) = 5(0)а + / (х) I (х),
где а =
а = | f (x)dx , индикатор I (x) = Г
0 при 0 < x<h, при x > h,
h - порог, 5 - дельта-
функция, введенная для сохранения условий нормировки J g (x)dx = 1.
0 h 10 20 30 x
Рис. 1. Функции плотности случайных величин f (x) и g (x)
Математическое ожидание случайной величины Y определяется следующим образом:
|aY =| xg (x)dx =| xf (x)dx
0 h
- ((n+2X - 'I
і
x/2 e /2a dx =
2/2 ст”Г(”2) h
2(n+2j2 ст(”+2)г ((n + 2)/)
K” (x) = -
2ст2
dx = ”ст
/2ст2 ^ .%-1
2/2 Г
• Г ”/ -i,/!
e ' 2ст dt.
(5)
(6)
В (6) Кп (х) - функция распределения центрального х -распределения с п степенями свободы.
Аналогично, 2-й начальный момент У определяется по формуле
1 -K”+4( У2)
а дисперсия равна ст^ = М2 - Ц2 .
Таким образом, случайную величину V можно представить в следующем виде:
m m
V = ЕX(i) = E Y , i=l i=1
при условии, что порог h = const для всей выборки Xi (1 < i < m) (например, h -медиана плотности f (x)).
Для случайной величины V математическое ожидание
I^V = m^Y ; (7)
дисперсия ctV = mCT~Y, (8)
и в силу центральной предельной теоремы при достаточно больших значениях m ее функция плотности распределения нормализуется ( V ~ N(w,ctV)).
В случае, если число степеней свободы n - четное, для определения моментов
Y можно использовать представление интегралов для вычисления и М2 в виде
конечного ряда {[3], формулы (3.381(3)) и (8.352(2))}:
- математическое ожидание Y
2 ЧХа2)
|aY = nc e /2c
1+х
2c2
k=1
k!
- 2-й начальный момент Y
M2 = 2n \ 2 +1 I c4e 2c
(hA 2)
+1(hA 2)
1+X
2c2
k=1
k!
1
- дисперсия Y
О у — 2 My .
3) W — SX(i), при условии, что порог k = const. В дальнейшем будем назы-
i—к
вать статистику W - усеченная порядковая статистика (УПС), а параметр к - порог отсечения.
В работе [4] приведены выражения для вычисления моментов порядковых статистик. Для случайной величины, описываемой формулами (1) и (6), т.е. плотностью распределения f (x) и функцией распределения Kn (х), формулы для определения цj, ст2 и ст]к приобретают следующий вид:
m!
ст2 —
(j - 1)!(m - j)!
. ад
m!
j-1
(j - 1)!(m - j)!
J Kn ( XCT2>j-1
1 - K'! ( /ст2)
m- j
x f (x) dx,
(x -Ц j )2 f (x) dx , (9)
j — E [ X( j) X(k) ] —
m!
(m - k)!(k - j -1)!( j -1)!
J C (x, y) xyf (x) f (y)dx
где C(x,y) — Kn( У2)1 1
k - j-1
n-k
Для случайной величины W математическое ожидание
Mw(l) — SMi для 1 - 1 -
j—1
m,
а дисперсия с учетом зависимости случайных величин X(i) [5]
dy,
(10)
стко—Sст2+2 S CTjk для 1 - 1 - ;
k—l l < j <k<m
(11)
и в силу центральной предельной теоремы при достаточно больших значениях т ее функция плотности распределения также нормализуется - Ж ~ N(цЖ, ст^).
ад
2. Моделирование
Аналитические исследования статистических свойств случайной величины Ж очень сложны, и поэтому большинство последующих результатов получены на ПК с использованием символьного программирования в среде МЛТЬЛБ.
На рис. 2 приведены рассчитанные по формулам (7), (8), (10) и (11) зависимости математических ожиданий (И), (I) и с.к.о. сту(И), стЖ(I) от порога при
следующих значениях параметров: п = 8, т = 12, ст = 1 .
Для случайной величины V порог И > 0 , для Ж - порог I дискретный, 1 < I < т, и для удобства сравнения моментов случайных величин V и Ж на оси абсцисс для
УПС W отложены дискретные значения порога
h =*-, h = *_ J* ^_
2 ' ' 1 ^ 2
где р - рассчитанные по формуле (9) значения математических ожиданий
2 < I < т. Из графиков видно, что ~ , ау (И) имеет максимум, приблизи-
тельно совпадающий с максимумом плотности распределения /(х) величины X, а стж (I) монотонно убывающая функция, причем ру (0) = (1) = = пт и
Су (0) = dw (1) = dz = V2
nm .
n = 8, m = 12, d = 1
0 4 8 12 h
Рис. 2. Зависимости математических ожиданий *V (h), *w (l) и с.к.о. dV(h), dw (l) от порога для случайных величин Vи W
Сравним между собой статистические свойства случайных величин V и W. Случайная величина
m
w =Х X(0, (12)
i=k
где X(i) (1 < i < m), а k = const.
Случайная величина
m
V = Z X(i), (13)
i=l
где l такая, что X(l_j) < h<X^).
Еще раз отмечаем, что l - случайная величина, зависящая от порядковых статистик выборки, и единственным отличием УПС V и W является то, что число
членов в сумме (12) k = const, а в сумме (13) l определяется из условия X(l-1) < h <
X(l), где h = const.
На рис. 3 приведены рассчитанные по формулам (2), (3), (7), (8), (10) и (11) плотности распределения случайных величин 2, V и Ж (рассчитанные при следующих значениях параметров: п = 8, т = 100, порог отсечения к = 51; медиана порядковой статистики Х^ (1 < / < т), И = 7,344 - медиана х2-распределения с 8 степенями свободы) и гистограммы этих плотностей, полученные на моделях. (Размеры массивов для построения гистограмм - 5000). Наблюдается достаточно близкое совпадение между теоретическими и модельными результатами.
п = 8, т = 100
0,016
0,012
0,008
0,004
0 200 400 600 800 1000 1200
Рис. 3. Плотности распределения и гистограммы случайных величин 2, V и Ж
В системах обнаружения, использующих энергетический критерий обнаружения [1], применение статистик Ж может позволить увеличить вероятность обнаружения слабых сигналов. Ниже в качестве иллюстрации приведены заимствованные из этой работы результаты математического моделирования двух систем обнаружения:
- однопороговой системы обнаружения сигнала (традиционной), реализующей алгоритм обнаружения, основанный на статистике 2 (алгоритм-1),
- двухпороговой системы обнаружения сигнала, реализующей алгоритм обнаружения, основанный на статистике Ж (алгоритм-2).
На рис. 4 приведены графики оценок вероятности обнаружения робн = / (ст с+ш) как функции от с.к.о. смеси сигнала и шума ст с+ш (при условии, что с.к.о. шума стш = 1) для
статистики Z - Ро|н (кр. 1) (алгоритм-1) и для статистики W - Р^ (кр. 2) (алгоритм-2), рассчитанные при следующих параметрах модели: n = 8, m = 100, порог отсечения к = 51 и Рлт = 0,05 по выборке размером - 10000.
В работе [6] результаты работы [2] обобщены на случай неизвестной дисперсии сигнала и дано обоснование выбора порога отсечения для этого случая.
Заключение
В данной работе получены аналитические выражения математических ожиданий и дисперсий для усеченных порядковых статистик. Показано, что фиксированный порог отсечения в УПС обеспечивает меньшую дисперсию, чем порог отсечения, определенный фиксированным квантилем исходной статистики, и меньшую, чем дисперсия исходной статистики. Приводятся результаты моделирования.
ЛИТЕРАТУРА
1. Левин Б.Р. Теоретические основы статистической радиотехники. Т. 2. М.: Сов. радио,
1968. 504 с.
2. Рудько И.М. Исследование методами математического моделирования двухпороговой системы обнаружения сигналов // Информационные технологии и математическое моделирование. Материалы VIII Всероссийской научно-практической конференции с международным участием. Томск: Изд-во Том. ун-та, 2009. Ч. 1. С. 82-86.
3. Градштейн И.С., Рыжик И.М. Таблицы интегралов, сумм, рядов и произведений. М.: Наука, 1971. 1108 с.
4. Дэйвид Г. Порядковые статистики. М.: Наука, 1979. 336 с.
5. Левин Б.Р. Теоретические основы статистической радиотехники. Т. 1. М.: Сов. радио,
1969. 752 с.
6. Рудько И.М. Применение порядковых статистик в задачах обнаружения // IX Международная конференция «Идентификация систем и задачи управления» SICPRO'12, Москва, 30 января - 2 февраля 2012, С. 1101-1116.
Рудько Игорь Михайлович
Институт проблем управления им. В. А. Трапезникова РАН
E-mail: [email protected] Поступила в редакцию 2 мая 2012 г.
Rudko Igor M. (Institute of Control Sciences of RAS, Moscow). Statistical characteristics to sum of terms of truncated variational series.
Keywords: order statistics, moments of random quantity, detection systems, mathematical modeling.
The concept of truncated order statistic is introduced. Analytical expressions for the mean value and the variance of truncated order statistic are derived for the two version of a threshold: for a threshold determined by the distribution function quantile and for a threshold determined by the number of member of the variational series.