Научная статья на тему 'Определение эффективных оценок центра распределения при статистической обработке результатов наблюдений'

Определение эффективных оценок центра распределения при статистической обработке результатов наблюдений Текст научной статьи по специальности «Математика»

CC BY
65
18
Поделиться

Аннотация научной статьи по математике, автор научной работы — Захаров Игорь Петрович, Штефан Наталья Владимировна

При статистической обработке результатов наблюдений очень важно для оценивания центра распределения использовать наиболее эффективную оценку, поскольку это позволяет более точно оценить другие параметры распределения и добиться той же точности вычислений при меньшем числе наблюдений. Предлагается метод определения эффективной оценки центра распределения в виде взвешенной суммы среднего арифметического, медианы и центра размаха.

Похожие темы научных работ по математике , автор научной работы — Захаров Игорь Петрович, Штефан Наталья Владимировна,

Definition of effective distribution center value at statistical processing of measurement observations

It is offered for estimation of a center value of distribution to use an estimation as the fluidized sum mean arithmetic, center of span and median, which one changes the view depending on a kurtosis of distribution.

Текст научной работы на тему «Определение эффективных оценок центра распределения при статистической обработке результатов наблюдений»

УДК 621.317.08

ОПРЕДЕЛЕНИЕ ЭФФЕКТИВНЫХ ОЦЕНОК ЦЕНТРА РАСПРЕДЕЛЕНИЯ ПРИ СТАТИСТИЧЕСКОЙ ОБРАБОТКЕ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

ЗАХАРОВ И.П., ШТЕФАНН.В.

При статистической обработке результатов наблюдений очень важно для оценивания центра распределения использовать наиболее эффективную оценку, поскольку это позволяет более точно оценить другие параметры распределения и добиться той же точности вычислений при меньшем числе наблюдений. Предлагается метод определения эффективной оценки центра распределения в виде взвешенной суммы среднего арифметического, медианы и центра размаха.

При статистической обработке экспериментальных данных наиболее часто используются следующие оценки центра распределения Mx :

— среднее арифметическое результатов наблюдений

- 1 V

x = -Е-i

ni=i

(1)

где n — число наблюдений; Xi — результат отдельного наблюдения;

— оценка медианы

x n+i, n - нечетное ,

2

Me = \

xn

2

+ X

n+i 2

2

n - четное ;

(2)

— центр размаха

xcp

x min + x max

2

(3)

здесь xmin — минимальный член выборки; xma- — максимальный член выборки.

Под наиболее эффективной понимается оценка, обладающая наименьшей дисперсией. Эффективность - одно из основных требований к оценке, поскольку определение всех последующих оценок базируется на оценке центра распределения и погрешность в его определении может повлечь за собой неправильную оценку среднего квадратичного отклонения (СКО), границ доверительного интервала, вида распределения и т.п. При этом использование более эффективных оценок позволяет оценить параметр по меньшему числу наблюдения при той же точности, что особенно актуально в настоящее время для построения процессорных средств измерений.

Наиболее часто за оценку центра распределения принимается среднее арифметическое результатов наблюдений. Однако [1-3] такая оценка наиболее эффективна только для нормального распределения. Она менее эффективна, чем центр размаха для ограниченных распределений (кроме треугольного), и менее эффективна, чем медиана для распределения Лапласа, т.е. эффективность оценок зависит от вида распределения. В литературе приводится методика, согласно которой эффективная оценка центра распределения выбирается в зависимости от эксцесса распределения, оценка которого вычисляется по формуле

£(xi - mJ4

E = ^----4-----3 , (4)

n°x

где ctx — оценка среднего квадратического отклонения результатов наблюдения.

Согласно этой методике для распределений со значениями эксцесса меньше —0,5 наиболее эффективной оценкой является центр размаха, со значениями эксцесса от —0,5 до 1 — среднее арифметическое результатов наблюдений, со значением эксцесса, большим 1 — медиана. Указанные выше границы выбраны приблизительно, поэтому они нуждаются в дополнительном исследовании.

В связи с этим возникает задача отыскания такой

Mx , которая была бы эффективной для любого

вида распределения и изменяла свой вид в зависимости от формы распределения.

Нами предлагается для оценивания центра распределения оценка в виде взвешенной суммы всех трех оценок:

xвз = k1x + k2xcp + k3Me , (5)

где ki, k2 и кз — коэффициенты влияния, значения которых зависят от формы закона распределения. При этом для того, чтобы оценка (5) была несмещенной, необходимо выполнять условия

ki + к 2 + кз = 1.

Эффективность оценки (4) была определена численным методом с помощью моделирования на ЭВМ. В его основу положен метод математического моделирования (метод Монте-Карло) [4], суть которого заключается в следующем:

1. Получаем генеральную совокупность случайных чисел объемом N, подчиняющуюся заданному распределению.

2. Из этой генеральной совокупности формируем выборки малого объема n. Для каждого распределения на ЭВМ формируем не менее 1000 выборок с объемом 3,5,7,...,21 наблюдений.

3. Для каждой малой выборки объемом n вычисляем оцениваемый параметр, в результате чего получаем выборку из значений этого параметра

РИ, 2002, № 3

97

объемом m = — для заданного числа наблюдении n n

и заданного распределения.

4. По этоИ выборке рассчитываем оценки точечных характеристик—математического ожидания и дисперсии, т.е. задаваясь различными сочетаниями коэффициентов, находим значения оценки (5) и по ним вычисляем оценку их дисперсии. Определяем минимальное значение дисперсии оценки (5) и фиксируем соответствующее ему сочетание коэффициентов.

Для исследования были взяты распределения различных классов [1] с разными значениями эксцесса: арксинусоидальное (эксцесс -1,5), равномерное (эксцесс -1,2), трапецеидальные с отношением основании 0,75 (эксцесс -1,15), 0,5(эксцесс -0,98), 0,25 (эксцесс -0,73),треугольное распределение (эксцесс -0,6), распределения типа шапо, полученные как композиция равномерного и нормального распределении (эксцессы -0,4 и -0,2), равномерного распределения и распределения Лапласа (эксцессы 0,4; 0,87; 1,32; 1,99;2,44), нормальное распределение (эксцесс 0), распределение Лапласа (эксцесс 3).

Для моделирования равномерного и нормального распределении был использован встроенный генератор случайных чисел Microsoft Mathcard 7.0. Треугольное, арксинусоидальное распределения и распределение Лапласа получены из равномерного распределения с границами (0; 1) методом обратных функции. Трапецеидальные распределения получены как композиция двух равномерных распределении с различными границами. Распределения типа шапо получены как композиция равномерного и нормального распределении (получены распределения с отрицательными эксцессами) или равномерного и распределения Лапласа (получены распределения с положительными эксцессами).

Результаты вычислении приведены в табл. 1.

Зависимости коэффициентов от эксцесса приведены на рисунке.

Как видно из рисунка, на оценку центра распределения оказывают влияние не более двух оценок:

для распределении с отрицательными эксцессами сказывается центр размаха и среднее арифметическое, а для распределении с положительным эксцессом — среднее арифметическое и медиана.

Зависимости коэффициентов влияния от эксцесса могут быть аппроксимированы выражениями, приведенными в табл. 2 с погрешностью, не превышаю-щеи 2%.

Таблица 1

E k1 k2 k3

-1,5 0 1 0

-1,2 0 1 0

-1,15 0 1 0

-0,99 0,2 0,8 0

-0,73 0,45 0,55 0

-0,6 0,6 0,4 0

-0,4 0,8 0,2 0

-0,2 1 0 0

0 1 0 0

0,39 1 0 0

0,87 1 0 0

1,32 0,8 0 0,2

1,99 0,45 0 0,55

2,44 0,25 0 0,75

3 0 0 1

Таблица 2

Область изменения эксцесса k1 k2 k3

E <-1,15 0 1 0

-1,15 < E <-0,2 1,05E +1,22 -0,05E - 0,22 0

-0,2 < E < 0,9 1 0 0

0,9 < E < 3 -0,47E +1,41 0,47E - 0,41

E > 3 0 0 1

Установлено, что для распределении, имеющих совершенно различную форму, но близкие значения эксцесса (например, для равномерного распределения с эксцессом —1,2 и распределения типа двоинои шлем с эксцессом—1,18; трапецеидального распределения с эксцессом -0,73 и распределения типа русскии шлем с эксцессом -0,75), дисперсия оценки (5) достигала минимума при одинаковых сочетаниях коэффициентов. Это говорит о том, что есть возможность определять значения коэффициентов по характеристике формы распределения -эксцессу и предложить следующую методику оценки центра распределения:

1. Определяется оценка эксцесса распределения.

2. По рисунку или с помощью табл. 2 рассчитываются значения коэффициентов.

3. По формуле (5) определяется эффективная оценка центра распределения.

Сравним эффективность предложеннои оценки с остальными для распределении с различными эксцессами. Для этого определим величину, называемую сравнительнои эффективностью, представляющую собои отношение дисперсии предложеннои средневзвешеннои оценки к дисперсиям других оценок. Результаты этих вычислении приведены в табл. 3.

Как видно из табл. 3, оценка центра в виде взвешеннои суммы более эффективна, чем центр размаха для распределении с эксцессом, меньшим -0,5, и более эффективна, чем медиана для распределении с эксцессом, большим 1.

98

РИ, 2002, № 3

Таблица 3

E D[x вз] DN D ,x вз, D[X вз] D [Ме]

D[xJ

-1,5 0,02 1 0,005

-1,2 0,2 1 0,08

-1,15 0,4 1 0,15

-0,99 0,63 0,85 0,25

-0,73 0,81 0,75 0,4

-0,6 0,86 0,67 0,54

-0,4 0,97 0,5 0,55

-0,2 1 0,4 0,6

0 1 0,31 0,64

0,39 1 0,25 0,65

0,87 1 0,2 0,67

1,32 0,96 0,18 0,8

1,99 0,9 0,12 0,85

2,44 0,8 0,1 0,93

3 0,67 0,07 1

Таким образом, предложенную средневзвешенную оценку можно использовать в качестве эффективной оценки центра распределения.

Литература: 1. Новицкий П. В., Зограф И. А. Оценка погрешностей результатов измерений. Л.:Энергоатомиздат. Ленингр. отд-ние, 1991. 304 с. 2.Крамер Г. Математические методы статистики. М.: Мир, 1976. 648 с. 3. Закс Л. Статистическое оценивание. М.: Статистика, 1976. 598 с. 3. Дунин-Барковский И.В., Смирнов Н.В. Теория вероятностей и математическая статистика в технике (общая часть). М.: Государственное издательство технико-теоретической литературы, 1955. 557 с. 4. Ермаков С. М, Михайлов Г. А. Курс статистического моделирования. М.: Наука, 1976. 472с.

Поступила в редколлегию 16.03.2002

Рецензент: д-р физ.-мат. наук, проф. Яковлев С.В.

Захаров Игорь Петрович, канд. техн. наук, доцент кафедры МИТ ХНУРЭ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-9331, 27-60-17.

Штефан Наталья Владимировна, младший научный сотрудник кафедры МИТ ХНУРЭ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-31, 27-60-17.

РИ, 2002, № 3

99