Научная статья на тему 'Оценивание параметров: одношаговые оценки предпочтительнее оценок максимального правдоподобия'

Оценивание параметров: одношаговые оценки предпочтительнее оценок максимального правдоподобия Текст научной статьи по специальности «Математика»

CC BY
834
119
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА / ОЦЕНИВАНИЕ ПАРАМЕТРОВ / ОЦЕНКИ МЕТОДА МОМЕНТОВ / ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ / ОДНОШАГОВЫЕ ОЦЕНКИ / НАИЛУЧШИЕ АСИМПТОТИЧЕСКИ НОРМАЛЬНЫЕ ОЦЕНКИ / СРАВНЕНИЕ МЕТОДОВ ОЦЕНИВАНИЯ / ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ / ГАММА-РАСПРЕДЕЛЕНИЕ / АСИМПТОТИЧЕСКАЯ НОРМАЛЬНОСТЬ / MATHEMATICAL STATISTICS / PARAMETRIC STATISTICS / ESTIMATION OF THE PARAMETERS / MOMENT METHOD ESTIMATORS / MAXIMUM LIKELIHOOD ESTIMATORS / ONE-STEP ESTIMATORS / BEST ASYMPTOTICALLY NORMAL ESTIMATORS / COMPARISON OF METHODS FOR ESTIMATING / LIMIT THEOREMS / GAMMA DISTRIBUTION / ASYMPTOTIC NORMALITY

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Согласно новой парадигме прикладной математической статистики следует отдавать предпочтение непараметрическим методам и моделям. Однако в настоящее время в прикладной статистике используются разнообразные параметрические модели. Термин «параметрический» означает, что вероятностно-статистическая модель полностью описывается конечномерным вектором фиксированной размерности, причем эта размерность не зависит от объема выборки. В параметрической статистике задача оценивания состоит в том, чтобы оценить неизвестное статистику значение параметра наилучшим (в каком-либо смысле) образом. В статистических задачах стандартизации и управления качеством используют трехпараметрическое семейство гамма-распределений. В настоящей статье это семейство рассматривается как пример. Сравним методы оценивания параметров. Метод моментов является универсальным. Однако получаемые с его помощью оценки лишь в редких случаях обладают оптимальными свойствами. Оценки максимального правдоподобия (ОМП) входят в класс наилучших асимптотически нормальных оценок. В большинстве случаев аналитических решений не существует, следовательно, для нахождения ОМП необходимо применять численные методы. Однако применение численных методов порождает многочисленные проблемы. Сходимость итерационных алгоритмов требует обоснования. В ряде примеров анализа конкретных данных функция правдоподобия имеет много локальных максимумов, а потому естественные итерационные процедуры не сходятся. Предлагаем использовать одношаговые оценки (ОШ-оценки). Они имеют столь же хорошие асимптотические свойства, что и оценки максимального правдоподобия, при тех же условиях регулярности, что и ОМП. Одношаговые оценки выписываются в виде явных формул. В статье доказано, что одношаговые оценки являются наилучшими асимптотически нормальными оценками (при выполнении естественных условий). Найдены ОШ-оценки для гамма-распределения. Приведены результаты расчетов по данным о наработке резцов до предельного состояния

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ESTIMATION OF THE PARAMETERS: ONE-STEP ESTIMATORS ARE MORE PREFERABLE THAN MAXIMUM LIKELIHOOD ESTIMATORS

According to the new paradigm of applied mathematical statistics one should prefer non-parametric methods and models. However, in applied statistics we currently use a variety of parametric models. The term "parametric" means that the probabilistic-statistical model is fully described by a finite-dimensional vector of fixed dimension, and this dimension does not depend on the size of the sample. In parametric statistics the estimation problem is to estimate the unknown value (for statistician) of parameter by means of the best (in some sense) method. In the statistical problems of standardization and quality control we use a three-parameter family of gamma distributions. In this article, it is considered as an example of the parametric distribution family. We compare the methods for estimating the parameters. The method of moments is universal. However, the estimates obtained with the help of method of moments have optimal properties only in rare cases. Maximum likelihood estimation (MLE) belongs to the class of the best asymptotically normal estimates. In most cases, analytical solutions do not exist; therefore, to find MLE it is necessary to apply numerical methods. However, the use of numerical methods creates numerous problems. Convergence of iterative algorithms requires justification. In a number of examples of the analysis of real data, the likelihood function has many local maxima, and because of that natural iterative procedures do not converge. We suggest the use of one-step estimates (OS-estimates). They have equally good asymptotic properties as the maximum likelihood estimators, under the same conditions of regularity that MLE. One-step estimates are written in the form of explicit formulas. In this article it is proved that the one-step estimates are the best asymptotically normal estimates (under natural conditions). We have found OS-estimates for the gamma distribution and given the results of calculations using data on operating time to limit state for incisors

Текст научной работы на тему «Оценивание параметров: одношаговые оценки предпочтительнее оценок максимального правдоподобия»

Научный журнал КубГАУ, №109(05), 2015 года

1

УДК 519.2

01.00.00 Физико-математические науки

ОЦЕНИВАНИЕ ПАРАМЕТРОВ: ОДНОШАГОВЫЕ ОЦЕНКИ ПРЕДПОЧТИТЕЛЬНЕЕ ОЦЕНОК МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ

Орлов Александр Иванович д.э.н., д.т.н., к.ф.-м.н., профессор РИНЦ SPIN-код: 4342-4994 Московский государственный технический университет им. Н.Э. Баумана, Россия, 105005, Москва, 2-я Бауманская ул., 5, _pro f-orlov@mail. ru Московский физико-технический институт, 141700, Моск. обл., г. Долгопрудный, Институтский пер., 9

Согласно новой парадигме прикладной математической статистики следует отдавать предпочтение непараметрическим методам и моделям. Однако в настоящее время в прикладной статистике используются разнообразные параметрические модели. Т ермин «параметрический» означает, что вероятностностатистическая модель полностью описывается конечномерным вектором фиксированной размерности, причем эта размерность не зависит от объема выборки. В параметрической статистике задача оценивания состоит в том, чтобы оценить неизвестное статистику значение параметра наилучшим (в каком-либо смысле) образом. В статистических задачах стандартизации и управления качеством используют трехпараметрическое семейство гамма-распределений. В настоящей статье это семейство рассматривается как пример. Сравним методы оценивания параметров. Метод моментов является универсальным. Однако получаемые с его помощью оценки лишь в редких случаях обладают оптимальными свойствами. Оценки максимального правдоподобия (ОМП) входят в класс наилучших асимптотически нормальных оценок. В большинстве случаев аналитических решений не существует, следовательно, для нахождения ОМП необходимо применять численные методы. Однако применение численных методов порождает многочисленные проблемы. Сходимость итерационных алгоритмов требует обоснования. В ряде примеров анализа конкретных данных функция правдоподобия имеет много локальных максимумов, а потому естественные итерационные процедуры не сходятся. Предлагаем использовать одношаговые оценки (ОШ-оценки). Они имеют столь же хорошие асимптотические свойства, что и оценки максимального правдоподобия, при тех же условиях регулярности, что и ОМП. Одношаговые оценки выписываются в виде явных формул. В статье доказано, что одношаговые оценки являются наилучшими асимптотически нормальными оценками

UDC 519.2

Physics and mathematical sciences

ESTIMATION OF THE PARAMETERS: ONE-STEP ESTIMATORS ARE MORE PREFERABLE THAN MAXIMUM LIKELIHOOD ESTIMATORS

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

Moscow Physics-Technical Institute; Moscow region, Dolgoprudny, Russia

According to the new paradigm of applied mathematical statistics one should prefer nonparametric methods and models. However, in applied statistics we currently use a variety of parametric models. The term "parametric" means that the probabilistic-statistical model is fully described by a finite-dimensional vector of fixed dimension, and this dimension does not depend on the size of the sample. In parametric statistics the estimation problem is to estimate the unknown value (for statistician) of parameter by means of the best (in some sense) method. In the statistical problems of standardization and quality control we use a three-parameter family of gamma distributions. In this article, it is considered as an example of the parametric distribution family. We compare the methods for estimating the parameters. The method of moments is universal. However, the estimates obtained with the help of method of moments have optimal properties only in rare cases. Maximum likelihood estimation (MLE) belongs to the class of the best asymptotically normal estimates. In most cases, analytical solutions do not exist; therefore, to find MLE it is necessary to apply numerical methods. However, the use of numerical methods creates numerous problems. Convergence of iterative algorithms requires justification. In a number of examples of the analysis of real data, the likelihood function has many local maxima, and because of that natural iterative procedures do not converge. We suggest the use of one-step estimates (OS-estimates). They have equally good asymptotic properties as the maximum likelihood estimators, under the same conditions of regularity that MLE. One-step estimates are written in the form of explicit formulas. In this article it is proved that the one-step estimates are the best asymptotically normal estimates (under natural conditions). We have found OS-estimates for the gamma distribution and given the results of calculations using data on operating time to limit state for incisors

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

2

(при выполнении естественных условий). Найдены ОШ-оценки для гамма-распределения. Приведены результаты расчетов по данным о наработке резцов до предельного состояния

Ключевые слова: МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА, ОЦЕНИВАНИЕ ПАРАМЕТРОВ, ОЦЕНКИ МЕТОДА МОМЕНТОВ, ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ, ОДНОШАГОВЫЕ ОЦЕНКИ, НАИЛУЧШИЕ АСИМПТОТИЧЕСКИ НОРМАЛЬНЫЕ ОЦЕНКИ, СРАВНЕНИЕ МЕТОДОВ ОЦЕНИВАНИЯ, ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ, ГАММА-РАСПРЕДЕЛЕНИЕ, АСИМПТОТИЧЕСКАЯ НОРМАЛЬНОСТЬ

Keywords: MATHEMATICAL STATISTICS, PARAMETRIC STATISTICS, ESTIMATION OF THE PARAMETERS, MOMENT METHOD ESTIMATORS, MAXIMUM LIKELIHOOD ESTIMATORS, ONE-STEP ESTIMATORS, BEST ASYMPTOTICALLY NORMAL ESTIMATORS, COMPARISON OF METHODS FOR ESTIMATING, LIMIT THEOREMS, GAMMA DISTRIBUTION, ASYMPTOTIC NORMALITY

1. Введение

Согласно новой парадигме прикладной математической статистики следует отдавать предпочтение непараметрическим методам и моделям [1 -

4]. Однако в настоящее время в прикладной статистике используются разнообразные параметрические модели. Термин «параметрический» означает, что вероятностно-статистическая модель полностью описывается конечномерным вектором фиксированной размерности, причем эта размерность не зависит от объема выборки.

Рассмотрим выборку xb x2,..., xn из распределения с плотностью /(x;00), где /(x;0o) - элемент параметрического семейства плотностей распределения вероятностей {/x;0), 0е0). Здесь 0 - заранее известное к-мерное пространство параметров, являющееся подмножеством евклидова пространства Rk, в то время как конкретное значение параметра 0О статистику неизвестно и подлежит оцениванию по выборке. Обычно в прикладной статистике применяются параметрические семейства с к =

1,2,3 (см. [5, гл.2]). В статистике нечисловых данных вместо плотности часто рассматриваются вероятности попадания в точки. В параметрических задачах оценивания принимают вероятностную модель, согласно которой результаты наблюдений xb x2,..., xn рассматривают как реализации n независимых случайных величин.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

3

В параметрической статистике задача оценивания состоит в том, чтобы оценить неизвестное статистику значение параметра 90 наилучшим (в каком-либо смысле) образом.

Пример 1. В статистических задачах стандартизации и управления качеством используют семейство гамма-распределений. Плотность гамма-распределения имеет вид

f (У a, b, c)

1

< Г(0)

(х - c)“ 1 b a exp

x - c

b

0, x < c.

x > c,

(1)

Плотность вероятности в формуле (1) определяется тремя параметрами а, b, c, где а>2, b>0. При этом а является параметром формы, b - параметром масштаба и с - параметром сдвига. Множитель 1/Г(а) является

нормировочным, он введен, чтобы

+ ¥

| f (х; a, b, c)dx = 1.

Здесь Г(а) - одна из используемых в математике специальных функций, так называемая «гамма-функция», по которой названо и распределение, задаваемое формулой (1),

Г(а) = | ха-le~Xdx.

0

Подробные решения задач оценивания параметров для гамма-распределения содержатся в разработанном нами государственном стандарте ГОСТ 11.01183 «Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения» [6]. В настоящее время эта публикация используется в качестве методического материала для инженерно-технических работников промышленных предприятий и прикладных научно-исследовательских институтов.

Поскольку гамма-распределение зависит от трех параметров, то имеется 2 - 1 = 7 вариантов постановок задач оценивания. Они описаны в табл.1.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

4

Таблица 1. Задачи оценивания для параметров гамма-распределения

№ п/п Параметр формы Параметр масштаба Параметр сдвига

1 Известен Оценивается Известен

2 Оценивается Известен Известен

3 Известен Известен Оценивается

4 Оценивается Оценивается Известен

5 Известен Оценивается Оценивается

6 Оценивается Известен Оценивается

7 Оценивается Оценивается Оценивается

В табл. 2 приведены данные о наработке резцов до предельного состояния, в часах. Упорядоченная выборка (вариационный ряд) объема n = 50 взята из государственного стандарта [6]. Проверка согласия данных о наработке резцов с семейством гамма-распределений проведена в [5, гл.7] и [7]. Именно эти данные будут служить исходным материалом для демонстрации тех или иных методов оценивания параметров.

Выбор «наилучших» оценок в определенной параметрической модели прикладной статистики - научно-исследовательская работа, растянутая во времени. Выделим в ней два этапа.

Этап асимптотики: оценки строятся и сравниваются по их свойствам при безграничном росте объема выборки. На этом этапе рассматривают такие характеристики оценок, как состоятельность, асимптотическая эффективность и др.

Этап конечных объемов выборки: оценки сравниваются, скажем, при n = 10. Ясно, что исследование начинается с этапа асимптотики: чтобы сравнивать оценки, надо сначала их построить и быть уверенными, что они

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

5

не являются абсурдными (такую уверенность дает доказательство состоятельности).

Таблица 2. Наработка резцов до предельного состояния (ч)

№ п/п Наработка № п/п Наработка № п/п Наработка

1 9 18 47,5 35 63

2 17,5 19 48 36 64,5

3 21 20 50 37 65

4 26,5 21 51 38 67,5

5 27,5 22 53,5 39 68,5

6 31 23 55 40 70

7 32,5 24 56 41 72,5

8 34 25 56 42 77,5

9 36 26 56,5 43 81

10 36,5 27 57,5 44 82,5

11 39 28 58 45 90

12 40 29 59 46 96

13 41 30 59 47 101,5

14 42,5 31 60 48 117,5

15 43 32 61 49 127,5

16 45 33 61,5 50 130

17 46 34 62

2. Метод моментов

С какой оценки начинать? Одним из наиболее известных и простых в употреблении методов является метод моментов. Название связано с тем, что этот метод опирается на использование выборочных моментов

I n

Mnm = -Xxm, m = 1,2,...,

i=1

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

6

где Хь x2,..., xn - выборка, т.е. набор независимых одинаково распределенных случайных величин с числовыми значениями.

В прикладной статистике метод анализа данных называется методом моментов, если он использует статистику

Y = g (Mnl, Mn2,..., Mnq ), (2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где g: Rq ^ Rk - некоторая функция (здесь k - число неизвестных числовых параметров). Чаще всего термин «метод моментов» используют, когда речь идет об оценивании параметров. В этом случае обычно предполагают, что плотность вероятности распределения элементов выборки f(x) входит в заранее известное статистику параметрическое семейство (fx;0), 0е©}, т.е. fx) = fx;0o) при некотором 0О. Здесь 0 - заранее заданное k-мерное пространство параметров, являющееся подмножеством евклидова пространства Rk, а конкретное значение параметра 00 статистику неизвестно, его и следует оценить. Известно также, что неизвестный параметр определяется с помощью известной статистику функции через начальные моменты элементов выборки:

во = g..., aqX ат = М(xm), т = 1,2,... (3)

В методе моментов в качестве оценки 00 используют статистику Yn вида

(2), которая отличается от правой части формулы (2) тем, что теоретические моменты заменены выборочными.

Статистики Yn вида (2) применяются не только для оценивания параметров, но и для непараметрического оценивания характеристик случайной величины, таких, как коэффициент вариации, и для проверки гипотез. Во всех случаях применения статистики Yn вида (2) говорят о методе моментов.

Распределение вектора Yn во всех практически важных случаях является асимптотически нормальным. Это утверждение опирается на следующий общий факт.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

7

Пусть случайный вектор Zn е Rq асимптотически нормален с математическим ожиданием z» и ковариационной матрицей ||czy||/n, а функция h: Rq ^ R1 достаточно гладкая. Тогда случайная величина h(Zn) асимптотически нормальна с математическим ожиданием h(z») и дисперсией

s

2

1

п

q q

II

r=1 s=1

dh dh dx dx

(4)

Этот способ нахождения предельного распределения известен как 5-метод Рао [8], метод линеаризации [9]. Последний термин и будем использовать. Условия регулярности, накладываемые на распределение случайной величины Zn и функцию h, при которых метод линеаризации обоснован, хорошо известны (см. [10], [2, с.337-339], [5, гл.4]).

Для получения асимптотического распределения статистики Yn вида (2) можно применить метод линеаризации к асимптотически нормальному вектору выборочных моментов (Mn1, Mn2, ..., Mnq) и функции g из формулы (2). В силу многомерной центральной предельной теоремы [5, гл. 4] указанная асимптотическая нормальность имеет место, если, например,

M | Xt |2q + 1< +¥.

Это условие выполнено, в частности, для результатов измерений, распределения которых сосредоточены на ограниченных сверху и снизу интервалах.

При реализации намеченного плана для применения формулы (4) необходимо использовать асимптотические дисперсии и ковариации выборочных моментов, т.е. величины, обозначенные в формуле (4) как crs . Эти величины имеют вид [8, с.388]:

crr = m2r — mr — 2гЛг-1m+1 + r m-1m2,

cs=m+s—mrm+rsmmr—m^—rm—m+1—щ+м—» r,s=и... m=0. (5)

Здесь - теоретический центральный момент порядка r, т.е.

m = m (x,. — m (x,. ))r, r = 1,2,...

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

8

Таким образом, для получения асимптотического распределения случайной величины Yn вида (2) достаточно знать теоретические центральные моменты результатов наблюдений и вид функции g. Отметим, что асимптотическим смещением оценок в рассматриваемом случае можно пренебречь, поскольку его вклад в средний квадрат ошибки статистической оценки - бесконечно малая величина более высокого порядка по сравнению с асимптотической дисперсией.

Однако моменты неизвестны. Их приходится оценивать. В соответствии с теоремами о наследовании сходимости для нахождения асимптотического распределения функции от выборочных моментов можно воспользоваться не теоретическими моментами, а их состоятельными оценками. Эти оценки можно получить разными способами. Можно непосредственно применить формулы (5), заменив теоретические моменты выборочными. Можно выразить моменты через параметры

рассматриваемого распределения. Можно применять более сложные процедуры, например, на основе непараметрических устойчивых (робастных) оценок моментов типа урезанных средних Пуанкаре и др. (в первой в России книге по общей теории устойчивости [14] проблематика робастных оценок рассмотрена в гл.2).

Для оценивания параметров гамма-распределения воспользуемся известной формулой [6, с.42], согласно которой для случайной величины X, имеющей гамма-распределение с параметрами формы а, масштаба b =1 и сдвига c=0,

M (Xm) = = а(а + 1)...(а + m -1), m = 1,2,... (6)

Следовательно, M(X) = а, M(X2) = а(а+1), D(X) = M(X2) - (M(X))2 = а(а+1) -а = а. Найдем третий центральный момент M(X - M(X)) . Справедливо равенство

M(X - M(X))3 = M(X3) - 3 M(X2) M(X) + 3 M(X) (M(X))2 - (M(X))3.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

9

Из равенства (6) вытекает, что

M(X- M(X))3 = a(a+1)(a+2) - 3 a (a+1) a + 3 a a2 - a3 = 2a.

Если Y - случайная величина, имеющая гамма-распределение с произвольными параметрами формы a, масштаба b и сдвига с, то Y = bX + с. Следовательно,

M(Y) = ab+c, D(Y) = ab2, M(Y - M(Y))3 = 2 a b3.

Пример 2. Оценивание методом моментов параметров гамма-распределения в случае трех неизвестных параметров (строка 7 табл.1).

В соответствии с проведенными выше рассуждениями для оценивания трех параметров достаточно использовать три выборочных момента - выборочное среднее арифметическое

_ X + Х2 + ... +

X =—-2------,

n

выборочную дисперсию

n

т Z(x- -■11=1

x)

1

52 =

2

и выборочный третий центральный момент

1 n

m3 =-Z(X - X)3.

n ,=1

Приравнивая теоретические моменты, выраженные через параметры распределения, и выборочные моменты, получаем систему уравнений метода моментов:

ab + c = x, ab2 = s2, 2ab3 = m3.

Решая эту систему, находим оценки метода моментов. Подставляя второе уравнение в третье, получаем оценку метода моментов для параметра сдвига:

2s2b = m3, b* =1 m3.

3 2 s2

Подставляя эту оценку во второе уравнение, находим оценку метода моментов для параметра формы:

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

10

a(b*)2 = а

1 m

2 s7

2

am 4 sz

2

s

a* = 4

s

6

m

2

3

Наконец, из первого уравнения находим оценку для параметра сдвига:

- , _ s 1 m3 _ s

c* = x - a * b* = x - 4—--3 = x - 2—.

m32 2 s m3

Для данных [6], приведенных выше в табл.2, выборочное среднее арифметическое x = 57,88, выборочная дисперсия s2 = 663,00, выборочный третий центральный момент m3 = 14927,91. Согласно только что полученным формулам оценки метода моментов таковы: а* = 5,23; b* = 11,26, c* = - 1,01.

Оценки параметров гамма-распределения, полученные методом моментов, являются функциями от выборочных моментов. В соответствии со сказанным выше они являются асимптотически нормальными случайными величинами. Их распределения аппроксимируются нормальными распределениями, математические ожидания которых равны соответствующим параметрам, а дисперсии находятся с помощью формулы (4) с учетом формул (5) и (6). В табл.3 приведены оценки метода моментов и их асимптотические дисперсии при различных вариантах сочетания известных и неизвестных параметров гамма-распределения.

Все оценки метода моментов, приведенные в табл.3, включены в государственный стандарт [6]. Они охватывают все постановки задач оценивания параметров гамма-распределения (см. табл.1) , кроме тех, когда неизвестен только один из двух параметров - а или b. Для этих исключительных случаев в [6] разработаны специальные методы оценивания.

Поскольку асимптотическое распределение оценок метода моментов известно, то не представляет труда формулировка правил проверки статистических гипотез относительно значений параметров распределений, а также построение доверительных границ для параметров.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

11

Таблица 3. Оценки метода моментов и их асимптотические дисперсии

№ Описание модели Оцениваемый Вид Асимптотическая

а b c параметр оценки дисперсия оценки

1 - - + а (x )2 s2 2а(а +1) n

2 - - + b s2 x - ( 2 + ^ ] n V а J

3 - - - а 4 4 m 6а 2 —(а + 6а + 5) n

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 - - - b 1 m3 2 s2 Ъг 2 (6а2 + 25а + 24) 2 ап

5 - - - c x - 2— m3 — (3а2 + 13а + 10) п

6 + - - b s та b —(а + 3) 2п

7 + - - c x — ^[а аЬ1 -Т-(а +1) 2п

8 - + - A s1 b1 2а . _ —(а + 3) п

9 - + - c _ s2 x b 0^(2а + 3) п

10 + + - c x — Qb аЪ2 п

Примечание. При описании вероятностной модели известные

статистику параметры отмечены плюсами, оцениваемые - минусами.

Например, в вероятностной модели, когда все три параметра неизвестны, в соответствии с третьей строкой таблицы 3 нижняя доверительная граница для параметра а, соответствующая доверительной вероятности у = 0,95, в асимптотике имеет вид

1

Г 6п* 1 2

аН = а *-1,96j---([a*]2 + 6а * +5)1 ,

а верхняя доверительная граница для той же доверительной вероятности:

1

Г 6а * 1 2

аВ = а * +1,96*1-([а*]2 + 6а * +5)|> ,

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

12

где а* - оценка метода моментов параметра формы (табл.3).

Метод моментов является универсальным. Однако получаемые с его помощью оценки лишь в редких случаях обладают оптимальными свойствами. Поэтому в прикладной статистике применяют и другие виды оценок.

3. Оценки максимального правдоподобия

В работах, предназначенных для первоначального знакомства с математической статистикой, обычно рассматривают оценки максимального правдоподобия (сокращенно ОМП):

n

q(n) = qo(n; ^ xn)=Arg mm П f (x,q). (7)

ве& i=i V /

Таким образом, сначала строится плотность распределения вероятностей, соответствующая выборке. Поскольку элементы выборки независимы, то эта плотность представляется в виде произведения плотностей для отдельных элементов выборки. Совместная плотность рассматривается в точке, соответствующей наблюденным значениям. Это выражение как функция от параметра (при заданных элементах выборки) называется функцией правдоподобия. Затем тем или иным способом ищется значение параметра, при котором значение совместной плотности максимально. Это и есть оценка максимального правдоподобия.

Хорошо известно, что оценки максимального правдоподобия входят в класс наилучших асимптотически нормальных оценок (определение дано ниже). Однако при конечных объемах выборки в ряде задач ОМП недопустимы, так как они хуже (дисперсия и средний квадрат ошибки больше), чем другие оценки, в частности, несмещенные [13]. Именно поэтому в ГОСТ 11.010-81 для оценивания параметров отрицательного биномиального распределения используются несмещенные оценки, а не ОМП [14]. Из сказанного следует, что априорно предпочитать ОМП другим

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

13

видам оценок можно - если можно - лишь на этапе изучения асимптотического поведения оценок.

В отдельных случаях ОМП находятся явно, в виде конкретных формул, пригодных для вычисления.

Пример 3. Найдем ОМП для выборки из нормального распределения, каждый элемент которой имеет плотность

•V 2ч 1 I (х - да)2

/<ГЛо) =SSexp

Таким образом, надо оценить двумерный параметр (m, о2).

Произведение плотностей вероятностей для элементов выборки, т.е. функция правдоподобия, имеет вид

H (ms2) = s~n (2p)-n/2

exPl-

1

2s2

Z(x - m)2

i=1

(8)

Требуется решить задачу оптимизации

H(m;s2) ® max.

Как и во многих иных случаях, задача оптимизации проще решается, если прологарифмировать функцию правдоподобия, т.е. перейти к функции

h(m;s2) = ln H (m;s2),

называемой логарифмической функцией правдоподобия. Для выборки из нормального распределения

h(m;s2) = (-n)lnо +1 П jln(2p 0_Z(x - m)2. (9)

V 2 J 2o i=1

Необходимым условием максимума является равенство 0 частных производных от логарифмической функции правдоподобия по параметрам, т.е.

3h(m,s2) = 0 3h(m,s2) = 0

(10)

dm Э(о2)

Система (10) называется системой уравнений максимального правдоподобия. В общем случае число уравнений равно числу

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

14

неизвестных параметров, а каждое из уравнений выписывается путем приравнивания 0 частной производной логарифмической функции правдоподобия по тому или иному параметру.

При дифференцировании по m первые два слагаемых в правой части формулы (9) обращаются в 0, а последнее слагаемое дает уравнение

0 n n n

^—£(xi - m)2 =£2(xi - m)(-1) =0, £X,. = nm.

0m i=1 i=1 i=1

Следовательно, оценкой m* максимального правдоподобия параметра m является выборочное среднее арифметическое,

m* = x

Для нахождения оценки дисперсии необходимо решить уравнение

-(-n)lnyfa2 - _, 0 ^ -1^£(х, -m)2 = 0

0 h(m; а2') = 0

д(а2)

0(а2)

0(а2) 2а

i=1

Легко видеть, что

-(-n)lnVO2 =

—- 0(а , s £ (х - m)2=а £ (х, - m)2

0(а ) 2а i=1 2а i=1

0(а2) ' 2S

2

Следовательно, оценкой (о )* максимального правдоподобия для дисперсии о2 с учетом найденной ранее оценки для параметра m является выборочная дисперсия,

(а2)* = - £ (xt - X )2.

Э

=1

Итак, система уравнений максимального правдоподобия решена аналитически, ОМП для математического ожидания и дисперсии нормального распределения - это выборочное среднее арифметическое и выборочная дисперсия. Отметим, что последняя оценка является смещенной.

Отметим, что в условиях примера 3 оценки метода максимального правдоподобия совпадают с оценками метода моментов. Причем вид оценок метода моментов очевиден и не требует проведения каких-либо рассуждений.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

15

В большинстве случаев аналитических решений не существует, следовательно, для нахождения ОМП необходимо применять численные методы. Так обстоит дело, например, с выборками из гамма-распределения. или распределения Вейбулла-Гнеденко. Во многих работах каким-либо итерационным методом решают систему уравнений максимального правдоподобия ([15] и др.) или впрямую максимизируют функцию правдоподобия типа (8) (см. [16] и др.).

Однако применение численных методов порождает многочисленные проблемы. Сходимость итерационных алгоритмов требует обоснования. В ряде примеров анализа конкретных данных функция правдоподобия имеет много локальных максимумов, а потому естественные итерационные процедуры не сходятся [17]. Для данных ВНИИ железнодорожного транспорта по усталостным испытаниям стали уравнение максимального правдоподобия имеет 11 корней [18]. Какой из одиннадцати использовать в качестве оценки параметра?

Как следствие осознания указанных трудностей, стали появляться работы по доказательству сходимости алгоритмов нахождения оценок максимального правдоподобия для конкретных вероятностных моделей и конкретных алгоритмов. Примером является статья [19].

Однако теоретическое доказательство сходимости итерационного алгоритма - это еще не всё. Возникает вопрос об обоснованном выборе момента прекращения вычислений в связи с достижением требуемой точности. В большинстве случаев он не решен.

Но и это не все. Точность вычислений необходимо увязывать с объемом выборки - чем он больше, тем точнее надо находить оценки параметров, в противном случае нельзя говорить о состоятельности метода оценивания. Более того, при увеличении объема выборки необходимо увеличивать и количество используемых в компьютере разрядов,

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

16

переходить от одинарной точности расчетов к двойной и далее - опять-таки ради достижения состоятельности оценок.

Таким образом, при отсутствии явных формул для оценок максимального правдоподобия нахождение ОМП натыкается на ряд проблем вычислительного характера. Специалисты по математической статистике позволяют себе игнорировать все эти проблемы, рассуждая об ОМП в теоретическом плане. Однако прикладная статистика не может их игнорировать. Отмеченные проблемы ставят под вопрос целесообразность практического использования ОМП.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нет необходимости абсолютизировать ОМП. Кроме них,

существуют другие виды оценок, обладающих хорошими статистическими свойствами. Примером являются одношаговые оценки (ОШ-оценки).

4. Одношаговые оценки

В прикладной статистике разработано много видов оценок. Упомянем квантильные оценки. Они основаны на идее, аналогичной методу моментов, но только вместо выборочных и теоретических моментов приравниваются выборочные и теоретические квантили. Другая группа оценок базируется на идее минимизации расстояния (показателя различия) между эмпирическими данными и элементом параметрического семейства. В простейшем случае минимизируется евклидово расстояние между эмпирическими и теоретическими гистограммами, а точнее, векторами, составленными из высот столбиков гистограмм.

Одношаговые оценки имеют столь же хорошие асимптотические свойства, что и оценки максимального правдоподобия, при тех же условиях регулярности, что и ОМП. Грубо говоря, они представляют собой результат первой итерации при решении системы уравнений максимального правдоподобия по методу Ньютона - Рафсона. Одношаговые оценки выписываются в виде явных формул, а потому

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

17

требуют существенно меньше машинного времени, а также могут применяться при ручном счете (на калькуляторах или с использованием электронных таблиц EXCEL). Снимаются вопросы о сходимости алгоритмов, о выборе момента прекращения вычислений, о влиянии округлений при вычислениях на окончательный результат. ОШ-оценки были использованы нами при разработке ГОСТ 11.011-83 [6] вместо ОМП.

Как и раньше, рассмотрим выборку xb x2,..., xn из распределения с плотностью /(x;00), где /x;00) - элемент параметрического семейства плотностей распределения вероятностей {/x;0), 0е©}. Здесь 0 - известное статистику k-мерное пространство параметров, являющееся

подмножеством евклидова пространства Rk, а конкретное значение параметра 00 неизвестно. Его и будем оценивать.

Обозначим 0 =(01, 02,..., 0k). Рассмотрим вектор-столбец частных производных логарифма плотности вероятности

s( х,&) =

----ln / (x,&), a= 1,2,..., k

deaJ

и матрицу частных производных второго порядка для той же функции

Ъ(х,в) =

э

ъеаъеь

ln / (x,ff),a,P = 1,2,..., k

Положим

I I

n (&) = - X s( x ,q), bn (&)=- X b(x ,&).

s

=1

=1

Пусть матрица информации Фишера Д00) = M[-bn(00)] положительно определена.

Определение 1 [17, с.269]. Оценку 0(n) параметра 00 называют наилучшей асимптотически нормальной оценкой (сокращенно НАН-оценкой), если распределение случайного вектора q(n)-q0) сходится при n ^ да к нормальному распределению с нулевым математическим ожиданием и ковариационной матрицей, равной /!(00).

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

18

Определение 1 корректно: /!(0О) является нижней асимптотической границей для ковариационной матрицы случайного вектора -Ш(в*(n)-в0), где 0*(п) - произвольная оценка; ОМП - это НАН-оценки (см. [17] и др.). Некоторые другие оценки также являются НАН-оценками, например, байесовские. Сказанное об ОМП и байесовских оценках справедливо при некоторых условиях регулярности (см., например, [20]). В ряде случаев несмещенные оценки являются НАН-оценками, более того, они лучше, чем ОМП (их дисперсия меньше), при конечных объемах выборки [13].

Для анализа реальных данных естественно рекомендовать какую-либо из НАН-оценок. (Это утверждение всегда верно на этапе асимптотики при изучении конкретной задачи прикладной статистики. Теоретически можно предположить, что при тщательном изучении для конкретных конечных объемов выборки наилучшей окажется какая-либо оценка, не являющаяся НАН-оценкой. Однако такие ситуации нам пока не известны.) Пусть 01(n) и I-1 - некоторые оценки 00 и I-1(00) соответственно. Определение 2. Одношаговой оценкой (ОШ-оценкой, или ОШО) называется оценка

в2(п) = в1(п) + АЧ (в1(п)).

Теорема 1. Пусть выполнены следующие условия.

(I) Распределение 4nsn (в0) сходится при п ^ да к нормальному распределению с математическим ожиданием 0 и ковариационной матрицей I(00) и, кроме того, существует ыьп (в0)ьп(в0).

(II) При некотором е > 0 и п ^ да

sup К(в)-sn(в)-ьп(W-^l = О0).

в:0<|в-в0|<е |в-в0| Г

(III) Для любого е > 0

lira^{п1/4(| в1(п)-в | +1|I- -1Эв) ||) >e} = 0.

Тогда ОШ-оценка является НАН-оценкой.

Доказательство. Рассмотрим тождество

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

19

4П q2(n)-q) = 4П qn)-в)+4Пгп1зп qm (11)

Рассмотрим второе слагаемое в правой части формулы (11). В силу условия (II) теоремы

jnr-\(в(п)) = 4nr„lsn(во)+4Пгп\(во)(в(п) - во)+4Пг„1ор(| в1(п) - в» |2). (12)

Из условия (I) теоремы следует, что первое слагаемое в правой части формулы (12) сходится при п ^ да по распределению к нормальному закону с математическим ожиданием 0 и ковариационной матрицей /1(0о). Согласно условию (III)

4П |в1(п) -в0|2 ® 0

по вероятности. Кроме того, согласно тому же условию

последовательность матриц г- ограничена по вероятности. Поэтому третье слагаемое в правой части формулы (12) сходится к 0 по вероятности. Для завершения доказательства теоремы осталось показать, что

Гп(в1(п) -в0) + 4Пг1Ьп(в0)(в1(п) - в0) ® 0 (13)

по вероятности. Левая часть формулы (13) преобразуется к виду

(E+rbnWWnqqn)-q), (14)

где Е - единичная матрица. Поскольку из условия (I) теоремы следует, что для Ьп(00) справедлива (многомерная) центральная предельная теорема, то

Ь (в0) = -Г (в) + Op (п-1/2).

С учетом условия (III) теоремы заключаем, что

E + г-;ьп (в) = q (п"1/4). (15)

Из соотношений (14), (15) и условия (III) теоремы вытекает

справедливость формулы (13). Теорема доказана (первоначальный вариант см. в [21]).

Прокомментируем условия теоремы. Условия (I) и (II) обычно предполагаются справедливыми при рассмотрении оценок максимального правдоподобия [17]. Эти условия можно выразить в виде требований, наложенных непосредственно на плотность fx;0) из параметрического

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

20

семейства, как это сделано, например, в [20]. Условие (III) теоремы, наложенное на исходные оценки, весьма слабое. Обычно используемые оценки 91(н) и I- являются не п'14-состоятельными, а 4П -состоятельными, т.е. условие (III) заведомо выполняется.

Какие оценки годятся в качестве начальных? В качестве 01(н) можно использовать оценки метода моментов, как это сделано в ГОСТ 11.011-83 [6], или, например, квантильные. В качестве I-1 в теоретической работе [17] предлагается использовать простейшую оценку

I-1 =-K\el(n)). (16)

Для гамма-распределения с неизвестными параметрами формы, масштаба и сдвига ОШ-оценки применены в [6]. При этом оценка (16) оказалась непрактичной, поскольку с точностью до погрешностей измерений и вычислений det(bn) = 0 для данных о наработке резцов до предельного состояния, приведенных выше в табл. 2. Поскольку det(bn) = 0, то обратная матрица не существует, вычисления по формуле (16) невозможны. Поэтому в [6] в качестве ОШ-оценки была применена непосредственно первая итерация метода Ньютона - Рафсона решения системы уравнений максимального правдоподобия, т.е. была использована оценка

I-1 = I-1(в1(п)). (17)

В формуле (17) непосредственно используется явный вид зависимости матрицы информации Фишера от неизвестных параметров распределения.

В других случаях выбор тех или иных начальных оценок, в частности, выбор между (16) и (17), может определяться, например, простотой вычислений. Можно использовать также устойчивые аналоги [12, 22 - 28] перечисленных выше оценок.

Необходимо отметить, что еще в 1925 г., т.е. непосредственно при разработке метода максимального правдоподобия, его создатель Р.Фишер считал, что первая итерация по методу Ньютона - Рафсона дает хорошую

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

21

оценку вектору неизвестных параметров [17, с.298]. Он однако рассматривал эту оценку как аппроксимацию ОМП. А.А. Боровков воспринимает ОШ-оценки как способ «приближенного вычисления оценок максимального правдоподобия» [11, с.225] и показывает асимптотическую эквивалентность ОШ-оценок и ОМП (в более сильных предположениях, чем в теореме 1; другими словами, теорема 1 обобщает результаты А.А. Боровкова относительно ОШ-оценок). Мы же полагаем, что ОШ-оценки имеют самостоятельную ценность, причем не меньшую, а в ряде случаев большую, чем ОМП. По нашему мнению, ОМП целесообразно применять (на этапе асимптотики) только тогда, когда они находятся явно. Во всех остальных случаях следует использовать на этом этапе ОШ-оценки (или какие-либо иные, выбранные из дополнительных соображений).

С чем связана популярность оценок максимального правдоподобия? Из всех НАН-оценок они наиболее просто вводятся и ранее других предложены. Поэтому среди математиков сложилась устойчивая традиция рассматривать ОМП в курсах математической статистики. Однако при этом игнорируются вычислительные вопросы, а также отодвигаются в сторону многочисленные иные НАН оценки.

В прикладной статистике - иные приоритеты. На первом месте -ОШ-оценки, все остальные НАН-оценки, в том числе ОМП, рассматриваются в качестве дополнительных возможностей.

Пример 4. Найдем ОШ-оценки для гамма-распределения. Напомним, это распределение имеет плотность

f (x; a,b, c) = <

—1—(x - c)a 1b а exp Г(аГ ' Р x - c _ b _

0, x < c

x > c,

(18)

Плотность вероятности в формуле (18) определяется тремя параметрами а, b, c, где а>0, b>0. При этом а является параметром формы, b - параметром масштаба и с - параметром сдвига. Здесь Г(а) - одна из используемых в

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

22

математике специальных функций, так называемая «гамма-функция», по

которой названо и распределение, задаваемое формулой (18),

Г(а) = | xa-1e~Xdx.

0

Как следует из явного вида плотности (18), логарифмическая функция правдоподобия имеет вид [29, с.98]:

n n 1 n nc

L = Уln f (x;a,b,c) = -nlnГ(а) - nalnb + (a - 1)Уln(x,. - c)-Уxt +-,

i=1 i=1 b i=1 b

а уравнения правдоподобия таковы:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

dJ n

- = -nY(a) + У ln да 7=1

x. - c 1_____

b

= 0,

dL

db

dL

dc

na 1 vv ч n

- b+b 5Cxi-c) ■0,

-(a -1)£-!- + b. = 0,

i = 1 xi c b

где

Y(a) = — ln r(a). da

Ясно, что выписанная система нелинейных уравнений не имеет аналитического решения, в отличие от аналогичной системы для семейства нормальных распределений. Построим ОШ-оценки для задачи оценивания трех неизвестных параметров [30].

В качестве начальных оценок 01(n) будем использовать оценки метода моментов:

a

* = ф___ b* =

6

m

3

1 m

2 s

3

2 ’ c

x - a * b*,

где x - выборочное среднее арифметическое, s2 - выборочная дисперсия, m3 - выборочный третий центральный момент.

Матрица информации Фишера согласно [29, с.98] при a > 2 имеет

вид

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

23

I (в) = I (a,b, c)

d Y(a) 1 1

da b b(a - 1)

1 a 1

b b1 b2

1 1 1

b(a -1) b2 b2(a - -2)

(19)

Вектор-столбец частных производных логарифма плотности вероятности

s( х;в) = s( x; a,b, c) = (s(1), s(2), s(3))'

имеет координаты

s(1)

Y(a) + ln

x - c ~~b~

. _. a x - c

s(2) = -b+—,

/on a -1 1

s(3) =--------+ -.

x - c b

Таким образом, для получения sn(a*, b*, c*) необходимо вычислить две суммы

Ж^, ( X. - c ) ж^ 1 и I b / ^ x,. - c

и произвести еще несколько арифметических действий, число которых не зависит от объема выборки.

Одношаговые оценки an, bn, cn для параметров гамма-распределения вычисляют по формуле

(an ,bn, cn) = (a*,b*, c*) +1-1(a*, b*, c*)sn (a*,b*, c*),

где Z1 - обратная матрица к матрице информации Фишера I, заданной формулой (19). Матрицу Z1 нетрудно рассчитать аналитически. Формулы для нахождения одношаговых оценок расписаны в [6]. Расчеты облегчает то обстоятельство, что для гамма-распределения вторая координата вектора sn(a*, b*, c*) тождественно равна 0, т.е. sn(2)(a*, b*, c*) = 0.

При n ^ да распределение вектора оценок (an, bn, cn) приближается трехмерным нормальным распределением с математическим ожиданием, равным вектору истинных значений параметров (a, b, c), и ковариационной

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

24

матрицей Г1(ап, bn, cn). На этом приближении основаны правила расчета доверительных границ для параметров гамма-распределения [6, 31]. Дисперсии оценок неизвестны, но зато имеются известные статистику зависимости этих дисперсий от параметров гамма-распределения. Эти зависимости непрерывные. Они стоят на главной диагонали

ковариационной матрицы I'l(an,bn, cn). Поэтому можно вместо неизвестных параметров подставить в них оценки этих параметров и на основе принципа наследования сходимости (см. [5, гл. 4]) получить состоятельные оценки дисперсий. Затем на основе оценок дисперсий обычным образом строятся доверительные интервалы для параметров гамма-распределения.

В табл. 4 приведены результаты реализации описанной выше схемы расчетов - точечные и интервальные (при односторонней доверительной вероятности 0,95) оценки параметров гамма-распределения для данных, содержащихся в табл.2.

Таблица 4. Одношаговые оценки и доверительные границы для параметров гамма-распределения

Параметр Одношаговая оценка Верхняя доверительная граница Нижняя доверительная граница

Формы 7,32 16,41 -1,77

Масштаба 8,77 15,24 2,30

Сдвига - 11,46 23,28 - 46,20

Приведенные в табл.4 данные получены на основе асимптотических формул. Из-за конечности объема выборки необходимо внести некоторые коррективы. Поскольку параметр формы всегда положителен, а > 0, то нижняя доверительная граница для этого параметра должна быть неотрицательна, т.е. следует положить ан = 0. Поскольку плотность гамма-распределения положительна только правее параметра с, то, очевидно, c <

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

25

xmin = 9,00, верхняя доверительная граница для параметра сдвига должна быть заменена на cB = 9,00.

Может ли параметр сдвига быть отрицательным в данной прикладной задаче? Отрицательность параметра сдвига означает, что с положительной вероятностью рассматриваемая случайная величина отрицательна, т.е. наработка резца до предельного состояния отрицательна. Ясно, что такого быть не может, хотя для специалиста по математической статистике отрицательность параметра сдвига вполне приемлема. Однако специалист по прикладной статистике должен признать неотрицательность параметра с при обработке данных, составляющих рассматриваемую выборку. Следовательно, нижнюю доверительную границу для параметра сдвига необходимо заменить на сн =

0.

Как следует из проведенных выше рассуждений и выкладок (см. также [29, с.98 - 100]), отношение дисперсий оценок метода моментов и ОШ-оценок имеет вид

Da

(a -1)3 + 1(a -1)

Da * a(a + 1)(a + 5) (20)

при больших а. Это отношение, как и должно быть из общих соображений, всегда меньше 1. Отношение дисперсий возрастает при приближении к 0 коэффициента асимметрии распределения. Если a > 39,1 (коэффициент асимметрии меньше 0,102), то эффективность оценки метода моментов превышает 80%. При а = 20 (коэффициент асимметрии 0,20) она равна 65%. Напомним, что при безграничном росте параметра формы а гамма-распределение приближается к нормальному, для которого оценки метода моментов и ОМП совпадают, а потому имеют равные дисперсии. Поэтому вполне естественно, что отношение дисперсий в формуле (20) стремится к 1 при безграничном росте параметра формы а.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

26

Хотя дисперсии оценок метода моментов, как правило, больше, чем дисперсии НАН-оценок, таких, как ОШО и ОМП, метод моментов играет большую роль в прикладной статистике. Во-первых, обычно их расчет проще (в частности, требует меньшего числа компьютерных операций), чем оценок других типов. К тому же оценки находятся с помощью выборочных моментов, которые, как правило, вычисляются на этапе описания статистических данных. Во-вторых, они служат основой для вычисления оценок других типов, например, ОШО. Для запуска итерационных методов нахождения ОМП также нужны начальные значения, и ими обычно являются оценки метода моментов. В-третьих, в статистике интервальных данных установлено, что при учете погрешностей результатов наблюдений оценки метода моментов могут оказаться точнее ОМП и асимптотически эквивалентных им ОШО (см. [5, гл.12], [32 - 35]). Соответствующие рекомендации по выбору метода оценивания включены в [6].

Методы оценивания параметров гамма-распределения и примеры расчетов для всех семи постановок, перечисленных в табл.1, приведены в [6]. Большинство из них основано на асимптотических (при n ^ да) теоретических результатах прикладной статистики. Методом

статистических испытаний (Монте-Карло) показано, что уже при n >10 используемые приближения удовлетворительны. Другими словами, асимптотической нормальностью оценок и другими важными для проведенных выше рассуждений предельными результатами можно пользоваться уже при n > 10.

Алгоритмическое и программное обеспечение ОШ-оценок для распределения Вейбулла-Гнеденко и гамма-распределения рассмотрено в монографии [36]. Одношаговые оценки разработаны для оценивания параметров смещения и формы распределения фон Мизеса в статье [37]. История вопроса разобрана в статье [21].

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

27

Литература

1. Орлов А.И. Основные черты новой парадигмы математической статистики // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №06(090). С.188-214. - IDA [article ID]: 0901306013. - Режим доступа: http://ei.kubagro.ru/2013/06/pdf/13.pdf

2. Орлов А.И. Новая парадигма прикладной статистики // Заводская лаборатория. Диагностика материалов. 2012. Том 78. №1, часть I. С.87-93.

3. Орлов А. И. Новая парадигма анализа статистических и экспертных данных в задачах экономики и управления / А. И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. -№04(098). С. 105 - 125. - IDA [article ID]: 0981404008. - Режим доступа: http://ei.kubagro.ru/2014/04/pdf/08.pdf

4. Орлов А.И. Новая парадигма математических методов экономики // Экономический анализ: теория и практика. - 2013. - № 36 (339). - С.25-30.

5. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 672 с.

6. ГОСТ 11.011-83. Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения. М.: Изд-во стандартов, 1984. 53 с. Переиздание: М.: Изд-во стандартов, 1985. 50 с.

7. Орлов А.И. Метод моментов проверки согласия с параметрическим семейством распределений // Заводская лаборатория. Диагностика материалов. 1989. №10. С.90-93.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8.

1968. 548 с. 9.

Рао С.Р. Линейные статистические методы и их применения. М.: Наука,

Вентцель Е.С. Теория вероятностей. М.: Наука, 1964. 576 с.

10. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.

11. Боровков А. А. Математическая статистика. М.: Наука, 1984. 472 с.

12. Орлов А. И. Устойчивость в социально-экономических моделях. М.: Наука, 1979. 296 с.

13. Лумельский Я.П. К вопросу сравнения несмещенных и других оценок // Прикладная статистика: Сб. тр. М.: Наука, 1983. С .316-319.

14. ГОСТ 11.010-81. Прикладная статистика. Правила определения оценок параметров и доверительных границ для биномиального и отрицательного биномиального распределений. М.: Изд-во стандартов, 1982. 32 с.

15. Сатаров Г.А., Шмерлинг Д.С. Новая статистическая модель парных сравнений // Экспертные оценки в задачах управления: Сборник трудов. М.: Изд-во Института проблем управления АН СССР, 1982. С.67-79.

16. Лапига А. Г. Многокритериальные задачи управления качеством: построение прогноза качества в балльной шкале // Заводская лаборатория. Диагностика материалов. 1983. Т.49. № 7. С.55-59.

17. Закс Ш. Теория статистических выводов. М.: Мир, 1975. 776 с.

18. Бахмутов В.О., Косарев Л.Н. Использование метода максимального правдоподобия для оценки однородности результатов усталостных испытаний // Заводская лаборатория. Диагностика материалов. 1986. Т.52. № 5. С.52-57.

19. Резникова А.Я., Шмерлинг Д.С. Оценивание параметров вероятностных моделей парных и множественных сравнений // Статистические методы оценивания и проверки гипотез: Межвузовский сб. науч. тр. Пермь: Изд-во Пермского госуниверситета, 1984. С.110-120.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

28

20. Ибрагимов И.А., Хасьминский Р.З. Асимптотическая теория оценивания. М.: Наука, 1979. 528 с.

21. Орлов А.И. О нецелесообразности использования итеративных процедур нахождения оценок максимального правдоподобия // Заводская лаборатория. Диагностика материалов. 1986. Т.52. № 5. С.67-69.

22. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей. М.: Статистика, 1980. 208 с.

23. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций влияния. М.: Мир, 1989. 512 с.

24. Хьюбер П. Робастность в статистике. М.: Мир, 1984. 304 с.

25. Эльясберг П.Е. Измерительная информация. Сколько ее нужно, как ее обрабатывать? М.: Наука, 1983. 208 с.

26. Орлов А. И. Устойчивые математические методы и модели // Заводская лаборатория. Диагностика материалов. 2010. Т.76. № 3. С.59-67.

27. Орлов А.И. Устойчивые экономико-математические методы и модели. Разработка и развитие устойчивых экономико-математических методов и моделей для модернизации управления предприятиями. - Saarbrucken: Lambert Academic Publishing, 2011. - 436 с.

28. Орлов А.И. Новый подход к изучению устойчивости выводов в математических моделях / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №06(100). С. 1

- 30. - IDA [article ID]: 1001406001. - Режим доступа:

http://ei.kubagro.ru/2014/06/pdf/01.pdf

29. Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973. 900 с.

30. Орлов А.И., Миронова Н.Г. Одношаговые оценки для параметров гамма-распределения // Надежность и контроль качества. 1988. № 9. С.18-22.

31. Орлов А. И. Об оценивании параметров гамма-распределения // Обозрение прикладной и промышленной математики. 1997. Т.4. Вып.3. С.471-482.

32. Орлов А.И. Теория принятия решений. — М.: Экзамен, 2006. — 574 с.

33. Орлов А. И. Организационно-экономическое моделирование: учебник : в 3

ч. Часть 1: Нечисловая статистика. - М.: Изд-во МГТУ им. Н.Э. Баумана. 2009. - 541 с.

34. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с.

35. Орлов А.И., Луценко Е.В., Лойко В.И. Перспективные математические и инструментальные методы контроллинга. Под научной ред. проф. С.Г. Фалько. Монография (научное издание). - Краснодар, КубГАУ. 2015. - 600 с.

36. Петрович М.Л., Давидович М.И. Статистическое оценивание и проверка гипотез на ЭВМ. М.: Финансы и статистика, 1989. 191 с.

37. Струков Т.С. Оценивание параметров смещения и формы распределения фон Мизеса // Заводская лаборатория. Диагностика материалов. 2004. Том 70. №5. С. 60

- 64.

References

1. Orlov A.I. Osnovnye cherty novoj paradigmy matematicheskoj statistiki // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar:

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

29

KubGAU, 2013. - №06(090). S.188-214. - IDA [article ID]: 0901306013. - Rezhim dostupa: http://ej.kubagro.ru/2013/06/pdf/13.pdf

2. Orlov A.I. Novaja paradigma prikladnoj statistiki // Zavodskaja laboratorija. Diagnostika materialov. 2012. Tom 78. №1, chast' I. S.87-93.

3. Orlov A.I. Novaja paradigma analiza statisticheskih i jekspertnyh dannyh v zadachah jekonomiki i upravlenija / A.I. Orlov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №04(098). S. 105 - 125. -IDA [article ID]: 0981404008. - Rezhim dostupa: http://ej.kubagro.ru/2014/04/pdf/08.pdf

4. Orlov A.I. Novaja paradigma matematicheskih metodov jekonomiki //

Jekonomicheskij analiz: teorija i praktika. - 2013. - № 36 (339). - S.25-30.

5. Orlov A.I. Prikladnaja statistika. - M.: Jekzamen, 2006. - 672 s.

6. GOST 11.011-83. Prikladnaja statistika. Pravila opredelenija ocenok i

doveritel'nyh granic dlja parametrov gamma-raspredelenija. M.: Izd-vo standartov, 1984. 53 s. Pereizdanie: M.: Izd-vo standartov, 1985. 50 s.

7. Orlov A.I. Metod momentov proverki soglasija s parametricheskim

semejstvom raspredelenij // Zavodskaja laboratorija. Diagnostika materialov. 1989. №10. S.90-93.

8. Rao S.R. Linejnye statisticheskie metody i ih primenenija. M.: Nauka, 1968.

548 s.

Ventcel' E.S. Teorija verojatnostej. M.: Nauka, 1964. 576 s.

Kramer G. Matematicheskie metody statistiki. M.: Mir, 1975. 648 s.

Borovkov A.A. Matematicheskaja statistika. M.: Nauka, 1984. 472 s.

Orlov A.I. Ustojchivost' v social'no-jekonomicheskih modeljah. M.: Nauka,

9.

10.

11.

12.

1979. 296 s.

13. Lumel'skij Ja.P. K voprosu sravnenija nesmeshhennyh i drugih ocenok // Prikladnaja statistika: Sb. tr. M.: Nauka, 1983. S.316-319.

14. GOST 11.010-81. Prikladnaja statistika. Pravila opredelenija ocenok parametrov i doveritel'nyh granic dlja binomial'nogo i otricatel'nogo binomial'nogo raspredelenij. M.: Izd-vo standartov, 1982. 32 s.

15. Satarov G.A., Shmerling D.S. Novaja statisticheskaja model' parnyh sravnenij // Jekspertnye ocenki v zadachah upravlenija: Sbornik trudov. M.: Izd-vo Instituta problem upravlenija AN SSSR, 1982. S.67-79.

16. Lapiga A.G. Mnogokriterial'nye zadachi upravlenija kachestvom: postroenie prognoza kachestva v ball'noj shkale // Zavodskaja laboratorija. Diagnostika materialov.

1983. T.49. № 7. S.55-59.

17. Zaks Sh. Teorija statisticheskih vyvodov. M.: Mir, 1975. 776 s.

18. Bahmutov V.O., Kosarev L.N. Ispol'zovanie metoda maksimal'nogo pravdopodobija dlja ocenki odnorodnosti rezul'tatov ustalostnyh ispytanij // Zavodskaja laboratorija. Diagnostika materialov. 1986. T.52. № 5. S.52-57.

19. Reznikova A.Ja., Shmerling D.S. Ocenivanie parametrov verojatnostnyh modelej parnyh i mnozhestvennyh sravnenij // Statisticheskie metody ocenivanija i proverki gipotez: Mezhvuzovskij sb. nauch. tr. Perm': Izd-vo Permskogo gosuniversiteta, 1984. S.110-

120.

20. Ibragimov I.A., Has'minskij R.Z. Asimptoticheskaja teorija ocenivanija. M.: Nauka, 1979. 528 s.

21. Orlov A.I. O necelesoobraznosti ispol'zovanija iterativnyh procedur nahozhdenija ocenok maksimal'nogo pravdopodobija // Zavodskaja laboratorija. Diagnostika materialov. 1986. T.52. № 5. S.67-69.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

Научный журнал КубГАУ, №109(05), 2015 года

30

22. Smoljak S.A., Titarenko B.P. Ustojchivye metody ocenivanija: Statisticheskaja obrabotka neodnorodnyh sovokupnostej. M.: Statistika, 1980. 208 s.

23. Hampel' F., Ronchetti Je., Rausseu P., Shtajel' V. Robastnost' v statistike. Podhod na osnove funkcij vlijanija. M.: Mir, 1989. 512 s.

24. H'juber P. Robastnost' v statistike. M.: Mir, 1984. 304 s.

25. Jel'jasberg P.E. Izmeritel'naja informacija. Skol'ko ee nuzhno, kak ee obrabatyvat'? M.: Nauka, 1983. 208 s.

26. Orlov A.I. Ustojchivye matematicheskie metody i modeli // Zavodskaja laboratorija. Diagnostika materialov. 2010. T.76. № 3. S.59-67.

27. Orlov A.I. Ustojchivye jekonomiko-matematicheskie metody i modeli. Razrabotka i razvitie ustojchivyh jekonomiko-matematicheskih metodov i modelej dlja modernizacii upravlenija predprijatijami. - Saarbrucken: Lambert Academic Publishing, 2011. - 436 s.

28. Orlov A.I. Novyj podhod k izucheniju ustojchivosti vyvodov v matematicheskih modeljah / A.I. Orlov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №06(100). S. 1 - 30. - IDA [article ID]: 1001406001. - Rezhim dostupa: http://ej.kubagro.ru/2014/06/pdf/01.pdf

29. Kendall M.Dzh., St'juart A. Statisticheskie vyvody i svjazi. M.: Nauka, 1973.

900 s.

30. Orlov A.I., Mironova N.G. Odnoshagovye ocenki dlja parametrov gamma-raspredelenija // Nadezhnost' i kontrol' kachestva. 1988. № 9. S.18-22.

31. Orlov A.I. Ob ocenivanii parametrov gamma-raspredelenija // Obozrenie prikladnoj i promyshlennoj matematiki. 1997. T.4. Vyp.3. S.471-482.

32. Orlov A.I. Teorija prinjatija reshenij. — M.: Jekzamen, 2006. — 574 s.

33. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie: uchebnik : v 3 ch. Chast' 1: Nechislovaja statistika. - M.: Izd-vo MGTU im. N.Je. Baumana. 2009. - 541 s.

34. Orlov A.I., Lucenko E.V. Sistemnaja nechetkaja interval'naja matematika. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s.

35. Orlov A.I., Lucenko E.V., Lojko V.I. Perspektivnye matematicheskie i instrumental'nye metody kontrollinga. Pod nauchnoj red. prof. S.G. Fal'ko. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2015. - 600 s.

36. Petrovich M.L., Davidovich M.I. Statisticheskoe ocenivanie i proverka gipotez na JeVM. M.: Finansy i statistika, 1989. 191 s.

37. Strukov T.S. Ocenivanie parametrov smeshhenija i formy raspredelenija fon Mizesa // Zavodskaja laboratorija. Diagnostika materialov. 2004. Tom 70. №5. S. 60 - 64.

http://ej.kubagro.ru/2015/05/pdf/14.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.