Научная статья на тему 'Кумулянтный метод идентификации вида закона распределения результатов измерений'

Кумулянтный метод идентификации вида закона распределения результатов измерений Текст научной статьи по специальности «Математика»

CC BY
440
92
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ИДЕНТИФИКАЦИИ ВИДА ЗАКОНА РАСПРЕДЕЛЕНИЯ / КУМУЛЯНТНЫЙ МЕТОД АНАЛИЗА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ / МОМЕНТЫ РАСПРЕДЕЛЕНИЯ / КУМУЛЯНТЫ РАСПРЕДЕЛЕНИЯ / IDENTIFICATION OF DISTRIBUTION FUNCTION TYPE / CUMULANT ANALYSIS METHOD OF MEASUREMENT RESULTS / MOMENTS OF DISTRIBUTION / CUMULANTS OF DISTRIBUTION

Аннотация научной статьи по математике, автор научной работы — Безуглов Дмитрий Анатольевич, Андрющенко Иван Владимирович, Швидченко Светлана Александровна

Разработан новый кумулянтный метод, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений, при этом правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента; представлена практическая реализация метода на примере проведения вычислительного эксперимента.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Безуглов Дмитрий Анатольевич, Андрющенко Иван Владимирович, Швидченко Светлана Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A new cumulant method is designed to fully automate the process of determining type of distribution function for results of measurement, and the correctness of the hypothesis can be tested in future using the known criteria, such as Kolmogorov's or Student's; authors present a practical implementation of the method on the example of computational experiment.

Текст научной работы на тему «Кумулянтный метод идентификации вида закона распределения результатов измерений»

Литература

1. Попова Т.В., Силуянова М.В. Исследование стационарной микрогазотурбинной теплоэлектростанции на твердом возобновляемом топливе // Научн. тр. ММНК «XXXVII Гагаринские чтения». М.: МАТИ. 2011. С. 197 - 198.

2. Ломазов В.С. Анализ способов сжигания твердого топлива применительно к ГТУ и выбор оптимального метода сжигания // Справка-отчет о научноисследовательской работе. М.: ФГУП «ЦИАМ им. П.И. Баранова». 2011. С. 3.

3. Попова Т.В., Силуянова М.В. Инженерно-экономическое обоснование и разработка маркетинговой стратегии инновационного проекта // Тр. всероссийской молодежной научн.-практ. конф. «Модернизация промышленности на базе интенсивного развития инновационно-инвестиционных процессов». М.: МАТИ. 2011. С. 23 - 27.

4. Алфимов А.В. Актуальность использования твердого возобновляемого топлива // Справка-отчет о научно-исследовательской работе. М.: ФГУП «ЦИАМ им. П.И.Баранова». 2011. С. 2.

Поступила 27.04.2011 г.

УДК 519.876.5

КУМУЛЯНТНЫЙ МЕТОД ИДЕНТИФИКАЦИИ ВИДА ЗАКОНА РАСПРЕДЕЛЕНИЯ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ

Дмитрий Анатольевич Безуглов - д.т.н., проф., проректор по учебно-методической работе, e-mail: bezuglovda@mail.ru

Иван Владимирович Андрющенко - аспирант, каф. «Информационные технологии в сервисе», e-mail: andrushenkoiv@yandex.ru

Светлана Александровна Швидченко - ассистент, каф. «Информационные технологии в сервисе», e-mail: sveta_more@mail.ru

Ростовский технологический институт туризма и сервиса (филиал ФГОУ ВПО «Южнороссийского государственного университета экономики и сервиса», г. Ростов-на-Дону)

A new cumulant method is designed to fully automate the process of determining type of distribution function for results of measurement, and the correctness of the hypothesis can be tested in future using the known criteria, such as Kolmogorov’s or Student’s; authors present a practical implementation of the method on the example of computational experiment.

Разработан новый кумулянтный метод, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений, при этом правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента; представлена практическая реализация метода на примере проведения вычислительного эксперимента.

Key words: identification of distribution function type, cumulant analysis method of measurement results, moments of distribution, cumulants of distribution.

Ключевые слова: идентификации вида закона распределения, кумулянтный метод анализа результатов измерений, моменты распределения, кумулянты распределения.

Под идентификацией закона распределения наблюдаемой случайной величины понимается нахождение такого закона, который бы в статистическом смысле не противоречил имеющимся наблюдениям. Практика использования нормального закона распределения для описания ошибок средств измерения не всегда оправдана [1, 5]. В основе измерительных приборов и систем лежат различные физические принципы, методы измерений и преобразования измерительных сигналов. Погрешности измерений являются следствием влияния множества факторов случайного и неслучайного характера, действующих постоянно или эпизодически. Поэтому понятно, что только при выполнении определенных предпосылок (теоретических и технических) погрешности измерений достаточно хорошо описываются нормальным законом распределения.

При автоматизации обработки результатов измерений рассматривается задача идентификации закона распределения случайных величин, которая обычно решается с применением статистических критериев согласия Пирсона, Колмогорова, Колмогорова -Смирнова, а также критерия омега-квадрат. В последние годы появились предложения об аппроксимации законов распределения без использования критериев согласия. Задача выбора закона распределения для данной выборки значений случайной величины решается в этом случае как задача приближения функции на заданных аналитических законах распределений. В качестве закона распределения выбирается закон такого распределения, которое находится на минимальном расстоянии (например, может быть выбрана статистика Пирсона, Колмогорова и др.) от эмпирического закона распределения, построенного по соответствующей выборке. Выбор числовых параметров законов распределений выполняется на основе обработки всех данных единственной выборки случайной величины, в то время как при использовании критериев согласия параметры требуется определять по иной выборке значений случайной величины.

Однако недостатком всех рассмотренных выше подходов является то, что гипотеза

о виде распределения определяется эмпирически. То есть исследователь должен по виду полученной функции распределения вероятностей (эмпирической функции распределения или гистограммы) исходя из своего опыта, определить теоретический закон, которым она описывается.

Целью данной работы является разработка кумулянтного метода идентификации вида закона распределения на базе анализа результатов измерений. В дальнейшем правильность гипотезы может быть проверена с помощью известных критериев, например Колмогорова или Стьюдента.

Кумулянтный анализ

Кумулянтное описание случайных величин дает столь же полное их статистическое представление, сколь и моментное, и обладает важными преимуществами [3], первое из которых заключается в том, что кумулянты, в отличие от моментов, имеют четко выраженный самостоятельный статистический характер и могут быть заданы в определенной степени независимо друг от друга, являясь с этой точки зрения некоторыми «нормальными координатами» статистического описания. Это приводит, например, к тому, что различные статистические средние «выходов» нелинейных преобразований выражаются простым образом именно через кумулянты «входных» переменных [3, 5].

Второе преимущество кумулянтов связано с тем, что учет их высших порядков позволяет просто описать любую степень негауссовости случайных величин. По этой причине основную ценность кумулянтное описание имеет именно для негауссовых переменных [2, 5].

Третье, весьма важное преимущество кумулянтного описания случайных величин обусловлено тем, что конечному набору кумулянтов всегда соответствует некоторая вещественная функция, аппроксимирующая вероятностное распределение. Это обстоятельство имеет особое значение при приближенном представлении вероятностных распределений тех случайных величин, для которых можно отыскать лишь конечные наборы кумулянтов [5].

Кумулянтный метод анализа результатов измерений

Рассмотрим сущность предлагаемого метода. Характеристическую функцию можно записать в виде 0(и) = ехр( в (и)), где, очевидно, должно быть в (0) = 0. Разложим функцию в (и) в степенной ряд [3]:

<Х)

в(и) = 1п&(и) = ^-к(Р)к, (1)

Хк ( ,-„.\к к!

где Хк - коэффициенты этого ряда, которые носят название кумулянтов или семиинвариантов и, как и моменты, являются характеристиками распределения:

= ,-к в(к= ,-—к

Хк = Г Г )(0) = у

ак 1п 0(м)

йик

. (2)

и =0

Таким образом, характеристическую функцию можно представить в виде

Хк

0(и) = exp

І ^(. уи) *

к=1 к-

(3)

Кумулянты однозначно определяют случайную величину, если ряд (3) сходится для всех и . Поэтому набор кумулянтов Х1,Х2,Х3, •••, Хя также может служить

тождественным представлением закона распределения.

Если известны моменты а1^, то кумулянты могут быть найдены из следующих соотношений [4, 5]:

4 = = т,

а 2

х 2=а2- (аі) = ^ ’

Х3 = ^3 — 3о^10^2 + (2а^) ,

X4 = а4 - 3(а2)2 - 4а|а3 + 12(а} )2 а2 - б(а| )4, (4)

Х5 = а5 - 5ос|а4 -10«2а3 + 20(а{ )2 а3 + 30а| (а2)2 - б0(а| )3 а2 + 24(а[ )5,

Хб = ^6 — бо^1^5 —15^2а 4 + 30(^1) а 4 —10(03) +120а 03 —

- 120(а1 )3а3 + 30(а2)3 -270(а|)2(а2)2 + 360(а{')4а2 - 120(Ц)б.

Верхним индексом / в дальнейшем будем обозначать принадлежность моментов и кумулянтов к тому или иному распределению. В выражениях (4) были использованы только шесть первых кумулянтов. Это связано с тем, что, как показали проведенные авторами исследования на различных выборках, такого количества кумулянтов достаточно для раскрытия сущности предложенного подхода. Однако при алгоритмической реализации предложенного метода число кумулянтов может быть увеличено.

В аналитическом виде моменты распределений могут быть вычислены через производящую функцию. В качестве примера рассмотрим выражения моментов гауссовского, равномерного и экспоненциального законов распределения. В дальнейшем эти выражения будут использованы для подстановки в (4) и определения кумулянтов соответствующих распределений.

Пусть имеется случайная величина X с распределением Р(х). Тогда ее производящей функцией моментов называется функция, имеющая вид

ад

Мх (Г) = Е [е* ] = | Р( х)е*сХ, (5)

—ад

где Е[*] - оператор математического ожидания.

Моменты случайной величины вычисляются через производящую функцию следующим образом [4]:

сп

Е

(6)

Для гауссовского закона с распределением

P(x) = -Lexp(- (7)

—v 2n 2—

производящая функция моментов будет иметь вид

_2.2

MX (t) = exP(U + ——) . (8)

Тогда моменты могут быть вычислены в соответствии со следующими выражениями:

аг1 = m = u, ar2 = /.u2 +—2,

ar3 = ju3 +3u—, ( )

ar4 = u4 + 6u2 —2 +3—4 ,

ar5 = u5 + 10u—2+15u—4,

ar6 = U + 15u4—2 + 45u—'— +15—6.

Во многих практически важных случаях нечетные моменты в (9) равны 0.

Для равномерного закона с распределением

1

Р( х) =

b-a' a £ х £ b' (10)

0 х < a, х > b

производящая функция моментов будет иметь вид

ых (г) = —^—(еы - еаг ), ХЧ7 г (Ь - а у ь

Е

Хп

п 1 п

(0) =—- £ акЬп. (11)

п+1к=о

£-Мх- (0) = —У а'

<*п п +

Соответственно, моменты могут быть найдены из следующих выражений: а'р1 = т = 1(а + Ь),

ар2 = 1(а2 + аЬ + Ь2),

ар3 = — (а3 + а2Ь + аЬ2 + Ь3),

4 (12)

ар4 = ^ (а4 + а Ь + а2Ь2 + аЬ3 + Ь4),

ар5 = — (а5 + а4Ь + а3Ь2 + а2Ь3 +аЬ4 +Ь5),

6

ар6 =1 (а6 + а5Ь + а4Ь2 + а3Ь3 + а2Ь4 + аЬъ + Ьь) .

7

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для экспоненциального закона с распределением Р(х) = Ае-Ах (13) производящая функция моментов будет иметь вид

Мх (г) = (1 -'- )-1. (14)

Тогда моменты могут быть найдены из следующих выражений:

е л-1

а = т = а ,

а 2 =—г,

2 А2

а 3 =

А2

I3, (15)

24

а 4 =!•■

е 120

а 5 =—т,

5 А5

е 720

а 6 =—^.

6 А6

Для набора распределений теоретические значения кумулянтов вычисляются с использованием выражений (4), (9), (12), (15). При автоматизации предложенного подхода число видов используемых распределений может быть значительно увеличено и оно будет ограничиваться лишь рамками решаемой при этом метрологической задачи.

Пусть имеются результаты измерений Ут. Эмпирические моменты а']- могут быть найдены на основе обработки входной реализации:

i-1

a3i1 = m=0

l

У Y2

/ v m

i-1

rl

а312 = m=0

l -1

i-1

У Y«

a3i3 = -------- (16)

(l -1)(l - 2 )

l2 У Ym4

аэг 4 = m=0

(l - 1)(l - 2)(l - 3)’ l3 У Y5

a3i5 = m=0

(l - 1)(l - 2)(l - 3)(l - 4)’

i-1

a 6 =

(l -1)(/ - 2)(/ - 3)(/ - 4)(/ - 5)’

где a3'j - эмпирический момент j -го порядка i -го закона распределения; l - размерность выборки.

По ним в соответствии с выражением (4) определяются эмпирические значения кумулянтов. При этом необходимо обеспечить нормировку по второму кумулянту.

В данном случае критерием «близости» исследуемого распределения к тому или иному виду может служить следующее выражение:

Si = min У(Х -Х )2, (17)

i j=1

где i - вид распределения, i =1, 2, 3; xj - кумулянты, рассчитанные аналитически; xj - кумулянты, рассчитанные эмпирически.

Предлагаемый метод может быть реализован, как это показано ниже на рисунке.

Блок-схема реализации кумулянтного метода идентификации вида закона распределения: 1 - блок вычисления эмпирических значений кумулянтов; 2 - блок вычисления значений критерия 8; 3 - блок анализа и определения вида закона распределения; 4 - блок вычисления (хранения) аналитических значений кумулянтов

Для проверки метода был проведен вычислительный эксперимент. При этом использовался математический пакет МаШсаё 14. Суть эксперимента состоит в следующем: с помощью датчиков случайных чисел генерировались реализации

случайных чисел, распределенных по гауссовскому, равномерному и экспоненциальному законам распределения. При проведении вычислительного эксперимента размер выборки был I = 217. Сначала вычислялись теоретические значения кумулянтов в соответствии с выражениями (4), (9), (12), (15). При этом в качестве параметров законов распределений были выбраны следующие величины: для гауссовского и равномерного распределения математическое ожидание т = 0, дисперсия Б = 1, для экспоненциального распределения

X = 1. Затем вычислялись значения эмпирических моментов в соответствии с выражениями (16) и значения эмпирических кумулянтов в соответствии с выражениями (4). Результаты сведены в табл. 1.

Таблица 1. Значения кумулянтов

Закон распределения Х X Хз Х4 X Хб

Г ауссовский Теоретические X = 0 х2 = 1 Хзг = 0 х4 = 0 х5 = 0 х6 = 0

Эмпирические Хгэ =-0,00071 х2га = 1,0011 Хзгэ =-0,011 Х4э = 0,00082 Х5гэ = -0,0069 Хбэ =-0,047

Равномерный Теоретические хр = 0 Хр = 1 Хз = 0 х4 = -1,е хХ = 0 Хбр = 6,88

Эмпирические Хрэ = -0,00074 х2э = 1,011 Хзрэ = 0,0021 Х4рэ =-1,е Хрэ =-0,013 Х = 6,86

Экспоненци- альный Теоретические хе = 1 Xе = 1 Хзе = е х4 = 6 Х5е = 24 хХ = 120

Эмпирические XX = 0,99 Х2э = 0,99 Хзеэ = 2,011 х4э = 6,11 Хеэ = 25,024 Х43 = 121,69

Для каждого набора теоретических и эмпирических кумулянтов по формуле (17) вычислялись значения критерия $ , которые сведены в табл. 2.

Таблица 2. Значения критериев $ для различных законов распределений

Закон распределения Si S2 S3

Г ауссовский S1r=0,0024 S2r=0,55 S3r=15028,65

Равномерный S1p=48,54 S2p=0,0006 S3p=13433,7

Экспоненциальный S1sj=15477,09 S2sj=15417,43 Sзе=3,99

Рассмотрим подробно алгоритм расчета первой строки табл. 2, где проанализирована выборка, сгенерированная датчиком случайных чисел, распределенных по гауссовскому закону распределения. Расчет проводился в соответствии со следующими выражениями:

■Slr = i(X-X)2 •

3=1

■s„ =£(Х-хХ )2 ■ (18)

3=1

S =£(Х-X)!-

j=1

При этом были использованы результаты расчета теоретических и эмпирических значений кумулянтов для гауссовского, равномерного и экспоненциального законов распределения из табл. 1. Аналогичным образом рассчитываются остальные строки табл. 2.

Из табл. 2 видно, что для первого эксперимента наименьшие значение критерия Sir соответствует гауссовскому распределению, для второго эксперимента наименьшее значение критерия $2р соответствует равномерному распределению, для третьего -наименьшие значение критерия £3э соответствует экспоненциальному распределению. Проведя вычисления по формулам (4), (9), (12), (15), (17), можно определить вид закона распределения, которым описывается выборка результатов измерений Ym .

Таким образом, разработан новый кумулянтный метод распределения, позволяющий полностью автоматизировать процесс определения вида закона распределения результатов измерений. Правильность гипотезы может быть проверена в дальнейшем с помощью известных критериев, например Колмогорова или Стьюдента.

Для сложных физических процессов при реализации предложенного подхода могут быть использованы методы аппроксимации полученных экспериментальных распределений физических величин обобщенными распределениями.

Данная статья выполнена в рамках проекта по аналитической ведомственной целевой программе «Развитие научного потенциала высшей школы (2009 - 2010 годы)» на 2009 год, подраздел 2.1.2 «Проведение фундаментальных исследований в области технических наук», проект «Теоретические основы решения задач управления -идентификации - оценивания на основе объединенного принципа максимума».

Литература

1. Алешкин А.Н., Лабутин С.А. Идентификация формы закона распределения случайных величин как задача приближения функций // Мат. заочных ВНТК «Современные проблемы математики и естествознания» и «Методы и средства измерений». 2002. Н. Новгород: МВВО АТН РФ. С. 6 - 9.

2. Безуглов Д. А. Кумулянтный метод оценки эффективности сегментированного зеркала адаптивной оптической системы // Оптика атмосферы и океана. 1996. №1. С.78 -84.

3. Безуглов Д.А., Поморцев П.М., Скляров А.В. Обработка результатов измерений на базе аппроксимации плотности распределения сглаживающими кубическими В- сплайнами // Измерительная техника. 2000. №9. С. 32 - 36.

4. Крамер. Г. Математические методы статистики. М.: ИЛ. 1948.

5. Малахов А. Н. Кумулянтный анализ случайных негауссовых процессов и их преобразований. М.: Сов. радио. 1978.

Поступила 10.03.2011г.

i Надоели баннеры? Вы всегда можете отключить рекламу.