Научная статья на тему 'Применение рядов Эджворта в информационных системах анализа погрешности'

Применение рядов Эджворта в информационных системах анализа погрешности Текст научной статьи по специальности «Математика»

CC BY
395
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук
Ключевые слова
КУМУЛЯНТЫ / РЯД ЭДЖВОРТА / АНАЛИЗ ПОГРЕШНОСТЕЙ / ПРИБЛИЖЕНИЕ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ / ИНФОРМАЦИОННАЯ СИСТЕМА

Аннотация научной статьи по математике, автор научной работы — Кузнецов Борис Федорович, Бородкин Дмитрий Константинович, Лебедева Людмила Викторовна

Приведен краткий обзор методов приближения вероятностных распределений. Обоснована актуальность получения вероятностных кривых в задачах анализа погрешностей кумулянтным методом. Предложена концепция информационной системы анализа погрешностей; описана модель получения приближенных кривых распределения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кузнецов Борис Федорович, Бородкин Дмитрий Константинович, Лебедева Людмила Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение рядов Эджворта в информационных системах анализа погрешности»

В таблице приведены формализованные знания о купольных структурах и разломной тектонике. Например, согласно формализованным экспертным знаниям, 40% площади месторождений должно размещаться в пределах 20-километровой зоны вблизи глубинных разломов ZR1. Еще по 30% нефтегазоносных площадей должно находиться в интервале от 20 до 60 км и на больших расстояниях от глубинных разломов.

Для формализации знаний о приуроченности месторождений углеводородов Сибирской платформы к разломным и купольным структурам задан способ квантования каждого признака и для каждой градации расстояний от узла до картографического объекта указаны вероятности попадания в данную градацию узлов сети, принадлежащих и не принадлежащих месторождениям. В результате строится прогнозная карта изолиний апостериорной вероятности, на которой исследуемая территория ранжирована по степени перспективности. На карту нанесены изолинии 0,5; 0,6 и выше. Попадание месторождений в области повышенной перспективности (вероятность существования

залежи обычно превышает 0,6) является критерием, характеризующим удовлетворительное качество формализации знаний о роли тектонических нарушений и купольных структур как факторов прогноза месторождений нефти и газа. При изменении знаний с учетом мнений геологов прогнозная карта, естественно, изменится.

Таким образом, проанализировав существующие подходы к решению задач геологического прогнозирования (распознавание образов, экспертные системы, системно-модельный подход), показано, что предложенное В.В. Марченко направление, основанное на использовании картографической информации и формализации знаний, является чрезвычайно перспективным. В данной работе рассмотрена эффективность этого подхода, но уже на основе применения современного программного комплекса GIA. Показано, что технология прогнозирования на основе картографической информации и формализации знаний логично вписывается в предложенную идеологию геоинформационного анализа.

Библиографический список

1. Воронин Ю.А. Исследование операций при поисках и разведке месторождений полезных ископаемых. Новосибирск: Наука, 1983. 174 с.

2. Еганов Э.А. Системно-модельный подход к решению поисковых задач // Методология и теория в геологии: сб. науч. тр.: Киев: Наукова думка, 1982.

3. Ларичев О.И., Мечитов А.И., Мошкович Е.М., Фуремс Е.М.

Выявление экспертных знаний (процедуры и реализации). М.: Наука, 1989. 128 с.

4. Марченко В.В. Человеко-машинные методы геологического прогнозирования. М.: Недра, 1988. 232 с.

5. Ломтадзе В.В., Дударева О.В. Геоинформационный анализ: учеб. пособие. Иркутск: Изд-во ИрГТУ. 2004. 60 с.

УДК 519.213

ПРИМЕНЕНИЕ РЯДОВ ЭДЖВОРТА В ИНФОРМАЦИОННЫХ СИСТЕМАХ АНАЛИЗА ПОГРЕШНОСТИ

1 о л

© Б.Ф. Кузнецов1, Д.К. Бородкин2, Л.В. Лебедева3

1Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83. 2,3Ангарская государственная техническая академия, 665835, Россия, г. Ангарск, ул. Чайковского, 60.

Приведен краткий обзор методов приближения вероятностных распределений. Обоснована актуальность получения вероятностных кривых в задачах анализа погрешностей кумулянтным методом. Предложена концепция информационной системы анализа погрешностей; описана модель получения приближенных кривых распределения.

Библиогр. 10 назв.

Ключевые слова: кумулянты; ряд Эджворта; анализ погрешностей; приближение вероятностных распределений; информационная система.

USING EDGEWORTH SERIES IN ERROR ANALYSIS INFORMATION SYSTEMS B.F.Kuznetsov, D.K. Borodkin, L.V. Lebedeva

Irkutsk State Technical University,

1Кузнецов Борис Федорович, доктор технических наук, профессор кафедры автоматизированных систем, e-mail: kuznetsovbf@gmail.com

Kuznetsov Boris, Doctor of technical sciences, Professor of the Department of Automated Systems, e-mail: kuznetsovbf@gmail.com

2Бородкин Дмитрий Константинович, кандидат технических наук, доцент кафедры промышленной электроники и информационно-измерительной техники, e-mail: borodkin_dk@mail.ru

Borodkin Dmitry, Candidate of technical sciences, Associate Professor of the Department of Industrial Electronics and Information

and Measuring Equipment, e-mail: borodkin_dk@mail.ru

3Лебедева Людмила Викторовна, магистрант, e-mail: lyudmila_l_@mail.ru

Lebedeva Lyudmila, Undergraduate, e-mail: lyudmila_l_@mail.ru

83 Lermontov St., Irkutsk, Russia, 664074. Angarsk State Technical Academy, 60 Chaikovsky St., Angarsk, Russia, 665835.

The article briefly reviews the approximation methods of probability distributions. The obtaining of probability curves in the error analysis problems by the cumulant method is proved to be urgent. A concept of the information system of error analysis is proposed; and the model of obtaining approximated distribution curves is described. 10 sources.

Key words: cumulants; Edgeworth series; error analysis; approximation of probability distributions; information system.

Одной из задач анализа погрешностей является определение границ интервала, в котором эта погрешность находится с заданной вероятностью. Согласно методике расчета, предлагаемой в рекомендации МИ 1317-2004 [1], нижняя Д/и верхняя ДЛ границы интервала определяются через среднее квадра-тическое отклонение погрешности по формуле:

^ = Ш = K(P) • а,

(1)

где К {Р) - коэффициент, зависящий от вероятности Р; а - среднее квадратическое отклонение погрешности измерений.

Коэффициент К {Р) определяется из функции

плотности вероятности распределения погрешности. Если есть основания предполагать, что реальная функция плотности распределения - функция симметричная, одномодальная, отличная от нуля на конечном интервале значений аргумента, и другая информация о плотности распределения отсутствует, в качестве функции плотности распределения вероятностей погрешности измерений принимают закон, близкий к нормальному усеченному.

В практике измерений часто встречаются и другие одномодальные законы распределения, например, треугольные, трапецивидные и другие, поэтому очевидно при условии того, что погрешность распределена нормально, оценки границ доверительных интервалов могут существенно отличаться от истинных. Кроме того, закон распределения погрешности может быть и двухмодальным, например, в приборах, имеющих погрешность от люфта кинематических механизмов или от гистерезиса при перемагничивании деталей приборов [2, 3].

В связи с этим возникает задача построить кривую распределения по имеющимся экспериментальным данным, например по выборке или известным числовым характеристикам случайной величины. Одним из методов решения такой задачи является метод, основанный на проверке гипотезы о том, что случайная величина распределена по тому или иному закону, однако в некоторых случаях исследуемая случайная величина распределена таким образом, что нет достаточных оснований для принятия гипотезы о законе распределения, тогда необходимо подобрать кривую распределения по имеющимся экспериментальным данным.

Одним из методов приближения вероятностных распределений является приближение кривыми Джон-

сона, которые получаются из преобразований плотности нормального распределения. Пусть х - исследуемая случайная величина. В общем виде преобразование Джонсона [4] представлено как

z = / + (x;s,A) ,

(2)

где п > 0, А > 0, -« м - параметры распределения Джонсона; - произвольная функция; z - случайная величина, имеющая стандартное нормальное распределение.

Джонсон предложил три формы функционального преобразования, которым соответствуют семейства кривых SL, Бв, Би. Подбор кривой производится следующим образом: сначала из соотношения для оценок третьего и четвертого центральных моментов определяется тип приемлемой кривой либо то, что для данного распределения кривые Джонсона неприменимы. В случае если подобрать кривую возможно, находятся оценки параметров выбранного семейства распределений.

Также для подбора кривых распределения часто применяются кривые Пирсона [4]. Плотность вероятности, график которой принадлежит семейству кривых Пирсона, определяется как решение дифференциального уравнения

dy У

x + b

С^ C}X HH C2X

(3)

где Ь, С, С, С определяются через первые четыре момента распределения.

Тип кривой определяется значением показателя х, который вычисляется через третий и четвертый моменты распределения.

Другим способом приближения плотностей вероятности является разложение на основе ортогональных функций, например, разложение на основе полиномов Лаггера, Чебышева, Лежандра. Наиболее удачными оказались разложения на основе полиномов Эрмита, а именно разложения в ряды Грама-Шарлье, Гаусса-Эрмита и Эджворта [5].

Ряд Грамма-Шарлье имеет плохие свойства сходимости. Ряд Гаусса-Эрмита обладает лучшими свойствами сходимости, однако имеет свой недостаток - отсутствие собственной меры точности. Одним из самых удобных вариантов разложения плотности вероятности в ряды полиномов Эрмита является разложение в ряд Эджворта [5, 6].

W (х) = е V 2ж

1 + уХН з( х) +

Г1 ^ ^

-X,Н 4 (х) +

10 2ГГ Г Л

+ — Хз2 Н 6( х) 6!

Г1 35 ^

^ Х5Н5 (х) + ^ Х,ХзН7 (х) +

280 з„ . .

+ — Хз3Н9 ( х)

.(4)

Другой, более компактной формой записи ряда Эджворта является выражение:

такое описание является достаточным.

Интерес представляет оценка кумулянтов старших порядков, и не только с целью построения эмпирической плотности вероятности, но и как более расширенная форма представления случайной величины.

Задача анализа преобразований законов случайной величины случайных величин, простейшим примером которой может быть суммирование дополнительных погрешностей, легко решается, если выразить кумулянты выходной величины через кумулянты входных, а потом уже в случае необходимости получить график плотности вероятности как сумму конечного числа членов ряда.

В простейшем случае, когда выходная величина является суммой двух входных, выходные кумулянты будут определяться через одномерные кумулянты входных величин и их совместные кумулянты [7]:

ад О

W(х) = Wг (*)+£(- 1)к , (5)

к=3 к!

где / (х) - плотность гауссова распределения;

Рк - квазимоменты распределения, которые могут

быть определены через кумулянты. В случае если случайная величина центрирована, квазимоменты равны кумулянтам [7].

Из этой формулы видно, что кумулянты порядка старше третьего позволяют оценивать степень отклонения распределения от гауссова.

Основными преимуществами разложения в ряд Эджворта являются [5, 8]:

• его непосредственная связь с моментами и кумулянтами случайной величины;

• возможность контроля ошибки аппроксимации;

• возможность получения легко кодируемых алгоритмов.

При большом отклонении от гауусовского закона распределения случайных величин разложение в ряд Эджворта имеет ограниченную область применения, так как сильно расходится, но в этом случае можно ограничить разложение, когда последний член становится неприемлемо большим.

Среди основных преимуществ приближения плотности вероятности рядом Эджворта указывалась его непосредственная связь с моментами и кумулянтами распределения.

Бесконечный ряд кумулянтов дает такую же исчерпывающую информацию о случайной величине, как и плотность распределения вероятности.

В ГОСТе 8.009-86 [9] в номенклатуре нормируемых метрологических характеристик погрешностей приводится математическое ожидание (для систематических погрешностей), которое является кумулянтом первого порядка, и среднее квадратическое отклонение, которое определяется как корень из дисперсии -кумулянта второго порядка. У нормально распределенной случайной величины кумулянты старших порядков равны нулю, поэтому для нормальных величин

~А1 + А 2 Лк

= (- Цсл^}.

(6)

В случае, когда случайные величины абсолютно независимы, все совместные кумулянты равны нулю, кумулянты суммы будут равны сумме кумулянтов соответствующих порядков.

Как правило, принимают, что статистическая связь между влияющими величинами отсутствует, и при суммировании дополнительных погрешностей ее не учитывают, используя формулу [10]:

А2 + А2 + ТД2

оси дин / <

2

доц

(7)

1=1

где Аосн - основная погрешность средства измерений;

Аймн- динамическая погрешность; Адои - дополнительная погрешность.

В задачах статистического моделирования учет статистической связи обычно ограничивают учетом совместного центрального момента второго порядка ^и, который носит название ковариация, имеет специальное обозначение В^ и равен совместному кумулянту второго порядка Кц:

веч=м1Л =Х1Д =((£-<£»■

(8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Такая статистическая связь, при которой Кц # 0, носит название коррелированности случайных величин, которую также удобно оценивать безразмерным коэффициентом корреляции р [7]:

Р = Ч 1 ЦК2, 0^0,2 = М, 1 IСРп ,

(9)

где к02, к2 о - одномерные кумулянты второго порядка случайных величин £ и п, равные их дисперсиям а/,

■>п .

Во многих случаях такой подход оказывается недостаточным, так как коэффициент корреляции учи-

х

2

+

+

+

тывает только линейную связь, и возможны ситуации, когда при наличии жесткой взаимосвязи между случайными величинами р = 0.

Пусть, например, случайные величины п и £ связаны следующим образом: г/ = , а распределение случайной величины ^ (х) симметрично относительно х = 0. В этом случае нетрудно обнаружить, что В^ = 0, а следовательно, и р = 0. Тогда, несмотря на то что случайные величины £ и п жестко взаимосвязаны, коэффициент их корреляции равен нулю. Поэтому необходим учет совместных кумулянтов высших порядков, которые равны нулю в случае отсутствия статистической связи между величинами [6, 7].

На основании вышеизложенного можно сделать следующие выводы: в задачах анализа погрешностей часто необходимо учитывать закон распределения погрешности, который может отличаться от нормального, что требует подбора приближенных кривых распределения. Наиболее удобным решением в случае кумулянтного подхода может быть приближение рядом Эджворта. Учет высших и совместных кумулянтов позволяет повысить точность оценки суммарной погрешности.

Приведённые выше результаты обуславливают актуальность разработки информационной системы анализа погрешностей, в которой был бы реализован кумулянтный подход: анализируемыми параметрами определяющих погрешность сигналов являются кумулянты (например, кумулянты измеряемого сигнала или влияющей величины). По ним определяются кумулянты различных видов погрешности и кумулянты суммарной погрешности.

Данная система должна содержать следующие модули:

- главный модуль;

- библиотеку формул;

- генератор формул;

- модуль получения приближенных кривых распределения.

Назначение главного модуля - обеспечивать взаимодействие остальных модулей, а именно, определять наличие формул для требуемой модели измерительного канала в библиотеке. Если требуемые формулы отсутствуют в библиотеке, то они создаются генератором формул и сохраняются в библиотеку. По полученным формулам определяются кумулянты погрешности, по которым строится график приближенной кривой ее распределения. Для решения этой задачи необходимо определить методы вычисления приближенных кривых по кумулянтам.

Если брать за основу выражение (5), то возникает необходимость разработки алгоритма вычисления производной гауссовой плотности вероятности произвольного порядка, например по известным формулам вычисления производной производного порядка [6]. Но программа на основе такого алгоритма будет ресурсоемкой, так как эти формулы достаточно громоздки.

Другой вариант решения проблемы - использова-

ние в качестве основы формы записи ряда Эджворта через полиномы Эрмита, при этом отпадает необходимость вычисления производных. Задача вычисления полиномов Эрмита достаточно распространенная; существуют уже готовые алгоритмы вычислений.

Предлагаемый ниже подход позволяет получить значительный выигрыш в быстродействии по сравнению с рассматриваемыми выше. Суть его заключается в самостоятельном получении более компактной формулы производной гауссовой плотности вероятности в общем виде.

Записав выражения для производных гауссовой плотности вероятности для различных порядков, можно увидеть некоторые закономерности и записать:

1

^ *)=^7 ^ М-Е сАк-

(10)

к=0

где коэффициенты

А = 1; а = -м;

А = м2 - Ю; А = -м3 + 3МЮ;

А = м4 - 6М2Ю + 3Ю2 и т. д. (нетрудно заметить, что данные выражения похожи на полиномы Эрмита); М - математическое ожидание; й - дисперсия.

В общем виде выражение для четных коэффициентов (/ > 2):

А = М' +

г п(

+

Е (-1)с- 1П(-1+2е)

Л

1=1 V V е=1

для нечетных (/ > 3):

А = -М' +

М'-2]Ю]

{11)

('-1)/2

(

+

1=1

Е {- ГС-21 |П(-1 + 2е){м)'-2 Ю

. (12)

При работе в математических пакетах и при создании алгоритма программы может быть целесообразно использование как готовых выражений для коэффициентов А, так и формул в общем виде. Первый вариант предпочтительнее в задачах, где главным требованием является быстродействие. Второй вариант удобен в случае, когда необходимо учесть максимальное число членов ряда.

Подставив полученное выражение для производных гауссовой плотности вероятности в ряд Эджворта, получим:

( п „ / А

К (х) = К^^Е^ Е °1А1Х'-

\ /=3/!й у=0

(13)

к

е=1

Это выражение можно записать еще компактнее, сгруппировав константы перед аргументом х. Примем &=0, 01=0, в 2=0,

в=Т

ßCj "'А, - j

Тогда ряд Эджворта (4) примет вид:

( п Л W (х) = (х 11+ Е В'Х' V '=0 У

(14)

(15)

Таким образом, выражение для ряда Эджворта преобразуется в произведение гауссовой плотности

вероятности на степенной полином. Использование такого выражения приведет к значительному снижению времени, требуемого для вычисления.

На основе предложенного алгоритма был разработан программный модуль, позволяющий получить приближенную кривую распределения по кумулянтам. По введенным значениям кумулянтов по известным формулам [7] вычисляются квазимоменты, по формулам (11), (12), (14) - коэффициенты А и В. Затем по полученным значениям В по формуле (15) высчи-тываются значения плотности вероятности, строится ее график.

Данный программный модуль в дальнейшем предполагается включить в информационную систему для анализа погрешностей.

1. МИ 1317-2004. Государственная система обеспечения единства измерений. Результаты и характеристики погрешности измерений. Формы представления. Способы использования при испытаниях образцов продукции и контроле их параметров. Взамен МИ 1317-86; зарегистрирована ФГУП ВНИИМС 28.12.04. 54 с.

2. Новицкий В.П., Зограф И.А. Оценка погрешностей результатов измерений. Л.: Энергоатомиздат, Ленинградское отделение, 1991. 304 с.

3. Авдеев Б.Я., Антонюк Е.М., Душин Е.М. Основы метрологии и электрические измерения / под ред. Е.М. Душина. Л.: Энергоатомиздат, Ленинградское отделение, 1987. 480 с.

4. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: Физматлит, 2006. 816 с.

5. Blinnikov S., Moessner R. Expansions for nearly Gaussian distributions [Journal] // Astronomy and Astrophysics

Библиографический список

Supplement Series. May 2. 1998. Р. 193-205.

6. Федорченко В.А. Теория многомерных распределений. М.: Русь, 2003. 576 с.

7. Малахов А.Н. Кумулянтный анализ случайных негауссовых процессов и их преобразований. М.: Советское радио, 1978. 374 с.

8. Кузнецов Б.Ф., Бородкин Д.К., Лебедева Л.В. К проблемам апроксимации эмпирических плотностей вероятности рядом Эджворта // Винеровские чтения. Иркутск: изд-во ИрГТУ, 2011. Т. 3. С. 25-30.

9. ГОСТ 8.009-89 Нормируемые метрологические характеристики средств измерения. Взамен ГОСТ 8.009-72; введ 1.01.86. М.: Изд-во стандартов, 1988. 132 с.

10. Кузнецов Б.Ф. Стохастические модели и методы анализа информационно-измерительных систем АСУ ТП. Ангарск: Ангарская государственная техническая академия, 2007. 180 с.

УДК 004.9

МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННЫХ ПРОЦЕССОВ В ЦИФРОВЫХ РАСЦЕПИТЕЛЯХ

1 9

© Б.Ф. Кузнецов1, М.В. Пильцов2

Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Описывается концепция модели преобразования информации в цифровом расцепителе автоматического выключателя. Представлен способ построения модели на примере теплового расцепителя с учетом погрешности первичного преобразователя, погрешности квантования и погрешности вычислений. Показана возможность декомпозиции суммарной погрешности на составляющие. Ил. 4. Библиогр. 7 назв.

Ключевые слова: информационный процесс; измерительный преобразователь; цифровой расцепитель; модель процесса преобразования.

MODELING INFORMATION PROCESSES IN DIGITRIPS B.F. Kuznetsov, M.V. Piltsov

Irkutsk State Technical University, 83 Lermontov St., Irkutsk, Russia, 664074.

The paper describes the concept of the model of information transformation in a digital trip unit of an automatic circuit

1 Кузнецов Борис Федорович, доктор технических наук, профессор кафедры автоматизированных систем, e-mail: kubf@inbox.ru

Kuznetsov Boris, Doctor of technical sciences, Professor of the Department of Automated Systems, e-mail: kubf@inbox.ru

2Пильцов Михаил Владимирович, соискатель, тел. 89041366683, e-mail: mpilcov@yandex.ru Piltsov Mikhail, Competitor for a scientific degree, tel. 89041366683, e-mail: mpilcov@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.