Научная статья на тему 'Программный модуль для аналитической записи совместных моментов через кумулянты'

Программный модуль для аналитической записи совместных моментов через кумулянты Текст научной статьи по специальности «Математика»

CC BY
140
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОМЕНТ / MOMENT / КУМУЛЯНТ / CUMULANT / СИСТЕМА КОМПЬЮТЕРНОЙ АЛГЕБРЫ / COMPUTER ALGEBRA SYSTEM / ТЕОРИЯ ВЕРОЯТНОСТЕЙ / PROBABILITY THEORY

Аннотация научной статьи по математике, автор научной работы — Бородкин Дмитрий Константинович

Определение закона распределения случайных величин, подвергающихся нелинейному преобразованию, является важной задачей в таких областях, как метрология, приборостроение, радиотехника и радиофизика. Однако непосредственное определение плотности распределения или характеристической функции выходной величины встречает значительные трудности. В большинстве случаев можно воспользоваться такими статистическими характеристиками, как моменты или кумулянты. Одним из ограничений моментного и кумулянтного анализов является отсутствие достаточно развитых соответствующих средств в современных математических пакетах. С этой целью автором разрабатывается пакет программ для поиска аналитических решений нелинейного преобразования случайных величин. В данной работе представлен полностью формализованный способ (алгоритм) получения аналитической записи начальных моментов через кумулянты. Метод основан на теории разбиения чисел, множеств и мультимножеств. Также уделено внимание вопросу упрощения аналитической записи совместных моментов при отсутствии статистической связи между случайными величинами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A SOFTWARE MODULE FOR ANALYTICAL WRITING JOINT MOMENTS IN TERMS OF CUMULANTS

Determination of the distribution of random variables, subject to the non-linear transformation is an important task in the fields of metrology, instrument-building, radio and radiophysics. However, the direct determination of the density distribution or characteristic function of the output variable has considerable difficulties. In most cases, we can use statistical characteristics such as moments or cumulants. One of the limitations of the moment and cumulant analysis is the lack of sufficiently developed appropriate tools in modern mathematical packages. To this end, the author is working out a software package to find analytical solutions of the nonlinear transformation of random variables. This paper presents a fully formalized method (algorithm) of an intelligence record initial moments in terms of cumulants. The method is based on the theory of partitions of numbers, sets and multisets. Also the issue considers simplifying the analytical record of joint moments in the absence of the statistical relationship between random variables.

Текст научной работы на тему «Программный модуль для аналитической записи совместных моментов через кумулянты»

Информатика, вычислительная техника и управление. Моделирование. Приборостроение. Метрология. Информационно-измерительные приборы и системы

20000 набл.) расч.) набл.) расч.) 15

15000 10000 /

У 4

« Ir j Б у -

V Ч

1 À ? ir Y'

5000 F

19 95 20 00 №. 20 10 20

Рис. 1. Графическая иллюстрация адекватности моделей (8, 9)

Выводы

1. Показано, что грузооборот и объем погрузки грузов можно прогнозировать по небольшому числу факторов: а) грузооборот по трехфак-торной модели (8); б) объем погрузки грузов по двухфакторной модели (9).

2. Используя в дальнейшем факторные прогнозные модели, основные показатели рекомендуется прогнозировать в два этапа: а) по факторным моделям определять их прогнозные значения; б) подставляя эти значения в многофакторные модели, вычислять прогнозные значения основных показателей.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Давааням Тамир. Создание модели многофакторного прогнозирования основных показателей УБЖД // Транспортная инфраструктура Сибирского региона : материалы 5-й Всерос. науч.-практ. конф. с междунар. участием. Т. 1. Иркутск, 2014. C. 408-413.

2. Краковский Ю.М., Домбровский И.А. Вероятностный анализ безубыточности гру зовых перевозок на основе метода Монте-Карло // Изв. Трансиба. 2013. № 1 (13). С. 125-130.

3. Краковский Ю.М., Домбровский И.А. Прогнозирование грузооборота дороги на основе статистической и экспертной информации // Вестн. стипендиатов DAAD. 2013. Т. 1., № 1-1(10). С. 1825.

4. Бардушко В.Д. Формирование расчетных периодов имитационного моделирования работы системы тягового электроснабжения вероятностным методом // Изв. Транссиба. 2013. № 4 (16). С. 58-62.

5. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. М. : Экзамен, 2003. 512 с.

6. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М. : ЮНИТИ. 1998. 1022 с.

УДК 004.42:519.246 Бородкин Дмитрий Константинович,

к. т. н., доцент кафедры «Промышленной электроники и информационно-измерительной техники», Ангарская государственная техническая академия, тел. 8-902-5-112-875, borodkin_dk@mail.ru

ПРОГРАММНЫЙ МОДУЛЬ ДЛЯ АНАЛИТИЧЕСКОЙ ЗАПИСИ СОВМЕСТНЫХ МОМЕНТОВ ЧЕРЕЗ КУМУЛЯНТЫ

D. K. Borodkin

A SOFTWARE MODULE FOR ANALYTICAL WRITING JOINT MOMENTS

IN TERMS OF CUMULANTS

Аннотация. Определение закона распределения случайных величин, подвергающихся нелинейному преобразованию, является важной задачей в таких областях, как метрология, приборостроение, радиотехника и радиофизика. Однако непосредственное определение плотности распределения или характеристической функции выходной величины встречает значительные трудности.

В большинстве случаев можно воспользоваться такими статистическими характеристиками, как моменты или кумулянты. Одним из ограничений моментного и кумулянтного анализов является отсутствие достаточно развитых соответствующих средств в современных математических пакетах. С этой целью автором разрабатывается пакет программ для поиска аналитических решений нелинейного преобразования случайных величин.

В данной работе представлен полностью формализованный способ (алгоритм) получения аналитической записи начальных моментов через кумулянты. Метод основан на теории разбиения чисел, множеств и мультимножеств. Также уделено внимание вопросу упрощения аналитической записи совместных моментов при отсутствии статистической связи между случайными величинами.

Ключевые слова: момент, кумулянт, система компьютерной алгебры, теория вероятностей.

Abstract. Determination of the distribution of random variables, subject to the non-linear transformation is an important task in the fields of metrology, instrument-building, radio and radiophysics. However, the direct determination of the density distribution or characteristic function of the output variable has considerable difficulties.

In most cases, we can use statistical characteristics such as moments or cumulants. One of the limitations of the moment and cumulant analysis is the lack of sufficiently developed appropriate tools in modern mathematical packages. To this end, the author is working out a software package to find analytical solutions of the nonlinear transformation of random variables.

This paper presents a fully formalized method (algorithm) of an intelligence record initial moments in terms of cumulants. The method is based on the theory ofpartitions of numbers, sets and multisets. Also the issue considers simplifying the analytical record of joint moments in the absence of the statistical relationship between random variables. Keywords: moment, cumulant, computer algebra system, probability theory.

Введение

В ряде задач радиотехники, приборостроения и моделирования объект исследований представляет собой безынерционный нелинейный преобразователь. Как правило, измеряемые сигналы и различные дестабилизирующие воздействия относятся к классу случайных сигналов и могут быть описаны при помощи вероятностных методов [1, 2].

Измеряемые сигналы и дестабилизирующие воздействия образуют множество входных случайных величин 5 = ,р2рг}, где г - количество входных случайных величин.

Случайная величина г на выходе безынерционного преобразователя (рис. 1) в каждый момент времени определяется входными величинами

г = £2,... р), (1)

где g (р) - нелинейная функция.

Наиболее полно каждая случайная величина из множества 5 может быть описана с помощью закона распределения. На практике чаще всего пользуются плотностью вероятности рДх) или

характеристической функцией ) [3]. Однако

задача определения плотности вероятности рг (х)

Для устранения перечисленных недостатков автором было разработано на языке Python 2.7 соответствующее программное обеспечение.

Данная работа посвящена вопросу разработки модуля получения аналитических зависимостей совместных моментов через кумулянты.

1. Совместные моменты и кумулянты Совместный момент представляет

собой статистическое усреднение произведения случайных величин р j, р 2,'.. р г, возведенных

в степени щ, п2, „. nr соответственно, и определяется выражением

щ щ

а^2-"^ = РЩ1 ■РЩ2 ■... ■РЩ

{РЩ1 ■ ...■Р Щ

(xi,..., x )х

(2)

х dxx ■ dx2 ■... ■ dxr

где р^ ^ (хх,..., хг) - г -мерная плотность вероятности.

Порядком момента (2) называется число п, определяемое как

п = п + П + . + П . В случае если все числа за ис-

„ , ^ ( \ ключением какого-либо одного (например, п,

или характеристической функции ) выход- V г- г'

q е {1,2,..., г}) равны нулю, то п = п, и такой мо-

ной величины г является весьма сложной [4].

Безынерционный

нелинейный преобразователь

мент является моментом одномерного распределения случайной величины р и обозначается

>п

а

Jq

Рис. 1. Безынерционный нелинейный преобразователь

В большинстве случаев для описания случайной величины можно воспользоваться такими характеристиками, как моменты или кумулянты [5, 6]. В случае если зависимость (1) представляет собой полином, задача получения моментного или куму-лянтного представления величины ] значительно упрощается.

К недостаткам этого метода следует отнести:

- громоздкое аналитическое решение;

- отсутствие функций по работе с моментами и кумулянтами в специализированных математических пакетах.

0,0,. п,.,о или просто ап .

Примеры записи совместных моментов вида (2) через собственные и совместные кумулянты представлены в [5, 6]. В [7] описана процедура получения аналитической записи момента

п через кумулянты, которую можно

обобщить для общего случая момента п -го порядка следующим образом: чтобы получить момент п -го порядка, следует записать сумму всевозможных корреляций. Число членов суммы определяется числом всевозможных сочетаний элементов

р 1, р 2,... р г по группам, состоящим из одного, двух и т. д. элементов.

В [4] представлен метод графического изображения кумулянтов - «метод кумулянтных диаграмм». Главным достоинством описанной методики является её наглядность.

Информатика, вычислительная техника и управ ление. Моделиров ание. Приборостроение. Метрология. Информационно-измерительные приборы и системы

аШ = К1,1,1 + ^1,1,0

^0,0,1 +

+ К1,0,1 ' К0, 1, 0 + К0, 1, 1 ' К\,0,0 +

(3)

+ ^1,0,0 ' ^0,1,0 '

ш

К сожалению, во всех указанных источниках приводятся недостаточно формализованные процедуры перехода от моментов к кумулянтам, что затрудняет создание соответствующего программного обеспечения.

Автором была сделана попытка решить данную проблему и создать формализованное описание (алгоритм) получения аналитической записи момента вида (2) через кумулянты, улучшив тем самым способ, приведенный в [8].

2. Использование теории разбиения при записи аналитических выражений для совместных моментов

Для того чтобы описать взаимосвязь момента п -го порядка и соответствующих кумулянтов, целесообразно воспользоваться теорией разбиений [9].

Продемонстрируем это на примере момента 3-го порядка а1\1г^ъ. Далее верхние индексы вида ЬЬи аналогичные будут опущены.

Момент аи 1 может быть записан через кумулянты:

Более наглядной является запись моментов и кумулянтов с помощью скобок - моментных и ку-мулянтных [4]. Моментные скобки (угловые) совпадают с обозначением операции статистического усреднения. Кумулянтные скобки также угловые, но отличие заключается в том, что внутри скобок записывается перечень случайных величин, а не их произведение.

Если теперь переписать (3), то получится

Ь •£) = (£,&,£) + (£,&) (£) + + (б,бХ&) + &,&)(&) + (4)

+ЙХ ои

Если проанализировать структуру выражения (4), то можно сделать вывод, что момент 3-го порядка состоит из:

- кумулянта 3-го порядка;

- произведения кумулянта 2-го порядка и кумулянта 1-го порядка;

- произведения кумулянтов 1-го порядка.

Подобная структура полностью совпадает с

разбиением числа 3 [9]:

э = э = ( 3),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

э = 2 +1 = (2,1), (5)

3 = 1 +1 +1 = (1,1,1).

Каждый вариант разбиения соответствует структуре члена суммы, составляющей момент. Так, например, первая строка (5)

э=э = (э)

соответствует кумулянту 3-го порядка ,Ьг,Ьз), вторая строка (5)

3 = 2 +1 = (2,1) соответствует произведению кумулянта 2-го порядка на кумулянт 1-го порядка: Ь ,Ьг)(Ьз),

(#1,&Х&) , (#2,&Х&) , третья строка (5)

э = 1 +1 +1 = (1,1,1), соответствует произведению кумулянтов 1 -го порядка: (^Х^э).

Подобная процедура справедлива и для моментов более высоких порядков. Следует также отметить, что количество всех разбиений числа п будет расти очень быстро с ростом п. Например, в [9]

р(э)=э,

р(10 ) = 42, р(20) = 627, р(100) = 190 569 292, где р(п) - функция разбиения.

Для графического отображения структуры членов, в сумме составляющих момент п -го порядка, можно воспользоваться диаграммой Юнга или диаграммой Ферре [10].

Рассмотрим в качестве примера момент 4-го порядка. Разбиения числа 4 равны:

4 = (4),

4 = (э,1),

4 = (2,2), (6)

4 = (2,1,1),

4 = (1,1,1,1).

На рис. 2 приведена диаграмма Юнга, соответствующая разбиениям (6).

□ □ □ □

□ □ □ □

а)

б)

□ □ □ □

в)

□ □

□ □ □ □

Д)

Рис. 2. Диаграммы Юнга для разбиения числа 4

По диаграмме, изображенной на рис. 2, можно сделать вывод, что момент 4-го порядка состоит из:

- кумулянта 4-го порядка (рис. 2, а);

- кумулянта 3-го порядка, умноженного на кумулянт 1-го порядка (рис. 2, б);

- произведения двух кумулянтов 2-го порядка (рис. 2, в);

- произведения кумулянта 2-го порядка и двух кумулянтов 1-го порядка (рис. 2, г);

- произведения четырех кумулянтов 1-го порядка (рис. 2, д).

Структура момента 4-го порядка, полученная с помощью разбиения числа 4, совпала с представленной в [4]. Совпали также структуры моментов и более высоких порядков, как описанные в литературе, так и полученные автором. Это позволяет сделать вывод, что использование теории разбиений, диаграмм Юнга или Ферре позволяет получить структуры членов, в сумме образующих момент п -го порядка.

После того как определена структура членов суммы (по сути, структура момента), следует сформировать все возможные варианты кумулянтов. Например, в (4) структуре вида «произведение кумулянта 2-го порядка на кумулянт 1-го порядка» соответствуют три члена: р 2)(р ,

(р1,рз)рт), (р2,р3)(р). Данная задача относится к разбиению множеств [9].

В общем случае, когда хотя бы одна степень

п (1 = 1, г) больше единицы, совокупность входных величин в статистическом усреднении (моменте) уже представляет собой мультимножество:

а

=<#1 ...р ...р >.

(7)

шшт

р1 р р = <£,&) рз) + +(£> р рз)-

(8)

Полученное выражение (8) можно записать:

а1,1,1 К1,1,0 ' К0,0,1 +

+ К1,0,0 ' К0,1,0 ' К0,0,1.

Для реализации операции разбиения множества или мультимножества можно воспользоваться алгоритмами, описанными в специальной литературе, например в [11, 12], или функциями, реализованными в специальных библиотеках. Автор в своей работе выбрал второй вариант.

3. Учёт статистических связей между входными величинами

Следующим этапом является анализ наличия статистических связей между случайными величинами р1,р2,...рг. При отсутствии подобных связей хотя бы между несколькими величинами аналитическое выражение для момента а п

может быть упрощено.

Действительно, если в кумулянтную скобку входит случайная величина, которая является статистически независимой от всех других, то соответствующий кумулянт равен нулю [4].

Например, если величина р 3 статистически

независима от р1 и р 2, то выражение (4) упрощается:

В случае статистической независимости всех трех величин р , р , р все совместные кумулянты равны нулю, и (4) примет вид

а1,1,1 = р1,р2,рз) = К\,0, 0 ' *0, 1, 0 ' *0,0, 1.

В разработанном программном обеспечении пользователю предлагается разбить множество входных случайных величин 5 = {р1,...,р.} на несколько подмножеств 5, 5, • • •, 5Ь , где Ь -количество подмножеств. Каждое подмножество 5] (] = 1,Ь) содержит только величины, обладающие статистической связью.

В случае, если все величины множества 5 являются статистически независимыми, то Ь -количество подмножеств равно г - количеству входных величин.

В текстовой строке пользователь перечисляет все входные величины, разделяя их на подмножества с помощью символов «[» и «]». Это позволяет сформировать вложенный список [13] и упростить программный код.

Каждому кумулянту (анализируемому в данный момент времени) соответствует множество входных величин. Для удобства это множество можно обозначить 5К. Если все элементы множества 5К принадлежат какому-либо множеству 5j, т. е. выполняется условие 5К е

(рис. 3, а), то между указанными случайными величинами имеется статистическая связь. В этом случае соответствующий кумулянт не равен нулю.

В случае если хотя бы одна случайная величина из 5К будет принадлежать 5р (р = 1, Ь и р Ф ]), а не 5j (рис. 3, б), то эта величина статистически независима от все остальных из 5*", и соответствующий кумулянт равен нулю. Это иллюстрирует выражение (8), в котором в отличие

от (4) отсутствуют слагаемые р1,р2,р3), р1,р3)(р2), , т. к. вследствие статисти-

ческой независимости р от р и р имеет место

(р„р2,£з) = 0 ,(р„рз)(рт> = 0, (рт,рзХр1> = 0 .

п

п

Информатика, вычислительная техника и управ ление. Моделиров ание. Приборостроение. Метрология. Информационно-измерительные приборы и системы

ш

Рис. 3. Два возможных варианта разбиения множества S на подмножества по признаку статистической связи элементов

Хранение множества S в виде вложенного списка позволило значительно упростить программную реализацию процедуры анализа наличия статистической связи между входными величинами.

Рассмотренный в данной работе формализованный подход к представлению моментов через кумулянты позволил автору создать соответствующее программное обеспечение.

4. Программная реализация

С целью интеграции с уже существующей системой разработанный код был оформлен в виде функции в отдельном файле (модуле - в терминах языка Python [13]).

В качестве аргументов (параметров) данной функции передаются:

- аналитическая запись момента;

- список входных случайных величин с разбиением на подмножества.

Запись момента представляет собой текстовую строку, которая начинается с символа «m». Далее в строке через символ «_» (подчеркивание) записываются степени щ. Например, для момента вида а211 строка имеет вид «m_2_1_1».

Входные случайные величины ^,,... записываются текстовыми литералами вида «х1», «х2», ....

В качестве результата функция возвращает текстовую строку соответствующей аналитической записи момента через кумулянты. Форма записи кумулянтов схожа с записью моментов с одним отличием: в начале вместо символа «m» записан символ «k».

Заключение

Реализация разработанного кода в виде отдельного модуля позволяет использовать его и в других программных продуктах, написанных на языке Python 2.7, где требуется получение аналитического представления моментов через кумулянты.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Давенпорт В.Б., Рут В.Л. Введение в теорию случайных сигналов и шумов / пер. с англ. Б.Г. Белкина, под ред. Р.Л. Добрушина. М. : Изд-во иностр. лит., 1960. 469 с.

2. Купер Дж., Макгиллем К. Вероятностные методы анализа сигналов и систем : пер. с англ. М. : Мир, 1989. 376 с.: ил.

3. Лоэв М. Теория вероятностей / пер. с англ. Б.А. Севастьянова, под ред. Ю.В. Прохорова М. : : Изд-во иностр. лит., 1962. 721 с.

4. Малахов А.Н. Кумулянтный анализ случайных негауссовых процессов и их преобразований. М. : Советское радио, 1978. 376 с.

5. Кендалл М., Стьюарт А. Теория распределений / пер. с англ. В.А. Сазонова, А.Н. Ширяева ; под ред. А.Н. Колмогорова. М. : Наука, 1966. 588 с.: ил.

6. Крамер Г. Математические методы статистики / пер. с англ. А.С. Монина, А.А. Петрова; под ред. А.Н. Колмогорова. М. : Мир, 1975. 646 с.

7. Стратонович Р.Л. Избранные вопросы теории флуктуаций в радиотехнике. М. : Советское радио, 1961. 558 с.: ил.

8. Кузнецов Б.Ф., Бородкин Д.К., Лебедева Л.В. Метод получения кумулянтов полиномиального преобразования совокупности случайных величин и его программная реализация // Высокие технологии, исследования, финансы. Т. 2 : сб. ст. 15-й Междунар. науч.-практ. конф. «Фундаментальные и прикладные исследования, разработка и применение высоких технологий в промышленности и экономике». 25-26 апр. 2013 г. Санкт-Петербург, 2013. С. 186-188.

9. Эндрюс Г. Теория разбиений / пер. с англ. М. : Наука. ГРФМЛ, 1982. 256 с.

10. Макдональд И. Симметричные функции : пер. с англ. М. : Мир, 1985. 222 с.

11. Андерсон Джеймс А. Дискретная математика и комбинаторика : пер. с англ. М. : Вильямс, 2004. 960 с., ил.

12. Липский В. Комбинаторика для программистов / пер. с польск. В.А. Евстигнеева, О.А. Логиновой ; под ред. А.П. Ершова. М. : Мир, 1988. 200 с.

13. Саммерфилд М. Программирование на Python 3. Подробное руководство. : пер. с англ. СПб. : Символ-Плюс, 2009. 608 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.