Научная статья на тему 'Использование смешанного семейства распределений Пирсона и Джонсона для расчета вероятностных характеристик'

Использование смешанного семейства распределений Пирсона и Джонсона для расчета вероятностных характеристик Текст научной статьи по специальности «Математика»

CC BY
289
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
РАСПРЕДЕЛЕНИЕ ПИРСОНА / РАСПРЕДЕЛЕНИЕ ДЖОНСОНА / СТАТИСТИЧЕСКИЕ ФУНКЦИИ / ВЕРОЯТНОСТЬ / ОТКРЫТЫЙ КОД / PEARSON DISTRIBUTION / JOHNSON DISTRIBUTION / STATISTICAL FUNCTIONS / PROBABILITY / OPEN CODE

Аннотация научной статьи по математике, автор научной работы — Тимошенко Сергей Иванович

Основой для проведения исследования послужило отсутствие в библиотеках статистических функций с открытым кодом семейств распределений Пирсона и Джонсона. Как правило, они нужны при построении программного обеспечения для моделирования и анализа технических систем. Несмотря на то, что распределения Пирсона и Джонсона известны давно, их практическое использование сталкивается с вычислительными трудностями. Для семейства распределений Пирсона это отсутствие выражения через известные функции интеграла от IV типа распределения, что затрудняет поиск нормировочного коэффициента. Для семейства распределений Джонсона основной недостаток отсутствие у распределения SB аналитических выражений для моментов, пригодных для практических расчетов. Это затрудняет подгонку экспериментальных данных к этому виду распределения. Проблема решена на основе предложенного смешанного семейства распределений Пирсона и Джонсона, в которое вошли распределения Пирсона (кроме IV и V типов) и распределение SU Джонсона (их заменяющее). Автором получены следующие результаты: 1. для аппроксимации распределений и расчета вероятностных характеристик предложено использовать смешанное семейство распределений Пирсона и Джонсона; 2. для распределения SU Джонсона найдены выражения для связи параметров распределения через моменты; предложен эффективный алгоритм расчета параметров распределения; 3. получены соотношения для вероятностей превышения порога случайной величиной из смешанного семейства, выражающиеся через известные функции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Тимошенко Сергей Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using a mixed family of Pearson and Johnson distributions to calculate the probability characteristics

The basis for the study was the absence in libraries of statistical functions with open code families of distributions of Pearson and Johnson. Typically, they are needed when building software for modeling and analysis of technical systems. Despite the fact that the distributions of Pearson and Johnson are known for a long time, their practical use is faced with computational difficulties. For the family of Pearson distributions, this is the absence of an expression in terms of known functions of the integral of the IV type of distribution, which makes it difficult to find the normalization coefficient. For the family of Johnson distributions the main drawback is the lack of analytic expressions for the distribution of SB for moments suitable for practical calculations. This makes it difficult to fit the experimental data to this type of distribution. The problem was solved on the basis of the proposed mixed family of Pearson and Johnson distributions, which included the Pearson distributions (except for IV and V types) and the Johnson SU distribution (their substitute). The author obtained the following results: 1. for the approximation of distributions and the calculation of probabilistic characteristics, it is proposed to use a mixed family of Pearson and Johnson distributions; 2. for the Johnson SU distribution, expressions are found for the relationship of the distribution parameters through moments; an efficient algorithm for calculating the distribution parameters; 3. relations are obtained for the probability of exceeding the threshold by a random variable from a mixed family, expressed in terms of known functions.

Текст научной работы на тему «Использование смешанного семейства распределений Пирсона и Джонсона для расчета вероятностных характеристик»

Интернет-журнал «Науковедение» ISSN 2223-5167 http ://naukovedenie.ru/

Том 9, №3 (2017) http://naukovedenie.ru/vol9-3 .php

URL статьи: http://naukovedenie.ru/PDF/03TVN317.pdf

Статья опубликована 12.05.2017

Ссылка для цитирования этой статьи:

Тимошенко С.И. Использование смешанного семейства распределений Пирсона и Джонсона для расчета вероятностных характеристик // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 9, №3 (2017) http://naukovedenie.ru/PDF/03TVN317.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.

УДК 004.62

Тимошенко Сергей Иванович

ФГАОУ ВО «Уральский федеральный университет имени первого Президента России Б.Н. Ельцина», Россия, Екатеринбург1

Старший научный сотрудник Доцент ИРИТ-РТФ Кандидат технических наук E-mail: [email protected]

Использование смешанного семейства распределений Пирсона и Джонсона для расчета вероятностных характеристик

Аннотация. Основой для проведения исследования послужило отсутствие в библиотеках статистических функций с открытым кодом семейств распределений Пирсона и Джонсона. Как правило, они нужны при построении программного обеспечения для моделирования и анализа технических систем.

Несмотря на то, что распределения Пирсона и Джонсона известны давно, их практическое использование сталкивается с вычислительными трудностями. Для семейства распределений Пирсона - это отсутствие выражения через известные функции интеграла от IV типа распределения, что затрудняет поиск нормировочного коэффициента. Для семейства распределений Джонсона основной недостаток - отсутствие у распределения SB аналитических выражений для моментов, пригодных для практических расчетов. Это затрудняет подгонку экспериментальных данных к этому виду распределения.

Проблема решена на основе предложенного смешанного семейства распределений Пирсона и Джонсона, в которое вошли распределения Пирсона (кроме IV и V типов) и распределение Su Джонсона (их заменяющее).

Автором получены следующие результаты:

1. для аппроксимации распределений и расчета вероятностных характеристик предложено использовать смешанное семейство распределений Пирсона и Джонсона;

2. для распределения SU Джонсона найдены выражения для связи параметров распределения через моменты; предложен эффективный алгоритм расчета параметров распределения;

1 620002, г. Екатеринбург, ул. Мира 32

3. получены соотношения для вероятностей превышения порога случайной величиной из смешанного семейства, выражающиеся через известные функции.

Ключевые слова: распределение Пирсона; распределение Джонсона; статистические функции; вероятность; открытый код

Введение

Семейства распределений Пирсона [1] и Джонсона [2] уже многие десятилетия используются в задачах аппроксимации эмпирических распределений, расчета и оценки вероятностных характеристик [3]. Не ослабевает интерес к ним и в наши дни. Спектр применений достаточно широк: в задачах анализа изображений [4, 5], в моделировании радиолокационных сигналов [6, 7], в оценке рисков [8, 9], в страховом деле [10], в регрессионном анализе [11], в оценке надежности [12], а также во многих других прикладных задачах теории вероятностей и математической статистики [13-17]. Есть работы и по модификации семейств распределений [18, 19]. Семейства распределений Пирсона и Джонсона сравнимы по своим аппроксимирующим возможностям.

Семейства распределений включены в статистические пакеты (см., например, Statistica2), в которых обычно решаются задачи подгонки экспериментальных данных к конкретным распределениям. При построении программного обеспечения для моделирования и анализа технических систем, как правило, требуются библиотеки статистических функций с открытым кодом. Однако полного набора функций для семейств распределений Пирсона и Джонсона в таких библиотеках нет (см., например, библиотеку Colt3 для Java или библиотеки языка R4). Поэтому актуальной задачей является создание базы для разработки таких библиотек.

При изучении алгоритмов расчета параметров распределений Пирсона и Джонсона [3, 20] можно отметить, что каждому из семейств присущи свои недостатки, затрудняющие их использование. Для семейства распределений Пирсона - это отсутствие выражения через известные функции интеграла от IV типа распределения [21], что затрудняет поиск нормировочного коэффициента.

Для семейства распределений Джонсона основной недостаток - отсутствие у распределения SB аналитических выражений для моментов, пригодных для практических расчетов. Это затрудняет подгонку экспериментальных данных к этому виду распределения.

Перечисленные недостатки могут быть скомпенсированы, если вместо использования какого-либо одного семейства применять смешанное семейство распределений Пирсона и Джонсона [22]. В смешанное семейство входят распределения Пирсона (кроме типов IV и V) и распределение SU Джонсона [23], заменяющее IV и V тип Пирсона (см. рис. 1). Распределение SU Джонсона перекрывает V тип, который не включен в смешанное семейство,

2 Анализ процессов. Негауссовские распределения [Электронный ресурс] // Statistica. Электронный учебник по статистике. Компания StatSoft Russia. - URL: http://statsoft.ru/home/textbook/default.htm (дата обращения: 21.02.2017).

3 CERN. Colt. Open Source Libraries for High Performance Scientific and Technical Computing in Java [Electronic resource] // Data Science and Technology. - URL: https://dst.lbl.gov/ACSSoftware/colt/api/index.html (circulation date: 22.02.2017).

4 An Introduction to R. Programming Environment for Data Analysis and Graphics [Electronic resource] // The Comprehensive R Archive Network. The R Manuals. - URL: https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf (circulation date: 16.03.2017).

и частично VI тип распределений Пирсона. Оси ß1 и ß2 на рис. 1 представляют из себя переменные Пирсона и определяются равенствами [21]:

ßi = МзМ-3 = Vi, ßi = V-Ф-2 =72 + 3, (1)

где: у1 и у2 - соответственно коэффициенты асимметрии и эксцесса, ^ - i-й центральный момент распределения вероятностей.

Прямая ß2=ß1+1 отделяет критическую область. Для любого распределения должно выполняться неравенство ß2>ß 1+1 [21]. Таким образом, в критической области распределений не существует.

Распределения III типа Пирсона находятся на прямой ß2=(3ß1+6)/2 [21]. Распределения V типа Пирсона - на кривой [20]:

6(ß1 + 4) г --.

32-ßi

(2)

Рисунок 1. Диаграмма распределений на плоскости переменных Пирсона (линии построены

автором по приведенным выше уравнениям)

Семейство распределений Пирсона

Семейство распределений Пирсона задается дифференциальным уравнением [21]:

др(х) дх

х — а

b0 + b1x + Ь2х2

(3)

где: а и Ъг - параметры распределения, р(х) - плотность вероятностей.

Для центрированных распределений (математическое ожидание т=0) параметры имеют следующую связь с центральными моментами ^, / = 2,4:

Я = йь Ь0=| , , ¿2=^ (4)

где:

Со = -^2(4^2^4 - 3д|), С1 = -Дз(М4 + 3д|), с2 = -2д2д4 + 6д| + 3^2, й = 10д2д4 — 18д| — 12^2.

Ъ I-

В зависимости от корней х12 =--— (1 ± VI — &-1), к = —— уравнения

' 2Ь2 4Ь0Ь2

Ь0 + Ь1х + Ь2х2 = 0 , (6)

решение дифференциального уравнения (3) приводит к трем основным типам распределений:

1. тип I (бета-распределение первого рода), если корни уравнения (6) вещественны и имеют разные знаки (^ < 0);

2. тип IV, если корни комплексные (0 < к < 1);

3. тип VI (бета-распределение II рода), если корни действительны и одинаковы по знаку (& > 1).

По существу, этим охватываются все возможные случаи. Тем не менее, граничные и частные случаи типов I, IV и VI выделяют особо. Поэтому в итоге различают 12 типов распределений Пирсона.

Для большинства практических расчетов можно ограничиться учетом в смешанном семействе лишь SU распределения Джонсона и распределений Пирсона типа I, VI и III, которое разделяет первые два типа. Кратко остановимся на характеристике распределений, включенных в смешанное семейство.

Тип I (бета-распределение)

Для типа I Пирсона корни х1 и х2 действительны и различны по знаку, к<0:

(х — х1)5(х2 — х)й

Р(Х) = В^ + 1,Л+1)(*2— Х1)^+1 , ■*1 ^ Х ^ Х2 , (7)

где: В() - бета-функция [24]. Распределение существует при £>—1, И>— 1, которые определяются уравнениями:

, Л = . (8)

При g>0, И>0 распределение унимодально. При —1<§<0, —1<И<0 - выпукло вниз, т.е. имеет и-образную форму. При g и И разных знаков - 1-образно.

Тип III (гамма-распределение)

Тип III Пирсона получается при k=ro (b2=0):

_ (-(х + йоЬГ1)ЬГ1)-1-ь°ь-2ехр((х + йсЬГ1)ЬГ1) ( )

Р(Х) |Ь1|Г(-ЬоЬ-2) ' ( )

где: х = Ь0Ь-1 < х < го при Ьх < 0 (д3 > 0)

и

— I

го < х < —Ь0Ь- 1 = х2 при

Ь1 > 0 (д3 < 0), Г() - гамма-функция [24]. Для распределения выполняются равенства:

¿2 = 0, Ьо = —М2, а = ¿1 = — ^ .

(10)

Распределения существуют как с положительной, так и отрицательной асимметрией (получаются путем зеркального отображения).

Тип VI (бета-распределение II рода)

Тип VI Пирсона соответствует ситуации, когда корни х1 и х2 действительны и одинаковы по знаку, т.е. к>1. В зависимости от знака различают два случая:

а) ^3>0, х2<х<го:

р(х) =

б) №<0, —ю<х<х1:

р(х) =

(х — Х1)5(Х — Х2)

(х2 — х1)5+^+15(Л + 1,— д — Л — 1)

(х1 — х)5(х2 — х)п (Х2 — Х1)5+^+15(—д — л — 1,0 + 1)

(11)

(12)

где: В() - бета-функция. Распределение (11) - (12) существует лишь при Ь2<—0,2.

8и распределение Джонсона

Плотность вероятностей р(х) распределения Джонсона типа Би имеет вид [23]:

р(х) =

Т2гё7(х-е)2+Я2

ехр

2(г + Ч(п!г-г +

(¥)

2

+1

(13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где: х - случайная переменная, —го < х < го; ^,Я, £, у - параметры распределения,

причем

ц > 0, Я > 0, —го < г < го, —го < у < го.

Известна [23] связь первых четырех моментов с параметрами распределения:

т = е — Я^ЛЛ,

я3

Я2

Д2 = у [^4сЛ2Л — ^2сЛ2Л + — 1],

я4

И4 = —

д3 = — — [(^9 — 3^5 + 2^3)5Л3Л + 3(^5 — 2^3 + ю^ЛА], (^16 — 4^10 + 6^6 — 3^4)сЛ4Л + 4(^10 — 3^6 + 2^4)сЛ2Л +

+ 3(2^6 — 3^4 + 1)

4

(14)

(15)

(16) (17)

где: т - математическое ожидание (первый начальный момент); д2,д3, д4 -

1

соответственно второй, третий и четвертый центральный момент; ш = ехр(^-^), П = у/^ ;

$И(), ек() - соответственно гиперболический синус и косинус.

2^2

Параметры распределения (13) могут быть найдены в результате решения системы трансцендентных уравнений (14) - (17). К сожалению, не существует общих аналитических методов решения подобных систем. Так как не удается получить приблизительной оценки параметров распределения (1), то затруднено применение численных методов.

2

1

V

Попробуем свести решение системы уравнений к решению одного уравнения. Допустим, что распределение (13) центрировано (т.е. т=0), тогда из (14) следует, что £ = ЛшзкП и

р

зЪП=- . 08) Подставим (18) в (15) и учтем, что [25]

ск2П = 2зк2П + 1, (19)

тогда

^ = (ы2-1) + (а>4-1)^ . (20)

Учитывая, что по определению (13) Л > 0, из (20) следует

Я = ^2(^2 - (ы2 - 1)г2)/(ы4 - 1). (21)

Подставим (18), (21) в (16) и учтем, что [25]

БкЗП = ЗэкП + 45И.3П, (22)

тогда

^ = \(а>2- 1)3е3 - - 1)е. (23)

Преобразуем (23) к приведенному виду кубического уравнения [26]:

^-3,2^-^) = °. <24)

При т = 0 и допустимых значениях Л им знаки у £ и д3 должны быть противоположны (см. (16) и (18)). Это необходимо учесть при выборе решения уравнения (24). В зависимости от знака дискриминанта

(Из - £(и2 + 1)3)/(^2 - 1)6, (25)

уравнение (24) будет иметь либо один (Л> 0), либо три действительных корня (Л< 0).

Рассмотрим каждое из возможных решений. При Л> 0, воспользуясь формулой Кардано [26], получим

г = + + ^з-^м2-м2(^2 + 1)3) /(С*2 - 1). (26)

В (26) знаки у е и д3 совпадают. Следовательно, (26) не может быть решением системы уравнений (14) - (17). Воспользовавшись третьим способом [26] решения приведенных уравнений, при А< 0 получим

е = cos(z)/(ш2 - 1). (27)

Возможны три решения, отличающиеся значением г, которое может быть равным ^ ,

(р 2п (р 4п

— +--и — +--, где:

3 3 3 3 '

( ы \ ( Ж \

<р = arccos I -з ) = arccos I-^ I. (28)

\(^2(ы2 + 1))2) + 1)г)

Выражение, стоящее под знаком функции в (28), положительно, поэтому 0 < ^ < - С учетом этого, области допустимых значений для г, определяющих три возможных решения, графически изображены на рис. 2 (кривые 1, 2, 3 соответствуют х = —, г = — + — и

2=^ + % 3 3 3

33

Из анализа (27) и рис. 2 следует, что первое решение (г = не удовлетворяет системе уравнений (14) - (17), так как в этом случае знаки у е и д3 совпадают.

Из (16) следует также, что яЛЛ = 0 и яЛЗЛ = 0, если д3 = 0. Тогда для т=0 следует, что и е = 0. Этой проверке удовлетворяет лишь третье решение (г = ^ +которое и

определяет истинное решение (27), удовлетворяющее системе уравнений (14) - (17). Таким образом

£ = ^ (| + у) /(^2 — 1).

(29)

со$(1) 0,8

0,6

0,4

0,2

0

-0,2

-0,4

-0,6

-0,8

-1

ч 2 ^_

ччч

п/6

п/3

п/2 2п/3 5п/6

7п/6 4п/3 3п/2 5п/3 11п/6 i

Рисунок 2. К выбору корня кубического уравнения (разработано автором для иллюстрации

поиска решений уравнения (27))

Область определения для может быть найдена из условия Д< 0. Тогда из (25) следует:

> Зл/м2м-3 — 1 = УК — 1.

(30)

Кроме того, из обозначения ш = ехр(—-), которое было введено для системы уравнений (14) - (17), следует, что ш > 1 и, лишь при ^ ^ го, ^ ^ 1. Подставим (18), (21) в (17), учтем (19), и что

сЛ4Я = 85Л4Я + 85Л2Я + 1, (31)

тогда

1

3 л

0

п

1

а. = -(—ш12 + 2ш10 — ш8 + 4ш6 — 11ш4 + 10ш2 — 3)е4 +

2 J (32)

+ + ш8 — 4ш4 — ш2 + 3)^2е2 +1 (ш8 + 2ш4 + 3)^2-

Пусть

£ц = 2sign(^3)J^22(MTTT) cos (j + y), (33)

тогда из (29) следует, что

£ = Ец/(Ш2 — 1). (34)

Подставим (34) в (32). Перенеся все члены (32) в левую часть уравнения и разделив многочлены при е4 и е2 на соответствующие степени от многочлена (ш2 — 1), получим:

(ш4 + 2ш2 + 3)е4 — (ш6 + 3^4 + 5ш2 + 3)е2 —1(ы8 + 2ш4 + 3)^2 = 0. (35)

Порядок уравнения может быть понижен вдвое, так как в нем присутствуют только четные степени переменной ш. В общем случае аналитически разрешить уравнение (35) относительно переменной ш не удается. Однако численное его решение при введенных ограничениях на ш может быть проведено более эффективно, по сравнению с численным решением исходной системы уравнений (14) - (17).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Повысить эффективность численного решения можно с использованием производной от функции /(&), расположенной в левой части уравнения (35), где: д = ш2:

1 ' Г,2 _,_ ОЛ _1_ -ЗЛ „4 _ ЛоЗ ^ ?л2 _,_ С „О -ЗЛ с2 - 1 ^о4 ^ пл2 _,_ -зЛ ,,2

f(d) = ^4+1(д2 + 2д + 3)г4 — (д3 + 3d2 + 5Я + 3)еЦ: —1(д4 + 2д + 3(36)

Найдем производную /(А) от функции (36) по т9. Для этого разобьем функцию /(А) на три части: /(д) = /1(д) + /2(д) + /З(д), где:

1

fi(d)=V4+-(d2 + 2d + 3)84 =

arccos(^p1(d+1) 2

(37)

= ^4 + 8(д4 + 4д3 + 8д2 + 8Я + 3) cos4 ( -^-'- + );

arccos(jp1(d+1) 2

f2(-d) = —4^2(д4 + 4д3 + 8д2 + + 3)cos2 ( -^-L + Y ); (38)

Гз($) = — &($4 + 2д2 + 3)/2. (39)

Взяв производную от каждой из частей (37) - (39) функции f(&), получим

/arccos (¡fi(d + 1) 3^) 4п

f'(d) = 16^2(д3 + 3d2 +4д + 2)cos2

( ' ' - 3

arccos

+ — \ х

V

33

х

2^2COS \ \

2 I arccos (¡Wi(d + 1) 2) 4Л ^

(40)

3 +т) — 1 \ + 2H2jFi(V + 1)-1x

х ( + 3$2 + + 3) sin

V

агссоя

1

(1-&(0 + 1)-3)-2 X

)

х

1 — 4Д2С052

+ т) ) — 2м2(03 + 0).

После нахождения из (35) параметры распределения могут быть последовательно

получены из уравнений (29) - £ и (21) -Я . Так как ш = ехр (^т), то ^ = (21п^)-Г. Учитывая

ранее введенное обозначение П = у/^ и формулу (18), а также найденные параметры £, можно найти у:

7

= ^^¿Ь^^ + лШ +1).

(41)

Так как параметры найдены для математического ожидания т = 0, то в общем случае т 0 в конце расчетов придется сделать поправку только для параметра £ с учетом формулы (14), т.е. к найденному по формуле (29) значению £ прибавить т.

Методика аппроксимации распределений смешанным семейством

Методика аппроксимации распределений смешанным семейством Пирсона и Джонсона заключатся в следующем:

1. вычисляются четыре момента распределения: т, /л2, Из, И4;

2. вычисляется значение к;

3. по величине к определяется тип распределения;

4. по моментам рассчитываются параметры распределения.

2

3

3

Вычисление вероятностей превышения порога

В ряде прикладных задач требуется определить вероятность превышения порога. К таким задачам относятся задачи обнаружения сигналов. Обратной к задаче обнаружения сигналов является поиск порога для обеспечения заданной вероятности ложной тревоги. Близкой к последней задаче является определение доверительного интервала для оценки случайного параметра (см. рис. 3, где: р(х) - плотность вероятностей, Р - доверительная вероятность, Т1 и Т2 - границы доверительного интервала). Во всех этих задачах основой являются алгоритмы вычисления вероятностей превышения порога.

Р(х)

и-Р,/2

(1 -Р)/2

Тг Т2 х

Рисунок 3. Доверительный интервал для заданной доверительной вероятности Р (график построен автором для показательно-степенной плотности вероятностей с параметром 3,5)

Определим аналитические выражения для вероятностей Р(х>Т) превышения порога Т случайной величиной х с распределением из смешанного семейства. Необходимо учесть, что найденные ранее параметры определяют центрированные распределения. Кроме того, конечные формулы для вероятностей должны выражаться через известные функции.

Общее соотношение для вероятности Р(х>Т), выраженное через плотность вероятностейрц(х) центрированного распределения, имеет вид:

Р(х>Г) = ГтРц(х)5х.

(42)

Тип I (бета-распределение)

Подставим в (42) плотность вероятностей (7). В этом случае, исходя из области определения для х, верхний предел в (42) будет равен х2. Осуществим замену переменной:

2 = (х Хг) , тогда = (Г — ш — х1)/(х2 — х1), Зх = (х2 — х1)3г. Окончательное

(%2-ХГ)

выражение:

Л

Р(х>Г) = /Ги5-1(# + 1,Л +1)2^(1 — 2)^ = 1 —/Т№(0 + 1,Л + 1), (43)

где: /^() - отношение неполной бета-функции к полной [27] или бета-функция распределения вероятностей.

Тип III (гамма-распределение)

Подставим в (42) плотность вероятностей (9). Сделаем замену переменной: х = —хЬ-1 — Ь0Ь-2, тогда = — (Г — ш)Ь-1 — Ь0Ь-2, Зх = —Ь19г. Выражение для Р(х>Т) будет зависеть от знака ц3. Для д3 > 0 верхний предел в (42) равен бесконечности, причем Ь1 = —|Ь1|, поэтому

Р(х >Т) = I Г-1( — Ь0Ь-2)г-ь°ь- -1е-2дг = 1 — 1Тм(-Ь0Ь-2). (44)

Для < 0 верхний предел в (42) равен х2 = —Ь0Ь-1, причем Ь1 = |Ь1|, поэтому

Р(х >Т) = Г-1( — ЬоЬ-2)г-ь°ь:-2-1е-2дг = 1Ты(—ЬоЬ-2). (45)

В (44) - (45) ¡ты() - гамма-функция распределения вероятностей.

Тип VI (бета-распределение II рода)

Вид плотности вероятностей в этом случае, как и выражение для Р(х > Т), зависит от знака д3.

При > 0 подставим в (42) плотность вероятностей (11). При этом верхний предел в (42) будет равен бесконечности. Осуществим замену переменной: г = (х2 — х1)/(х — х1), тогда Ты = (х2 — х1)/(Т — т — х1), дх = —(х2 — х1)г-2дг, и получим

Р(х >Т)= С" В-1(—д — к — 1,к+1) г-д-п-2(1 — 2)пдх = 1Ты(—д — И —1,И + 1). (46)

При < 0 подставим в (42) плотность вероятностей (12). Верхний предел в этом случае будет равен х1. Проведем замену переменной: х = (х2 — х1)/(х2 — х), тогда

Ты = (х2 — х1)/(хг —Т + т), дх = (х2 — х1)г-2дг, и получим Р(х >Т) = ^В-1(—д — к — 1,д + 1)г-з-н-2(1 — г)ддг = 1 — 1Ты(—д — к — 1,д + 1). (47) В (46) - (47) 1тм() - бета-функция распределения вероятностей.

8и распределение

Подставим в (42) плотность вероятностей (13). Осуществим замену переменной: г = у + цагзк тогда Ты = у + цагзк х = + дх дг и

получим

где: Ф() - интеграл вероятности [21].

1 1 2

Р(х > Т) =^=С е-2' дг=1 — Ф(Т„), (48)

Заключение

Для аппроксимации распределений и расчета вероятностных характеристик предложено использовать смешанное семейство распределений Пирсона и Джонсона, в которое вошли распределения Пирсона (кроме IV и V типов) и распределение Би Джонсона. Смешанное семейство распределений эквивалентно по аппроксимирующим возможностям семействам Пирсона или Джонсона, однако позволяет избежать вычислительных трудностей определения параметров распределений IV типа Пирсона и Бв Джонсона. Смешанное семейство опробовано на различных статистических данных, в частности на данных нагрузочного тестирования интернет-сервисов [28].

Для распределения Би Джонсона найдены выражения для связи параметров распределения через моменты. Предложен эффективный алгоритм расчета параметров распределения.

Получены соотношения для вероятностей превышения порога случайной величиной из смешанного семейства, выражающиеся через известные функции (бета-функцию, гамма-функцию и интеграл вероятности).

Найденные выражения для смешанного семейства распределений Пирсона и Джонсона могут стать базой для разработки библиотек статистических функций с открытым кодом.

ЛИТЕРАТУРА

1. Pearson, K. Contributions to the Mathematical Theory of Evolution. II. Skew Variations in Homogeneous Material [Text] / K. Pearson // Philosophical Transactions of the Royal Society of London. Ser. A. - 1895. - Vol. 186. - P. 343-414.

2. Johnson, N.L. Systems of Frequency Curves Generated by Methods of Translation [Text] / N.L. Johnson // Biometrica. - 1949. - Vol. 36, № 1/2. - P. 149-176.

3. Джонсон, Н.Л. Одномерные непрерывные распределения [Текст]: в 2 ч. Ч. 1 / Н.Л. Джонсон, С. Коц, Н. Балакришнан. - М.: БИНОМ. Лаборатория знаний, 2010. - 703 с.

4. Буркатовская, Ю.Б. Применение распределений Джонсона к задаче классификации аэрокосмических изображений [Текст] / Ю.Б. Буркатовская, Н.Г. Марков, А.С. Морозов, А.П. Серых // Известия Томского политехнического университета. - 2007. - Т. 311, № 5. - С. 76-80.

5. Воронов, И.В. Применение универсального семейства распределений Пирсона для аппроксимации распределения значений вектора псевдоградиента при совмещении изображений [Текст] / И.В. Воронов // Радиоэлектронная техника. -

2015. - № 2(8). - С. 123-127.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Пат. 2187888 Российская Федерация, МПК7 G 01 S 7/40. Способ имитации радиолокационных сигналов радиолокационных систем навигации летательных аппаратов [Текст] / Кольцов Ю.В., Белинский А.В.; заявитель и патентообладатель Государственная корпорация по атомной энергии "Росатом" и ФГУП ФНПЦ "Научно-исследовательский институт измерительных систем им. Ю.Е. Седакова". - № 2015108240/07; заявл. 10.03.2015; опубл. 10.06.2016, Бюл. № 16. - 17 с.

7. Карпов, И.Г. Модернизация распределений Пирсона для аппроксимации экспериментальных распределений радиолокационных сигналов [Текст] / И.Г. Карпов, Е.А. Галкин // Известия вузов. Радиоэлектроника. - 2004. - Т. 47, № 11.

- С. 52-61.

8. Лебедев, С.А. Оценка рыночных рисков ценных бумаг на основе универсальных семейств распределений [Текст] / С.А. Лебедев // Сибирская финансовая школа.

- 2008. - № 2(67). - С. 87-90.

9. Naguez, N. Dynamic Portfolio Insurance Strategies: Risk Management under Johnson Distributions [Text] / N. Naguez // Annals of Operations Research. - 06 February

2016. - P. 1-25. - DOI 10.1007/s10479-016-2121-8.

10. Смагина, С.Р. Расчет тарифных ставок с использованием кривых Джонсона при страховании автотранспорта [Текст] / С.Р. Смагина, Г.М. Кошкин // Известия высших учебных заведений. Физика. - 2015. - Т. 58, № 11-2. - С. 297-302.

11. Тимофеев В.С. Оценивание параметров регрессионных зависимостей с использованием кривых Пирсона [Текст] / В.С. Тимофеев // Науч. вестн. Новосибир. гос. техн. Ун-та. - 2009. - № 4 (37). - С. 57-66.

12. Игнатенко, В.И. Применение распределений Джонсона и Пирсона в задачах технической эксплуатации автомобилей [Текст] / В.И. Игнатенко // Сборник научных трудов конференции «Проблемы современной науки». - Липецк: Издательство ЛГТУ, 2016. - C. 63-66.

13. Битюкова, В.В. Применение универсальных семейств распределений Пирсона для моделирования загруженности кабинетов лечебно-профилактических учреждений [Текст] / В.В. Битюкова, А.А. Хвостов, Д.И. Ребриков // Вестник Тамбовского государственного технического университета. - 2008. - Т. 14, № 1. - С. 202-208.

14. Свиркина, Н.М. Метод кривых Пирсона в анализе баллов ЕГЭ абитуриентов, поступивших в вуз [Текст] / Н.М. Свиркина // Процессы управления и устойчивость. - 2014. - Т. 1, № 1. - С. 500-505.

15. Mateus, A. Fitting Johnson's SB Distribution to Forest Tree Diameter [Text] / A. Mateus, M. Tome // Advances in Regression, Survival Analysis, Extreme Values, Markov Processes and Other Statistical Applications. Studies in Theoretical and Applied Statistics. - Berlin: Springer-Verlag, 2013. - P. 289-296. - DOI: 10.1007/ 978-3-642-34904-1_30.

16. Заикин, П.В. Аппроксимация эмпирических функций полиномами высших порядков [Текст] / П.В. Заикин, М.А. Погореловский, В.С. Микшина // Вестник кибернетики. - 2015. - № 4. - С. 129-134.

17. Губарев, В.В. Идентификация эмпирических распределений [Текст] / В.В. Губарев // Вестник Самарского государственного аэрокосмического университета. - 2011. - № 6(30). - С. 205-215.

18. Карпов, И.Г. Модифицированные распределения Джонсона и их применение для аппроксимации законов распределения экспериментальных данных [Текст] / И.Г. Карпов, Ю.Т. Зырянов, А.Н. Грибков // Известия Томского политехнического университета. - 2013. - Т. 322, № 2. - С. 46-50.

19. Карпов, И.Г. Методика идентификации параметров модифицированных распределений Пирсона с использованием степенных, экспоненциальных и логарифмических моментов [Текст] / И.Г. Карпов, Ю.Т. Зырянов // Фундаментальные и прикладные проблемы техники и технологии. - 2015. - № 3 (311). - С. 117-127.

20. Бостанджиян, Б.А. Распределение Пирсона, Джонсона, Вейбулла и обратное нормальное. Оценивание их параметров [Текст] / Б.А. Бостанджиян. -Черноголовка: Редакционно-издательский отдел ИПХФ РАН, 2009. - 240 с.

21. Тихонов, В.И. Статистическая радиотехника [Текст] / В.И. Тихонов. - 2-е изд., перераб. и доп. - М.: Радио и связь, 1982. - 624 с.

22. Тимошенко, С.И. Использование семейств кривых Джонсона и Пирсона в задачах аппроксимации распределений, расчета и оценки вероятностных

Том 9, №3 (май - июнь 2017)

[email protected]

23.

24.

25.

26.

27.

28.

характеристик [Текст] / С.И. Тимошенко // УПИ. - Свердловск, 1986. - 59 с. -Библиогр.: C. 47-48. - Деп. в ВИНИТИ 30.07.86, № 6190-В86.

Тимошенко, С.И. Расчет параметров распределения Джонсона типа Su по моментам [Текст] / С.И. Тимошенко // Научные труды международной научно-практической конференции «СВЯЗЬ-ПРОМ 2009». - Екатеринбург: УрТИСИ ГОУ ВПО «СибГУТИ», 2009. - C. 26-29.

Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений [Текст] / И.С. Градштейн, И.М. Рыжик. - М.: Наука, 1971. - 1108 с.

Двайт, Г.Б. Таблицы интегралов и другие математические формулы [Текст] / Г.Б. Двайт. - М.: Наука, 1978. - 224 с.

Бронштейн, И.Н. Справочник по математике для инженеров и учащихся втузов [Текст] / И.Н. Бронштейн, К.А. Семендяев. - Изд. перераб. под ред. Г. Гроше и В. Циглера; пер. с нем. - М.: Наука, 1980. - 976 с.

Корн, Г. Справочник по математике для научных работников и инженеров [Текст] / Г. Корн, Т. Корн. - М.: Наука, 1977. - 831 с.

Суханов, В.И. Исследование визуализации данных с применением открытых геоинформационных сервисов [Текст] / В.И. Суханов, С.И. Тимошенко, Р.М. Чернин // Информационные системы и технологии. - 2011. - № 6(68). - С. 139144.

Timoshenko Sergey Ivanovich

Ural federal university, Russia, Ekaterinburg E-mail: [email protected]

Using a mixed family of Pearson and Johnson distributions to calculate the probability characteristics

Abstract. The basis for the study was the absence in libraries of statistical functions with open code families of distributions of Pearson and Johnson. Typically, they are needed when building software for modeling and analysis of technical systems.

Despite the fact that the distributions of Pearson and Johnson are known for a long time, their practical use is faced with computational difficulties. For the family of Pearson distributions, this is the absence of an expression in terms of known functions of the integral of the IV type of distribution, which makes it difficult to find the normalization coefficient. For the family of Johnson distributions the main drawback is the lack of analytic expressions for the distribution of SB for moments suitable for practical calculations. This makes it difficult to fit the experimental data to this type of distribution.

The problem was solved on the basis of the proposed mixed family of Pearson and Johnson distributions, which included the Pearson distributions (except for IV and V types) and the Johnson SU distribution (their substitute).

The author obtained the following results:

1. for the approximation of distributions and the calculation of probabilistic characteristics, it is proposed to use a mixed family of Pearson and Johnson distributions;

2. for the Johnson SU distribution, expressions are found for the relationship of the distribution parameters through moments; an efficient algorithm for calculating the distribution parameters;

3. relations are obtained for the probability of exceeding the threshold by a random variable from a mixed family, expressed in terms of known functions.

Keywords: Pearson distribution; Johnson distribution; statistical functions; probability; open

code

i Надоели баннеры? Вы всегда можете отключить рекламу.