Научная статья на тему 'ОЦЕНКА ПАРАМЕТРОВ ОДНОМЕРНОГО И ДВУМЕРНОГО РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН'

ОЦЕНКА ПАРАМЕТРОВ ОДНОМЕРНОГО И ДВУМЕРНОГО РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН Текст научной статьи по специальности «Математика»

CC BY
220
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА / ФУНКЦИЯ ПЛОТНОСТИ ВЕРОЯТНОСТИ / ДВУМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ / СЛУЧАЙНАЯ ВЕЛИЧИНА / РЕАЛИЗАЦИЯ / ОЦЕНКА / MULTIVARIATE RANDOM VARIABLE / PROBABILITY DENSITY FUNCTION / TWO-DIMENSIONAL NORMAL DISTRIBUTION / UNIFORM DISTRIBUTION / IMPLEMENTATION / ESTIMATION

Аннотация научной статьи по математике, автор научной работы — Шерстнева А.А.

Рассматривается задача оценки параметров одномерного и двумерного распределения случайных величин средствами программы математического моделирования. Целью работы является нахождение и оценка этих параметров. Сгенерирована 1000 равномерно и нормально распределенных случайных чисел. Произведен расчет среднего значения, дисперсии и стандартного отклонения этих реализаций тремя различными способами. В статье приведена оценка функции плотности вероятности случайной величины из ряда наблюдений. Построены графики функции плотности вероятности равномерно и нормально распределенных величин с учетом 20, 200 и 1000 попыток. Произведена генерация двумерного нормального распределения. Выполнена оценка математического ожидания и дисперсии с использованием выборочной функции кросс- и ковариационной функции. Рассчитана двумерная функция плотности и показано ее графическое отображение в виде 3D графика.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETERS ESTIMATION OF ONE-DIMENSION AND TWO-DIMENSION DISTRIBUTION OF RANDOM VARIABLES

The article considers a problem of parameters estimating of one-dimensional and two-dimensional distribution of random variables with mathematical modeling program. The article is aimed to find and evaluate these parameters. In the article 1000 uniformly and normally distributed random numbers are generated. The mean value, variance and standard deviation of these implementations were calculated in three different ways. The article provides an estimate of the density function of a random variable from a number of observations. Probability density function plots of uniformly and normally distributed values are constructed with 20 and 200 number of bins. A two-dimensional normal distribution is generated. The mean value and variance are estimated using the sample of cross- and covariance function. A two-dimensional probability density function is calculated and is shown in the form of a 3D graph.

Текст научной работы на тему «ОЦЕНКА ПАРАМЕТРОВ ОДНОМЕРНОГО И ДВУМЕРНОГО РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН»

УДК 681.514 DOI: https://doi.org/10.34680/2076-8052.2020.5(121).63-67

ОЦЕНКА ПАРАМЕТРОВ ОДНОМЕРНОГО И ДВУМЕРНОГО РАСПРЕДЕЛЕНИЯ

СЛУЧАЙНЫХ ВЕЛИЧИН

А.А.Шерстнева

PARAMETERS ESTIMATION OF ONE-DIMENSION AND TWO-DIMENSION DISTRIBUTION

OF RANDOM VARIABLES

A.A.Sherstneva

Сибирский государственный университет телекоммуникаций и информатики, Новосибирск,

asherstneva@sibguti. ru

Рассматривается задача оценки параметров одномерного и двумерного распределения случайных величин средствами программы математического моделирования. Целью работы является нахождение и оценка этих параметров. Сгенерирована 1000 равномерно и нормально распределенных случайных чисел. Произведен расчет среднего значения, дисперсии и стандартного отклонения этих реализаций тремя различными способами. В статье приведена оценка функции плотности вероятности случайной величины из ряда наблюдений. Построены графики функции плотности вероятности равномерно и нормально распределенных величин с учетом 20, 200 и 1000 попыток. Произведена генерация двумерного нормального распределения. Выполнена оценка математического ожидания и дисперсии с использованием выборочной функции кросс- и ковариационной функции. Рассчитана двумерная функция плотности и показано ее графическое отображение в виде 3D графика.

Ключевые слова: многомерная случайная величина, функция плотности вероятности, двумерное нормальное распределение, равномерное распределение, случайная величина, реализация, оценка

Для цитирования: Шерстнева А.А. Оценка параметров одномерного и двумерного распределения случайных величин // Вестник НовГУ. Сер.: Технические науки. 2020. №5(121). С.63-67. DOI: https://doi.org/10.34680/2076-8052.2020.5(121).63-67.

The article considers a problem of parameters estimating of one-dimensional and two-dimensional distribution of random variables with mathematical modeling program. The article is aimed to find and evaluate these parameters. In the article 1000 uniformly and normally distributed random numbers are generated. The mean value, variance and standard deviation of these implementations were calculated in three different ways. The article provides an estimate of the density function of a random variable from a number of observations. Probability density function plots of uniformly and normally distributed values are constructed with 20 and 200 number of bins. A two-dimensional normal distribution is generated. The mean value and variance are estimated using the sample of cross- and covariance function. A two-dimensional probability density function is calculated and is shown in the form of a 3D graph. Keywords: multivariate random variable, probability density function, two-dimensional normal distribution, uniform distribution, implementation, estimation

For citation: Sherstneva АЛ. Parameters estimation of one-dimension and two-dimension distribution of random variables // Vestnik NovSU. Issue: Engineering Sciences. 2020. №5(121). P.63-67. DOI: https://doi.org/10.34680/2076-8052.2020.5(121).63-67.

Введение

При рассмотрении современных телекоммуникационных сетей и систем с целью определения эффективности их функционирования, как правило, рассматривается ряд задач, связанных с их формализованным представлением. В основе практически всех методов решения лежат два основных принципа рассмотрения функциональных и структурных особенностей сетей связи.

Первоначально необходимо определиться с описанием математической модели сети связи как системы массового обслуживания. Согласно теории телетрафика, при выборе модели системы массового обслуживания характерно не только определение параметров ее функционирования, но и выбор закона распределения информации для количественной оценки процессов обслуживания информационных

потоков. Выбирается математическая модель функционирования сети связи в заданных условиях и с соблюдением существующих нормативно-правовых актов.

Выбор математической модели включает определение случайных величин, задающих время между поступлениями заявок, их обслуживанием, пребыванием в очереди ожидания обслуживания, в том числе и в очереди на повторное обслуживание. Таким образом, формулируется задача расчета параметров функции распределения случайных величин, а также задача нахождения оценки их практических значений.

Учитывая то, что существует много вариантов реализаций элементов сетевой модели, для решения подобных задач целесообразно применять программы математического моделирования. Их использование для получения практических результатов исследования вполне обосновано.

При моделировании инфокоммуникационная система представляется в виде графовой модели, включающей множество состояний с описанием со-зависимостей между ними. Соответственно, необходимы программные решения, которые позволят качественно улучшить прогнозирование системных параметров, повысить точность сложных вычислений и уменьшить время обработки массивов данных.

Актуальной является задача оценки функции плотности вероятности случайной величины из ряда наблюдений. Программная реализация осуществляется с учетом законов распределения, нормального и равномерного. Для увеличения точности результатов расчет среднего значения, дисперсии и стандартного отклонения этих реализаций производится тремя различными способами. Количество попыток также варьируется от 50 до 1000 для выявления закономерностей при анализе больших массивов данных и уточнения программных возможностей при решении прикладных задач. В статье предлагается также практическая реализация двумерной функции плотности вероятности на основе теоретических выкладок и оценка математического ожидания и дисперсии с использованием выборочной функции кросс- и ковариационной функции.

Теория

Непрерывная случайная величина Х имеет нормальный закон распределения с математическим ожиданием E и коэффициентом вариации Var (X) (Х~ЩЕ,<з2)), если плотность распределения описывается выражением [1-4]:

¡х (х) =

1

л/2л

-ехр

(х - Е)2 2а2

и функция распределения:

х 1 X

Fx (х) = [ ¡х (х)йх=-^= Гехр

хе К,

(х - Е)2

2а2

йх.

В случае, когда Х~Щ0, 1), так называемом стандартизированном нормальном распределении, функция распределения принимает вид:

Щх)=тЫ Ч- т ^х.

Колебания параметра относительной частоты события (стат. частность) зависят от соотношения

случайных чисел и количества попыток. Если количество попыток приблизительно равно количеству случайных чисел, то форма относительной частоты события не дает хорошего приближения к плотности распределения. Поэтому удобнее аппроксимировать соответствующую функцию распределения.

Две случайные величины X и 7 называются двумерно нормально или совместно нормально распределенными, если аХ + Ь7 имеет нормальное распределение для всех а, Ье К [2, 3].

Две случайные величины X и 7 имеют стандартное двумерно нормальное распределение с коэффициентом корреляции р, если их совместная плотность распределения определяется как [1-5]:

1x7 (х, У) =-

1

2п^11-р

-ехр

1

2(1-р2)

[х2 - 2рху+у2]

где ре(-1;1).

Если р = 0, то X и 7 имеют стандартное двумерное нормальное распределение.

Кроме того, две случайные величины X и 7 имеют двумерное нормальное распределение с параметрами цх,аХ,Ц7,а^,р, если их совместная плотность распределения определяется как:

¡Х7 (x, У) =- 1

хех

1

2(1-р2)

2лстх а7^ 1-р2 х-ЦхV 0 (х-Цх)(У-Цу) (у-ц|

ах

-2р-

аХ а7

а7

где цх ,ц7 еК, ах ,а7 > 0 и ре(-1;1) — постоянны.

Согласно приведенному выражению, двумерное нормальное распределение было выведено для независимых нормально распределенных случайных величин [6-10]. Другой подход состоит в том, чтобы определить двумерное нормальное распределение с использованием совместной плотности вероятности. Эти два определения математически эквивалентны. В частности, пусть две случайные величины X и 7 имеют двумерное нормальное распределение, т.е. их совместная плотность распределения определяется согласно указанной формуле. Тогда существуют независимые стандартные нормальные случайные величины Zl и Z2, такие, что:

X =а х^ +ц х,

7 = а7 (р^ ^л/!-р2г2)+Ц7.

2

2

В матричной форме это выглядит как:

Ц X =

Zx -

aX

рст X aY

a?

vpCT x CT7

Если коэффициент корреляции p = 0, то случайные величины I и Y полностью не коррелирова-ны, т. е. любая реализация I не связана с Y [5]. В этом случае контур кривых представляет собой окружности. Для коэффициента корреляции p = 0,5, контур кривых имеет эллиптическую форму (рис.1).

При установке p, близкой к 12 (высокая корреляция), реализация I практически определяет реализацию Y. Это означает, что контур кривых уровня приближается к прямой линии. Знак коэффициента корреляции приводит к зеркальной форме кривых на оси у (рис.2).

Практическая реализация

При помощи программы математического моделирования Matlab [6] были сгенерированы 1000 равномерно распределенных случайных чисел на интервале [0, 1]. Числа отображены с использованием инструмента plot Matlab. На рис.3 показаны 1000 реализаций равномерно распределенных случайных чисел на интервале [0, 1] с использованием функции rand с начальным значением 0.

Total number rr'i=1000

Estimated value tor -

О JJ ° ° °

о<? & ° °

ООО

О 10 20 30 äa SO 60 70 MC-run

oo tœ

Рис.3. Программная реализация 1000 равномерно распределенных случайных чисел на интервале [0, 1] (X~R(0, 1))

Следующим шагом был расчет среднего значения, дисперсии и стандартного отклонения этих реализаций тремя различными способами:

1) loop for ... end;

2) функции sum и length;

3) функции mean и cov.

Далее, была написана программа, которая оценивает функцию плотности случайной величины из ряда наблюдений. Эксперимент был проведен для 1000 стандартно нормально распределенных случайных чисел.

Согласно свойству функции плотности вероятности:

x

J fx (x)dx = 1, поскольку Нтх^ш FX (x) =1.

—ад

Площадь под кривой равна 1, поэтому число ni каждой i-й попытки с площадью Axni должно быть нормализовано так, чтобы площадь всех попыток составляла 1 [5-8].

x

Fx (x) = J fx (x)dx,

да

J fx (x)dx=Zi Ax«/!=1=

Z Axn

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, площадь диаграммы с нормированными щ равна 1, потому что:

( \

Лх =1.

Z

. У.ДхЩ

- у

Результаты программной реализации эксперимента показаны на рисунках 4, 5, 6 и 7. Программа математического моделирования позволяет провести эксперимент как для 20 попыток, так и для 200, что, безусловно, имеет положительный эффект на практике для решения прикладных задач. При этом увеличение количества попыток направлено на повышение точности сложных вычислений и уменьшение времени обработки массивов данных.

n

Uniformly distributed numbers

Рис.4. График функции плотности распределения равномерно распределенных величин с учетом 20 попыток

Рис.5. График функции плотности распределения равномерно распределенных величин с учетом 200 попыток

Рис.7. График функции плотности распределения нормально распределенных величин с учетом 200 попыток

Исходя из полученных графиков функции плотности распределения, можно сделать вывод, что теоретические и практические результаты в зависимости от числа экспериментов имеют некоторые флуктуации.

Следующим шагом была генерация двумерного нормального распределения [6, 8-10]. Случайные числа генерируются через х^ = гапйп (1000,2) = (х, у), чтобы получить матрицу с некоррелированными нормально распределенными случайными числами. Добавляем корреляцию путем умножения на мат-

( 1 0,5Л рицу Б = 1 I, так что:

^ 0,5 1 )

( х1 0,5(х1 + у!)

22 = хБ = х2 0,5(х2 + у2)

\х1000 0,5(х1000 + у1000 ))

Числа в матрице х2 разделены на два вектора, включая смещение от ожидаемого значения:

х=х2(:Д)+0,5;

у = 22(:,2)+1,5.

Для этого набора данных была произведена оценка математического ожидания и дисперсии с использованием выборочной функции кросс- и ковариационной функции. Рассчитана двумерная функцию плотности /Х7(ху) с заданными параметрами. Графическое отображение в виде 3D графика приведено на рис.8.

ц =1.4569, =0.50123, я =0.04349,=0.67071, р=0.65£бв

Л

Рис.6. График функции плотности распределения нормально распределенных величин с учетом 20 попыток

Рис.8. Двумерное нормальное распределение

Далее определяем математическое ожидание, дисперсию и коэффициент корреляции. Вычисление

ц X векторов

y, где x = (xb x2, xn)

У = (Уь У2, Уп) и п = 1000 находим через определение ожидаемых значений:

1 п

^х = Щ X Хг,

г

1п

^ = Щ X У

г

Для того чтобы оценить дисперсию:

1 n

a2=n^i Z(x )2,

i

1n

a?=Z( y y)2.

Функция Matlab cov (х,у) возвращает ковариационную матрицу, включающую коэффициент корреляции:

Z=

Pa X aY

Pa X aY

2

Л

c11 c12 c21 c22

P =

C21

Л

c11c22

Заключение

На рис.9 приведено сравнение по времени выполнения расчета среднего числа, дисперсии и стандартного отклонения для 1000 равномерно распределенных случайных чисел.

■ For-loop

1 Sum- and langth-funcllon D MAI ДВ inbuilt functions mean and eov

Standard diviation

Рис.9. Сравнение по времени выполнения расчета параметров

Результаты сравнения показывают, что использование функции суммы и длины — это самый быстрый способ вычислить любое из трех значений. Это утверждение основано на том, что функции sum и length являются встроенными функциями, запрограммированными на оптимизацию по времени выполнения.

Функция cov включает в себя множество определений в отдельных случаях, поэтому время выполнения для дисперсии и стандартного отклонения относительно медленное. Цикл loop for вычисляет

среднее значение немного медленнее, чем функция mean, но быстрее, чем функция cov, вычисляющая дисперсию и стандартное отклонение.

В статье описан программный подход к получению оценки математического ожидания и дисперсии с использованием выборочной кросс- и ковариационной функции. Рассчитана двумерная функция плотности и показано ее графическое изображение в виде 3D графика.

Форма кривых является эллипсом, потому что данные коррелированы. Положительное значение p определяет направление эллипса. Расчетные значения цх и (xY сдвигают функцию плотности в положительном направлении x и у.

1. Pishro-Nik H. Introduction to probability, statistics, and random processes. Kappa research, 2014. 732 p.

2. ГОСТ 11.003-73 (CT СЭВ 546-77) Прикладная статистика. М., 1981. 14 с.

3. ГОСТ P 50779.21-2004 Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. М., 2004. 43 с.

4. Колемаев В.А, Калинина В.Н. Теория вероятностей и математическая статистика: учебник. М.: ИНФРА-М, 1997. 302 с.

5. Koralov L., Sinai Y.A. Theory of probability and random processes. Springer-Verlag Berlin Heidelberg, 2007. 347 p.

6. Chapman S.J. Essentials of Matlab programming. Springer, 2008. 256 p.

7. Leon-Garcia A. Probability, statistics, and random processes for electrical engineering. Pearson Education, 2011. 832 p.

8. Blanchet G., Charbit M. Digital signal and image processing using Matlab. ISTE Ltd, London, 2015. 329 p.

9. Вьюгин В. Математические основы машинного обучения и прогнозирования. М.: МЦНМО, 2014. 304 с.

10. Попов А.М., Сотников В.Н. Теория вероятностей и математическая статистика. 2-е изд., М.: Юрайт, 2020. 434 с.

References

1. Hossein Pishro-Nik. Introduction to probability, statistics, and random processes. Kappa research, 2014. 732 p.

2. GOST 11.003-73 (ST SEV 546-77) Prikladnaya statistika [Applied statistics. Uniformly distributed random numbers].

3. GOST P 50779.21-2004 Statisticheskie metody. Pravila opredeleniya i metody rascheta statisticheskikh kharakteristik po vyborochnym dannym [Statistical methods. Determination rules and methods for calculation of statistical characteristics based on sample data].

4. Kolemaev V.A., Kalinina V.N. Teoriya veroyatnostej i mate-maticheskaya statistika [Probability Theory and Mathematical Statistics: a textbook]. Moscow, INFRA-M Publ., 1997, 302 p.

5. Koralov L., Sinai YA. Theory of probability and random processes. Springer, USA, 2007. 347 p.

6. Chapman S. J. Essentials of Matlab programming. Springer, 2008. 256 p.

7. Leon-Garcia A. Probability, statistics, and random processes for electrical engineering. Pearson Education, 2011. 832 p.

8. Blanchet G., Charbit M. Digital signal and image processing using Matlab. ISTE Ltd, London, 2015. 329 p.

9. V'yugin V. Matematicheskie osnovy mashinnogo obucheniya i prognozirovaniya [Mathematical fundamentals of machine learning and prediction]. Moscow, MTsNMO Publ., 2014. 304 p.

10. Popov A.M., Sotnikov V.N. Teoriya veroyatnostey i mate-maticheskaya statistika [Probability Theory and Mathematical Statistics]. Moscow, Yurayt Publ., 2020. 434 p.

x

и

a

i Надоели баннеры? Вы всегда можете отключить рекламу.