Научная статья на тему 'Обзор методов восстановления функции плотности вероятности'

Обзор методов восстановления функции плотности вероятности Текст научной статьи по специальности «Математика»

CC BY
400
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА / ФУНКЦИЯ ПЛОТНОСТИ ВЕРОЯТНОСТИ / ГИСТОГРАММА / ПРОЕКЦИОННАЯ ОЦЕНКА / ОЦЕНКА РОЗЕНБЛАТТА-ПАРЗЕНА / NONPARAMETRIC STATISTICS / PROBABILITY DENSITY FUNCTION / HISTOGRAM / PROJECTIVE ESTIMATES / ROSENBLATT-PARZEN ESTIMATE

Аннотация научной статьи по математике, автор научной работы — Браништи В. В.

Рассматриваются распространённые методы восстановления функции плотности вероятности: гистограмма, проекционная оценка и оценка Розенблатта-Парзена. Указываются преимущества и недостатки каждого из подходов, а также рассматриваются различные критерии качества оценивания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REVIEWING METHODS TO RECOVER PROBABILITY DENSITY FUNCTION

The paper describes the well known methods of probability density function recovery: histogram, projection estimate and Rosenblatt-Parzen estimate. We show advantages and disadvantages for every approach and consider different criteria of estimation quality.

Текст научной работы на тему «Обзор методов восстановления функции плотности вероятности»

Решетневские чтения. 2017

УДК 519.2

ОБЗОР МЕТОДОВ ВОССТАНОВЛЕНИЯ ФУНКЦИИ ПЛОТНОСТИ ВЕРОЯТНОСТИ

В. В. Браништи

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Рассматриваются распространённые методы восстановления функции плотности вероятности: гистограмма, проекционная оценка и оценка Розенблатта-Парзена. Указываются преимущества и недостатки каждого из подходов, а также рассматриваются различные критерии качества оценивания.

Ключевые слова: непараметрическая статистика, функция плотности вероятности, гистограмма, проекционная оценка, оценка Розенблатта-Парзена.

REVIEWING METHODS TO RECOVER PROBABILITY DENSITY FUNCTION

V. V. Branishti

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

The paper describes the well known methods of probability density function recovery: histogram, projection estimate and Rosenblatt-Parzen estimate. We show advantages and disadvantages for every approach and consider different criteria of estimation quality.

Keywords: nonparametric statistics, probability density function, histogram, projective estimates, Rosenblatt-Parzen estimate.

Введение. Оценивание функции плотности вероятности случайной величины является одной из основных задач в математической статистике [1]. Алгоритмы восстановления неизвестной плотности вероятности используются в системах поддержки принятия решений, а также при построении систем автоматического управления и алгоритмов идентификации технических систем, в том числе, в аэрокосмической отрасли.

Перспективным направлением решения данной задачи являются непараметрические методы оценивания, к которым относятся гистограммные оценки, проекционная оценка [2; 3] и оценка Розенблатта-Парзена [4].

В настоящей работе предлагается введение некоторой обобщённой оценки функции плотности вероятности, частными случаями которой являются все три указанных метода восстановления. Далее рассматривается метод сравнения качества оценок в условиях конечных выборок.

Обобщённая оценка плотности вероятности. В работе [5] предложена обобщённая оценка функции плотности вероятности непрерывной случайной величины ^ в виде суммы 5-образных функций:

1 п

д х)=-&(х, х,.), п ы

где х1, ..., хп - независимая выборка исследуемой случайной величины 4, 5п(х, х,) - последовательность

5-образных функций, сходящаяся к 5-функции Дирака 5(х - х) в смысле сходимости обобщённых функций [6, с. 222]. Там же показано, что гистограмма, проекционная оценка и оценка Розенблатта-Парзена являются частными случаями предложенной обобщённой оценки при определённом выборе последовательности 5-образных функций.

Методика сравнения оценок. В ряде работ (например, в [1; 7]) приводятся асимптотические соотношения для оценок плотности вероятности, т.е. при неограниченном увеличении выборки исследуемой случайной величины. Однако с практической точки зрения более важным является сравнение качества оценок в условиях выборки конечного объёма п.

Для сравнения качества оценивания в работе [7] вводится усреднённая глобальная квадратичная ошибка аппроксимации:

(1)

Q {M ¥ - f\

и относительная глобальная ошибка аппроксимации

'2=сгм ^ -71

где 7 - истинная плотность вероятности; / - её оценка, ц.ц - норма в пространстве Ь2.

Так как теоретический расчёт данных функционалов затруднён даже для модельных распределений, то

Математические методы моделирования, управления и анализа данных

предлагается их значения находить методом Монте-Карло. Пусть численный эксперимент проведён N раз

и получена выборка ^^ значений z = ||/ - /|| . Тогда

значение (1) приближённо рассчитывается следующим образом [8]:

е {)■

где

- 1

Z =-Y Nil

1 N 2

—Ziz -Z) .

N-1 ' '

Выводы. Сравнение рассматриваемых методов восстановления плотности вероятности проводилось на тестовых законах распределения, различающихся по ряду критериев: непрерывность, гладкость, симметричность, финитность и др. Как показало сравнение, качество проекционной оценки существенно зависит от наличия разрывов истинной плотности, тогда как для оценки Розенблатта-Парзена это не было существенным. В целом, оценка Розенблатта-Парзена показала лучшую аппроксимацию в широком классе распределений. Оценка в виде гистограммы показала меньшую скорость сходимости по сравнению с остальными рассмотренными непараметрическими оценками.

Библиографические ссылки

1. Деврой Л., Дьёрфи Л. Непараметрическое оценивание плотности. ^-подход. М. : Мир, 1988. 408 с.

2. Браништи В. В. Введение пространства L2,w при построении проекционной оценки плотности вероятности // Вестник СибГАУ. 2016. Том 17, № 1. С. 19-26.

3. Браништи В. В. Построение проекционных оценок для плотностей вероятности с неинтегрируемым квадратом // Решетневские чтения : материалы XX Междунар. науч. конф. (09-12 ноября 2016, г. Красноярск) : в 2 ч. / под общ. ред. Ю. Ю. Логинова ; Сиб. гос. аэрокосмич. ун-т. Красноярск, 2016. Ч. 2. С. 96-98.

4. Parzen E. On estimation of a probability density function and mode // The Annals of Mathematical Statistics, 1962. Vol. 35, 3. P. 1065-1076.

5. Браништи В. В. Построение оценок плотности вероятности в виде суммы дельтаобразных функций //

Национальная ассоциация ученых. 2015. № 4 (9), ч. 7. С. 10-13.

6. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. 7-е изд. М. : Физматлит, 2004. 572 с.

7. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятностей и ее применения, 1969. Т. 14, вып. 1. С. 156-161.

8. Браништи В. В. О параметрическом оценивании функции плотности вероятности // Научно-технический вестник Поволжья. 2014. № 1. С. 13-16.

References

1. Devroye L., Gyorfi L. Nonparametric density estimation. The Li view. John Wiley & Sons, 1985. 367 p.

2. Branishti V. V. Introducing the L2,w space for building the projective estimation of probability density function // Vestnik SibSAU. 2016. Vol. 17, No. 1. P. 1926. (In Russ.)

3. Branishti V. V. Construction of projective estimates for non square-integrable probability densities // Materialy XX Mezhdunar. nauch. konf. "Reshetnevskie chteniya" [Materials XX Intern. Scientific. Conf "Reshetnev reading"]. Krasnoyarsk, 2016. Vol. 2. P. 96-98. (In Russ.)

4. Parzen E. On estimation of a probability density function and mode // The Annals of Mathematical Statistics. 1962. Vol. 35, 3. P. 1065-1076.

5. Branishti V. Building a probability density estimations by sum of delta-shaped functions // Natsional'naya assotsiatsiya uchenyh. 2015. № 4 (9), Vol. 7. P. 10-13.

6. Kolmogorov A. N., Fomin S. V. Elementy teorii funktsiy i funktsional'nogo analiza [Elements of theory of functions and functional analysis]. M. : Fizmatlit Publ., 2004. 572 p. (In Russ.)

7. Epanecnikov V. A. Nonparametric estimation of a multidimensional probability density // Teoriya veroyatnostey i ee primeneniya, 1969. Vol. 14, Iss. 1. P. 156-161. (In Russ.)

8. Branishti V. V. [On parametric estimation of probability density function] // Nauchno-tekhnicheskiy vestnik Povolzh'ya. 2014. № 1. P. 13-16. (In Russ.)

© Браништи В. В., 2017

z. , s„ =

i Надоели баннеры? Вы всегда можете отключить рекламу.