¡Программные средства и информационные технологии
УДК 519.24
МОДЕРНИЗИРОВАННЫЙ МЕТОД СМЕЩЕННЫХ ГИСТОГРАММ ДЛЯ ВОССТАНОВЛЕНИЯ ПЛОТНОСТИ ВЕРОЯТНОСТИ
А. А. Чевер
Сибирский федеральный университет Российская Федерация, 660074, г. Красноярск, ул. Киренского, 26 E-mail: [email protected]
Проведено краткое сравнение восстановления плотности вероятности методом гистограмм и ядерных оценок. Приведён модернизированный метод восстановления плотности вероятности путём осреднения смещенных гистограмм.
Ключевые слова: восстановление плотности вероятности, метод гистограмм, осреднение смещенных гистограмм.
MODERNIZED METHOD OF AVARAGE SHIFTED HISTOGRAMS TO RECOVER
THE PROBABILITY DENSITY
A. A. Chever
Siberian Federal University 26, Kirenskogo Str., Krasnoyarsk, 660074, Russian Federation E-mail: [email protected]
This article compares the recovery of the probability density by the method of histograms and nuclear assessments. We describe a streamlined method of recovering probability density by averaging shifted histograms.
Keywords: restoration of the probability density, the method of histograms, averaged shifted histograms.
В настоящее время существует большое число научно-практических задач, решаемых на основе аэрокосмической информации (обработка данных дистанционного зондирования Земли, прогноз погодных условий, составление геологических картин и т. д.), или задач, связанных с управлением надежностью (оценка сопротивляемости технических устройств, прогнозирование отказов технических изделий, пересчёт характеристик надежности на разные условия испытаний и т. д.).
Принятие решения в таких задачах зачастую осуществляется в условиях неопределенности. Возникает потребность в разработке метода, который позволит извлекать как можно больше полной и полезной информации из любого объема данных.
Важная характеристика случайной величины -функция плотности вероятности. Восстановление плотности вероятности позволяет получить максимальное и надежное описание системы. Таким образом, продолжая работу [1], будем исследовать метод восстановления плотности вероятности и обработку данных с получением максимально достоверных результатов.
Одним из самых распространенных методов восстановления плотности вероятности является метод гистограмм. Несмотря на свою простоту, гистограммы охватывают весь диапазон представления плотностей вероятности. Процедура построения гистограмм достаточно проста: строится сетка ю={х; 1' = 1,2, ..., п},
вертикальные прямоугольники c площадью —где
N
высота прямоугольника Pi = -
N{х, - х, -1)'
Основанием для использования гистограммы рй(х) в качестве оценки неизвестной плотности вероятностей Дх) является кусочно-интегральная сходимость рй(х) к Дх), которая вытекает из того, что относитель-т
ная частота —'- события X е (х, -1, х, ] сходится
N
к его вероятности fi: ^
I f (х)dX.
На качество гистограммы влияют несколько факторов: объем выборки N (объем исходной информации), величина интервалов группировки, точность измерений.
В то же время существует метод ядерных оценок, который, по сравнению с методом гистограмм, даёт наиболее точные результаты. При этом к получившейся функции плотности восстановления необязательно применять метод сглаживания полученных результатов. Однако метод ядерных оценок сложен в своей реализации. Ниже представлена формула процедуры оценки функции в одной точке
л{х )=п^ Рг х - х
m
m
X
i-1
<Тешетневс^ие чтения. 2016
где К - ядро; х - последовательность, длиной п; к - шаг [2-5].
В работе [6] представлен метод осреднения смещенных гистограмм. Смысл метода заключается в том, что начальная точка х0 сетки выбирается равномерно из некоторого отрезка [а0,ах] т число раз.
Соответственно для каждой сетки ак строится своя гистограмма Нк , к = 1, ..., т . Гистограмма Нк характеризуется своей сеткой
ик = {хк = х0 +1к 11 = 0,...,п} и принимает на каждом отрезке [ хк_1, хк] постоянное значение рк. В качестве приближения для функции плотности вероятности / (х) строится функция
т
/ (х) = 1/ т£ Нк (х).
к=1
Метод осреднения смещенных гистограмм показал хорошие результаты, сравнимые с методом ядерных оценок.
В данной работе рассмотрен модернизированный метод смещенных гистограмм. Аналогично методу осреднения смещенных гистограмм строится т гистограмм Нк , к = 1,...,т . По гистограммам Нк строится множество точек
Z = {(рк, хк _ к / 2), I = 1,..., п;к = 1,..., т} .
Для восстановления значения / т( х) используется
метод скользящего среднего.
В качестве численного примера рассмотрено восстановление функции плотности вероятности /(х) суммы четырех равномерных на [0,1] случайных величин. При этом к = 0,1, п = 40, т = 20. На рис. 1 приведен результат работы алгоритма: / (х) - сплошная линия, точками показано множество Z . На рис. 2 представлены сглаженные значения / .
Рис. 1. Множество Z
Рис. 2. Сглаженные значения ?
т
В дальнейшем планируется рассмотреть оптимизацию выбора параметра к при построении гистограмм.
Библиографические ссылки
1. Чевер А. А. Подходы к обработке экспериментальных данных в условиях ограниченной информации // Научные исследования и разработки молодых ученых. 2015. Вып. 7. C. 136.
2. Попова О. А. Технология извлечения и визуализации знаний на основе численного вероятностного анализа неопределенных данных // Информатизация и связь. 2013. № 2. С. 63-66.
3. Uglev V. A., Popova O. A., Dobronets B. S. The accuracy calculation control of reliability indices for equipment responsible appointment // International Siberian Conference on Control and Communications, SIBCON-2015. 2015. С. 7147248.
4. Dobronets B., Popova O. Numerical probabilistic approach for data nonparametric analysis // Applied methods of statistical analysis. Nonparametric approach. Proceedings of the international workshop, 2015. С. 376-384.
5. Popova O. A. Optimization problems with random data // Журнал Сибирского федерального университета. Сер. «Математика и физика». 2013. Т. 6, № 4. С. 506-515.
6. Scott R. W. Multivariate density estimation: theory, practice, and visualization. John Wiley & Sons, 2015. 381 p.
References
1. Chever A. A. Approaches to the processing of the experimental data in conditions of limited information // Scientific research and development young scientists, 2015, № 7, p. 136.
2. Popova O. A. The technology of the extraction and visualization of knowledge on the basis of numerical probabilistic analysis of uncertain data // Informatization and communication. 2013, № 2, pр. 63-66.
3. Uglev V. A., Popova O. A., Dobronets B. S. The accuracy calculation control of reliability indices for equipment responsible appointment // 2015 International Siberian Conference on Control and Communications, SIBCON 2015. Proceedings 2015, р. 7147248.
4. Dobronets B., Popova O. Numerical probabilistic approach for data nonparametric analysis // Applied methods of statistical analysis. nonparametric approach proceedings of the international workshop. 2015. С. 376-384.
5. Popova O. A. Optimization problems with random data // The journal of Siberian Federal University. Series: Mathematics and physics. 2013. Т. 6, № 4. С. 506-515.
6. Scott R. W. Multivariate density estimation: theory, practice, and visualization. John Wiley & Sons. 2015. 381 p.
© Чевер А. А., 2016