ПРИМЕНЕНИЕ ГИСТОГРАММ ВТОРОГО ПОРЯДКА ДЛЯ ОБРАБОТКИ И МОДЕЛИРОВАНИЯ НЕОПРЕДЕЛЕННЫХ ДАННЫХ
© Брюханов О.В.*
Институт космических и информационных технологий Сибирского федерального университета, г. Красноярск
Рассматриваются возможности применения ЧВА в случае, когда экспериментальные данные содержат эпистемическую неопределенность, а вероятностные оценки изучаемых параметров носят неопределенный характер. Для обработки и численного моделирования предлагается использовать гистограммы второго порядка. Рассматриваются области применения данного подхода и численные примеры.
Ключевые слова численный вероятностный анализ, гистограммы второго порядка, неопределенные данные.
Изучение любых сложных систем представляет собой трудную задачу, так как некоторые показатели в сложных системах зависят от условий окружающей среды, то есть показатели системы имеют случайный, неопределенный характер, так же показатели могут включать в себя параметры, которые так же имеют случайную, неопределенную природу. Так же мы можем лишь предполагать, какой закон распределения имеет измеряемая величина.
Неопределенная природа показателей и параметров, от которых зависят эти показатели, в итоге повышают сложность анализа таких систем.
Одним из типов неопределенностей является, так называемая, эписте-мическая неопределенность, которая обусловлена недостатком знаний о системе и характеризуется неопределенностью самих вероятностных оценок. Эпистемическая неопределенность прямо связана с объемом и достоверностью информации, на основании которой получаются эти оценки. Она характеризуется состоянием отсутствия знаний об изучаемом объекте, о предыстории рассматриваемого процесса, невозможностью использовать повторные выборки. Альтернативная терминология для эпистемической неопределенности включает такие понятия, как «субъективная» неопределенность, неопределенность знаний. Обработка данных, численное моделирование и анализ результатов в условиях такого типа неопределенности требует применения новых подходов и методов.
Одним из новых подходов для решения указанных проблем является численный вероятностный анализ (ЧВА). Предметом ЧВА является решение различных задач со стохастическими неопределенностями в данных с использованием численных операций над плотностями вероятностей слу-
Магистрант кафедры Системы искусственного интеллекта.
Технические науки
85
чайных величин и функций со случайными аргументами. Для этого предлагается разнообразный инструментарий, включающий такие понятия, как гистограммная арифметика, вероятностные, естественные и гистограммные расширения, гистограммы второго порядка [1, 2, 3].
ЧВА представляет собой непараметрический подход и может успешно применяться для вероятностного описания систем в рамках визуальноинтерактивного моделирования, повышая тем самым качество исследования систем [4, 5, 6].
Рассмотрим возможности применения ЧВА в случае эпистемической неопределенности, когда вероятностные оценки носят неопределенный характер. В работе [2] приводится пример эпистемической неопределенности, когда рассматривается показатель S, представляющий собой случайную величину St, с треугольным распределением Pt на отрезке [0, 1]. Данное распределение имеет высоту h = 2 и вершину в некоторой точке, (t, 2), где t -случайная величина с треугольным распределением на отрезке [0.25, 0.75] с вершиной (0.5, 4).
Подобные задачи достаточно часто встречаются на практике. Например, в экономике, где мы имеем дело с высоким уровнем рыночной неопределенности, и стандартная финансовая модель не учитывает вероятностную природу характеристик оцениваемых показателей и соответственно не может дать достаточных оснований для построения гарантированных оценок рассматриваемых показателей и соответственно принятия решений с учетом возможных рисков [4, 7].
Приведем один из самых очевидных примеров подобной ситуации, когда прибыль носит случайный характер и зависит от спроса на товары или услуги, которые в свою очередь суть случайные величины, зависящие от некоторых неопределенных параметров.
В рамках ЧВА для обработки и численного моделирования неопределенных данных разработан подход, использующий понятие «гистограммы второго порядка (ГВП)». ГВП представляют собой гистограммы, каждый столбец которых есть гистограмма [3, 4].
Рассмотрим процедуру построения ГВП. Пусть мы имеем ряд гистограмм {Yi, i = 1, 2, ..., N}. Каждой Yi поставим в соответствие вероятность Pi- Z Pi = 1. Для простоты будем считать, что все гистограммы Yi заданы на сетке {z„ i = 0, 1, ..., n} и на отрезке [zk-1, zk] Y принимает значение Yik. Таким образом, на каждом отрезке [zk-1, zk] имеем случайную величину Yk принимающую значения Yik с вероятностью pi. Используя эти значения, мы можем на каждом отрезке [zk-1, zk] восстановить гистограмму Pzk.
Для осуществления численных операций над «неопределенными» переменными, заданными своими функциями плотности в виде гистограмм второго порядка, в условиях неопределенности, разработана арифметика, которая позволяет выполнять численные операции над сложными показате-
86
НАУЧНЫЕ ИССЛЕДОВАНИЯ И РАЗРАБОТКИ МОЛОДЫХ УЧЕНЫХ
лями, требующими сложных вычислений в условиях присутствия эписте-мической неопределенности.
Анализ публикаций и численные примеры [6, 8] показывают возможность использования гистограмм второго порядка для представления различных типов информационной неопределенности и позволяют проводить численное моделирование для различных задач.
Рассмотрим численный пример построения гистограммы второго порядка. Предположим у нас есть некоторая случайная величина X, имеющая плотность вероятности p(x). Предположим, что мы имеем возможность получать выборки этой случайной величины (хь ..., xn). По выборке (хь ..., xn) построим гистограмму k1 и повторим эту процедуру N раз. В результате получаем набор гистограмм k, i = 1, ..., N. По этим гистограммам, следуя представленному выше алгоритму, построим гистограмму второго порядка.
/ \
Рис. 1. Гистограмма второго порядка H
На рис. 1 приведена гистограмма второго порядка H, построенная по выборкам, полученным из треугольного распределения c носителем [0,2] и вершиной в точке (1, 1). Размерность выборок была взята равной 5000, размерность сетки гистограммы второго - 100 и число гистограмм ki - N=100. Каждый к-й столбец построенной гистограммы второго порядка H представляет собой некоторую гистограмму gk. Следуя [9] получаем, что гистограмма
gk аппроксимирует биноминальный закон B(n, pk), где pk = [ k p(x)dx. Гис-
Jxk-1
тограмма gk имеет математическое ожидание рк и дисперсию
Pk (1~ Pk )
nh2
Гистограммы второго порядка представляют собой эффективный способ анализа и обработки информации в условиях неопределенности. Они могут успешно применяться в задачах оценки показателей надежности и оценки безотказной работы сложных технических систем, для изучения гидрологических, транспортных и других объектов.
Список литературы:
1. Добронец Б.С., Попова О.А. Элементы численного вероятностного анализа // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. - 2012. - № 2 (42). - С. 19-23.
Технические науки
87
2. Добронец Б.С., Попова О.А. Численный вероятностный анализ для исследования систем в условиях неопределенности // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. - 2012. - № 4 (21). - С. 39-46.
3. Добронец Б.С., Попова О.А. Численный вероятностный анализ неопределенных данных: монография. Сибирский федеральный университет, Институт космический и информационных технологий. - Красноярск, 2014. -167 с.
4. Добронец Б.С., Попова О.А. Представление и обработка неопределенности на основе гистограммных функций распределения и P-Boxes // Информатизация и связь. - 2014. - № 2. - С. 23-26.
5. Добронец Б.С., Попова О.А. Гистограммный подход к представлению и обработке данных космического и наземного мониторинга // Известия ЮФУ Технические науки. - 2014. - № 6 (155). - С. 14-22.
6. Попова О.А. Гистограммный информационно-аналитический подход к представлению и прогнозированию временных рядов // Информатизация и связь. - 2014. - № 2. - С. 43-47.
7. Попова О.А. Численный вероятностный анализ для агрегации, регрессионного моделирования и анализа данных // Информатизация и связь. -2015. - № 1. - С. 15-21.
8. Dobronets B.S., Krantsevich A.M., Krantsevich N.M. Software implementation of numerical operations on random variables // Журнал Сибирского федерального университета. Серия: Математика и физика. - 2013. - Т 6. № 2. -С. 168-173.
9. Scott R.W. Multivariate density estimation: theory, practice, and visualization. - John Wiley & Sons, 2015. - 381 p.
ПРИМЕНЕНИЕ ЧИСЛЕННОГО ВЕРОЯТНОСТНОГО АНАЛИЗА ДЛЯ ОЦЕНКИ РИСКОВ ИНВЕСТИЦИОННОГО ПРОЕКТА
© Велиходский А.С.*, Минин А.С.
Институт космических и информационных технологий Сибирского федерального университета, г. Красноярск
В работе рассмотрено использование аппарата численного вероятностного анализа для оценки рисков инвестиционных проектов.
Ключевые слова численный вероятностный анализ, инвестиционные проекты, оценки рисков.
Магистрант I курса.