Доклады БГУИР
2014 № 8 (86)
УДК 519.2:005
ИНФОРМАЦИОННАЯ ПРОГНОЗИРУЕМОСТЬ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ В ДИСКРЕТНОМ ВРЕМЕНИ
А.В. ОВСЯННИКОВ, В.М. КОЗЕЛ
Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь
Белорусский государственный университет пр. Независимости, 4, Минск, 220030, Беларусь
Поступила в редакцию 4 июня 2014
Приведено определение одношаговой информационной прогнозируемости стохастического процесса в дискретном времени. Исследовано влияние накопления данных о процессе на его информационную прогнозируемость. Получены соотношения, связывающие прогнозируемость процесса в целом с прогнозируемостью его отдельных параметров. Приведены примеры определения информационной прогнозируемости для процессов, описываемых линейными разностными схемами.
Ключевые слова: прогнозируемость, стохастический процесс, оптимальная разностная схема, одношаговая плотность перехода, одношаговая информационная прогнозируемость.
Введение
Решение теоретических и прикладных задач прогнозирования, множество методов, методик и подходов к их реализации зачастую оставляет без внимания вопрос о самом понятии прогнозируемости исследуемого процесса или системы. В данном случае под прогнозируемостью понимается функция, количественно характеризующая возможные знания об исследуемом явлении (процессе или системе) в любые будущие моменты времени. Такая функция, очевидно, должна являться функцией времени. В то же время, в обширной литературе по прогнозированию отсутствует единое понимание того, что следует рассматривать под прогнозируемостью. Во многом такое положение связано с различием областей применения и разнообразием методов прогноза. Так, во-первых, исторически прогнозируемость связывалась со скоростью потери информации о состоянии исследуемой системы с течением времени [1,2] (энтропия Колмогорова); во-вторых, с позиций теории случайных процессов, в стационарном случае, возможности прогнозирования связывают с исследованием корреляционно-спектральных характеристик процессов, в частности с интервалом корреляции; в-третьих, теория оценивания, фильтрации, управления предполагает построение алгоритмов обработки, включающих элементы прогноза и коррекции. В связи с этим, предложенное в работе [3] определение информационной прогнозируемости в непрерывном времени, базирующееся на обобщении информации Фишера на случай нестационарных плотностей вероятности, может оказаться интересным с теоретической и практической точки зрения, позволяющим с единых позиций, однозначно трактовать это понятие.
В данной работе, предложенный в статье [3], подход к определению информационной прогнозируемости распространен на стохастические процессы в дискретном времени, представленные соответствующими оптимальными разностными схемами или одношаговыми плотностями перехода. Зависимость одношаговой информационной прогнозируемости от шага дискретизации и текущего момента времени позволяет расширить классификацию стохастических процессов, учитывая «хорошо» и «плохо» прогнозируемые. Количественная
мера информационной прогнозируемости позволяет также оценить адекватную поставленной задаче величину горизонта прогноза применяемой прогностической модели. Особый интерес, в этом случае, представляет исследование информационной прогнозируемости с учетом эффекта накопления данных о процессе.
Цель работы - дать определение одношаговой информационной прогнозируемости стохастического процесса и его параметров в дискретном времени, установить основные соотношения, связывающие прогнозируемость параметров с прогнозируемостью стохастического процесса в целом, а также на примере процессов, представленных оптимальными линейными разностными схемами, получить выражения информационной прогнозируемости, учитывающие эффект накопления данных.
Одношаговая информационная прогнозируемость марковского процесса
Рассмотрим задачу прогнозируемости стохастического процесса в дискретном времени в условиях регулярного статистического эксперимента. Пусть имеется наблюдаемая последовательность ,..., и соответствующая многомерная плотность вероятности
Р = Р(Е | X), где X = [Xq } , q = 1, l - набор параметров плотности.
В непрерывном времени модель процесса представляется стохастическим дифференциальным уравнением (СДУ) 4(0 + = &(0С(0 > гДе g(0 ~ известные
детерминированные функции удовлетворяющие условию Липшица, C,(t) - нормальный белый
шум с нулевым средним (С(0) = 0 и дельтообразной корреляционной функцией (C,(ty^(t) = N5(t'—t)/2, N - односторонняя спектральная плотность. Оптимальная разностная схема, при понимании СДУ в форме Ито, имеет вид [4]
^ = , —Да, +ДйСг, (1)
где Д = — ti малый интервал времени, на котором слева и справа интегрируется СДУ,
а = a(t,) , (1/ А)|^ +A^(t)dt, b(t,) = Hm(N /2Д)|^'+Дg2(x)dx - коэффициент диффузии (в
случае g = const этот коэффициент равен b = Ng2/2), М^ = ,—Да - математическое ожидание, D = b(ti )Д - дисперсия. Глобальная среднеквадратическая погрешность разностной
(еТ \ 1/2
J о М [(0=g(t))2 ]dt I , T = кД. В дальнейшем, там
где это не вызывает сомнений, зависимость функций от аргументов опускается.
Одношаговая плотность перехода (ОПП) марковского процесса (1) имеет вид
П+и = exp{—(2D,-)—11>+1 — Мц]2}/^ . (2)
Введем следующее определение.
Определение 1. Одношаговая информационная прогнозируемость по Фишеру вектора параметров X марковского процесса определяется матрицей
IPx(t,) = /(Эlnя,+и /ЭХ)(Эln^.+1, / ЭХ)Л =
,(3)
= Ц ^(Эlnп+1,,. /ЭХ)(Эlnп+1,,. /ЭХ)T,,1+1)d,id,+1, t, >0,
представляющей собой информационную матрицу Фишера [5], зависящую от момента времени t, при выполнении условий регулярности для яг+1 г.
В частном случае одномерного параметрического множества, информационная прогнозируемость параметра X представляется функцией информационного количества
Фишера, зависящего от параметра ^ : 1РХ ) = у(д 1пц+и / дХ) ) . Очевидно также, что если
/(д 1п / дХр )(д 1п / дХд )\ = 0, где р Ф ц и р, д = 1,1, то матрица ) имеет
диагональный вид.
Определение 2. Одношаговая информационная прогнозируемость марковского процесса 4 по Фишеру в целом есть неотрицательная функция
1Р (и ) = ((д 1пя,.+1, / д, )2}^ , Г,. > 0. (4)
Установим связь между одношаговой информационной прогнозируемостью по параметрам 1РХ (^) и информационной прогнозируемостью марковского процесса в целом 1р (и ) . Эта связь определяется следующими выражениями:
ЩО={{д \пп1+и / дф\пп1+и/а,))^ =([хт (д\пп1+и /ау)][(51пЯ(+ц/дх)Т =
= Хт((д1ппМ1 1дХ)(д\пкг+и1дХ)Ту^ Х = Х1Рхи)Х
Таким образом, с учетом условия /(д 1п/ дХр)(д 1п / дХд )\ = 0, р Ф ц, р, д = 1,1 получаем уравнение взаимосвязи
ЩО = ^1РХд№2д. (5)
Вклад (степень влияния) отдельных параметров ОПП в информационную прогнозируемость процесса в целом Щможно оценить коэффициентом влияния
уЛ0=1Рха)х2ч/^РЛ0х2ч , д=й.
■ 9
д
/Рх С,-) =
В характерном частном случае, когда имеем двухпараметрическую ОПП X = [М^,^ ] получаем
~!Рм (',■) 0 " _ 0 1РВ )_
В матрице одношаговая информационная прогнозируемость математического ожидания и дисперсии соответственно равны
Р(и) = Щ, ^(и) = 0,5^42,Р(и) = 0,5/Рм(и,)2. (6)
С учетом формулы (5) одношаговая информационная прогнозируемость марковского процесса (2) в целом имеет вид
1Р
(О=Щ/В^+0,5[^1/В^]2=М2/Ь1+0,5[б1/Ь1]2, а,=а(Ш, />,=/>(/,). (7)
Из выражения (7) видно, что одношаговая информационная прогнозируемость отдельных параметров ОПП и процесса в целом полностью определяется параметрами оптимальной разностной схемы (1). При достаточно малых величинах А—>0 получаем
Для формирования ОПП может быть предложен более общий подход - конструктивное формирование ОПП с формальной заменой в одномерной плотности Р(41X) переменных
4 —> 4г+1 _Мщ и ^ —^, требуя при этом сохранения условий нормировки. Строго говоря,
полученная таким образом конструкция ОПП, как и в случае априорного выбора функции ядра в методах непараметрической оценки плотости, в общем случае, не является физически
обоснованной или математически доказанной. Однако сконструированные таким образом ОПП являются удобными аналитическими моделями с физически понятными при их использовании результатами. В качестве такой конструкции удобно использовать следующую:
ж1+и = с:1ехр(-Д+1,), л = Р(9о), (8)
где БМ1 = В[9м -М., О., X, ] - семейство параметрических функций, X = ) - значение параметра ОПП в 7-тый момент времени, с - параметры нормировки (в общем случае С = с( Xi)). Так, в частности, при решении практических задач нашли применение модели, совпадающие по форме с обобщенно-нормальным распределением следующего вида:
я,.+1, = В(т)ехр(-Л(т) (|9+1 - ), т > 0,5, (9)
где Л(т) = (Г(3/ т)Г-1(1/ т))"'2, В(т) = Л(т)ут /(2Л/Д~Г(1 +1/ т), Г - гамма-функция.
Наиболее часто такие модели используются с параметром т е{0,5;1;2} . Например, для т = 1 прогнозируемость по параметрам ОПП следующая:
1РМ (г,) = 2/О, /Рв (г,) = 0,25Д-2, /Рв (г,) = 1РМ (г, )2/16, (10)
а для т = 2у, V = 1,2,..., соответственно, получаем
Р0,) = т2^V-1'т^ , Р(г,) = 0,25тО-2. (,1)
Ог^(1/ т) 9
Информационная прогнозируемость стохастических процессов представленных оптимальными линейными разностными схемами
В теоретическом аспекте представляет интерес исследование и анализ различных моделей оптимальных разностных схем с точки зрения возможности прогнозирования процессов, которые могут быть описаны этими моделями.
Рассмотрим примеры, поясняющие смысл определенных величин одношаговой информационной прогнозируемости. Для процесса, описываемого линейной разностной схемой с переменными параметрами
9,+1 =9, -Д|9 , I = |(г,), g¡ = ), (12)
математическое ожидание и дисперсия определяются выражениями: Мц =9 г [1 - Д|],
О = )Д.
В табл. 1 приведены параметры разностных схем, параметры ОПП и одношаговая информационная прогнозируемость двух процессов - чисто диффузионного (столбец №1) и гауссовского (столбец №2). В табл. 1, в условиях малых Д<<1, введены обозначения г = 1 - Д|« е~|Д, а2 = ^2 / 4|. Результаты, представленные в табл. 1, позволяют заметить, что для диффузионного и гауссовского процессов прогнозируемость в целом (5), (7) равна нулю, в то время как одношаговая информационная прогнозируемость отдельных параметров есть фиксированная величина, зависящая только от шага дискретизации А: 1Ри (г) = а-2(1 - г2)-1, /Рв (г ) = 0,5а-4(1 - г2)-2. При этом с увеличением интервала дискретизации Нш/Рм (г,) = Нш2(Л£2Д)-1 = 0, Нш 1Ро (г,) = 0.
Д^вд Д^вд Д^вд
Полученный результат одношаговой информационной прогнозируемости для моделей с разностными схемами № 1, № 2 (табл. 1) полностью согласуется с теоретическими представлениями.
Разностная схема № 1 № 2
Параметры разностной схемы Ц, = 0, g, = g h = h g = g
Параметры Mi 4, i[l -Ah], ri при A<<1
ОПП Di Ng2 A /2 Ng 2A /2, ст2(1 - r2) при A<<1
IPM t) 2(Ng 2A)-1 2(Ng2 A)-1, a-2(1- r2)-1 при A<<1
IPd (t) 2(Ng 2A)-2 2(Ng2 A)-2, 0,5a-4(1 - r2)-2 при A<<1
Рассмотрим прогнозируемость марковских процессов, описываемых оптимальными разностными схемами с более сложными функциями ц,=ц(ti) и gi=g (ti) (табл. 2). Такого рода разностные схемы могут быть использованы для описания в дискретном времени процессов с медленными нестационарными изменениями, процессов установления, процессов ухода из контрольной зоны, процессов, описывающих метрологические характеристики аппаратно-технических средств в теории надежности.
В табл. 2 приведены параметры трех оптимальных разностных схем и соответствующие им параметры ОПП, позволяющие определить одношаговую информационную прогнозируемость как по параметрам (3), так и по процессу в целом (4), (5).
Таблица 2. Информационная прогнозируемость марковских процессов, описываемых разностными схемами
со сложными функциями и g(ti)
№ Параметры разностной схемы Параметры ОПП
1 ц(?,.) = М, g(t¡) = >/Х=о8^ = 2hAlL atf Mr. =i[l-Ah], a^ = Ngk /4ц
2 ^) = Х=с ^> 8(', ) = 8, D = Ng2A /2, D = a2(1 - r2) при A<<1 Mi = i[l-ASLhktf ], a2 = Ng2 /4ц
3 = ХК=о ^, 8('>) = № 8£ Di = 2hAXL atf M, = i [l - AXK=0 Ц^ ], a2 = Ngk / 4ц
4 *('., ) = Х"с ^, 8(', ) =№. 8^4 D = 2ЦД1К=0 aktk, ak = Ngk /4ц M-=i-AZL hkifik
Поскольку в реальных задачах прогнозирования информация о процессе последовательно накапливается, представляет интерес получение зависимости величины информационной прогнозируемости от объема накопленных данных. Пусть накопленная информация о процессе на интервале времени ; ^ ] содержится в векторе данных ,..., . Тогда в скалярном случае на основании (3) можно записать ¡Ркх (гк) = 1пр / дХ)2 раЕ.
Представим входящие в формулу компоненты в виде
1п Рн П+и '
81п Я 12 (^ к-1 8 1п ^Л^ „ к/81п пшЛ2 к-1 8 1п 1п п
дХ
!=0 8Х ^¿=0 XV ^¿=0 ^
дХ
+ к-1 81п П+1' 81п п+и
г=0^ ]=г+1 8Х 8Х.
' У
Для иллюстрации эффекта накопления ограничимся случаем информационной прогнозируемости математического ожидания и параметра масштаба, т.е. X = [М^,^ ]. На основании общей формулы (8) получаем
я*«к)=Е-1 нр^ 1" ль, ^ЖА«.
Например, для ОПП (2), на основании последней формулы, информационная прогнозируемость на момент времени с учетом накопления определяется выражениями:
^ркм &+г)=х:=1 п-,+г,
к
'В \1к+г у
1Ркв «к+г) = 0,5^ В,2+г, Г =0,1,... .
В табл. 3 представлены зависимости информационной прогнозируемости от величины к и г, определенные для разностного уравнения Ь,+1 = (1 - Ац, + ^ёг+ёЖ^н . Здесь величина дисперсии В = %)А = ^ + , ^ = —А^ /2, ^ = /А, V = 1,2. В табл. 3 обозначено
Ч (У) = ^(й)(У), = Г'Су)/Г(У) , 5 = 4/ ¿2А.
На рисунке представлена зависимость нормированной величины информационной прогнозируемости математического ожидания ^к^ (^ ) = ^^ (^ 5-1 процесса, заданного разностной схемой (табл. 3, строка № 2) от величины ¿г при А = 1. Зависимости, приведенные на рисунке, наглядно демонстрируют влияние накопления данных о процессе на его информационную прогнозируемость. С увеличением количества накопленных данных растет и прогнозируемость параметров и самого процесса в целом.
В заключении отметим еще одно важное практическое приложение - генерация на основе оптимальных разностных схем последовательностей с заданными свойствами информационной прогнозируемости. Так, на примере формул (1), (6), (7), (10)-(12), табл. 1 и 2 видно, что определяющими информационную прогнозируемость величинами являются параметры масштаба ^ и сдвига ^^, которые, в свою очередь, связаны с диффузией Ь(^ ) и
сносом a(ti,Ь ) . Поэтому, задаваясь желаемыми функциями №м (^ ), ^¡^ (¿г) , (¿г) можно
решать обратную задачу по нахождению g(ti), a(ti, Ь ), входящих в уравнения (1), (12).
Таблица 3. Информационная прогнозируемость процесса, описываемого линейной разностной схемой с
= ^ + d2t¡
№ Параметры разностной схемы Параметры ОПП
1 ^ > 0, ^ = 0 ^ &+Г ) = ^Г1 IPkв (4+г ) = 0,5/Ц-2
2 ^ = 0, ^ > 0 ^ (4 +г ) = ¿1-15[Ч0(: + Г) -ВД] Якп (^) = 0,5d_252 [ЧД + г) -ВД]
3 d1, ^ ф 0, d1, ^ > 0 (4+Г ) = 4-15[Ч0 (к + Г + 5) - Г0(Г + 5)] Якп (t:+г ) = 0,5dl-252 [ЧД + г + 5) -^(Г + 5)]
1 0.8 0.6 0.4 0.2
0 l-1-1-1-1-1-
0 50 100 150 200 250 300
Нормированная информационная прогнозируемость процесса IPkMi (tr ),
таблица 3, строка №2: 1 - к = 10; 2 - к = 50; 3 - к = 100
Заключение
Предложенное в статье определение прогнозируемости стохастического процесса и его параметров в дискретном времени на основе информационного подхода позволяет теоретически обоснованно дать количественную оценку этой характеристики. В отличие от энтропийных мер, предложенная в работе мера основана на информационном количестве Фишера и непосредственно связана с асимптотическими алгоритмами теории оценивания. В дискретном времени прогнозируемость процесса определяется одношаговой информационной прогнозируемостью определяемой по одношаговой плотности перехода. Учет эффекта накопления данных о процессе, как и следовало ожидать, численно отражается в количественном увеличении прогнозируемости.
Практическая значимость введенной величины одношаговой и (с учетом накопления) информационной прогнозируемости состоит в том, что, во-первых, эта величина может способствовать обоснованному выбору наиболее адекватного метода прогнозирования, во-вторых, появляется возможность генерации стохастических процессов на основе разностных схем с заданными свойствами относительно их прогнозируемости. В частности, это может оказаться полезным при тестировании и сравнительной оценке алгоритмов прогнозирования.
INFORMATION PREDICTABILITY OF STOCHASTIC PROCESSES
IN DISCRETE TIME
A.V. AUSIANNIKAU, V.M. KOZEL Abstract
The definition of one-step information predictability stochastic process in discrete time is given. The influence of the accumulation process data on its informational predictability is investigated. Relations connecting the predictability of the whole process with predictability of the individual parameters are obtained. The examples of the definition of information predictability for processes described by linear difference schemes are shown.
Список литературы
1. Заславский Г.М. Стохастичность динамических систем. М., 1984.
2. Шустер Г. Детерминированный хаос. М., 1988.
3. ОвсянниковА.В. // Докл. БГУИР. 2014. № 6 (84). №. С. 48-54.
4. Никитин Н.Н., Разевиг В.Д. // Журнал вычислительной математики и математической физики. 1978. Т 18, № 1. С.106-117.
5. Ибрагимов И.А., Хасьминский Р.З. Асимптотическая теория оценивания. М., 1979.