УДК 551.465.553 С.В. Балакин
ИМ СО РАН, Новосибирск
МАРКОВСКОЕ СТОХАСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПОВЕДЕНИЯВРЕМЕННЫХ РЯДОВ СУТОЧНЫХ СУММ ЖИДКИХ ОСАДКОВ
1. Стохастические процессы достаточно давно используются при моделировании временных рядов сумм осадков, причем как непрерывные, так и дискретные. К первым относятся непосредственно марковские процессы и процессы, траектории которых моделируются методами Монте-Карло. Работ, использующих дискретные модели, заметно больше. Одним из наиболее часто встречающихся методов в литературе является метод приближения данной траектории кривой какого-нибудь известного распределения, в частности, в роли последних выступают Г-распределение, распределение Пойа и другие. Непосредственно дискретные марковские модели (с различным уровнем связности и числом состояний) рассматривались в работах [1] (два состояния, простая цепь), [2] (семь состояний, простая цепь), [3] (два состояния, сложность цепи варьируется в зависимости от рассматриваемой местности). Во всех этих работах марковская модель используется только для расчета простейших характеристик, а дальнейшее исследование серийной структуры идет за счет различных предположений (например, в работе [2] предполагается, что количество осадков за сезон распределено равномерно или экспоненциально). В докладе исследование серийной структуры рассматриваемой последовательности опирается на результаты работ [4] и
[5].
2. Используется банк данных 15-летних (1969 - 1983 гг.) наблюдений за суточным слоем осадков в теплое время года (май - октябрь) на всех осадкомерных пунктах равнинной части Новосибирской области (западнее г. Новосибирска). Пунктов с достоверной информацией и без пропусков отдельных лет оказалось 47; их список приведен в статье [6].
По данным наблюдений временные ряды суточных сумм жидких осадков выглядят как чередование серий "сухих" суток, суток со следами осадков (наблюдателями эти события кодируются цифрами 0.00) и серий дождливых суток, когда суточный слой осадков превышает 0.1 мм. Ряду таких наблюдений будем сопоставлять индикаторную последовательность, состоящую из нулей и единиц. Случай дождливых суток будет соответствовать единице (1), остальные случаи полагаем нулевыми (0). Таким образом, для каждого месяца получается 47*15 последовательностей нулей и единиц длины п, где п — длина месяца (30 или 31), то есть для каждого из шести месяцев образуется трехмерный массив &\к) (/ — номер станции, I = 1,...,47;} — номер года от 1969 до 1983,} = 1,...,15; к — номер суток, к = 1,...,п.
3. В качестве модели возьмем простую (односвязную) однородную двоичную цепь Маркова £(к), k > 0 с множеством значений С = {1,0}, начальным вектором А и переходной матрицей Q.
А = (а, 1 - а), Q
(
Ч11 V Чс1
Л
Ч1С Чсс У
где
а = Рг{£(0) = 1}, 1 - а = Рг{£(0) = 0}, да(! = Рг{£(£+1) = в | № = а}, к > 0.
С помощью критерия X рассмотрено, насколько хорошо односвязная цепь описывает данный процесс. В табл. 1 приведены номера станций, показания которых не адекватны выбранной модели при уровне значимости критерия 3 = 0.02.
Таблица 1
Май Июнь Июль Август Сентябрь Октябрь
— — — 45 10, 21 10, 16, 19, 40
Из таблицы видно, что рассматриваемая модель достаточно хорошо описывает реальный процесс с мая по июль, для августа и сентября приближение можно считать удовлетворительным, для октября — плохим. В последнем случае необходимо увеличивать связность цепи для получения приемлемых результатов [3].
4. Моделировать начальные и переходные вероятности ввиду сильной неоднородности количества осадков необходимо независимо для каждого месяца. Переходные вероятности ду (/, у = 0,1) будем моделировать следующим образом. Найдем число всевозможных переходов 11, 10, 01, 00 по каждой из станций за каждый год. Например, за месяц май в 1969 году на первой станции было зафиксировано 4 перехода из 1 в 1, 9 переходов 10, 9 переходов 01 и 8 переходов 00. Среднее число переходов i ^ у по всем станциям и годам в течение одного месяца обозначим ту. Тогда оценка д'у вероятности ду будет иметь вид:
Ч'у = Шу / ( шю + шп) (1, ] = 0,1).
Например, для мая т11 = 4.224, ш10 = 5.070, откуда <^11 = 0.455.
Данные оценки являются, очевидно, несмещенными и сильно состоятельными, так как к ним применим усиленный закон больших чисел.
Для подсчета начальных вероятностей необходимо число всех единиц, отмеченных первого числа месяца на всех станциях и по всем годам, поделить на общее число наблюдений. Таким образом, оценка имеет вид:
“' = ^0 ’(1)/(47*15).
и0 /
Вышеперечисленные оценки по всем месяцам вместе со вспомогательными обозначениями приведены в табл. 2 (всюду далее полученные оценки отождествляются с теоретическими вероятностями).
Таблица 2
Май Июнь Июль Август Сентябрь Октябрь
ди = ди’ 0.455 0.470 0.491 0.483 0.495 0.604
''о о о о 0.747 0.781 0.744 0.728 0.786 0.711
а = а’ 0.220 0.281 0.332 0.428 0.403 0.416
d=p+q-1 0.202 0.251 0.235 0.212 0.281 0.316
b = (1-q)/(1-d) 0.317 0.293 0.335 0.344 0.297 0.422
5. Рассмотрим функционалы x(n) и у(п), определенные на нашей марковской цепи и равные соответственно числу единиц и числу серий из единиц на отрезке от 0 до п. Выясним, как ведут себя теоретические и эмпирические средние для них. Формулы для теоретических математических ожиданий берем в [5], подставляя в них данные из табл. 2. Эмпирические средние ищутся стандартными методами. Полученные данные отражены в табл. 3.
Таблица 3
Май Июнь Июль Август Сентябрь Октябрь
Ex( n) 9.68 8.74 10.34 10.78 9.03 12.98
Ex(n) 9.7 8.76 10.38 10.78 9.07 13.07
ЕУ( n) 5.46 4.8 5.48 5.75 4.75 5.51
ЕУ( n) 5.44 4.78 5.45 5.74 4.73 5.43
Как видно, разница между теоретическими и эмпирическими средними не превышает четырех сотых (если не брать во внимание октябрь), что косвенно свидетельствует о достаточной адекватности модели.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Stern R.D. Computing a Probability Disribution for the Start of the Rains a Markov Chain Model for Precipitation // J. Appl. Meteorol., 1982. - 21, №3. - P. 420-423.
2. Haan C., Allan D., Street I.A. Markov Chain Model of Daily Rainfall // Water Resour. Res., 1976. - 12, №3. - P. 443-449.
3. Chin E.H. Modeling Daily Precipitation Occurrence Process With Markov Chain // Water Resour. Res., 1977. - 13, №6. - P. 949-956.
4. Савельев Л.Я. Накрывающие серии в двоичных марковских последовательностях / Л.Я. Савельев, С.В. Балакин, Б.В. Хромов // Дискретная математика, 2003. - Т. 15, вып. 1. - С. 50-76.
5. Савельев Л.Я. Совместное распределение числа единиц и числа 1-серий в двоичной марковской последовательности / Л.Я. Савельев, С.В. Балакин // Дискретная математика, 2004. - Т. 16, вып. 3. - С. 43-62.
6. Дробышев А.Д. Статистическая структура временных рядов суточных сумм жидких осадков в равнинной части Новосибирской области / А.Д. Дробышев // Труды ЗапСибНИИ Госкомгидромета, 1989. - Вып. 86. - С. 44-74.
© С.В. Балакин, 2007