УДК 519.216 Вестник СПбГУ. Математика. Механика. Астрономия. 2023. Т. 10 (68). Вып. 3 МБС 60G10
Стационарные обратимые процессы скользящего среднего и авторегрессии с остатками в виде скользящего среднего
Т. М. Товстик
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9
Для цитирования: Товстик Т. М. Стационарные обратимые процессы скользящего среднего и авторегрессии с остатками в виде скользящего среднего // Вестник Санкт-Петербургского университета. Математика. Механика. Астрономия. 2023. Т. 10(68). Вып. 3. С. 530-544. https://doi.org/10.21638/spbu01.2023.307
В данной работе показывается, как подобрать адекватную модель обратимого стационарного процесса скользящего среднего конечного порядка, имея в распоряжении соответствующее количество выборочных корреляций. Находятся условия допустимости, при выполнении которых для обратимой модели процесса скользящего среднего не выше пятого порядка устанавливается однозначное соответствие коэффициентов и корреляций процесса, а при выполнении условий допустимости для выборочных корреляций удается подобрать обратимую стационарную модель. Для процессов скользящего среднего более высокого порядка предварительно к исходным данным подбирается смешанная модель авторегрессии и скользящего среднего не выше пятого порядка. Этот вариант имеет и самостоятельное значение, так как и при небольших порядках смешанной модели получается хорошее совпадение корреляций модели и выборочных корреляций процесса. Особое внимание уделяется обратимости процесса, так как формулы прогноза предполагают выполнение этого условия.
Ключевые слова: процессы скользящего среднего, скользящее среднее конечного порядка, авторегрессия с остатками вида скользящего среднего, стационарные обратимые процессы, оценка параметров.
1. Введение. В работе на основе выборочных данных строится алгоритм оценки параметров процесса скользящего среднего порядка т, (СС(т)), с т ^ 5. При необходимости рассмотрения процесса СС(т) более высокого порядка предварительно оценивается модель обратимого стационарного процесса авторегрессии с остатками в виде скользящего среднего порядков т и п, АРСС(п, т), с т ^ 5. Для этого сначала при фиксированном т ^ 5, как и в алгоритме Хеннана [1], оцениваются параметры авторегрессии. При оценке параметров авторегрессии используется метод наименьших квадратов, который способствует существенному улучшению модели. Затем способом, представленным в данной статье, подбирается модель обратимого стационарного процесса СС(т). В результате получаем обратимую стационарную модель АРСС(п, т) и эквивалентный ей вариант процесса скользящего среднего. Обратимости процесса уделяется особое внимание, так как формулы прогноза предполагают ее выполнение.
В статье обсуждается вопрос выбора порядков т и п. Важно отметить, что данный алгоритм можно использовать, если выборочные корреляции получены при
© Санкт-Петербургский государственный университет, 2023
ограниченном объеме данных и нужно подбирать модель с небольшим количеством параметров. Приводятся примеры.
Алгоритмы оценки параметров СС(т) приводятся в [2, 3]. Однако если корреляции процесса медленно затухают, то соответствующий процесс скользящего среднего должен быть высокого порядка и часто модель оказывается необратимой.
В [1-4] обсуждается вопрос оптимального выбора параметров т и п процесса АРСС(п, т), а также оценка параметров моделей.
Если нужно оценить коэффициенты корреляционной функции, а с ней и спектральной плотности АРСС(п, т) процесса с дискретным или непрерывным параметром, то можно воспользоваться алгоритмами в [5, 6].
Задачи прогноза и моделирования систем, дающие возможность сделать правильный выбор и оценить взаимодействие отдельных систем, основаны на статистических методах. В частности, используется теория стационарных процессов вида АР, СС, АРСС. Публикации [7, 8] подтверждают актуальность решения подобных задач. Это такие задачи, как изменение цен фондовых рынков, цен на акции, изменение цен на единицу энергии, задачи, связанные с прогнозом погоды и уровня воды в реках и озерах. Но для решения подобных задач нужно предварительно найти хорошие оценки моделей. Данная работа дает простой способ оценки параметров моделей СС и АРСС.
2. Связь коэффициентов процесса скользящего среднего с его корреляциями. Процесс скользящего среднего т-го порядка СС(т) имеет вид
хг
&-к, Ро > 0, г = 0, ±1, ±2,... , (1)
к=0
здесь — независимые одинаково распределенные случайные величины с Е(£к) = 0;
= ¿¡у, а ¿¡у — символ Кронекера. Во всей статье случайные величины ^ будут обладать перечисленными выше свойствами, откуда, в частности, следует, что Е(хг) = 0. Процесс СС(т) при конечном т является стационарным процессом с дискретным параметром, и его корреляции Д (к) = удовлетворяют равенствам
т — к
Е(к) = рйрй+к, 0 < к < т, (2)
¿=о
Я(т + к) = 0, к> 0. (3)
Спектральная плотность ](Л) процесса (1) имеет вид
тт
= 2^1 = + ВД(е-"А + (4)
к=0 к=1
Стационарный процесс (1) обратим, если веса ак в обращенном состоянии
^ 1 то
& = -к=^2акгк> N ^ !> (5)
к=о ^к=0 Ркг к=о
таковы, что сходится последний ряд в (5) при \г\ < 1. Процесс (1) обратим, если
т ;к=0-1
все корни характеристического полинома р(г) = ^т=0 Рк?т к по модулю меньше
единицы [3], т.е.
р(г) =]Тркгт-к = (г - гк)=0, \гк\ < 1, 1 < к < т. (6)
к=0 к=1
Последнее условие нетрудно выполнить, так как при 2 = ехр(гЛ) имеем ](Л) = р(г)р(1/г)/(2п). В частности, если процессу (1) соответствует характеристический полином, у которого некоторые корни по модулю больше единицы
Р{г)=Ро П П (г-^)' (7)
\гь\<1 | > 1
то процесс с характеристическим полиномом
Р{*)=Р0 П П (г~1/гз)гз (8)
\гь\<1 \zí\>1
имеет ту же спектральную плотность, а его корни по модулю меньше единицы.
В дальнейшем считаем, что условия (6) относительно корней р(г) выполнены и, следовательно, процесс хг обратим.
Производящая функция у(г) ковариаций процесса СС(т) равна
Аг)= Е(к)гк = р0я(г)д(г-1),
к=-г,
а у обратимого процесса
д(г) =]Т дкгт-к = П (г - гк) = 0.
к=0 ь=1
\*к\<1
Корни у(г) = 0 можно найти, решив уравнение
2т
52К(к - т)гк = 0, (9)
к=0
и у стационарного процесса они равны г1, ■ ■■ , гт, 1/г1, ■ ■■ , 1/гт. Нумеруем корни так, что все \гк\ ^ 1, а так как корней \гк \ = 1 должно быть четное число, то одно из них обозначаем гк, а другое — 1/гк. У обратимого процесса в уравнении у(г) = 0 не должно быть корней \гк \ = 1, (см. [2, 3]).
2.1. Замечание 1. Если корреляции К(к) таковы, что уравнение (9) не имеет корней \гк \ = 1 и
2т т
- т)гк = р2П(г - гк)(г - 1/гк), Ы < 1, (10)
к=0 к=1
то коэффициенты процесса СС(т) однозначно определяются корреляциями, процесс является обратимым, характеристический полином р(г) имеет вид (6), а коэффициент р0 = (Я(0)/^2т=0 дк )1/2. Результат остается в силе, если для выборочных
корреляций выполнено уравнение (10). Подбор параметров модели является оптимальным, так как корреляции модели совпадают с заданными.
Приведем некоторые равенства и неравенства, которым должны удовлетворять коэффициенты
Р0,Р1, • • • ,Рт (11)
и корреляции
Д(0),Д(1), ••• ,Е(т) (12)
стационарного обратимого процесса. Так как рт/р0 = Пт=1 гк и при всех к корни \гк\ < 1, то из равенства (2) при к = т следует
Ы = ЩА<1. (13)
Р0 р0
Убедимся в том, что коэффициенты (11) удовлетворяют неравенствам
Р0 + Р1 + Р2 + •••+ Рт > 0, (14)
Р0 — Р1 + Р2 — Р3 + ••• + ( —1)тРт > 0. (15)
Так как \гк \ < 1 при всех к, то р(1) = Р0 Пт=1(1 — гк) = ^2т=0 Рк > 0, и, следовательно, неравенство (14) выполнено. При г = —1 получаем
( —1)тр( —1) = £( — 1)крк = Р0 П(1 + гк),
к
) Р
к=0 к=1
а с учетом неравенств (6) убеждаемся в справедливости неравенства (15).
Убедимся, что корреляции (12) процесса СС(т) должны удовлетворять неравенствам, которые назовем условиями допустимости:
Д(0) + 2^ Д(к) > 0, Д(0) + 2^( — 1)кД(к) > 0. (16)
к=1 к=1
Неравенства (16) очевидны, так как их левые части равны, соответственно
Г=0 Рк)2 и Ет=0(
( т=0 Рк)2 и Е т=0( — 1)кРк)2. В дальнейшем будем использовать обозначения:
А(т) = (Д(0) + 2^ Д(к))1/2 = ^ Рк, (17)
к=1 к=0
тт
В(т) = (Д(0) + 2^( —1)кД(к))1/2 = ^( — 1)кРк, (18)
к=1 к=0 т/2
С(т) = (А(т) + В(т))/2 = Р0 + ^Р2к, (19)
к=1
(т+1)/2
в(т) = (А(т) — в(т))/2 = Р2к—1. (20)
к=1
Из (16) следует, что величины А(т),в(т) и
с(т)
больше нуля.
3. Вычисление коэффициентов обратимого процесса СС(т) при т ^ 5.
Приведенные ниже алгоритмы находят коэффициенты (11) процесса СС(т) при условии, что корреляции (12) удовлетворяют соотношениям (2), (16).
3.1. Случай 1. Случай т =1. Процесс СС(1) имеет вид
xt = P06 + PlCt-l.
Согласно (16) должно выполняться неравенство R(0) > 2|R(1)| и, благодаря (2), р0 = (y/R(0) + 2Д(1) + y/R(0) - 2Д(1))/2, Р1 = (у/Д(0) + 2Д(1) - \]Д(0) — 2Д(1))/2.
3.2. Случай 2. Случай т = 2. Процесс СС(2) имеет вид
Xt = PoCt + PlCt-l + P2&-2 .
Из (20) следует, что P1 = D(2). Так как р0р2 = R(2), P0 + р2 = C(2) > 0, то относительно p0 получаем квадратное уравнение p0 — C(2)р0 + R(2) = 0. В качестве p0 следует взять максимальный корень р0 = (C(2) + ((C(2))2 — 4R(2))l/2)/2, так как при этом минимальный корень будет равен р2 и будет выполняться неравенство (13).
3.3. Случай 3. Случай т = 3. Процесс СС(3) имеет вид
Xt = P0& + PlCt-l + P2it-2 + P3&-3.
Используя равенства
P0 + P2 = C(3), P1 + P3 = D(3\ P0P3 = R(3), (21)
выражаем все коэффициенты (11) через р0 и подставляем в равенство (2) при к = т. Это приводит к уравнению 4-го порядка относительно Л, (р0 = Л),
Л4 — C(3)X3 + R(2)X2 — D(3)R(3)X + R2(3) = 0. (22)
За р0 принимаем максимальный положительный корень уравнения (22), остальные параметры (11) находим из равенств (21). В пользу указанного выбора р0 выступает тот факт, что из (21) следует неравенство P0 + P2 > 0, а р2 может быть отрицательным. Кроме того, произведение корней полинома (22) равно R2(3) = (P0P3)2 и |рз| < P0. Если полином (22) имеет только два действительных корня, то максимальный из них есть р0, а второй — рз. Если у полинома (22) четыре действительных корня, то максимальный положительный из них есть P0 и один из корней равен рз = R(3)/p0.
Так как в (22) корреляции будут заменяться выборочными, то может оказаться, что уравнение (22) не имеет действительных корней. Наилучшее приближение получается, если в качестве P0 взять максимум из действительных положительных частей корней уравнения (22) или максимум модулей этих корней. В примере 3 обсуждаются эти варианты.
3.4. Случай 4. Случай т = 4. Процесс СС(4) имеет вид
Xt = P0& + PlCt-l + P2&-2 + P3&-3 + P4&-4. 534 Вестник СПбГУ. Математика. Механика. Астрономия. 2023. Т. 10(68). Вып. 3
Используя равенства (2), (19), (20), выражаем через ро остальные коэффициенты: (Д(3) - Р^ро)ро С^ро — Рр — Д(4) (4) Д(4)
Р1 = --2-> -Р2 = -, Рз = 0('-Р1, Р4 = -,
Д(4) - Р0 ро ро
(23)
подставляем их в равенство (2) при к = т и для вычисления ро получаем уравнение 8-го порядка:
Л8 - С(4)А7 + Д(2)А6 + (С(4) Д(4) - Б(4)Д(3))Л5 + (Д2(3) - Д(4)(С(4))2 + Д(0)Д(4))А4+
+(С(4)Д2(4) - £(4)Д(4)Д(3))А3 + Д(2)Д2(4)А2 - С(4)Д3(4)А + Д4(4) = 0. (24)
Как и прежде, ро — максимальный положительный корень уравнения (24), остальные параметры (11) находим из равенств (23). Если полином (24) не имеет действительных корней, то поступаем так же, как в разделе 3.3.
3.5. Случай 5. Случай т = 5. Процесс СС(5) имеет вид
хг = роб + р1&-1 + р2^г-2 + рзб-з + р4&-4 + р5&-5. Используя равенства (2), (19), (20), через ро и р1 выразим остальные параметры
(11):
р2 = С(5) - ро - (Д(4) - Д(5)р1/ро)/ро, рз = £(5) - р1 - Д(5)/ро,
р4 = С(5) - ро - р2, р5 = Д(5)/ро. (25)
Равенства (2) при к = 2 и к = 3 дают возможность найти связь между ро и р1:
Р1=Ро—;—:, (26)
Ф(ро)
здесь
Ф(ро) = ро - рбД(4) + р5оЯ(5)Д(5) - р3оС(5) Д2(5) + роД(4)Д2(5) - Д4(5),
^(ро) = р^(5) -р6(Д(3) + Д(5)) + р4(Д(2) + Д(4))Д(5) -р3С(5)Д(4)Д(5)--р2(Д(3)Д(5) - Д2(4) + Д2(5))Д(5) + роС(5)Д3(5) - Д(4)Д3(5). Для вычисления ро получаем уравнение 20-го порядка относительно А:
(А)[А4 - А3С(5) + А2(Д(2) + 2Д(4)) - А(С(5)Д(4) + Б(5)Д(5)) + Д2(4) + Д2(5)]+
+^(А)ф(А)[-Б(5)А3 + АС(5)Д(5) - 2Д(4)Д(5)] + ^2(А)[А4 + Д2(5)] = 0. (27)
Находим корни полинома (27). Максимальный действительный из этих корней принимаем за ро, остальные параметры р1 ^ г ^ 5, модели находим из равенств (25) и (26). Если нет действительных корней, то поступаем как в разделе 3.3.
4. Оценка параметров процесса АРСС(п, т) при т ^ 5. Процесс хг авторегрессии порядка п с остатками в виде скользящего среднего порядка т, т. е. АРСС(п, т), имеет вид
п т
Якхг-к = ^2рк, до = 1. (28)
к=о к=о
Спектральная плотность /(А) и корреляции Д (к) = Е процесса (28) равны
11 Р р-^ I2 сп
= = к = О, ±1, ±2, • • • . (29)
Процесс (28) будет стационарным и обратимым, если корни соответствующих характеристических полиномов д(г) = ^п=0 дкгп-к и р(г) = ^ркгт-к по модулю меньше единицы. В дальнейшем предполагаем, что эти условия выполнены. Считаем, что эти полиномы не имеют одинаковых корней, что естественно предположить, если посмотреть на вид (29) спектральной плотности.
Напомним, что если коэффициенты процесса АРСС(п, т) в представлении (28) известны, то можно найти корреляции К(к), к = 0, ±1, ±2, ■ ■ ■ , либо аналитическими методами [6], либо вычислив интегралы (29). С другой стороны, существует много разных способов [1, 3-6] подбора модели АРСС(п, т) к заданным выборочным корреляциям, и, как правило, даже при небольших значениях п и т можно получить хорошее совпадение корреляций модели с выборочными.
Рассмотрим способ оценки параметров модели АРСС(п, т), в котором сначала оцениваются параметры д1,...,дп, т. е. параметры АР(п), а затемр0,... ,рт, 0 ^ т ^ 5, т.е. параметры СС(т). Этот способ использует алгоритм Хеннана [1] в сочетании с методом наименьших квадратов, а параметры СС(т) при значениях 0 ^ т ^ 5 оцениваются способом, описанным в начале статьи.
4.1. Вычисление параметров процесса АРСС(п,т), если известны корреляции К(к), 0 < к < т + п, процесса, величины п, т и т < 5. Для
коэффициентов корреляций г(к) = К(к)/аХ, аX = К(0), процесса (28) уравнения Юла — Уокера принимают вид
п
52 д^г(к — 3) = 0, т +1 ^ к ^ т + п. (30)
¿=0
Введем в рассмотрение процесс:
п
Уг = 52 ЧкХг-к, (31)
к=0
который является линейным преобразованием с ядром д(р-гХ) процесса хг и, следовательно, стационарным процессом с корреляционной функцией
пп
Ку (I — в) = Е(угуь) = ^52 М, К(1 — в — к + з). (32)
к=0 ¿=0
Из равенства (28) следует представление процесса уг в виде СС(т):
т
Уг = 52 Рк^г-к. (33)
к=0
Убедимся, что корреляции процесса (33) удовлетворяют равенствам (2),(3). Из равенств (28) и (33) следует
п п т- г
Ку (*) = ^52 ЫЯз К(г — к + з) = 52 РзРз+г, 0 < * < т, (34)
к=0 ¿=0 ¿=0
кроме того, из равенств (32), (33) получаем
п п
Яу " к + г>т-
к=0 3=0
Итак, процесс уг является процессом СС(т) с т ^ 5 и, если корреляции (34) удовлетворяют неравенствам (16), то, пользуясь результатами раздела 2, можно найти коэффициенты (11) и, следовательно, завершить подбор модели процесса (28).
4.2. Оценка параметров процесса АРСС(п, т) при т < 5, если известны выборочные корреляции. Пусть исходные данные процесса хг представлены в виде выборочных корреляций
Я(0) = , Я(1) = т(1),...,Я(У)= ¿2 Т(у), г(0) = 1, (35)
где а% — выборочная дисперсия; т(]) — коэффициенты корреляций. Сначала подберем модель при заданном параметре т, затем обсудим выбор этого параметра. Рассмотрим случай п > т, по крайней мере это неравенство должно выполняться, если процесс получается в результате дискретизации процесса с непрерывным параметром. Алгоритм справедлив и при п ^ т.
Если имеется V выборочных корреляций, то возьмем Н такое, что
Н ^ V, п ^ Н — т, (36)
составим функционал
К п
ф(9! ,...,<п)= ^ (52 <3 Г (к — -?))2
к=т+1 з = 0
40
и найдем оценки , 1 ^ ] ^ п, параметров 43, которые его минимизируют. Система
дФ
— =0, к = 1, .. ., п,
дцк
сводится к системе линейных относительно ^, 1 ^ ] ^ п, уравнений:
пК
52 52 Г (к — з)Г(к — ^=0, / = 1, ± =1,...,п. (37)
3=0 к=т+1
При проверке модели на стационарность нужно убедиться, что корни характеристического полинома (¡(г) = ХП=0 Чкгп-к, </0 = 1, по модулю меньше единицы. Если это условие не выполнено, то можно варьировать параметры Н и п в пределах (36), добиваясь его выполнения, иначе нужно выбрать новое т и повторить алгоритм.
В предположении, что исходные данные соответствуют модели АРСС(т, п) вида (28), нужно в (34) заменить ( их оценками (/¿, а корреляции Я(з) выборочными Я(]), тогда для выборочных корреляций йу(£) и коэффициентов рк процесса скользящего среднего
т
Уг = 52 Рк^г-к, (38)
к=0
получим уравнения
п п т- г
Ы*) = ^52 К(1 — к + з) = РзРз+г, 0 < * < т. (39)
к=0 ¿=0 ¿=0
4.3. Замечание 2. Если уравнение (10) с корреляциями К(к) = Лу(к) не имеет корней \гк \ = 1, то, согласно замечанию 1, у процесса (38) корни гк характеристического полинома р(г) = р0 Пт=1 (г — гк) по модулю меньше единицы. Модель будет обратима. В данном случае р0 выбирается из расчета, чтобы дисперсия модели АРСС(п, т) была равна Н(0). Подбор параметров (11) при фиксированных т и п является оптимальным, так как корреляции модели совпадают с заданными (см. пример 1).
Если полином (10) с корреляциями К(к) = В-у(к) имеет корни, по модулю равные единице, а т ^ 5, то воспользуемся алгоритмом, описанным в разделе 2. Убедившись, что выполнены неравенства (16), найдем для процесса (38) оценки р0, ■ ■ ■ ,рт коэффициентов (11) с характеристическим полиномом
т т\ т2
р(г) = 52рк^т-к = р0 П (г — ) П (* — ), т1 + тх = т. (40)
к=0 ь=1 , = 1
!>1
Заметим, что подбор параметров происходит по выборочным данным, поэтому единичный корень у характеристического полинома р(г) исключен из рассмотрения. Рассмотрим два варианта, когда т1 = т и т1 < т.
Случай т1 = т в (40) приводит к обратимому процессу, так как все корни характеристического полинома по модулю меньше единицы (см. пример 1). Дисперсия модели должна быть равна Д(0) = а2, поэтому в (40) р0 следует заменить на р0 = р0<?х/а, где а2 — дисперсия процесса с характеристическими полиномами р(г), 4(г). В результате получаем стационарную обратимую модель АРСС(т, п), которая будет иметь вид
п т т
52%кХг-к = 52рк, рк = рках/а, 0 < к < т, р(г) = 52ркгт-к. (41)
¿=0 к=0 к=0
Случай т1 < т в (40) свидетельствует о необратимости модели (см. пример 2), поэтому переходим к процессу с той же спектральной плотностью, но с характеристическим полиномом
т т1 т2 т2
~р(г) = 52ркгт-к = р0 П (* — Ъ) П (* — 1/¿), р0 = р0 П \Ъ\, (42)
к=0 Ь=1 3 = 1 з = 1
!£к!<1 !*з !>1 !>1
который приводит к обратимой модели
пт
52ъ Хг-к = 52 рк £г-к, Ъ = 1. (43)
к=0 к=0
Оптимальным можно считать тот вариант, при котором минимально отклонение
1 У
°1,Ъ.,т,п = —7 Х^С?) ~ 9= ¿30,к,т,п, (44)
+ 3=0
здесь и далее обозначение ок,т,п используется для ¿у,к,т,п, когда V = 30.
Ясно, что V ^ т + п, и V рекомендуется брать в пределах 20 ^ V ^ 30. В примерах V = 30, однако если коэффициенты корреляций быстро затухают, то V можно уменьшить.
Если целью является подбор модели СС(М), то
М т п то
хг = 51 Чк£г-к, = 51 Чк%к, \г\ < 1,
к=0 к=0 ¿=0 к=0
сходимость ряда обеспечивается свойствами характеристического полинома (¡(г). Величину М находим из равенства (1/о М=0 7к ~ 1 — (■■
5. Примеры. В разделе 5.1 определяется стационарный обратимый процесс АРСС(6,4), а в остальных разделах этот процесс моделируется с разными объемами N выборок и к каждой выборке подбирается предложенным выше способом модель АРСС(п, т). Оптимальным по параметру Н,т + п ^ Н ^ V считается тот вариант, у которого величина ¿У,к,т,п точности вида (44) минимальна.
На рисунке выборочные коэффициенты корреляций, полученные при N = 500; 100; 50, обозначены соответственно гА, гв и гс. Аналогичная запись используется для коэффициентов корреляций моделей.
5.1. Исходные данные. Генеральная совокупность. Зададим параметры стационарного процесса АРСС(6, 4). Найдем его корреляции и по ним, используя алгоритм раздела 3.1, восстановим эти параметры.
Приведем характеристические полиномы процесса (28)
р(г) = 2г4 — 4.4г3 + 5.58г2 — 3.5962 + 1.258, (45)
ц(г) = г6 — 1.2г5 + 0.912г4 — 0.596г3 + 0.973г2 — 1.065г + 0.476. (46)
Корни у полиномов р(г) и ц(г) равны, соответственно г\22 = 0.6± 1,0.7, (\г1,2\ = 0.922), гз,4 = 0.5 ± 10.7, (\гз,4\ = 0.860), и у^ = 0.7 ± ¿0.3, (\у1,к\ = 0.762), уз,4 = —0.6 ± 10.75, (\Уз,4\ = 0.960), У5,6 = 0.5 ± ¿0.8, (\у5,б\ = 0.943).
У процесса ¿X = 39.318, а график коэффициентов корреляций т(]) приведен на рисунке, а. Находим корреляции Я(з) и ставим задачу вычисления ц(г) и р(г).
Решаем систему уравнений (30), получаем коэффициенты цк, из которых образован полином ц(г) в (46).
Для получения р(г) воспользуемся двумя вариантами (см. разделы 4.1 и 3.4). Находим корреляции Яу(0) = 68.161, Яу(1) = —57.121, Яу(2) = 33.474, Яу(3) = — 12, 68.161, Яу(4) = 2.516 процесса уг, которые удовлетворяют соотношениям (10), и убеждаемся, что полином р(г) совпадает с (45).
Другой вариант основан на алгоритме раздела 3.4, в котором полином (24) имеет вид
Л8 —8.838Л7+33.474Л6—76.113Л5+130.899Л4 —191.500Л3+211.899Л2 —140.762Л+40.072.
За р0 принимаем максимальный положительный корень полинома, а именно р0 = 2, а остальные параметры рк, 1 ^ к ^ 4 находим из равенств (23) и убеждаемся, что они совпадают с коэффициентами полинома (45).
5.2. Пример 1. У выборки объема N = 500 выборочная дисперсия равна а'Х = 37.548. Определим Н(10 ^ Н ^ 30) и найдем модель, у которой ошибка (44) будет минимальной. У этого варианта Н = 26, т = 4, п = 6, а2в,4,б = 0.014,
д (г) = г6 + 1.037г5 + 0.420г4 — 0.858г3 — 0.303г2 + 0.142г + 0.359. (48)
Корреляции процесса уг равны Щ(0) = 4.610, Щ(1) = 0.265, Щ(2) = 0.450, Яу(3) = 0.031, Ду(4) = 1.588, у полинома (9) корней по модулю, равных единице, нет, и на основании замечаний 1 и 2 р(г) имеет вид (5) с р0 = 1.940.
В результате при т = 4 получаем наилучшую стационарную обратимую модель (41), которую назовем А1, с характеристическими полиномами (48) и
р (г) = 1.940г4 + 0.140г3 + 0.161г2 — 0.041г + 0.786.
Заметим, что при Н = 28, 29, 30, подобрать стационарную модель АРСС(6, 4) не удалось, так как у каждого из соответствующих полиномов д(г) оказались корни по модулю больше единицы.
Здесь и в дальнейшем будем приводить величину ат+п,т,п, так как на основании Н = т + п корреляций традиционно строится оценка параметров. В данном случае а10,4,б = 0.026, а у соответствующей модели, которую назовем ^2, характеристические полиномы равны
р (г) = 1.96г4 — 1.287г3 + 0.413г2 — 0190г + 0.399, д (г) = г6 + 0.325г5 — 0.137г4 — 0.995г3 + 0.104г2 + 0.215г + 0.325.
Так как коэффициенты корреляций гА(Ь) и гА1 (I) модели практически совпадают, то для наглядности на рисунке, б приведены коэффициенты корреляций гА(Ь) и гА2(1) — модели А2.
Благодаря большой выборке промоделированного процесса, коэффициенты корреляций всех перечисленных моделей мало отличаются между собой и от выборочных. В данном примере и в последующих можно убедиться, что использование метода наименьших квадратов в виде (37) для оценки параметров д1, ■ ■ ■ ,дп приводит к улучшению модели.
5.3. Пример 2. У выборки объема N = 100 выборочная дисперсия равна ах2 = 42.312, а график коэффициентов корреляций гв (*) приведен на рисунке, а, б.
При подборе стационарной модели АРСС(6, 4) с V = 30 в (44) минимальное отклонение >723,4,6 = 0.051 получаем, если в (37) Н = 23. Эту модель обозначим через В1. У модели В1 характеристический полином р(г) в (40) имеет корни г 1,2 = —0.449 ± 10.475, Ъ3,4 = 0.556 ± ¡0.892, \Ъ3,4\ > 1, р0 = 1.231, а = 7.449, ах = 6.505,р0 = 1.075.
Корреляции процесса уг равны Щ(0) = 2.759, Еу(1) = 0.349, Еу(2) = 1.525, Яу(3) = 0.762, Яу(4) = 0.866. У полинома (9) четыре разных корня по модулю равны единице, поэтому воспользоваться методом, приведенным в замечании 1, не удается.
Для сравнения приведем также ау, 10,4,6 = 0.227.
-А ^А1
!![■ Г , Г
-С -С
щ г ,г
в г
Коэффициенты корреляций: т(1) — исходные, — выборочные, т(1) — модели.
При подборе модели с т = 3, а п = 5 или п = 6, минимальные по Н отклонения (44) равны &2в,з,в = 0.035 (модель В2), 025,3,5 = 0.045. Точности моделей не очень отличаются между собой, но оптимальной является модель В2. При Н = 9,т = 3,п = 6 не выполнены условия допустимости (16).
Приводим характеристические полиномы окончательных вариантов стационарных обратимых моделей
Р(г) = 1.156/ + 0.067/ - 0.240/ + 0.087г + 0.106, = г6 + 1.081/ + 0.663/ - 0.694/ - 0.348/ - 0.072г + 0.290
и В2 :
р(г) = 0.676/ + 0.126/ + 0.460г + 0.388, </(/ = г6 + 1.358/ + 0.976/ - 0.625/ - 0.735/ - 0.425г + 0.128.
Графики коэффициентов корреляций моделей и В2 мало отличаются между собой и от выборочных коэффициентов корреляций гв (£), поэтому их не приводим.
5-4- Пример 3. При объеме выборки N = 50 выборочная дисперсия равна а/ = 66.266. Оптимальный вариант модели АРСС(6,4) имеет отклонение 027,4,6 = 0.069 при Н = 27. Выборочные корреляции процесса уг равны Д§(0) = 5.057, Ду(1) = 2.520, Д(2) = 6.086, Д§(3) = 3.013, Д§(4) = 0.690 и при этих корреляциях у полинома (9) четыре корня по модулю равны единице, следовательно, условия, приведенные в замечании 1 не выполнены. Стационарная обратимая модель, назовем ее С, имеет
характеристические полиномы
р(г) = 0.675г4 + 0.050г3 + 0.339г2 + 0.308г + 0.072, Ъ (г) = г6 + 1.207г5 + 0.737г4 — 0.480г3 + 0.198г2 + 0.587г + 0.629.
В данном примере при оценке параметров (11) модели АРСС(6, 4) по алгоритму раздела 3.4, у полинома (24) все 8 корней оказались комплексно-сопряженными, т. е. не было положительного действительного корня, который можно было принять за р0. Поэтому для выбора параметра р0 рассматривался, во-первых, максимум из действительных положительных частей корней уравнения (24), а во-вторых, максимум модулей корней. У обеих моделей коэффициенты корреляций практически одинаковые, а точности (46) соответственно равны 0.069 и 0.071.
При подборе модели АРСС(6,3) оптимальный вариант имеет отклонение а27,з,6 = 0.086 при Н = 27. Заметим, что не удается подобрать стационарных моделей для АРСС(6, 4) при Н = 10 и для АРСС(6, 3) при Н = 9. При других значениях т и п (3 ^ т ^ 5, 4 ^ п ^ 6) величина критерия (44) оказывалась больше, чем у оптимальных моделей.
При N = 500 выборочные корреляции близки к исходным и точность подбора модели лучше, чем при N = 50.
На рисунке, в, г приведены коэффициенты корреляций г(Ь), выборочные гс(Ь), а также коэффициенты корреляций гс (Ь) модели С.
5.5. Замечание 3. Рассмотрим три варианта задания процессов АРСС(п, т). Будем использовать обозначения примера 5.1.
В I варианте рассматривается процесс АРСС(4, 2), у которого корни характеристических полиномов р1(г) и д1(г) те же, что и, соответственно, первые два и первые четыре в примере 5.1. Во II варианте рассматривается процесс АРСС(6,4), у которого р2(г) = р1(г)(г — уъ)(г — у6), д2(г) = д1(г)(г — уъ)(г — у6), У5,6 = 0.5 ± ¡0.8. В III варианте задан процесс АРСС(6,4), у которого р2(г) = р1(г)(г — у7)(г — у8), уг,8 = 0.5 ± ¿0.801, дз(г) = д2(г) имеет вид (46).
Во II варианте р2(г) и д2(г) имеют общие корни и при соответствующем сокращении на общий множитель числителя и знаменателя спектральной плотности получается I вариант. Коэффициенты корреляций процессов первых двух вариантов совпадают. Если к этим корреляциям применить предложенный метод, то при т = 2 получаем I вариант, а т = 4 приводит к нестационарному варианту. Хотя, кроме одной пары, остальные корни характеристических полиномов вариантов II и III совпадают, но вариант III, в отличие от II, по своим корреляциям восстанавливается однозначно.
Все варианты были промоделированы с N = 500. При подборе модели к выборке I варианта получились точности: при т = 2, п = 4, а26,2,4 = 0.027 и при т = 4, п = 6, а26,4,6 = 0.039. У II и III вариантов модели близки, а точности лучших моделей одинаковы: т = 2, п = 4, >2з,2,4 = 0.030 и т = 4, п = 6, 723,4,6 = 0.022, т. е. моделирование нивелирует расхождение между этими вариантами.
У выборок алгоритм отдает предпочтение тому варианту, который моделировался. Если считать, что приведенные точности не очень отличаются, а более важно минимизирование суммы т + п (это предположение присутствует во многих учебниках), то все варианты приводят к модели с т = 2, п = 4. В данном случае понятен аргумент в пользу уменьшения суммы т + п, так как он помогает избежать вариант, при котором числитель и знаменатель спектральной плотности процесса
АРСС(п, m) имеют общие корни. Выборки приводят к сглаживанию оценок, и для получения более тонких результатов нужны дополнительные исследования.
Заключение. Приведенные примеры показывают, что предложенный алгоритм оценки параметров процессов СС(т) и АРСС(п, т) приводит к хорошим результатам.
Литература
1. Хеннан Э. Многомерные временные ряды,. Москва, Мир (1974).
2. Дурбин Д. Эффективное оценивание параметров модели скользящего среднего. Biometrika 46, 306-316, 1959.
3. Андерсон Т. Статистический анализ временных рядов. Москва, Мир (1976).
4. Kavalieris. A Not on Estimating Autoregressive-Moving average Order. Biometrika 78, 920-922 (1991).
5. Товстик Т. М. Об оценке параметров корреляционной функции стационарного случайного процесса. Кибернетика 6, 131-136 (1975).
6. Товстик Т. М. Стационарные случайные процессы с рациональными спектральными плотностями. СПб.: Изд-во С.-Петерб. ун-та (2000).
7. Mehdizadeh S. Using AR, MA, and ARMA Time Series Models to Improve the Performance of MARS and KNN Approaches in Monthly Precipitation Modeling under Limited Climatic Data. Water Resources Management 34, 263-282 (2020).
8. Salih Katircioglu, Tezcan Abasiz, Sevgi Sezer & Setareh Katircioglu. Volatility of the alternative energy input prices and spillover effects: a VAR [MA]-MGARCH in BEKK approach for the Turkish economy. Environmental ¡Science and Pollution Research 26, 10738-10745 (2019).
Статья поступила в редакцию 5 декабря 2022 г.;
доработана 15 февраля 2023 г.; рекомендована к печати 16 февраля 2023 г.
Контактная информация:
Товстик Татьяна Михайловна — канд. физ.-мат. наук, доц.; [email protected]
Stationary reversibles processes MA and ARMA
T. M. Tovstik
St. Petersburg State University, 7-9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation
For citation: Tovstik T. M. Stationary reversibles processes MA and ARMA. Vestnik of Saint Petersburg University. Mathematics. Mechanics. Astronomy, 2023, vol. 10(68), issue 3, pp. 530544. https://doi.org/10.21638/spbu01.2023.307 (In Russian)
In this paper, we show how to choose an adequate model of a reversible stationary moving average process of finite order, given the appropriate number of sample correlations. For an order no higher than the fifth, a one-to-one correspondence between the coefficients and correlations of the process is established. For higher-order moving average processes, a mixed autoregression and moving average model is preliminarily fitted to the initial data. This option also has an independent meaning.
Keywords: stationary reversible processes MA, ARMA, estimation of process parameters. References
1. Hannan E. J. Multiple time series. John Wiley and Sons (1970) [Rus. ed.: Hannan E.J. Mno-gomernye vremennye riady. Moscow, Mir Publ. (1974)].
2. Durbin J. Efficient estimation of parameters in moving-average model. Biometrika 46, 306—316 (1959).
3. Anderson T.W. The statistical analysis of time series. John Wiley & Sons (1971). [Rus. ed.: Anderson T.W. Statisticheskii analiz vremennykh riadov. Moscow, Mir Publ. (1976)].
4. Kavalieris. A Not on Estimating Autoregressive-Moving average Order. Biometrika 78, 920—922 (1991).
5. Tovstik T.M. On estimating the parameters of the correlation function of a stationary random process. Cibernetics 6, 131—136 (1975).
6. Tovstik T.M. Stationary random processes with rational spectral densities. St. Petersburg, St. Petersburg University Press (2000). (In Russian)
7. Mehdizadeh S. Using AR, MA, and ARMA Time Series Models to Improve the Performance of MARS and KNN Approaches in Monthly Precipitation Modeling under Limited Climatic Data. Water Resources Management 34, 263-282 (2020).
8. Salih Katircioglu, Tezcan Abasiz, Sevgi Sezer & Setareh Katircioglu. Volatility of the alternative energy input prices and spillover effects: a VAR [MA]-MGARCH in BEKK approach for the Turkish economy. Environmental Science and Pollution Research 26, 10738-10745 (2019).
Received: December 5, 2022 Revised: February 15, 2023 Accepted: February 16, 2023
Author's information:
Tatiana M. Tovstik — [email protected]