Н.А. Моисеев
ПОВЫШЕНИЕ ТОЧНОСТИ ПРОГНОЗИРОВАНИЯ МАКРОЭКОНОМИЧЕСКИХ ПРОЦЕССОВ ПОСРЕДСТВОМ УЧЕТА
ВЗАИМОСВЯЗЕЙ МЕЖДУ НИМИ
N.A. Moiseyev
INCREASE IN ACCURACY OF FORECASTING OF MACROECONOMIC PROCESSES BY MEANS OF ACCOUNTING OF INTERRELATIONS
BETWEEN THEM
При построении комплексных прогностических систем макроэкономических процессов исследователи зачастую прибегают к использованию регрессионного инструментария. Данный подход является одним из наиболее распространенных и позволяет получать не только точечные оценки значений прогнозируемых показателей, но и находить доверительные интервалы для данных значений с заданным уровнем надежности. В большинстве случаев каждый из рассматриваемых показателей моделируется и предсказывается согласно построенной специально для него модели отдельно от других. Таким образом, прогнозируемые индикаторы зачастую получаются либо несогласованными друг с другом, либо один из функционально связанных показателей прогнозируется через предсказания, полученные по остальным индикаторам. Например, при предсказании индексов Валового Внутреннего Продукта (ВВП), дефлятора ВВП и ВВП, выраженного в постоянных ценах, используется известная функциональная связь, а именно что индекс ВВП равен произведению индекса дефлятора ВВП на индекс реального ВВП. В связи с этим обычно строятся модели только для двух из данных показателей, а прогноз для третьего получается посредством выражения его значения через предсказания этих моделей. Однако при таком подходе теряется информация, которая могла бы быть получена из результатов работы модели для третьего показателя, что можно охарактеризовать как существенное упущение, так как данная информация могла бы улучшить полученные прогнозы. В работе высказывается идея того, что существует возможность повысить точность прогнозов функционально и корреляционно зависимых показателей, если после прогнозирования каждого из них по отдельности провести процедуру поправок полученных предсказаний посредством учета
взаимосвязей между ними. Так как система статистического учета процессов, происходящих в экономике на макроуровне, предполагает множество функциональных и корреляционных взаимосвязей между измеряемыми характеристиками экономической структуры, предлагаемый метод поправок предсказаний регрессионных моделей имеет достаточно широкую сферу применения. Следует отметить, что идеи, в некоторой мере напоминающие те, которые высказываются в данной научной работе, уже были опубликованы в некоторых международных статистических журналах и рассматривают регрессию с множественным откликом, т.е. моделирующую вектор целевых переменных. Такие модели состоят из системы регрессионных уравнений с предположением о некоторой степени корреляционной взаимосвязи между предсказываемыми целевыми переменными. Некоторое количество работ было посвящено непараметрическим моделям с двумя целевыми переменными, оцениваемых с помощью сглаживающих сплайнов, см. например Wang et al. (2000), Chen and Wang (2011), Welsh and Yee (2006) и Lestari et al. (2010), а также с применением полиномиального приближения, см. работу Chamidah et al. (2012). Целью таких моделей с множественным откликом является получение более точных предсказаний, чем по моделям с одной целевой переменной, так как в последнем случае учитывается только влияние объясняющих факторов на выходную переменную, а в первом добавляется информация о взаимозависимости между прогнозируемыми откликами. Данная взаимозависимость обычно представляется в виде дисперсионно-ковариационной матрицы ошибок, которая используется для взвешивания наблюдаемых отклонений при расчете оценок истинных параметров моделей по аналогии с обобщенным методом наименьших квадратов. Максимальный эффект в таком случае достигается при наличии достаточно сильной корреляционной взаимосвязи между анализируемыми откликами, что явно показано в работах Ruchstuhl et al. (2000), Welsh et al. (2002) и Guo (2002). Обычно регрессионные модели с множественными откликами широко применяются при анализе категориальных или панельных данных в области медицины и социологии, см. работы Wang et al. (2000), Chen and Wang (2011), Welsh and Yee (2006) и Antoniadis and Sapatinas (2007). Однако и в области экономики подходы, разделяющие схожую идею, могут давать повышенное качество моделей. Предпосылкой для данного улучшения точности прогнозов, как уже было сказано выше, является факт наличия функциональных и сильных корреляционных зависимостей среди основных макроэкономических индикаторов, которые могут быть использованы для повышения надежности разрабатываемых моделей.
МЕТОД УЧЕТА ФУНКЦИОНАЛЬНЫХ И КОРРЕЛЯЦИОННЫХ ЗАВИСИМОСТЕЙ МЕЖДУ МАКРОЭКОНОМИЧЕСКИМИ
ИНДИКАТОРАМИ
Пусть [ус,Хс^ = 1, ...,п] является рассматриваемым набором действительных данных, где ус - целевая переменная, а Хс = (1,х1С, х2с, ...,хтС) - конечный набор объясняющих переменных. Тогда линейная регрессионная модель для ус выглядит следующим образом:
ут = ХТБ + ^ или (1)
У = ХБ, (2)
где В - вектор-столбец параметров модели, рассчитываемый стандартным способом:
Б = (ХТХ )_1 ХТУ.
(3)
Также предположим выполнение следующих предпосылок.
Предпосылка 1: Строгая экзогенность ошибок, т.е. Е(гс|Х) = 0;
Предпосылка 2: Гомоскедастичность ошибок, т.е. Е(е'2 |Х) = а2;
Предпосылка 3: Нормальность ошибок, т.е. £1~Ы(0; а);
Предпосылка 4: Отсутствие полной мультиколлинеарности, т.е. ХТХ является положительно определенной матрицей;
Предпосылка 5: Отсутствие автокорреляции остатков, т.е. соу(£;;£у) = 0 1 ^у.
Тогда функция плотности вероятности для прогнозного значения на один шаг вперед у п+1 является сдвинутым и масштабированным I-распределением с степенями свободы.
г
Г
^(Уп+1 )
V
У + 1 2
\
У
д/МжЕП+^Уг
У
V 2 у
у +
(У
п+1
У п+1
)2
МБГЕ
п+1
у
У+1
(4)
где уп+1 является параметром сдвига и рассчитывается по формуле (2), а - параметром масштаба и вычисляется стандартным способом согласно следующей формуле:
МХГЕ(+, = з2 (1 + Х^ {ХТХ)~1 Х(+,), (5)
где - вектор-столбец значений объясняющих переменных, участвующих
2
в построении прогноза на период С + ¿, б2 - несмещенная оценка дисперсии ошибок, рассчитывающаяся следующим образом:
п
I (у - у )2
-• (6)
j 2 =i=1
n - m -1
Далее предположим, что имеется набор целевых переменных
(1) (2) (К) R
yt , yt ,. ■ -,Ус , каждая из которых моделируется с помощью набора данных
соответственно, а также что все рассматриваемые целевые переменные связаны между собой некоторой функциональной зависимостью:
у( > =f (у(1),.., У(' -1), У!'+1',..., У!к'), (7)
где fa обозначает функцию, которая выражает у^ через остальные целевые переменные.
Для обеспечения надежности получаемых далее выводов предположим выполнение еще одной предпосылки:
Предпосылка 6: Отсутствие корреляции остатков рассматриваемых
целевых переменных, т.е. с ov^ = О , Vi^j. Особо отметим, что
данное условие обычно выполняется при моделировании векторов с достаточно большим числом макроэкономических индикаторов и их волатильности сравнимы по величине.
Тогда существует возможность провести корректировки полученных прогнозов, учитывая полученные функции плотности вероятности и известную функциональную связь между целевыми переменными. Данную процедуру предлагается проводить с помощью Метода Максимального Правдоподобия (ММП, англ. Maximum Likelihood Estimation), который был проанализирован, рекомендован и значительно популяризован Р. Фишером между 1912 и 1922 гг. Суть метода сводится к максимизации так называемой функции правдоподобия, которая представляет собой совместную плотность вероятности набора анализируемых случайных величин. В случае с упомянутыми выше функционально зависимыми целевыми переменными совместная плотность вероятности может быть представлена следующим образом с использованием функции ft:
LH = 41уШ...,уПКИ)-4)л 4(уПК). (8)
Таким образом процедура корректировки полученных прогнозов сводится к поиску таких значений прогнозируемых случайных величин, которые максимизировали бы выражение (8). С целью снижения вычислительной сложности расчета оптимальных параметров при
максимизации функции правдоподобия (8) прибегнем к процедуре логарифмирования совместной плотности вероятности, что даст в результате сумму рассматриваемых функций вместо их произведения.
1св-ьи = 1п{ч(/Ь£>, ж,.., у™])}+ Цч (ж )}+л + 1п К бе;)}. (9)
Поскольку логарифм является монотонно возрастающей функцией, то значения аргументов, максимизирующих выражения (8) и (9), будут совпадать. С учетом степени развития вычислительных технологий на данный момент поиск такого решения осуществляется за приемлемое время даже при условии, что число рассматриваемых целевых переменных достаточно большое.
Помимо проводимых корректировок полученных прогнозов можно также получить скорректированную функцию плотности вероятности для всех целевых переменных под рассмотрением. Данную процедуру предлагается проводить с помощью вычисления маргинального распределения для анализируемой целевой переменной, которое учитывает вероятностные распределения остальных выходных переменных и функциональную связь между ними. Таким образом, согласно данному способу, скорректированная функция плотности вероятности вычисляется как показано ниже:
где нормировочная константа в знаменателе представляет собой интеграл функции правдоподобия по всем целевым переменным под рассмотрением, а
вычисляется следующим образом:
Таким образом из исходного вероятностного распределения для целевой переменной получается скорректированная функция плотности вероятности, при этом дисперсия скорректированного распределения будет меньше либо равна дисперсии исходного, см. рисунок 1.
(10)
X х
"(уЕ)= |л (г> )л ч,/„и ,№ ,...У<;;,2),& ...,
(11)
У(П+11
Рисунок 1. Пример скорректированной и исходной функций плотности
вероятности
Как видно из рисунка 1, моды скорректированной и исходной функций распределения различны, что говорит о присутствии некоторой поправки прогнозируемого значения, поскольку мода скорректированного распределения соответствует точке максимума функции правдоподобия.
Далее рассмотрим ситуацию, когда набор рассматриваемых целевых переменных не связан строгой функциональной зависимостью, но при этом присутствует сильная корреляционная зависимость между моделируемыми случайными величинами. Предположим строится система моделей для
(1) (2) (К)
целевых переменных у ,ус ,... ,ус , каждая из которых моделируется с помощью набора данных ... соответственно, а также что все
рассматриваемые целевые переменные связаны между собой некоторой линейной корреляционной зависимостью:
у )=ь0 )+ь ы(1)+ь2 Ы(2)+...+ь* Ы*)+е). (12)
Тогда, согласно модели (12), функция плотности вероятности для
~ (О
прогнозируемого значения целевой переменной является сдвинутым и масштабированным /-распределением с V = п — К — 1 степенями свободы.
щ И/:,..., ы::1.., /*))= м^,«- * -1), аэ)
где
Ы+1 = ьь!' УЧ1: Ь^уЦ):...: Ь^у*, (14)
а МБРЕп+1 - параметр масштаба, который вычисляется стандартным способом согласно формуле (5).
Отсюда делаем вывод, что если домножить совместную плотность
вероятности на плотность данного распределения, то получится функция правдоподобия, которая учитывает корреляционную взаимосвязь между рассматриваемыми целевыми переменными. В формуле ниже приведена функция правдоподобия для вычисления поправки для /-ой целевой переменной.
ьи (у (0; )=ч, (у£ )лча. (у (у« | у 0;,..., у ^, у<-;) ,..., у (К»). (15)
Из формулы (15) легко заметить, что параметры функции р ¿, а именно параметр масштаба и параметр сдвига зависят от неизвестных нам на момент
(1) (2) (¿-1) (¿ + 1) (К)
прогнозирования величин , по которым
строится регрессия на величину . Поэтому при вычислении функции
правдоподобия функции и имеют одно и то же значение
аргумента, однако у первой параметры постоянны, а у второй - зависят от значений, принимаемых остальными целевыми переменными в процессе оптимизации. Здесь следует особо отметить, что несмотря на то, что в результате максимизации функции правдоподобия (15) поправкам подвергаются все рассматриваемые целевые переменные, данную функцию правдоподобия нецелесообразно использовать для вычисления поправки
отличной от Уп1г величины. Рекомендуется при вычислении поправок для каждой из рассматриваемых целевых переменных использовать отдельную функцию правдоподобия, в которой корректируемая целевая переменная выражается через остальные с помощью линии регрессии. Исходя из вида формулы (15) можно сказать, что поправки, полученные при регрессии одной из целевых переменных на все остальные не равны поправкам при регрессии другой целевой переменной на все оставшиеся. Рассчитываемые корректировки будут совпадать только в случае строгой функциональной связи между выходными переменными под рассмотрением. Таким образом возникает проблема выбора между получившимися корректировками, которую в данной научной работе предлагается решить посредством выбора той корректировки, при проведении которой корректируемая целевая переменная моделируется через остальные с помощью линии регрессии. Действуя таким образом, можно добиться более существенного улучшения качества получаемых прогнозов.
Для вычисления исправленной функции плотности будем по аналогии с предыдущим случаем вычислять маргинальное распределение для анализируемой целевой переменной, которое учитывает вероятностные распределения остальных выходных переменных и корреляционную связь между ними. Таким образом, согласно данному способу, скорректированная функция плотности вероятности вычисляется как показано ниже:
n )
да
Jn(y« к"0')
U'h)=« , ,
yii,' ()
где нормировочная константа в знаменателе представляет собой интеграл функции правдоподобия по всем целевым переменным под рассмотрением, а
n (yjilх) вычисляется следующим образом:
да да
й(у« )= Ja Jy,К(y)л ^(y« )л ^A-(yf;>).
-да _да (17)
•Л|y&y^ ),y£?)уКЫ),л )л
ЭМПИРИЧЕСКОЕ И ИМИТАЦИОННОЕ ТЕСТИРОВАНИЕ МЕТОДА УЧЕТА ФУНКЦИОНАЛЬНЫХ И КОРРЕЛЯЦИОННЫХ
ЗАВИСИМОСТЕЙ
С целью тестирования эффективности предлагаемых в данной работе методов проведем имитационные и эмпирические эксперименты. Сначала проверим насколько хорошо работает разработанная система поправок для искусственно сгенерированных данных при наличии функциональной связи между прогнозируемыми переменными. Рассмотрим простейший случай, когда моделируются три целевые переменные у1г, у2 г и у3 г с помощью однофакторной линейной регрессионной модели, а именно:
у , = А о+А1 х t +8 г >
Ун = Р20 + Р2 1Х21 + 8 21, (18)
Уъг = Р30 + Рз1Х3г + 8 • Причем моделируемые целевые переменные связаны функциональной зависимостью у3 г = у1 г + у2 г. Объясняющие переменные х 1 г и х 2 г генерируются исходя из нормального распределения с нулевой средней и единичной дисперсией, а переменная х 3 г - с помощью функциональной связи х 3 г = х 1 г + х 2 г. Истинные параметры данного эксперимента устанавливались на уровнях 0 = 2 , //2 0 = 2 , /^ 1 = 0 . 7 и //2 1 = 0 . 7. Истинные ошибки первых двух моделей генерируются исходя из нормального распределения с нулевой средней и единичной дисперсией, а именно: и . По
третьей модели истинные коэффициенты и ошибки в явном виде не генерируются, поскольку узг и хзг определяются функционально согласно значениям факторов и целевых переменных по первым двум моделям.
В таблице 1 представлена среднеквадратическая реализованная ошибка прогноза для моделей (18), обозначенных как у1г, у2г и у31, а также для моделей с учетом предложенных поправок (у1г, у2г, у31) и для моделей с учетом всех объясняющих переменных системы, приведенных ниже:
у1/ _ С10 : С11ХИ : С12ХИ : С13ХЪг,
у2/ _ С20 : С21ХИ : С22ХИ : С23Х3г, (19)
Уъг ~ С30 : СЪ1ХИ : СЪ2Х2г : СЪЪХЪг.
Для обеспечения всеобъемлющего имитационного эксперимента описанные модели тестировались на окнах данных различной длины (п) и сравнивались по показателю среднеквадратической реализованной ошибки прогноза, для расчета каждой из которых использовалось по 10 000 имитаций. Исходя из этого, полученные в результате эксперимента данные можно рассматривать в качестве основания для того, чтобы сделать состоятельные выводы относительно эффективности работы предлагаемых методов.
Таблица 1. Сравнение анализируемых методов, имитационный
эксперимент, функциональная зависимость
_У и_У 21_Узе У и Угг Утл У и_Уж_Уз±_
5 1.8019 1.8276 3.5756 1.6442 1.6751 3.1601 3.4469 4.0148 7.8445
6 1.5515 1.5467 3.0982 1.4703 1.4768 2.8733 2.3229 2.3652 4.7144
7 1.4329 1.4091 2.7944 1.3656 1.3667 2.6249 1.8767 1.8832 3.7273
8 1.3962 1.3734 2.7777 1.3517 1.3329 2.6383 1.7161 1.7349 3.4859
9 1.3225 1.2916 2.5672 1.2927 1.2604 2.4694 1.6013 1.5391 3.0879
10 1.2638 1.3012 2.5377 1.2414 1.2768 2.4443 1.4808 1.5111 2.9322
15 1.1418 1.1421 2.3064 1.1293 1.1299 2.2582 1.2341 1.2623 2.5204
20 1.0857 1.1089 2.1876 1.0776 1.0991 2.1631 1.1575 1.1763 2.3346
50 1.0217 1.0273 2.0583 1.0189 1.0263 2.0527 1.0432 1.0533 2.1087
80 1.0151 1.0275 2.0108 1.0149 1.0263 2.0069 1.0292 1.0371 2.0383
100 1.0209 1.0005 2.0009 1.0212 0.9995 1.9939 1.0339 1.0107 2.0215
Как видно из таблицы 1, предложенный метод поправок прогнозируемых целевых переменных превосходит по точности как модели (18), так и модели (19) практически при любом из рассматриваемых окон данных. Исключение составляет только среднеквадратическая реализованная ошибка по модели уи для окна наблюдений п = 100, которая в результате проведенных имитаций оказалась незначительно меньше ошибки,
полученной согласно предложенной модели уг
По всем целевым переменным и рассматриваемым методам точность предсказания растет с увеличением числа наблюдений и при достаточно длинном окне данных различия в среднеквадратической реализованной ошибке прогноза можно считать несущественными. Однако при анализе временных рядов макроэкономических процессов практически всегда приходится работать в условиях недостатка статистических данных. Как известно при моделировании таких данных слишком длинное окно способствует получению таких же неточных прогнозов, как и слишком короткое. Вследствие этого зачастую при анализе макроэкономических процессов возникают условия ограниченной статистики где применение предлагаемых поправок позволяет ощутимо сократить ошибку прогноза.
Далее перейдем к эмпирическому тестированию метода поправок с учетом функциональной связи моделируемых целевых переменных. Рассмотрим простейшее трехфакторное макроэкономическое уравнение: индекс ВВП равен произведению индекса дефлятора ВВП на индекс реального ВВП. Для тестирования разработанных методов была собрана поквартальная статистика по США для данных индикаторов, начиная с Р1.1947 и заканчивая Р3.2016. Таким образом набор статистических данных для проведения эмпирического эксперимента составляет 279 наблюдений. Базовая система моделей представляется в виде авторегрессии четвертого порядка как показано ниже:
1 pt - ¿>10 + ¿11^-1) + ¿12^-2) + ¿13^-3) + Ь141р^-4)>
/V
1 qt - Ь20 + Ь211д{1 -1) + b221q(t-2) + Ь231д((-3) + Ь241д^-4) >
/V
1 pqt - Ь30 + Ь31^Н) + b321pq(t-2) + Ь33^^-3) + b341pq(t-4) ■
(20)
Также добавим к сравнению модели рассматриваемых трех целевых переменных с участием всех экзогенных переменных системы (20). Таким образом получим в некотором роде эквивалент приведенной формы системы одновременных линейных уравнений.
~ 4 4 4
~pt - Ь10 + X ¿И^Р^ - i) + X - ]) + X d1i1pq{t - к) >
I-1 4
У-1
4
1qt - Ь20 + X - /) + X С2г^(? - ]) + X ^2i1pq(t - к) =
к-1 4
I-1
4
]-1 4
к-1 4
~pqt - Ь30 + X -) + X С3;^ - ]) + X d3i1pq(t - к )■
I-1 у-1 к-1
<
<
В таблице 2 приведена среднеквадратическая реализованная ошибка прогноза по моделям (20), (21) и моделям с поправками согласно предлагаемому методу, рассчитанным по собранной базе статистических данных.
Таблица 2. Сравнение анализируемых методов, эмпирический
эксперимент, функциональная зависимость
n Ip Iq Ipq Ip Iq Ipq Ip Iq Ipq
20 0.9705 0.1103 0.9757 0.9123 0.1064 0.9702 2.4943 0.3209 2.4845
30 0.8295 0.0857 0.8598 0.7985 0.0837 0.8362 1.2493 0.1734 1.3475
40 0.7695 0.0775 0.8373 0.7444 0.0769 0.7971 1.0735 0.1281 1.1849
50 0.6878 0.0779 0.7502 0.6592 0.0779 0.7181 0.9584 0.1032 1.0215
60 0.6662 0.0792 0.7364 0.6341 0.0791 0.7009 0.8775 0.0951 0.9421
70 0.6654 0.0837 0.7683 0.6443 0.0828 0.7217 0.9275 0.0957 1.0054
80 0.6562 0.0887 0.7718 0.6481 0.0887 0.7199 0.8932 0.0988 0.9639
90 0.6516 0.0866 0.7941 0.6461 0.0867 0.7388 0.9257 0.0989 0.9981
100 0.5814 0.0776 0.6822 0.5694 0.0792 0.6537 0.8594 0.1081 0.8257
110 0.5294 0.0577 0.6628 0.5247 0.0581 0.6242 0.6032 0.0701 0.7112
120 0.5324 0.0511 0.6626 0.5208 0.0521 0.6256 0.5933 0.0588 0.7183
Как видно из таблицы 2, предложенный метод поправок прогнозируемых целевых переменных в подавляющем числе случаев превосходит по точности как модели (20), так и модели (21). Исключением в данном случае являются только среднеквадратические реализованные ошибки по модели Iqt для окон наблюдений п = 90, п = 100, п = 110 и п = 120, которые в результате проведенного эмпирического тестирования оказалась незначительно меньше ошибки, полученной согласно предложенной модели Iqt.
Далее перейдем к тестированию предлагаемых методов поправок получаемых прогнозов в случае, когда рассматриваемые целевые переменные связаны не функциональной, а корреляционной зависимостью. Начнем с проведения имитационного эксперимента. Пусть моделируются две целевые переменные ylt и y2t с помощью однофакторной линейной регрессионной модели, а именно:
Я = bio + bi X>
У2t ~ b20 ^ b21X2t ■
Причем моделируемые целевые переменные связаны некоторой корреляционной зависимостью y2t = fio + filylt + £t. Для машинной генерации эндогенных и экзогенных переменных данной системы
воспользуемся методом генерации коррелированных нормально распределенных случайных величин. Во-первых, определим истинную дисперсионно-ковариационную матрицу
х х2 У1 У2
1 0.1 0.15 0.1
2 - Х2 0.1 1 0.1 0.15
У1 0.15 0.1 1 0.9
У2 0.1 0.15 0.9 1
посредством эндогенными независимых, подчиняются
экзогенными и вектор-столбец , которые
которой задаются взаимосвязи между переменными системы. Далее введем идентично распределенных переменных нормальному закону распределения с нулевой средней и единичной дисперсией, что подразумевает, что
Е^т)- 1т .
После чего будем генерировать переменные хх х2 ух с и у2 с с помощью разложения Холецкого истинной дисперсионно-ковариационной матрицы .
X2t - S[2,^]Zt У^ - S[3,^]Zt
У 2t -
(23)
и - ^[4,.]^
где £ = Б 5Т, Б [ . ] - /-ая строчка нижней треугольной матрицы Б.
Таким образом для каждого наблюдения / получим участвующие в рассматриваемой системе уравнений переменные, которые имеют истинную дисперсионно-ковариационную матрицу . По аналогии с предыдущим имитационным экспериментом описанные модели тестировались на окнах данных различной длины ( ) и сравнивались по показателю среднеквадратической реализованной ошибки прогноза, для расчета каждой из которых использовалось по 10 000 имитаций. Исходя из этого, полученные в результате эксперимента данные можно рассматривать в качестве основания для того, чтобы сделать состоятельные выводы относительно эффективности работы предлагаемых методов.
В таблице 3 представлена среднеквадратическая реализованная ошибка прогноза для моделей (23), а также для моделей с учетом предложенных поправок и для моделей с учетом всех объясняющих переменных системы, приведенных ниже:
Ун С10 + С11Х1/ + С12Х2/,
~ , (24)
У2/ С20 + С21Х1г + С22Х2г' Для проведения поправок будем использовать две функции правдоподобия. Поправки и получаются посредством максимизации следующей функции правдоподобия:
ьи - ч»1 <У£1»1 )■ (У?Л )■ п И Уй), (25)
а поправки у±_ 2 и у2 _2 вычисляются с помощью максимизации функции правдоподобия, представленной ниже:
ьи - Ч»1 (у« )■ (у(2+)1 )■ п (у(2+> |ум ). (26)
Отличием функций правдоподобия (25) и (26) является то, что в
случае (25) строится регрессия для у^ ^ с фактором а для функции
(2)
правдоподобия (26) наоборот - используется уравнение регрессии для с
у™ в качестве объясняющей переменной.
Таблица 3. Сравнение анализируемых методов, имитационный
эксперимент, корреляционная зависимость
п У1 Уг У1.1 У2.1 У 1.2 У 2.2 У\ У 2
5 1.7458 1.7253 1.4577 1.4812 1.4985 1.4371 3.3691 3.2243
6 1.5144 1.5095 1.3197 1.3378 1.3465 1.3142 2.2871 2.2294
7 1.3914 1.3867 1.2512 1.2597 1.2736 1.2387 1.8487 1.8112
8 1.3371 1.3074 1.2136 1.2288 1.2324 1.2136 1.6348 1.6468
9 1.2675 1.2454 1.1714 1.1728 1.1877 1.1601 1.5057 1.4979
10 1.2128 1.2222 1.1281 1.1504 1.1413 1.1379 1.4051 1.4161
15 1.1376 1.1253 1.0859 1.0872 1.0949 1.0808 1.2343 1.2253
20 1.0684 1.0813 1.0394 1.0485 1.0446 1.0438 1.1325 1.1389
50 0.9996 1.0116 0.9887 0.9982 0.9904 0.9976 1.0158 1.0235
Как видно из таблицы 3, предлагаемый метод поправок во всех рассматриваемых случаях работает лучше, чем традиционные модели и модели с участием всех экзогенных факторов системы. При достаточно большом числе наблюдений разница в точности прогнозирования между анализируемыми подходами минимальна, однако при моделировании временных рядов макроэкономических процессов такая ситуация встречается крайне редко, из чего можно сделать вывод о наличии определенной практической значимости предлагаемых подходов.
Модель у х _ которая опирается на линию регрессии ух г от у2 и показывает более высокую точность прогноза, чем модель у1 _ 2, использующая уравнение регрессии у2 г от ух Аналогичный вывод можно
сделать и о моделях у21 -у2.2, где поправки с использованием регрессии у 2г от у± г работают лучше для прогнозирования переменной у 2 Среднеквадратические реализованные ошибки прогноза по сравниваемым моделям демонстрируют схожую нисходящую динамику с уменьшающейся разницей по мере увеличения числа наблюдений в окне данных. Таким образом, исходя из проведенного анализа, есть основания утверждать, что является целесообразным, применять рекомендацию, высказанную выше, о том, что в процессе выбора между получившимися корректировками, рекомендуется выбрать ту, при проведении которой корректируемая целевая переменная моделируется через остальные с помощью линии регрессии.
Перейдем к проведению эмпирического тестирования метода поправок прогнозов макроэкономических индикаторов на основе учета корреляционных зависимостей между ними. Здесь будем рассматривать дневные данные по двум фондовым индексам США ЭЛЛ и Б&Р 500. С целью обеспечения стационарности моделируемых процессов преобразуем исходные данные в темпы прироста. Для удобства дальнейшего анализа обозначим целевую переменную ЭЛЛ как у± а целевую переменную Б&Р 500 как . В данном эксперименте моделирование рассматриваемых целевых переменных осуществляется с помощью простой авторегрессионной модели, а именно:
Здесь отметим, что во избежание высокой степени мультиколлинеарности между лаговыми переменными системы (27) и, как следствие, малой информативности поправок при такой структуре уравнений переменная моделируется с помощью лага , а не . По аналогии с предыдущими экспериментами описанные модели тестировались на окнах данных различной длины ( ) и сравнивались по показателю среднеквадратической реализованной ошибки прогноза, для расчета каждой из которых использовались дневные данные по рассматриваемым фондовым индексам США за период с 05.10.2012 по 05.10.2017.
В таблице 4 представлена среднеквадратическая реализованная ошибка прогноза для моделей (27), а также для моделей с учетом предложенных поправок и для моделей с учетом всех объясняющих переменных системы, приведенных ниже:
По аналогии с предыдущим имитационным экспериментом для
>1/ = Ь10 + Ь11>1(/-1) > >2/ = Ь20 + Ь21>2(/ - 2 )•
(27)
>1/ - С10 + С11>1(/-1) + С12у2(/-2У У2/ - С20 + С21У1(/-1) + С22>2(/-2).
(28)
проведения поправок будем использовать две функции правдоподобия. Поправки и получаются посредством максимизации функции
правдоподобия (25), а поправки уг.2 и у2.2 вычисляются с помощью максимизации функции правдоподобия (26).
п
У\
Таблица 4. Сравнение анализируемых методов, эмпирический
эксперимент, корреляционная зависимость
У 2 У 1.1 Угл У 1.2 У 2.2 У\_У 2.
5 1.0316 1.1901 0.8787 0.9914 0.8813 0.9731 1.6726 1.8255
6 0.9159 1.0409 0.7846 0.8589 0.7929 0.8524 1.3907 1.4832
7 0.8381 0.9439 0.7569 0.8232 0.7564 0.8107 1.1868 1.2695
8 0.7646 0.8501 0.7084 0.7645 0.7134 0.7627 1.0383 1.1243
9 0.7322 0.8268 0.6798 0.7433 0.6853 0.7418 0.9737 1.0591
10 0.6858 0.7825 0.6585 0.7182 0.6603 0.7157 0.8821 0.9529
15 0.6429 0.7235 0.6191 0.6723 0.6196 0.6701 0.7339 0.7872
20 0.6161 0.6753 0.5999 0.6424 0.6019 0.6436 0.6789 0.7301
30 0.5799 0.6476 0.5731 0.6209 0.5756 0.6208 0.6133 0.6643
50 0.5763 0.6267 0.5679 0.6111 0.5717 0.6118 0.5968 0.6406
Анализируя результаты, представленные в таблице 4, можно заключить, что предлагаемый метод поправок дает меньшую по сравнению с другими методами среднеквадратическую реализованную ошибку прогноза при любом из рассматриваемых числе наблюдений. Однако в сравнении с таблицей 3, где превосходство модели у±.± над у±.2 и модели у2.2 над у2.± было однозначно, при моделировании эмпирических данных в отдельных случаях модель работает несколько лучше, чем модель (при числе наблюдений ), а также является более точной, чем (при числе наблюдений п = 2 0 и п = 5 0 ). Во всех остальных случаях наблюдается аналогичная таблице 3 ситуация.
Также можно отчетливо проследить, что предлагаемый метод дает существенное улучшение качества прогноза по сравнению с моделями (27) и (28), особенно в условиях короткого окна данных. Модели (28) являются явными аутсайдерами по точности получаемых прогнозов, что явно заметно в условиях малого числа наблюдений. Причиной этому служит тот факт, что каждая из этих моделей включает в себя все экзогенные переменные системы регрессионных уравнений, что требует оценки большего числа параметров, чем для моделей (27). Вследствие этого возрастает общая неопределенность относительно прогнозируемого значения, поскольку она учитывает неопределенность в оценке каждого из имеющихся параметров регрессионного уравнения. Естественно, данный эффект нивелируется при
увеличении числа наблюдений. Однако, несмотря на то, что при достаточно длинном окне данных разница в точности прогнозирования между анализируемыми подходами минимальна, данный метод представляется актуальным в силу того, что при моделировании временных рядов макроэкономических процессов ситуация достаточности статистических данных встречается крайне редко, а даже в тех ситуациях, когда это так, длинное окно данных не дает улучшения точности прогноза, а наоборот достаточно часто происходит ее падение.
Модель , которая опирается на линию регрессии от , в среднем показывает более высокую точность прогноза, чем модель у 1 _2, использующая уравнение регрессии от . Аналогичный вывод можно сделать и о моделях - , где поправки с использованием регрессии от показывают более высокую эффективность для прогнозирования целевой переменной . Однако по сравнению с имитационным экспериментом в данном случае различие между этими противопоставляемыми моделями не так велико. Тем не менее в среднем можно заключить, что модель у1ш 1 работает лучше модели , а модель - лучше модели . Таким образом эмпирический эксперимент также, как и имитационный, подтверждает целесообразность высказанной выше рекомендации относительно того, что в процессе выбора между получившимися корректировками, рекомендуется выбрать ту, при проведении которой корректируемая целевая переменная моделируется через остальные с помощью линии регрессии.
5. ЗАКЛЮЧЕНИЕ
В работе представлен метод учета функциональных и корреляционных взаимосвязей между моделируемыми макроэкономическими индикаторами. Проведенные имитационные и эмпирические эксперименты показывают на достаточно простых примерах практическую пользу от предлагаемых методов поправок прогнозов при одновременном моделировании временных рядов макроэкономических процессов функционально или корреляционно зависящих друг от друга. При проведении таких поправок получаемые прогнозы являются согласованными между собой, а не «оторванными» выходами каждой из несвязанных между собой моделей, что неминуемо сказывается на их качестве. В общем и целом, разработанные методы дают значимое улучшение качества прогнозов по сравнению с регрессионными уравнениями, моделирующими каждый макроэкономический процесс по отдельности, а также работают лучше моделей, включающих все экзогенные переменные рассматриваемой системы уравнений. Данный положительный эффект достигается за счет
использования незадействованной в традиционных моделях информации о виде функциональной или корреляционной зависимости между прогнозируемыми целевыми переменными. В силу того, что существует возможность функционально связать большинство макроэкономических индикаторов между собой предлагаемый в данной научной работе метод поправок получаемых прогнозов может считаться актуальным для комплексного прогнозирования макроэкономических систем.
ПРИМЕЧАНИЯ
1. Antoniadis, A., and Sapatinas, T., (2007). Estimation and Inference in Functional Mixed-Effects Models. Computational Statistics and Data Analysis 51, 4793-4813.
2. Chamidah, N., Budiantara, I.N., Sunaryo, S., and Zain, I., (2012). Designing of Child Growth Chart Based on Multi-Response Local Polynimial Modelling. Journal of Mathematics and Statistics, 8(3): 342247.
3. Lestari, B., Budiantara, I.N., Sunaryo, S., and Mashuri, M., (2010). Spline Estimator in Multi-Response Nonparametric Regression Model with Unequal Correlation of Errors. Journal of Mathematics and Statistics, 6(3): 327-332.
4. Moiseev N.A., Manakhov S.V., Demenko O.G. (2016). Boosting regional competitiveness level via budgetary policy optimization. International Journal of Applied Business and Economic Research. Т. 14. № 10. С. 7315-7324.
5. Moiseev, N.A., (2016). Linear model averaging by minimizing mean-squared forecast error unbiased estimator. Model Assisted Statistics and Applications 11(4), 325-338.
6. Ruchstuhl, A., Welsh, A.H., Carroll, R.J., (2000). Nonparametric function estimation of the relationship between two repeatedly measured variables. Statistica Sinica 10, 51-71.
7. Wang, Y., Guo, W., and Brown, M.B., (2000). Spline Smoothing for Bivariate Data With Application to Association Between Hormones. Statistica Sinica 10, 377-397.
8. Welsh, A.H., Lin, X., Carroll, R.J., (2002). Marginal longitudinal nonparametric regression: locality and efficiency of spline and kernel methods. Journal of American Statistical Association 97, 482-494.
9. Welsh, A.H., Yee, T.W., (2006). Local regression for vector responses. Journal of Statistical Planning and Inference. 136(9):3007-3031.
10. Моисеев Н.А., Ахмадеев Б.А. (2014). Факторная модель динамики инфляционных процессов в инновационной экономике. Научно-аналитический журнал "Наука и практика" Российского экономического университета им. Г.В. Плеханова. № 2 (14). С. 40-52.
Моисеев Никита Александрович, к.э.н., доцент кафедры Математических методов в экономике РЭУ им. Г.В. Плеханова
mr.nikitamoiseev@gmail.com
Аннотация
Данная статья представляет параметрический подход к прогнозированию векторов макроэкономических индикаторов, который учитывает функциональные и корреляционные взаимосвязи между ними. Поскольку существует возможность функционально и корреляционно связать большинство индикаторов, утверждается, что данная информация позволяет добиться устойчивого снижения их среднеквадратической ошибки прогноза. Предлагаемый метод основывается на корректировке прогнозов, получаемых согласно традиционным регрессионным моделям, с учетом известной функциональной или корреляционной связи между рассматриваемыми макроэкономическими индикаторами с помощью метода максимального правдоподобия. Также в статье приводится алгоритм вычисления общей формы скорректированной функции плотности вероятности для каждого из моделируемых индикаторов посредством нормализации его маржинального вероятностного распределения. С целью доказательства эффективности предлагаемого метода в работе проводится имитационное тестирование и эмпирическое тестирование на реальных исторических данных по макроэкономическим индикаторам ведущих мировых экономик.
Ключевые слова.
Регрессионный анализ, ВВП, Инфляция, Денежные агрегаты, Безработица, Метод максимального правдоподобия, Функция плотности вероятности, Функциональные и корреляционные зависимости макроэкономических индикаторов, Точность прогноза, Среднеквадратическая ошибка, Байесовская эконометрика.
Summary
This article represents parametrical approach to forecasting of vectors of macroeconomic indicators which considers functional and correlation interrelations between them. As there is an opportunity functionally and korrelyatsionno to connect the majority of indicators, is claimed that this information allows to achieve steady decrease in their mean square error of the forecast. The offered method is based on updating of the forecasts received according to traditional regression models taking into account the known functional or correlation communication between the considered macroeconomic indicators by means of a method of maximum likelihood. Also the algorithm of calculation of the general form of the corrected function of density of probability for each of the modelled indicators by means of normalization of his marginal probabilistic distribution is given in article. For the purpose of the proof of efficiency of the offered method in work imitating testing and empirical testing on real historical data on macroeconomic indicators of the leading world economy is held.
Keywords.
Regression analysis, GDP, Inflation, Monetary units, Unemployment, Method of maximum likelihood, Function of density of probability, Functional and correlation dependences of macroeconomic indicators, forecast Accuracy, Mean square mistake, Bayesian econometrics.