Макроэкономика
О МЕТОДАХ ПОСТРОЕНИЯ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ДЛЯ ДАТ СТРУКТУРНЫХ СДВИГОВ
Антон СКРОБОТОВ
Научный сотрудник РАНХиГС при Президенте Российской Федерации. E-mail: [email protected] Андрей ПОЛБИН
Заведующий лабораторией макроэкономического моделирования Института экономической политики имени Е.Т. Гайдара; заведующий лабораторией математического моделирования экономических процессов РАНХиГС при Президенте Российской Федерации, канд. экон. наук. E-mail: [email protected]
В работе приводится обзор методов построения доверительных интервалов для дат сдвигов во временном ряде. Рассматриваются интервалы, основанные как на предельном распределении доли даты структурного сдвига, так и на обращении тестовой статистики для тестирования гипотезы о том, что сдвиг происходит в конкретную дату. Рассматриваемые методы применяются к ряду реального ВВП РФ.
Ключевые слова: структурные сдвиги, доверительные интервалы, российский ВВП.
Введение
Исследование структурной нестабильности во временных рядах имеет длинную историю (см., например, обзоры Перрона (2006)1, Ка-зини и Перрона (2018)2). Одним из наиболее популярных подходов является моделирование этой структурной нестабильности в виде так называемых структурных сдвигов, когда временной ряд до определенного момента времени порождается одним процессом, а после этого момента - другим. Таких сдвигов может быть больше одного, и они часто предполагаются неслучайными (из-за малого их количества) и могут быть связаны с какими-либо важными историческими событиями, изменившими структуру случайного процесса. Понятно, что наличие таких структурных сдвигов влияет на получаемые статистические выводы, и неучет сдвигов может повлечь за собой неверную интерпретацию результатов, а также некорректные или неоптимальные прогнозы, если целью исследования является прогнозирование.
Обычно датировку структурных сдвигов определяют на основе минимизации суммы квадратов остатков в регрессии по всем возможным датам сдвигов. Понятно, что полученные оценки даты сдвигов являются точечными, и возникает вопрос, а можно ли построить интервал для конкретной даты сдвига, который с заданной вероятностью будет накрывать истинное значение этого сдвига? И действительно, в последнее время было разработано большое количество методов, которые позволяют построить такие доверительные интервалы, дающие возможность получить диапазон возможных дат сдвигов.
Цель настоящей работы заключается в систематизации подходов к построению доверительных интервалов для дат структурных сдвигов в одномерном временном ряде и апробации этих подходов на статистических данных по реальному ВВП РФ. Работа состоит из двух разделов. В первом разделе мы даем обзор методов построения доверительных интервалов для дат сдвигов, где рассматриваем по-
1 Perron, P. Dealing with Structural Breaks // Palgrave Handbooks of Econometrics: Vol. 1 Econometric Theory. Chapter 8. T.C. Mills and K. Patterson (eds.). 2006. Palgrave MacMillan, Basingstoke. Pp. 278-352.
2 Casini, A., Perron, P. Structural Breaks in Time Series. 2018. Prepared for Oxford Research Encyclopedia of Economics and Finance.
строение доверительных интервалов как на основе предельного распределения доли даты структурного сдвига, так и на основе обращения тестовой статистики для тестирования гипотезы о том, что сдвиг происходит в конкретную дату. Во втором разделе применяем описанные методы на временном ряде реального ВВП РФ, а в заключении формулируем полученные выводы.
Методы построения доверительных интервалов для оценок дат сдвигов
На сегодняшний день в литературе предложено достаточно много альтернативных методов построения доверительных интервалов для дат сдвигов.
Классическими работами по этой теме являются исследования Баи (1997)3, а также Баи и Перрона (19984; 20035), в которых был предложен метод построения доверительного интервала на основе асимптотического распределения оценки доли даты сдвига. Для простоты рассмотрим следующую модель:
х = в + №(Т0) + ... + РШЩЮ + ^= = zis.it е (Т0— + 1,27)] + щ , (1)
где Т°, . = 1,..., т - даты структурных сдвигов6; ои(Т°) = I ^ > Т°) - переменная, отвечающая за сдвиг в уровнях; I (•) - индикатор-функция, а щ предполагается слабо зависимым стационарным процессом. В качестве х( может выступать, например, темп роста ВВП.
Пусть Д. = Р]+1~РГ О = рИшТ-1 Ъи^р') и
О = рИтГ-1ЪЪ Е^г'ии). Тогда, как показано в работе Баи и Перрона (1998), выполняет-
ся следующий асимптотический результат:
(Д) (Т, - Т0) ^ агатах Ш(л -151 /2}
Д.ОД ] 1 1 ^
где знаки «крышек» над параметрами означают соответствующие оценки; №. является двусторонним броуновским движением, определенном на Я, и функция плотности распределения оценки является симметричной.
Из этого следует, что 100(1 — а)%-ный доверительный интервал строится как
{Т1 - О / Ц ] "1,Т1 + ЙО, / Ц ] + 1} ,
где q1 — а/2. является (1 — а/2)-ной квантилью случайной величины а^тах^^1-| 51/2}; квадратные скобки обозначают целую часть, а А, = (АДА,)2 /(А,¿1 А,).
Другие методы основаны на обращении тестовой статистики. Одной из первых таких работ стало исследование Эллайотта и Мюллера (2007)7. Эти авторы отмечают следующий недостаток метода, представленного в работе Баи и Перрона (1998): при его использовании доверительные интервалы будут меньше номинального уровня значимости при малых сдвигах (т.е. будут часто недонакрывать истинную дату сдвига). Причина этого недостатка заключается в том, что в работах Баи, а также Баи и Перрона (1998, 2003) величина сдвига предполагалась сходящейся к нулю со скоростью меньшей, чем Т"1/2, и соответствующие доверительные интервалы строились исходя из этого предположения.
Идея метода, предложенного Эллайоттом и Мюллером, заключается в следующем.
3 Bai, J. Estimation of a Change Point in Multiple Regression Models // The Review of Economics and Statistics. 1997. Vol. 79. Pp. 551— 563.
4 Bai, J., Perron, P. Estimating and Testing Linear Models with Multiple Structural Changes // Econometrica. 1998. Vol. 66. Pp. 47—78.
5 Bai, J., Perron, P. Computation and Analysis of Multiple Structural Change Models // Journal of Applied Econometrics. 2003. Vol. 18. Pp. 1-22.
6 Отметим, что в литературе для анализа датировки сдвигов обычно используется не сама дата сдвига T а ее доля, т.е. величина = T/T, показывающая местоположение этого сдвига в ряде. В дальнейшем для простоты изложения мы будем говорить о дате сдвига, принимая во внимание, что корректнее говорить именно о доле даты сдвига.
7 Elliott, G., Muller, U.K. Confidence Sets for the Date of a Single Break in Linear Time Series Regressions // Journal of Econometrics. 2007. Vol. 141. Pp. 1196-1218.
С%-ный доверительный интервал можно считать набором значений параметров, которые не отвергаются на (1 — С)%-ном уровне значимости. Наша цель - тестировать гипотезу о том, что истинной датой сдвига является Т1. Если эта гипотеза не отвергается, то дата сдвига Т1 входит в доверительное множество. Другими словами, доверительное множество дат сдвигов - это множество всех дат, для которых тест не отвергает нулевую гипотезу.
Для построения оптимального теста на тестирование гипотезы, согласно которой истинной датой сдвига является Т1, авторы максимизируют взвешенную среднюю мощность (по аналогии с методом, представленным в работе Эндрюса и Плобергера (1994)8) по величине сдвига и доле даты этого сдвига. Они руководствуются тем положением, что не существует равномерно мощного теста, поскольку эффективные тестовые статистики зависят от величины сдвига и истинной даты этого сдвига, которые в общем случае неизвестны. В итоге авторы доказывают, что локально наилучший тест будет отвергать нулевую гипотезу при больших значениях статистики:
1 т , , ,
и г (7 ) = У(IV) X V,) +
71 I=1 л=1 1
1 T
+ — — У
(У^2)-1 ( Zv,), (2)
(Т Т) ,=71+1 ^ ^Т+1
где = ztйt, щ - 01_Б-остатки от регрессии (1) исследуемого временного ряда; со12 и со,2 -оценки ковариационных матриц для ^-размерности (р х р).
Можно видеть, что эта статистика напоминает взвешенную сумму КРББ-статистик для каждой из двух подвыборок до и после сдвига (см. работы Бузетти и Харви (2001)9; Курозу-
ми (2002)10) для проверки нулевой гипотезы о стационарности. Процедура построения доверительного интервала заключается в следующем: строится статистика ит(Т1) для некоторого множества Т1£ (е, Т—е) и тестируется гипотеза Н0: Т1 =Т"; если гипотеза не отвергается, то дата включается в доверительное множество. Вследствие инвариантности теста относительно величины сдвига достигается контроль уровня накрытия при любой величине сдвига - в отличие от метода, предложенного Баи и Баи и Перроном (1998).
Чанг и Перрон (2016)11 показали, что для достижения точного уровня накрытия, наиболее близкого к номинальному уровню, подход Эллайотта и Мюллера является наилучшим, однако он приводит к слишком широкому доверительному интервалу, иногда накрывающему почти всю выборку (например, когда ошибки серийно коррелированы и отношение «сигнал/шум» высоко). Чанг и Перрон обсудили теоретическое обоснование этого феномена, используя нелокальную асимптотическую структуру, в которой величина сдвига не сходится к нулю при росте выборки (в отличие от подхода Баи и Баи-Перрона (1998, 2003), где величина сдвига предполагалась сходящейся к нулю со скоростью меньшей, чем Т "1/2).
В работе Ямамото (2018)12 предложена тестовая статистика, асимптотически эквивалентная тестовой статистике в (2), в которой долгосрочные ковариационные матрицы оцениваются при альтернативной гипотезе, т.е. когда в остатках есть сдвиг. Если действительная дата сдвига оценивается состоятельно, то такие остатки асимптотически не зависят от мешающих параметров. При альтернативной ги-
8 Andrews, D.W.K., Ploberger, W. Optimal Tests When a Nuisance Parameter is Present Only Under the Alternative // Econometrica. 1994. Vol. 62. Pp. 1383-1414.
9 Busetti, F., Harvey, A.C. Testing for the Presence of a Random Walk in Series with Structural Breaks // Journal of Time Series Analysis. 2001. Vol. 22. Pp. 127-150.
10 Kurozumi, E. Testing for Stationarity with a Break // Journal of Econometrics. 2002. Vol. 108. Pp. 63-99.
11 Chang, S., Perron, P. A Comparison of Alternative Methods to Construct Confidence Intervals for the Estimate of a Break Date in Linear Regression Models // Econometric Reviews. 2016. Vol. 37. Pp. 577-601.
12 Yamamoto, Y. A Modified Confidence Set for the Structural Break Date in Linear Regression Models // Econometric Reviews. 2018. Vol. 37. Pp. 974-999.
потезе модифицированный тест является возрастающей функцией от величины сдвига в отличие от оригинального теста, что приводит к большей мощности теста и к более корректному и меньшему доверительному интервалу. Даже если сдвиг является малым, то уровень накрытия не сильно отличается от альтернативных методов.
Курозуми и Ямамото (2015)13 модифицируют статистику иТ(Т), более аккуратно выбирая взвешивающую функцию для величины сдвига во взвешенной средней мощности14, и предлагают, по аналогии с работой Эндрюса и Плобергера, три теста: средний, экспоненциальный и супремум, предельные распределения которых зависят от (доли) даты сдвига.
Несколько иная стратегия построения доверительного интервала представлена в исследовании Эо и Морли (2015)15, в котором, на основе обобщения результатов работы Зигмунда (1988)16, в качестве тестовой статистики предлагается брать статистику отношения правдоподобия. В этом случае доверительный интервал для дат сдвигов строится точно так же, как и в предыдущих методах, основанных на обращении тестовой статистики, - включая в себя те даты сдвига, которые не отвергаются 1_^тестом (тест включает в себя функцию правдоподобия для оцененной даты сдвига и функцию правдоподобия для тестируемой даты сдвига).
Построение доверительных интервалов для дат сдвигов в темпах экономического роста
В данном разделе мы переходим непосредственно к построению доверительных интерва-
лов для дат сдвигов в долгосрочном темпе роста реального ВВП РФ. В эмпирическом анализе мы используем ВВП российской экономики с первого квартала 1995 г. по второй квартал 2015 г. в постоянных ценах 2003 г., который был построен сцеплением временных рядов в постоянных ценах 2003 и 2008 гг.17. Из полученного ряда была удалена мультипликативная сезонная компонента с помощью фильтра Х-12-АШМА в программном пакете Eviews, после чего ряд был прологарифмирован. Поскольку основная цель исследования заключается в апробации методов построения доверительных интервалов, здесь мы используем временной ряд реального ВВП до смены методологии его построения Росстатом, что сделало временной ряд реального ВВП РФ несогласованным на отдельных отрезках времени.
До построения доверительных интервалов необходимо, во-первых, определить количество структурных сдвигов. Во-вторых, для построения доверительных интервалов на основе предельных распределений оценок (долей) дат сдвигов (метод Баи и Баи-Перрона (1998, 2003) необходимо иметь сами оценки дат сдвигов. В недавней работе Полбин и Скробо-тов (2016)18 при описании реального ВВП РФ в виде одномерного стохастического процесса на основе тестов, робастных к порядку интег-рированности ряда, определили наличие двух сдвигов. В качестве дат структурных сдвигов они получили третий квартал 1998 г. и второй квартал 2008 г., а сам временной ряд был идентифицирован как нестационарный (стационарный в разностях).
Важно отметить, что описанные нами методы, основанные на обращении тестовой ста-
13 Kurozumi, E., Yamamoto, Y. Confidence sets for the break date based on optimal tests // Econometrics Journal. 2015. Vol. 18. Pp. 412-435.
14 В работе Эллайотта и Мюллера взвешивающая функция выбирается так, чтобы тестовая статистика асимптотически не зависела от (доли) даты сдвига, так что критические значения также не зависели бы от (доли) даты сдвига.
15 Eo, Y., Morley, J. Likelihood-Ratio Based Confidence Sets for the Timing of Structural Breaks // Quantitative Economics. 2015. Vol. 6. Pp. 463-497.
16 Siegmund, D. Confidence Set in Change-Point Problems // International Statistical Review. 1988. Vol. 56. Pp. 31-48.
17 Национальные счета / Росстат. URL: http://www.gks.ru
18 Полбин А., Скроботов А. Тестирование наличия изломов в тренде структурной компоненты ВВП Российской Федерации // Экономический журнал ВШЭ. 2016. Т. 20. № 4. С. 588- 623.
тистики (Эллайотт-Мюллер; Ямамото; Куро-зуми-Ямамото), предполагают наличие только одного структурного сдвига. Однако этот недостаток легко преодолевается следующим образом. Если в нашем ряде два структурных сдвига, то, зафиксировав дату одного из них (например, взяв состоятельную оценку), можно построить доверительное множество для второй даты сдвига. Уровень накрытия дат сдвигов будет корректным, если зафиксированная дата первого сдвига совпадет с истинной его датой. Поэтому мы можем обеспечить асимптотически корректный уровень накрытия, беря состоятельную оценку даты первого сдвига.
С целью построения доверительных интервалов для дат сдвигов темпов экономического роста РФ мы применяем все вышеописанные подходы с модификацией19. При этом для каждого метода рассматриваются две альтернативные спецификации. В первой спецификации ковариационная структура ошибки пред-
полагается неизвестной и используются оценки долгосрочной дисперсии этой ошибки (построенной способом, соответствующим каждой из указанных работ20). В рамках второй спецификации предполагается, что темп роста реального ВВП описывается с помощью А^р)-процесса, а ошибки являются некоррелированными и гомоскедастичными. На основе информационных критериев и анализа кор-релограммы мы выбрали одно запаздывание. Используемые методы систематизированы в таблице, а на рис. 1-3 отображены построенные 90%-ные доверительные интервалы для дат сдвигов (закрашенная область на рис. 3 представляет собой доверительное множество для дат сдвигов).
Как показано на рисунках, некоторые доверительные интервалы получились разрывными, что может быть обусловлено мультимо-дальностью распределения для дат сдвигов на конечных выборках. Например, согласно подходу EM-AR второй структурный сдвиг мог
Методы, используемые для построения доверительного интервала
Метод
Курозуми-Ямамото. Статистика экспоненты
Спецификация Аббревиатура
АН(1 (-процесс exp-LR-AR
Робастные ошибки exp-LR
А1Ч(1 (-процесс avg-LR-AR
Робастные ошибки avg-LR
АН(1 (-процесс sup-LR-AR
Робастные ошибки sup-LR
АВ(1 (-процесс MEM-AR
Робастные ошибки MEM
АН(1 (-процесс EM-AR
Робастные ошибки EM
АР(1 (-процесс iLR-AR
Робастные ошибки ¡LR
АР(1 (-процесс Bai-AR
Робастные ошибки Bai
Курозуми-Ямамото. Статистика среднего
Курозуми-Ямамото. Статистика супремума
Ямамото
Эллайотт-Мюллер
Эо-Морли
Баи, Баи-Перрон
Источник: составлено авторами.
19 Мы выражаем признательность Ейджи Курозуми за предоставление GAUSS-кодов для методов Курозуми-Ямамото и Ямамото. Для построения доверительного интервала методом Ео-Морли мы используем код, написанный авторами на языке GAUSS и доступный по ссылке: https://sites.google.com/site/jamescmorley/research/code
20 Долгосрочная дисперсия оценивается непараметрически с использованием подходов, аналогичных методам Ньюи и Уэста (1987) или Эндрюса (1991).
произойти как на периоде 200502-200804, так и на периоде 201103-201302, период же 200901-201102 для структурного сдвига представляется маловероятным. Как и следовало ожидать, дополнительная информация об автокорреляционной структуре ошибок в виде AR (1)-процесса позволяет сузить доверительные интервалы, т.е. «ценой» за более общую спецификацию модели с робастными ошибками является более широкий доверительный интервал. В частности, для метода Эллайотта-Мюллера с робастными ошибками доверитель-
ные интервалы для двух дат сдвигов пересекаются и образуют единую полосу доверительного множества, которая почти полностью накрывает выборку.
В целом, почти все методы, за исключением метода Эо-Морли, основанного на обращении теста отношения правдоподобий, дают достаточно широкие доверительные интервалы для дат сдвига - продолжительностью более одного года. Для второго сдвига наблюдается значительное смещение доверительного множества влево относительно точечной оцен-
Рис. 1. Доверительные интервалы для дат сдвигов: логарифм индекса реального ВВП
ООООСГОООООООООСГОООООО'ОООО'ОООООООООСГОООООО
Источник составлено авторами.
Рис. 2. Доверительные интервалы для дат сдвигов: темп прироста реального ВВП, в % к предыдущему кварталу
6 4 2 0 -2 -4 -6
аооаоаоааасуаоаоаоасуаоаоаоаоасуаоаоаоаоаооо
* ' * * * * Г"^ г^ ^ ГМ О! Г"^ Г\1 Г\| г^ ГМ Рч] ^ Г^ Г*^ ^ГМГ\|ГМГМГМ(\)ГМ
Источник составлено авторами.
Рис. 3. Доверительные интервалы для дат сдвигов: датировка структурных сдвигов
о о о о
о о о о о
ааааааааа~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
iflinffiffiNNfflOffl ojcnaitnoicnaicntB.. ojcnaitnoicnaicntBcn
О О О О
U U * * IN IN CJ CJ ^ ^ UJ UJ 4J 4J I' I' CU CU U) O) t-J t-J * * IN IN CJ ГО ^ ^ Ю OOOOOOOOOOOOOOOOOOOO*-*-*-*-*-*-*-*-*-*-*-
ooooooooooooooooooooooooooooooo
O'lC'IO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'lO'l
Источник: составлено авторами.
ки 200802. Это говорит о том, что замедление темпов экономического роста могло произойти гораздо раньше кризиса 2008-2009 гг. Но достаточно вероятен и другой случай - когда структурный сдвиг наблюдался «в окрестностях» 2012 г.
Заключение
Важной проблемой прикладного экономет-рического анализа временных рядов является наличие структурных сдвигов, в рамках которых происходит изменение параметров процесса порождения данных, так как стандартные эконометрические методы без учета сдвигов могут давать сильно смещенные и несостоятельные оценки искомых параметров модели.
Одним из вариантов такого структурного сдвига может являться изменение параметра сноса во временном ряде первого поряд-
ка интегрированности, характеризующего долгосрочные темпы роста. Например, в соответствии с нашей гипотезой, согласующейся со статистическими данными, представленными в работе Полбина и Скроботова21, во временном ряде логарифма реального ВВП РФ «в окрестностях» кризиса 2008-2009 гг. произошел структурный сдвиг, в рамках которого долгосрочные темпы роста отечественной экономики снизились. Данное событие можно интерпретировать как исчерпание высокого потенциала роста за счет эффекта низкой базы после трансформационного спада и достижение некоторой границы производственных возможностей, соответствующей текущему уровню институтов и других фундаментальных детерминант долгосрочного роста.
Проблема замедления роста российской экономики не раз обсуждалась в литературе
21 Полбин А., Скроботов А. Тестирование наличия изломов в тренде структурной компоненты ВВП Российской Федерации // Экономический журнал ВШЭ. 2016. Т. 20. № 4. С. 588- 623.
(см., например, недавние работы Мау (2018)22; Дробышевского и Синельникова-Мурылева (2018)23; Кудрина и Гурвича (2014)24), однако при построении прикладных макроэкономических моделей структурные сдвиги, как правило, игнорируются. В свою очередь, игнорирование наличия структурных сдвигов может существенно ухудшать прогнозные свойства макроэкономических моделей в связи с неправильной спецификацией (см., например, работы Клеменса и Хендри (2006)25; Песарана и др. (2006)26). В частности, если мы будем оценивать модель для реального ВВП РФ по всей выборке, не учитывая замедления долгосрочных темпов роста, то получим завышенные оценки параметра сноса и будем переоценивать темпы роста при построении прогнозов.
При построении и оценке модели с учетом наличия структурных сдвигов одной из важнейших задач является оценка даты предполагаемого сдвига и ее точности. В настоящей работе мы сконцентрировали внимание на обзоре основных подходов при построении доверительных интервалов для дат структур-
ных сдвигов, что, как правило, и выступает основной характеристикой точности регрессионной оценки искомого параметра, а также на применении данных подходов при построении доверительных интервалов дат сдвига в долгосрочных темпах роста российского реального ВВП.
Согласно результатам анализа, хотя мы и можем с достаточной степенью уверенности идентифицировать два структурных сдвига в темпах роста реального ВВП РФ на периоде с 1995 г., точность оценки дат сдвигов оказывается низкой (доверительные интервалы достаточно широки). В этих условиях при прогнозировании динамики реального ВВП РФ перспективно использование методов, робастных к дате структурного сдвига. Например, в качестве итогового прогноза временного ряда можно использовать взвешенное среднее по прогнозам, полученным на основе оценок модели с перебором по датам сдвигов из заданного множества, либо оценивать модель с робастным взвешиванием по наблюдениям (см., например, работу Песарана и др.)27). ■
22 Мау В.А. На исходе глобального кризиса: экономические задачи 2017-2019 гг. // Вопросы экономики. 2018. № 3. С. 5-29.
23 Дробышевский С., Синельников-Мурылев С. Особенности роста экономики России в 2017 и 2018 гг.: стимулы и ограничения // Экономическое развитие России. 2018. № 2. С. 3-7.
24 Кудрин А., Гурвич Е. Новая модель роста для российской экономики // Вопросы экономики. 2014. № 12. С. 4-36.
25 Clements, M.P., Hendry, D.F. Forecasting with breaks // Handbook of economic forecastin. 2006. Vol. 1. Рр. 605-657.
26 Pesaran, M.H., Pettenuzzo, D., & Timmermann, A. Forecasting time series subject to multiple structural breaks // The Review of Economic Studies. 2006. Vol. 73. No. 4. Pp. 1057-1084.
27 Pesaran M.H., Pick A., Pranovich M. Optimal forecasts in the presence of structural breaks // Journal of Econometrics. 2013. Vol. 177. No. 2. Pp. 134-152.