УДК 330.43
Тестирование на единичный корень в панельных данных:
обзор1
Скроботов А.А.
В данном обзоре рассматриваются методы тестирования на единичный корень в панельных данных. Обсуждается вопрос о предпочтительности рассмотрения нескольких временных рядов совместно вместо анализа каждого по отдельности и мотивация тестирования на панельный единичный корень. Обзор начинается с рассмотрения простейших тестов на панельный единичный корень с независимыми ошибками и двух типов альтернативной гипотезы: однородной и неоднородной. Для простейших тестов описывается их асимптотическое поведение при различных типах сходимости числа объектов и временного горизонта. После рассматривается вопрос включения детерминированной компоненты и изменение асимптотических результатов, а также методы учета слабой зависимости ошибок. Завершается первый раздел методами на основе р-значений.
Следующий раздел посвящен важной проблеме учета пространственной корреляции в панелях и ее влиянию на классические тесты на панельный единичный корень. Пространственная корреляция имеет место согласно некоторым макроэкономическим теориям, которые утверждают, что существуют некоторые общие факторы (например, технологические шоки), которые влияют не на одну, а на некоторое множество переменных. Описываются модификации классических тестов, основанные на факторизации, когда пространственная корреляция аппроксимируется (возможно нестационарными) общими факторами на основе метода главных компонент и на основе аппроксимации факторов при помощи кросс-секционных средних. Рассматриваются альтернативные методы, основанные на методах ресемплинга. Завершается раздел сравнительным анализом различных тестов, которые были описаны в обзоре, на основе симуляций Монте-Карло. Обсуждается проб-
1 Статья подготовлена в рамках выполнения научно-исследовательской работы государственного задания РАНХиГС. Автор выражает благодарность АА. Пересецкому, а также анонимному рецензенту за ценные замечания и предложения. Более полная версия данного обзора с дополнительными результатами доступна на https://arxiv.org/submit/5789164/
Скроботов Антон Андреевич - д.э.н., с.н.с. лаборатории макроэкономического прогнозирования Института прикладных экономических исследований РАНХиГС. E-mail: [email protected]
Статья поступила: 16.08.2024/Статья принята: 07.11.2024.
лема, связанная с несбалансированностью панелей. В заключении приводятся ссылки на существующие пакеты, которые позволяют реализовать некоторые из описанных методов.
Ключевые слова: тестирование на панельный единичный корень; тестирование на стационарность панели; детрендирование; общие факторы; пространственная корреляция.
DOI: 10.17323/1813-8691-2024-28-4-664-701
Для цитирования: Скроботов А.А. Тестирование на единичный корень в панельных данных: обзор. Экономический журнал ВШЭ. 2024; 28(4): 664-701.
For citation: Skrobotov A.A. Panel Data Unit Root Testing: An Overview. HSE Economic Journal. 2024; 28(4): 664-701. (In Russ.)
1. Введение
Тестирование наличия единичных корней в данных имеет большое значение для эмпирического анализа. Практически ни одно макроэкономическое исследование не обходится без тестирования того, является ли конкретный временный ряд стационарным относительно тренда (trend stationary, TS) или является стационарным в первых разностях (difference stationary, DS). В первом случае, если ряд является стационарным относительно тренда, то моделировать ряд необходимо в уровнях. В противном случае нужно перейти к первым разностям временного ряда, если моделируется именно этот конкретный ряд по отдельности, или переходить к анализу коинтеграции нескольких временных рядов, каждый из которых является нестационарным. Наличие коинтеграции позволяет дать экономическое обоснование долгосрочных зависимостей и краткосрочной корректировке к долгосрочным состояниям равновесия. См. [Скроботов, 2020, 2021a, б] в качестве недавних обзоров.
Однако если рассматривать не отдельные временные ряды для конкретного субъекта (например, одной конкретной страны или одного конкретного региона), а группу (панель) временных рядов по каждому субъекту, то могут возникнуть некоторые проблемы. Существует феномен, который заключается в том, что если оценить регрессию одного нестационарного ряда на другие нестационарные ряды, то оценки OLS-коэффициен-тов будут часто значимы, даже когда фактически зависимости между рядами нет. Этот феномен называется ложной регрессией. Аналогичный вывод можно получить, рассматривая нестационарные временные ряды, у которых ошибки будут зависимыми. Существует необоснованное заблуждение, что для панельных данных ложная регрессия не наблюдается, особенно при малом количестве наблюдений по времени. Однако эффект ложной регрессии для панельных данных намного более существенен, чем для отдельных временных рядов. Хотя оценка в панельной регрессии для нестационарных (независимых в долгосрочном смысле) временных рядов и будет состоятельной (из-за того, что мы оцениваем модель в виде пула и усредняем все оценки по временным рядам), соответствующая ей t-статистика будет расходиться к бесконечности, что означает почти стопро-
центное отвержение нулевой гипотезы на больших выборках. Таким образом, выводы на основе этой t-статистики будут необоснованными, и необходимо проверять наличие коинтеграции между всеми временными рядами в панели, предполагая, что долгосрочная зависимость между различными показателями одинаковая. Однако до проверки наличия коинтеграции между панелями временных рядов необходимо проверить наличие единичного корня в панелях, и проверка коинтеграции происходит, если гипотеза о наличии панельного единичного корня не была отвергнута. Кроме этого, одна из причин перехода к панелям - низкая мощность классических тестов на наличие единичного корня, и объединение нескольких временных рядов в панели может позволить найти свидетельство стационарности определенного числа временных рядов в этой панели. Соответственно в данном обзоре мы акцентируем внимание на проблемах тестирования наличия панельного единичного корня в данных, тем самым дополняя более ранний обзор на русском языке [Ратникова, Фурманов, 2014, с. 125-130], в частности, тестами, учитывающими кросс-секционную корреляцию (см. также более раннюю версию в статье [Ратникова, 2006]).
Тесты на панельный единичный корень широко используются на практике. Среди примеров использования таких тестов можно привести исследования по тестированию паритета покупательской способности [Chortareas, Kapetanios, 2009] (двухсторонние реальные обменные курсы тестируются на стационарность), сходимости выпуска [Deckers, Hanck, 2013] (проверка на стационарность разрыва в выпусках между двумя экономиками или регионами), [Pesaran, 2007a], динамики доходов [Ng, 2008] (жизненный цикл и наблюдаемые эффекты неоднородности устраняются путем регрессии логарифмических доходов на возраст, квадрат возраста и дамми-переменные, связанные с образованием, а остатки, которые мы называем доходом, используются для анализа нестационарности), международные перетоки инвестиционных потоков в НИОКР (R&D) [Kao, Chiang, Chen, 1999] (исследуются отстатки от регрессии полной факторной производительности, TFP, на внешние и внутренние запасы капитала на НИОКР) и др. См. также [Baltagi, Kao, 2001; Choi, 2006a] с обзором приложений тестов на панельный единичный корень.
Данная работа состоит из следующих разделов. В разделе 2 обсуждаются как классические тесты на панельный единичный корень, так и недавно разработанные тесты. Гипотеза панельного единичного корня заключается в том, что все временные ряды в панели имеют единичный корень. Тестироваться эта гипотеза может, однако против разных альтернатив: однородной и неоднородной. Однородная альтернатива заключается в том, что все временные ряды в панели являются стационарными. Для тестирования гипотезы о панельном единичном корне против этой альтернативы используются t-статистики на основе модели пула. С другой стороны, при неоднородной альтернативе предполагается, что существует как доля стационарных временных рядов в панели, так и доля нестационарных временных рядов в панели, и эти доли не равны нулю (т.е. они должны быть значимы).
В разделе 3 обсуждается проблема кросс-секционной корреляции между ошибками в панели. Наличие такой корреляции может сильно исказить статистические выводы относительно наличия панельного единичного корня. Пространственная корреляция имеет место согласно некоторым макроэкономическим теориям, которые утверждают, что существуют некоторые общие факторы (например, технологические шоки), которые влияют не на одну, а на некоторое множество переменных. Наличие общих факторов, которые
дополнительно могут быть нестационарными, предполагает наличие пространственной коинтеграции между субъектами, которая также часто может иметь место. Также источником кросс-секционной корреляции может быть пространственная (spatial) корреляция, которая основана на пространственных взаимосвязях и пространственной неоднородности.
В разделе 4 приводятся ссылки на пакеты и программы, позволяющие реализовать часть методов, описанных в обзоре.
Более полная версия данного обзора с дополнительными результатами доступна на https://arxiv.org/submit/5789164/. В частности, в дополнение рассматриваются тесты на стационарность, тесты при фиксированной временной размерности и другие тесты на единичный корень в панели, которые нельзя однозначно отнести к определенной категории. Также обсуждаются методы оценивания доли стационарных временных рядов в панели.
2. Тесты на единичный корень для независимых панелей 2.1. LLC и IPS тесты
Рассмотрим простейший случай, в котором временные ряды {yi0.yiT} для кросс-секционных субъектов i = 1,2,...,N порождаются для каждого iпростой авторегрессией первого порядка
(1) У it = Pi У ,t-i + %,
где начальное значение y0 является фиксированной константой2, ошибки &и являются независимыми и одинаково распределенными (i.i.d.) по всем i и t с E(sit ) = 0, E (ег2 ) = of < да и E) < да. Эти процессы можно эквивалентно записать следующим образом, по аналогии с простой регрессией Дики - Фуллера:
(2) 4у а = Ф,- у,,,-i + eiï >
где Ayit = yit — yi t_j, фг = рг — 1. Нас интересует тестирование нулевой гипотезы
(3) Ho : ф = = 0,
т.е. гипотезы о том, что все временные ряды имеют единичный корень (являются независимыми случайными блужданиями), против одной из следующих альтернатив, Hla и
Hib :
2 Авторы работ [Harris et al., 2010; Westerlund, 2016b] анализировали влияние начального значения на тесты, описываемые ниже, получая противоположные выводы относительно мощности по сравнению с временными рядами. Вестерлунд [Westerlund, 2016b], среди прочего, указывает на отсутствие необходимости разработки робастной тестовой стратегии для различных амплитуд начального значения, рекомендуя просто игнорировать его влияние.
(4)
(5)
Hia : Ф = ••■ = Фж = Ф<0, H ib : ф1 <0,..., ф „ <0, N о < N.
о
При первой альтернативе, Hla , авторегрессионный параметр одинаковый для всех кросс-секционных субъектов. Эта альтернатива была рассмотрена в работе [Levin et al., 2002] (далее LLC, см. также более раннюю версию работы [Levin, Lin, 1993]) и была названа однородной альтернативой (homogeneous alternative). При второй альтернативе предполагается, что все N0 кросс-секционных объектов ( 0 < N0 < N ) являются стационарными с индивидуальными авторегрессионными коэффициентами. Эта альтернатива была рассмотрена в работе [Im et al., 2003] (далее IPS) и была названа неоднородной альтернативой (heterogeneous alternative).
Ченг и Сонг [Chang, Song, 2009] рассматривают также гипотезу о том, что ф, =0 для некоторых i против альтернативы о том, что фг < 0 для всех i. Для тестирования такой гипотезы они предлагают брать максимум из всех индивидуальных левосторонних статистик (т.е. ту статистику, которая показывает наименьшее отвержение нулевой гипотезы).
Для состоятельности тестовых статистик здесь предполагается, что доля стационарных временных рядов в панели сходится к фиксированной константе, т.е. N0/N ^ к при N ^ да. Отвержение нулевой гипотезы в пользу неоднородной альтернативы необязательно говорит о том, что наличие единичного корня отвергается для всех i, а только о том, что гипотеза отвергается для доли N0 < N, и тест не дает каких-либо рекомендаций о величине к или о тех элементах панели, для которых гипотеза отвергается. С другой стороны, отвержение гипотезы единичного корня против однородной альтернативы необязательно означает, что все панельные субъекты являются стационарными, поскольку тест, построенный таким образом, чтобы иметь мощность против однородной альтернативы, также будет иметь мощность и при неоднородной альтернативе.
Авторы работы [Karlsson, Lothgren, 2000] провели симуляции Монте-Карло в зависимости от доли стационарных временных рядов в панели и получили достаточно логичный результат, что мощность всех тестов увеличивается при увеличении пропорции стационарных временных рядов в панели. Также мощность увеличивается сильнее при росте T , чем при росте N. Следствием этого является то, что при больших T и достаточно малых пропорциях стационарных временных рядов в панели мы будем часто отвергать нулевую гипотезу о наличии единичного корня, в то время как при малых T даже при достаточно высокой пропорции стационарных временных рядов в панели из-за низкой мощности мы будем редко не отвергать нулевую гипотезу, после этого некорректно моделируя все временные ряды как нестационарные. Поэтому авторы рекомендуют не накладывать однородные ограничения на все временные ряды в панели, а анализировать эти временные ряды индивидуально.
2.1.1. LLC-тест
Тест LLC основан на t-статистике для ф в регрессии пула
4У it = фу,у-1 + Bit
или, используя матричные обозначения,
АУ,- = фу,- ,-1 + ,
где
АУг- = [1.к,Ау,г]', уг>_1 = [у0,Ун,--;у -1 ] И е,- = [,к,е,-Г]'. На первом шаге оценивается ст2 для каждого панельного временного ряда:
- 2 _ Ау'м, Ау,.
Т - 2
где Мг = 1Т - Хг (ХгХг) Хг и Xг- = (уг- ). Тогда ¿-статистика для проверки гипотезы (3) принимает вид
N ,
ЕАУг Уг 22
(6) = 1==
2
X Уг ,-1Уг ,-i/^i
Как отмечает Брейтунг [Breitung, 2000], в LLC предлагается дополнительно делить эту статистику на <jnt , общее (по всем N и T ) стандартное отклонение остатков, но эти остатки уже скорректированы на свои стандартные отклонения, поэтому это стандартное отклонение можно опустить.
2.1.2. IPS-тест
В отличие от LLC, рассматривая неоднородную альтернативу H1b, состоящую из
множества неравенств, IPS предлагают тест, основанный на среднем индивидуальных t-статистик,
1 Ж
(7) т =— Ехг,
где
(8) т.- =
N
Ау У ,-1
является t-статистикой Дики - Фуллера для /-го кросс-секционного субъекта.
Ченг и Сонг [Chang, Song, 2009] предлагают вместо усреднения тестовых статистик брать минимум из всех статистик, что позволяет получить более высокую мощность при очень малом количестве стационарных временных рядов в панели.
2.1.3. Асимптотика тестов на единичный корень в панельных данных
Рассмотрим получение предельного распределения для статистики LLC. Используя FCLT и CMT, можно показать, что при T ^ да
ЕЛу'- У г ,-i/a г2 ZlX (r )dWt (r)
(9) тф = L t ^t1
£у!,-1уг- 2
г =1
Jfjy (r )2 dr
где W(r), i = 1,...,N - независимые винеровские процессы, а ^ обозначает слабую сходимость. Применяя закон больших чисел, числитель (9) (деленный на N) сходится по
вероятности к нулю, а знаменатель (деленный на N) сходится к -1. Поэтому t-статистика
на основе регрессии пула (по центральной предельной теореме) имеет стандартное нормальное распределение.
Рассмотрим получение предельного распределения для статистики IPS. Понятно, что при T ^ да каждая статистика хг в (8) сходится к обычному распределению Дики -Фуллера,
(r )dWt (r )
T ^ П = —T"
JX (r )2 dr
Поскольку статистика
1 N
"n z?
при фиксированном N и T ^ да, то при N ^ да статистика VNт имеет стандартное нормальное предельное распределение, аналогично LLC.
Результаты выше были основаны на том, что сначала применяется асимптотика при T ^ да, а затем при N ^ да. Можно рассмотреть альтернативный подход, когда одновременно T, N ^ да (IPS доказывают, что асимптотические результаты остаются неизменными по сравнению с последовательной асимптотикой) или когда N является функцией от T , следуя работе [Phillips, Moon, 1999]3. Филлипс и Мун [Phillips, Moon, 1999]
3 Последний подход может принимать вид, например, T(N) = cN для c Ф 0. Этот подход в работе [Phillips, Moon, 1999] называется асимптотикой диагональной траектории (diagonal path).
вводят понятия последовательной и совместной сходимости по вероятности и слабой сходимости и устанавливают соотношения между этими типами сходимости. Авторы заключают, что последовательная асимптотика не предполагает совместную, так что в некоторых ситуациях совместная асимптотика может не выполняться. Хотя подходы, связанные с совместной асимптотикой, являются интересными с теоретической точки зрения и иногда дают полезные следствия, предельные результаты по существу такие же, как и в последовательной асимптотике, но требуют более сильных условий. С практической точки зрения последовательная асимптотика является достаточной для большинства случаев.
2.2. Наличие детерминированной компоненты
Более подробно остановимся на вопросе наличия детерминированных компонент в данных, а именно на спецификации детерминированной компоненты. Обычно нас интересуют два наиболее распространенных случая:
(10) 4Уи = h + Ф,-д,-i + &tt (Случай i),
(11) Ay, = ц г +ßit + фг yv _! + 6jt (Случай 2
где уравнение (10) соответствует случаю индивидуально-специфических констант (фиксированных эффектов), а (11) соответствует случаю индивидуально-специфических трендов («случайных трендов», incidental trends в терминологии [Phillips, Moon, 1999]).
Отметим, что многие тесты требуют условия, что N/T ^ да для контроля размера, так как в противном случае ошибка, вызванная детрендированием, будет возрастать с ростом N ; см. [Westerlund, Breitung, 2013, Fact 3].
2.2.1. Тест LLC
Для простоты рассмотрим Случай 1 с фиксированными эффектами. Тест LLC основан на t-статистике для ф в регрессии с фиксированными эффектами
4у а = а + Фу -i + eit
или, используя матричные обозначения,
Ay,- = 1 a + фУг,-1 + ег,
где АУ, = [Ay,-!,...,AyiT]', уг>_! = [у0,y,,...,y-T_i] , е, = ziT]' и 1 = [^...Д]'.
Недостатком этого подхода является то, что он сильно специфичен и не дает соответствующей аппроксимации для заданных Т и N, а также зависит от конкретной функциональной формы зависимости Т = Т(N) .
На первом шаге оценивается о2 для каждого временного ряда:
2 = Ду, мг дуг
i
T - 2
где Мг = 1Т - Xi (ХгХг) Хг и Хг = (1, уг _1). Тогда г>статистика для проверки гипотезы (3) принимает вид
N ,
£Ду. М^. ,/d 2
(12) ТФ =1Г
Z У. ,-iM1y! ,Va2
i=1
где M1 = IT -1 (l'l)1'.
Оценивание коэффициента ф эквивалентно оцениванию коэффициента ф в центрированной регрессии
=ф-1 + e,
где yit = yit — T 1 У j . При нулевой гипотезе мы получим
1 T
lim— YPu -1 = -аг2 /2, тT t=1
и
1 т <
lim —X У i,t-iy i,t-1 = ^/6,
г^® T t=1
так что VNT(ф — l) + 3>/N ^ N(0,51/5), т.е. T(ф — l) 3 . Следовательно, оценка ф является асимптотически смещенной, и t-статистика для проверки ф = 0 расходится к —да при росте T и N (из-за коррелированности регрессора и ошибки). Это смещение называется смещением Никелла (Nickell bias), см. [Nickell, 1981].
Этот результат можно получить иначе следующим образом. Заметим, что при T ^да>
N N
2 ;jc
(13) Тф = ^ '•=1 N -Z,
N N 1
XAy!M1y!-_1/a!2 XJoW" (r)dW (r)
i=1
2
0W (r )2 dr
где W? (r) = W (r) - J^Wi (s)ds - центрированный винеровский процесс, W (r), i = 1, ..., N -независимые винеровские процессы. Применяя закон больших чисел, числитель (13)
(деленный на N ) сходится по вероятности к —, а знаменатель (деленный на
2
сходится к —^. Поэтому t-статистика на основе регрессии пула расходится. V6
Имея значения для математических ожиданий и дисперсий функционалов от вине-ровских процессов, представленные в табл. 1 (см. [Levin, Lin, 1993], можно получить, что в Случае 1
а в Случае 2
Тф ^ N(-V1,875N,1,25), Тф ^ N(/75*,1).
Таблица 1.
Значения для математических ожиданий и дисперсий функционалов от винеровских процессов
Var ( fW/' dWi )
E ( i ( )2
Var ( J (W )2
H ( J = ^ ) (h, t ) ( j = x)
12 60
1 6
1 15
45 11 6300
1
2
1
2
После этого можно также получить, что статистика
S lAyi M1y!W/â!2 +1T I _ - i TN
(14) ZiiC = i-1 ^ . 2 > 2
fi iz^ ~ /1 [i ln , ™
будет иметь стандартное нормальное предельное распределение. Отметим, что при = 0 статистика ZLLC совпадает с Тф. Также следует заметить, что скорость сходимости для
оценки ф будет равна
Т-М (т.е. Т-М(ф -1) = Ор (1)), таким образом, сходимость происходит быстрее при Т ^ да (суперсостоятельность), чем при N ^ да. Также из скорости сходимости следует более высокая мощность панельных тестов, поскольку она увеличивается не только с ростом Т , но и с ростом N.
2.2.2. Коррекция числителя оценки коэффициента
Вспомним, что Т(ф — 1)3, и статистика (14) основана на коррекции оценки ф,
ф + = ф + 3/Т. Можно, однако, скорректировать не саму оценку коэффициента ф, а только ее числитель:
N < 2 NT 2
ZAy M1y! Ja2 + — аг2
(15) Ф # = ^-:-2
Z yi,-iMiy;
i=1
2
(см. [Hahn, Kuersteiner, 2002; Moon, Perron, 2004]). Тогда (в случае фиксированных эффектов) VnT(ф# — l) ^ N(0,3) и соответствующая t-статистика будет иметь стандартное нормальное распределение. Но в случае коррекции оценки коэффициента, как в LLC, 4NT(ф + — l) ^ N(0,51/5), так что последняя оценка для ф будет менее эффективна в смысле дисперсии, но обе t-статистики будут асимптотически эквивалентны.
2.2.3. Детрендирование, устраняющее смещение
Альтернативный способ исключить смещение при оценивании был рассмотрен в [Breitung, Meyer, 1994]. Авторы в качестве оценки константы использовали начальное значение yt0, так что регрессионная модель для Случая 1 (против однородной альтернативы Н1а) принимает вид
(16) 4Уй = Ф( У -1 - У 0) + .
При нулевой гипотезе величина E|(y t— y0 )s!t = 0, так что t-статистика для
ф в регрессии (16) не будет смещенной и будет иметь асимптотическое стандартное нормальное распределение. Полученный тест, являющийся t-статистикой в регрессии для преобразованных рядов, называем UBNT.
В случае наличия линейного тренда, чтобы получить несмещенную тестовую статистику, имеющую стандартное нормальное распределение, Брейтунг [Breitung, 2000] предложил рассмотреть следующую регрессию:
(17) Ду* = Фу>-1+4>
где
Ay* = s Ay-t - T-t((it + K + АУт )
= (T - t)/(T - t +1),
* t — 1 / \
У -1 = У ,t-1 — У 0 —Y (T — У0)'
Это преобразование называется преобразованием Гельмерта (Helmert transformation). В данном преобразовании вычитание yq удаляет константу, а
(Уп — Уо) /Т = (Ayi0 + к + AyiT) /Т является оценкой коэффициента при тренде. Смещения не возникает из-за ортогональности преобразованных регрессора и ошибки.
2.2.4. Тест IPS
Для тестов IPS коррекция связана только с конкретными детерминированными компонентами для каждого i, т.е. каждая статистика хг в (8) корректируется на некоторые средние и дисперсию, заданные в IPS, Table 3 (средние и дисперсии распределений Дики -Фуллера).
2.2.5. Коррекция на основе GMM
Другая возможность устранения смещения из-за детрендирования - использование альтернативных методов оценивания, таких как обобщенный метод моментов (Generalized Methods of Moments, GMM). Брейтунг [Breitung, 1997] применяет вторые разности для получения теста на единичный корень без корректировки смещения, используя соответствующую GMM-оценку.
2.3. Наличие слабой зависимости ошибок
Как и в случае временных рядов, логично было бы предположить, что ошибки s!t в (1) могут быть слабо зависимыми. Тогда, аналогично расширенному тесту Дики - Фуллера, можно аппроксимировать краткосрочную динамику добавлением запаздывающих разностей:
(18) 4Vit = dit + Фп-Ум-1 + Zv i, p. 4Vi,t - j + eit >
j=i '
где dit - некоторая детерминированная компонента.
В случае однородных альтернатив в LLC рекомендуется сначала очистить переменные от краткосрочной динамики, получая остатки eit (vit) от регрессии Ayit (yit) на 4y t-j , j = 1)k,p, и dit. Затем общий параметр ф можно оценить по регрессии пула
(19)
( eit /<* i) = Ф ( vi -i^ i) + vit>
где сг- - оцененная дисперсия еи . Однако регрессия на первом шаге не удаляет всю зависимость в ошибках, поскольку
lim E
T ^О
1
T - pt=p+i
X ev, t-A2
"Mo
где ю2 - долгосрочная дисперсия e it. В LLC предлагается оценить ю2 непараметрически, используя ряды в первых разностях:
О 2 1 СО,- = —
XДЙ + 2X(Ii X Ay,Ay,t-
t=i г=iV K +1 At=г+i
где Ayit = Ayit — T 1 - центрированный ряд разности; K - параметр усечения.
Тогда статистика LLC принимает вид
(20) ZLLC = ;=1
N, .
X(Ay,Miy,,-i/a2 -mTTa,/СС,)
_ ТФ
at л XУ,,-iMiy,,-i/
M * T
N
^./Xy;,-iMiy,,-i/a2 '=1С
Снова отметим, что в контексте временных рядов данная оценка, основанная на первых разностях, не была бы состоятельной, поскольку при стационарной альтернативе сходится к нулю по вероятности. В панелях, однако, данная оценка улучшает мощность теста, поскольку корректирующая компонента пропадает, и статистика стремится к —o.
Чтобы избежать непараметрического оценивания долгосрочной дисперсии можно использовать подход [Breitung, Das, 2005]. На первом шаге предлагается оценить регрессию Ay;t на детерминированную компоненту и лаги Ay;t-i,...,Ay;t- . При нулевой гипотезе очищенный от краткосрочной динамики ряд Ц>;уи является случайным блужданием с некоррелированными приращениями. Этот подход также можно использовать для модификации несмещенной статистики UBNT , так что асимптотическая стандартная нормальность сохраняется.
Отметим, что статистика, основанная на рекурсивном детрендировании, t - REC, предложенная работе [Westerlund, 2015], не требует коррекции статистики на смещение, а требует простой очистки переменных от серийной корреляции после выполнения рекурсивного детрендирования.
Статистика IPS при наличии серийной корреляции строится точно так же, как и в случае ее отсутствия, основываясь на статистиках расширенного (а не обычного) теста Дики - Фуллера, используя количество запаздывающих разностей, равное pt, для каж-
дого /-го временного ряда. Для построения статистики IPS можно использовать средние и дисперсии, соответствующие каждому значению pi .
2.4. Тесты, основанные на комбинации ^-значений
Отметим некоторые недостатки наиболее популярных тестов LLC и IPS. Во-первых, данные тесты требуют, чтобы число временных рядов в панели было бесконечным, но в то же время чтобы число групп должно было быть достаточно мало относительно временного интервала (формально N/T ^ 0). В противном случае тесты не будут иметь корректный размер и в случае очень малых N, и в случае очень больших N . Во-вторых, для каждой группы требуется тот же самый тип детерминированной компоненты. В-третьих, предполагается одинаковый временной интервал для каждой группы (для IPS допускается ослабление этого предположения, но возникает проблема вычисления моментов для тестовой статистики). Кроме этого, хотя IPS утверждают, что их тест превосходит тест LLC, эти два типа тестов не совсем корректно сравнивать между собой, поскольку тест IPS является просто способом комбинирования свидетельства наличия единичного корня N тестов на единичный корень, примененных к N группам. Также с точки зрения асимптотической локальной мощности тест LLC более мощный, чем тест IPS (см.: [Westerlund, Breitung, 2013, Fact 2]).
Авторы работ [Choi, 2001; Maddala, Wu, 1999] независимо предлагают подход для решения данных проблем. В работе [Maddala, Wu, 1999] предлагается тест против неоднородной альтернативы H1b, основанный на р-значениях статистик, индивидуальных для каждого временного ряда, используя подход [Fisher, 1932]. Обозначим некоторый тест на единичный корень для /-го временного ряда как Gi, тогда pi = F(Gi) - р-значение для этого теста, где F(•) - его функция распределения. Тогда предложенная авторами (правосторонняя) тестовая статистика будет иметь вид
(21) P = -21ln(Pl).
i=1
Альтернативная возможность скомбинировать тесты была предложена в работе [Choi, 2001], в ней использовался обратный нормальный (левосторонний) тест, определенный как
1 N
(22) Z
где Ф(-) является функцией стандартного нормального распределения.
При нулевой гипотезе и при фиксированном N статистика P имеет распределение х2 с 2N степенями свободы, а Z имеет стандартное нормальное распределение. При N ^ да тест P расходится к бесконечности и его необходимо модифицировать следующим образом:
1 N
7- S (-21n(ft )-2)
(23) P* = ^- '2-,
поскольку E(-2ln(p¡)) = 2 и Var(-2ln(p)) = 4. Однако при N тест Z все еще
имеет стандартное нормальное распределение, т.е. его можно использовать как при малых, так и при больших N .
Хенк [Hanck, 2008] дает объяснение контринтуитивного феномена, что у тестов, основанных на комбинации рзначений, увеличиваются искажения размера при росте N. Пусть мы получаем N p-значений для последующей их комбинации. Однако для конечных T тесты не будут иметь размер, равный номинальному. Это приводит к тому, что рзначения не будут равномерно распределены на единичном интервале. Фактически рзначения будут равномерно распределены на интервале [a, b], где a > 0 и b < 1. Автор рекомендует использовать выборочное распределение статистик, например, при помощи критических значений для конечных выборок.
3. Тесты на единичный корень для пространственно-коррелированных панелей
Предположение об отсутствии пространственной корреляции в ошибках является достаточно сильным и, вероятно, не выполняется во многих приложениях. Многие макроэкономические теории утверждают, что существуют одни и те же ненаблюдаемые общие факторы (такие как шоки технологии, привычки и фискальная политика). Соответственно, логично ожидать, что эти общие факторы влияют на многие макроэкономические переменные, такие как процентные ставки, инфляция, выпуск и другие. Как отмечают исследователи [Pesaran et al., 2013], например, при тестировании на наличие единичного корня в панели реальных выпусков можно было бы ожидать ненаблюдаемый общий шок выпуска (происходящий из-за технологии), который также проявляется в занятости, потреблении и инвестициях. При тестировании на наличие единичного корня в межстрано-вых данных по инфляции можно было бы ожидать ненаблюдаемые общие факторы, которые коррелированы с темпами инфляции среди стран, которые также влияют на краткосрочные и долгосрочные процентные ставки среди различных рынков и экономик.
Авторы работ [O'Connell, 1998; Maddala, Wu, 1999] показали, что в пространственно коррелированных панелях наблюдаются сильные искажения размера для панельных тестов на наличие единичного корня. Strauss, Yigit (2003) демонстрируют, что степень искажений размера вследствие одновременной корреляции увеличивается при увеличении величины коэффициента этой кросс-корреляции и ее вариабельностью. Скорректированные на размер критические значения, соответственно, становятся более отрицательными. Авторы показывают, что усреднение, согласно IPS (вычитание кросс-секционного среднего для устранения общего временного или агрегированного эффекта), не устраняет проблему искажений размера, вызванного вариацией кросс-корреляций, оно только частично
уменьшает корреляцию. Кроме того, мощность не увеличивается при росте -JÑ , и панели с большим значением N показывают более серьезные искажения размера.
Авторы работ [Banerjee et al., 2004, 2005] анализируют наличие коинтеграции между кросс-секционными объектами (cross-unit cointegration), которая увеличивает размер теста, так что отвержение гипотезы о наличии панельного единичного корня не является следствием более высокой мощности по сравнению с одномерными тестами, а лишь следствием наличия мешающих параметров.
Это привело к разработке множеств тестов, учитывающих пространственную корреляцию в панелях. Такие тесты принято называть тестами на панельный единичный корень второго поколения. Хотя корреляционная структура ошибок в общем случае неизвестна, и ее оценивание в общем случае недоступно вследствие ограничений на степени свободы, упрощенное задание некоторой формы зависимости является обычной практикой в теоретических работах.
Исследователи [Baltagi et al., 2007] обсуждают еще один источник кросс-секционной корреляции - пространственную (spatial) корреляцию, популярную в региональных исследованиях и в экономике города, которая основана на пространственных взаимосвязях и пространственной неоднородности. Здесь термин «пространственный» относится к географии субъектов, входящих в панель, к их местоположению, географическому расстоянию между ними, а также расстоянию в экономическом и социально-сетевом смысле.
3.1. Тесты, основанные на дефакторизации
Одним из самых удобных способов упрощения структуры зависимости является включение общей временной дамми-переменной (common time effects, CTE) в панельную регрессию. Обоснованием этого является то, что некоторое содвижение в многомерных временных рядах может происходить из-за общего фактора (common factor). Например, в страновых панелях временная дамми представляет собой общий международный эффект (например, глобальный шок или общий фактор делового цикла) или валюту, используемую в качестве меры стоимости (numeraire currency), в исследованиях паритета покупательской способности.
В модели, исследуемой в работе [Phillips, Sul, 2003], ошибка регрессии uit имеет вид
(24) uit = Xi ft + sit, ft ~ i.i.d.N(0,1) по всем t,
где f является общим временных эффектом, дисперсия которого нормализована равной единице для идентификации, а коэффициенты , предполагающиеся неслучайными, можно рассматривать как параметры «идиосинкразической доли», которые измеряют вклад общего временного эффекта на временной ряд i. Ошибки eit предполагаются взаимно независимыми и не зависящими от Qs для всех s. В такой постановке источником пространственной корреляции является общий стохастический временной ряд f и степень зависимости измеряется коэффициентами . В частности, ковариация
между uit и Ujt ( i Ф j ) задается как E (uitujt = кik ■ ). Если = 0 для всех i, то пространственной корреляции нет в данных, а если X = Xj = X0 для всех i и j, то пространственная корреляция одинакова. Таким образом, пространственная корреляция контроли-
руется компонентами X = (XN). Полагая ut = ((u1t,...,uNt) , мы можем определить условную ковариационную матрицу
(25) VM = E(и,и, | afaN) = S + XX', S = diag(a2aN).
О модели (24) можно думать как о простой факторной модели, в которой ft является общим фактором, а X¡ является факторной нагрузкой для ряда i. Филлипс и Сул [Phillips, Sul, 2003] предлагают исключить общий фактор f и построить тесты на единичный корень на основе очищенных переменных.
Авторы работы [Bai, Ng, 2004] рассматривали более общую модель, нежели (24), и предложили так называемый подход PANIC (Panel Analysis of Nonstationary in the Idiosyncratic and Common components, панельный анализ нестационарности в общей и идиосинкразической компонентах). Их модель имеет вид
(26) Ya = а +рг t + X'i Ft + ги,
(27) (I - L)F = C(L)ut,
(28) (1 -Pi L ) e¡t = A (L)elt,
где C(L) и D (L) - матричные полиномы. Идиосинкразическая ошибка eit является I(1), если Pi =1, и является стационарной, если | рг |< 1. Факторы также могут быть как стационарными, так и интегрированными первого порядка (ранг матрицы C(1) равен количеству общих трендов). Аналогичный процесс порождения данных (DGP) использовался в работах [Phillips, Sul, 2003; Choi, 2006b]. В исследованиях [Moon, Perron, 2004; Moon et al., 2007] использовался DGP вида
(29) Yt = а +Р, t + e,t,
(30) eit = Pi&i ,t-i + Ut >
(31) ut = Kft+,
где f и eit являются стационарными линейными процессами, и eit пространственно независима. Данный DGP отличается от рассмотренного в работе [Bai, Ng, 2004] в том смысле, что он специфицирует динамику наблюдаемых переменных, в то время как процесс в [Bai, Ng, 2004] специфицирует динамику ненаблюдаемых компонент. Как показано в работе [Bai, Ng, 2010], при s¡0 =0 и p¿ = р для всех i последний процесс можно выразить через первый, так что фактор и идиосинкразическая компонента имеют один и тот же порядок интегрированности. Первая модель является более общей, чем вторая при нулевой гипотезе, что рг = 1 для всех i. Модель, рассмотренная в статье [Pesaran, 2007b], идентична модели в работе [Moon, Perron, 2004], за исключением того, что детерминированная компонента явно включена в регрессию:
(32) Yit = а +р it + pjYi,t-1 + uit,
(33) Ut = Kft+eu>
Вернемся к модели (26)-(28). Оценить факторы можно методом главных компонент. Если ошибки s, являются 1(0), то оценивая методом главных компонент, мы получаем состоятельные оценки Ft и Xt, когда все факторы являются 1(0) или некоторые из них 1(1). Но в случае, когда sit являются 1(1), регрессия Yit на Ft будет ложной, даже если бы факторы являлись наблюдаемыми. Для получения состоятельных оценок авторы предлагают сначала привести данные к стационарному виду: в случае Р( =0 в (26) (случай отсутствия трендов) определим yit = AYit, ft = AFt и zit = Asit. Тогда мы можем оценить модель
(34) уи = \'Jt +
методом главных компонент. Затем можно выполнить обратное преобразование
£ и = S s=2^
и Ft — Xs=2f, получая состоятельные оценки факторов. Отметим, что хотя zt может быть передифференцированным, если исходные данные s, были стационарными, оценки факторов все равно будут состоятельными, хотя и неэффективными. После оценивания мы можем использовать ряды sit для тестирования панельного единичного
корня, поскольку эти ряды являются некоррелированными. Исследователи [Bai, Ng, 2004] также предлагают тестировать общие факторы на наличие единичного корня на основе процедуры Стока и Ватсона [Stock, Watson, 1988]. Единичный корень может наблюдаться или в идиосинкразической ошибке, или в общих факторах, или в обоих. Если только общий фактор содержит единичный корень, то мы не сможем выиграть в мощности относительно одномерных тестов, поскольку используется только информация относительно временного ряда {Ft} .
Кроме метода главных компонент Капетаниос [Kapetanios, 2005] рассматривает другие варианты дефакторизации, такие как динамический метод главных компонент и метод, основанный на оценивании подпространства факторов. Кроме этого он доказывает асимптотическую эквивалентность тестовых статистик, основанных на дефактори-зованных данных и статистик при условии отсутствия кросс-секционной зависимости (в смысле сходимости по вероятности) для любого метода дефакторизации, удовлетворяющего некоторым стандартным условиям.
При наличии трендов (Рг Ф 0 в (26)) взятие первой разности приводит к
ay; = р,- +КЩ +as!Y .
Усредняя по t, получим модель
A Y, - AY = Ц (AFt - AF) + (As, - AS"),
которую можно оценить методом главных компонент.
Отметим, что количество факторов выбирается согласно информационным критериям, предложенным в работе [Bai, Ng, 2002], в которых штрафная функция зависит и от N, и от T . Другими словами, количество факторов r выбирается согласно
r = arg min /С, ( k ),
k=0,...,k 1
где
1 ,, ( NT Л N + T
IC-, (к) = log с2 (к) + к log I-I-
1V n + T ) NT
â2 (k ) = N -1T-1 X^Х■ Максимальное количество факторов kmax предлагается выбирать равным 6.
Исследователи [Bai, Ng, 2002] акцентировали внимание на тесте, описанном в уравнении (22) [Choi, 2001]:
-2 X ln (p )- 2 N
(35) P = i='v4N '
где pi, i = 1,...,N являютсярзначениями ADF-теста без детерминированной компоненты для z-го субъекта, используя очищенные от факторов остатки. Напомним, что данный тест является асимптотически стандартным нормальным.
Авторы работы [Bai, Ng, 2010] предлагают дополнительные тесты, основанные на
очистке от факторов согласно своему подходу. Первый тест, Pb, является аналогом
*
статистики tb, предложенной в работе [Moon, Perron, 2004], за исключением того, что она основана на другом множестве остатков и на другом методе дефакторизации. Данный тест основан на регрессии пула
(36) 4 = р -1 + &it ■
Пусть
N N N л N
¿2 = Nж, Ю2 = N 1 Хш2, X£ = N 1XX£!, Ф4 = N 1 Хш4г,
где сг2 , ю2 и XEi = (ю2 - сг2)/2 - оценки дисперсии, долгосрочной дисперсии и односторонней долгосрочной дисперсии процесса sit. Эти оценки можно получить согласно [Andrews, Monahan, 1992], используя квадратичное спектральное ядро и предбеливание. Тогда для случая фиксированных эффектов
4nt (р + -1)
У2Ф 42
N T
(38) р(( - ^ (. Ш< - Jf •
где
NT
ZZê -iê - nt x £
P+ _ i=1t=2_
P NT '
EEC-i
i=1t=2
а для случая индивидуально-специфических трендов
4nt(р + -1)
(39) Pa = , \ ,
л/(36/5)ф 4â 4/ш 1
(40) P = ( +-
NT \ 5 f6
I 5 Ш
-1
i=1t=2
' "V 6 Ф 40;
'
8 E
N T
EEe; ,,-Â, — i=1t=2
3 ô 2
где ca4 = ((»2) , = (®2) , < = (<) и p' =^T-+ ~ .2'
ESC-1 Ш e
i=11=2
Важно отметить, что оценивание факторов на основе модели в первых разностях удаляет фиксированные эффекты, так что тестовые статистики для случаев отсутствия и наличия фиксированных эффектов совпадают.
Кроме этого, в статье [Bai, Ng, 2010] был обобщен тест Саргана - Бхаргавы [Sargan, Bhargava, 1983], SB , и модифицированный тест Саргана - Бхаргавы [Stock, 1999], MSB . Особенность теста MSB заключается в том, что он не требует оценивания параметра р, что позволяет сравнить, происходит ли отличие в мощности из-за оценивания этого параметра.
На основе симуляций на конечных выборках авторы заключают, что когда строится оценка р, использующая данные, детрендированные методом наименьших квадратов, вне зависимости от того, как удаляются факторы, то это приводит к отсутствию мощности у тестов Pb.
Вестерлунд и Ларсон [Westerlund, Larsson, 2009] анализируют возможное смещение предельного распределения статистики IPS ( Zê ), вызванное дефакторизацией. Результат [Bai, Ng, 2004] не гарантирует, что статистика Zê будет иметь асимптотически стандартное нормальное распределение. Это вызвано тем, что порядок смещения, вызванного заменой остатков eit на очищенные от факторов остатки , не является настолько большим, чтобы смещение исчезало асимптотически при росте N .
На основе разложения более высокого порядка Вестерлунд и Ларсон [Westerlund, Larsson, 2009] предлагают корректировку смещения статистики Zè для конечных выборок, которая делает размер теста более близким к номинальному без одновременной потери в мощности.
3.2. Тесты, основанные на аппроксимации факторов
Песаран [Pesaran, 2007b] исследует модель ошибок в виде [24], с одним фактором, но вместо того, чтобы строить тесты на единичный корень для очищенных от общего фактора данных, Песаран предлагает расширить стандартную ADF-регрессию кросс-секционными средними лагированных уровней и первых разностей индивидуальных временных рядов. В отличие от подхода [Bai, Ng, 2004], фактор предполагается стационарным. Как отмечается в статье [Pesaran et al., 2013], если бы компонента ft в регрессии ниже была бы I[1], то вне зависимости от того, равны ли значения фг нулю или нет, все ряды были бы нестационарными. В простой модели
[41] AVi-t = «i + Ф At-i + ^ ft + eit
для тестирования гипотезы фг = 0 для всех i против неоднородной альтернативы [как в IPS] предлагается использовать следующую кросс-секционно расширенную [cross-sec-tionally augmented DF, CADF] регрессию:
[42] Лу-t = ai + ф yt,t-i + Si yt-i + Y i Ayt + eit ■
Чтобы понять, как кросс-секционные средние лагированных уровней и первых разностей помогают устранить пространственную зависимость, усредним уравнение [41] [для простоты при отсутствии фиксированных эффектов] по N :
1 N ф N f N 1 N ф N f N
[43> N^« = N^'-++Ñ&* = + ^+(1)-
где аппроксимация выполняется при больших N [по закону больших чисел]. Если X ¡IjX¡ Ф 0 [что достаточно вероятно на практике]4, то фактор f можно выразить через линейную комбинацию средних лагированных уровней и первых разностей.
Распределение t-статистики для z-го субъекта не будет зависеть от мешающих параметров, когда N ^ да независимо от того, является ли T фиксированным или стремящимся к бесконечности совместно с N . Если T является фиксированным, то чтобы t-статистика не зависела от мешающих параметров, необходимо применять тест к отклонениям от начального значения, yit — y0. Также распределение [обозначаемое как CADFf -
4 Если Хм^/ = 0, то Ау1 = £1 сходится к нулю при N ^ да, а у является фиксированной константой для всех г.
распределение) является более скошенным влево, чем стандартное распределение Дики -Фуллера. Однако распределение стандартизованной статистики выглядит похожим на стандартное нормальное, хотя и имеет значимые ненулевые значения коэффициента асимметрии и (куртозиса-3).
Для построения тестов на панельный единичный корень Песаран предлагает использовать либо версию IPS,
CIPS = N-1 £ ti,
i=1
где t - индивидуальная статистика для z-го ряда, либо тесты, предложенные в работах [Maddala, Wu, 1999; Choi, 2001]. Для исключения проблемы вычисления моментов Песаран предлагает использовать так называемые усеченные тесты, CIPS : т.е. если тестовая статистика для z-го ряда < K, присваивать ей значение Kx, а если > K2, присваивать ей значение K2 . Константы Kj и K2 должны быть таковы, чтобы вероятность тестовой статистики попасть в интервал (Kx,K)2 была очень большая. Предлагается использовать значения K равным, соответственно, 6,12, 6,19 и 6,42 для модели без детерминированной компоненты, модели с константой и модели с трендом, а значения Kj равным 4,16, 2,61 и 1,70 для тех же самых моделей5. Однако распределение среднего из усеченных статистик все еще остается нестандартным из-за винеровского процесса Wf, в отличие
от IPS, где рассматривалась пространственно независимая панель. Распределение будет сходиться (почти наверное) к распределению, которое зависит от Kj, K2 и Wf , и критические значения для которого можно получить посредством симуляций. Те же самые аргументы применимы и к тестам [Maddala, Wu, 1999; Choi, 2001]. Степень отклонения от нормальности зависит от типа детерминированной компоненты, и плотность в случае отсутствия детерминированной компоненты является бимодальной и показывает наибольшее отклонение от нормальности.
Песаран [Pesaran, 2007b] обсуждает наличие серийной корреляции, источником которой может быть зависимость в общем факторе f, автокорреляция в идиосинкразической ошибке s¡Y или автокорреляция в ошибках регрессии uit. Все эти спецификации приводят в одной и той же регрессии вида
(44) ДУи = + ф, У,,,-i + Si У,-i + í Y j ДУ, - j + í ß j - j + .
J=0 j =1
Тогда все асимптотические результаты, полученные для случая с отсутствием автокорреляции, продолжают выполняться и в случае слабой зависимости ошибок. Как было
5 Как отмечается в работе [Pesaran, 2007b, p. 278], усечение фактически никогда не оказывает влияние на статистику.
показано в работе [Westerlund, 2014], данный подход кажется необоснованным в том случае, когда авторегрессионная структура ошибок неоднородная. Однако на самом деле предельное распределение тестовой статистики CADFf остается тем же самым даже при
неправильном моделировании авторегрессионной динамики как однородной.
Отметим, что тест Песарана обоснован в случае, если N и T имеют одинаковый порядок, в то время как авторы работ [Bai, Ng, 2004; Moon, Perron, 2004] требуют, чтобы N / T ^ 0. Также отметим, что для получения предельного распределения для CADFf
требуется условие, что N ^ да , хотя CADFf - это тест для i-го временного ряда. Причина
заключается в том, что из-за того, что общий фактор заменяется на кросс-секционное среднее, это создает ошибку аппроксимации, которая уменьшается с ростом N (см.: [Westerlund, 2014]).
Поскольку модель в статье [Pesaran, 2007b] допускает наличие только одного фактора (так что при наличии более одного фактора наблюдаются искажения размера теста), в работе [Pesaran et al., 2013] было предпринято обобщение на случай наличия большего количества факторов. Авторы предполагают, что существует к дополнительных переменных, которые зависят от по крайней мере того же самого множества общих факторов, хотя и с различными факторными нагрузками. Например, в анализе сходимости выпуска (output convergence) разумно было бы утверждать, что выпуск, инвестиции, потребление, реальные цены на активы и цены на нефть оказывают одинаковый эффект на факторы в общем. Аналогично краткосрочные и долгосрочные процентные ставки и инфляция среди стран, вероятно, обладают рядом общих факторов.
Учитывая рассуждение выше, в случае наличия многофакторной структуры исследователи [Pesaran et al., 2013] предлагают расширить регрессию (42) или (в случае автокор-релированности) (44) путем добавления дополнительных кросс-секционных средних лагированных уровней и первых разностей, связанных с экономически обоснованными другими переменными xit (k переменных):
(45) Ду,- = а + ф,- y¡,-i + Wiphp + е,
где % = (Ay¡w,Ду1>2Ay,._p;AZ,AZ.,.....AZ_p;Z_,), AZ = (Az1;...,Azr)',
zt = NX Izu, zit = ((,x it )'.
Также авторы работы [Pesaran et al., 2013] строят статистику Саргана - Вхаргавы, CSB. В случае отсутствия трендов эта статистика строится на основе регрессии
(46) Дуй = X c'y Azt - j + ХР j Дум - j + ^,
j=0 j=1
и сама статистика для z-го субъекта имеет вид
(47)
csBt = T 2 /а2,
t=i
где = X'j=fii¡ и tf = Zf=Ay/[T - p - (p + l)(k +1)], êj - OLS-остатки в регрессии (46).
При наличии трендов в регрессию (46) следует включить константу и скорректировать соответствующим образом количество степеней свободы в оценке дисперсии. Поскольку CSBi при нулевой гипотезе сходится к функционалу от винеровского процесса и не зависит от мешающих параметров (а именно, от факторов и факторных нагрузок), CBS-тест можно построить как
(48) CSB = N-1 ¿CBS.
i=1
Критические значения, как и для теста CIPS , будут зависеть от количества факторов k . На основе стимуляций авторы заключают, что CIPS и CSB не показывают искажений размера для любых рассмотренных значений T и N независимо от того, является ли идиосинкразическая компонента коррелированной или нет, а также что CSB имеет более высокую мощность, чем CIPS , при меньших T .
Отметим, что в обсуждении выше количество факторов k предполагается известным. Если оно неизвестно, то предлагается выбирать его либо на основе информационных критериев [Bai, Ng, 2002], либо равным mmax -1.
Вестерлунд [Westerlund, 2016a] предлагает в некотором смысле обобщение тестов Песарана. Пусть
yit = Kft + •
Если бы X:t были бы известны, оценку ft можно получить на основе метода наименьших квадратов. При неизвестных предлагается использовать некоторый инструмент, Z¡, который некоррелирован с sit, но сильно коррелирован с Xt, так что кросс-секционная OLS-оценка Z¡yit на Z¿A,' была бы состоятельной для ft, или эквивалентно, чтобы f = N-1X¿!iZyit была состоятельной оценкой для пространства, порожденного ft. Эта оценка является инструментальной оценкой (пространства, порожденного) ft. Тогда оценкой идиосинкразической ошибки будет
t
R = Z д - Zf.
s=1
В качестве инструментов можно взять просто Zi =1, что приводит к модели [Pesaran, 2007b], рассмотренной выше. Однако вследствие предварительного рекурсивного детрендирования результирующая t-статистика для проверки гипотезы о панельном единичном корне будет асимптотически стандартной нормальной, что отличается от результата в статье [Pesaran, 2007b]. Однако Вестерлунд [Westerlund, 2016a] рассматривает t-статистику для однородной альтернативы и требует предположения, что T намного больше, чем N.
Относительно выбора инструментов Z¡ для Вестерлунд отмечает, что выбрать соответствующие достаточно легко, например, на основе экономического содержания или просто взять состоятельные оценки, полученные по методу главных компонент. Выбрать подходящие инструменты можно на основе информационных критериев, предложенных, например, в работе [Bai, Ng, 2002].
Исследователи [Westerlund, Hosseinkouchack, 2016] решают проблему нестандартности распределения для теста [Pesaran, 2007b]. Авторы предлагают построить LM-тест, требующий оценивания модели только при нулевой гипотезе, для каждого субъекта. Этот тест будет также иметь нестандартное распределение при аппроксимации факторов, но если вычесть из каждой такой статистики статистику CIPS¡ в квадрате, то полученная статистика будет иметь распределение хи-квадрат, т.е. зависимость от винеров-ских процессов, связанных с факторами, удалится. Нормированная сумма таких скорректированных статистик будет иметь асимптотически стандартное нормальное распределение, как и в стандартных панельных тестах на единичный корень.
Авторы работы [Reese, Westerlund, 2016] объединяют подходы, основанные на добавлении кросссекционных средних (CA) для аппроксимации факторов ([Pesaran, 2007b; Pesaran et al., 2013]) с подходами, основанными на удалении факторов (PANIC) ([Bai, Ng, 2004, 2010]), поскольку оба этих подхода являются наиболее популярными в тестировании гипотезы о наличии панельного единичного корня. Комбинацию этих подходов авторы называют PANICCA (PANIC + CA). В работе [Reese, Westerlund, 2016] предлагается использовать подход PANIC, но не к оцененным компонентам по методу главных компонент, а к оцененным компонентам по методу кросс-секционного усреднения. Более точно, путь данные порождаются как
(49) уи = ai Dt + X i Ft + et,
(50) Xit = ßi Dt + Л Ft + Ut,
где Dt является детерминированной компонентой, xit является вектором (m х 1) дополнительных переменных, а остальные переменные и параметры определяются как и
ранее. Определяя вектор zit = (yit, xit) , запишем эти уравнения в векторном виде как
(51) Zit = BiDt + Ci Ft + Vit,
где мы используем соответствующие переобозначения. Запишем теперь данное уравнение в первых разностях, меняя размерность Dt:
(52) Az й = bi AD, + Ci AFt + Ауй ,
или, детрендировав каждую из компонент (очистив от AD,),
(53)
(Az, ) = Ci (AFt) + (Av. ).
Поскольку Сг. и (Д^.) не идентифицируются по отдельности, вместо оценки методом главных компонент для (ДРг) предлагается СА-оценка , являющаяся средним (Дг,). Затем оценка для Сг находится методом наименьших квадратов. Для оценки
Ft предлагается брать накопленную сумму соответствующей разности, как в статье [Bai, Ng, 2004]. В отличие от работ Песарана, здесь средние интерпретируются как не прокси для факторов, а как сами оцененные факторы (см. Remark 2 [Reese, Westerlund, 2016]). Далее можно тестировать на наличие единичного корня отдельно факторную компоненту и идиосинкразическую компоненту, как в работе [Bai, Ng, 2004].
Ченг [Chang, 2004] рассматривает применение бутстрапа для тестирования панельного единичного корня как против однородной, так и против неоднородной альтернатив6. Автокорреляционная динамика для каждого временного ряда в панели предполагается различной. Авторегрессионный параметр оценивался в системе либо посредством OLS, либо GLS (на основе симуляций авторы заключают, что GLS превосходит OLS). Для получения состоятельной оценки ковариационной матрицы для каждого временного ряда при нулевой гипотезе подбиралась авторегрессия (возможно разного порядка). В итоге строились F-статистики для OLS и GLS-оценок авторегрессионных коэффициентов. Поскольку F-статистики по своей природе являются двухсторонними, была предложена модификация, разработанная в исследовании [Andrews, 1999], которая заключается в ограничении сверху оценок авторегрессионных коэффициентов, чтобы не допустить возможность взрывных процессов. Предельные распределения полученных статистик при наличии пространственной корреляции и неоднородной серийной зависимости будут зависеть от мешающих параметров, что затрудняет использование фиксированных критических значений для случая отсутствия такой корреляции. Для получения критических значений автор предлагает использовать обычный остаточный бутстрап с восстановлением авторегрессий (re-colouring) по оцененным коэффициентам для каждого временного ряда в панели. Отметим, что в работе не предполагается факторная структура ошибок.
В работе [Choi, Chue, 2007] вместо бутстрапа предлагается использовать сабсемплинг для тестов LLC и IPS. Статистики строятся по подвыборкам определенной длины,
{yis,...,yi}. , а на основе значений этих статистик строится распределение для конечных выборок. Если длина подвыборки b ^ да и ЫТ ^ 0 при T ^ да, то эмпирическое распределение на основе подвыборок аппроксимирует предельное распределение равномерно при фиксированном N, так что можно использовать его для тестирования гипотез. В работе [Choi, Chue, 2007] также предлагают оптимальный выбор длины подвыборки b.
3.3. Тесты, основанные на методах ресемпелинга
6 Изначально в статье [Maddala, Wu, 1999] (см. также: Sarantis, 2007]) предлагается ис-
пользовать бутстрап с фиксированным кросс-секционным индексом, но авторы не доказывают обоснованность применения бутстрапа.
Авторы работы [Choi, Chue, 2007] применяют тесты LLC, IPS и обратный нормальный тест [Choi, 2001] и показывают, что сабсемплинг является робастным даже при перекрестной коинтегрированности между разными объектами в панели. Тесты [Pesaran, 2007b; Moon, Perron, 2004], с другой стороны, не учитывают возможную перекрестную коинтегрированность и имеют искажения размера.
В статье [Palm et al., 2011] предлагается более общий подход, в котором процесс порождения данных аналогичен [Bai, Ng, 2004], но факторы не предполагаются независящими от идиосинкразической компоненты. Также предполагается более широкий класс зависимости между идиосинкразическими компонентами (динамическая пространственная зависимость). Отметим, что хотя в работе [Bai, Ng, 2004] предлагается принцип тестирования обоих компонент, факторной и идиосинкразической, на наличие единичного корня, в статье [Palm et al., 2011] тестируется наличие единичного корня в исходном временном ряде.
Авторы работы [Palm et al., 2011] рассматривают упрощенные версии статистик LLC и IPS (без коррекции на среднее и дисперсию), а также не учитывают в построении статистик краткосрочную динамику посредством лагов. Последнее не имеет значения, поскольку в любом случае при неизвестном типе кросс-секционной зависимости ошибок невозможно получить тестовую статистику, которая не зависит от мешающих параметров, что дало бы асимптотическое уточнение (asymptotic refinement). Кроме этого авторы используют тесты, основанные на коэффициентах, а не на t-статистиках, поскольку наивная стьюдентизация может привести к некоторым проблемам в смысле точности тестов.
Исследователи [Palm et al., 2011] предлагают блочный бутстрап, который является бутстрапом со скользящим окном, предложенным в статье [Künsch, 1989].
Хотя блочный бутстрап обоснован для очень широкого класса процессов порождения данных, решетчатый (sieve) бутсрап, используемый в статье [Chang, 2004], не будет работать при некоторых достаточно общих предположениях, как показано в работе [Smee-kes, Urbain, 2014]. Причина заключается в том, что хотя и возможно записать систему в виде набора одномерных AR-моделей бесконечного порядка, инновации этих уравнений не будут составлять векторный белый шум, что является необходимым для обоснованности решетчатого бутстрапа. На малых выборках решетчатый бутстрап практически неотличим от бутстрапа со скользящими блоками, и только на больших выборках отличия становятся заметными. Причина, по которой в предыдущих исследованиях решетчатый бутстрап работал хорошо - это специфические комбинации параметров в DGP.
Исследователи [Hwang, Shin, 2015] предлагают использовать стационарный бутстрап (см.: [Politis, Romano, 1994]) и доказывают обоснованность предложенного алгоритма, однако не рассматривают случай кросс-секционной коинтеграции (факторных ошибок). Для учета детерминированной компоненты предлагается использовать рекурсивное детрен-дирование.
В работе [Herwartz, Siedenburg, 2008] предлагается использовать дикий бутстрап при предположении о наличии единственного общего фактора или пространственной зависимости в ошибках. Однако авторы предполагают автокорреляцию в ошибках только первого порядка.
3.4. Сравнение тестов
Исходя из множества разработанных тестов на панельный единичный корень, которые были описаны выше, было проведено большое количество исследований на основе симуляций Монте-Карло, чтобы сравнить, какие из этих тестов работают лучше или хуже в различных процессах порождения данных.
В исследовании [Jang, Shin, 2005] сравнивались тесты [Phillips, Sul, 2003] (далее PS), [Bai, Ng, 2004] (далее BN) и [Moon, Perron, 2004] (далее MP). Вспомним, что PS и MP корректируют кросс-секционную зависимость на основе проектирующей матрицы, которая сокращает факторы, в то время как BN удаляет факторы непосредственно путем их вычитания. Также PS и BN комбинируют тесты о p¿ путем их усреднения, в то время как MP основан
на регрессии пула. В работе [Jang, Shin, 2005] данные подходы комбинируются с различными методами детрендирования, такими как OLS, GLS, рекурсивное детрендирование, WSLS и безусловный метод максимального правдоподобия. Таким образом, авторы [Jang, Shin, 2005] рассматривают все возможные комбинации методов детрендирования, дефак-торизации и комбинирования результатов о коэффициентах рг. На основе результатов
сравнения размера и мощности они рекомендуют использовать OLS-детрендирование (из-за простоты реализации) и метод BN для очистки от факторов. Метод BN дает более стабильный размер, особенно при малых Т. Проекция для очистки от факторов и оценивание пула приводит к очень плохому размеру, а усреднение индивидуальных тестов дает лучший размер, чем оценивание регрессии пула. Из двух тестов, основанных на усреднении или на регрессии пула, первый имеет лучший размер, одновременно не теряя сильно в мощности по сравнению с последним тестом.
Гутиерес [Gutierrez, 2006] независимо сравнивает те же самые тесты, PS, BN и MN, в дополнение к тесту [Choi, 2006b] и заключает, что тест MP имеет хорошие размер и мощность при различных спецификациях и различных Т и N. Тест BN, основанный на регрессии пула, имеет хорошие свойства при GLS-детрендировании, а при OLS-детрендировании имеет низкую мощность. Тест [Choi, 2006b] имеет сильные либеральные искажения размера. Тест PS показывает искажения размера, если имеется более одного общего фактора. Искажения размера часто происходят из-за переоценки количества факторов при малых N < 15 для тестов BN и MP. При наличии трендов все тесты теряют в мощности.
Снова независимо от рассматриваемых работ в исследовании [Gengenbach et al., 2010] сравниваются тесты [Pesaran, 2007b], MP, BN, а также тесты [Breitung, Das, 2008; Sul, 2009], которые не учитывают факторную структуру. В работе [Gengenbach et al., 2010] обсуждается различие в процессах порождения данных, лежащих в основе каждого из тестов, а также различия в нулевых гипотезах. Симуляции проводятся также для различных видов факторных процессов порождения данных (с одним или двумя факторами), а факторы и ошибки порождаются как MA(1)-процессы. Также рассматриваются несколько вариантов того, какая из компонент, факторы или идиосинкразическая ошибка (или оба) имеют единичный корень. Для устранения влияния фиксированных эффектов на тестовые статистики из данных вычитается начальное наблюдение, как в работе [Breitung, Das, 2008]. Исследователи [Gengenbach et al., 2010] получают следующие результаты. Во-первых, если нестационарность приходится только на общие факторы, но не на идиосинкразическую ошибку, то такую структуру данных могут обнаружить только тесты [Bai, Ng,
2004; Sul, 2009]. Во-вторых, тест на наличие единичного корня в единственном общем факторе имеет низкую мощность. Данная картина наблюдается и в случае нескольких факторов. В-третьих, при тестировании на наличие единичного корня в идиосинкразической компоненте тест CIPS на основе модели пула имеет лучшую мощность, чем индивидуальные CADF-тесты (хотя, поскольку тесты были основаны на работе [Pesaran, 2007b], они не учитывали возможность наличия более одного фактора). Аналогичный эффект наблюдается и для тестов BN, хотя тест BN, основанный на модели пула, имеет существенные искажения размера при малой временной размерности панели. Тесты MP показывают аналогичные свойства, так же как и тесты [Breitung, Das, 2008; Sul, 2009], хотя последние только при N < T . Также исследователи [Gengenbach et al., 2010] указывают на проблему выбора количества факторов для тестов BN и MP, и данные тесты показывают искажения размера, если число факторов неправильно специфицировано.
В работе [de Silva et al., 2009] рассматривается аналогичная проблема сравнения различных тестов, но для более широкого диапазона возможных процессов порождения данных (в том числе наличие нескольких факторов, ненормальный процесс ошибок, стохастический единичный корень), однако авторы сравнивали только тесты BN, MP и [Pesaran, 2007b]. Ключевое отличие от предыдущих работ заключается в анализе большого количества методов выбора количества факторов (предложенных в работе [Bai, Ng, 2002]). Кроме того, de Silva et al. (2009) предлагают ряд новых методов, основанных на критерии Хеннана - Куинна. На основе симуляций de Silva et al. (2009) делают вывод, что критерии Хеннана - Куинна улучшают свойства на конечных выборках, особенно при малых N (и T > 50 ), хотя если и T достаточно мало, ни один из критериев не работает достаточно хорошо. Сравнивая тесты на панельный единичный корень, de Silva et al. (2009) заключают, что тест Фишера р имеет хорошие свойства размера и мощности при широком классе процессов порождения данных. Тест Ze в работе [Bai, Ng, 2004] также имеет хороший размер, но его скорректированный аналог Z+ в статье [Westerlund, Larsson, 2009]
редко отвергает нулевую гипотезу.
Отметим также проблему, связанную с отсутствием наблюдений в панели, что делает ее несбалансированной. Стандартным подходом в работе с несбалансированными панелями будет просто удалить наблюдения таким образом, чтобы панель была сбалансированной, что, однако, может привести к потере информации. Кроме этого, пропущенные наблюдения могут влиять на коррекцию смещения, которое часто включается в построение тестовых статистик. На данный момент существует единственная работа с попыткой скорректировать тестовые статистики на единичный корень для панельных данных на несбалансированность с теоретическим обоснованием, [Karavias et al., 2022], однако авторы рассматривают тесты с фиксированным T, не приводимые в данном обзоре. См. обзор таких методов в более полной версии статьи (https://arxiv.org/submit/5789164/, раздел 7).
4. Практическая реализация
В настоящее время не так много тестов на панельный единичный корень импле-ментировано в статистические пакеты анализа данных, особенно учитывающих кросс-
секционную зависимость. Ряд команд в пакете Stata можно найти на веб-сайте Markus Eberhardt: https://sites.google.com/site/medevecon/code. В частности, тесты LLC и IPS реализуются командами levinlin (или xtunitroot llc) и ipshin (или xtunitroot ips). Тест [Pesaran, 2007] CIPS можно реализовать при помощи команды xtcips. Для реализации теста [Hadri, 2000] на стационарность можно использовать команду hadrilm (или xtunitroot hadri). Для тестов на единичный корень/стационарность [Maddala, Wu, 1999] используется команда xtfisher (или xtunitroot fisher).
Seemon Reese разработал команду panicca для Stata для реализации метода PANICCA [Reese, Westerlund, 2016], а также методы методы [Bai, Ng, 2004, 2010], см. https://simonreese.weebly.com/code.html
Для реализации теста [Karavias, Tzavalis, 2014a] Yiannis Karavias и Elias Tzavalis разработали команду xtbunitroot для Stata, см. также описание в [Chen, Karavias, Tzavalis, 2022] и https://sites.google.com/site/yianniskaravias/files/xtbunitroot. На веб-сайте Yiannis Karavias также можно найти код в Matlab для реализации тестов при фиксированном T: тест [Karavias, Tzavalis, 2014b], см. https://sites.google.com/site/yianniskaravias/files/fixed-t-breitung-s-panel-data-unit-root-test-code; тест [Karavias, Tzavalis, 2019], см. https://sites.google.com/ site/yianniskaravias/files/generalized-fixed-t-purts
Stephan Smeekes и Ines Wilms разработали пакет bootUR для R, включающий в себя реализацию метода оценки доли стационарных временных рядов в панели [Smeekes, 2014] и бутстраповский тест на единичный корень [Palm et al., 2011], см. также описание в [Smeekes, Wilms, 2023] со ссылками на другие пакеты в R (plm и pdR), см. https://smeekes.github.io/bootUR/
* * *
СПИСОК ЛИТЕРА ТУРЫ
Ратникова Т.А., Фурманов К.К. Анализ панельных данных и данных о длительности состояний. М.: Изд. дом ВШЭ, 2014.
Ратникова Т.А. Введение в эконометрический анализ панельных данных // Экономический журнал ВШЭ. 2006. Т. 10. № 3. С. 492-519.
Скроботов А.А. Структурные сдвиги и тестирование на единичный корень // Прикладная эконометрика. 2020. Т. 50. С. 96-141.
Скроботов А.А. Структурные сдвиги в моделях коинтеграции // Прикладная эконометрика. 2021а. Т. 63. C. 117-141.
Скроботов А.А. Структурные сдвиги в моделях коинтеграции: многомерный случай // Прикладная эконометрика. 20216. Т. 64. С. 83-106.
Andrews D.W.K. Estimation When a Parameter Is on a Boundary // Econometrica. 1999. Vol. 67. P. 1341-1383.
Andrews D.W.K., Monahan J.C. An Improved Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Estimator // Econometricа. 1992. Vol. 60. P. 953-966.
Bai J., Ng S. Determining the Number of Factors in Approximate Factor Models // Econometrica. 2002. Vol. 70. P. 191-221.
BaiJ, Ng S. A PANIC Attack on Unit Roots and Cointegration // Econometrica. 2004. Vol. 72. P. 11271177.
Bai J., Ng S. Panel Unit Root Tests with Cross-Section Dependence: A Further Investigation // Econometric Theory. 2010. Vol. 26. P. 1088-1114.
Baltagi B.H., Bresson G., Pirotte A. Panel Unit Root Tests and Spatial Dependence // Journal of Applied Econometrics. 2007. Vol. 22. P. 339-360.
Baltagi B.H., Kao C. Nonstationary Panels, Cointegration in Panels and Dynamic Panels: A Survey // Nonstationary Panels, Panel Cointegration, and Dynamic Panels. Emerald Group Publishing Limited, 2001. P. 7-51.
Banerjee A, Marcellino M., Osbat C. Some Cautions on the Use of Panel Methods for Integrated Series of Macroeconomic Data // Econometrics Journal. 2004. Vol. 7. P. 322-340.
Banerjee A., Marcellino M., Osbat C. Testing for PPP: Should We Use Panel Methods? // Empirical Economics. 2005. Vol. 30. P. 77-91.
Breitung J. Testing for Unit Roots in Panel Data Using a GMM Approach // Statistical Papers. 1997. Vol. 38. P. 253-269.
Breitung J. The Local Power of Some Unit Root Tests for Panel Data // B. Baltagi, T.B. Fomby, R.C. Hill (eds.) Nonstationary Panels, Panel Cointegration, and Dynamic Panels, Advances in Econometrics. Amsterdam: JAI Press, 2000. Vol. 15. P. 161-178.
Breitung J., Das S. Panel Unit Root Tests under Cross-Sectional Dependence // Statistica Neerlandica. 2005. Vol. 59. P. 414-433.
Breitung J., Das S. Testing for Unit Roots in Panels with a Factor Structure // Econometric Theory. 2008. Vol. 24. P. 88-108.
Breitung J., Meyer W. Testing for Unit Roots in Panel Data: Are Wages on Different Bargaining Levels Cointegrated? // Applied Economics. 1994. Vol. 26. P. 353-361.
Cerrato M., Sarantis N. A Bootstrap Panel Unit Root Test under Cross-Sectional Dependence, with an Application to PPP // Computational Statistics & Data Analysis. 2007. Vol. 51. P. 4028-4037.
Chang Y. Bootstrap Unit Root Tests in Panels with Cross-Sectional Dependency // Journal of Econometrics. 2004. Vol. 120. P. 263-293.
Chang Y., Song W. Unit Root Tests for Panels in the Presence of Short-run and Long-run Dependencies: Nonlinear IV Approach with Fixed N and Large T // The Review of Economic Studies. 2009. Vol. 76. P. 903-935.
Chen P., Karavias Y., Tzavalis E. Panel Unit-Root Tests with Structural Breaks // The Stata Journal. 2022. Vol. 22. P. 664-678.
Choi I. Unit Root Tests for Panel Data // Journal of International Money and Finance. 2001. Vol. 20. P. 249-272.
Choi I. Nonstationary Panels // Palgrave Handbooks of Econometrics. New York: Palgrave Macmil-lan: 2006a. Vol. 1. P. 511-539.
Choi I. Combination Unit Root Tests for Cross-Sectionally Correlated Panels // D. Corbae, S.N. Durlauf, B.E. Hansen (eds.) // Econometric Theory and Practice: Frontiers of Analysis and Applied Research: Essays in Honor of Peter C.B. Phillips. 2006b. P. 311-333.
Choi I., Chue T.K. Subsampling Hypothesis Tests for Nonstationary Panels with Applications to Exchange Rates and Stock Prices // Journal of Applied Econometrics. 2007. Vol. 22. P. 401-428.
Chortareas G., Kapetanios G. Getting PPP Right: Identifying Mean-Reverting Real Exchange Rates in Panels // Journal of Banking & Finance. 2009. Vol. 33. P. 390-404.
Deckers T., Hanck C. Multiple Testing for Output Convergence // Macroeconomic Dynamics. 2013. 17. P. 1-16.
Fisher R.A. Statistical Methods for Research Workers. London: Oliver and Boyd, 1932. Gengenbach C., Palm F.C., Urbain J.-P. Panel Unit Root Tests in the Presence of Cross-Sectional Dependencies: Comparison and Implications for Modelling // Econometric Reviews. 2010. Vol. 29. P. 111-145.
Gutierrez L. Panel Unit-root Tests for Cross-Sectionally Correlated Panels: A Monte Carlo Comparison // Oxford Bulletin of Economics and Statistics. 2006. Vol. 68. P. 519-540.
Hadri K. Testing for Stationarity in Heterogeneous Panel Data // Econometrics Journal. 2000. Vol. 3. P. 148-161.
Hahn J., Kuersteiner G. Asymptotically Unbiased Inference for a Dynamic Panel Model with Fixed Effects When Both n and TAre Large // Econometrica. 2002. Vol. 70. P. 1639-1657.
Hanck C. The Error-in-Rejection Probability of Meta-Analytic Panel Tests // Economics Letters. 2008. Vol. 101. P. 27-30.
Harris D., Harvey D.I., Leybourne S.J., Sakkas N.D. Local Asymptotic Power of the Im-Pesaran-Shin Panel Unit Root Test and the Impact of Initial Observations // Econometric Theory. 2010. Vol. 26. P. 311-324.
Herwartz H., Siedenburg F. Homogenous Panel Unit Root Tests under Cross Sectional Dependence: Finite Sample Modifications and the Wild Bootstrap // Computational Statistics and Data Analysis. 2008. Vol. 53. P. 137-150.
Hwang E., Shin D.W. Stationary Bootstrapping for Semiparametric Panel Unit Root Tests // Computational Statistics & Data Analysis. 2015. Vol. 83. P. 14-25.
Im K.S., Pesaran M.H., Shin Y. Testing for Unit Roots in Heterogenous Panels // Journal of Econometrics. 2003. Vol. 115. P. 53-74.
Jang M.J., Shin D.W. Comparison of Panel Unit Root Tests under Cross Sectional Dependence // Economics Letters. 2005. Vol. 89. P. 12-17.
Kao C., Chiang M.H., Chen B. International R&D Spillovers: An Application of Estimation and Inference in Panel Cointegration // Oxford Bulletin of Economics and Statistics. 1999. Vol. 61. P. 691-709.
Kapetanios G. Dynamic Factor Extraction of Cross-Sectional Dependence in Panel Unit Root Tests // Journal of Applied Econometrics. 2005. Vol. 22. P. 313-338.
Karavias Y., Tzavalis E. Testing for Unit Roots in Short Panels Allowing for a Structural Break // Computational Statistics & Data Analysis. 2014a. Vol. 76. P. 391-407.
Karavias Y., Tzavalis E. A fixed-T Version of Breitung's Panel Data Unit Root Test // Economics Letters. 2014b. Vol. 124. P. 83-87.
Karavias Y., Tzavalis E. Generalized Fixed-t Panel Unit Root Tests // Scandinavian Journal of Statistics. 2019. Vol. 46. P. 1227-1251.
Karavias Y., Tzavalis E., Zhang H. Missing Values in Panel Data Unit Root Tests // Econometrics. 2022. Vol. 10.1, 12.
Karlsson S., Lothgren M. On the Power and Interpretation of Panel Unit Root Tests // Economics Letters. 2000. Vol. 66. P. 249-255.
Ktinsch H.R. The Jackknife and the Bootstrap for General Stationary Observations // Annals of Statistics. 1989. 17. P. 1217-1241.
Levin A., Lin C.F. Unit Root Tests in Panel Data: Asymptotic and Finitesample Properties. 1993. Unpublished Manuscript.
Levin A., Lin C.F., Chu C.J. Unit Root Tests in Panel Data: Asymptotic and Finite-sample Properties // Journal of Econometrics. 2002. Vol. 108. P. 1-24.
Maddala G.S., Wu S. A Comparative Study of Unit Root Tests with Panel Data and a New Simple Test // Oxford Bulletin of Economics and Statistics. 1999. Vol. 61. P. 631-652.
Moon H.R., Perron B., Phillips P.C.B. Incidental Trends and the Power of Panel Unit Root Tests // Journal of Econometrics. 2007. Vol. 141. P. 416-459.
Moon H.R., Phillips P.C.B. Maximum Likelihood Estimation in Panels with Incidental Trends // Oxford Bulletin of Economics and Statistics. 1999. Vol. 61. P. 771-748.
Moon H.R., Perron B. Testing for a Unit Root in Panels with Dynamic Factors // Journal of Econometrics. 2004. Vol. 122. P. 81-126.
Ng S. A Simple Test for Nonstationarity in Mixed Panels // Journal of Business & Economic Statistics. 2008. Vol. 26. P. 113-127.
Nickell S. Biases in Dynamic Models with Fixed Effects // Econometrica. 1981. Vol. 49. P. 1417-1426.
O'Connell P. The Overvaluation of Purchasing Power Parity // Journal of International Economics. 1998. Vol. 44. P. 1-19.
Palm F.C., Smeekes S., Urbain J.-P. Cross-Sectional Dependence Robust Block Bootstrap Panel Unit Root Tests // Journal of Econometrics. 2011. Vol. 163. P. 85-104.
Pesaran M.H. A Pair-Wise Approach to Testing for Output and Growth Convergence // Journal of Econometrics. 2007a. Vol. 138. P. 312-355.
Pesaran M.H. A Simple Panel Unit Root Test in the Presence of Cross-Section Dependence // Journal of Applied Econometrics. 2007b. Vol. 22. P. 265-312.
Pesaran M.H., Smith L.V., Yamagata T. Panel Unit Root Tests in the Presence of a Multifactor Error Structure // Journal of Econometrics. 2013. Vol. 175. P. 94-115.
Phillips P.C.B., Moon H.R. Linear Regression Limit Theory for Nonstationary Panel Data // Econo-metrica. 1999. Vol. 67. P. 1057-1111.
Phillips P.C.B., Sul D. Dynamic Panel Estimation and Homogeneity Testing Under Cross-Section Dependence // Econometrics Journal. 2003. Vol. 6. P. 217-239.
Politis D.N., Romano J.P. The Stationary Bootstrap // Journal of American Statistical Association. 1994. Vol. 89. P. 1303-1313.
Reese S., Westerlund J. Panicca: Panic on Cross-Section Averages // Journal of Applied Econometrics. 2016. Vol. 31. P. 961-981.
Sargan J.D., Bhargava A. Testing Residuals from Least Squares Regression for Being Generated by the Gaussian Random Walk // Econometrica. 1983. Vol. 51. P. 153-174.
De Silva S., Hadri K., Tremayne A.R. Panel Unit Root Tests in the Presence of Cross-Sectional Dependence: Finite Sample Performance and an Application // Econometrics Journal. 2009. Vol. 12. P. 340-366.
Smeekes S. Bootstrap Sequential Tests to Determine the Order of Integration of Individual Units in A Time Series Panel // Journal of Time Series Analysis. 2014. Vol. 36. P. 398-415.
Smeekes S., Urbain J.-P. On the Applicability of the Sieve Bootstrap in Time Series Panels // Oxford Bulletin of Economics & Statistics. 2014. Vol. 76. P. 139-151.
Smeekes S., Wilms I. BootUR: An R Package for Bootstrap Unit Root Tests // Journal of Statistical Software. 2023. Vol. 106. P. 1-39.
Stock J.H. A Class of Tests for Integration and Cointegration, Volume In Cointegration, Causality, and Forecasting: A Festschrift for Clive W.J. Granger. Oxford: Oxford University Press, 1999. P. 135-167.
StockJ.H., Watson M.W. Unit Root Tests for Panel Data // Testing for Common Trends. 1988. Vol. 83. P. 1097-1107.
Strauss J., Yigit T. Shortfalls of Panel Unit Root Testing // Economics Letters. 2003. Vol. 81. P. 309313.
Sul D. Panel Unit Root Tests Under Cross Section Dependence with Recursive Mean Adjustment // Economics Letters. 2009. Vol. 105. P. 123-126.
Westerlund J. The Asymptotic Distribution of the CADF Unit Root Test in the Presence of Heterogeneous AR(p) Errors // Statistical Papers. 2014. Vol. 57. P. 303-317.
Westerlund J. The Effect of Recursive Detrending on Panel Unit Root Tests // Journal of Econometrics. 2015. Vol. 185. P. 453-467.
Westerlund J. An IV Test for a Unit Root in Generally Trending and Correlated Panels // Oxford Bulletin of Economics and Statistics. 2016a. Vol. 78. P. 752-764.
Westerlund J. Pooled Panel Unit Root Tests and the Effect of Past Initialization // Econometric Reviews. 2016b. Vol. 35. P. 396-427.
Westerlund J., Breitung J. Lessons From a Decade of IPS and LLC // Econometric Reviews. 2013. Vol. 32. P. 547-591.
Westerlund J., Hosseinkouchack M. Modified CADF and CIPS Panel Unit Root Statistics with Standard Chi-squared and Normal Limiting Distributions // Oxford Bulletin of Economics & Statistics. 2016. Vol. 78. P. 347-364.
Westerlund J., Larsson R. A Note on the Pooling of Individual PANIC Unit Root Tests // Econometric Theory. 2009. Vol. 25. P. 1851-1868.
Panel Data Unit Root Testing: An Overview
Anton Skrobotov
Institute of Applied Economic Studies, RANEPA, 82, Prospekt Vernadskogo, Moscow, 119571, Russian Federation.
E-mail: [email protected]
This review discusses methods of testing for a panel unit root. Modern approaches to testing in cross-sectionally correlated panels are discussed, preceding the analysis with an analysis of independent panels. In addition, the de-trending methods and corresponding asymptotic results are discussed. To account for cross-sectional correlation, the methods based on de-factorization and bootstrap are considered. In conclusion, links to existing packages that allow implementing some of the described methods are provided.
This review discusses methods for testing for unit roots in panel data. The investigation of several time series together instead of analyzing each one separately and the motivation for testing for panel unit roots are discussed. The review begins with a consideration of the simplest panel unit root tests with independent errors and two types of alternative hypothesis: homogeneous and heterogeneous. For the simplest tests, their asymptotic behavior is described under different types of convergence of the number of objects and the time horizon. Then, the issue of including a deterministic component and changing the asymptotic results are considered, as well as methods for accounting for a weak dependence of errors. The first section concludes with methods based on p-values.
The next section is devoted to the important issue of accounting for cross-sectional correlation in panels and its impact on classical panel unit root tests. Cross-sectional correlation takes place according to some macroeconomic theories, which state that there are some common factors (e.g., technological shocks) that affect not one, but some set of variables. Modifications of classical tests based on factorization are described, when cross-sectional correlation is approximated by (possibly non-stationary) common factors based on the principal component method and based on factor approximation using cross-sectional means. Alternative methods based on resampling are considered. The section ends with a comparative Monte Carlo simulations analysis of various tests described in the review. The problem of imbalanced panel is discussed. In conclusion, references are given to existing packages that allow implementing some of the described methods.
Key words: panel unit root testing; panel stationarity testing; detrending; common factors; cross-sectional correlation.
JEL Classification: C12, C22.
* * *
References
Andrews D.W.K. (1999) Estimation When a Parameter Is on a Boundary. Econometrica, 67, pp. 13411383.
Andrews D.W.K., Monahan J.C. (1992) An Improved Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Estimator. Econometrica, 60, pp. 953-966.
Bai J., Ng S. (2002) Determining the Number of Factors in Approximate Factor Models. Econometrica, 70, pp. 191-221.
Bai J., Ng S. (2004) A PANIC Attack on Unit Roots and Cointegration. Econometrica, 72, pp. 1127-1177.
Bai J., Ng S. (2010) Panel Unit Root Tests with Cross-Section Dependence: A Further Investigation. Econometric Theory, 26, pp. 1088-1114.
Baltagi B.H., Bresson G., Pirotte A. (2007) Panel Unit Root Tests and Spatial Dependence. Journal of Applied Econometrics, 22, pp. 339-360.
Baltagi B.H., Kao C. (2001) Nonstationary Panels, Cointegration in Panels and Dynamic Panels: A Survey. Nonstationary Panels, Panel Cointegration, and Dynamic Panels. Emerald Group Publishing Limited, pp. 7-51.
Banerjee A., Marcellino M., Osbat C. (2004) Some Cautions on the Use of Panel Methods for Integrated Series of Macroeconomic Data. Econometrics Journal, 7, pp. 322-340.
Banerjee A., Marcellino M., Osbat C. (2005) Testing for PPP: Should We Use Panel Methods? Empirical Economics, 30, pp. 77-91.
Breitung J. (1997) Testing for Unit Roots in Panel Data Using a GMM Approach. Statistical Papers, 38, pp. 253-269.
Breitung J. (2000) The Local Power of Some Unit Root Tests for Panel Data. (eds. B. Baltagi, T.B. Fomby, R.C. Hill). Nonstationary Panels, Panel Cointegration, and Dynamic Panels, Advances in Econometrics. Amsterdam: JAI Press, 15, pp. 161-178.
Breitung J., Das S. (2005) Panel Unit Root Tests under Cross-Sectional Dependence. Statistica Neer-landica, 59, pp. 414-433.
Breitung J., Das S. (2008) Testing for Unit Roots in Panels with a Factor Structure. Econometric Theory, 24, pp. 88-108.
Breitung J., Meyer W. (1994) Testing for Unit Roots in Panel Data: Are Wages on Different Bargaining Levels Cointegrated? Applied Economics, 26, pp. 353-361.
Cerrato M., Sarantis N. (2007) A Bootstrap Panel Unit Root Test under Cross-Sectional Dependence, with an Application to PPP. Computational Statistics & Data Analysis, 51, pp. 4028-4037.
Chang Y. (2004) Bootstrap Unit Root Tests in Panels with Cross-Sectional Dependency. Journal of Econometrics, 120, pp. 263-293.
Chang Y., Song W. (2009) Unit Root Tests for Panels in the Presence of Short-run and Long-run Dependencies: Nonlinear IV Approach with Fixed N and Large T. The Review of Economic Studies, 76, pp. 903935.
Chen P., Karavias Y., Tzavalis E. (2022) Panel Unit-Root Tests with Structural Breaks. The Stata Journal, 22, pp. 664-678.
Choi I. (2001) Unit Root Tests for Panel Data. Journal of International Money and Finance, 20, pp. 249272.
Choi I. (2006a) Nonstationary Panels. Palgrave Handbooks of Econometrics. New York: Palgrave Mac-millan, 1, pp. 511-539.
Choi I. (2006b) Combination Unit Root Tests for Cross-Sectionally Correlated Panels. Econometric Theory and Practice: Frontiers of Analysis and Applied Research: Essays in Honor of Peter C.B. Phillips (eds. D. Corbae, S.N. Durlauf, B.E. Hansen), pp. 311-333.
Choi I., Chue T.K. (2007) Subsampling Hypothesis Tests for Nonstationary Panels with Applications to Exchange Rates and Stock Prices. Journal of Applied Econometrics, 22, pp. 401-428.
Chortareas G., Kapetanios G. (2009) Getting PPP Right: Identifying Mean-Reverting Real Exchange Rates in Panels. Journal of Banking & Finance, 33, pp. 390-404.
Deckers T., Hanck C. (2013) Multiple Testing for Output Convergence. Macroeconomic Dynamics, 17, pp. 1-16.
Fisher R.A. (1932) Statistical Methods for Research Workers. London: Oliver and Boyd.
Gengenbach C., Palm F.C., Urbain J.-P. (2010) Panel Unit Root Tests in the Presence of Cross-Sectional Dependencies: Comparison and Implications for Modelling. Econometric Reviews, 29, pp. 111-145.
Gutierrez L. (2006) Panel Unit-root Tests for Cross-Sectionally Correlated Panels: A Monte Carlo Comparison. Oxford Bulletin of Economics and Statistics, 68, pp. 519-540.
Hadri K. (2000) Testing for Stationarity in Heterogeneous Panel Data. Econometrics Journal, 3, pp. 148-161.
Hahn J., Kuersteiner G. (2002) Asymptotically Unbiased Inference for a Dynamic Panel Model with Fixed Effects When Both n and TAre Large. Econometrica, 70, pp. 1639-1657.
Hanck C. (2008) The Error-in-Rejection Probability of Meta-Analytic Panel Tests. Economics Letters, 101, pp. 27-30.
Harris D., Harvey D.I., Leybourne S.J., Sakkas N.D. (2010) Local Asymptotic Power of the Im-Pesaran-Shin Panel Unit Root Test and the Impact of Initial Observations. Econometric Theory, 26, pp. 311-324.
Herwartz H., Siedenburg F. (2008) Homogenous Panel Unit Root Tests under Cross Sectional Dependence: Finite Sample Modifications and the Wild Bootstrap. Computational Statistics and Data Analysis, 53, pp. 137-150.
Hwang E., Shin D.W. (2015) Stationary Bootstrapping for Semiparametric Panel Unit Root Tests. Computational Statistics & Data Analysis, 83, pp. 14-25.
Im K.S., Pesaran M.H., Shin Y. (2003) Testing for Unit Roots in Heterogenous Panels. Journal of Econometrics, 115, pp. 53-74.
Jang M.J., Shin D.W. (2005) Comparison of Panel Unit Root Tests under Cross Sectional Dependence. Economics Letters, 89, pp. 12-17.
Kao C., Chiang M.H., Chen B. (1999) International R&D Spillovers: An Application of Estimation and Inference in Panel Cointegration. Oxford Bulletin of Economics and Statistics, 61, pp. 691-709.
Kapetanios G. (2005) Dynamic Factor Extraction of Cross-Sectional Dependence in Panel Unit Root Tests. Journal of Applied Econometrics, 22, pp. 313-338.
Karavias Y., Tzavalis E. (2014a) Testing for Unit Roots in Short Panels Allowing for a Structural Break. Computational Statistics & Data Analysis, 76, pp. 391-407.
Karavias Y., Tzavalis E. (2014b) A fixed-T Version of Breitungs Panel Data Unit Root Test. Economics Letters, 124, pp. 83-87.
Karavias Y., Tzavalis E. (2019) Generalized Fixed-t Panel Unit Root Tests. Scandinavian Journal of Statistics, 46, pp. 1227-1251.
Karavias Y., Tzavalis E., Zhang H. (2022) Missing Values in Panel Data Unit Root Tests. Econometrics, 10.1, 12.
Karlsson S., Lothgren M. (2000) On the Power and Interpretation of Panel Unit Root Tests. Economics Letters, 66, pp. 249-255.
Kunsch H.R. (1989) The Jackknife and the Bootstrap for General Stationary Observations. Annals of Statistics, 17, pp. 1217-1241.
Levin A., Lin C.F. (1993) Unit Root Tests in Panel Data: Asymptotic and Finitesample Properties. Unpublished Manuscript.
Levin A., Lin C.F., Chu C.J. (2002) Unit Root Tests in Panel Data: Asymptotic and Finite-sample Properties. Journal of Econometrics, 108, pp. 1-24.
Maddala G.S., Wu S. (1999) A Comparative Study of Unit Root Tests with Panel Data and a New Simple Test. Oxford Bulletin of Economics and Statistics, 61, pp. 631-652.
Moon H.R., Perron B., Phillips P.C.B. (2007) Incidental Trends and the Power of Panel Unit Root Tests. Journal of Econometrics, 141, pp. 416-459.
Moon H.R., Phillips P.C.B. (1999) Maximum Likelihood Estimation in Panels with Incidental Trends. Oxford Bulletin of Economics and Statistics, 61, pp. 771-748.
Moon H.R., Perron B. (2004) Testing for a Unit Root in Panels with Dynamic Factors. Journal of Econometrics, 122, pp. 81-126.
Ng S. (2008) A Simple Test for Nonstationarity in Mixed Panels. Journal of Business & Economic Statistics, 26, pp. 113-127.
Nickell S. (1981) Biases in Dynamic Models with Fixed Effects. Econometrica, 49, pp. 1417-1426.
O'Connell P. (1998) The Overvaluation of Purchasing Power Parity. Journal of International Economics, 44, pp. 1-19.
Palm F.C., Smeekes S., Urbain J.-P. (2011) Cross-Sectional Dependence Robust Block Bootstrap Panel Unit Root Tests. Journal of Econometrics, 163, pp. 85-104.
Pesaran M.H. (2007a) A Pair-Wise Approach to Testing for Output and Growth Convergence. Journal of Econometrics, 138, pp. 312-355.
Pesaran M.H. (2007b) A Simple Panel Unit Root Test in the Presence of Cross-Section Dependence. Journal of Applied Econometrics, 22, pp. 265-312.
Pesaran M.H., Smith L.V., Yamagata T. (2013) Panel Unit Root Tests in the Presence of a Multifactor Error Structure. Journal of Econometrics, 175, pp. 94-115.
Phillips P.C.B., Moon H.R. (1999) Linear Regression Limit Theory for Nonstationary Panel Data. Econometrica, 67, pp. 1057-1111.
Phillips P.C.B., Sul D. (2003) Dynamic Panel Estimation and Homogeneity Testing Under Cross-Section Dependence. Econometrics Journal, 6, pp. 217-239.
Politis D.N., Romano J.P. (1994) The Stationary Bootstrap. Journal of American Statistical Association, 89, pp. 1303-1313.
Ratnikova T.A., Furmanov K.K. (2014) Analysis of Panel Data and State Duration Data. М.: Publishing House of the HSE. (in Russ.)
Ratnikova T.A. (2006) Introduction to Econometric Analysis of Panel Data. HSE Economic Journal, 10, 3, pp. 492-519.
Reese S., Westerlund J. (2016) Panicca: Panic on Cross-Section Averages. Journal of Applied Econometrics, 31, pp. 961-981.
Sargan J.D., Bhargava A. (1983) Testing Residuals from Least Squares Regression for Being Generated by the Gaussian Random Walk. Econometrica, 51, pp. 153-174.
De Silva S., Hadri K., Tremayne A.R. (2009) Panel Unit Root Tests in the Presence of Cross-Sectional Dependence: Finite Sample Performance and an Application. Econometrics Journal, 12, pp. 340-366.
Smeekes S. (2014) Bootstrap Sequential Tests to Determine the Order of Integration of Individual Units in A Time Series Panel. Journal of Time Series Analysis, 36, pp. 398-415.
Smeekes S., Urbain J.-P. (2014) On the Applicability of the Sieve Bootstrap in Time Series Panels. Oxford Bulletin of Economics & Statistics, 76, pp 139-151.
Smeekes S., Wilms I. (2023) BootUR: An R Package for Bootstrap Unit Root Tests. Journal of Statistical Software, 106, pp. 1-39.
Skrobotov A. (2020) Survey on Structural Breaks and Unit Root Tests. Applied Econometrics, 58, pp. 96-141. (In Russ.)
Skrobotov A. (2021) Structural Breaks in Cointegration Models. Applied Econometrics, 63, pp. 117141. (In Russ.)
Skrobotov A. (2021) Structural Breaks in Cointegration Models: Multivariate Case. Applied Econometrics, 64, pp. 83-106. (In Russ.)
Stock J.H. (1999.) A Class of Tests for Integration and Cointegration. Cointegration, Causality, and Forecasting: A Festschrift for Clive W.J. Granger. Oxford: Oxford University Press, pp. 135-167.
Stock J.H., Watson M.W. (1988) Unit Root Tests for Panel Data. Testing for Common Trends, 83, pp. 1097-1107.
Strauss J., Yigit T. (2003) Shortfalls of Panel Unit Root Testing. Economics Letters, 81, pp. 309-313.
Sul D. (2009) Panel Unit Root Tests Under Cross Section Dependence with Recursive Mean Adjustment. Economics Letters, 105, pp. 123-126.
Westerlund J. (2014) The Asymptotic Distribution of the CADF Unit Root Test in the Presence of Heterogeneous AR(p) Errors. Statistical Papers, 57, pp. 303-317.
Westerlund J. (2015) The Effect of Recursive Detrending on Panel Unit Root Tests. Journal of Econometrics, 185, pp. 453-467.
Westerlund J. (2016a) An IV Test for a Unit Root in Generally Trending and Correlated Panels. Oxford Bulletin of Economics and Statistics, 78, pp. 752-764.
Westerlund J. (2016b) Pooled Panel Unit Root Tests and the Effect of Past Initialization. Econometric Reviews, 35, pp. 396-427.
Westerlund J., Breitung J. (2013) Lessons From a Decade of IPS and LLC. Econometric Reviews, 32, pp. 547-591.
Westerlund J., Hosseinkouchack M. (2016) Modified CADF and CIPS Panel Unit Root Statistics with Standard Chi-squared and Normal Limiting Distributions. Oxford Bulletin of Economics & Statistics, 78, pp. 347-364.
Westerlund J., Larsson R. (2009) A Note on the Pooling of Individual PANIC Unit Root Tests. Econometric Theory, 25, pp. 1851-1868.