Научная статья на тему 'Лекции: Анализ временных рядов'

Лекции: Анализ временных рядов Текст научной статьи по специальности «Математика»

CC BY-NC-ND
1847
263
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Канторович Григорий Гельмутович

Продолжается публикация курса "Анализ временных рядов". В этом номере рассматривается моделирование сезонности в терминах моделей ARIMA, построение авторегрессионных моделей с распределенными лагами (ADL), модели корреляции ошибками (ECM), различные типы экзогенности переменных, начато рассмотрение многомерных временных рядов. В следующем выпуске будет продолжено рассмотрение моделей многомерных случайных процессов, коинтеграционные регрессии, тестирование коинтеграции.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Лекции: Анализ временных рядов»

ЛЕКЦИОННЫЕ И МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ

Анализ временных рядов1) Канторович Г.Г.

Продолжается публикация курса «Анализ временных рядов». В этом номере рассматривается моделирование сезонности в терминах моделей АШМА, построение авторегрессионных моделей с распределенными лагами (АЮЪ), модели корреляции ошибками (ЕСМ), различные типы экзогенности переменных, начато рассмотрение многомерных временных рядов.

В следующем выпуске будет продолжено рассмотрение моделей многомерных случайных процессов, коинтеграционные регрессии, тестирование коинтеграции.

Лекция 11 Сезонность

Статистические данные динамики экономических величин часто демонстрируют регулярные или почти регулярные колебания. Это явление носит название сезонности. Так, если рассматривать данные об объеме промышленного производства, то уровень производства в январе имеет большую связь с производством в прошлогоднем январе, чем с производством в предыдущем месяце - декабре. Обычно в России в январе наблюдается сильное падение производства по сравнению с декабрем. В развитых странах в летние месяцы происходит снижение безработицы в связи с сезонными работами. Данные о розничных продажах обычно имеют заметный «всплеск» в декабре, что носит название рождественского эффекта.

Из предыдущих лекций видно, что модели типа АШМА плохо описывают такое сезонное циклическое поведение данных. Другими словами, неявно предполагается, что сезонность предварительно устранена. В традиционной экономической практике такое «десезонирование» данных получило широкое применение. Одним из распространенных методов является хорошо вам известное из курса эконометрики применение ^шшу-переменных. Например, для квартальных данных строится регрессия на 4 ^шшу-переменные, каждая из которых равна 1 в соот-

1 Подготовлено при содействии Национального фонда подготовки кадров (НФПК) в рамках программы «Совершенствование преподавания социально-экономических дисциплин в вузах».

Канторович Г.Г. - профессор, к. физ.-мат. н., проректор ГУ-ВШЭ, зав. кафедрой математической экономики и эконометрики.

ветствующем квартале и 0 - в остальных (не забудем, что свободный член в этом случае в регрессию не включается). Остатки этой регрессии и являются данными с устраненной сезонностью. Этот метод предполагает «жесткую» сезонность с неизменной величиной влияния каждого квартала в отдельности. Для месячных данных регрессия строится на 12 dummy-переменных, для полугодовых - на 2 dummy-переменные. Иногда рассматривают временные отрезки длиной в четыре недели, тогда в течение года насчитывается 13 промежутков и, соответственно, 13 dummy-переменных. В дальнейшем будем называть такой подход детерминированной сезонностью.

Предположение о «жесткой» сезонности является слишком ограничительным, поэтому официальная статистика применяет более сложные методы устранения сезонности. Широкое распространение получила программа Х-11, разработанная в Американском бюро цензов (US Census Bureau), и ее дальнейшие развития. Разработаны и применяются на практике и другие методы. На рис. 11.1 приведены официальные ежемесячные данные Госкомстата РФ о динамике индекса промышленного производства в России в период с января 1990 г. по апрель 1999 г. до и после устранения сезонности [1]. На графике хорошо видно, что сезонность в этом случае наложена на тренд, т.е. данные демонстрируют одновременно и циклическое поведение, и тенденцию к снижению уровня.

-Сезонная составляющая устранена

- Сезонная составляющая не устранена

Рис. 11.1. Динамика индекса промышленного производства в России с января 1990 г. по апрель 1999 г., %

Рассмотренные до сих пор модели временной структуры ряда не предназначались для описания именно такого поведения. Мы строили авторегрессионные модели, когда текущее значение ряда было связано с несколькими предыдущими значениями. В принципе, циклическое поведение можно попытаться описать в терминах моделей ARMA, наложив некоторые ограничения на коэффициенты модели. Например, если исследуемые данные являются квартальными, сезонность означает, что данные I квартала текущего года сильнее связаны с данными I квартала предыдущего года, чем с данными предыдущего квартала. Разумно рассмат-

ривать модель, в которой явно присутствует связь только с данными одноименного квартала предыдущего года, т.е. модель вида: xt =jxt_4 +et. А для месячных данных разумной будет модель xt = Y xt+ st. Используя оператор сдвига, получаем для квартальных данных: (1 _ jL4)xt = st, а для месячных данных:

(1 _ jL)xt = st. Видно, что сезонность - это специальный случай ARMA. По нашей терминологии это ARMA(4,0) или AR(4). Но у него промежуточные коэффициенты равны нулю.

Что будет, если в модели с квартальными данными j = 1 ? Модель принимает вид xt = xt_4 + st. Очевидно, характеристическое уравнение имеет единичный корень. Модель приводится к виду (1 _ L4)xt = st. Я думаю, вы помните, что (1-L4) раскладывается на 4 сомножителя, и L=1 является корнем. Три остальных корня характеристического уравнения равны соответственно -1 и ± i, где

i = л/_Г . Все четыре корня по модулю равны 1. Говорят, что уравнение содержит единичный корень в обычном смысле и, кроме того, три сезонных единичных корня [11]. Аналогично для месячных данных: если Y = 1, то модель принимает вид (1 _L12)xt = st. Разумеется, здесь тоже есть единичный корень в обычном смысле, т.е. и этот ряд относится к типу DS.

Модель, в которой имеется такой четко выраженный сомножитель (1 _ jL )

или (1 _ jL2 ) принято называть сезонной авторегрессией (SAR). Аналогично можно рассмотреть сезонную схему для скользящего среднего, т.е. рассмотреть модель типа SMA, которая означает, что в правую часть будет добавлено слагаемое ßst _4. Эта модель представляет собой специальный вид обычного МА(4) или

МА(12) с нулевыми промежуточными коэффициентами. Общая модель, описывающая сезонность в подходе Бокса-Дженкинса, носит название SARIMA.

Разработана примерно такая же теория и практика нахождения единичных сезонных корней, как это сделано для обычных единичных корней. Если TS и DS процессы мы называли также процессами с детерминированным и стохастическим трендом соответственно, то для описания сезонности употребляется аналогичная терминология. Если j = 1, то присутствует стохастическая сезонность. Если i j < 1, то присутствует детерминированная сезонность.

Разумеется, в одной модели можно без большого труда сочетать и сезонную составляющую, и обычную ARMA схему. Например, рассмотрим модель типа

SARIMA: (1 _ L4)B(L)xt = st, где B(L) = (1 _ ßL) (для упрощения записи в модель не включена МА часть). После раскрытия скобок получаем: (1 _L4 _ßL + ßL5)xt = st или xt = ßxt l + xt_4 _ ßxt5 + st. То есть исходная модель приводится к AR(5), но

с некоторыми дополнительными ограничениями на коэффициенты. Они выражаются в том, что второй и третий коэффициенты равны нулю, и в том, что коэффициенты первого и пятого слагаемых в сумме равны нулю, т.е. имеют противоположные знаки. Другими словами, это некий частный случай общего AR(5). При

оценивании модели для нас важно, что мы уже знаем эти соотношения между коэффициентами и будем оценивать именно такую модель, а не общую, в которой у нас будут лишние переменные и понизится точность оценки наших коэффициентов. Эту модель принято обозначать SAR(4)xAR(1).

Econometric Views позволяет легко строить такие модели, вы просто указываете, что вам надо добавить в модель SAR или SMA соответствующего порядка. Следует отметить, что при задании порядка сезонности нужно учитывать, как описана структура данных в базе EViews. Если данные описаны как нерегулярные, то порядок сезонности задается числом 4, а если вы их уже описали как квартальные, то можно задать SAR(1).

Получается, что если в данных присутствует сезонность, нельзя обойтись моделью ARMA низкого порядка. Допустим, у вас есть ежемесячные данные за 4 или 5 лет. Наличие сезонности означает, что имеется значимая статистическая зависимость от соответствующего месяца предыдущего года. Вы можете сразу построить модель порядка, скажем, 15, т.е. AR(15), но AR(15) приведет к утрате 15 первых точек для построения модели. Коэффициентов определяется очень много, опасность мультиколлинеарности возрастает. При явном использовании схемы SAR возникает другая ситуация, в модели остается только 4 коэффициента. Конечно, некоторое число наблюдений все равно будет потеряно. Но число коэффициентов гораздо меньше, число степеней свободы существенно больше, значит, точность их оценивания возрастает. Кроме того, уменьшается опасность мультикол-линеарности.

Если учет сезонности в терминах подхода Бокса-Дженкинса находит широкое применение на практике, то исследование единичных сезонных корней не столь популярно. Среди работ по этой тематике, кроме уже отмеченной статьи Хилле-берга и других, стоит отметить монографию Франсеса [5].

Авторегрессионные модели с распределенными лагами

До сих пор мы рассматривали только один случайный процесс Xt. Мы исследовали его на стационарность, строили модели процесса, прогнозировали будущие значения процесса. Однако при изучении экономических явлений наибольший интерес представляет взаимозависимость экономических величин. Текущее значение экономической величины будет зависеть не только от ее предыдущих значений, но и от текущего и предыдущих значений других экономических величин. Другими словами, среди регрессоров будут лаговые значения как объясняемой, так и объясняющих величин. Такие модели принято называть авторегрессионными моделями с распределенными лагами, по-английски - ADL (auturegres-sive distributed lag) models. Другое название таких моделей - ARMAX напоминает об их сходстве с моделями ARIMA. Регрессор Xt как бы заменяет собой белый шум в модели ARIMA. Для случая только одной объясняющей экономической величины общий вид моделей рассматриваемого типа:

Yt =e + alYt_l +a2Yt_2 + ...+apYt_p + ß0 Xt + ß XM + ß2 Xt_2 +... + ßqXt_q + et, t = 1Д...Г.

Случайное возмущение по-прежнему полагается белым шумом. Используя операторные полиномы, получим а (Ь)У( = 0 + /3 (V)Х( + е. В отличие от модели

АШМА мы отказываемся от нормирующего условия Д0 ° 1. Мы будем использовать обозначения ADL(p,q) и АИМАХ(р^), чтобы указать количество лагов независимой и зависимой переменных.

Если процесс Х{ является стационарным в широком смысле, то, используя

его разложение по теореме Вольда, мы получаем представление процесса У{ в виде модели АИМА(р,да), и стационарность процесса У{ полностью определяется авторегрессионной частью исходной модели. Для нестационарного регрессора Х{ процесс У{ является, вообще говоря, также нестационарным. Отдельного рассмотрения заслуживает только случай, когда характеристические уравнения обоих полиномов а (Ь) и Д (Ь) имеют одинаковые корни, по модулю большие единицы.

Начнем рассмотрение с ситуации, когда регрессор стационарен, и полином а (Ь) не имеет корней вне или на единичной окружности. В этом случае можно

переписать модель в виде: у = ар (Ь)~19+ар (Ь)Д (Ь)Х( + ар (Ь)~1£(, т.е. стационарная ADL модель представима в виде модели с распределенными лагами без авторегрессионной части. Это означает, что текущее значение величины У{

зависит от текущего и всех предшествовавших значений величины Х{ или что текущее значение Х{ влияет на текущее и все последующие значения величины У. Другими словами, текущее значение величины У{ представляется в виде суммы динамических откликов на изменения величины Х{. Коэффициент влияния

дУ

значения Х( на величину У+ к представляет собой частную производную ——,

дХ

которую можно выразить как значение производной от операторного выражения:

й

к ( (Ь) ^

йЬк

(Ь) у

при Ь=0.

При увеличении параметра к получаем последовательно мгновенный, краткосрочный, среднесрочный и долгосрочный отклики. Для макроэкономических и монетарных моделей, выраженных в уровнях величин, эти отклики принято называть соответствующими мультипликаторами, а для моделей, выраженных в логарифмах величин, - эластичностями. Например, для модели ADL(1,1) отклики выражаются через коэффициенты модели следующим образом:

2

Д0,Д + а1Д0,а1Д1 + а1 Д0 и т.д.

Долгосрочный отклик определяется как сумма всех промежуточных откликов. Используя стационарность процессов Х и У , долгосрочный отклик можно найти, просто взяв математические ожидания от обеих частей соотношения. В результате получаем уравнение статического или долгосрочного равновесия.

Y =

q bq (i)-

- + -

X,

а, (1) а, (1)

где через У и X обозначены равновесные значения соответствующих величин.

Для удобства анализа долгосрочного и краткосрочного поведения динамического соотношения, выраженного ЛЮЪ моделью, удобно провести перепараметризацию модели. Начнем с модели ЛБЪ(1,1): у = 0+а1У(_1 + /30Х( + /31 Х__х + е,. Заменив У{ на У{_1 + АУ{, и Х{ на Х1_1 + АХ{, получаем:

Ау = 0 + 30ах( _(1 _а)ум + (30 + 3)Х

Перегруппировка членов дает:

о 3о + 31

,-1 + e.

AY, = bo AX, - (1 -ai)

Yt-i -

1 -a,

1 -a,

X,

+e.

Это представление ADL модели называется моделью коррекции ошибками (error correction model), сокращенно - ECM2). Смысл модели и названия становится ясен, если обратить внимание, что выражение в квадратных скобках может трактоваться как отклонение от долгосрочного равновесия в момент времени t-1. В самом деле, долгосрочное равновесие определяется соотношением

Y - q

bo + b v

1 -a. 1 -a.

X

= 0,

11

поэтому выражение в квадратных скобках положительно, если значение У—1 превышает равновесное значение, соответствующее Х{ _1. Таким образом, текущее (краткосрочное) изменение У представлено в виде суммы двух слагаемых. Первое из них - это мгновенный отклик на текущее (краткосрочное) изменение Х , а второе - поправка на имевшее место в предыдущий момент отклонение от долгосрочного равновесия. При этом, поскольку для стационарности процесса У{ необходимо выполнение условия |а11 < 1, коэффициент при невязке отрицательный. Это означает, что второе слагаемое «подтягивает» процесс У{ к долгосрочному соотношению с процессом Х{. Таким образом, модель коррекции ошибками позволяет удобно объединить в рамках одной модели краткосрочную и долгосрочную динамику, а ее коэффициенты имеют содержательную экономическую интерпретацию.

В общем случае модели ЛОЪ(р^) мы должны заменить значения процессов У и Х{ в различные моменты времени на их значения в момент {-1 и отклоне-

2) Впервые введена в [14].

ния, например Yt_2 = Yt_1 — AYt, Yt—3 = Yt_1 — AYt — AYt_2. В результате получаем ECM представление:

AYt = b0AXt AYt_i + AXt_г — ^(1)

i=1 i=1

Выражение в квадратных скобках по-прежнему представляет корректирующий член, «подправляющий» лаговую структуру отклонениями от долгосрочного равновесия на предыдущем шаге. Это хорошо видно после замены нулями всех отклонений, что соответствует равновесному состоянию. Важно также отметить, что коэффициенты Si и gi, также как и остальные коэффициенты ECM представления, линейно выражаются через коэффициенты исходной ADL модели, причем это преобразование невырождено.

Наиболее общая ADL модель получается в случае, когда имеется k различных экономических дисциплин в качестве регрессоров. Будем обозначать ее ADL(p,q!,q2,...,qk), а общее уравнение принимает вид:

(L)Yt = q + bqi (L) X it + f3qi(L)X 2t +... + b (L)Xto + ^ ■

Преобразование к модели коррекции ошибками проводится в этом случае точно также, как и ранее, но выражение в общем случае становится весьма громоздким.

Оценивание и диагностика ADL моделей близки к моделям ARIMA. Поскольку в модели отсутствует лаговая структура случайного возмущения, основным методом оценивания является метод наименьших квадратов. Мы знаем, что при отсутствии корреляции случайных регрессоров и случайного возмущения МНК дает состоятельные оценки. Разумеется, перед оцениванием модели нужно убедиться, что все переменные являются стационарными.

У нас есть две возможности. Первая: оценить ADL модель, а затем пересчитать параметры и их стандартные ошибки для ECM представления. Вторая: оценить параметры ECM модели непосредственно. Поскольку, как уже упоминалось ранее, коэффициенты ADL и ECM моделей связаны невырожденным линейным преобразованием, можно доказать, что оба пути дают идентичные результаты. Поэтому, выбор представления модели определяется содержательной задачей исследования, а не особенностями процедуры оценивания.

Определение числа лагов для переменных, входящих в модель, неизбежно сопровождается построением ряда моделей и выбором наилучшей из них. Общепринятой стратегией выбора модели в настоящее время является подход от общего к частному (from general to simple), предложенный и развитый Дэвидом Хендри и его соавторами [8]. В соответствии с этим подходом мы начинаем построение с наиболее общей модели как по набору объясняющих переменных, так и по количеству включенных лагов. Построенная методом наименьших квадратов модель подвергается различным тестам: на автокорреляцию остатков, нормальность, гетероскедастичность и т.д. Если модель проходит все диагностические тесты, на следующем шаге исследуется возможность наложения различных ограничений на ее коэффициенты. Такими ограничениями могут быть исключение из модели отдельных переменных или лагов, равенство некоторых коэффициентов между собой и т.п. Обычно проверяемые ограничения порождаются как содержательными теоретическими соображениями, так и численными значениями оценок коэффициентов.

Yt _ i _

q

bq (1)

(1) (1)

Xt

+ e

Лекция 12

При оценивании АЮЪ моделей существует еще одна особенность, которую следует иметь в виду. Впрочем, она присутствует при оценивании любой модели со стохастическими регрессорами, но в курсе эконометрики мы оставляли ее за рамками рассмотрения. Рассматривая несколько случайных величин (или процессов) одновременно, мы всегда неявно предполагаем существование их совместного распределения. Для упрощения выкладок и, не теряя общности, ограничимся двумя процессами: У и Х(. Пусть, например, мы строим ЛЮЪ модель процесса У от

одной объясняющей переменной Х(. Совместная плотность распределения

/(У , Х() , если она существует, может быть представлена в виде произведения

/(У, Х{) = /(у|Х,)/(Х{) условной плотности у при условии Х( и одномерной

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

плотности процесса Х(. Такое разложение называется факторизацией совместного распределения.

В то же время, теоретическая регрессия представляет собой условное математическое ожидание Е (У|Х,) = | У(/(У Хг МУ, для вычисления которого используется только условное распределение. Фактически для вычисления регрессии не используется часть информации, содержащаяся в совместном распределении. Вопрос о том, в какой степени такой неполный учет информации влияет на оценивание регрессии, представляет очень интересный и важный аспект современного эконометрического исследования.

Рассмотрим два случайных процесса у и х(, определяемые следующей моделью, в которой для упрощения записи математические ожидания положены равными нулю:

У = 3 + еи

Хг = а1 Х_1 + а2У_1 + ■

Пусть возмущения образуют двумерный нормальный случайный процесс е , каждая компонента которого не имеет автокорреляций (т.е. является белым шумом), но корреляция между одновременными значениями возмущений, вообще говоря, может быть ненулевой. Это означает, что

Г о ^ ... (а а, 2 ^

V 0 0

Е (е) = , ооу(е) =

•11 а12 2 а22 0

Р =

£

Двумерное распределение х( и у полностью определяется свойствами вектора е , но у нас нет нужды выписывать распределение в явном виде. Заметим, что процессы х( и у очевидно автокоррелированы. Первое из соотношений является уравнением регрессии, и вопрос состоит в том, в какой степени можно

а12

оценивать эту зависимость yt от xt, не принимая во внимание второе из соотношений. В ранее применявшихся терминах [10] вопрос звучал так: является ли xt

экзогенным (exogenous) для уравнения регрессии? В соответствии же с современными представлениями [4] этот вопрос недостаточно конкретен: следует заранее определить способ использования модели. В эконометрике мы уже встречались с ситуацией, когда выбор, например, наилучшей модели зависел от того, как мы собираемся ее использовать. Мы различали, в основном, два типа использования: а) для целей прогнозирования и б) для изучения механизма модели, когда нас интересовали численные оценки всех или нескольких параметров. В соответствии с [4] будем различать следующие три цели анализа моделей:

• сделать статистические выводы об одном или нескольких параметрах модели (изучить механизм модели);

• предсказать yt при заданном xt, (условный прогноз);

• проверить, является ли уравнение регрессии структурно инвариантным при изменениях одномерного распределения xt.

Слабая экзогенность (weak exogeneity)

Пусть мы рассматриваем регрессию некой величины yt на несколько регрессоров. Обозначим через j вектор параметров совместной плотности величины yt и регрессоров, через q - вектор параметров, от которых зависит условная

плотность вероятности yt при заданных регрессорах, а через Q - вектор параметров совместной плотности вероятности регрессоров.

Наконец, пусть параметры, относительно которых мы хотим сделать статистические выводы, образуют множество, записанное в виде вектора а . Мы скажем, что набор регрессоров является слабо экзогенным для параметров а , если статистические выводы об этих параметрах, сделанные на основании условного распределения, эквивалентны выводам по совместному распределению yt и рег-рессоров.

Очевидно, что необходимым условием независимости статистических выводов от информации, содержащейся в условном распределении регрессоров, является возможность выразить а в виде функции параметров Q , т.е. а = a(q ).

Кроме того, на компоненты векторов параметров q и q не должны быть наложены совместные ограничения ни в виде равенств, ни в виде неравенств. Это означает, что область допустимых значений параметров Q не зависит от того, какие значения принимают параметры из множества q , и наоборот. Это свойство

по-английски выражается термином variation-free. По-русски можно использовать предложенный Э. Б. Ершовым термин «свободно-варьируемые».

Проиллюстрируем свойство слабой экзогенности на примере вышеприведен-

о12

ной модели. Умножив второе из уравнений на--— и сложив полученные урав-

СТ22

нения, получим:

. „ о, 2 о, 2 о, 2 о. 2

у г =(/+от} х - «ох- 1 - « -¡г у- 1 - е 1 , - -г s2t ■

о22 о22 о22 о22

Введя для упрощения записи обозначения:

¿0 = / + о

о22

¿0 = -ао

о22

¿0 =-«2 о

о22

о, 2

иг = е 1 г--е2г >

о22

приходим к следующей модели: у( = ¿0х( + ¿1х , + ¿2у1 + ы(.

Случайный процесс , как линейная комбинация нормальных процессов,

о1

является нормальным. Очевидно, что уаг(иг) = о1 1--— = о11 (1 - р )

и

°22

ооу(мг ,82г) = ооу(ег ,б2()--— ооу(е2г ,е2г) = 0 по определению параметров о 1 ^

о22

о1 2, о22 и р. Таким образом, нормальные случайные процессы и е2г - не-коррелированы и, следовательно, независимы. Полученное уравнение для процесса у{ является другой параметризацией уравнения регрессии у{ = /Зх{ + 8и.

Введенные ранее векторы параметров конкретизируются для данного примера следующим образом:

ф = (Ь« ,а2,о 1>о!2,о22)Т

= ¿0^ 1' ¿2 ' о П ) Т , $2 = («1 ,«2,о22) Т .

Предположим, что вектор а содержит только один параметр /, т.е. нас интересует только коэффициент регрессии у( на х(. Параметр / выражается

через параметры из множеств 0Х и 02 следующим образом:

с о

/ = ¿0 + « = ¿0 + «. « а2

сам

Очевидно, что b невозможно представить в виде функции от параметров, входящих только в множество q1. Более того, параметры из множеств q1 и 02 связаны очевидным соотношением OC2S1 = OC1S2, т.е. не являются свободно варьируемыми. Вывод очевиден: переменная (регрессор) xt не является слабо экзогенной для параметра b.

Несколько изменим модель. Пусть возмущения s1t и s2t будут независимыми (s12 = 0 ). Тогда

Ф = (b,a1,a2,S^1,S12,S22) Т q1 = (b,S11)Т , q2 = (a1,«2,S22)Т .

Теперь b является элементом множества q1 и, конечно, является функцией от самого себя. Также очевидно, что параметры множеств q1 и 62 являются свободно варьируемыми. Таким образом, в этом случае xt является слабо экзогенной переменной для параметра b.

Как еще одну модификацию рассмотрим случай, когда с12 вновь не равно нулю, но мы интересуемся другим параметром - S0 из преобразованного уравнения. Очевидно, что параметр d0 представим как функция параметров из множества q1, но условие свободной варьируемости не выполнено. Следовательно, процесс xt не является слабо экзогенным и для параметра d0.

Обратите внимание, что если переменная не является слабо экзогенной для параметра, то это еще не означает, что этот параметр нельзя оценить. Например, попытка оценить параметр b методом наименьших квадратов дает несостоятельную оценку, поскольку xt очевидно коррелирует с s1t

( COV(xt ,s2t ) = COV(s1t ,s2t ) = s12 ). А вот корреляция переменной xt с возмущением ut равна нулю, поэтому оценка параметра d0 методом наименьших квадратов состоятельна. Но вот точность оценки (ее эффективность) снижена, так как в модель не инкорпорирована отмеченная связь между параметрами множеств q1 и q2 .

Сильная экзогенность (strong exogeneity)

В соответствии с [4] переменная xt называется строго экзогенной для параметра b, если она слабо экзогенна для него, и объясняемая переменная yt не

является причиной по Грэнджеру для переменной xt. Понятие причинности по

Грэнджеру (Granger causality) было введено в работе [6]. Этот термин сегодня расценивается как не очень удачный, прежде всего из-за дословного совпадения с причинно-следственными отношениями в обычном смысле, но он уже прочно укоренился в литературе. Лимер [12] предлагал более удачный термин «предшествование» (precedence), но в практике укоренилась именно причинность по Грэнджеру.

Основной посылкой Грэнджера было то, что будущее не может быть причиной настоящего или прошлого. Поэтому, если событие А произошло после события В, то А определенно не может быть причиной В. Но, как знает каждый, «после того не значит вследствие того». При анализе временных рядов часто хотелось бы знать, предшествует ряд xt ряду yt, или y предшествует xt, или они

«одновременны». Например, предшествует сжатие денежной массы падению производства в России 1990-х гг., или между ними нет соотношения предшествования (причинности по Грэнджеру).

Понятие причинности по Грэнджеру имеет более широкое применение, чем то, в котором мы будем его использовать. Это, скорее, понятие информационное. Сначала запишем формальное определение. Рассмотрим некоторый процесс Zt, не важно, многомерный или нет. Представим себе, что мы рассчитываем условное математическое ожидание этого процесса: E(Zt+1 |Qt), где Wt - вся возможная

информация, которая существует в мире в момент t. Потом из всевозможной информации, которая известна к моменту t, удаляем информацию о некотором процессе xt. Если при этом условное математическое ожидание процесса Zt не изменится, т.е. если E(Zt+1 |Wt )= E(Zt+1 |Wt \ xs (s < t)), то xt не является причиной по Гренжеру для Zt. Если же они не равны между собой, т.е. если изъятие информации об xt меняет условное математическое ожидание, то xt является причиной по Грэнджеру для Z t .

Если xt - причина по Грэнджеру для Zt , то это не означает, что между этими процессами есть причинно-следственная связь. Единственный вывод состоит в том, что уж если переменная xt не является причиной по Грэнджеру для

переменной Zt , то она не является ее причиной и в обычном смысле. Грэнджер [6] предложил метод тестирования причинности по Грэнджеру. Он предложил построить регрессию процесса Zt на его собственные предыдущие значения и на

k k

предыдущие значения процесса xt: Zt = a0 +^aiZt_i bixt_i + st. А после

i=1 i=1

этого проверить обычную гипотезу о равенстве нулю группы коэффициентов:

H0 : Д = ... = b = 0

. Это обычный F-тест. Как обычно, строится полное уравне-

H-1 : b2 + .. + Ь > 0

ние и укороченное, и сравниваются остаточные суммы по F-статистике. Если ну-

левая гипотеза отвергается, то xt является причиной по Грэнджеру для Zt. Если же нулевая гипотеза не отвергается, то прошлое процесса xt не оказывает влияние на процесс Zt и не является его причиной по Грэнджеру.

Симс в [16] предложил другой подход: xt не является причиной по Грэнджеру для yt, если в регрессии yt на прошлые, текущие и предыдущие значения xt коэффициенты при будущих значениях xt совместно равны нулю. Для проведения теста строим регрессию

m

yt = ЕДл- i + e i=-k

и проверяем гипотезу H0 : = 0 (i = 1, ..., k) против естественной альтернативы. Если нулевая гипотеза отвергается, то знание будущих значений xt не позволяет улучшать прогноз yt. Хотя с эконометрической точки зрения тесты

Грэнджера и Симса не тождественны, они проверяют одно и то же свойство [3]. Оба теста, впрочем, весьма чувствительны к числу лагов, включенных в тестовое уравнение. Идейно тесты должны включать бесконечное число лагов, т.е. всю предысторию xt. Но нас ограничивает длина реализации, во-первых, в количестве лагов, которое можно применять, во-вторых, падающее число степеней свободы тоже может повлиять на мощность этого теста. Хорошие рекомендации по выбору числа лагов отсутствуют.

Если группа регрессоров является строго экзогенной для параметра J , то этот параметр можно оценить из уравнения регрессии, используя только информацию об условном распределении. В этом случае также можно прогнозировать процесс yt, основываясь на прогнозе процесса xt по его собственным прошлым значениям.

Суперэкзогенность (super exogeneity)

Говорят, что группа регрессоров является суперэкзогенной, если изменение их совместного распределения не меняет условного распределения объясняемой переменной yt. Это свойство связано с так называемой критикой Лукаса [13]. Она

заключается в следующем. Одна из целей эконометрического моделирования состоит в прогнозировании эффекта от изменений экзогенных переменных. Однако при изменении этих переменных экономические агенты видят, что происходят изменения, меняют свое поведение и, тем самым, меняют параметры экономической системы. Поэтому модель с постоянными параметрами, говорил Лукас, не адекватна реальным экономическим системам. Свойство суперэкзогенности выделяет модели экономических систем, к которым критика Лукаса не применима.

В соответствии с уже упоминавшимся подходом Cowles Foundation [10] эк-зогенность переменных и причинно-следственные отношения между переменны-

ми не тестируются, они специфицируются из содержательных априорных соображений. Современный же подход [4] предполагает тестирование экзогенности. По самому смыслу этого свойства для проверки, влияет или нет учет распределения регрессоров на оценки регрессии, использующие только условное распределение, нужно построить обе модели: учитывающую DGP (Data Generating Process) полностью и уравнение регрессии. Но если мы в состоянии построить модель, учитывающую DGP полностью, то необходимость в регрессии просто пропадает. Рассмотренный выше пример с исследованием слабой экзогенности процесса xt относительно параметра J показывает, что нарушение этого свойства связано с наличием регрессора yt-i во втором из уравнений и с неравенством нулю кова-риации <т12. Следовательно, наличие слабой экзогенности является частным случаем общей модели при ограничениях на значения параметров: <г12 = 0, a2 = 0. Поэтому для тестирования слабой экзогенности представляется естественным применение теста множителей Лагранжа, при котором оценивается только модель с ограничениями на параметры. Тест, использующий тест множителей Лагранжа для тестирования слабой экзогенности, был разработан Энглом [4].

В условиях нулевой гипотезы оба уравнения для yt и для xt могут быть оценены МНК по отдельности. Обозначим остатки соответствующих регрессий через ey и ex, причем в обе регрессии включены свободные члены, если только они не должны там отсутствовать из содержательных соображений. Далее строим регрессию ey на константу, xt и ex: eyt = a + b xt + g ext + st.

Нулевая гипотеза принимает вид H0 : g = 0, и при условии справедливости H 0 асимптотическое распределение статистики (T — 1) R2 имеет асимптотическое

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 2 распределение с одной степенью свободы. Здесь R - множественный коэффициент детерминации последней регрессии, а (T — 1) - количество наблюдений при ее оценке.

Асимптотически эквивалентный результат можно получить, используя R2 регрессии ex на константу, xt—1, yt—1 и ey . Этот подход требует построения трех регрессий. Можно ограничиться построением только двух, если воспользоваться теоремой Фриша-Вау. В этом варианте теста мы строим регрессию yt на константу, xt и ex , а затем проверяем значимость коэффициента при ex с помощью статистики Стьюдента. Статистический вывод асимптотически эквивалентен предыдущим модификациям. Последняя версия заключается в регрессии xt на константу, xt—1, yt—1 и ey и проверке значимости коэффициента при ey.

Для тестирования сильной экзогенности мы тестируем слабую экзогенность и затем причинность по Грэнджеру, как это описано ранее. Проверка суперэкзо-генности проводится в три этапа. Сначала проверяется слабая экзогенность. Затем проверяется стабильность параметров условного распределения из множест-

ва 01. Для этой цели могут использоваться введение ^шшу-переменных и проверка их значимости, тест Чау и другие тесты.

Если стабильность параметров условного распределения установлена, то на

третьем этапе проверяется стабильность параметров из множества 02. Проверку имеет смысл проводить, используя ^шшу-переменные. Если параметры из множества 02 оказываются стабильными, то имеющиеся данные не дают оснований

для вывода о суперэкзогенности. Если же нестабильность параметров из 02 установлена, то значимые ^шшу-переменные добавляются в качестве дополнительных регрессоров в исследуемую регрессию. Если введенные ^шшу-переменные оказываются незначимыми в совокупности, то суперэкзогенность установлена.

На другой идее проверки слабой экзогенности основан тест Ву-Хаусмана [7, 18]. При отсутствии слабой экзогенности регрессор хг коррелирован со случайным возмущением, поэтому МНК оценки коэффициентов регрессии являются смещенными и несостоятельными. Состоятельные оценки дает метод инструментальных переменных (IV), о котором мы говорили в курсе эконометрики. Напомню, что инструментальной переменной (инструментом) для Хг называется любая

переменная , некоррелированная со случайным возмущением, но коррелированная с . Тест Ву-Хаусмана сравнивает две оценки: метода наименьших

квадратов и метода инструментальных переменных. При нулевой гипотезе слабой экзогенности обе оценки состоятельны и асимптотически эквивалентны. При альтернативной гипотезе оценки не эквивалентны.

В качестве инструмента выбирается оценка хг методом наименьших квадратов. Проиллюстрируем применение теста Ву-Хаусмана на рассматриваемом примере.

у = ^ + е1(

xt — а1х-1 + а 2у-1 + е2г с теми же свойствами случайных возмущений. На первом шаге строим регрессию,

л

соответствующую второму уравнению, и обозначим через Хг рассчитанные значения Хг. Далее оцениваем регрессию

л

у — Ь + /Хг + е

и проверяем значимость коэффициента В общем случае нескольких регрессо-ров строятся инструменты для каждого из них, все инструменты добавляются в регрессию, и проверяется гипотеза о совместной значимости коэффициентов при инструментальных переменных. Если нулевая гипотеза не отвергается, делается вывод о наличии слабой экзогенности.

Впрочем, на практике достаточно часто просто постулируют слабую экзо-генность переменных, исходя из содержательных соображений. Напомним, что стационарность переменных и слабая экзогенность регрессоров позволяют получить состоятельные оценки коэффициентов ЛЮЪ моделей, и обычные процедуры проверки гипотез являются асимптотически верными.

Лекция 13

Многомерные процессы

До сих пор мы рассматривали модели, которые состоят только из одного соотношения, связывающего временные ряды. При этом мы выбирали одну из переменных в качестве эндогенной, а остальные переменные являлись экзогенными. Такое разделение не всегда является естественным, часто приходится рассматривать одновременно несколько соотношений, в которые одни и те же переменные входят и как эндогенные, и как экзогенные. Как видно из прошлой лекции, переменная не всегда может рассматриваться как экзогенная, и мы фактически должны рассматривать модель ЮСР, состоящую из нескольких уравнений. Это означает моделирование нескольких временных рядов одновременно, другими словами - моделирование многомерного случайного процесса.

Начнем с определений. Рассмотрим вектор Хг = (х1, хг2,..., хк)Т , каждая

компонента которого является временным рядом. Верхним индексом будем обозначать номер компоненты, а нижним по-прежнему - момент времени. Распределение компонент характеризуется семейством совместных плотностей распределения вида: /(х.1, х'2,..., х1'), п = 1,2,.... Условием стационарности в узком смысле

г1 г2 гп

по-прежнему является независимость от сдвига во времени всего семейства совместных плотностей распределения. Только теперь кроме всевозможных комбинаций значений случайного процесса в различные моменты времени аргументами плотностей вероятности также являются всевозможные комбинации различных компонент в различные моменты времени. Например, для двухмерной плотности

получаем из условия стационарности: /2(х1,х2) = /2(х]+т,хг2+т) для любого т.

Совместное распределение компонент для одного и того же момента времени не зависит от времени. Рассмотрим другую функцию распределения, например трехмерную, в которую входят значения первой компоненты в два разных момента времени и второй компоненты в некоторый третий момент времени. Стационарность означает, что /3(х1,х]+к,x^+s) = /3(х]+т,х)+й+т,х^х+т) . Можно сказать, что

это свойство инвариантности к сдвигу во времени. То есть, если к каждому моменту времени прибавить величину т , то функция плотности не изменится. Понятно, что стационарность многомерного процесса влечет за собой стационарность каждой из его компонент.

Как и в одномерном случае, стационарность в узком смысле влечет за собой ряд свойств характеристик случайных процессов. Прежде всего, начнем с математического ожидания. Математическое ожидание для каждой компоненты не зависит от других компонент. Поэтому если многомерный процесс стационарен, математическое ожидание каждой компоненты не зависит от времени. Вектор

математических ожиданий Е (Х() =

V

не зависит от времени.

Теперь рассмотрим моменты второго порядка. Каждая компонента характеризуется дисперсией и автокорреляционной функцией. Если одномерный ряд стационарен, его автокорреляционная и автоковариационная функции зависят только

от сдвига т: Corr(т) = Corr(x't, x\+ ) = pi (т). Однако теперь можно рассмотреть

второй смешанный момент для различных компонент, а также Corr(x\, xj+T). Такую величину естественно назвать кросс-корреляционной функцией. Если компоненты образуют многомерный стационарный процесс, то кросс-корреляция будет функцией сдвига во времени т. Обозначим эту функцию RtJ. (т). Довольно очевидно, что Rtj (т) = Rjt (—т). При фиксированном значении т элементы Rtj (т) образуют матрицу R, зависящую от т. Значению т , равному нулю, соответствует корреляционная матрица вектора Xt.

Как и в одномерном случае, назовем многомерный процесс стационарным в широком смысле (слабо стационарным), если вектор математических ожиданий не зависит от времени, и кросс-корреляции между любыми компонентами зависят только от разности во времени. Можно сказать, что у стационарного многомерного процесса компоненты стационарны и стационарно связаны между собой.

Модель многомерного временного ряда обычно будет задаваться в виде уравнения для каждой из компонент, причем в виде объясняющих переменных будут выступать текущие и предыдущие значения, вообще говоря, всех компонент. Другими словами, модель будет представлена системой одновременных уравнений. Одновременность не дает напрямую использовать такой распространенный метод, как метод наименьших квадратов для оценки параметров многомерных моделей. Эта особенность не имеет специфики временных рядов, а относится именно к оценке одновременных уравнений. Поскольку системы одновременных уравнений не входили еще в данный курс эконометрики, кратко рассмотрим возникающие трудности.

Пусть задана простая Кейнсианская макроэкономическая модель национального дохода, состоящая только из двух следующих уравнений:

Y = Ct + Zt Ct = a + j3Yt + ut

где Yt - национальный доход, Ct - потребление, Zt - инвестиции и государственные расходы, а ut - белый шум. Первое из уравнений представляет собой условие равновесия национального дохода, а второе - функцию потребления. Коэффициент b - предельная склонность к потреблению, а коэффициент a - автономное потребление. В соответствии с экономическим смыслом считаем эндогенными переменными Yt и Ct - ВВП и потребление, а Zt считаем экзогенной

переменной. Эти уравнения и их коэффициенты отражают экономический смысл соотношений, в этом случае говорят, что уравнения заданы в структурной (structural) форме. Индекс t указывает на то, что переменные являются временными рядами, хотя уравнения и не содержат лаговых составляющих. Пусть собраны данные о потреблении, о расходах и о национальном доходе. Можно ли, от-

влекаясь от проблемы экзогенности, оценить функцию потребления просто из второго соотношения методом наименьших квадратов?

Модель представленного типа называется одновременными уравнениями. В данном случае у нас два уравнения, причем эконометрическое у нас только одно. Первое соотношение - это обычное экономическое тождество, мы ничего не оцениваем в этом уравнении. Мы хотим оценить только коэффициенты a и b, но из-за того, что существует дополнительное экономическое тождество, появляется проблема. Если просто подставить Ct в первое соотношение, то получим

Yt = a + j3Yt + Zt + ut. Разрешив полученное уравнение относительно националь-

a 1 ^ 1 -,-т

ного дохода, получаем Y =--1--Z +--u . Подстановка Yt во второе

t 1 — b 1 — b t 1 — b t уравнение дает так называемую приведенную (reduced) форму модели:

Ct =az. 1 u

1 — b 1 — b 1 — b .

a 1 1

Yt =-+-Zt +-ut

1 — b 1 — b 1 — b t

Теперь эндогенные переменные выражены через экзогенные переменные и случайные возмущения. Различие между структурной и приведенной формой носит не только математический, но и содержательный характер. Вообще-то нас интересуют коэффициенты структурных уравнений, они имеют экономический смысл. Например, b - это предельная склонность к потреблению. А коэффициенты в приведенной форме уже не несут экономического смысла.

Приведенная форма явно показывает, что переменная Yt коррелирована со случайным возмущением ut. Формально в структурное уравнение, определяющее Yt , не входит никакая случайная компонента. Тем не менее, из-за того, что это одновременные уравнения, Yt зависит от ut. Это означает, что метод наименьших

квадратов даст смещенную и несостоятельную оценку при оценивании функции потребления. Он приведет к смещению, вызванному совместными уравнениями. Даже асимптотически метод наименьших квадратов, примененный к структурному уравнению, приводит к плохим результатам. Из-за одновременности уравнений ошибка из любого уравнения как бы проникает во все остальные уравнения.

Можно использовать МНК для оценки коэффициентов приведенной формы, если экзогенная переменная Zt детерминирована или не коррелирует с возмущением ut. Для нахождения коэффициентов структурной формы применяются два способа.

1. Косвенный (indirect) метод наименьших квадратов. Методом наименьших квадратов оцениваем коэффициенты приведенной формы, для чего оцениваем регрессии:

= р + р • г, + е)

[с, = р20 + р21 • + е,2

Каждая из регрессий оценивается отдельно. Для нахождения параметров структурной формы а и / можно попытаться решить систему уравнений:

а Л а л / л 1 л

1 _ 3 р0' 1 _ 3 р20' 1 _ 3 р21' 1 _ 3

Очевидно, что эта система четырех уравнений с двумя неизвестными, вообще говоря, не имеет решения. В этом и состоит основной недостаток косвенного метода наименьших квадратов. Приведенную систему всегда можно оценить. Предположим, система состоит не из двух, а из 10 уравнений с 10 переменными. Выбираем эндогенные и экзогенные переменные и строим регрессию каждой эндогенной переменной на все экзогенные. После этого основной вопрос заключается в том, можно ли от коэффициентов приведенной формы вернуться однозначно к структурным коэффициентам, которые и имеют содержательный смысл. Говорят, что система идентифицируема, если по коэффициентам приведенной формы можно однозначно вернуться к структурным коэффициентам. Иногда соответствующая система уравнений противоречива, иногда решения будут существовать, но не будут единственными. Существуют системы одновременных уравнений, в которых косвенный МНК приводит к однозначному результату. Идентифицируемость зависит в том числе и от того, сколько экзогенных переменных присутствуют в модели и как они входят в структурные уравнения. В этом, на самом деле, одна из причин того, что в нашем примере мы не можем оценить структурные коэффициенты - у нас одна единственная экзогенная переменная, всего два структурных параметра и четыре - в приведенной системе. С проблемой идентифицируемости вы познакомитесь подробней в дальнейшем курсе эконометрики при изучении темы «системы одновременных уравнений». Кажущийся таким простым косвенный метод наименьших квадратов не всегда может дать оценки структурных параметров.

Для дальнейшего изложения важно понять, что, имея систему одновременных уравнений, нельзя оценивать каждое уравнение в отдельности из-за того, что эндогенные переменные входят и в левую, и в правую часть, и из-за того, что равновесие определяется всеми уравнениями вместе. Случайная ошибка из любого уравнения проникает во все остальные, из-за чего оказываются коррелированны регрессор и случайное возмущение.

2. Метод инструментальных переменных. Этот метод известен из курса эконометрики и кратко упоминался в предыдущей лекции. В случае системы одновременных уравнений можно легко предложить набор инструментальных переменных. Они строятся как линейные комбинации экзогенных переменных, подобранные так, чтобы не было коррелированности инструментов и случайных возмущений. Этот метод тоже зависит от того, насколько идентифицируема оцениваемая система уравнений. При отсутствии лаговых переменных двумя относительно широко применяемыми вариантами этого подхода являются так называемые двухшаговый МНК и трехшаговый МНК. Мы не будем на них специально останавливаться. Это отдельная проблема.

Возвращаясь к временным рядам, мы видим, что при оценивании моделей, состоящих из нескольких уравнений, возникают сложности, связанные с наличием среди регрессоров «одновременных» составляющих. Кроме того, надо попытаться разделить переменные на эндогенные и экзогенные. Иногда это разделение экономически оправдано (как в вышерассмотренном примере), иногда не очень. Например, один из подходов к исследованию эффективности рынка - это моделирование временных рядов кросс-курсов различных валют и цен разных финансовых инструментов. Например, рассматривая курсы рубль/доллар, доллар/евро, рубль/евро, трудно сказать, какой из них естественно выбрать эндогенной переменной, а какие - экзогенными.

Векторная авторегрессия

В 1980 г. Симс [15] предложил подход, который позволяет уйти от разделения переменных на экзогенные и эндогенные и избавиться от сложностей, связанных с одновременностью уравнений. Этот подход является к тому же естественным обобщением подхода Бокса-Дженкинса к моделям ЛИ1МЛ и носит название VAR, или векторная авторегрессия. В принципе существует и VARIMA [17], но, как мы увидим дальше, это скорее теоретически, чем практически. Для того, чтобы избежать смещения, связанного с применением МНК непосредственно к каждому уравнению структурной формы, Симс предложил, не производя деления переменных на экзогенные и эндогенные, представить каждую из компонент многомерного случайного процесса как линейную комбинацию от предыдущих значений всех переменных.

Рассмотрим сначала пример двумерного вектора и только одного лага. Пусть,

например, X] - темп роста денежной массы, а X2 - дефлятор ВВП. Запишем систему уравнений указанного вида:

X1 = а + ри Х1-1 + Ь12 х(2_1 + е1

Х = а2 + Ь 21Х1-1 + Ь X,- + е

Здесь случайные возмущения предполагаются белыми шумами, вообще говоря, коррелированными. Стандартное обозначение этой модели - VAR(1), где 1 - число лагов. Размерность многомерного случайного процесса обычно не указывается. Модель VAR(p) в матрично-векторных обозначениях имеет вид:

X, = а + Ах Х(_1 + А 2 X,-2 +... + АРХ( - р + е,

где е - векторный белый шум со следующими свойствами: Е(е,) = 0 для всех t,

г г г Т Г^, ^ = г

СОу(е ) = Е(ее ) = ^ . Модель сразу выписывается в приведенной форме.

* [ 0, ^ ф г

Одновременные компоненты не входят в правую часть. Для рассмотренного двумерного примера получаем:

œх1 Л a Л œb bi21 (s; Л

v Xt 0

+

Va2 0

vAi b

22 0

v Xt-10

+

1 ■t

vst 0

л

t

x2

V* t 0

v^t2 0

œxi > x 2

VAt 0

V^t2 0

Модель VAR(p) напоминает модель ARMA, поэтому многие их свойства схожи. Перепишем модель VAR(p), используя оператор лага,:

(e - AiL - A2L2 -... - ApLp )xt = et.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для упрощения записи мы предполагаем, что нет свободного члена, это не приводит к потери общности, но немного сокращает запись. Для рассматриваемого примера можем записать:

'1 - bii L - bi2 L Y xi 1 (si 1

v - b21L 1 - b22L0V

Также, как и в одномерном случае, возникает вопрос, можно ли выразить вектор xt через текущие и предыдущие значения вектора случайных возмущений st. Очевидно, что если существует обратная матрица, то можно записать:

1 '1 - b22 L b12 L Ys1 Л

aV b21 L 1 - bu L0V

Если обозначить через I единичную матрицу, то определитель матрицы системы П = I - A1 равен:

А = (1-b„L)(1-p22L) - bb2 = 1-(b11 + b22)L + (bb - b12b21)L2 = (1-М)(1-m2L),

где m и m2 - собственные числа матрицы П, возможно комплексные.

Если хотя бы одно из собственных чисел равно 0, то матрица системы уравнений вырождена, и xt не выражается через текущие и предыдущие значения векторного белого шума. Вспомнив условия стационарности моделей ARMA(p,q), можно заключить, что при условии mm < 1 и |m2| < 1 каждая из компонент процесса xt выражается в виде бесконечного ряда текущего и предыдущего значений компонент белого шума. Поскольку коэффициенты каждого из разложений будут учитывать в геометрической прогрессии, по теореме Вольда каждая из компонент процесса xt будет стационарной в широком смысле.

Для изучения условий стационарности и свойств моделей VAR(1) удобно использовать сведение матриц A1 и П к простейшей форме. Заметим, что матрицы П и A1 очевидно имеют одни и те же собственные векторы, а их собственные числа дополняют друг друга до единиц. Обозначим собственные числа матрицы A1 через 1 = 1 - m1, и 12 = 1 - m2. Поэтому условие, что собственные числа

матрицы П лежат в единичном круге, эквивалентно аналогичному условию для собственных чисел матрицы А1.

Рассмотрим сначала случай, когда 1 Ф 12. Из линейной алгебры мы знаем, что собственные векторы, соответствующие различным собственным числам, линейно независимы. Введем невырожденную матрицу С, столбцы которой являются собственными векторами, соответствующими собственным числам 1 и 12 соответственно. Обозначим через Л диагональную матрицу 1, 12}. Тогда очевидно, что С-1 А1С = Л и А1 = СЛС-1. Определим новый вектор переменных соотношением у( = С-1 Х,, отсюда следует также, что Х, = Су(. Умножая уравнение

Х( = А1 Х,-1 + е слева на матрицу С-1, получим у( = Лу,-1 + ^ , где через ^ обозначен «новый» векторный белый шум.

В новых переменных система уравнений распадается на два отдельных уравнения:

у] = 1 Ум + У2 = 1 Ум + л],

свойства которых можно установить, используя уже известные нам приемы.

Очевидно, что у] и у,2 слабо стационарны при |11 < 1 и |121 < 1, и, по крайней мере, одна из компонент вектора у, не является стационарной при нарушении этого условия. Поскольку Х] и х2 являются линейными комбинациями

1 2 г

у, и у, , то условием стационарности векторного процесса Х( является нахождение собственных чисел матрицы А1 внутри единичного круга.

Отдельного рассмотрения заслуживает случай, когда 1 — . В этом случае двух линейно независимых векторов может и не существовать, и матрицу А1 нельзя привести к диагональной форме. Однако доказано, что тогда существует матрица Р, которая приводит матрицу А1 к так называемой жордановой форме. Мы ограничимся только кратким рассмотрением этого понятия без доказательств. Итак, доказано, что существует невырожденная матрица Р, такая что

П 1 ^

Р А1Р = J и А1 = Р3Р , где 3 - жорданова матрица: 3 =

V0 1

. Определив

вектор у{ = Р Х( (Х, = Ру,), сведем исходную модель к виду у{ = + , где сейчас векторный белый шум Г}1 = Р . В этом случае система уравнений:

у] = 1 у]-1 + у]-1 + у? = 1 у21 + л

не распадается на отдельные уравнения, но второе из них может быть решено и исследовано отдельно от первого. Очевидно, что при условии |Л| < 1 второе уравнение представляет собой стационарную модель ЛИ(1), а первое - стационарную модель ЛОЪ(1,1). При |Л| > 1 оба уравнения нестационарны. Таким образом, оба рассмотренных случая дают единое условие стационарности: собственные числа матрицы А1 (или П) должны лежать строго внутри единичного круга.

Этот результат легко обобщить на случай УЛИ(1) модели произвольной размерности. Если все собственные числа Л,Л2,...,Лк матрицы А1 различны, то

модель распадается на отдельные уравнения у'( = Л^у'(-1 + Л (? = 1,2,..,к) . Каждое из них стационарно тогда и только тогда, когда Ц < 1. Если же среди собственных чисел Л,Л2,...,Лк есть группа равных по величине, то, обозначив их без потери общности номерами 1,2,...,к, приводим модель к тому же виду: Уг = ^Уг-1 + ^. Матрица ^ содержит так называемую жорданову клетку Б размера г в левом верхнем углу:

£ =

(л 0

0 0

1 Л

0 0

0 0

Л 0

0 ^ 0

1 Л

На главной диагонали жордановой клетки стоят собственные числа, первая над-диагональ содержит 1, а остальные элементы равны 0. Отдельные уравнения системы принимают вид:

у] = Ма + Уг2-1 + Л

у г-1 = луг- + у-1+л;-1 у\ = ЛУи + лЧ

У г+1 = Л У г+1 + пг+1

Ук = Лку- + лк.

Преобразованная система ясно показывает, что условие стационарности имеет тот же вид, что и для случая двумерной модели.

Для модели VAR(p) рассмотрение, подобное проведенному выше, невозможно. Для получения условий стационарности можно толковать модель VAR(p) как систему разностных линейных уравнений с постоянными коэффициентами и правой частью St. По аналогии со скалярным случаем будем искать общее решение однородной системы xt — A1 xt—1 —... — Apxt—p = 0 в виде xt = C (1)t. Подставив это выражение в уравнение, получим:

(1pI + 1p—1 Aj +... + Ap )C = 0.

Однородная система линейных уравнений имеет ненулевые решения при l равных собственным числам матрицы 1pI + 1p—1A1 +... + Ap , т.е. корням характеристического уравнения det(1pI + 1p—1A1 +... + Ap ) = 0.

Соответствующими нетривиальными решениями системы

(1pI + 1p—1A1 +... + Ap )C = 0

являются собственные векторы ее матрицы. Тогда слагаемое, соответствующее собственному числу 1i, стремится к нулю при неограниченном увеличении t. Если среди p х к собственных чисел есть одинаковые, то нужно заменить в выражении xt = C(l)t постоянный вектор C зависящим от времени вектором вида

C0 + C1t + ... + Cr—1tr 1. Во всех случаях условие стационарности выражается компактно: все корни характеристического уравнения должны лежать строго внутри единичного круга.

Если условие стационарности выполнено, и случайное возмущение st обладает свойствами белого шума, то уравнения модели VAR(p) можно оценивать обычным методом наименьших квадратов. Причем каждое уравнение можно оценивать отдельно, т.е. строить регрессию компоненты xti на предыдущие значения

всех компонент, включая предыдущие значения самой xti . Во-первых, нет корреляции регрессоров с возмущениями, и нет никаких проблем с состоятельностью оценок. Кроме того, все переменные совершенно равноправны, и поскольку все регрессоры предшествуют объясняемым переменным, не возникает проблем с эк-зогенностью. Таким образом, оценивание моделей VAR(p) требует только многократного применения метода наименьших квадратов и легко реализуемо в специализированных пакетах. Обычно в компьютерных программах, например в том же Econometric views, задается список переменных, число лагов, и этого достаточно для построения модели.

Одним из больших препятствий при практическом применении VAR моделей является очень большое число подлежащих оцениванию параметров. Рассмотрим простой случай. Как вы знаете, стандартная кейнсианская модель состоит из 7 уравнений. Переменные модели являются макроэкономическими показателями. По каким данным вы будете оценивать такую модель? Ну, не меньше, чем по квартальным. Сколько лагов включать в модель? Конечно, существуют

статистические методы оценки числа лагов, но попробуем использовать содержательные знания. Знаменитая Сент-Луисская модель [2] демонстрирует, что в уравнение темпа роста номинального ВВП входят темпы роста денежного агрегата Mj и темпы роста правительственных расходов на поддержание занятости с запаздыванием вплоть до четырех кварталов. Давайте возьмем модель с 5 лагами, пусть используются квартальные данные. Сколько параметров нам надо оценить, если мы строим VAR модель? 5 лагов - это значит 5 матриц размерности 7 на 7. В каждой 49 параметров, плюс столбец свободных членов, плюс 7 дисперсий случайных составляющих. Итого мы получаем, что надо оценить 49 • 5 + 7 + 7 = 259 коэффициентов. В каждом из уравнений нужно оценить 37 параметров. Для этого необходимы данные хотя бы лет за 15. Вот эта простая арифметика называется перепараметризацией VAR, т.е. VAR вводит слишком много параметров в модель. Это свойство препятствует широкому применению VAR моделей.

В то же время оказалось, что VAR представление тесно связано с исследованием стационарности и возможностью построения эконометрических моделей с нестационарными регрессорами. Это и будет предметом нашего рассмотрения в последующих лекциях.

* * *

СПИСОК ЛИТЕРАТУРЫ

1. Индексы интенсивности промышленного производства / Центр экономической конъюнктуры при Правительстве РФ, ежемесячное издание. Также официальный сайт Центра http://www.cea.gov.ru

2. Carlson K.M. Does the St. Louis Equation Now Believe in Fiscal Policy // Review., Federal Bank of St. Louis. 1978. V. 60. № 2. Р. 17.

3. Chambarlain G. The General Equivalence of Granger and Sims Causality // Econo-metrica. 1982. V. 50. P. 569-582.

4. Engle R.F. Wald, Likelihood Ratio and Lagrange Multiplier Tests in Econometrics // Handbook of Econometrics, eds. Z. Griliches and M.D. Intriligator. Chapter 13. North-Holland, 1984.

5. Franses P.H. Periodicity and Stochastic Trends in Economic Time Series. Oxford Univercity Press, 1996.

6. Granger C.V.J. Investigating Causal Relations by Econometric Methods and Cross-Spectral Methods // Econometrica. 1969. V. 37. P. 424-438.

7. Hausman A. Specification Tests in Econometrics // Econometrica. V. 46. P. 1251-1271.

8. Hendry D.F. and Ericsson N.R. Modeling the Demand for Narrow Money in the United Kingdom and the United States // European Economic Review. 1991. V. 35. P. 833-866.

9. Hendry D.F. and Richard J.-F. Exogeneity // Econometrica. 1983. V. 51. P. 277-304.

10. Hood W. C. and Coopmans T. S. Studies in Econometric Method. Wiley, 1953.

11. Hylleberg S., Engle R.F., Granger C.W.J., Yoo B.S. Seasonal Integration and Cointe-gration // Journal of Econometrics. 1990. № 44. P. 215-238.

12. Leamer E.E. Vector Autoregressions for Cansal Inference // K.L. Brunner and A. Meltrer (eds.) Understanding Monetary Regims (Supplement to the Journal of Monetary Economics). 1985. P. 255-304.

13. Lucas R.E. Econometric Policy Evaluation: A Critique // K.L. Brunner (eds.) The Phillips Curve and Labor Markets (Supplement to the Journal of Monetary Economics). 1976. P. 19-46.

14. Sargan J.D. Wages and Prices in the United Kingdom: A Study in Econometric Methodology // P.E. Hart, G. Mills, K. Whiteker (eds.) Econometric Analysis for National Economic Planning, Butterworth. London, 1964; reprinted in D.F. Hendry and K.F. Wallis (eds.) Econometrics and Quantitative Economics. Oxford: Basil Blackwell, 1984.

15. Sims C.A. Macroeconomics and Reality // Econometrica. 1980. V. 48. P. 1-48.

16. Sims C.A. Money, Income and Causality // American Economic Review. 1972. V. 62. P. 450-552.

17. Tsiao G.C. and Box G.E.P. Modelling Multiple Time Series with Applications // Journal of the American Statistical Association. 1981. V. 76. P. 802-816.

18. Wu D. Alternative Tests of Independence between Stochastic Regressors and Disturbances // Econometrica. 1973. V. 41. P. 733-750.

i Надоели баннеры? Вы всегда можете отключить рекламу.