Введение в эконометрический анализ панельных данных

Ратникова Та.

ЛЕКЦИОННЫЕ И МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ

Введение

в эконометрический анализ панельных данных

Ратникова Т.А.

В предыдущем номере журнала были опубликованы четыре лекции из курса «Введение в эконометрический анализ панельных данных», где была изложена информация общего порядка о панельных данных, рассмотрены методы оценивания основных моделей, свойства полученных оценок и тесты на спецификацию. В этом выпуске вашему вниманию предлагаются четыре следующие лекции, в первой из которых речь пойдет об оценивании регрессионных моделей панельных данных в условиях гетероскедастичности и автокоррелированно-сти случайных ошибок. В остальных лекциях будет обсуждаться проблема оценивания в условиях эндогенности, которая имеет место при коррелированности регрессоров с индивидуальными эффектами, при наличии ошибок измерения объясняющих переменных и при построении динамических моделей.

Лекция 5.

7. Особенности оценивания моделей с панельными данными в условиях гетероскедастичности и автокорреляции случайных возмущений

7.1. Оценивание ковариационных матриц ошибок в условиях гетероскедастичности и автокорреляции

Как модель со случайным, так и модель с детерминированным эффектами предполагает, что присутствие в уравнении слагаемого а обеспечивает учет всей корреляции между ненаблюдаемыми переменными в различные периоды времени. И это действительно так, если ошибка е.{ предполагается некоррелированной как по {, так и по 1 Если регрессоры строго экзогенны, автокоррелирован-ность е.{ не приводит к несостоятельности стандартных методов оценивания, но

все же происходит искажение стандартных ошибок и результатов тестов. Сами оценки коэффициентов, оставаясь состоятельными, перестают быть эффективными. Если структура ковариационной матрицы ошибок не соответствует, на-

Ратникова Т.А. - к.ф.-м.н., доцент кафедры математической экономики и эконометрики ГУ ВШЭ.

пример, предположениям модели со случайным эффектом, то оценки ЬРОМНК утрачивают адекватность. Присутствие гетероскедастичности как из-за e , так и

из-за а в модели со случайным эффектом приводит к сходным последствиям.

Самый простой путь преодоления этих трудностей без наложения дополнительных ограничений относительно структуры ковариационной матрицы - это использовать оценки МНК со стандартными ошибками, учитывающими несферичность случайных возмущений.

Рассмотрим для начала простую модель без каких-либо предположений о структуре ошибок:

y и = х; e + uit.

Состоятельность МНК-оценки

( NT V1 N T

в = (х'хух'Y = I XIх ltX'lt I IIх ltYlt

V 1=1 t=i 0 i=i t=i

требует, чтобы Е{х'аи t }= 0 .

В предположении, что различные индивидуумы некоррелированы (E{uitujs} = 0 для всех i Ф j) оценка ковариационной матрицы может быть получена с помощью формулы Навье - Веста:

/)\ ( NT I-1 NTT ( NT I-1

v(в)= (IIхйх; I IIIu^«IIIхйх; I = (хх)-1 х'ии'х(хх)-1,

V i=1 t=1 0 /=1 t=1 s=1 V i=1 t=1 0

где ut означают МНК-остатки. Эта оценка учитывает гетероскедастичность и автокорреляцию общего вида (в пределах временного ряда для одного индивидуума). Если гетероскедастичность исключена априори, оценка приобретает вид

( N T I-1 N T T ( 1 N I ( N T I -1

v(e )=III хих\, I iiiiN i иии|хйх: in хх I ,

V i=1 t=1 0 /=1 t=1 s=1 VN ¿=1 0 V i=1 t=1 0

1 N _ _

где —Iujtujs - состоятельная оценка для Wis = E{ujtujs}.

N ¿=1

Если ошибка uit имеет инвариантную по времени составляющую а, которая может коррелировать с объясняющими переменными, оценка модели с детерминированным индивидуальным эффектом может быть более предпочтительна, чем оценка МНК. Скорректированная на гетероскедастичность и автокорреляцию оценка ковариационной матрицы в этом случае будет иметь вид:

V(в )= (х' шх)-1 х' W uWuW шх(х' шх)-1, где uW - остатки регрессии «within».

Как правило, в стандартных случаях такой корректировки бывает достаточно. Однако, когда существует потребность учитывать гетероскедастичность и автокорреляцию конкретного вида, то с помощью метода максимального правдоподобия или реализуемого обобщенного МНК можно получить более эффективные оценки ковариационной матрицы, чем с помощью обыкновенного МНК или модели с детерминированным эффектом. Подробный обзор таких методов изложен в монографии Балтаджи [11].

7.2. Тестирование гетероскедастичности и автокорреляции

Большая часть тестов на гетероскедастичность и автокорреляцию, проводимых в рамках модели со случайным эффектом (в дальнейшем для краткости именуемой ИЕ-модель), перегружены техническими деталями (см. монографию Балтаджи [11]), а в рамках модели с детерминированным эффектом (ЕЕ-модели) они выглядят значительно проще. Поскольку ИЕ-модель можно рассматривать как частный случай ЕЕ-модели, в котором индивидуальный эффект некоррелирован с регрессорами, тесты, справедливые для ЕЕ-модели, можно распространить и на ИЕ-модель.

Рассмотрим самый распространенный тест Дарбина - Уотсона на автокорреляцию первого порядка для нашего случая. Против основной гипотезы об отсутствии автокорреляции

Я0: р = 0

проверяется альтернативная гипотеза вида

е„ _ ре,-! + V,,, р > 0 или р < °

где V,, независимы и одинаково распределены по времени и индивидуумам. Таким образом, предполагается, что все индивидуумы имеют один и тот же коэффициент корреляции р . Пусть еи обозначают остатки «адйЬ,т»-регрессии. Тогда можно вычислить панельный аналог статистики Дарбина - Уотсона:

_ Х<=2) р _ Г Г 2 '

Для этой статистики, так же, как и для обычной статистики Дарбина - Уот-сона, существуют таблицы критических значений, зависящих только от Ы, Т и К. В отличие от случая обычных временных рядов область неопределенности здесь будет очень узкой, особенно для панелей с большим числом индивидуумов. В этом можно убедиться на примере табл. 1, в которой представлены выборочные нижние и верхние границы пятипроцентной критической области.

Из табл. 1 также видно, что разброс значений статистики по Ы, Т и К ограничен. В модели с тремя объясняющими переменными, оцененной по трем периодам, мы отвергаем Н0 : р = 0 в пользу НА : р> 0 при пятипроцентном уровне значимости, если меньше, чем 1,859 для N=100 и 1,957 для N=1000. Для па-

нелей с очень большим N достаточно сравнивать а^с двойкой. Так как оценка

Рее = рш является состоятельной и в случае справедливости модели со случайным эффектом, то можно использовать статистику сЬмв обоих случаях.

Таблица 1.

N = 100 N = 500 N = 1000

dL du dL du d L du

T = 3 K = 3 1,859 1,880 1,939 1,943 1,957 1,959

K = 9 1,839 1,902 1,935 1,947 1,954 1,961

T = 10 K = 3 1,891 1,904 1,952 1,954 1,967 1,968

K = 9 1,878 1,916 1,949 1,957 1,965 1,970

Для тестирования на предмет наличия гетероскедастичности тоже можно использовать остатки «within^-регрессии. В тестовой регрессии оценивается зависимость квадратов остатков регрессии «within» на константу и J независимых переменных zit - предполагаемых виновников гетероскедастичности. Это - один из вариантов известного теста Бройша - Пагана. Против основной гипотезы о гомоскедастичности проверяется альтернативная гипотеза

V e} = s2h(z'a),

где h - некоторая непрерывно дифференцируемая функция с h(0) = 1, так что основная гипотеза формулируется в виде H0: а = 0. Тестовая статистика, вычисляемая как N(T -1)R2, где R2 - коэффициент детерминации тестовой регрессии, асимптотически подчиняется х1 -распределению с J степенями свободы, если справедлива основная гипотеза.

Можно проделывать аналогичный тест и с остатками регрессии «between».

Лекция 6.

8. Оценивание коэффициентов панельных регрессий в условиях коррелированности регрессоров и случайной ошибки

8.1. Метод Хаусмана — Тейлора 8.1.1. Идея и преимущества метода

Как уже упоминалось выше, в главе, посвященной анализу модели со специфическим индивидуальным эффектом, существует потенциальная возможность коррелированности ненаблюдаемого индивидуального эффекта aj и объясняющих переменных (х, Z) регрессионной модели

Yt = х'„р + Z'iY + ai +eit, i = 1, N , t = 1,T .

В присутствии такой корреляции оценки метода наименьших квадратов (МНК) и обобщенного МНК (ОМНК) параметров модели (b, g, s2e, s2a) будут смещены и несостоятельны. Традиционная техника преодоления этой проблемы -исключение индивидуальных эффектов с помощью преобразования переменных «within», т.е. переход от модели в уровневых значениях переменных к модели в отклонениях от среднего значения по времени для каждого индивидуума. Но, к сожалению, оценки МНК преобразованной модели будут обладать двумя существенными недостатками:

1) все переменные Z, не меняющиеся со временем, будут также исключены из модели, а следовательно, оценить их влияние (т.е. найти оценки у) окажется невозможным;

2) обстоятельство (1) приводит к тому, что оценки «within» для коэффициентов в будут не полностью эффективны, так как будут игнорировать неоднородность индивидуумов в выборке, которая отражалась исключенными переменными.

Проблема (1) особенно существенна в приложениях, в которых нас интересуют преимущественно коэффициенты при инвариантных по времени регрессорах. Например, при оценивании уравнения Минцера (уравнения заработной платы) исследователи обычно особенно интересуются отдачей от образования. Но образование, как правило, меняется со временем у незначительной части выборки, соответствующей молодым возрастам, а для подавляющего числа респондентов образование является инвариантной по времени переменной.

Существует подход, заключающийся в использовании инструментальных переменных, которые не коррелируют со специфическим индивидуальным эффектом и не включены в модель, хотя тесно связаны с используемыми в модели объясняющими переменными. Но, во-первых, такие инструменты бывает сложно подобрать, а, во-вторых, процедура их использования игнорирует не меняющиеся во времени характеристики скрытых переменных. В рамках этого подхода, в частности в одной из работ Ц. Грилихиса [23], предлагался метод оценивания отдачи от образования с использованием в качестве инструментов переменных, характеризующих уровень образования в семье респондента и не включенных в модель.

Другой подход развил Чемберлен [13], предложив накладывать требование некоррелированности специфического индивидуального эффекта a и инвариантных во времени регрессоров Z.

Но все эти методы обладают высокой чувствительностью к априорной информации о природе ненаблюдаемых специфических эффектов.

В подходе, который предлагают Хаусман и Тейлор [19], предполагается, что хотя X и Z коррелируют с a в целом, однако среди них имеются переменные, которые все же некоррелированны с at. Тогда интуитивно ясно, что столбцы X, некоррелированные с a, могут служить двум целям:

1) при «within^-оценивании они позволят получить несмещенные оценки

для в;

2) при «between»-оценивании они могут быть хорошими инструментами для столбцов Z, коррелированных с a .

В примере с отдачей от образования можно предположить, что ненаблюдаемые способности индивидуума не коррелируют с его здоровьем и возрастом, в меньшей степени это можно отнести к незанятости.

Важное преимущество подхода Хаусмана и Тейлора состоит в том, что этот подход не опирается на строгие априорные предположения и при определенных условиях позволяет тестировать наличие корреляции между а, и регрессорами.

8.1.2. Основные допущения

Итак, рассматривается регрессионная модель вида

Уи = ХЬ + 2\у+а + е„ , Е(а\Хй, 2 „ )* 0 ;

X - матрица размера (N7, к), 2 - матрица размера (N7, д).

Необходимая априорная информация - возможность различить столбцы X и 2, асимптотически некоррелированные с а,, т.е. такие, что при фиксированных значениях Т

,. X', .а ,. 2', а.

рИт-^^ = 0; р Ит-^^ = 0 ;

N®¥ N N®¥ N

X2 a л- Z'2а

p lim—2L-L = hx; p lim^-

NN x N N

где X= [Xj, X2 ], Xl(NT, kj), X2 (NT, k2); Z= [Zj,Z2], Zj(NT,qj), Z2(NT, q2); hx ф 0, hz ф 0 .

Применив преобразование «within» к модели

WYit = WX'itP + WZ'g + Wа + Wett,

мы получим уравнение

Y, = X'ttp + eit (поскольку WZt = 0, W. = 0 ), откуда извлечем оценку

pw = (x WXlt )-1 x WY,,

которая будет являться несмещенной и состоятельной, не взирая на наличие корреляции между а, и (X, Z). Сумма квадратов остатков этой модели может

2

служить для получения несмещенной и состоятельной оценки для &в. Применив преобразование «between» к модели

BY, = BXр + BZg + B. + Be, ,

мы получим уравнение

Y. = X :.P+Z g+а+e,,

откуда извлечем оценку

( bл Те

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

, которая из-за присутствия ненаблюдаемой а, бу-

дет смещенной и несостоятельной. Сумма квадратов остатков этой модели будет

смещенной и несостоятельной оценкой для

V (а,- + e.) = сто; +

CTe Т

Однако, используя обобщенную ковариационную матрицу

W = ст]1 + Тст2аЕ = al\W + в Е

мы сможем получить более эффективные оценки коэффициентов в и у:

(д ^ (

= m Дв + (1 - m)

Д Л

V

ОМНК

Уомнк

/

Те

(д л

/ W

V 0 0

где ц = (ув + V*У\, У„ = XШ, ¥в = в2ХВХ.

Эту оценку в литературе еще называют оценкой Балестра - Нерлова. Для

ее вычисления необходимо знать значение параметра в2 =

ст2 + Та

но можно

заменить ее на в2, если последняя состоятельна. Но если hx Ф 0, hZ Ф 0 , тогда в2, ст2 и ст2а не будут состоятельными.

Напомним, что ОМНК - это МНК, примененный к исходным данным, преобразованным следующим образом: Yit = Yt - (l - e)Y..

8.1.3. Состоятельное, но неэффективное оценивание

Если тест Хаусмана отвергает гипотезу о некоррелированности а, и (X, Z), тогда модель со случайным индивидуальным эффектом неверна, а верна модель с детерминированным индивидуальным эффектом, и состоятельными будут являться лишь оценки «within» для в и ст2. На основании этих оценок можно построить эффективную процедуру оценивания параметров у и ст2а, использующую инструментальные переменные.

Введем в рассмотрение вектор усредненных по времени остатков регрессии «within»:

d, = Y-. - X\.bw = (в - x,.(xwx,t )-1 x'tW )Yt.

Учитывая, что Y it генерируется процессом Y it = Х'Д + Zg+a + 2tt, получим,

di = Zg + 2 + (в-Xi.(x'ilwxil)-1 x'itw2.

2

что

Интерпретируя последние два слагаемых полученного выражения как ненаблюдаемое случайное возмущение с нулевым математическим ожиданием, можно попробовать найти из этого регрессионного соотношения оценку параметра у. Из-за корреляции а, и 2Ъ оценки уМНК и уОМНК будут несостоятельны.

Состоятельную оценку для у можно получить, если использовать столбцы Х1, некоррелированные с а по определению, как инструменты для столбцов . Необходимое условие реализуемости этой процедуры: к1 > q2, т.е. экзогенных, меняющихся во времени переменных, должно быть по крайней мере столько же, сколько эндогенных переменных, инвариантных по времени. Это условие идентифицируемости у .

Оценка двухшагового МНК параметра у, которую мы назовем у№ (поскольку она построена на основании /3№), будет иметь вид

gw

=(zpAzi )-1 zpji

где PA = A(A'A) 1A - ортогональный проектор на пространство, образованное столбцами матрицы A = [X1 Z1 ].

Ошибка этой выборочной оценки будет иметь вид

gw-r = {z'ipAzi )-1 ZpA [ + (5 - X ,(x,;wx„ )-1 XW )ett ]

и при условиях

A ry x' f

plim^^ = 0 , plim^^ = 0

N N NN

и фиксированных значениях T полученная оценка является состоятельной. Но поскольку значения dt представляют собой остатки регрессии «within» в предположении, что оценка ßw не является самой эффективной, то и оценка gw тоже не будет самой эффективной. Зато теперь можно сконструировать состоятельную оценку для дисперсий.

Сумма квадратов остатков регрессии «within» может быть представлена в

виде

UwUw = Y w{/nt - wx it (x'itwxit)-1 xw}wiü = - F'itwx(x ' wx)-1 X Щ,,

2 o2 uwuw f

тогда для se можно построить оценку SB = n(T - , которая будет являться состоятельной:

F ' wf

p lim S] = p lim N—1 - 0 = S.

n®¥ N®¥ N yl - 1J

(Y XX' b Z'g ) (Y XX' b Z) Можно также построить оценку S2 = Y-ibL-igwN '•-iibw-^^ такую,

„2 a + £■)(«■ + — ) 2 S „9

что plimS = plim—- ' 4 '-— = sa +——, и из нее с помощью S— выразить со-

N

2 .

стоятельную оценку для аа .

52 = 52 - Т

8.1.4. Состоятельное и эффективное оценивание

Состоятельные и эффективные оценки всех интересующих нас параметров можно получить, используя другой метод, тоже основанный на инструментальных переменных.

Поскольку единственная компонента случайного возмущения, а именно а1, коррелирующая с регрессорами, является инвариантной по времени, то любой вектор, ортогональный инвариантному по времени вектору, может быть использован как инструмент. В частности, «адйЬ,т»-преобразованные изменяющиеся во времени регрессоры некоррелированы с а1 по построению Х'нЖа, = 0, так что из них можно построить ЫТ-Ы линейно независимых инструментов, которые порождают базис в пространстве образа оператора W. Но, к несчастью, все элементы этого пространства ортогональны инвариантным по времени регрессорам 21, что противоречит требованию тесной связи между инструментами и теми переменными, которые инструментируются. Необходимо развивать какой-то иной подход.

На анализ панельных данных легко распространяется теория об идентифицируемости в системах одновременных линейных регрессионных уравнений. Напомним, что под идентифицируемостью понимается возможность определения структурных параметров системы.

А именно, пусть имеются система одновременных уравнений (СОУ)

(1) У = ХЬ + е ,

г е

где к столбцов матрицы X эндогенны, и матрица 2 такая, что рИт-= 0 .

Т®¥ Т

Спроецируем нашу СОУ в пространство, образованное столбцами 2:

(2) Р2У = Р2ХЬ + Р2е ,

где Р2 = 2 (2 '2 )-1 г'.

Пусть 1 есть к-мерный вектор констант. Тогда верна следующая лемма.

Лемма. Необходимым и достаточным условием идентифицируемости функций 1'р в (1) является оцениваемость 1 Ь в (2).

Опираясь на этот результат, легко увидеть, что безо всякой априорной информации все элементы вектора в идентифицируемы из нашей исходной модели. Для этого надо просто осуществить преобразование «within».

Совсем иная ситуация с вектором у, который не оцениваем из уравнения «within» совсем. Нужна некая априорная информация.

Этой априорной информацией является знание X, и 7,. Тогда X, и 7, могут быть добавлены в матрицу инструментальных переменных к WX.

Обозначим A = [WX X, 7,], а PA = A(AA)- A'. Тогда условие ранга формулируется следующим образом.

Утверждение 1. Необходимым и достаточным условием идентифицируемости вектора (b, g) является невырожденность матрицы

f x ' Л 7", Pa X Zi).

V 7i 0

Соответствующее условие порядка примет вид.

Утверждение 2. Необходимое и достаточное условие идентифицируемости вектора (ft, g) есть k, > q2.

Итак, для нашей модели анализа панельных данных параметры (ft, s—) идентифицируемы, а параметры (g, s2a) неидентифицируемы, если существует ненулевая корреляция at и объясняющих переменных (X, Z). Для идентификации (g, &a) нужна априорная информация о возможных инструментах, по крайней мере для всех эндогенных столбцов Z (Z2). И в отличие от ситуации с системами одновременных уравнений, где инструменты надо искать извне (пример с образованием родителей, не включенным в модель), в анализе панельных данных инструментами являются к1 экзогенных столбцов X X), т.е. инструменты содержатся в самой модели. Так как только at коррелирует с (X2, Z2), WXJ может быть инструментом для Xj = WXJ + X1#, а X1# может быть инструментом для Z2.

Когда априорная информация о разбиении X на Xj и X2 и Z на Zj и Z2 имеется, то можно построить состоятельную и асимптотически эффективную оценку для вектора (ß, g).

Если ковариационная матрица W известна, то процедура оценивания двух-шаговым МНК (2SLS) выглядит следующим образом:

(1) W-J% = W-^Xjß + W-^Z-g + W-,

где W-1% = Yt -(1 -q)Y, ,

(2) РАучи = PAW-y^X'itß + Pfixy Z g +

где PA = A(A'A) 1A , а A = [^XXj —1], причем проецирование экзогенных переменных на столбцы матрицы A даст их же самих, а проецирование эндогенных переменных может быть осуществлено с использованием только средних по времени.

Если матрица W неизвестна, что более естественно, то в (2) вместо W следует использовать ее состоятельную оценку W , так как на этот счет имеется следующее утверждение.

Утверждение 3. Для любой состоятельной оценки W оценка МНК (ß, у) из уравнения (2) с W имеет то же асимптотическое распределение, что и оценка (ß*, у*) из (2) с W.

Если модель недоидентифицирована (k1 < q2), то ß* = ßW, а у* не существует, следовательно, мы можем найти только ß W, применив FE-модель.

Если модель точно идентифицирована (k1 = q2), то ß* = ß W, у* = yW , а следовательно, мы находим ß W с помощью FE-модели и yW с помощью метода инструментальных переменных.

Если модель сверхидентифицирована (k1 > q2), то оценки (ß*, у*) отличаются от оценок (ßW, yW) и являются более эффективными.

8.1.5. Тестирование априорных ограничений

Все априорные ограничения могут быть протестированы, когда параметры сверхидентифицированы.

Мы будем проверять следующую основную гипотезу:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X' a Z' a

H0: p lim = 0; p lim = 0 .

N®¥ N N®¥ N

Иначе основную гипотезу можно сформулировать так: все инструменты верны.

Если выполнена гипотеза H0, обе оценки (ßW , yW) и (ß*, у*) состоятельны.

Альтернативная гипотеза HA предполагает, что не все инструменты верны, или не все моментные тождества справедливы.

При HA plimß* Ф plimßW = ß.

Следовательно, надо тестировать отличие от нуля q = ß* - ßW .

Введя обозначения

W- = int - - (-- )-1 - и X * = W- Q"% ,

получим

q =

X * PAX X

X * PA -I X * WX *

X W

Wz W-У% = DY*

где D = ^X*'PAX' 0 X* 'PA - ^X * 'WX' J X* 'W , a Y* = WZW-^Ya . Тогда тестовая статистика примет вид

m = q [v(b)- V(b*)]+ q = q [[dd']+ q,

где символ «+» означает обобщенное обращение.

Замечание. Обобщенной обратной матрицей для произвольной матрицы A называется матрица A+ , удовлетворяющая условиям:

AA+A = A , A+AA+ = A+, (AA+)' = AA+ , (a+A)' = A+A. Хаусман и Тейлор сформулировали и доказали следующее утверждение.

Утверждение 4. Если верна основная гипотеза, то величина [m , где [ -состоятельная оценка для [, сходится по распределению к случайной величине cd , где d = rankD = min [^j - q2, NT - k].

Если мы находимся в условиях точной идентификации, q ° 0 и d = 0. Этот тест называют тестом Саржан на сверхидентифицированные ограничения. Тест не требует нормальности ошибок.

8.1.6. Приложение метода Хаусмана — Тейлора для оценивания эффекта от образования

В недавнем прошлом оценивание эффекта образования на заработную плату было темой активных исследований и большая часть дискуссий фокусировалась на потенциальной корреляции между ненаблюдаемыми способностями индивида и его образованием. Еще Грилихес отмечал, что неясно, в каком направлении оказывается смещенным коэффициент при образовании. В то время, как в простых моделях положительная корреляция между ненаблюдаемыми способностями индивида и количеством лет, затраченных на получение образования, смещала оценку МНК вниз, в более сложных моделях, где решение о продолжительности процесса образования формировалось эндогенно, выявлялась отрицательная корреляция между способностями и образованием. Например, когда Гри-лихес, Холл и Хаусман рассматривали образование как эндогенную переменную и использовали уровень образования в семье как инструмент, коэффициент при образовании возрастал на 50%. Интересно, даст ли метод Хаусмана - Тейлора увеличение этого коэффициента по сравнению с МНК?

Для ответа на этот вопрос попытаемся использовать панель, описанную в параграфе 6 четвертой лекции. Напомним, что эта панель сформирована на основании данных РМЭЗ за 1994, 1996, 1998 и 2000 годы.

Мы несколько модифицируем используемую выборку так, чтобы образование было инвариантной по времени переменной. В сущности, в исходной выборке образование менялось со временем лишь у незначительной части респондентов молодых возрастов, поэтому включение в модифицированную выборку индивидов в возрасте от 35 до 65 лет позволит считать образование не меняющейся со временем переменной.

Напомним, что оцениваемое уравнение имело следующий вид:

1шадвц = Ъд + Ъ^йисц + Ъ2адв^ + Ъ3адв2ц + Ъ^адпац + Ъ5двщ + Ъ6татз^ + + Ъ^сИуц + Ъ813СО_1ц + Ъд{зСО_2ц + ... + Ъ1^3СО_7ц + Ъц{зСО_8х + Ъ1бй96 +

где lwageit - логарифм месячной заработной платы; educit - продолжительность образования (в годах); ageit - возраст; age2it - квадрат возраста; stagnait - стаж на данном месте работы; geni - пол;

marstit - семейный статус;

cityit - тип места проживания (город = 1 или село = 0);

isco_1it - isco_8it - дамми-переменные для профессиональных групп по классификации ISCO-88;

isco_9 (неквалифицированные рабочие) - референтная группа для сравнений; d96, d98, d00 - дамми-переменные для отражения временного эффекта, 1994 г. принят за базовый.

Сквозное оценивание уравнения нашей модели (МНК), игнорирующее панельную природу данных, приводит к следующим результатам:

+ b17d98 + b18d00 + sit,

Number of obs F( 18, 4640) Prob > F

2991.87 0.0000 0.9207 0.9204

4659

R-squared Adj R-squared

lwage

Coef. Std. Err.

t P>|t|

educ

age age2

.0434751 .0053231

.0653114 .0202214

.0007599 .0002101

.0009205 .0079549

.3553418 .0308112

.0109592 .0154633

.4935197 .0287722

.6642551 .0770394

.4405935 .052957

.4282444 .0506021

8.17 0.000

3.23 0.001

-3.62 0.000

-0.12 0.908

stagna

gen

marst

city

-11.53 0.000

isco_1 isco_2 isco 3

0.71 0.479

17.15 0.000

8.62 0.000

8.32 0.000

8.46 0.000

lwage | Coef. Std. Err. t P>|t|

isco 4 | .2982684 .0591398 5 04 0. 000

isco 5 | .3087274 .0613108 5 04 0. 000

isco 6 | .3378075 .1758152 1 92 0. 055

isco 7 | .3398478 .0510442 6 66 0. 000

isco 8 | .4641957 .04947 9 38 0. 000

d96 | 1.022029 .0360932 28 32 0. 000

d98 | -5.6942 .0359527 -158 38 0. 000

d00 | -4.934061 .0340505 -144 90 0. 000

cons | 9.568922 .4775385 20 04 0. 000

Из приведенной таблицы видно, что коэффициент при образовании является значимым и положительным, но эта модель игнорирует индивидуальную гетерогенность и возможную эндогенность образования.

Для сравнения приведем результаты оценивания коэффициента при образовании в регрессиях со случайными эффектами, опустив для краткости оценки коэффициентов при остальных переменных:

Random-effects GLS regression Group variable (i): aid_i R-sq: within = 0.9645 between = 0.8 65 6 overall = 0.9206 Random effects u_i ~ Gaussian corr(u_i, X) = 0 (assumed)

Number of obs = 4 659

Number of groups = 2011

Obs per group: min = 1

avg = 2.3

max = 4

Wald chi2(18) = 83682.53

Prob > chi2 = 0.0000

lwage |

Coef.

Std. Err.

P>|z|

educ |

.0379163

.0060711

6.25

0.000

Модель со случайными эффектами дает оценку, похожую на оценку МНК, а модель с детерминированными эффектами вообще не позволяет получить оценку интересующего нас коэффициента, поскольку образование в нашей выборке - инвариантная по времени переменная. При этом, судя по результатам теста Хаусмана,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Test: Ho: difference in coefficients not systematic

chi2( 17) = (b-B)'[SA(-1)](b-B), S = (S_fe - S_re)= 40.04 Prob>chi2 = 0.0013

доверять следует как раз модели с детерминированными эффектами.

Получить адекватную оценку коэффициента при образовании в такой ситуации позволяет метод Хаусмана - Тейлора:

Hausman-Taylor estimation Number of obs = 4659

Group variable (i): aid_i Number of groups = 2010

Obs per group: min = 1

avg = 2.3

max = 4

Random effects u_i ~ i.i.d. Wald chi2(18) = 91055.30

Prob > chi2 = 0.0000

lwage |_Coef. Std. Err._z P>|z|

TVexogenous |

age | .1082985 .0278551 3 89 0 000

age2 | -.0011794 . 0002881 -4 09 0 000

marst | .0186788 .0162352 1 15 0 250

isco 1 | .4475797 .0844171 5 30 0 000

isco 2 | .2179303 .0789794 2 76 0 006

isco 3 | .2677107 .0609747 4 39 0 000

isco 4 | .2206012 .0668783 3 30 0 001

isco 5 | .2345142 .0697221 3 36 0 001

isco 6 | .3714492 .1813608 2 05 0 041

isco 7 | .3173181 .0565847 5 61 0 000

isco 8 | .394937 .055502 7 12 0 000

d96 | .9857857 .0271921 36 25 0 000

d98 | -5.720279 .0286043 -199 98 0 000

d00 | -4.959665 .0286614 -173 04 0 000

TVendogenous |

stagna | .0019522 .0100927 0 19 0 847

TIexogenous |

gen | -.331364 .0436492 -7 59 0 000

city | .4858962 .0439518 11 06 0 000

TIendogenous |

educ | .0894979 .016713 5 35 0 000

| cons | 7.993123 .6918442 11 55 0 000

sigma u | .7551597

sigma e | .62321409

rho | .59485636 (fraction of variance due to ui)

note: TV refers to time-varying; TI refers to time-invariant.

Здесь переменную stagna, отвечающую за стаж работы на данном месте, мы полагаем меняющейся со временем эндогенной переменной, поскольку она может быть коррелирована с индивидуальными обстоятельствами респондентов, пол и место проживания (которое действительно практически не меняется со временем для рассматриваемой подвыборки) полагаются неизменными во времени экзогенными переменными. Образование полагаем неизменной во времени эндогенной переменной.

Как видно из таблицы, наблюдается эффект, похожий на тот, что заметили Грилихес и его коллеги: коэффициент при образовании статистически значим и действительно увеличивается, только в нашем случае не на 50%, а на 100% по сравнению с результатом регрессии, оцененной обычным МНК.

Лекция 7.

8.2. Ошибки измерения в панельных данных 8.2.1. Основные источники ошибок измерений

Микропанельные данные по домохозяйствам, индивидуумам и фирмам часто содержат ошибки измерения. В частности, серьезные ошибки содержатся в

средней почасовой заработной плате в американской базе РБГО (панельный обзор динамики доходов населения), причем положение усугубляется в ситуации, когда опрос проводится с двухгодичным интервалом по сравнению с ситуацией ежегодного опроса. В 1990 г. американский исследователь Бонд, используя два различных панельных опроса, в которых принимали участие одни и те же индивидуумы, исследовал масштабы ошибок измерения и пытался выявить переменные, для которых такие ошибки наиболее типичны. Он обнаружил, что наиболее серьезные ошибки содержат данные о почасовой заработной плате и длительности периода безработицы, менее сильно смещены данные по годовой оплате труда.

В данных бюджетных обзоров домохозяйств общие расходы и доходы содержат ошибки измерения. Игнорирование этих ошибок при построении функции Энгеля по данным норвежской панели домохозяйств привело к значительным смещениям оценок эластичностей.

Было выявлено, что наличие ошибок измерения существенно влияет на вид взаимосвязи между доходом и потреблением. При игнорировании ошибок измерения дохода в исследованиях потребления домохозяйств на основании базы РБГО оказывалось, что нет основания отвергать кейнсианскую модель потребления, однако при учете ошибок измерения дохода кейнсианская модель отвергалась в пользу модели рациональных ожиданий.

Ситуацию с российскими панельными данными РМЭЗ, наверное, можно назвать еще более сложной по многим причинам, в том числе связанным со значительной и неоднородной по различным регионам инфляцией в наблюдаемый период.

8.2.2. Методы оценивания регрессий по панельным данным при наличии ошибок измерений

Эконометрические учебники подчеркивают, что ошибки измерений объясняющих переменных приводят к смещенности и несостоятельности оценок МНК. Выход из положения заключается в использовании внешних по отношению к модели инструментальных переменных или дополнительных предположений относительно идентификации модельных параметров. Используя панельные данные, Грилихес и Хаусман [24] показали, что возможны идентификация и оценивание ошибок измерения различных переменных в регрессионных моделях без использования внешних инструментов. Можно продемонстрировать их подход на примере простой регрессии со случайным индивидуальным эффектом:

у = « + рх* + пи ,= 1,...,х г = 1,...,т,

где случайный член подчиняется модели со случайной ошибкой и и = т + еи и объясняющая переменная X* измерена с ошибкой X и = X* + .

Пусть т ~''ё(о, ), ей (о, ст^) и % ~иё(о, ст^) и все они независимы.

Кроме того, X* не зависит от и и и т]и ■

Покомпонентная запись модели будет выглядеть следующим образом:

У,, = « + РХ п + V п ,

где vi, = т + - рл,

Очевидно, что МНК-оценки окажутся несостоятельными, поскольку X t коррелированна с (н и v и. В векторной форме уравнение модели примет вид

Y = alT + Xß + v, где v = (lT Ä m) + e- ßh , m =(mi,-, Mn),

S = (eii,....,eNl,.-,eiT ,--,eNT ) и h' = (hl1,--,hN1,"",hlT >-•> hNT ) ■

Теперь рассмотрим произвольную матрицу P, которая может исключить индивидуальные эффекты. Это может быть и матрица перехода к первым разностям, и матрица преобразования «within», главное, чтобы она удовлетворяла условию PlT = 0.

Пусть матрица Q = P'P. Тогда для любой таким образом построенной матрицы Q оценка коэффициента ß может быть получена следующим образом:

ß = X' (Q Ä in)Y /X' (Q Ä in)X = ß + X' (Q Ä in)(e- ßh)/X' (Q Ä lN)X .

Для фиксированных значений T, беря предел по вероятности при N ® ¥, мы получаем

N e[x' (Q Ä in)(s - ßh)] = - N ß tr[(Q Ä in)E(hh')l = -ßStrQ , e[x' (Q Ä in)x] = N tr[(Q Ä in)(SX Ä in)] = trQsx , где SX - ковариационная матрица вектора X, и

p lim ß = ß-ß&h (trQ / trS x ) = ß(l - sf), где ф ° (trQ / trSx )> 0.

Грилихес и Хаусман использовали матрицы Q = P'P различного вида и показали, что хотя эти преобразования и убирают индивидуальный эффект, они могут усугубить смещение ошибок измерения. Однако состоятельные оценки для ß и s( могут быть получены комбинированием этих несостоятельных оценок.

Существует T(T -1)/ 2 -1 линейно независимых Q-преобразований. Пусть Q1 и Q2 - два различных Q-преобразования и ф °(trQj /trsx), i = 1,2. Тогда p lim ß = ß(1 - ст^ф.) и, заменяя p limß на сами Д , можно решить систему из двух уравнений с двумя неизвестными и найти

ß= f1ß2 -f2ß1 и Sh = ß2 - ß1^ f1 ф2 ' f1ß2 - f2ß1

Для того чтобы вычислить эти оценки, вместо ф подставляется ф = (trQi / trSXi = 1,2 . В качестве Q1 и Q2, например, могут выступать матрицы

Q1 = рр и Q2 = Р2'Р2, где Р1 = 1Т - ^^т , а Р2 = ^ ', где - матрица оператора вычисления первых разностей порядка (Т - 1)х Т. Другие Q-преобразования, предложенные Грилихисом и Хаусманом, получены из разностных операторов более высоких порядков.

Остается только ответить на вопрос, как комбинировать эти состоятельные оценки для р в эффективные.

Здесь может быть использован обобщенный метод моментов, основанный на эмпирических моментах четвертого порядка. Или, если есть нормальность, можно

получить асимптотическую ковариационную матрицу для Д., которая может быть состоятельно оценена с помощью эмпирических моментов второго порядка. Используя последний результат, Вансбик и Конинг [35] показали, что для т различных состоятельных оценок Д , задаваемых вектором Ь = (р,..., Дт) , на т различных матрицах Q¡

основанных

N [Ь - Р(1 ф)] ~ N(0,Г),

где ф = (ф,-,фт) ,

V = F' (С2вЕX ® 1т + Р2а1 (ех + )® 1Т)р и Е - (т2 х т)-мерная матрица с г-ым столбцом = vecQ¡ /(trQjEX).

Минимизируя квадратичную форму [ь - р(/т - -1 [ь - р(г

параметрам Д и а2? можно получить асимптотически эффективные (поскольку они основаны на Ь) оценки для Д и сс?:

ФУ-1Ь I' V-1Ь

ф)]

р=

се =

ф'У ф I 'V ф

' V I' V

фУф I 'V-1ф ] [Ф^^Ф I'V-lф

ф'V-1Ь I'V-1Ь I/ I фv-1Ь I'V-1Ь

с вектором л[ы (р- р, СС - сС), асимптотически распределенным по закону N(0, Т),

где

Т =

д

рф^ф р(}т - s2llф)Vф

(^ - Сф) V- (¡т -С2ф)

а Д = р2 (!т - сфф V-1 (Im - фф V-ф)- р2 [ф V- (т - ф .

Приведенные выше результаты, как показали Грилихис и Хаусман, могут быть распространены на случай нескольких независимых переменных при усло-

и

1

вии, что ошибки измерения в объясняющих переменных либо совсем некоррелированны, либо их корреляция имеет известную структуру. Эти результаты, выведенные в отсутствии серийной корреляции ошибок измерения, могут быть при некоторых сильных предположениях обобщены на случай серийно коррелированных Г)и ■

Предложенный метод был опробован самими авторами при оценивании уравнения спроса на труд по данным для N = 1242 американских промышленных предприятий за период 1972-1977 гг. Метод применялся также рядом других авторов при оценивании уравнений заработной платы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Возможность моделирования индивидуальной динамики - одно из существенных и уникальных преимуществ панельных данных. Во многих экономических моделях предполагается зависимость текущего поведения от прошлого (формирование привычек, частичное приспособление и т.д.), так что встает необходимость оценивать динамическую модель на индивидуальном уровне.

Рассмотрим линейную динамическую модель с экзогенными переменными и лагированной зависимой переменной вида

Добавление динамики в модель введением переменной Уи_х приводит к существенным изменениям в интерпретации уравнения. Без лагированной переменной регрессоры представляют собой полный набор информации, порождающей наблюдаемые значения зависимой переменной У и. С добавлением лагированной зависимой переменной в уравнение вводится полная предыстория самих регрессо-ров, так что любое воздействие на процесс измерения обусловлено этой историей. Это приводит к существенному усложнению методов оценивания таких моделей. Как в случае моделей с детерминированным, так и со случайным эффектом трудность состоит в том, что лагированная переменная коррелирует со случайным членом, даже в отсутствии автокоррелированности последнего.

Полагая а, детерминированными эффектами, рассмотрим «адйЬ,т»-преобра-зование исходной модели, элиминирующее влияние а :

Лекция 8.

8.3. Оценивание динамических моделей

8.3.1. Авторегрессионные модели с панельными данными

У - У. = X - х •)' р + -У.)+е - е

Здесь У их - У. и еи - еы являются коррелированными из-за наличия усредненных по времени значений, а следовательно, оценки коэффициентов этого

уравнения будут несостоятельны в случае конечных значений Т. Если бы Т ® ¥, такой проблемы бы не возникало для «гийЬ,т»-регрессии, но для МНК-оценок исходного уравнения она все равно бы существовала из-за корреляции У их и а -

Продемонстрируем это на примере упрощенной модели с одним стохастическим регрессором:

У и = У-, + а + еи, М<1.

Опять полагая а детерминированными эффектами, рассмотрим «шИЫп»-преобразование исходной модели, элиминирующее влияние а :

У, - У. = гУ-1 - У.)+е - е..

Переписав полученное уравнение в виде У, = уУи-1 + ен, найдем оценку коэффициента:

IУ аУ а -1 I ~«У,-1

^ = ~2 = Г +

У Y 2 yf2 '

A.i-'-it -1 й-1

Эта оценка смещена и несостоятельна при N ® ¥ и конечных значениях Т, поскольку математическое ожидание второго слагаемого в правой части приведенного выше выражения не равно нулю и не стремится к нулю, даже когда N очень велико. В частности, было показано, что

,• 1 s2 (T -1)-Tg + gT A

PlimNTy~tft-1 = -TT —л—* 0 .

s

n®: nt ^it±it-1 t 2 (1 - g)2

Таким образом, становится очевидной несостоятельность оценки для конечных Т. Причем эта несостоятельность не связана со свойствами at.

Смещение может быть очень существенным на конечных по Т выборках, как это явствует из следующего модельного примера, в котором истинное значение g предполагалось равным 0,5:

p lim gW = -0,25 при Т = 2, p lim gW = -0,04 при Т = 3, p limgW = 0,33 при Т=10.

Для разрешения проблемы преобразуем рассматриваемое уравнение, перейдя к первым разностям для элиминирования индивидуальных эффектов:

Y« - Yt-1 = (X,t -Xit-1 )'ß + g(ft-1 - ft-2)+ sit - Sit-1, t = 2, ..., T

Попытки применить к этому уравнению МНК приведут к несостоятельным оценкам g, поскольку Yt-1 и st-1 коррелированны даже при T ® ¥. Но сущест-

i.t

вует еще метод инструментальных переменных, который здесь вполне уместен. Например, У и-2 может служить в качестве инструмента для разности У п-1 - У и-2, так как тесно коррелирует с ней и в то же время не коррелирует ни с ви, ни с еи-1. Напомним, что предполагается отсутствие автокорреляции случайного возмущения. Тогда оценка метода инструментальных переменных для у, предложенная Андерсеном и Хсяо в 1981 г., будет иметь вид

^^^й-2 Ой — )

у = 1=1 »=2_

1=1 »=2

Необходимое условие для состоятельности этой оценки

Рlim NT I\ZZ(e<t -e«-i)Yt-2 = 0 ■

n®¥ N[I - ij ,=i t=2

Существует альтернативный вариант оценки метода инструментальных переменных тех же авторов:

11(^-2 - Гй-3)(7Й - ^-1)

у <2) = 1=1 »=3,

I IV

^ Yt-3 )(Yi-1 Y'i-2) ,=1 t=3

с условием состоятельности

Рlim nt(t 2)- e-1 )(Yt-2 - Yt-з)= 0 ■

л®>» NT -2J ,=i ,=з

Состоятельность обеих приведенных оценок гарантирована отсутствием авто-коррелированности e ■

Вторая оценка требует дополнительного лага для конструирования инструмента, поэтому происходит потеря одного наблюдения, а следовательно, несколько снижается эффективность второй оценки по сравнению с первой. Подход обобщенного метода моментов (GMM) позволяет унифицировать оценки и компенсировать потерю наблюдений.

Первый шаг обобщенного метода моментов состоит в том, чтобы заметить, что оба условия состоятельности, сформулированные выше, представляют собой моментные тождества. Иначе говоря,

р lim N(T 1) DX(e*- e-i )y-2 =E{(e«- et-i )y«-2 }=0,

n®¥ NU - 1 ,-=i t=2

T

РlimH(e* -et-i)(Yt-2 - Yt-з)= E{(eit -e^)(Y-2 - Yt-з)}= 0■

N[I - 2 J ,=i t=3

Известно, что увеличение числа используемых моментных тождеств повышает эффективность оценок (если конечно тождества справедливы). Ареллано и

Бонд [10] предположили, что список инструментов может быть расширен введением дополнительных моментных условий и разрешением количеству этих условий варьироваться с t. Допустим, Т = 4, тогда

для t = 2 Е{(в, - В1 )Хо}= о;

для t = 3 Е{(Вз - в,Х}=о,

Е{(вз - В2 )Хо} = о;

для t = 4 Е{(в,ч - Вз Х} = о,

Е{(В4 - Вз Х}=о,

Е{(В4 - Вз )Хо}=о.

Все эти моментные тождества могут быть использованы одновременно в рамках обобщенного метода моментов.

Поясним это, введя некоторые обозначения:

С в - в ^

,2 ЬИ

Дв,. = ошибки и

- вектор преобразованных к первым разностям значений

2,. =

^о ] 0

0

о

ХоХ ]

0 Х

о о о

..х

,Т-210

матрица инструментов.

Каждая строка матрицы 2. содержит инструменты, подходящие для данного периода. Тогда набор всех моментных тождеств может быть записан в матричной форме как

к[г ,'Дв,.}=о.

Заметим, что здесь содержится 1 + 2 + 3 + ... + Т - 1 условие.

Теперь выразим Дв из исходной регрессионной зависимости, записанной в первых разностях

Е[г(ДХ - г ДХ,,-1}= о.

Так как число моментных тождеств обычно превышает число неизвестных коэффициентов, оценка у будет отыскиваться минимизацией квадратичной формы, записанной через соответствующие выборочные моменты

Ш1П

у

1 N I \1 Г 1 Ы I \

NXг:{д7, - у дх-1 ) ^ ^I2;(дх - у дх,-1 )

в -в

Л ,Т С.,Т-1 0

где ^ - симметричная положительно определенная матрица. Дифференцирование этой квадратичной формы по у и решение полученного уравнения дает следующую оценку

(, ' Л-1

Ygmm

ZK-z* I wn 11

ZbYUzA WN[XZ:Ay,\ .

Свойства этой оценки будут зависеть от выбора матрицы WN, но состоятельность их обеспечивается положительной определенностью этой матрицы.

Каким же образом выбирается весовая матрица WN ? Оптимальным, очевидно, является выбор, обуславливающий наиболее эффективную оценку параметра у , т.е. минимальную асимптотическую ковариационную матрицу для yGMM. Из общей теории обобщенного метода моментов известно, что оптимальная весовая матрица асимптотически пропорциональна обратной ковариационной матрице выборочных моментов. Это означает, что оптимальная весовая матрица должна удовлетворять условию:

p lim wn = V {Z [De}-1 = E{Z [Ds.Ds'Z ,}-1.

В стандартном случае, когда нет специальных ограничений на ковариационную матрицу V (e), оптимальная весовая матрица оценивается следующим образом:

wopt =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 N

— У Z 'dsas'Z ,

N tl ' ' ' '

где 2 - остатки регрессии, полученные после первого шага применения СММ, в котором в качестве используется единичная диагональная матрица.

Вообще говоря, в обобщенном методе моментов не требуется, чтобы ошибки е были одинаково и независимо распределены по г и по t, и оптимальная весовая матрица оценивается без этих ограничений. Но, однако, отсутствие автокорреляции является необходимой гарантией справедливости моментных тождеств. Для маленьких выборок целесообразно накладывать требования отсутствия автокорреляции и гомоскедастичности. При этих ограничениях

Г 2 -1 О

-1

2

О

Л

о -1

2

а^О = а]

и

/ 0 -1

тогда оптимальная весовая матрица может быть определена как

1

WoJ" =1 — У Z 'GZ

I n £ ' '

,=1

1=1

,=1

Очевидно, что эта матрица не включает неизвестных параметров, так что оптимальная ОММ-оценка может быть вычислена на первом же шаге, если ошибки е исходной модели предполагаются гомоскедастичными и не автокоррелированными.

В общем же случае ОММ-оценки для параметра у асимптотически нормальны с ковариационной матрицей

(

p lim

N Y 1 N

У AY/ Z II — УZ'MAe'Zt

ti 1,-1 'ANti ■ ■ ■ ■

У Z ;Ay,-i

Y

8.3.2. Динамические модели с экзогенными переменными

Вернемся опять к рассмотрению более общей динамической модели, содержащей экзогенные переменные

У = *Ь + У^й-1 + «, + е.

Она также может быть оценена обобщенным методом моментов. В зависимости от предположений, сделанных относительно Х, можно сконструировать различные наборы дополнительных инструментов. Если Х являются строго экзогенными в том смысле, что они не коррелируют ни с какими е , то справедливы следующие моментные тождества:

Е{Х 15 деи }= 0 для любых 5 и

так что Х11,...,Хт могут быть добавлены в список инструментов для уравнений в первых разностях в любом периоде. Но тогда в матрице инструментов будет слишком много строк. Чтобы избежать этого, сохранив всю полезную информацию, можно использовать не сами Хл,...,Х т , а их первые разности в качестве инструментов. В таком случае моментные тождества будут сформулированы следующим образом:

Е{ДХ1( Дей }= 0 для любого t, и матрица инструментов запишется так:

Фу,, дх;2] о к о

0 [Ую.Уц, ДХ,'з] 0

: О 0

Z, =

Л

0

0 [Y'0,K,y t-2,ax;t\

Если же Х не строго экзогенны, а предопределены («predetermined»), в этом случае текущие и лагированные значения Х некоррелированны с текущими значениями случайного члена. Тогда будут справедливы тождества

e{x t aeis }= 0 для s > t.

'=1

В этом случае только Хд-1,...,Хл будут хорошими инструментами для уравнений в первых разностях в момент t. Таким образом, подходящие моментные тождества можно переписать в следующем виде

е{х п-де}= 0 для ] = 1, t - 1.

На практике чаще встречается комбинированный случай, когда часть Х строго экзогенна, а другая часть - предопределена. Очевидно, что матрица инструментов должна все это учитывать.

О качестве оцененной модели можно судить по результатам теста Саржа-на, который был описан выше, в разделе, посвященном методу инструментальных переменных Хаусмана - Тейлора.

В завершении добавим, что можно рассматривать моментные тождества не только для первых разностей, но и для уровней или для средних по времени, подобрав подходящие инструменты. Это бывает удобнее в случае, когда параметр у близок к единице.

8.3.3. Проблема стационарности и коинтеграция

Множество современных статей посвящено обсуждению проблем единичных корней, кажущихся регрессий и коинтеграции в панельных данных. В основном они содержат концепции долгосрочного характера и рассматривают проблемы тестирования моделей для случая Т ® ¥. Во многих ситуациях обращение к моделям с фиксированным Т и N ® ¥ позволяет обойти подобные проблемы, по крайней мере теоретически.

Принципиальный момент в анализе временных рядов на выборке из множества индивидуальных объектов - учет гетерогенности. Пока мы рассматриваем каждый временной ряд отдельно, и его длина достаточно велика, естественно применять стандартную технику анализа временных рядов. Однако, если мы сливаем индивидуальные временные ряды, то должны быть готовы к тому, что они могут описываться различными случайными процессами или процессами одного характера, но с разными параметрами. Например, допустим, зависимая переменная У, стационарна для страны 1 и подчиняется процессу 1(1) для страны 2. Или пусть все переменные модели подчиняются процессу 1(1), но для каждой страны коинтеграционное соотношение имеет вид У и - ¡Х ы , которое представляет собой процесс 1(0) для каждого ряда, но не существует общего для всех стран коинтеграционого соотношения Уй - ¡¡Х,. Так же точно коинтегрированность индивидуальных временных рядов не гарантирует наличие коинтеграции между У,

и Х.,.

Для иллюстрации рассмотрим простейшую авторегрессионную модель

У и = а + УУ-1 + е,,

которую для наших целей удобнее переписать в виде

Ду = а+руу и-1 + е,, где р = у -1.

Нулевая гипотеза состоит в том, что все ряды имеют единичный корень:

Н0: р = 0 для любых г.

Альтернативная гипотеза состоит в том, что все ряды стационарны с одинаковыми параметрами, т.е.

Н1: р = п < 0 для всех г.

Менее ограничительный вариант альтернативной гипотезы

Н1: р < 0 для всех г.

Очевидно, что ни основная, ни каждая из альтернативных гипотез не учитывают такой возможности, что часть рядов может быть стационарна, а часть нет. В таких случаях, а они достаточно часто встречаются на практике, затруднительно понять, какую гипотезу следует отвергнуть. Другая техническая проблема - возможность коррелированности ей, относящихся к различным странам, которая затрудняет проведение тестов на стационарность.

Одно из направлений современных исследований в динамическом моделировании панелей - построение моделей с гетерогенными параметрами. Другое направление - исследование величин и направления смещения оценок, вызванного использованием методов оценивания, неадекватных данным.

В качестве примера исследования величин такого смещения рассмотрим некоторые результаты работы Севестра и Троньона [30].

Ими рассматривалась следующая динамическая модель:

Т = ЬХ „ + а¥и-1 + ий ,

где

u и = a + e > E(utt )= 0,

E(u uuн) = 8usl + 8ti■ Процесс генерирования экзогенной переменной подчинялся условиям:

x „ = цХц-\ + x,

где

E (Xt ) = 0 ,

E(XXv) = ddtS , E(£ta)= E(Xueti) = 0 ',t,t.

Данные моделировались методом Монте - Карло.

При N ® ¥ и конечных значениях Т соотношения величин оценок, полученных различными методами, и истинных значений параметров оказались следующими:

аш < а < ОрОМНК < оомнк < амнк < ав ,

Ьв < ЬМНК < ЬОМНК < ЬРОМНК < Ь < К при П> 0 и Ь > 0 .

При N ® ¥ и T ® ¥ результаты выглядят так:

a = aw = аромНК = aOMHK < aMHK < aB = 1 , 0 = bB < ьмнк < ьомнк = bРОМНК = bW = b при h> 0 и b > 0 .

* * *

СПИСОК ЛИТЕРАТУРЫ

1. Анатольев С. Курс лекций по эконометрике для продолжающих. Российская экономическая школа. 2002. (http://www.nes.ru/Acad-year-2003/5th-module/econometrics-3-rus.htm).

2. Васькович Н., Гурова Е., Поляков К. Регрессионная модель панельных данных с однофакторной случайной составляющей // Математические модели экономики: Сборник научных трудов. М.: МИЭМ, 2002.

3. Гимпельсон В., Капелюшников Р., Ратникова Т. Страх безработицы и гибкость заработной платы в России // Экономический журнал ВШЭ. Т. 7. № 3. 2003.

4. Колеников С. Прикладной эконометрический анализ в статистическом пакете STATA. М.: Российская экономическая школа, 2001.

5. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. 5-е изд., испр. М.: Дело, 2004.

6. Нестерова Д., Сабирьянова К. Инвестиции в человеческий капитал в переходный период в России. Доклад на конференции EERC. 1999.

7. Ратникова Т.А. Анализ панельных данных в пакете STATA. Методические указания к компьютерному практикуму по курсу «Эконометрический анализ панельных данных». М.: ГУ ВШЭ, 2005.

8. Рощин С.Ю. Предложение труда в России: микроэкономический анализ экономической активности населения: Препринт WP3/2003/02. Серия «Проблемы рынка труда». М.: ГУ ВШЭ, 2003.

9. Список публикаций на основе данных Российского мониторинга экономического положения и здоровья населения (РМЭЗ). Материалы конференции «Российский мониторинг экономического положения и здоровья населения», 17 июня 2003 г.

10. Arellano M., Bond S.R. Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations // Review of Economic Studies. 1991. Vol. 58.

11. Baltagi B. Economertic Analysis of Panel Data. John Wiley & Sons, 1995.

12. Baltagi B.H., Raj B. A Survey of Recent Theoretical Developments in the Econo-metrcs of Panel Data // Empirical Economics. 1992. Vol. 17.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13. Chamberlain G. Omitted Variable Bias in Panel Data. Estimating the Return to Schooling // Annales de l'INSEE. 1978. № 30/31.

14. Chamberlain G. Panel Data. Handbook of Econometrics / Ed. by Z. Griliches, M.D. Intriligator. 1984. Vol. II.

15. Cheng H. Analysis of Panel Data: 1st ed. Cambridge University Press, 1986.

16. Cornwell C., Trumbull W.N. Estimating the Economic Model of Crime with Panel Data // The Review of Economics and Statistics. 1994. Vol. 76. № 2.

17. Dormant B. Introduction à l'Econométrie des données de panel. Paris, 1989.

18. Frisch R., Waugh F.V. Partial Time Regressions as Compared with Individual Trends // Econometrica. 1933. Vol. 1.

19. Hausman J.A., Taylor W.E. Panel Data and Unobservable Individual Effects // Econometrica. Vol. 49.

20. Heckman J.J. Micro Data, Heterogeneity and Evaluation of Public Policy. Nobel Lecture // Journal of Political Economy. 2001. Vol. 109. № 4.

21. Heckman J.J., Macurdy T.E. Ihe Review of Economic Studies // Econometrics Issue. 1980. Vol. 47. № 1.

22. Greene W.H. Economertic Analysis. 3rd ed. Prentice Hall, 1997. (Chapter 14.)

23. Griliches Z. Estimating the Return to Schooling: Some Econometric Problems // Econometrica. 1977. Vol. 45.

24. Griliches Z., Hausman J.A Errors in Variables in Panel Data // Econometrica. 1986. Vol. 31.

25. Kiefer N.M. Population Heterogeneity and Inference from Panel Data on the Effects of Vocational Education // Journal of Political Economy. 1979. Vol. 87. № 5.

26. Kim B.S., Maddala G.S. Estimation and Specification Analysis of Models of Devi-dend Behavior Based on Censored Panel Data // Empirical Economics. 1992. Vol. 17.

27. Lovell M.C. Seasonal Adjustment of Economic Time Series // Journal of the American Statistical Association. 1963. № 58.

28. Mundlak Y. On the Pooling of Time Series and Cross-Section Data // Economet-rica. 1978. Vol. 46.

29. Sabirianova K.Z. The Great Human Capital Reallocation: A Study of Occupational Mobility in Transitional Russia // Journal of Comparative Economics. 2002. № 30.

30. Sevestre P., Trognon A. A Note on Autoregressive Error Component Models // Journal of Econometrics. 1985. Vol. 28.

31. Tekin E. Employment, Wages and Alcohol Consumption in Russia: Evidence from Panel Data // IZA Discussion Paper. 2002. № 432.

32. Trognon A. Donnees individuelles temporelles. Polycopie de l'ENSAE. Couurs d'Eonometrie II. 1987. Tomes 2 et 3.

33. Verbeek M. A Guide to Modern Econometrics. John Wiley & Sons, 2003.

34. Verbeek M, Nijman Th. Can Cohot Data Be Treated as Genuine Panel Data? // Empirical Economics. 1992. Vol. 17.

35. Wansbeek T.J., Koning R.H. Measurement Error and Panel Data // Statistica Neer-landica. 1989. Vol. 45.

Введение в эконометрический анализ панельных данных Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Ратникова Та

Похожие темы научных работ по математике , автор научной работы — Ратникова Та

Текст научной работы на тему «Введение в эконометрический анализ панельных данных»