№3(7) 2007
Л. Н. Слуцкин
Обобщенный метод моментов
Мы продолжаем обзор наиболее значительных достижений в эконометрической науке, еще не достаточно полно освещенных в отечественной литературе.
Обобщенный метод моментов — ОММ (generalized method of moments — GMM) был введен в эконометрику Л. Хансеном [Hansen (1982)] и является одновременно обобщением метода моментов (ММ) и метода наименьших квадратов (МНК) для оценки параметров модели. В статье мы рассмотрим применение ОММ для нахождения оценок параметров модели линейной регрессии.
М
1. Метод моментов
ы напомним, что математическое ожидание Е(х) случайной величины х называется ее моментом (первого порядка) — т, а выборочным моментом — ее выборочное среднее:
тп = (1.1)
п
где п — число наблюдений, а х1,...,хп — случайная выборка значений х.Теорема Хинчина утверждает, что тп сходится по вероятности к т, т. е.
рИт тп = т. (1.2)
В дальнейшем мы откажемся оттребования, чтобы случайные величины х1,...,хп были независимыми и даже, чтобы они имели одинаковое вероятностное распределение (но, все они должны иметь одинаковое математическое ожидание Е(х,) = т, / = 1,2,...). Тем не менее, аналог теоремы Хинчина — формула (1.2) остается верной при наложении определенных условий на х/.
Соответственно для функции д(х) ее момент1 :
т( д( х)) = Е( д( х)),
а ее выборочный момент:
Шп (д( х)) = 5^. (1.3)
п
В отличие от выборочного, момент т(д(х)) функции д(х) называют ее теоретическим моментом.
Мы заметим, что т(д(X)) и тп(д(X)) определены также для случая, когда X — вектор, т. е. Xпредставлен конечным набором случайных величин. В этом случае д(Х) будет функцией от соответствующего числа переменных. Более того, если С(Х) — векторная функция размер-
При g(x) =xr, мы получим начальный момент порядка r.
119
-\
Консультации
НвЗ(7) 2007
ности г, то с помощью формул (1.1) и (1.3) мы получим выборочные моменты, которые будут г-мерными векторами.
Как правило, д(Х зависит от вектора параметров 9 = (9,,...,9к)2. Мы будем записывать этот факт в виде д( X; 9) = д( X; 9,,... ,9 к). Соответственно, моменты т( д( X; 9)) и тп (д( X; 9)) также будут зависеть от параметров 9,,...,9к.
Постановка задачи. Предположим, что имеются г функций — д, (X ;9),..., дг (X ;9), и мы наблюдаем значения XII,...,X,,, соответствующие вектору 90 =9°,...,90, для которого теоретические моменты m(g1(X;90)),...,т(дг(X;90)) равны 03. Мы также предполагаем, что 90 — идентифицируем. Это означает, что, если 9ф90, то хотя бы один из моментов m(g1(X;9)),...,m(gг(X;9)) не равен 0.Требуется оценить вектор90.
Мы запишем систему из г уравнений моментов относительно к неизвестных 9,,... ,9 к:
т, (д,(X;9,,.,9к)) = 0
............................................................(,.4)
т, (дг (X;9,,...,9к)) = 0.
Другими словами, мы приравниваем выборочные моменты функций д,,...,дг к их теоретическим моментам. Естественно, принять решение системы (,.4) 9?,...,9 0, при условии, что оно существует и единственное, за оценки соответствующих параметров9,0,...,90. Как правило, для этого требуется, чтобы число неизвестных и уравнений в (,.4) совпадало, то есть, чтобы к = г. Нахождение оценок 9,0,... ,90 при решении системы (,.4) называется методом моментов (ММ).
1.1. Оценка коэффициентов модели линейной регрессии
Рассмотрим модель линейной регрессии:
у,- = р,х™ + р2х<2) +...+Ркх|к) +Б, I = ,2,...,п, (,.5)
где случайные члены б,,...,бп — произвольные (не обязательно нормальные и, возможно, имеющие различные вероятностные распределения) случайные величины с одним и тем же математическим ожиданием, равным 0. Регрессоры х(1), х(2),...,х(к' также, в отличие от классической модели линейной регрессии, не предполагаются детерминированными4. Мы получим дополнительные ограничения как для случайных членов, так и для регрессоров, при щ изучении оценок параметров модели р,,р2,...,рк.Тем самым наш подход принципиально | отличается от принятого в курсах эконометрики, когда априори определяются все характе-
ристики модели, а затем, на их основе, выводятся ее свойства. Положим, что
§
0 §
?
| д] (х('>, Б) = х(У>Б, ] = ,2,..., к. (,.6)
1 _
З1 Вероятностное распределение Xтакже может зависеть от9.
у§ 3 Если т(д(К)) = с Ф 0, то мы рассмотрим g1(X) = д^У.) - с.
® 4 Для одного и того же регрессора х(,хи хЦ\ I, Ф12, могут иметь различные вероятностные распределения, в том числе быть различными константами.
120
Для /-го наблюдения
д] (х('>, б) = х('1 Б,
N93(7) 2007
(1.7)
Заметим, что в правой части (1.7) при различных / мы будем иметь в общем различные случайные величины.
Так как мы собираемся применить метод моментов, потребуем, чтобы для каждого ] = 1, 2,...,к выполнялось следующее условие ортогональности:
I
ас
Е(х(11 е,) = 0,1 = 1,2,...,п.
(1.
Из (1.5) следует, что формулу (1.6) можно записать в виде функции от к +1 переменных
(1) и к),
у,х(1),...,х(к)и к параметров р 1,...,рк
д] (у, х(1),...,х(к>; р1,...,рк) = х(у> (у -р 1х(1) -... -ркх(к)), } = 1,2,..., к.
(1.9)
Для определения параметров р 1 ,...,рк, мы воспользуемся методом моментов (1.4), и получим следующую систему из к уравнений моментов с к неизвестными:
£х</>(у, -р 1хI1» -р2х(2) -...-ркх<«) = 0, } = 1,2,..., к.
(1.10)
Систему (1.10) можно записать как одно уравнение моментов в векторном виде:
Хт (У - хр) = 0, (1.11)
где X = Хп — матрица, составленная из значений регрессоров модели (1.5). Мы предполагаем, как обычно, что ранг X равен к.
X =
Сх™ х® х ™ х ®
у (1) у (2)
х п х п
А к) ^
Л к)
(к)
(1.12)
вектора У = (у 1,...,уп), р = (р 1,рк), и Т— символ транспонирования.
Поскольку гапк(X) = к, матрица XTX — невырожденная. Таким образом, решение уравнения (1.11) существует, единственное, и его можно записать в виде:
р = (хTX)-1 XTУ. (1.13)
Из (1.11) следует, что вектор остаткове = (е1,..., еп), соответствующийр, ортогонален каждому из столбцов X (вектору X(/), образованному значениями регрессора х(/),] = 1,...,к):
£ х\е1 = 0, \ = 1,..., к,
(1.14)
гдее, = у, -р 1 х,(|)-р2х,(2)-...-ркх(
к (к)
п
121
№3(7) 2007
Полученная методом моментов оценка (1.13), совпадает с МНК-оценкой для ß — при нахождении минимума квадратичной формы (по ß 1,...,ßk):
n n
Q=Ёe'2 =Ё (У' -ß ix ™ -.-ß kx 'k>)2, (1.15)
i=1 ' =1
или в векторной форме:
Q = (Y -Xß)T (Y -Xß). (1.15)
Рассмотрим следующие свойства оценки (1.13).
1. Несмещенность, E(ß) = ß.
Из (1.13) имеем:
ß = (XTX)-1XTY = (XTX)-1XT (Xß + s) = ß + (XTX)-1XT б, (1.16)
где e = (s1 ,...,sn). Отсюда получаем:
E(ß) = ß + E(( XT X)-1XT s). Таким образом, оценка ß будет несмещенной тогда и только тогда, когда
E(( XT X)-1XT б) = 0. (1.17)
Для выполнения (1.17) достаточно потребовать5 выполнения следующего условия экзо-генности6:
E(e, \X) = 0, i = 1,2,..., n. (1.18)
Очевидно, что условие ортогональности (1.8) следует из (1.18).
2. Состоятельность, plim ß = ß.
п^да
При больших значениях числа наблюдений п, значения ß с большой вероятностью будут близки ß. Согласно (1.16), для состоятельности ß необходимо и достаточно, чтобы
plim( XT X)-1XT б = 0. (1.19)
п^да
Если записать
(xx-1x" б) = (п-1XTX) "'(п-Xт б), (,.20)
о то достаточными условиями для выполнения (1.19) будут: § а)
§ рит п-1XTX = я, (1.21)
| где Я — невырожденная матрица порядка к.
>5
¡8 -
5 5 Для доказательства достаточности можно воспользоваться формулой из теории вероятностей | Е( бх) = Е (Е (ех|х)).
6 Обычно под экзогенностью регрессоров понимается более общее условие независимости б, отX, I =1,2,...,п. ® Что это не одно и тоже, видно на примере гетероскедастичности случайных членов в том случае, когда дисперсия б, является функцией отX.
122
Нв3(7) 2007
Примечание. |
1.В случае, когда регрессоры х(1),х(2),...,х(k)— независимые случайные величины, || а столбцы Xпредставляют собой случайные выборки значений регрессоров, sij = Е(х(')х(j)). <§
2. Условие (1.21) часто не выполняется для нестационарных рядов7.Тем не менее, сущест- ^ вуют более слабые условия Гренандера [Greene (2003)] на X, имеющие достаточно универсальный характер, при которых выполняется 2.
б)
plim п-1XT б = 0. (1.22)
Примечание. Условие б) представляет собой не что иное, как аналог теоремы Хинчина (1.2). Если оно выполняется, то говорят, что случайные члены асимптотически не коррели-рованы с регрессорами.
Мы видим, что оценка может быть состоятельной даже при неэкзогенных регрессорах. Например, при выполнении условий а) и б), в качестве регрессоров могут выступатьлагиро-ванные значения объясняемой переменной y (y ' = y,_v, v >0).
3. Эффективность.
Эффективность означает, чтоßi, i = 1,..., k, являются наилучшими несмещенными оценками (то есть, имеют наименьшее значение дисперсии) соответствующих параметров bi в данном классе оценок. Теорема Гаусса-Маркова утверждает, что в случае, если ковариационная матрица для случайных членов имеет вид:
2e=||cov(s i б j )|| = а21, (1.23)
где 1 — единичная матрица порядка n, оценка (1.13) является эффективной в классе линейных оценок по Y, т. е. вида c Y, где с — n-мерный вектор.
Примечание. Вектор с в теореме Гаусса-Маркова может зависеть только от исходной информации (значений регрессоров), но не от ненаблюдаемых параметров модели.
Рассмотрим случай, когда условие (1.23) не выполняется, более подробно. Это означает, что или имеются ненулевые корреляционные отношения между случайными членами, соответствующими различным наблюдениям, или присутствует гетероскедастичность. Так как условия несмещенности и состоятельности не зависят от вида 2б, то они выполняются (при техже условиях) издесь. Однакооценкар уже не будет больше эффективной. Чтобы показать это, найдем эффективную оценку ß, которая в общем будет отлична отр.
Для этого мы представим матрицув виде произведения PPT, где P — невырожденная матрица порядка п. В таком случае после преобразования переменных PTY, PTX, мы получим модель линейной регрессии:
TY = PTX р+б'. (1.24)
гдеб'= P^. Легко проверяется, что2Б' = а21. В таком случае, если мы возьмем оценку, определяемую формулой (1.13) для уравнения (1.24), то получим эффективную оценку ß:
Можно легко проверить, что (1.21) не выполняется в случае, когда один из регрессоров — время ( =1,2,
123
-\
Консультации
7
No3(7) 2007
(3 * = (XTPPTX)-1 XTPPTY.
Отсюда следует, что
(3 * = (XT 2-1X) - XT 2-1Y. (1.25)
Заметим, что оценка (1.25) в отличие от (1.13) будет недоступной (unfeasible), так как ковариационная матрица 2Е — ненаблюдаемая.
Оценку (3 * можно также получить из модели (1.24) либо методом моментов, либо, минимизируя соответствующую квадратичную форму. В первом случае мы получим:
XTP (PTY - PTX () = 0.
Отсюда:
XT 2-1(Y - X() = 0. (1.11)
Можно заметить, что (1.11) отличается от соответствующей формулы (1.11) добавлением матрицы2-1, что соответствует ортогональности каждого из векторовX(j), j = 1,...,k, вектору остатков e в n-мерном пространстве, в котором скалярное произведение задано матрицей 2-1. Формула (1.25) следует из (1.11).
Квадратичная форма для модели (1.24) будет:
q = (ptY - PTX ()T (PTY - PTX (),
откуда получаем, что
Q = (Y - X()T Z-1(Y - X(). (1.15 ')
Нахождение (* при минимизации правой части формулы (1.15 ') называется обобщенным методом наименьших квадратов (ОМНК). Если мы сравним формулы (1.15 ) и (1.15 '), то заметим, что различные произведения компонент вектора Y-X( взяты в (1.15 ') с множителями (весами), являющимися элементами матрицы 2-1. В то же время в (1.15 ) мы имеем только квадраты этих компонент.
1.2. Инструментальные переменные
При эндогенных (коррелированных со случайными членами) переменных свойства оценок, которые мы получили ранее, могут не выполняться. Такой пример нам дают системы регрессионных уравнений. В этом случае для эндогенных регрессоров находят соответствующие инструменты или инструментальные переменные. От инструментов уже требуется, чтобы они были экзогенными.
Пример 1. (Эконометрика [2006]). Модель динамики цен и заработной платы.
Щ
S £
§ У1 = a 11 x 1 + b 12 y 2 + e 1,
5
6
у 2 = а 22 х 2 + а 23 х 2 + ь 21 у 1 + е 2,
I где у, —темпы изменения месячной заработной платы;у2 — темпы изменения цен;х, — про-центбезработных;х2 — темпы изменения постоянного капитала;х3—темпы изменения цен на £ импорт сырья.
о В данном примере переменные у,, у2 — эндогенные, а х,, х2, х3 — экзогенные переменные
мента для у2 взять одну из экзогенных переменных х2 или х3 из второго уравнения.
124
N93(7) 2007
Рассмотрим модель:
!
yi =р,х™ + р2x<2) +... +рkxf] +Б, i = 1,2,..., n, (1.26)
<§ ас
в которой первые г, г < k, регрессоровx(1), x(2),...,x(г) —экзогенные, а остальные — эндогенные. Предположим, что для эндогенных переменныхx(г+1), x(г+2),...,x(k) мы смогли найти ин- ^ струментальные переменныеz(г+1), z(г+2),...,z(k). Обозначим матрицу, составленную из новых и старых регрессоров:
W = [ Хг; Zk_ г ], (1.27)
где Хг — матрица порядка nхг, соответствующая старым регрессорам, а Zk_г — матрица порядка nх(k _г), соответствующая инструментам. Тогда уравнение моментов (1.11) можно записать в виде:
WT (Y _ ХР) = 0. (1.28)
Если матрица WTX — невырожденная, мы получим оценку для
p|V = (WTX) _1 WT Y, (1.29)
называемой простой IV оценкой. Если W = X, т. е. каждая экзогенная переменная является инструментом для самой себя, то мы получим формулу (1.13). Из (1.28) следует, что вектор остатков e, соответствующий р, ортогонален каждому из столбцов W.
Оценка pIV минимизирует квадратичную форму8:
Q = (Y _ Xp)TWWT (Y _ ХР). (1.30)
Подставив Хр + s вместо Y в (1.29), получим:
piv _р= (WTX)_1 WTб. (1.31)
Так как элементы матрицы (WTX)_1 WT могут быть коррелированны со случайными членами, то в отличие от (1.16) pIV, как правило, больше не будет несмещенной оценкой р. Также следует, что pIV — состоятельная оценка р, тогда и только тогда, когда выражение в правой части (1.31) асимптотически стремится к 0. Например, pIV будет состоятельной оценкой, если выполняются два условия аналогично (1.21) и (1.22).
а)
plimn ~]WT X = S, (1.21)
где S — невырожденная матрица порядка k.
б)
plimn ~]WT б = 0. (1.22).
Как мы уже отмечали, при обсуждении формулы (1.22), для выполнения (1.22) не обязательно требовать, чтобы столбцы W были экзогенны по отношению к случайным членам. Для этого часто достаточно, чтобы выполнялось следующее условие предопределенности (predeterminedness condition):
w°'; и в] —независимы при любых i и j, i =1, 2,..., n; j =1,2,..., k.
'' Доказательство этого факта в более общем случае будет приведено в следующем разделе.
125
НвЗ(7) 2007
Заметьте, что случайный член должен быть независим только от значений инструментов того же самого наблюдения. Очевидно, что условие ортогональности (1.8) следует из предопределенности.
Результаты этого раздела резюмируем следующим образом. В каждом из рассмотренных случаев, оценки параметров модели линейной регрессии могут быть получены одним из двух способов:
• метод моментов. Нахождение решения системы уравнений, полученных из условия ортогональности (с различными весами, как в случае (1.11);
• минимизация квадратичной формы. О = (У-хр)Т Ф(У-хр), где Ф — симметричная положительно определенная матрица (Ф = I в (1.15 ), Ф =2-1 в (1.15 "), Ф = в (1.30).
2. Обобщенный метод моментов
Произвольная симметричная положительно определенная матрица порядка п задает в п-мерном пространстве Яп длину вектора А(а,,..., ап)' формулой:
| А|¥п = [(а 1,..., ап )уп (а,,..., ап )Т/2. (2.,)
Формула (2.1) является обобщением формулы для длины вектора:
|А| = (а ,2.....ап2 )12, (2.2)
в случае, когда уп —единичная матрица 1п. В действительности [Гельфанд (1998)], в некотором базисе в Нп |А|ч,п будет иметь вид (2.2). Элементы уп можно понимать, как некоторые веса, с которыми попарные произведения а1а] входят в формулу для | А .
Теперь, снова вернемся к примеру 1. В качестве инструмента для у2 мы можем взять любую из переменныхх2, х3. Возможно, существуют и другие экзогенные переменные, которые также можно было бы использовать в этом же качестве. Но, если мы включим в № более одной переменной, то система (1.28) станет сверхидентифицируемой, т. е. в ней будет больше уравнений, чем переменных, и, как правило, такая система не имеет решений. Следовательно, мы должны выбрать ровно один инструмент для у2. Но, исключив из рассмотрения другие экзогенные переменные, мы, тем самым, сужаем полезную информацию о модели. В таком случае поступают следующим образом. Обратимся снова к модели:
у| =р,х™ +р2х|2) +... +ркхк +Б|, I = 1,2,..., п. (2.3)
§ Рассмотрим матрицу 1/Кп, столбцы которой образованы значениями экзогенных (предо-| пределенных) переменных (инструментов) 7(1), 7(2),...,7('). Мы будем считать, что г > к, и
§ гапк(^птХп) = к. Запишем уравнение моментов: §
Ц (Уп - Хп р) = 0. (2.4)
<и
Так как система (2.4), в общем случае, не будет иметь решений, то мы в качестве оценки р возьмем вектор, при котором левая часть (2.4) наиболее близка к0, т.е. имеет наименьшую длину (заданной некоторой положительно определенной матрицей уп) в Яп.
Определение. Если уп — симметричная положительно определенная матрица порядка ' (матрица весов), то к-мерный вектор:
I
Л
£ О
126
'— №3(7) 2007
ßомм(^п) = argminW Y -Xnß)]T^ [WTn (Yn -Xnß)], |
p, ,-,p k §
p
или, в более компактной форме: о
ас
(Pомм(^п) = argmin(Yn -Xnß)TWnTnWlY -Xnß), (2.5) ^
p, ,..,p k
называется оценкой ß (соответствующей -фп), полученной обобщенным метод моментов.
Примечание. В определении ß0MM(Tn), матрица yn можетзависеть от исходной информации, представленной матрицами Xn и Wn также, как и от размера выборки n.
Из условия для оптимизации квадратичной формы9 [Магнус, Нейдеккер (2002)], получаем:
P омм(Тп ) = (XTnWn TnWTXn)-1 XTnWn TnWTYn . (2.6)
В принципе, мы могли бы взять за определение ß омм(Тп ) формулу (2.6). Но в таком случае, было бы непонятно, откуда она появилась.
Пример 2.
а) Рассмотрим случай r = k, то есть, число инструментов равно числу регрессоров. В таком случае, если WnTXn — невырожденная матрица порядка r, то формула (2.6), при любой yn, даст нам простую IVоценку (,.29). Соответственно, квадратичная форма в (2.5) совпадает с Q в (,.30) при yn = Ir.
б) Если r >k, то мы получим обобщенную IV оценку при yn = (WnTWn)-1. А соответствующую квадратичную форму легко можно получить из (2.5).
Сейчас мы займемся изучением вопроса, при каких условиях оценка ßомм(Тп ) — состоятельна. Для этого нам надо сделать, во-первых, предположение относительно Wn:
2-а. Матрица WnTXn имеет полный ранг, равный kтакже как и plimn-1WnTXn.
n—
матрицы yn мы будем подбирать так, чтобы выполнялось условие:
2-б. plim^n существует и равен положительно определенной матрице. 0
Если мы подставим Xnß + en, вn = (s,,...,sn) вместо Yn в (2.6), то получим:
P омм(Тп ) =ß + (n-,XTnWn Tnn-,WTXn)-1 n-,XTnWn 4nn-,WT в n. (2.7)
Из 2-а,б следует, что plimn- XTnWnTnnXn — невырожденная матрица порядка k, и
9 Для полноты изложения, мы приведем доказательство. Необходимое условие для минимума в (2.5), -!-!— = -2Х„ №пЧ№п' (Уп -Хпр) = 0. Отсюда следует (2.6). Достаточность следует из того фак-
зр
та, что гессиан квадратичной формы (У„ -Хпр)т№пЧ/„№Пт(У п -Хпр) равен 2Х^пх¥„Xп — положительно определенная квадратичная форма.
10 Неотрицательная определенность следует из существования рПтЧП.
n n—да
127
N93(7) 2007
рПтп 1xnwnТn существует.Таким образом, состоятельность |30ММ(Тп) сводится к асимпто-
п^да
тической некоррелированности случайных членов с инструментами 7(1),7(2),...,7('): 2-в. рПт пеп = 0.
п^да
Для изучения дальнейших свойств |0ММ(Тп) нам потребуется вспомнить следующие понятия из теории вероятностей.
Определение. Состоятельная оценка 9п векторного параметра 9 размерности к называется асимптотически нормальной, если
л/п(0 п -9) ——^ N(0,0), (2.8)
гдеN(0,0) — к-мерное нормальное распределение с ковариационной матрицей 0 порядка к.
Мы будем записывать (2.8) в виде — 9п N(9,0/п). Матрица 0/п называется асимптотической ковариационной матрицей для 9п.
В случае, когда к = 1, состоятельная оценка 9п действительного параметра — асимптотически нормальна, если
л/п(ё п -9) ——^ N(0, ст2), (2.9)
где N(0, ст2) — стандартное нормальное распределение. Записывается — 9п -^N(9,ст2/п).
Рассмотрим г-мерный вектор пп[еп. По 2-в, его вероятностный предел равен 0. Можно показать [ИауаБЫ (2000)], что при определенных, достаточно общих условиях11 на Wп и е п,
4п{п^тпЕп) ——^N(0,0) (2.10)
с некоторой положительно определенной матрицей О, в общем зависящей от модели (2.3) и Wn.
Ниже приведены два основных свойства! 0ММ(Тп). Мы предполагаем справедливость 2-а, б, в. Вероятностные пределы матриц п~^тпХп и уп будем обозначать через SWтX и 5¥ соответственно.
1. 0ценка|0ММ(Тп) — состоятельна, что доказано выше.
2. л/п(|3 омм(Т ) ) ——^ N(00 Sт)), (2.11)
03 £
| где
ц 0( S т ) = ( -^Х^ SWTX ) ^Х^т^т SWTX ( SWTXS т SWTX ) , (2.12)
¡г л
I что следует из (2.7) для | омм(Т ) -|12.
!_
Щ
^ 11 Точная формулировка этих условий предполагает знакомство с теорией эргодических стационарных процессов.
® 12 Мы воспользовались при доказательстве следующим результатом из теории вероятности: если Х„ — г-мерный вектор,Л„ — матрица порядка кх г, так что 4пХп —^^N(0,2) и рПт Ап = А, то 4пАпХ„ —^^N(0,АЕДт).
п^да
128
N93(7) 2007
Определение. Асимптотически нормальная оценка 9n называется асимптотически эф- Л фективной в данном классе M асимптотически нормальных оценок, если для любой оцен- || ки 9'n из M, матрица Q' — Q — неотрицательно определена. <§
ас
С;
Асимптотическая эффективность означает, что любая линейная комбинация компонент 9n имеет асимптотически не большую дисперсию, чем такая же линейная комбинация компонент 9 n.
Естественным было бы попытаться узнать, когда (30мм№, ) будет асимптотически эффективной в классоценок, имеющих свойство (2.12). Результат Хансена [Hansen (1982)], который отвечает на этот вопрос, является центральным для обобщенных методов моментов:
Оценка (30мм() будет асимптотически эффективной, если Sф = П-1.
Обозначим асимптотически эффективную оценку — (3Э0мм(Q -1) (plim Qn - Q). Асимпто-
/v
тическая ковариационная матрица для (3ЭОМм(Q-1) легко находится из формулы (2.12):
n-Q (Q-1) = n"Ч STwTx Q-1 SwTx)-1. (2.13)
Асимптотическая ковариационная матрица (2.13) однозначно определяется матрицами
SWTX и W.
Из примера 2-а следует, что в случае, когда число инструментов равно числу регрессо-ров (r = k), оценка (3|V - (WTX)-1WTY является асимптотически эффективной. Асимптотическая ковариационная матрица для (3IV вычисляется по формуле (2.13). В отсутствие новых инструментальных переменных (W = X), мы получаем, что (3MHK = (XTX)-1XTY — асимптотически эффективна. Этот результат довольно неожиданный, так как мы знаем, что для конечных выборок (3MHK — эффективна в случае: 2Sn = а21n.
Итак, подведем итоги поданному разделу.
1. С каждой положительно определенной матрицей yn порядка n однозначно ассоциируется оценка р0мм№, ) вектора параметров модели ((при условии наличия n наблюдений и матрицы Wn).
2. Если plim^ — положительно определенная матрица, то (при выполнении ряда ус-
n—>TO ^
ловий на X, W и s), 3 0мм№, ) —состоятельная асимптотически нормальная оценка 3.
3. Если plim Qn - Q, то3Омм(Q-1) — асимптотически эффективна (3ЭОМм(Q-1)).
n—TO
3. ГАС-оценка13
Для нахождения эффективной оценки 3ЭОМм(Q-1) мы можем воспользоваться формулой (2.6) (¥n - Q-1).Таким образом, поиск3ЭОММ(Q-1)сводится к нахождениюQn.
Из (2.10) следует, чтоnQявляется асимптотической ковариационной матрицей для вектора W,tеn. Ковариационная матрица для Wlеn вычисляется по формуле:
E( WT е n eTnWn) - E[ E( Wl е n е W |Wn)] - E(W^ е nWn), (3.1)
13 В нашем изложении мы следовали [Hayashi (2000)] и [Davidson, MacKinnon (2004)].
129
-\
Консультации
No3(7) 2007
где 2еп — ковариационная матрица для случайных членов. По этой причине, Оп носит название гетероскедастичной автокорреляционной состоятельной (ГАС) оценки О14.
Рассмотрим сначала случай, при котором 28 имеет диагональный вид (гетероскедастич-ность без автокорреляции). Тогда для нахождения ГАС-оценки Оп поступают следующим образом15:
1. Берется состоятельная оценка!. Например, простая или обобщенная IVоценка.
2. Вычисляется вектор остатков
еп = Пп - Хп(3.2)
3. Полагаем16
О п = п-Щ,' 2 , (3.3)
где2вп —диагональная матрица сэлементамив!2,...,еп на главной диагонали.
В общем случае присутствия корреляционных связей между случайными ошибками запишем:
пп
п-1Е(wnепETnWn) = пЕ(&'8), (3.4)
Г =1 5 = 1
где Wt — строка W с номером Г. Из (3.4) следует, что
п -1
пЕ п еЖ ) = Г(0) + £ (Г( ]) +ГT (])), (3.5)
1=1
где
п
Г( 1) = п-1 £ Е(8г 8г-¡WtTWt -1), 1 > 0. (3.6)
Г =1+1
Из (3.5) следует (при тех же условиях, что и для (2.10):
п -1
0=Г(0) + ИтУ (Г( 1) +ГT (1)). (3.7)
1=1
В качестве оценки дляГ( 1), 1 > 0, естественно взять
Г( 1) = п-1 ¿^е,-iW[TW[-1, (3.8)
о
■с f=1+
<ъ §
где et тоже, что и в (3.2). Оценки, которые мы сейчас обсудим, отличаются только тем, как раз-
5 личные исследователи обходят трудность с бесконечным числом слагаемых в (3.7). <ù
I Оценка Хансена-Уайта (Hansen-White estimator). В правой части (3 7) берется конеч-
1 ное число членов, j = 1,...,p, где p — некоторый порог (lag truncation parameter), зависящий ï
t -
va 14
^ В англоязычной литературе — heteroskedasticity autocorrelation consistent (HAC) estimator.
® 15 Предполагается, что все инструменты в W — стационарны.
16 Оценки типа (3.3) были впервые исследованы Уайтом [White (1980)].
130
Ns3(7) 2007
от п. Другими словами, слагаемые в (3.7) просто урезаются при ] >р. Таким образом, мы
!
имеем: 5
р I
ас
П HW =г(0) + £(Г( j) +Гr (j)). (3.9)
j _1
Главный недостаток ПHW, что она может не удовлетворять одному из основных требований к ГАС-оценкам — быть положительно определенной.
Оценка Ньюэя-Уеста (Newey-West). Эта оценка также как и предыдущая урезает все слагаемые в (3.7), кроме конечного числа. Однако в отличие от нее, приписывает оставшимся членам веса, уменьшающиеся в процессе их удаления отj=0.
p i
n nw =Г(0) +У (1--J— )(Г( j) +Гr (j)). (3.10)
T_i p+1
Оценка Ньюэя-Уеста, в отличие от Хансена-Уайта, положительно определенная. Весовой коэффициент 1- j/(р +1) в (3.10) называется ядром Бартлета (Bartlett kernel).
Для того чтобы быть ГАС-оценками, в обоих случаях требуется, чтобы р монотонно возрастало с ростом п.
Наконец, что касается практического вычисления (3ЭОМм(П-1), то в EViews предусмотрен целый набор ГАС-оценок на все случаи жизни. Для пространственных данных предлагается оценка (3.3). Кроме Ньюэя-Уеста, имеется также оценка с квадратичным спектральным ядром (quadratic spectral — QS) [Hayashi (2000)], имеющая лучшие асимптотические свойства, чем у Ньюэя-Уеста.
4.Тестирование модели
После того, как определили ГАС-оценку П п и нашли (3 ЭОММ(П-1)по формуле (2.6), мы можем протестировать модель. Тестирование вОММ носит асимптотический характер и, следовательно, применимо к выборкам большого размера.
f-отношение (f-ratio). Согласно формулам (2.11) и (2.13),
л/П((3 эомм (П-1) - () N(0,Q( П-1)), (4.1)
где
Q(П-1) = (STwTx n-1Swrx)-1. (4.2)
Проверяется нулевая гипотеза H0, что (j _ 0 (против H1, что (j ф 0), 1 < j < k. f-отношение находится по формуле:
_ Vnj3 ЭОММ,; (П-1) _P ЭОММ,j (П-1) ,..,4
t= VX7 = SEj ' (4-3)
где (3ЭОММ,;(П-1) — j-я компонента (3ЭОММ(П-1), Xи — j-й диагональный элемент матрицы (XrnWnПnWnrXn)-1, которая получается из (4.2) заменой предельных матриц на их оценки,
стандартная ошибка — SEj _
131
No3(7) 2007
Из (4.1) следует, что tj ^^N(0;1)17.
J-статистика Хансена. Рассмотрим экстремальное (минимальное) значение квадратичной формы (2.5), соответствующее (3ЭОмм(iП1):
J(i-1) = (Yn -(3эомм)Ж&Ж(Yn -(3эомм), (4.4)
где мы для краткости обозначили (3эомм(i-1) через (3эомм. Второй фундаментальный результат, полученный Хансеном [Hansen (1982)] утверждает, что
п J i п1) ^^х 2( r - k) (4.5)
при r >k18. При значениях п- J(i-1), превышающих критическое значение (при заданном уровне значимости) %2-статистики, условие ортогональности (1.8) (экзогенности, предопределенности) инструментов w (1),...,w(r) к случайным членам отвергается. Тут нужно заметить, что причиной больших значений %2-статистики могут быть неправильная спецификация модели, а также невыполнение условий, которые нам потребовались при нахождении i;
Пример 3 [Dahlberg, Johansson(2000)]. Этот пример также приведен в книге Грина [Greene (2003)]. В работе исследовались статьи расходов нескольких сот шведских муниципалитетов за период 1979-1987 гг. В качестве объясняющих рассматривались лагированные переменные: расходы (S — spending), доходы (R — revenues) и гранты (G — grants), а также фиктивные переменные по годам. Отдельные модели строились в зависимости от значения максимального лага m (m - 1, 2,3). При m - 3 общее количество объясняющих переменных равнялось 14. Уравнение модели выглядит следующим образом:
m m m
AS,, = Xf +£ß, AS,,AR„AG,,+ u„, (4.6)
j =i i=i i=i
где A — оператор взятия разности, uit — случайная ошибка, соответствующая ,-му муниципалитету, i - 1, 2,..., 265, и t-му году (t - 1983,...,1987).
В качестве инструментальных переменных использовалось дополнительно 16 переменных. Инструментальные переменные строились как значения расходов за определенный год. Причем, если данный год участвовал в наблюдении, то эта инструментальная перемен-g ная принималась равной 0. Авторы оценили коэффициенты для каждой из переменной, | стандартные ошибки и t-отношения. Приведем часть данных в табл. 1. | Значение %2-статистики с 16 степенями свободы, соответствующее 5% уровню значимости — % 2,95 (16) = 26,3. Таким образом, мы видим, что J - 22,83 < 26,3, и модель принимается. S В том числе делается вывод о неэндогенности инструментов. Однако для модели, где в каче-| стве объясняемой переменной рассматривались расходы — R, J - 20,54, что свидетельство-ig вало о неверной спецификации.
17 Ц не является Г-статистикой,таккакмы не предполагаем, что случайная ошибка е нормально распределена.
18 Поэтому этот тест также называется тестом на сверхидентифицируемость. Как легко видеть, при г = к, уравнение моментов (2.4) имеет решение, и, следовательно, ] = 0.
132
Ns3(7) 2007
Оценка параметров модели методом ОММ, lag = 3
Таблица 1 £
I
ас
Переменная ОММ-оценка SE t-ratio
Year 1983 -0,00 0,00 -12,32*
.......... .......... .......... ..........
Year 1987 0,00 0,00 5,87*
S(t - 1) 1,15 0,34 3,36*
S(t - 2) -0,04 0,23 -0,17
S(t - 3) -0,56 0,22 -2,59*
R(t - 1) -1,24 0,36 -3,42*
R(t - 2) 0,08 0,27 0,28
R(t - 3) 0,65 0,27 2,41*
G(t -1) 0,02 0,82 0,02
G(t - 2) 1,55 0,76 2,05*
G(t - 3) 1,79 0,69 2,58*
J = 22,83
Примечание. * — значимость на уровне 5%.
5. Заключение
Со времени опубликования Хансеном своих результатов [Hansen (1982)], обобщенный метод моментов получил большое распространение, в основном в теоретической, но также и в прикладной эконометрике. По своему характеру, ОММ, основанный на асимптотических свойствах оценок, может быть эффективно использован лишь для больших выборок. Преимуществом ОММ является отсутствие привязки к априори заданному (обычно нормальному) распределению ошибок. Также надо отметить большое методологическое значение метода. Практически все известные оценки (мы рассмотрели только часть из них) могут быть получены при его применении. Напоследок заметим, что применение ОММ для нелинейной регрессии основано на принципах, изложенных выше. Детали можно найти у Грина [Greene (2003)].
Список литературы
Айвазян С. А., Иванова С. С. Эконометрика. М.: Маркет ДС, 2007.
Гельфанд И. М. Лекции по линейной алгебре. М.: Добросвет МЦНМО, 1998.
Магнус Я., Нейдеккер ХМатричное дифференциальное исчисление с приложениями к статистике и эконометрике. М.: Физматлит, 2002.
Рао С. Р. Линейные статистические методы и их применения. М.: Наука, 1968.
Эконометрика (под ред. Елисеевой). М.: Финансы и Статистика, 2006.
Dahlberg M, Johansson E. An examination of the dynamic behavior of local governments using GMM bootstrapping methods// Journal of Applied Econometrics. 2000. № 15. P. 401-416.
Davidson R, MacKinnon J. Econometric theory and methods. New York: Oxford University Press, 2004.
Greene W. Econometric analysis. New York: Prentice Hall, 2003.
Hansen L. Large sample properties of generalized method of moment's estimators, Econometrica, 1982. № 50.
Hayashi F. Econometrics. Princeton: Princeton University Press, 2000.
White H, A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroske-dasticity, Econometrica. 1980. № 48. P. 817-838.
133
. ПРИКЛАДНАЯ ЭКОНОМЕТРИКА
No3(7) 2007 '
BANKING Georgy Gambarov
Structural Liquidity as the Indicator of Interest Rate Policy......................................................................3
Anna Chizhova
Econometric Estimation of Credit Rating Transition Matrices...................................................................11
FINANCIAL MARKETS Sergey Titov
An Adaptive System of Decision Making for Financial Markets.................................................................27
Eugene Shchetinin, Kirill Nazarenko
On Mathematical Models of Extreme Values Probabilities Mixtures.............................................................44
MACROECONOMICS Vladimir Kolemajev
On Consequences of Investing into Production of the Additional Income Generated by World Prices Growths on Raw Materials
and Energy Resources....................................................................................................53
SOCIETY
Sergey Arzhenovskiy, Darya Artamonova
Econometric Estimation of the Wage Penalty for the Motherhood..............................................................66
Karolina Ketova
A Mathematical Economic Model of the Manpower Resource Potential and Cost Characteristics of Demographic Losses................80
Ovsey Shkaratan, Gordey Yastrebov
Discovering Real (Homogenous) Social Groups in the Russian Society: Methods and Results........................................95
CONSULTATION Lev Slutskin
The Generalized Method of Moments.....................................................................................119
134
№3(7) 2007
Georgy Gambarov
Structural Liquidity as the Indicator of Interest Rate Policy
The article reviews basic principles and directions of the interest rate policy of the Bank of Russia in the second half of 2006. It presents some developments in bank liquidity indicators and by using a simple statistical model provides an explanation of introduction of new bank liquidity indicators in Russia.
Anna Chizhova
Econometric Estimation of Credit Rating Transition Matrices
The article presents an econometric approach to estimation of credit transition matrices by using a number of explanatory variables such as geographic region, industry, business cycle, state, and borrower's credit history. The hurdle ordered probit model is in the core of the proposed method. The hurdle specification of a model allows to perform an estimation procedure in two steps with default probabilities characterizing an objectively observed default event estimated in the first step followed by estimation of transition probabilities describing transitions of borrowers'credit ratings subjectively assigned by credit managers. A data source is a unified database containing detailed information about the borrowers in the credit portfolio of a large German banking alliance.
Sergey Titov
An Adaptive System of Decision Making for Financial Markets
In the article an adaptive model of decision-making for financial markets based on the method of weighted indicators is considered. The model is built on signals from several standard mechanical trade systems (MTS) by generalizing and redistributing between them weight coefficients that change according to the effectiveness of the MTS. Calculations are performed by making use of price dynamic data from the international currency market FOREX.
Eugene Shchetinin, Kirill Nazarenko
On Mathematical Models of Extreme Values Probabilities Mixtures
A new mathematical model of extreme values probability mixture is proposed in the paper. Effective computational algorithms for modeling probability mixture and value at risk (VaR) capital estimation are developed and rigorously proved. Comparative analysis of VaR-estimation with threshold and mixture models based on the Dow Jones historical data (01.01.1950 - 10.08.2005) has shown a high effectiveness of the last one for risk capital estimation of an issuing company.
Vladimir Kolemajev
On Consequences of Investing into Production of the Additional Income Generated by World Prices Growths on Raw Materials and Energy Resources
The work, based on a mathematical model, shows that investment of the additional income into production under reasonable state control, accompanied by moderate inflationary pressure on the consumer market, effects optimal economic growth. The inflationary pressure can to a considerable extent be eliminated by government measures.
Sergey Arzhenovskiy, Darya Artamonova
Econometric Estimation of the Wage Penalty for the Motherhood
In the paper we estimate the size of wage penalty for the motherhood by using the data of three rounds of the Russian Longitudinal Monitoring Survey. We have found the wage differentials between mothers and non-mothers are on the average about 8,1%. The differentials in socio-demographic, occupational and skill patterns of working women with and without children are considered.
Karolina Ketova
A Mathematical Economic Model of the Manpower Resource Potential and Cost Characteristics of Demogra-
A mathematical economic model of measuring a worker's potential and cost-of-living is proposed. Two aspects of the problem of untimely loss ofan average statistical demographic elementare considered: loss of profitforthe regional
phic Losses
135
# Abstracts
No3(7) 2007
business system as a whole and the lost value for the family. An attempt is made to estimate the real age density distribution of demographic elements to take a more precise account of the age factor and the demographic dynamics as a solution to the problem. Calculations of cost characteristics of the demographic losses are carried out for the Udmurt republic.
Ovsey Shkaratan, Gordey Yastrebov
Discovering Real (Homogenous) Social Groups in the Russian Society: Methods and Results
The article focuses on the problem of identifying real social groups in the contemporary Russian society. The data from all-Russian monitoring surveys are used to compare two social structure models obtained by alternative methods. One ofthe models is similarto that ofthe European sociological tradition based on a socio-professional classification.The other one has been obtained by applying the cluster analysis after having ranked the stratification criteria derived from the entropy analysis.
LevSlutskin
The Generalized Method of Moments
We continue presenting recent achievements in econometrics not yet widely known to a Russian reader.
The generalized method of moments (GMM) was introduced to econometrical research by L. Hansen in his seminal paper in 1982. The GMM is a result of unifying two main approaches to estimating model parameters — method of moments (MM) and generalized least squares (GLS). In the paper it is shown how to use the GMM in the case of a linear regression model.
136