ЭКОНОМИКА И УПРАВЛЕНИЕ НАРОДНЫМ ХОЗЯЙСТВОМ
УДК 330.43
ПРОЦЕДУРА ОЦЕНИВАНИЯ ПАРАМЕТРОВ МОДЕЛЕЙ ЭКОНОМИЧЕСКИХ СИСТЕМ
Амридон Гемзаевич Барлиани
Сибирский государственный университет геосистем и технологий, 630108, Россия, г. Новосибирск, ул. Плахотного, 10, кандидат технических наук, доцент кафедры прикладной информатики и информационных систем, тел. (983)319-99-31
Ираида Яковлевна Барлиани
Сибирский государственный университет геосистем и технологий, 630108, Россия, г. Новосибирск, ул. Плахотного, 10, кандидат технических наук, доцент кафедры управления и предпринимательства, тел. (983)319-99-31
В статье предлагается новый подход к процедуре оценивания параметров эконометрических моделей, основанный на матричной лемме Шермана - Моррисона - Вудберий. Предлагаемая методика оценки параметров эконометрических моделей имеет преимущества перед другими методами в том, что представляется возможность последовательно присоединять к уже подобранной модели как дополнительные экономические объекты, так и дополнительные факторы-признаки. На демонстративном примере показана методика построения оценок параметров эконометрической модели предлагаемой методики. На основании предложенного алгоритма оценивания предоставляется возможность отбора оптимальных факторов-признаков без дополнительных вычислительных процедур.
Ключевые слова: гребневая регрессия, объясняющие переменные, плохо обусловленная матрица, признаки-факторы, рекуррентный алгоритм, ридж-регрессии, эконометрическая модель, метод наименьших квадратов.
PROCEDURE FOR ESTIMATING ECONOMIC SYSTEMS MODELS PARAMETERS
Amridon G. Barliani
Siberian State University of Geosystems and Technologies, 630108, Russia, Novosibirsk, 10 Plakhotnogo St., Ph. D., senior lecturer, Department of Applied Informatics and Information Systems, tel. (983)319-99-31
Iraida Ya. Barliani
Siberian State University of Geosystems and Technologies, 630108, Russia, Novosibirsk, 10 Plakhotnogo St., Ph. D., Assoc. Prof., Department of Management and Entrepreneurship, tel. (983)319-99-31
140
Экономика и управление народным хозяйством
A new approach to the procedure for estimating econometric models parameters is offered. It is based on Sherman - Morrison - Woodbury matrix lemma. The offered technique for estimating econometric models parameters has an advantage over others because both additional economic entities and additional factors-signs may be sequentially joined to the previously selected model. The demonstration example presented here shows the technique for building econometric models parameters estimates (for offered technique). The estimation algorithm is to be used as a basis for choosing optimal factors-signs, with additional computational procedures being unnecessary.
Key words: ridge regression, explanatory variable, ill-conditioned matrix, signs-factors, recurrent algorithm, ridge-regression, econometric model, least square method.
Современный период социально-экономического развития страны характеризуется особым спросом на инновационные разработки наиболее передовых отраслей экономики и обеспечивающей их инфраструктуры. Особое значение здесь приобретает информационное обеспечение развития таких отраслей, а также картографо-геодезическое и земельно-кадастровое сопровождение, осуществляющее формирование единого геоинформационного пространства, включающего, в том числе, сформированные и обеспеченные необходимой атрибутикой объекты недвижимой собственности - важнейшие элементы рынка недвижимости и современной экономики. Различные аспекты формирования указанного геопространства отражены в целом ряде содержательных работ как отечественных, так и зарубежных специалистов [1-7].
Важной частью указанного геопространства являются модели экономических объектов и систем, оптимальное построение которых - центральная проблема любого эконометрического исследования, поскольку ее «качество» определяет достоверность и обоснованность результатов анализа и прогноза тенденций развития рассматриваемых социально-экономических процессов.
Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной зависимой переменной Y от нескольких объясняющих переменных X X .., X . Эта задача решается с помощью множественного регрессионного анализа [5, 6, 7, 8, 9, 10, 13, 14].
Обычно модель линейной множественной регрессии с к переменными и n индивидуумами записывается в виде
V i = 1, n,
Y = а1 • X + X.2 -а .., + ак • Xк +Si,
i 1 i1 i 2 2 к ik 1
где M(s. ) = 0, cov(s s ) = ст, 0 a ct а да, V j, или вматричной форме:
i i J
Y = X a + s;
M (s) = 0, K = M (sst ) = ст I;
141
Вестник СГУГиТ, вып. 1 (29), 2015
X = (XTX )-1 XTY = B-1XTY,
где Y - (n, 1)- вектор столбец, X - (n, k) - матрица; a-( k, 1) -вектор-столбец; a - (k, 1) - вектор-столбец случайных ошибок; I - (n, n) - единичная матрица.
В процессе оценивания параметров эконометрической модели возможны три ситуации:
- матрица XTX некоторого класса необратима, поскольку число индивидуумов меньше числа объясняющих переменных;
- матрица XTX плохо обусловлена, что может быть, когда число индивидуумов незначительно больше числа объясняющих переменных;
- матрица XTX хорошо обусловлена и параметры можно оценить по классическому методу наименьших квадратов.
Чтобы получить решение в первом случае, пользуются методом псевдонормальной оптимизации [8, 9]. Для получения оценок во втором случае применяют метод «ридж-регрессии» (или «гребневой регрессии») [9, 10].
Метод наименьших квадратов дает оценку [5, 11, 12]
X = (XTX )-1 XTY = B ~lXTY = B ~lb. (1)
Приведем рекуррентный алгоритм вычисления обратной матрицы B. Хорошо известно, что любую матрицу можно расщеплять в виде суммы нескольких матриц. В частности, исходную матрицу нормальных уравнений B можно записать в виде суммы двух матриц, то есть:
B = B0 + С. (2)
Здесь B0 - диагональная матрица, состоящая из элементов B , а матрица С имеет вид:
' 0 B 12 B 13 .. B > 1k
B 21 0 B 23 •• B 2k
С = B 31 B 32 0 • •• B 3k . (3)
B V k1 B k2 B k3 •• 0 у
Теперь матрицу (3) можно выразить через столбцы, то есть:
С = (С1
С,
С,
ck).
(4)
142
Экономика и управление народным хозяйством
В матричном представлении (4), например первый столбец можно записать следующим образом:
0 ] ( b Л 12
B21 0
C1— B31 ; C2 — B32
v Bt 1 / b v k 2 J
и т. д.
Тогда с учетом введенных обозначений матричное разложение (3) можно представить в форме матричного ряда:
B — Bo + Ciei + C2e2 + "■ + Ckek-
(5)
где e . - единичный вектор-строка, который имеет всюду нули и единицу на позиции j.
Например, для j - 1 единичный вектор имеет вид: e — (1 0 0 — 0).
Теперь необходимо рассмотреть частный случай, когда исходная невырожденная матрица нормальных уравнений разложена в ряд из двух составляющих, то есть:
B — B0 + Ce.
(6)
При этом невырожденная матрица B может быть диагональной, то есть:
( b 0 0 — 0 "I
11 0 B 0 — 0
B — 0 22 0 B — 0
0 33
0 0 0 — B
v kk J
(7)
В условиях разложения (6) на основании леммы Шермана - Моррисона -Вудберий можно доказать теорему [9, 11, 12].
Теорема. В условиях разложения исходной матрицы в виде (6) обратную матрицу к B можно рассчитать по формуле:
B -1 — B -1 о
B -1 • C • e • B -1
0 _________о_
1 + e • B -1 • C
о
(8)
Для доказательства справедливости теоремы выражение (8) нужно умножить справа или слева на матрицу B0 + Ce:
143
Вестник СГУГиТ, вып. 1 (29), 2015
f л B - lCeB -1 ^ B -1 --0----00 1 + eB- 1C
k + Ce)= Bo 'Bo + B- C -
B - lCeB - 1B + B - lCeB - lCe 0 0 0 0 0
1 + eB - 1C
Так как BQ B - единичная матрица I, a eBQ 1C является скалярной величиной, то можно прийти к тому, что последнее выражение равняется единичной матрице I. Таким образом, теорема доказана.
На основании разложения матрицы в ряд (5) и полученной формулы (8) можно записать эффективный рекуррентный алгоритм обращения матрицы нормальных уравнений, имеющий вид:
B -1
j
=B -1
B -1 CeB -1
j-1 j j j -1
1 + e B -1 C
j j -1 j
(9)
где j - номер итерации. При этом для начала итерационного процесса необходимо иметь начальную обратную матрицу B-1 и она равна:
B -1 0
B -1 11 0 0
0 B-1 22 0
0 0 B -1 33
0
0
0 0 0 ••• B-1
V kk у
Таким образом, после k-кратного обращения к формуле (9), последовательно присоединяя элементы разложения (6), можно получить обратную матрицу нормальных уравнений B-1.
Рассмотрим пример. По приведенным в таблице данным 20 однотипных предприятий провести регрессионный анализ зависимости производительности труда (Y) от фондоотдачи (X!), фондовооруженности труда (X2) и непроизводственных расходов (X3).
На основании этой таблицы составим матрицу нормальных уравнений
B = XTX и вектор-столбец нормальных уравнений b = XTY, которые равны соответственно:
' 20 31,36 123,5 402,78 " ' 158.9 ^
31,36 52,646 186,044 636,5448 • h — 252,927 5
123,5 186,044 844,756 2 510,5549 ; Ь = 1015,329 7
V402,78 636,5448 2 510,5549 8 513,2042 у V 3198,6551 у
144
Экономика и управление народным хозяйством
Таблица
Исходные данные для регрессионного анализа
Номер предпри- ятия Производительность труда (тыс. руб.), Y Фондоотдача (руб./коп.), X Фондово оружен-ность труда (млн. руб./чел.), Х2 Непроизводственные расходы, (млн. руб.), X3
1 9,26 1,45 6,40 17,72
2 9,38 1,30 7,80 18,39
3 12,11 1,37 9,76 26,46
4 10,81 1,65 7,90 22,37
5 9,35 1,91 5,35 28,13
6 9,87 1,68 9,90 17,55
7 8,17 1,94 4,50 21,92
8 9,12 1,89 4,88 19,52
9 5,88 1,94 3,46 23,99
10 6,30 2,06 3,60 21,76
11 6,22 1,96 3,56 25,68
12 5,49 1,02 4,28 18,13
13 6,50 1,85 8,85 25,74
14 6,61 0,88 8,52 21,21
15 4,32 0,62 7,19 22,97
16 7,37 1,09 6,82 16,38
17 7,02 1,60 4,82 13,21
18 8,25 1,53 5,46 14,48
19 8,15 1,40 6,20 13,38
20 8,72 2,22 4,25 13,69
Для того чтобы определить обратную матрицу В в форме (5) и (9), запишем начальную матрицу:
В„
и векторы-столбцы
' 0 ^ 31,36 123,5 ; ч402,78,
' 20 0 0 0 ^
0 52,646 0 0
0 0 844,756 0
V 0 0 0 8 513,204 2,
' 31,36 " ' 123,5 ^
0 ; C = 186,044
186,044 ’ 3 0
ч636,544 8у ч2 510,554 9,
' 402,78 ^ 636,544 8 2 510,554 9 ‘
145
Вестник СГУГиТ, вып. 1 (29), 2015
Введем единичные векторы:
е,=(1 0 0 0), е2 =( 0 1 0 0); е3 =( 0 0 1 0); е4 =( 0 0 0 1).
На первом этапе найдем обратную начальную матрицу B
B
-1
(0,05 0 0
0 0,018 994 795 4 0
0 0 0,001183 773 8
0
0
0
-1.
0
0
0
0
0,000117 464 6
К полученной начальной матрице по формуле (9) присоединим векторстолбец С с учетом единичного вектора е и получим:
B
-1
0.05 0 0 0 ^
-0,029 783 839 2 0,018 994 795 0 0
-0,007 309 8031 0 0,001183 773 8 0
-0,002 365 619 3 0 0 0,000117 464 6,
К этой матрице по алгоритму (9) присоединим вектор-столбец C с учетом
единичного вектора e и получим:
B
-1
2
' 0,757 819157 5 -0,029 783 839 2 -0,007 309 8031 ч-0,002 365 619 3
-0,451415 279 0 0,287 892 397 3 0,002 591439 2 -0,000168 604 2
0
0
0,001183 773 8 0
0
0
,000117 464 6,
Аналогичным образом, присоединив С3 и е3, получим обратную матрицу, которая имеет вид:
B
-1
3
' 2,167117 0341 -0,772 531257 3 -0,146 686 319 4 ч-0,001510193 6
-0,772 531257 3 0,361060 3721 0,033 423 2541 -0,000 303 2791
-0,146 686 319 4 0,033 423 2541 0,015 267 798 7 -0,000 061519 7
0
0
0,000117 464 6,
Наконец аналогичным образом присоединим вектора С , е и окончательно получим:
146
Экономика и управление народным хозяйством
B-1
' 2,606143 81 -0,684 365 31 -0,128 80199 ч-0,034148 01
-0,684 365 31 0,378 765 97 0,037 014 81 -0,006 857 65
-0,128 80199 0,037 01481 0,015 996 34 -0,00139106
-0,03414801 ^ -0,006 857 65 -0,00139106 0,002 656 07 .
По формуле (1) определим оценку вектора a:
a =
r 1,017 26126 ^ 2,701665 72 0,687 453 27 ^-0,077138 74,
Построим оценку модели уравнения регрессии. Для этого воспользуемся формулой [13, 14]:
Y = X ■ a = 1,017 3 + 2,7017х + 0,687 4х2 - 0,0771х
Таким образом, осуществляется оценка параметров регрессии по предложенному алгоритму. Необходимо заметить, что данный алгоритм удобен при пошаговом отборе оптимальных факторов-признаков.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Карпик А. П., Ветошкин Д. Н., Архипенко О. П. Совершенствование модели ведения государственного кадастра недвижимости России // Вестник СГГА. - 2013. - Вып. 3 (23). -С. 53-60.
2. Карпик А. П. Разработка критериев оценки качества кадастровых данных // Изв. вузов. Геодезия и аэрофотосъемка. - 2013. - № 4/С. - С. 133-136.
3. Карпик А. П. Разработка методики качественной и количественной оценки кадастровой информации // Изв. вузов. Геодезия и аэрофотосъемка. - 2013. - № 4/С. - С. 137-142.
4. Жарников В. Б., Щукина В. Н. Обеспечение условий устойчивого землепользования в проектах разработки месторождений на территориях традиционного природопользования // Вестник СГГА. - 2012. - Вып. 1 (17). - С. 72-78.
5. Карпик А. П., Каленицкий А. И., Соловицкий А. Н. Новый этап развития геодезии -переход к изучению деформаций блоков земной коры в районах освоения угольных месторождений // Вестник СГГА. - 2013. - № 3 (23). - С. 3-9.
6. Карпик А. П., Каленицкий А. И., Соловицкий А. Н. Технология изучения изменений во времени деформаций блоков земной коры при освоении месторождений Кузбасса // Вестник СГГА. - 2013. - Вып. 4 (24). - С. 3-11.
7. Обиденко В. И. Технология определения метрических параметров территории Российской Федерации по геопространственным данным // Вестник СГГА. - 2012. - Вып. 3 (19). -С. 3-13.
8. Барлиани А. Г. Псевдорешение и метод наименьших квадратов // ГЕО-Сибирь-2008. IV Междунар. науч. конгр. : сб. материалов в 5 т. (Новосибирск, 22-24 апреля 2008 г.). - Новосибирск: СГГА, 2008. Т. 1, ч. 1. - С. 160-163.
147
Вестник СГУГиТ, вып. 1 (29), 2015
9. Барлиани А. Г., Егорова С. А. Единый рекурсивный алгоритм уравнивания и оценки точности геодезических наблюдений // Интерэкспо ГЕО-Сибирь-2012. VIII Междунар. науч. конгр. : Междунар. науч. конф. «Геодезия, геоинформатика, картография, маркшейдерия» : сб. материалов в 3 т. (Новосибирск, 10-20 апреля 2012 г.). - Новосибирск: СГГА, 2012. Т. 1. -С. 85-89.
10. Барлиани А. Г. Разработка алгоритмов уравнивания и оценки точности свободных и несвободных геодезических сетей на основе пседонормального решения: монография. -Новосибирск: СГГА, 2010. - 135 с.
11. Барлиани А. Г., Барлиани И. Я. Процедура оценивания параметров эконометрической модели методом псевдонормальной оптимизации // Вестник СГГА. - 2014. - Вып. 1 (25). -С.105-113.
12. Барлиани А. Г. Метод Гревилля при уравнивании геодезических сетей // ГЕО-Сибирь-2008. IV Междунар. науч. конгр. : сб. материалов в 5 т. (Новосибирск, 22-24 апреля 2008 г.). - Новосибирск: СГГА, 2008. Т. 1, ч. 1. - С. 271-273.
13. Hoerl, Kennard (1970) Ridge regression, biaised estimation for non orthogonal problems. Technometrics, vol. 12, № 1.
14. Cazes (1975) Protection de la regression par utilization de contraintes lineaires et non lineaires RSA, № 3, vol. 23.
Получено 23.02.2015
© А. Г. Барлиани, И. Я. Барлиани, 2015
148