Научная статья на тему 'АЛГОРИТМ ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННЫХ ПАНЕЛЬНЫХ ДАННЫХ'

АЛГОРИТМ ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННЫХ ПАНЕЛЬНЫХ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
548
221
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ПРОСТРАНСТВЕННАЯ ЭКОНОМЕТРИКА / ПРОСТРАНСТВЕННЫЕ ПАНЕЛЬНЫЕ ДАННЫЕ / КРОСС-СЕКЦИОННЫЕ ДАННЫЕ / СОПУТСТВУЮЩИЕ ЭФФЕКТЫ / ECONOMETRIC MODELLING / SPATIAL ECONOMETRICS / SPATIAL PANEL DATA / CROSS-SECTIONAL DATA / SPILLOVER EFFECTS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Схведиани А.Е.

В статье рассматриваются особенности использования пространственных панельных данных. В частности, отмечаются их преимущества перед кросс-секционными, временными, панельными и пространственными данными. Определено, что пространственные панельные данные могут содержать информацию по трём измерениям: временному, пространственному и групповому, и что её необходимо использовать при эконометрическом моделировании. Предлагаемый алгоритм разделен на 7 этапов. В рамках первого этапа проводится систематизация теоретического материала, формулирование гипотез и предварительное обоснование спецификации модели. На втором этапе проводится сбор и подготовка данных к анализу. На третьем этапе проводится анализ описательной статистики и уточняется спецификация модели. На четвертом этапе проводится построение моделей сквозной регрессии, на которую накладываются наибольшие ограничения. На пятом этапе проводится построение моделей панельных данных, в которых данные объединены по группам. На шестом этапе проводится построение моделей пространственных панельных данных, учитывающих пространственное расположение объектов исследования друг относительно друга. Поэтапное построение различных моделей позволяет на седьмом этапе сравнить их между собой и определять стабильность полученных оценок. Полученные оценки параметров моделей могут значительно варьироваться в зависимости от накладываемых на модель ограничений. Так, значимые оценки параметров модели сквозной регрессии могут перестать быть таковыми при построении моделей панельных данных и пространственных панельных данных. На заключительном этапе необходимо проинтерпретировать полученные результаты и сделать выводы о наличии или отсутствии прямых и косвенных сопутствующих эффектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM OF SPATIAL PANEL DATA ECONOMETRIC MODELLING

Paper presents some peculiarities of spatial panel data modelling. In particular, the author discusses their benefits comparing to the cross-sectional, time - serial, panel and spatial data. The paper highlights that spatial panel data contains information on three dimensions: spatial, temporal and panel. This information should be used in econometric analysis in order to stick with the main assumptions of classical linear regression model. The developed algorithm contains seven stages. At the first stage theoretical material is collected and systemized. This material provides background for hypothesis development and preliminary formalization of the model. At the second stage data should be collected and prepared for the analysis. At third stage analysis of the descriptive statistics should be conducted. At fourth stage researcher should model pooled regression, which has the highest restrictions. Next, panel data regression should be estimated. After that, spatial panel data regression. The last one includes panel, temporal and spatial dimensions. Step by step modelling allows to compare models at the last stage and assess the stability of the obtained estimates. These estimates can vary significantly depending on the differences in model restrictions. Therefore, significant estimates obtained for the pooled regression models can become insignificant in models with lower restrictions. At the last stage researcher should interpret results of the econometric modeling and make conclusions about existing direct and indirect spillover effects.

Текст научной работы на тему «АЛГОРИТМ ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ ПРОСТРАНСТВЕННЫХ ПАНЕЛЬНЫХ ДАННЫХ»

Алгоритм эконометрического моделирования пространственных панельных данных

Схведиани Анги Ерастиевич

ассистент Высшей инженерно-экономической школы Санкт-Петербургского политехнического университета Петра Великого, shvediani_ae@spbstu.ru

В статье рассматриваются особенности использования пространственных панельных данных. В частности, отмечаются их преимущества перед кросс-секционными, временными, панельными и пространственными данными. Определено, что пространственные панельные данные могут содержать информацию по трём измерениям: временному, пространственному и групповому, и что её необходимо использовать при экономет-рическом моделировании. Предлагаемый алгоритм разделен на 7 этапов. В рамках первого этапа проводится систематизация теоретического материала, формулирование гипотез и предварительное обоснование спецификации модели. На втором этапе проводится сбор и подготовка данных к анализу. На третьем этапе проводится анализ описательной статистики и уточняется спецификация модели. На четвертом этапе проводится построение моделей сквозной регрессии, на которую накладываются наибольшие ограничения. На пятом этапе проводится построение моделей панельных данных, в которых данные объединены по группам. На шестом этапе проводится построение моделей пространственных панельных данных, учитывающих пространственное расположение объектов исследования друг относительно друга. Поэтапное построение различных моделей позволяет на седьмом этапе сравнить их между собой и определять стабильность полученных оценок. Полученные оценки параметров моделей могут значительно варьироваться в зависимости от накладываемых на модель ограничений. Так, значимые оценки параметров модели сквозной регрессии могут перестать быть таковыми при построении моделей панельных данных и пространственных панельных данных. На заключительном этапе необходимо проинтерпретировать полученные результаты и сделать выводы о наличии или отсутствии прямых и косвенных сопутствующих эффектов. Ключевые слова: эконометрическое моделирование, пространственная эконометрика, пространственные панельные данные, кросс-секционные данные, сопутствующие эффекты.

Введение

Применение эконометрических методов является популярным методом исследования [1.2]. Кроме того, в последнее время обретает всё большую популярность применение методов пространственной эконометрики для исследования различных социально - экономических процессов [3.4]. Таким образом, целью исследования является разработка алгоритма проведения эконометрического анализа пространственных панельных данных.

1. Структурные особенности пространственных панельных данных

Данные имеют различные характеристики, которые определяют их структуру. В зависимости от структуры данных применяются различные методы анализа и строятся различные эконометрические модели. В этой связи необходимо определить отличительные характеристики пространственных панельных данных с целью подбора в дальнейшем релевантных методов анализа и оценки параметров регрессионных уравнений. При проведении эконометрического анализа выделяют несколько основных типов данных в зависимости от их структуры, а именно:

кросс-секционные данные (cross - sectional data); временные ряды (time series data); панельные данные (panel data); пространственные данные (spatial data); пространственные панельные данные (spatial panel data).

Пространственные панельные данные (географические панельные данные, панельные геоданные) — данные, содержащие временные ряды показателей пространственных объектов и их наборов (см. табл. 1). Пространственные данные совмещают в себе всем преимущества пространственных данных и панельных данных. В частности, благодаря включению временного измерения, повышается информативность моделей, а влияние мультиколлинеарности на оценки параметров регрессии снижается [5].

X X

о

го А с.

Таблица 1

Показатели

объекта

исследования Наблюдения •Zgt

X_coord4 Y_coord4 g t

X_coord-L Y_coordx 1 1 ¿1,1

X_coord-L Y_coordx 1 2 ■^1,2 ¿1,2

X_coord2 Y_coord2 2 1 •^2,1 *2,1 ¿2,1

X_coord2 Y_coord2 2 2 ■^2,2 ^2,2 ¿2,2

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-310-90069.

Составлено автором

Также, необходимо обратить внимание, что для целей анализа данные представлены в длинном формате, а не в широком. Отличие длинного формата от широкого

X

го m

о

ю

2 О

м о

о см

0 см

СП

01

о ш т

X

<

т о х

X

заключается в том, что временное измерение представлено в виде самостоятельной переменной, а не является частью других переменных моделей.

Таблица 2 показывает, какие аспекты учитываются в каких типах данных. Так, кросс-секционные данные содержат, как правило, информацию о множестве объектов в определенный момент времени, а временные ряды о сравнительно небольшом количестве объектов, но за большой период времени. Основное преимущество панельных данных заключается в том, что они содержат информацию о множестве объектов за несколько периодов времени. Пространственные панельные данные в дополнение к выше перечисленным преимуществам позволяют учитывать расположение исследуемых объектов друг относительно друга [5.6].

Таблица 2

Сравнительная характеристика различных типов данных

""""-Характеристика Тип данных^\_ Много объектов Изменение во времени Учёт пространственного расположения

Кросс-секционные данные + - -

Временные ряды - + -

Панельные данные + + -

Пространственные данные + - +

Пространственные панельные данные + + +

тренд или направленность взаимосвязи, однако, применительно к каждой отдельной панели, она не учитывает смещение постоянной составляющей регрессионного уравнения. То есть предполагается, что константа модели постоянна, хотя, как мы видим на примере ниже, это не соответствует действительности.

Составлено автором

Таким образом, если систематизировать отличия основных типов данных, используемых в регрессионном анализе, то можно заключить, что пространственные панельные являются более предпочтительными, так как содержат информацию не только о расположении объектов друг относительно друга, но и информацию об изменении показателей во времени, что позволяет оценивать прямые и косвенные сопутствующие эффекты.

2. Учёт временного, группового и пространственного измерения в эконометрическом моделировании

Различные типы моделей могут быть использованы для различных типов данных. Так, наиболее ограниченной является модель сквозной регрессии, так как она не учитывает ни пространственную структуру данных, ни связанность наблюдений, относящихся к одной панели, между собой, ни временное измерение данных. При этом, модели пространственных панельных данных позволяют учитывать эти аспекты и оценивать не только прямые эффекты влияния одних показателей на другие, но и косвенные эффекты, показывающие влияние показателей соседних объектов на исследуемый [5,7].

Модель сквозной (общей) регрессии является теоретической в виду накладываемых на неё ограничений. В частности, основным ограничением данного типа регрессионных моделей является предположение о постоянстве параметров модели (см. Рисунок 1.).

Так, сквозная регрессия не учитывает изменчивость при переходе от одного наблюдения одного и того же объекта исследования к другому наблюдению (изменчивость внутри панели) и не учитывает изменчивость наблюдений при переходе от одной панели к другой (изменчивость между панелями). Так, если говорить, к примеру, об отличиях панелей друг относительно друга, то можно заметить, что линия регрессии обозначает общий

Рисунок 1. Схематическое представление пространственных панельных данных

Рисунок 2 - Схематическое представление панельных данных. Составлено автором

Рисунок 2 демонстрирует три различных паттерна пространственной корреляции: наличие сильной положительной автокорреляции, сильной отрицательной автокорреляции и её отсутствие, то есть случайное расположение объектов друг относительно друга. Если пространственная корреляция между показателями объектов исследования существует, то не включение в модель информации о пространственном расположении объектов может приводить к нарушению предпосылки классической линейной регрессии о сферичности случайных шоков и экзогенности независимых переменных. То есть может наблюдаться пространственная автокорреляция ошибок и корреляция ошибок с объясняющими переменными [8].

Таким образом, учёт пространственного, временного и группового измерений является необходимым в ходе эконометрического моделирования.

3. Алгоритм эконометрического моделирования пространственных панельных данных

Алгоритм эконометрического моделирования базируется на проведении проверок основных предпосылок классической линейной регрессии [9-11]:

А1: Линейность по параметрам (правильная спецификация)

А2: Полный ранг (отсутствие строгой мультиколли-неарности)

А3: Экзогенность независимость переменных

А4: Сферические шоки

А5: Нормальность распределения случайных шоков

На первом этапе проведения анализа необходимо определить спецификацию регрессионной модели. Для этого необходимо формализовать гипотезы и на основании этого определить спецификацию эконометрических моделей. Основная методическая проблема, возникающая на этом этапе, состоит в определении прокси переменных, которые отражают проверяемые теоретические положения. Данные переменные должны исходить из теории, а экзогенные переменные на должны являться линейной комбинацией друг друга (предпосылка А2 (строгая мультиколлинеарность)).

На втором этапе необходимо провести сбор данных, их подготовку и объединение. Основной проблемой на данном этапе является сопоставление и объединение данных из разных ресурсов и за разные временные промежутки. Это связано с тем, что, во - первых, когда анализируются пространственные панельные данные, необходимо, чтобы не было пропущенных значений переменных в наборе данных. То есть панели должны быть сбалансированными. В противном случае оценить параметры моделей, включающих пространственные эффекты, будет невозможно.

Этап предварительного анализа данных начинается с анализа описательной статистики с целью определения основных характеристик распределения интересуемых нас переменных. Как правило, на данном этапе проводится анализ средних значений переменных, минимальных и максимальных значений, медианы, дисперсии и стандартного отклонения, распределения анализируемых переменных, эксцесса и асимметрии. Оценка основных характеристик распределения анализируемых переменных позволяет получить предварительные результаты, описывающие основные закономерности переменных. В случае с анализом пространственных данных, также, проводится анализ пространственной автокорреляции с помощью глобального и локального индексов Морана.

На этапах 4 - 6 проводится построение моделей сквозной регрессии, панельных данных и пространственных панельных данных. Построение всех типов моделей необходимо для проверки стабильности оценок их параметров при различных ограничениях. В ходе построения различных типов моделей необходимо, также, проводить проверки на основные предположения классической линейной модели регрессии.

Рисунок 3 - Общая методика проведения эконометрического анализа пространственных панельных данных. Составлено автором

Отдельно необходимо отметить, что существует восемь основных видов пространственных моделей [4,5,12]. Наиболее общей моделью является общая вложенная пространственная модель (General nesting spatial model, GNS) [13]. Уравнение модели GNS представлено ниже:

Y = SWY + aiN + Xp + WXe + u u=AWu+£

где WY - эндогенные эффекты взаимодействия между зависимыми переменными, WX - экзогенные эффекты взаимодействия между независимыми переменными, Wu - эффекты взаимодействия между возмущающими членами различных элементов, W - матрица пространственных весов [4,5].

X X

о

го А с.

X

го m

о

ю

2 О M

о

о

CS

0

CS

СП

01

о ш m

X

<

m о x

X

Таким образом, накладывая ограничения на параметры модели GNS, можно получить любую другую из указанных моделей, включая базовую МНК модель, в случае, если гипотезы относительно наличия пространственных связей в моделях не подтвердились (см. табл. 3).

Таблица 3

Сравнительная характеристика пространственных моделей

Пространственные лаги Пространственная модель Пространственный лаг объясняемой переменной (WF) Пространственный лаг объясняющей переменной (WX) Пространственный лаг ошибки (№и)

Общая вложенная пространственная модель (General nesting spatial model, GNS) + + +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пространственная авторегрессионная комбинированная модель (Spatial autoregressive combined model, SAC) + - +

Пространственная модель Дарбина (spatial Durbin model, SDM) + + -

Пространственная модель ошибки Дарбина (spatial Durbin error model SDEM) - + +

Модель пространственной автокорреляции (spatial autoregressive model, SAR; Spatial Lag Model, SLM) + - -

Модель пространственной ошибки (Spatial Error Model, SEM) - - +

Модель пространственного лага объясняющей переменной (spatial lag of X model, SLX) - + -

Модель сквозной регрессии - - -

Составлено автором по [5-7,14,15]

Наиболее популярными моделями для анализа являются модели SAR и SEM, а также модель SAC, которая сочетает в себе эндогенные эффекты взаимодействия и эффекты взаимодействия остаточных членов, поскольку оценка этих моделей сопровождается решением эконометрических задач [5].

На этапе 7 необходимо провести сравнение полученных моделей, сделать выводы, соотнести полученные результаты с существующей теорией.

Заключение

Таким образом, автором была представлен алгоритм эконометрического анализа для случая пространственных панельных данных. В качестве отличительных

особенностей алгоритма можно выделить: наличие этапов проверки моделей на соответствие основным предпосылкам классической линейной регрессии, построение не только регрессионных моделей пространственных панельных данных, но и других моделей, с целью осуществления проверки стабильности полученных результатов оценки при различных ограничениях.

Литература

1. Rudskaya I., Rodionov D. Econometric modelling as a tool for evaluating the performance of regional innovation systems (with regions of the Russian Federation as the example // Acad. Strateg. Manag. J. 2017. Т. 16.

2. Schepinin V., Skhvediani A., Kudryavtseva T. An empirical study of the production technology cluster and regional economic growth in Russia // Proceedings of the European Conference on Innovation and Entrepreneurship, ECIE. 2018. Т. 2018-Septe. С. 732-740.

3. Гичиев Н.С. Региональная конвергенция экономического роста: пространственная эконометрика // Региональная экономика теория и практика. ФИНАНСЫ и КРЕДИТ, 2018. Т. 16, № 1 (448).

4. Гафарова Е.А. Эмпирические модели регионального экономического роста с пространственными эффектами: результаты сравнительного анализа // Вестник Пермского университета. Серия: Экономика. 2017. Т. 12, № 4.

5. Elhorst J.P. и др. Spatial Econometrics From Cross-Sectional Data to Spatial Panels // Springer briefs in regional science. Springer, 2014. Т. 16. 436-457 с.

6. Anselin L., Le Gallo J., Jayet H. Spatial econometrics and panel data models // by L. Matyas, P. Sevestre. Kluwer, Dordr. 2006.

7. Anselin L., Le Gallo J., Jayet H. Spatial panel econometrics // The econometrics of panel data. Springer, 2008. С. 625-660.

8. Павлов Ю.В., Королева Е.Н. Пространственные взаимодействия: оценка на основе глобального и локального индексов Морана // Пространственная экономика. 2014. № 3.

9. Схведиани А.Е. Основные предпосылки классической линейной регрессии и последствия их нарушений // Инновации и инвестиции. 2020. № 8. С. 38-42.

10. Кеннеди П. Путеводитель по эконометрике. Книга 1. Москва: Дело, 2016. 518 с.

11. Картаев Ф., Лукаш Е. Эконометрика. Учебное пособие. Litres, 2017.

12. Жукова А.К., Силаев А.М., Силаева М.В. Анализ ожидаемой продолжительности жизни с учетом пространственной зависимости по регионам России // Пространственная экономика. 2016. № 4-5.

13. Hassan A.R. The interplay between the Bayesian and frequentist approaches: a general nesting spatial panel data model // Spat. Econ. Anal. Routledge, 2017. Т. 12, № 1. С. 92-112.

14. Балаш О.С. Эконометрическое моделирование пространственных взаимодействий // Известия Саратовского университета. Новая серия. Серия Экономика. Управление. Право. 2012. Т. 12, № 3.

15. Тимирьянова В.М., Зимин А.Ф., Жилина Е.В. Пространственная составляющая в изменении розничного рынка товаров // Экономика региона. 2018. Т. 14, № 1.

Algorithm of spatial panel data econometric modelling Skhvediani A.E.

Peter the Great Saint - Petersburg Polytechnic University

Paper presents some peculiarities of spatial panel data modelling. In particular, the author discusses their benefits comparing to the cross-sectional, time - serial, panel and spatial data. The paper highlights that spatial panel data contains information on three dimensions: spatial, temporal and panel. This information should be used in econometric analysis in order to stick with the main assumptions of classical linear regression model. The developed algorithm contains seven stages. At the first stage theoretical material is collected and systemized. This material provides background for hypothesis development and preliminary formalization of the model. At the second stage data should be collected and prepared for the analysis. At third stage analysis of the descriptive statistics should be conducted. At fourth stage researcher should model pooled regression, which has the highest restrictions. Next, panel data regression should be estimated. After that, spatial panel data regression. The last one includes panel, temporal and spatial dimensions. Step by step modelling allows to compare models at the last stage and assess the stability of the obtained estimates. These estimates can vary significantly depending on the differences in model restrictions. Therefore, significant estimates obtained for the pooled regression models can become insignificant in models with lower restrictions. At the last stage researcher should interpret results of the econometric modeling and make conclusions about existing direct and indirect spillover effects.

Keywords: econometric modelling, spatial econometrics, spatial panel data, cross-sectional data, spillover effects.

References

1. Rudskaya I., Rodionov D. Econometric modeling as a tool for

evaluating the performance of regional innovation systems (with regions of the Russian Federation as the example // Acad. Strateg. Manag. J. 2017. Vol. 16.

2. Schepinin V., Skhvediani A., Kudryavtseva T. An empirical study

of the production technology cluster and regional economic growth in Russia // Proceedings of the European Conference on Innovation and Entrepreneurship, ECIE. 2018.T. 2018-Septe. S. 732-740.

3. Gichiev N.S. Regional convergence of economic growth: spatial

econometrics // Regional economics theory and practice. Limited Liability Company "Publishing House FINANCE and CREDIT", 2018. V. 16, No. 1 (448).

4. Gafarova E.A. Empirical models of regional economic growth with

spatial effects: results of a comparative analysis // Bulletin of the Perm University. Series: Economics. 2017.Vol. 12, No. 4.

5. Elhorst J.P. et al. Spatial Econometrics From Cross-Sectional

Data to Spatial Panels // Springer briefs in regional science. Springer, 2014. T. 16. 436-457 p.

6. Anselin L., Le Gallo J., Jayet H. Spatial econometrics and panel

data models // by L. Matyas, P. Sevestre. Kluwer, Dordr. 2006.

7. Anselin L., Le Gallo J., Jayet H. Spatial panel econometrics // The

econometrics of panel data. Springer, 2008, pp. 625-660.

8. Pavlov Yu.V., Koroleva E.N. Spatial interactions: assessment

based on the global and local Moran's indices // Spatial Economics. 2014. No. 3.

9. Skhvediani A.E. Basic premises of classical linear regression and

consequences of their violations // Innovations and investments. 2020. No. 8. P. 38-42.

10. Kennedy P. A Guide to Econometrics. Book 1. Moscow: Delo, 2016.518 p.

11. Kartaev F., Lukash E. Econometrics. Tutorial. Litres, 2017.

12. Zhukova A.K., Silaev A.M., Silaeva M.V. Analysis of life expectancy taking into account spatial dependence in the regions of Russia // Spatial Economics. 2016. No. 4-5.

13. Hassan A.R. The interplay between the Bayesian and frequentist approaches: a general nesting spatial panel data model // Spat. Econ. Anal. Routledge, 2017. T. 12, No. 1. P. 92112.

14. Balash O.S. Econometric modeling of spatial interactions // Izvestia of the Saratov University. New series. Series Economics. Control. Right. 2012.Vol. 12, No. 3.

15. Timiryanova V.M., Zimin A.F., Zhilina E.V. Spatial component in the change in the retail market of goods // Economy of the region. 2018.Vol. 14, No. 1.

X X

o 00 A c.

X

00 m

o

ho o ho o

i Надоели баннеры? Вы всегда можете отключить рекламу.