Научная статья на тему 'VAR-LASSO-модель на большом массиве российских экономических данных'

VAR-LASSO-модель на большом массиве российских экономических данных Текст научной статьи по специальности «Экономика и бизнес»

CC BY
293
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
индексы промышленного производства / ARIMA-модель / VAR-LASSO-модель / прогнозирование / цены на нефть. / indices of industrial production / ARIMA model / VAR model / VAR-LASSO model / forecasting / oil prices.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Н. Д. Фокин

В работе строится большая векторная авторегрессия с L1-регуляризацией (VAR-LASSO-модель) на основе месячных значений российских макропоказателей – для случая, когда число наблюдений меньше числа оцениваемых параметров. Цель работы – продемонстрировать возможность и преимущества использования для прогнозирования российских макропараметров подхода с помощью большого набора регрессоров, что, с теоретической точки зрения, должно улучшить прогнозы относительно моделей меньшей размерности. Прогнозные качества VAR-LASSO-модели оказываются лучше прогнозных качеств рассмотренных бенчмарков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VAR-LASSO Model for the Russian Economy Using a Large Dataset

The article provides a large auto regression with L1-regularization (VAR-LASSO-model) based on monthly values of Russian macro indicators for the case when the number of observations is less than the number of evaluated parameters. The aim of the work is to demonstrate feasibility and the advantage of Russian macro parameters for forecasting with the help of a large set of regressors, which from theoretical point of view should improve forecasts regarding models of lesser dimension. Forecasting properties of VAR-LASSO-model are better than forecasting features of reviewed benchmarks.

Текст научной работы на тему «VAR-LASSO-модель на большом массиве российских экономических данных»

Эконометрическое моделирование

var-lasso-модель на большом массиве российских экономических данных1

Н. Д. ФОКИН

Младший научный сотрудник РАНХиГС при Президенте Российской Федерации (Москва). E-mail: fokinikita@gmail.com

В работе строится большая векторная авторегрессия с L--регуляризацией (VAR-LASSO-модель) на основе месячных значений российских макропоказателей — для случая, когда число наблюдений меньше числа оцениваемых параметров. Цель работы — продемонстрировать возможность и преимущества использования для прогнозирования российских макропараметров подхода с помощью большого набора регрес-соров, что, с теоретической точки зрения, должно улучшить прогнозы относительно моделей меньшей размерности. Прогнозные качества VAR-LASSO-модели оказываются лучше прогнозных качеств рассмотренных бенчмарков.

Ключевые слова: индексы промышленного производства, ARIMA-модель, VAR-LASSO-модель, прогнозирование, цены на нефть.

Введение

С учетом возросших объемов доступной экономической статистики в последние годы значительную актуальность приобретают эконо-метрические модели, позволяющие использовать большое число временных рядов, а также модели, в которых разделение на существенные2 и несущественные переменные производится одновременно с оценкой параметров модели. В таком случае хорошим инструментом для моделирования является УА^1_АББ0-модель, которая позволяет использовать любое число регрессоров и их лагов в правой части; в частности, применение данной модели возможно в том случае, когда число оцениваемых параметров превышает число наблюдений.

Основной акцент мы делаем на индексах промышленного производства. В частности, на основе качества прогнозов индексов мы делаем выводы о прогнозной силе модели и противопоставляем УА^1_АББ0 классическую АШМА-модель.

При выборе для анализа временного ряда статистики промпроизводства мы исходили из следующего. Недавно Росстат перешел на новый общероссийский классификатор видов экономической деятельности (ОКВЭД 2), на основе которого данные по индексам промышленного производства публикуются лишь с 2013 г. по настоящее время, тогда как в старом ОКВЭД соответствующие данные доступны за достаточно большой период времени, но ограничиваются 2016-м годом. В связи с этим мы исключаем из рассмотрения два последних года, «жертвуя» ими в пользу более длинных временных рядов, поскольку основной целью работы является анализ применимости рассматриваемого модельного класса для моделирования и прогнозирования российских макропоказателей, для чего необходимо использовать как можно больший массив статистических данных.

При выборе спецификации кроме индексов промышленного производства в модель

1 Автор выражает глубокую признательность А.В. Полбину за конструктивные замечания и ценные комментарии к данной работе.

2 В настоящей статье термин «существенный регрессор» используется не в смысле статистической значимости, а в том смысле, что коэффициент при переменной в результате оценивания параметров 1_А550-регрессии не превращается в ноль.

было включено большое число других переменных. В качестве ключевой детерминанты российской экономики в модель была экзо-генно включена реальная цена на нефть, значимость учета которой была продемонстрирована в большом числе работ3, исследующих российскую экономику.

LASSO- и VAR-LASSO-модели

Рассмотрим классическую линейную регрессию с p объясняющими регрессорами и T наблюдениями, удовлетворяющую условиям теоремы Гаусса-Маркова:

y = Хв + е, (1)

где y - вектор наблюдений объясняемой переменной размерности T х 1; X - матрица наблюдений объясняющих переменных размерности Tх p; в - вектор параметров при объясняющих переменных размерности p х 1; е -вектор случайных ошибок (шоков) размерности T х 1, который пусть кроме удовлетворения условий теоремы Гаусса-Маркова также является нормально распределенной случайной величиной с нулевым математическим ожиданием и некоторой постоянной дисперсией а2е, то есть е~ N(0, а2е).

В такой модели оценка вектора параметров в имеет вид

в = (X' X)-X'y (2)

при условии, что матрица X' X имеет полный столбцовый ранг, что означает отсутствие в пространстве регрессоров двух или более пе-

ременных, корреляция между которыми по модулю равна единице.

Чаще, чем вышеописанная проблема полной мультиколлинеарности, на практике наблюдается проблема частичной мультиколли-неарности. Частичная мультиколлинеарность подразумевает корреляцию по модулю, близкую к единице, двух или более регрессоров, включенных в правую часть уравнения. В таком случае определитель матрицы X' X близок к нулю, хотя и не равен ему, за счет чего в матрице, обратной к X' X, могут получиться очень большие собственные числа.

¿-регуляризация, или 1_АББО-регрессия4, предложенная в работе Тибширани на основе более ранней работы Бримена5, подразумевает добавление ¿-нормы вектора параметров к штрафной функции метода наименьших квадратов. Для регрессии (1) 1_АББО-преобра-зование будет иметь вид г

О (в) = X = (у - Xв)2 + Я 11Р11, ^ шт. (3)

Параметр Я > 0 является параметром тюнинга, выбор значений для которого будет рассмотрен несколько ниже. В данной постановке задачи минимизируемая функция является негладкой и вектор параметров не может быть найден в явном виде путем операций с матрицами данных у и X - в отличие от RIDGE-рег-рессии6. Суть регуляризации заключается в том, что мы штрафуем функцию потерь О(в) за большие (по модулю или квадрату) значения параметров из вектора р. Тем самым мы сводим задачу безусловной минимизации к задаче условной минимизации на некотором мно-

3 Идрисов Г., Казакова М., Полбин А. Теоретическая интерпретация влияния нефтяных цен на экономический рост в современной России // Экономическая политика. 2014. № 5. С. 150—171; Казакова М.В. Вклад нефтегазового сектора в динамику экономических показателей в России и в мировой практике // Российский внешнеэкономический вестник. 2009. № 8. С. 66—72; Полбин А В. Оценка влияния шоков нефтяных цен на российскую экономику в векторной модели коррекции ошибок // Вопросы экономики. 2017. № 10. С. 27—49; Синельников-Мурылев С., Дробышевский С., Казакова М. Декомпозиция темпов роста ВВП России в 1999—2014 годах // Экономическая политика. 2014. № 5. С. 7—37.

4 Tibshirani R. Regression shrinkage and selection via the lasso // Journal of the Royal Statistical Society. Series B (Methodological). 1996. Рр. 267-288.

5 Breiman L. Better subset regression using the nonnegative garrote // Technometrics. 1995. Vol. 37. No. 4. Рр. 373-384.

6 Тихонов А.Н. О некорректных задачах линейной алгебры и устойчивом методе их решения // Доклады АН СССР. 1965. Т. 163. № 3. С. 97-102.

жестве значений вектора параметров р. При оценивании 1_АББ0-регрессии коэффициенты при несущественных регрессорах превращаются в ноль, что является ее хорошим свойством. Таким образом, при оценивании вектора параметров в мы получим разреженный вектор из нулей и отличных от нуля чисел. Регрес-соры при ненулевых параметрах будут являться существенными для рассматриваемой объясняемой переменной у.

УА^1_АББ0-модель впервые была рассмотрена в работе Хсу и соавторов7, и чаще всего именно ^-регуляризация используется в работах по построению больших векторных ав-торегрессий8. Дальнейшее описание модели мы проведем на основе исследования Никол-сона и соавторов9, создавших пакет для языка К, в котором будет производиться оценивание модели, рассматриваемой в настоящей работе.

Запишем УАКХ (УАК с экзогенными пере-менными)-модель для I = 1 ... Т наблюдений с к эндогенными переменными и т экзогенными переменными, допустив разную глубину запаздываний - р для эндогенных и в для экзогенных:

yt = v + 2 Ф<% 1 + 2 ß х. t + ut , (4)

' i = i tl j = i tj 1

где у - вектор эндогенных переменных; V -вектор констант; Ф(1) - матрица параметров при лаге порядка 1 эндогенных переменных размером к х к; х1 - вектор экзогенных переменных; в - матрица параметров при лаге порядка у экзогенных переменных размером к х т; и - м.С. к-мерный белый шум с нулевым вектором математических ожиданий и некоторой ковариационной матрицей

В вышеупомянутой работе Николсона и соавторов рассматривается несколько разных

видов штрафных функций для УАКХ-модели, которые позволяют выделять как стандартные группировки, так и другие весьма специфичные варианты штрафных функций. В данной работе мы остановимся на базовой штрафной функции, для которой задача условной минимизации имеет вид

Г, p

о (v, ф, ß) = 2_t (yt - v - 2=i ф%ч -

S <л

- j в x-) + Я (ЦФЦ, + WßD ^ min. (5)

Параметр Я обычно выбирается на основе кросс-валидации. В настоящей работе, поскольку модель строится на временных рядах, используется скользящая кросс-валидация, которая является обобщением классической K-блочной кросс-валидации применительно к случаю временных рядов. Ее механизм заключается в следующем: выборка разбивается на тренировочную и тестовую; фиксируется горизонт построения прогноза h; для одного из допустимых значений параметра Я оценивается модель и строится прогноз на h наблюдений вперед; затем для использованного значения параметра Я записывается значение среднеквадратичной ошибки прогноза (MSFE) или корня среднеквадратичной ошибки прогноза (RMSFE). На последнем шаге при оценивании модели мы используем значение параметра Я, минимизирующее ошибку прогноза.

Заметим, что в данной модели обязательной процедурой является стандартизация рассматриваемых переменных, т.е. их центрирование и нормирование. Учитывая, что в модели есть множество эндогенных переменных, при выборе лучшей модели на стадии кросс-валидации нам нужно каким-то образом подобрать модель, которая лучше всего прогно-

7 Hsu N.J., Hung H. L., Chang Y. M. Subset selection for vector autoregressive processes using lasso // Computational Statistics & Data Analysis. 2008. Vol. 52. No. 7. Pp. 3645-3657.

8 Kock A.B., Callot L. Oracle inequalities for high dimensional vector autoregressions // Journal of Econometrics. 2015. Vol. 186. No. 2. Pp. 325-344; Wilms I., Croux C. Sparse cointegration. 2014.

9 Nicholson W.B., Matteson D.S., Bien J. VARX-L: Structured regularization for large vector autoregressions with exogenous variables // International Journal of Forecasting. 2017. Vol. 33. No. 3. Pp. 627-651.

зирует все переменные, а не одну конкретную. В таком случае вполне разумным представляется складывать МБРЕ или RMSFE по всем полученным прогнозам, однако данные показатели зависят от дисперсии рассматриваемой переменной, и, чтобы мы могли их сложить и получить оценку качества модели в целом, нам необходимо привести переменные в стандартизированный вид.

Описание используемых данных и построение прогнозов

В приложении приведены участвующие в модели регрессоры, из которых, как было сказано выше, в качестве переменных, связанных с основной направленностью данной работы, выступают ИПП - индексы промышленного производства по крупным отраслям: добыче полезных ископаемых, обрабатывающим производствам, производству электроэнергии, газа и воды. В модели также участвуют более мелкие индексы, а именно: добычи каменного угля, бурого угля и торфа, добычи сырой нефти и нефтяного (попутного) газа, добычи природного газа и газового конденсата, добычи металлических руд, добычи прочих полезных ископаемых, производства пищевых продуктов, включая напитки, и табака, производства кожи, изделий из кожи и производства обуви, производства прочих неметаллических минеральных продуктов, производства машин и оборудования.

Кроме того, в приложении представлены данные о зарплате, доходах, реальном курсе рубля, приведены показатели платежеспособности частного сектора, данные по экспорту и импорту, валютные резервы ЦБР, денежные агрегаты МО и М2, различные индексы цен и объемов работ, показатели торговли и федерального и консолидированного бюджетов, уровень безработицы, процентная ставка

MIACR и реальная цена на нефть в качестве экзогенной переменной. Также в приложении приведена дополнительная информация об обработке переменных, а именно о способах очищения их от сезонности, источники данных и информация о дефлировании переменных на уровень цен.

Все представленные в приложении переменные протестированы тестом Филлипса-Перрона1О на наличие единичного корня. В результате все переменные, кроме ставки MIACR, включаются в модель в первых разностях логарифмов, сама переменная MIACR включается в уровнях, а переменная уровня безработицы - в разностях уровней. Все переменные центрированы на свои средние и нормированы на стандартные отклонения.

На второй трети выборки производится кросс-валидация, а на последней трети - тестирование качества прогнозов. Разбиение на три равные части является стандартной практикой при построении VAR-LASSO-модели11. Глубина запаздывания по эндогенным переменным составляет четыре лага, по цене на нефть - текущая цена и три ее лага. На рис. 1 показана матрица разреженности, полученная после оценивания модели. В матрице четыре блока лагов эндогенных переменных. Обозначим номер блока через Л. Если в блоке Л в ячейке г, } (где г - строка, у - столбец) находится закрашенный квадрат, значит, в г-м уравнении коэффициент перед лагом порядка Л переменной у является значимым. В случае блока лагов цен на нефть интерпретация аналогична, за исключением обозначений столбцов: первый столбец «отвечает» за текущую цену на нефть, второй - за первый лаг и т.д.

В табл. 1 представлены суммы MSFE на тестовом периоде для VAR-LASSO-модели, а также для четырех бенчмарков: выборочного среднего, VAR-модели с подбором лагов на

10 Phillips P.C.B., Perron P. Testing for a unit root in time series regression // Biometrika. 1988. Vol. 75. No. 2. Pp. 335—346.

11 Nicholson W.B., Matteson D.S., Bien J. VARX-L: Structured regularization for large vector autoregressions with exogenous variables // International Journal of Forecasting. 2017. Vol. 33. No. 3.

основе критериев Акаике12 и Шварца13, а также ARIMA-модели. В результате VAR-LASSO-модель оказывается наилучшей на последней трети выборки, а худшей - VAR-модель с выбором лагов на основе информационного критерия. Второе, скорее всего, связано с тем, что критерий Акаике завышает число включаемых в модель лагов, за счет чего падает точность оценивания, а следовательно, и прогнозов.

Для наглядной визуализации качества прогнозов на рис. 2 и 3 приведены псевдов-невыборочные прогнозы темпа роста индекса промышленного производства, подобно тому как это было осуществлено в работе А. Полбина и Н. Фокина14, где проводилось аналогичное тестирование качества прогнозов потребления домохозяйств. Визуализация прогнозов по индексам обрабатывающих производств, добычи полезных ископаемых и производства электроэнергии, газа и воды не приводится: мы ограничиваемся оптимальным примером, так как качество прогнозов по VAR-LASSO-модели относительно ARIMA-модели для общего ИПП является наилучшим.

Прогнозы строятся по принципу разделения выборки на тренировочную и тестовую. Изначально на периоде январь 2002 г. - декабрь 2014 г. оценивается VAR-LASSO-модель. Кросс-валидация производится на последней трети рассматриваемой выборки. Затем строится вневыборочный прогноз на двенадцать месяцев (для первой итерации это весь 2015 г.), и процедура повторяется до тех пор, пока последней точкой в тренировочной выборке не окажется последняя доступная нам точка, а именно декабрь 2016 г.

о

12 Akaike H. A new look at the statistical model identification // IEEE transactions on automatic control. 1974. Vol. 19. No. 6. Рр. 716-723.

13 Schwarz G. et al. Estimating the dimension of a model // The annals of statistics. 1978. Vol. 6. No. 2. Рр. 461-464.

14 Полбин А., Фокин Н. К вопросу о долгосрочной взаимосвязи реального потребления домохозяйств с реальным доходом в РФ // Экономическое развитие России. 2017. № 10.

С. 6-16.

Таблица 1

Сумма вневыборочных MSFE по всем стандартизированным переменным на тестовом периоде (последняя треть выборки)

VAR-LASSO MEAN AICVAR BICVAR ARIMABIC Сумма MSFE по всем стандартизированным переменным 44,754 47,107 133,431 46,105 46,905 Источник: расчеты автора.

Рис. 2. Псевдовневыборочные прогнозы темпа роста ИПП по VAR-LASSO-модели (пунктирная линия - истинные значения ряда)

0,008

-0,006 -0,008 -0,010

m m гп m

N (N N IN

Источник: расчеты автора.

S i ^ 5 ? 5

Р Б о о р ° Й

1Л 1Л Ш 1Л

Й 5 5 I 2 й

5 о о О S

ГМ (N fN (N

Рис. 3. Псевдовневыборочные прогнозы темпа роста ИПП по ARIMA-модели (пунктирная линия - истинные значения ряда)

0,010 0,008 0,006 0,004 0,002 0

-0,002 -0,004 -0,006 -0,008 -0,010

о 2

5 2

m m m m

гч rsi rsi fN

Источник: расчеты автора.

5 о

^ ^ j—

О О О о

ГМ Г\| ГМ N

5 5 2 5

LD LO LP Ш

fN (N (N ГМ

LD ID О О

ID LD

О О ГМ fN

Р Г-

S P.

«— V— О О О ГМ ГМ ГМ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о '

с

с

о. -

"О I

о

с с

1= 5

с ■

1= !

к)

э

5< (О со ч о О) о О) о> о о

N со со со со см см см со см см со со

0 ^ О о о о о о о о о о о о о

„- ОС о о о о о о о о о о о о о

3 < о" о о о о" о о о" о" о" о о" о"

. о

см о со N N <о N 00 0> О) 00

со со см СМ СМ см см см см см см см см

о о о О О о о о о о о о о

о о о о о о о о о о о о о

о" о" о о о о о о о о" о о о"

< N N см см со со л со ш ю

СО * к> ю со см см см см см см со

о О о о о о о о о о о о о

ос о о о о о о о о о о о о о

< о о о о" о" о о о" о" о" о о" о"

О

и) см со ш 0) СП со т- 0> N N 00 со

ю со Ю со см см см со

< о о о 2 о о о о о о о о о

_1 о ® о о о о о о о о о о

ос < о" о о о о" о о о о" о о о о"

>

< см со со ю см о О) о о ю

СО и 5 см см см см см см см см см

о о о о о о о о о о о о о

ос о о о о о о о о о о о о о

< о" о" о о" о" о о о" о" о" о о" о"

о

С/5 со со а <0 (0 ^ см см 00 00 00 00 ч-

4} со со см см см см см см т- ^ т- т- см ш

о о о о о о о о о о о о о п.

о о о о о о о о о о о о о со

ос § о" о о о" о" о о о" о" о" о о о" ОС 1

го

о

< ю 00 см ю ю о со г^ 0) 05 05 0) о а

см см со со со со см см см см см см см .д

о о о о о о о о о о о о о I

ос о о о о о о о о о о о о о 0)

< о" о" о о о" о о о" о" о" о о" о" 5

га

I

о

I

о

с;

о о

I/} N со ю см N Ч со Ч Ч1 10 (О (0 N з га

см со со со СМ см см см см см см см см ш о

о о о о О о о о о о о о о р

о о о о о о о о о о о о о ш

ос § о о о о о" о о о о" о о о о" е ■е га л н а>

о. т

о га

2 о.

я со 3 л у

о со о л

л см со ю со СО О) о см Ш 5 X о. а. 1

о о. Э! *

с о- о 1 ,о

О п ■X 5

В результате мы видим, что прогнозы по VAR-LASSO-модели достаточно быстро стягиваются к среднему. При этом замечаем, что цена на нефть не входит в уравнение для индекса промышленного производства, чем и может быть обусловлено отсутствие видимой динамики прогнозов. Прогнозы по ARIMA-модели оказываются весьма волатильными, однако сходимость к среднему здесь также прослеживается. Количественно измерить качество прогнозов по общему индексу и индексам крупных отраслей промышленного производства мы можем с помощью RMSFE и их отношений, представленных соответственно в табл. 2 и 3.

Исходя из результатов, представленных в таблицах, можно заключить, что даже в том случае (добыча полезных ископаемых и производство электроэнергии, газа и воды), когда в уравнение для индекса входят только собственные лаги (случай ARIMA) и не входят лаги других переменных, VAR-LASSO-модель имеет более высокую прогнозную силу, нежели обычная ARIMA.

Такой результат обусловлен тем фактом, что в VAR-LASSO-модели при оценивании подбирается параметр тюнинга и оценивание модели производится не только согласно некоторому методу, например OLS или ML, а с учетом кросс-валидации, которая улучшает прогноз на будущее. В случае общего ИПП и обрабатывающих производств, где кроме авторегрессионной части в уравнении участвуют также лаги других регрессоров, преимущество VAR-LASSO-модели перед ARIMA формируется как за счет кросс-валидации, так и за счет большого объема информации, используемой при построении прогноза. Основное преимущество применения VAR-LASSO в случае общего ИПП то, что в среднем на всех периодах прогноза эта модель превосходит по качеству прогнозов модель ARIMA на 9%. Также стоит учитывать, что при добавлении новой точки в обучающую выборку число значимых коэффициентов в том или ином уравнении может увеличиваться, что также потенциально способно улучшать прогноз относительно базовой модели ARIMA.

Таблица 3

Отношение вневыборочных RMSFE BIG VAR к ARIMA на периоде 2015-2016 гг. -нестандартизированные переменные

ИПП УАРМ-АЭЗО ИПП полез, ископ. ИПП обр. произв. ИПП Электр., газ, вода

кАШМА \ZAR-LASSO кАР1МА УАР-ЬАЭЭО кАШМА \ZAR-LASSO к АР1МА

1 0,90 1,06 1,41 1,23

2 1,19 1,03 1,28 0,81

3 1,09 0,94 1,02 0,74

4 0,90 0,93 0,96 0,79

5 0,78 0,93 0,91 0,90

6 0,78 0,84 0,88 1,00

7 0,84 0,92 0,92 1,00

8 0,91 1,00 0,91 0,90

9 0,91 0,90 0,79 0,90

10 0,88 0,95 0,71 0,97

11 0,90 0,90 0,68 1,00

12 0,90 0,90 0,72 0,97

Среднее за период 0,91 0,95 0,97 0,93

Источник: расчеты автора.

Заключение

В работе была построена большая VAR-LASSO-модель с использованием 45 регрессоров месячной частоты. В частности, был рассмотрен случай, когда общее число оцениваемых параметров превышает число доступных наблюдений. На основе оцененной модели было проведено несколько экспериментов по тестированию качества прогнозов как модели в целом, так и на отдельных временных рядах российских индексов промышленного производства. В результате было установлено, что VAR-LASSO-модель превосходит рассмотренные бенчмарки во всех случаях. По совокупной ошибке прогноза модели VAR-LASSO превосходит ARIMA, прогноз среднего, VAR на основе AIC и BIC В случае отдельных индексов промышленного производства модель прогнозирует лучше, чем ARIMA.

Описанный в работе подход, по мнению автора, может хорошо себя зарекомендовать при прогнозировании временных рядов российского промпроизводства, учитывая их небольшую протяженность относительно развитых экономик. Так, например, на сайте Федеральной резервной системы США индекс промышленного производства представлен в месячном выражении с 1919 г., тогда как на сайте Росстата соответствующие данные имеются начиная лишь с 1992 г. Принимая во внимание то обстоятельство, что новой российской экономике не исполнилось еще и 30 лет, а также возросший в последнее время интерес к большим данным и возможный в будущем их рост «в ширину», протестированный в работе подход представляется весьма актуальным. ■

Приложение

Описание используемых данных

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Показатель Имя переменной Дополнительная информация

ИП П IPP Очищение от сезонности - SOPHIST

ИПП полезные ископаемые POLEZ Очищение от сезонности - SOPHIST

ИПП обрабатывающие производства OBR Очищение от сезонности - SOPHIST

ИПП электроэнергия, газ, вода ELECTR Очищение от сезонности - SOPHIST

Добыча каменного угля, бурого угля и торфа MCLP2 Очищение от сезонности - SOPHIST

Добыча сырой нефти и нефтяного (попутного)газа ECOG2 Очищение от сезонности - SOPHIST

Добыча природного газа и газового конденсата ENGC2 Очищение от сезонности - SOPHIST

Добыча металлических руд ММЕТ2 Очищение от сезонности - SOPHIST

Добыча прочих полезных ископаемых OMAQ2 Очищение от сезонности - SOPHIST

Производство пищевых продуктов, включая напитки, и табака MFBT2 Очищение от сезонности - SOPHIST

Производство кожи, изделий из кожи и производство обуви MLPP2 Очищение от сезонности - SOPHIST

Производство прочих неметаллических минеральных продуктов MONMP2 Очищение от сезонности - SOPHIST

Производство машин и оборудования МЕРМ2 Очищение от сезонности - SOPHIST

Индекс реальной зарплаты WAGE Очищение от сезонности - SOPHIST

Индекс реального дохода INCOME Очищение от сезонности - SOPHIST

ИПЦ CP1 Очищение от сезонности - SOPHIST

VAR-LASSO-МОДЕЛЬ на большом массиве российских экономических данных

Приложение

Описание используемых данных (продолжение)

Показатель Имя переменной Дополнительная информация

Индекс реального эффективного обменного курса REER Источник: МВФ

Очищение от сезонности - Х12 ARIMA EVIEWS,

Задолженность покупателей DBT_P_M временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Дебиторская задолженность DBT_T_M временной ряд поделен на ИПЦ, SOPHIST

Просроченная дебиторская задолженность DBT_UNP_M Очищение от сезонности - Х12 ARIMA EVIEWS, временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Экспорт EXPORT временной ряд поделен на ИПЦ, SOPHIST

Валютные резервы ЦБР ICR_M Очищение от сезонности - Х12 ARIMA EVIEWS, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Импорт IMPORT временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Задолженность в бюджет UAB_B_M временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Задолженность поставщикам LIAB_S_M временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Кредиторская задолженность UABTM временной ряд поделен на ИПЦ, SOPHIST

Просроченная кредиторская задолженность UAB_UNP_M Очищение от сезонности - Х12 ARIMA EVIEWS, временной ряд поделен на ИПЦ, SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Денежный агрегат МО MO временной ряд поделен на ИПЦ, SOPHIST

Индекс цен на строительно-монтажные PRICEBUILD Очищение от сезонности - Х12 ARIMA EVIEWS,

работы SOPHIST

Очищение от сезонности - Х12 ARIMA EVIEWS,

Денежный агрегат М2 M2_M временной ряд поделен на ИПЦ, SOPHIST

Индекс цен производителей промышленных товаров PRICE_PROD Очищение от сезонности - Х12 ARIMA EVIEWS, SOPHIST

Индекс цен на грузовые перевозки PRICE_TRANSP Очищение от сезонности - Х12 ARIMA EVIEWS, SOPHIST

Международные резервы ЦБР IR_M Очищение от сезонности - Х12 ARIMA EVIEWS, временной ряд поделен на ИПЦ, SOPHIST

Индекс реального объема сел ьскохозя йствен ного п роизводства AGR_M_DIRI Очищение от сезонности - SOPHIST

Индекс реального объема работ,

выполненных по виду деятельности CNSTR M DIRI Очищение от сезонности - SOPHIST

«Строительство»

Ввод в действие жилых домов CONSTR_M_NAT Очищение от сезонности - SOPHIST

Приложение

Описание используемых данных (продолжение)

Показатель Имя переменной Дополнительная информация

Индекс пассажирооборота транспорта общего пользования TRPMPASSDIRI Очищение от сезонности - Х12 ARIMA EVI EWS, временной ряд поделен на ИПЦ, SOPHIST

Индекс реального оборота розничной торговли RTRD_M_DIRI Очищение от сезонности - Х12 ARIMA EVI EWS, временной ряд поделен на ИПЦ, SOPHIST

Расходы консолидированного бюджета СВЕ Очищение от сезонности - Х12 ARIMA EVI EWS, временной ряд поделен на ИПЦ, SOPHIST

Доходы консолидированного бюджета CBJ Очищение от сезонности - Х12 ARIMA EVI EWS, временной ряд поделен на ИПЦ, SOPHIST

Расходы федерального бюджета FED_E Очищение от сезонности -Х12 ARIMA EVIEWS, временной ряд поделен на ИПЦ, SOPHIST

Доходы федерального бюджета FEDJ Очищение от сезонности - Х12 ARIMA EVIEWS, временной ряд поделен на ИПЦ, SOPHIST

Уровень безработицы UNEMP

Ставка М1АСР MIACR Усреднение однодневных ставок (URL: cbr.ru)

Реальная цена на нефть POIL Номинальная цена, поделенная на долларовый ИПЦ. Оба ряда взяты с сайта Федеральной резервной системы США

Источник: составлено автором.

VAR-LASSO Model for the Russian Economy Using a Large Dataset

Nikita D. Fokin — Junior Researcher of the Russian Presidential Academy of National Economy and Public Administration; 2nd year Master Student at Economic Faculty at the Russian Presidential Academy of National Economy and Public Administration (Moscow, Russia). E-mail: fokinikita@gmail.com

The article provides a large auto regression with L-regularization (VAR-LASSO-model) based on monthly values of Russian macro indicators for the case when the number of observations is less than the number of evaluated parameters. The aim of the work is to demonstrate feasibility and the advantage of Russian macro parameters for forecasting with the help of a large set of regressors, which from theoretical point of view should improve forecasts regarding models of lesser dimension. Forecasting properties of VAR-LASSO-model are better than forecasting features of reviewed benchmarks.

Key words: indices of industrial production, ARIMA model, VAR model, VAR-LASSO model, forecasting, oil prices.

i Надоели баннеры? Вы всегда можете отключить рекламу.