Научная статья на тему 'ИСПОЛЬЗОВАНИЕ АВТОРЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПРИРОСТА ВКЛАДОВ ФИЗИЧЕСКИХ ЛИЦ'

ИСПОЛЬЗОВАНИЕ АВТОРЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПРИРОСТА ВКЛАДОВ ФИЗИЧЕСКИХ ЛИЦ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
123
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОЛИЧЕСТВЕННАЯ АНАЛИТИКА / МОДЕЛИРОВАНИЕ / КОЛИЧЕСТВЕННОЕ МОДЕЛИРОВАНИЕ / ВРЕМЕННЫЕ РЯДЫ / ФИНАНСОВЫЕ ВРЕМЕННЫЕ РЯДЫ / АВТОРЕГРЕССИОННЫЕ МОДЕЛИ / ARIMA

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Пастухов Семён Игоревич

В настоящее время задача моделирования и прогнозирования данных в виде временных рядов является более чем актуальной. Отдельно можно выделить конкретно финансовые временные ряды со своими особенностями, которые определяют подходы к их оценке. Система финансового рынка детерминирует определенную структуру и особенности таких рядов данных так, что они всегда обладают уникальными свойствами. Финансовые временные ряды, в отличие от классических рядов чаще являются нестационарными процессами. Связан такой факт с тем, что динамика различных финансовых показателей содержит в себе в качестве компонент различные характеристики, которые непосредственно оказывают влияние на направление движения данных. Среди подобных характеристик чаще всего встречается, во-первых, трендовая составляющая, которая больше всего влияет на направление изменений ряда. Во-вторых, это сезонная компонента и компонента цикла, которые задают направление движения данных внутри определенного временного промежутка, в также задают длину и частоту появления подобных интервалов во всей выборке. Для построения необходимой исследователю модели всегда нужно обращать внимание на подобные характеристики временных рядов и адаптировать метод под их специфику. В данной работе проводится построение и оценка авторегрессионной модели для последующего прогноза данных, конкретно прироста вкладов физических лиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Пастухов Семён Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING AUTOREGRESSIVE MODELS FOR PREDICTING THE GROWTH OF INDIVIDUAL DEPOSITS

Currently, the task of modeling and forecasting data in the form of time series is more than relevant. Separately, it is possible to single out specifically financial time series with their own characteristics that determine approaches to their assessment. The financial market system determines a certain structure and features of such data series so that they always have unique properties. Financial time series, unlike classical time series, are more often non-stationary processes. This fact relates to the fact that the dynamics of various financial indicators contains various characteristics as components that directly affect the direction of data movement. Among such characteristics, the trend component is most often found, firstly, which most affects the direction of changes in the series. Secondly, it is the seasonal component and the cycle component, which set the direction of data movement within a certain time interval, and set the length and frequency of occurrence of such intervals in the entire sample. To build the model necessary for the researcher, it is always necessary to pay attention to such characteristics of time series and adapt the method to their specifics. In this paper, the construction and evaluation of an autoregressive model is carried out for the subsequent forecast of data, specifically the increase in deposits of individuals.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ АВТОРЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПРИРОСТА ВКЛАДОВ ФИЗИЧЕСКИХ ЛИЦ»

Использование авторегрессионных моделей для прогнозирования прироста вкладов физических лиц

Пастухов Семён Игоревич,

аспирант кафедры управления государственными и муниципальными закупками МГУУ Правительства Москвы E-mail: pastukhov.se@gmail.com

В настоящее время задача моделирования и прогнозирования данных в виде временных рядов является более чем актуальной. Отдельно можно выделить конкретно финансовые временные ряды со своими особенностями, которые определяют подходы к их оценке. Система финансового рынка детерминирует определенную структуру и особенности таких рядов данных так, что они всегда обладают уникальными свойствами. Финансовые временные ряды, в отличие от классических рядов чаще являются нестационарными процессами. Связан такой факт с тем, что динамика различных финансовых показателей содержит в себе в качестве компонент различные характеристики, которые непосредственно оказывают влияние на направление движения данных. Среди подобных характеристик чаще всего встречается, во-первых, трендовая составляющая, которая больше всего влияет на направление изменений ряда. Во-вторых, это сезонная компонента и компонента цикла, которые задают направление движения данных внутри определенного временного промежутка, в также задают длину и частоту появления подобных интервалов во всей выборке. Для построения необходимой исследователю модели всегда нужно обращать внимание на подобные характеристики временных рядов и адаптировать метод под их специфику. В данной работе проводится построение и оценка авторегрессионной модели для последующего прогноза данных, конкретно прироста вкладов физических лиц.

Ключевые слова: количественная аналитика; моделирование; количественное моделирование; временные ряды; финансовые временные ряды; авторегрессионные модели; ARIMA.

LO S Ое

см см о см

03

В настоящий момент существует огромное множество подходов и методов, подходящих для анализа финансовых временных рядов. На окончательный выбор модели для последующей оценки всегда влияет совокупность факторов, таких как: качественная особенность данных или целевых переменных, специфика области применения модели и субъективное восприятие исследователя.

В данной статье использовались данные по изменениям объемов вкладов физических лиц в рублях в РФ, а также необходимые макроэкономические показатели. Таким, образом, в качестве целевой или таргетной переменной здесь выступают помесячные изменения объемов рынка вкладов физических лиц. Главной же задачей модели будет являться построение прогноза таргета на следующий период.

Для начала стоит проанализировать целевую переменную - значение прироста вкладов физических лиц - как отдельный временной ряд (рисунок 1).

-6CODCO

2011 2012 2013 2014 201Б 2016 20 1 7

дата

Рис. 1. Значение прироста вкладов физических лиц, млн руб.

Из графика видно, что ряд значений имеет явную сезонность - в последний месяц каждого года значение прироста вкладов физических лиц достигает максимального уровня относительно всего года. При этом, в январе следующего года, наоборот, достигается значение минимума. Можно сделать предположение, что люди в большинстве своем склонны откладывать свои средства на депозиты чаще к концу года, чем к его началу. Исключением для данного факта будет являться 2015 год, что можно объяснить предшествующим кризисом.

График автокорреляционной функции подтверждает предположения о сезонном характере временного ряда (рисунок 2). Действительно, наблюдаются пики на 12, 24, 36 и 48-м лаге, что говорит о том, что сезон равен одному году, а цикл повторяется каждые 12 месяцев.

Рис. 2. Автокорреляционная функция для ряда целевой переменной

Принимая во внимание вышеизложенные факты, целесообразно использовать модель SARIMAX, модифицированный вариант классического подхода Бокса-Дженкинса, которая сможет учесть сезонный характер ряда значений целевой переменной, а также дополнительно использовать экзогенный фактор. Единственное условие будет заключаться в том, что данную модель нельзя «перегружать» внешними эффектами, так как это может оказать влияние на точность прогноза.

Из объясняющих факторов отдельно можно выделить денежный агрегат М2, поскольку этот показатель включает в себя остатки средств на рублевых срочных депозитах. А значит он наиболее точно сможет объяснить целевую переменную. Именно поэтому для моделирования будут использоваться только значения денежного агрегата М2.

Для улучшения качества оценки, значения экзогенной переменной были приведены к относительным величинам. Из следующего графика видно, что ряд значений прироста денежного агрегата М2 визуально аналогичен ряду целевой переменной, что может говорить о правильном выборе объясняющей переменной (рисунок 3).

Рис. 3. Значение прироста денежного агрегата М2, млрд руб.

Далее необходимо проверить ряд целевой переменной на стационарность, используя расширенный тест Дики-Фуллера. Р^а1ие теста равно 0,51, что говорит о том, что нулевая гипотеза о нестационарности ряда не отвергается, другими

словами - временной ряд является нестационарным.

Разбив временной ряд целевой переменной на компоненты, можно отметить, что в его динамике отсутствует какой-либо ярко выраженный тренд (рисунок 4). А это значит, что трендовая компонента временного ряда не является определяющей, в отличии от сезонной. Таким образом, можно привести временной ряд данных к стационарному виду посредством последовательного взятия именно сезонных разностей.

Рис. 4. Компоненты временного ряда целевой переменной

Временной ряд приводится к стационарному виду последовательным взятием двух сезонных разностей. То есть ряд является стационарным при порядке сезонного интегрирования D = 2.

Далее были подобраны другие порядки модели, такие как порядок авторегрессии и порядок скользящего среднего, а также сезонные компоненты. Подбор и последующая проверка данных параметров происходили на основе максимизации информационного критерия А1С, поскольку он больше подходит для целей прогнозирования, в отличии от критерия В1С, который чаще применяется для объясняющих моделей. Итоговой моделью для оценки стала модель SARIMAX(0,0,0) (2,2,0)12 (таблица 1).

Из результатов оценки модели видно, что коэффициент при объясняющей переменной и лаг одного сезона значимы на любом уровне значимости. Статистика Люинга-Бокса равна 25.25, а р^а!ие теста равно 0.97, что означает, что нулевая гипотеза теста не отвергается, то есть остатки модели не являются коррелированными. Статистика Харки-Бера равна 7.59, р^а!ие теста равно 0.02. На 1% уровне значимости нулевая гипотеза теста не отвергается, а это значит, что остатки имеют нормальное распределение.

Можно сказать, что первый этап диагностики модели прошел успешно - коэффициенты модели значимы, а остатки некоррелированы и имеют характер нормального распределения, что является достаточно важным фактором признания модели адекватной. Далее можно приступить к подробной диагностике полученных результатов.

сз о

со £

m Р

сг

СТ1 А

Таблица 1. Результаты оценки модели SARIMAX(0,0,0)(2,2,0)12.

No. Observations 71 AIC 1296.644

Log Likelihood -643.322 BIC 1305.895

coef std err z P>|z| [0.025 0.975]

intercept -2.926e+04 7.48e+04 -0.391 0.696 -1.76e+05 1.17e+05

M2 445.6656 151.310 2.945 0.003 149.103 742.228

ar.S.L12 -1.2057 0.280 -4.313 0.000 -1.754 -0.658

ar.S.L24 -0.9343 0.661 -1.414 0.157 -2.230 0.361

sigma2 8.575e+10 0.052 1.64e+12 0.000 8.57e+10 8.57e+10

Ljung-Box (Q) 25.25 Jarque-Bera (JB) 7.59

Prob (Q) 0.97 Prob (JB) 0.02

Heteroskedasticity (H) 2.75 Skew 0.71

Prob (H) 0.05 Kurtosis 4.36

Ое

OJ

Из графиков подробной диагностики модели видно, что стандартные остатки не имеют очевидной структуры, какой-либо сезонной или трен-довой составляющей и вполне схожи на белый шум с абсолютно случайной динамикой показателя и центром - средней величиной стандартного остатка в нуле (рисунок 5).

Рис. 5. Графическая диагностика модели

Распределение остатков ближе к распределению Стьюдента с небольшой асимметрией, увеличенным параметром куртозиса и длинным правым хвостом. Кроме того, у остатков отсутствует автокорреляция - все значения корреляций на графике незначимые.

Исходя из проведенной диагностики, можно сказать, что данная модель подходит для прогнозирования значений ряда целевой переменной.

В первую очередь, стоит построить прогноз значений внутри выборки, и далее оценить точность прогноза (рисунок 6).

Исходя из графика можно отметить, что значения прогноза визуально достаточно близки к наблюдаемым. Кроме того, привлекает внимание достаточно широкая граница прогноза для первых двух лет наблюдения, хоть она и не снизила качество самого прогноза. Связано это с тем, что при

приведении ряда к стационарному виду последовательно берутся две сезонные разности, то есть буквально «отрезаются» данные за два сезона, то есть два года. Исправить это можно, если найти другую трансформацию, которая привела бы исследуемый временной ряд к стационарности.

Рис. 6. Прогноз значений прироста вкладов физических лиц внутри выборки, млн руб.

Качество прогноза будет измеряться с помощью показателя MAE - средней абсолютной ошибки прогноза. Для данной модели он равен 120813.

Далее был проведен прогноз вне выборки для определения ряда будущих значений целевой переменной (рисунок 7).

Рис. 7. Прогноз значений прироста вкладов физических лиц вне выборки, млн руб.

Из графика видно, что прогноз хорошо учитывает сезонность. Действительно наименьшее значение прироста приходится на 1 месяц, а наибольшее на последний месяц прогнозируемого года.

Предиктивная динамика целевой переменной визуально напоминает динамику реальных данных, использованных для построения модели. Этот факт говорит о правильном подборе параметров авторегрессионной модели, которые в последствии позволили получить значимые коэффициенты, адекватно описывающие поведение тар-гетного показателя.

Заключение

Таким образом, в данной работе нам удалось произвести построение и оценку авторегрессионной модели на основе данных о динамике вкладов физических лиц. Далее, на основе построенной модели был произведен прогноз внутри выборки и за рамками выборки, который оправдал ожидания исследования.

Стоит отметить, что высокое качество как самой модели, так и прогноза на ее основе достигается по большей части благодаря адекватному и релевантному анализу входных данных. Так, временной ряд целевого показателя - прироста вкладов физических лиц - был разбит на несколько компонент, среди которых трендовая, сезонная и циклическая составляющая. Далее, посредством анализа каждой характеристики, были выделены те из них, которые влияют на динамику таргета в наибольшей степени. Подобное доскональное изучение входных данных позволило далее подобрать наилучшие параметры авторегрессионной модели, которая адекватно описывает целевую переменную, а также ее прогноз.

Литература

1. Akaike H. Fitting autoregressive models for prediction //Annals of the institute of Statistical Mathematics. - 1969. - Т. 21. - № . 1. - С. 243-247.

2. Arlt J., Arltova M. Financial time series and their features. - 2001.

3. Box G. E. P. et al. Time series analysis: forecasting and control. - John Wiley & Sons, 2015.

4. Enders W. Applied econometric time series. -John Wiley & Sons, 2008.

5. Gray H. L., Kelley G.D., Mc Intire D.D. A new approach to ARMA modeling //Communications in Statistics-Simulation and Computation. - 1978. -T. 7. - № . 1. - C. 1-77.

6. Hamilton J.D. Time series analysis. - New Jersey: Princeton, 1994. - T. 2. - C. 690-696.

7. Mills T. C., Mills T.C. Time series techniques for economists. - Cambridge University Press, 1991.

USING AUTOREGRESSIVE MODELS FOR PREDICTING THE GROWTH OF INDIVIDUAL DEPOSITS

Pastukhov S.I.

Moscow Metropolitan Governance University

Currently, the task of modeling and forecasting data in the form of time series is more than relevant. Separately, it is possible to single out specifically financial time series with their own characteristics that determine approaches to their assessment. The financial market system determines a certain structure and features of such data series so that they always have unique properties. Financial time series, unlike classical time series, are more often non-stationary processes. This fact relates to the fact that the dynamics of various financial indicators contains various characteristics as components that directly affect the direction of data movement. Among such characteristics, the trend component is most often found, firstly, which most affects the direction of changes in the series. Secondly, it is the seasonal component and the cycle component, which set the direction of data movement within a certain time interval, and set the length and frequency of occurrence of such intervals in the entire sample. To build the model necessary for the researcher, it is always necessary to pay attention to such characteristics of time series and adapt the method to their specifics. In this paper, the construction and evaluation of an autoregressive model is carried out for the subsequent forecast of data, specifically the increase in deposits of individuals.

Keywords: quantitative analytics; modeling; quantitative modeling; time series; financial time series; autoregressive models; ARIMA.

References

1. Akaike H. Fitting autoregressive models for prediction //Annals of the institute of Statistical Mathematics. - 1969. - T. 21. - № . 1. - C. 243-247.

2. Arlt J., Arltova M. Financial time series and their features. -2001.

3. Box G. E. P. et al. Time series analysis: forecasting and control. - John Wiley & Sons, 2015.

4. Enders W. Applied econometric time series. - John Wiley & Sons, 2008.

5. Gray H. L., Kelley G.D., Mc Intire D.D. A new approach to ARMA modeling //Communications in Statistics-Simulation and Computation. - 1978. - T. 7. - № . 1. - C. 1-77.

6. Hamilton J.D. Time series analysis. - New Jersey: Princeton, 1994. - T. 2. - C. 690-696.

7. Mills T. C., Mills T.C. Time series techniques for economists. -Cambridge University Press, 1991.

i Надоели баннеры? Вы всегда можете отключить рекламу.