Научная статья на тему 'ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ НА ОСНОВЕ ГИБРИДНОЙ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ: ГРАДИЕНТНЫЙ БУСТИНГ И СЛУЧАЙНЫЙ ЛЕС'

ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ НА ОСНОВЕ ГИБРИДНОЙ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ: ГРАДИЕНТНЫЙ БУСТИНГ И СЛУЧАЙНЫЙ ЛЕС Текст научной статьи по специальности «Экономика и бизнес»

CC BY
82
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Машинное обучение / региональная инфляция / индекс потребительских цен / гибридная модель / градиентный бустинг / случайный лес / Machine learning / regional inflation / consumer price index / hybrid model / gradient boosting / random forest

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Астраханцева Ирина Александровна, Герасимов Александр Сергеевич

В данной работе была разработана гибридная модель машинного обучения для прогнозирования региональной инфляции, основанная на градиентном бустинге и случайном лесе. Был использован индекс потребительских цен как метод измерения инфляции, который измеряет соотношение стоимости корзины в отчетном и базовом периодах. Одной из ключевых особенностей и научной новизной работы является использование гибридной модели, которая объединяет прогнозы двух моделей машинного обучения (градиентный бустинг и случайный лес) и выдает общий результат. Такой подход является современным трендом в области прогнозирования инфляции и позволяет получить более объективную прогнозную картину. При выборе градиентного бустинга и случайного леса в качестве основных алгоритмов для построения модели, авторы руководствовались несколькими причинами. Во-первых, данные методы широко используются для решения задач прогнозирования как в России, так и за рубежом. Во-вторых, они демонстрировали эффективность в предыдущих исследованиях авторов, позволяя работать с большим объемом входных данных и строить ранжированную схему по влиянию каждого фактора на результат. Рассмотрение степени влияния переменных важно для интерпретации результата моделирования. Оценка важности переменных необходима для более полной интерпретации результатов моделирования. В-третьих, процесс обработки данных для этих моделей идентичен, что позволяет существенно сократить время на обработку данных. В-четвертых, несмотря на сходство этих моделей как ансамблей деревьев решений, они отличаются процессом обучения и тем, как они объединяют результаты отдельных деревьев.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Астраханцева Ирина Александровна, Герасимов Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REGIONAL INFLATION PREDICTION BASED ON HYBRID MACHINE LEARNING MODEL: GRADIENT BOOSTING AND RANDOM FOREST

In this paper, a hybrid machine learning model was developed for predicting regional inflation based on gradient boosting and random forest. The consumer price index was used as a method of measuring inflation, which measures the ratio of the basket value in the reporting and base periods. One of the key features and scientific novelty of the work is the use of a hybrid model that combines the predictions of two machine learning models (gradient boosting and random forest) and gives the overall result. This approach is a modern trend in the field of inflation forecasting and allows you to get a more objective forecast picture. When choosing gradient boosting and random forest as the main algorithms for building the model, the authors were guided by several reasons. Firstly, these methods are widely used to solve forecasting problems both in Russia and abroad. Secondly, they demonstrated effectiveness in previous studies of the authors, allowing them to work with a large amount of input data and build a ranked scheme based on the influence of each factor on the result. Consideration of the degree of influence of variables is important for the interpretation of the simulation result. Evaluation of the importance of variables is necessary for a more complete interpretation of the simulation results. Thirdly, the data processing process for these models is identical, which significantly reduces the time for data processing. Fourth, despite the similarity of these models as ensembles of decision trees, they differ in the learning process and how they combine the results of individual trees.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ НА ОСНОВЕ ГИБРИДНОЙ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ: ГРАДИЕНТНЫЙ БУСТИНГ И СЛУЧАЙНЫЙ ЛЕС»

?nn

DOI:10.38197/2072-2060-2023-243-5-200-226

ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ НА ОСНОВЕ ГИБРИДНОЙ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ: ГРАДИЕНТНЫЙ БУСТИНГ И СЛУЧАЙНЫЙ ЛЕС REGIONAL INFLATION PREDICTION BASED ON HYBRID MACHINE LEARNING MODEL: GRADIENT BOOSTING AND RANDOM FOREST

АСТРАХАНЦЕВА ИРИНА АЛЕКСАНДРОВНА

Заведующая кафедрой информационных технологий и цифровой экономики ФГБОУ ВО «Ивановского государственного химико-технологического университета», руководитель Ивановской региональной общественной организации ВЭО России, д.э.н.. доцент

IRINA A. ASTRAKHANTSEVA

Head of the Department of Information Technology and Digital Economy, Ivanovo State University of Chemical Technology, Head of the Ivanovo regional public organization VEO of Russia, Doctor of Economics, Associate Professor

ГЕРАСИМОВ АЛЕКСАНДР СЕРГЕЕВИЧ

Магистр первого года обучения ФГБОУ ВО «Ивановского государственного химико-технологического университета» по направлению «Информационные системы и технологии»

ALEXANDER S. GERASIMOV

Student of the Ivanovo State University of Chemistry and Technology

АННОТАЦИЯ

В данной работе была разработана гибридная модель машинного обучения для прогнозирования региональной инфляции, основанная на градиентном бустинге и случайном лесе. Был использован индекс потребительских цен как метод измерения инфляции, который измеряет соотношение стоимости корзины в отчетном и базовом периодах. Одной из ключевых особенностей и научной новизной работы является использование гибридной модели, которая объединяет прогнозы

/

двух моделей машинного обучения (градиентный бустинг и случайный лес) и выдает общий результат. Такой подход является современным трендом в области прогнозирования инфляции и позволяет получить более объективную прогнозную картину.

При выборе градиентного бустинга и случайного леса в качестве основных алгоритмов для построения модели, авторы руководствовались несколькими причинами. Во-первых, данные методы широко используются для решения задач прогнозирования как в России, так и за рубежом. Во-вторых, они демонстрировали эффективность в предыдущих исследованиях авторов, позволяя работать с большим объемом входных данных и строить ранжированную схему по влиянию каждого фактора на результат. Рассмотрение степени влияния переменных важно для интерпретации результата моделирования. Оценка важности переменных необходима для более полной интерпретации результатов моделирования. В-третьих, процесс обработки данных для этих моделей идентичен, что позволяет существенно сократить время на обработку данных. В-четвертых, несмотря на сходство этих моделей как ансамблей деревьев решений, они отличаются процессом обучения и тем, как они объединяют результаты отдельных деревьев. ABSTRACT

In this paper, a hybrid machine Learning model was developed for predicting regional inflation based on gradient boosting and random forest. The consumer price index was used as a method of measuring inflation, which measures the ratio of the basket value in the reporting and base periods.

One of the key features and scientific novelty of the work is the use of a hybrid model that combines the predictions of two machine learning models (gradient boosting and random forest) and gives the overall result. This approach is a modern trend in the field of inflation forecasting and allows you to get a more objective forecast picture.

When choosing gradient boosting and random forest as the main algorithms for building the model, the authors were guided by several reasons. Firstly, these methods are widely used to solve forecasting problems both in Russia and abroad. Secondly, they demonstrated effectiveness in previous studies of the authors, allowing them to work with a large amount of input data and build a ranked scheme based on the influence of each factor on the result. Consideration of the degree of influence of variables is important for the interpretation of the simulation result.

Evaluation of the importance of variables is necessary for a more complete interpretation of the simulation results. Thirdly, the data processing process for these models is identical, which significantly reduces the time for data processing. Fourth, despite the similarity of these models as ensembles of decision trees, they differ in the learning process and how they combine the results of individual trees.

КЛЮЧЕВЫЕ СЛОВА

Машинное обучение, региональная инфляция, индекс потребительских цен, гибридная модель, градиентный бустинг, случайный лес. KEYWORDS

Machine learning, regional inflation, consumer price index, hybrid model, gradient boosting, random forest.

Введение

Инфляция в современной России проявляет переменную динамику. За последние годы наблюдались различные тенденции [1]. В период с 2019 по 2020 гг. инфляция не превышала 4%, что соответствовало среднесрочной цели Центрального Банка России. Однако в 2020 и в 2021 гг. она значительно превысила целевые показатели, увеличившись вдвое. Таким образом, инфляция в России

204

проявляет переменные тенденции в различные периоды времени [2].

В России основным методом измерения инфляции является индекс потребительских цен (ИПЦ), который рассчитывается для фиксированной корзины товаров. Индекс измеряет соотношение стоимости корзины в отчетном и базовом периодах [3].

В России официальные индексы потребительских цен периодически публикуются Федеральной службой государственной статистики [4]. Данные показатели широко используются заинтересованными сторонами, включая кор-рекционные коэффициенты, используемые, например, в судебных процессах для определения ущерба и т.д.

По данным Росстата официальная инфляция в РФ за 2022 г. составила 11,94%. Именно на эту величину будут индексироваться 40 выплат, компенсаций и пособий с 1 февраля 2023 г. Центробанк РФ с помощью кредитно-денежной политики рассчитывает снизить этот показатель до 5-7% в 2023 г. и вернуться к 4% в 2024 и 2025 гг.

Инфляция возникает под воздействием многих факторов, таких как снижение роста производства товаров, увеличение денежной массы, изменения в практике ценообразования, снижение конкуренции, рост монополизации экономики, увеличение государственных расходов (дефицит бюджета), резкое увеличение объемов кредитования и другие [5].

Для снижения рисков инфляционных процессов необходимо эффективное планирование экономики, которое возможно только при учете инфляционного прогноза [6].

Целью работы является создание гибридной модели машинного обучения градиентного бустинга и случайный лес для прогнозирования региональной инфляции.

Использование гибридных моделей машинного обучения для прогнозирования инфляции является одной из возможных стратегий, которая может помочь улучшить качество прогнозов и обеспечить более информированное принятие решений в экономической сфере [7].

Такое объединение различных моделей прогнозирования является актуальным направлением исследований, позволяет расширить прогностические возможности и является научной новизной [8].

1. Методы

В настоящем исследовании методом измерения инфляции является индекс потребительских цен, который рассчитывается по отношению к базовому периоду. Зная стоимость потребительской корзины за выбранный месяц в данном (текущем) году и ее же стоимость за выбранный месяц в прошлом году, можно рассчитать ИПЦ. В России с 1991 г. принято рассчитывать этот показатель по методике Э. Ласпейреса.

Индекс потребительских цен рассчитывается как частное от деления стоимости потребительской корзины за выбранный месяц в текущем году и стоимости потребительской корзины за выбранный месяц в прошлом году.

В экономической теории выделяются такие виды инфляции, как инфляция спроса (превышение совокупного спроса над предложением) и издержек (уменьшение совокупного предложения как следствие роста издержек). В инфляции спроса можно выделить ее распределение по создателям этого спроса, а именно:

— потребительская — потребители;

— фискальная — государство;

20

— инвестиционная — бизнес;

— импортированная — внешние рынки.

В настоящем исследовании рассматривается потребительская инфляция, которая измеряется с помощью ИПЦ. Потребительская инфляция показывает устойчивое повышение цен на товары и услуги, которые приобретает население в определенном регионе. Рассматривается изменение цен выбранного месяца к этому же месяцу прошлого года.

Авторы считают целесообразным проанализировать влияние на инфляцию еще некоторых важнейших экономических показателей, определяя степень их влияния. Все они являются ключевыми факторами ценообразования. Это такие показатели как среднемесячная фактическая ставка по кредитам, предоставленным московскими банками [9], цена на нефть марки Юралс [10], сезонно-скорректирован-ный ряд широкой денежной массы [11], Индекс МосБир-жи [12], разница между доходностями долгосрочных (10 лет) и среднесрочных (1 год) облигаций [13], Вгуа1и — стоимость бивалютной корзины (значение средневзвешенное из курса доллара США с весом 0,55 и Евро с весом 0,45), руб. [14]. В таблице 1 перечислены обозначения, расшифровка и обоснование выбора для каждого из показателей [1].

Использование данных за период с 2010 по 2022 гг. обусловлен доступностью и надежностью информации за этот временной промежуток. Анализ долгосрочных паттернов и цикличности инфляционных процессов важен для понимания факторов, влияющих на инфляцию [15].

В то же время анализ цикличности инфляции помогает выявить краткосрочные колебания, которые могут быть вызваны экономическими шоками, изменениями в макроэкономической политике или временными факторами спроса

Таблица 1

Факторы, влияющие на инфляцию

№ Обозначение Расшифровка Обоснование выбора

1 ИПЦ (СР1) Индекс потребительских цен Ивановской области на все товары и услуги Инфляция может быть взаимосвязана с ее предыдущими значениями. Прошлые уровни инфляции (высокие или низкие) могут сказываться на текущей инфляции через эффект инерции и формирование инфляционных ожиданий.

2 М1АС1} Среднемесячная фактическая ставка по кредитам (в руб.), предоставленным банками [121 Трансмиссионный механизм влияет на инфляцию через процентную ставку.

3 1)га Цена на нефть марки Юралс [13] Динамика курса рубля к доллару связана с динамикой цен на нефть.

4 Мопеу Сезонно-скорректирован-ный ряд широкой денежной массы [14] Инфляция зависит от количества денег в обращении

5 1МОЕХ Индекс МосБиржи [15] Индекс Мосбиржи может служить индикатором экономического состояния и настроений инвесторов, которые влияют на инфляцию

6 БргеасИт Разница между доходностя-ми долгосрочных (10 лет) и краткосрочных (1 год) облигаций [16] Разница в доходности ценных бумаг за разные периоды может свидетельствовать об изменении ожиданий инвесторов относительно будущей инфляции и влиять на инфляцию через изменения спроса на активы и финансовые условия. [6]

7 В1уа1.1Л Стоимость бивалютной корзины (значение средневзвешенное из курса доллара США с весом 0,55 и Евро с весом 0,45), руб. Бивалютная корзина позволяет сбалансировать рублевый курс, сдерживать инфляцию и не позволять рублю существенно дорожать [14]

208

и предложения [16]. Такими как переход от ставки рефинансирования к ключевой политике таргетирования инфляции, модернизация бюджетного правила в 2022 г. Учет этих циклических факторов позволяет более точно оценить краткосрочные эффекты на инфляцию и разработать соответствующие меры по управлению инфляционными рисками.

Одной из прогнозируемых переменных в гибридной модели машинного обучения является Индекс потребительских цен (СР1), который был прогнозируемых переменных. Остальные переменные выступают в роли предикторов. В исследовании использовалось 177 наблюдений за период с января 2010 г., на основе которых проводилось обучение модели. Прогноз на период с января 2023 г. по январь 2024 г. был построен с использованием указанных предикторов.

В исследовании использовались две модели машинного обучения градиентный бустинг и случайный лес [17].

В работе использовался градиентный бустинг как модель, в которой в первый шаг оценивается дерево решений на всем наборе данных. Оно представлено в виде Ь^х), которое было обучено на первом шаге (формула 1). Градиентный бустинг — это обобщение наработок алгоритмов бустинга, используемых до этого.

Ь£0) = агдтть Е[=1 (Ь(хг - у¿)2 (1)

Ь1(х) — предсказанное значение;

у{ — реальное значение;

I — количество наблюдений в наборе данных.

Затем, во второй шаг модель доучивается на остатках, полученных в процессе первого шага, и итоговый прогноз принимает вид формулы (2):

а(х) = 1Г=1уЛО)(2)

У1 — вес каждого базового алгоритма;

Ь — решающее дерево;

х — сгенерированная нами на основе данных выборка.

Случайный лес — это комбинация решающих деревьев, созданная для уменьшения дисперсии прогнозов и решения проблемы переобучения. Для этого исходная выборка X дублируется N раз, формируя искусственные подвыбор-ки. В каждую искусственную выборку включены случайные признаки. Затем для каждой искусственной выборки построить решающее дерево Ь^х).

Итоговым прогнозом является усреднение результатов всех решающих деревьев формула (3):

аСО=^=1Ь£СО (3)

N — количество деревьев;

i — счетчик для деревьев;

Ь — решающее дерево;

х — сгенерированная нами на основе данных выборка.

Точно невозможно сказать, какая из моделей (с регуляризацией или ансамблевых алгоритмов) даст лучший результат. Однако предполагается, что ансамблевые методы хорошо ра-

210

ботают, когда существуют нелинейные взаимосвязи между факторами и переменной, которые требуют объяснения.

Главное различие состоит в процессе обучения. Деревья в случайном лесу обучаются независимо, одновременно, в то время как в бустинге следующий алгоритм обучается на исправлении ошибок предыдущих этапов (последовательное обучение).

Основным преимуществом бустинга является упрощение решения проблемы переобучения. С помощью валидацион-ной выборки определяется, сколько этапов бустинга нужно оставить, чтобы избежать переобучения, в то время как случайный лес не позволяет этого сделать.

2. Построение гибридной модели машинного обучения: градиентный бустинг и случайный лес

Объединение результатов работы нескольких моделей машинного обучения и получение более объективного прогноза региональной инфляции, возможно при построении при построении гибридной модели. Это дает возможность преодолеть характерные ограничения прогнозных моделей, в том числе за счет более высокой сложности конечного решения. Основная задача в моделирования в данном случае заключается в том, чтобы выбрать и правильно комбинировать набор методов прогнозирования, повысив точность окончательного прогноза. Достижение наибольшей точности происходит из-за сочетания преимуществ отдельных моделей прогнозирования и минимизации их недостатков.

Прогнозная модель двух ансамблей выводится, как среднестатистическая по отношению к результатам каждой из используемых моделей машинного обучения. Данная методика

в среде ML называется блендинг и является простейшей схемой стекинга.

Формула (4), показывает, как выводятся точечные значения для построения прогноза.

а = (4)

а — точечное значение ансамбля для построения прогноза;

Xi — точечное значение модели градиентного бустинга для построения прогноза;

Yi — точечное значение модели случайного леса для построения прогноза.

Выбор данных алгоритмов обусловлен несколькими причинами:

1. Популярность данных моделей, их частое использование в решении задач прогнозирования среди отечественных и зарубежных специалистов, занимающихся прогнозированием [17, 18, 19].

2. Предыдущая работа с данными моделями показала их эффективность в прогнозировании инфляции [1]. Они дают возможность пользоваться неограниченным количеством вводных данных и выстраивать ранжированные схемы по силе влияния каждого из рассматриваемых факторов, а для анализа полученных результатов выявление степени важности переменной является неотъемлемой функцией исследования.

3. Обработка данных для двух этих моделей идентична, поэтому при написании кода есть возможность совместить этот процесс, сократив существенные затраты на обработку материала (1 этап).

212

4. Несмотря на сходство моделей, которые представляют собой ансамбли деревьев решений, они отличаются процессом обучения и тем, как они объединяют результаты отдельных деревьев. Оба алгоритма представляют ансамбли, но основаны на разных принципах работы. В случайном лесе допускается параллельное обучение и выполнение, а в градиентном бустинге — нет (только последовательно). Следовательно, в итоге получаются два независимых друг от друга прогноза, которые при соответствующей обработке дадут более объективную картину, нежели один из них.

Для разработки программного кода гибридной прогнозной модели был объединен процесс обработки данных для двух моделей, так как он был абсолютно идентичен в обоих случаях. Код был написан на языке программирования Python 3, а для построения графиков использовались наиболее удобные и широко используемые фреймворк Scikit-learn и библиотека Matplotlib. Эта библиотека обладает отличной поддержкой множества сред, таких как веб-серверы приложений, графические библиотеки пользовательского интерфейса, Jupiter Notebook, iPython Notebook и оболочка iPython. Scikit-learn является универсальной библиотекой с открытым исходным кодом для анализа данных, написанной на Python, и основан на других популярных библиотеках Python, таких как NumPy, SciPy и matplotlib. Он содержит ряд реализаций для различных популярных алгоритмов машинного обучения.

3. Итоги работы моделей

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В таблице 2 представлены результаты прогноза инфляции модели градиентного бустинга для периода с 01.04.2023 по 01.03.2024.

Таблица 2

Прогноз градиентного бустинга

№ Дата Индекс ИПЦ, в %

21 01.04.2023 103,71

к2 01.05.2023 102,91

33 01.06.2023 103,47

44 01.07.2023 104,47

55 01.08.2023 105,99

66 01.09.2023 107,32

77 01.10.2023 108,70

88 01.11.2023 109,27

99 01.12.2023 109,68

110 01.01.2024 110,21

111 01.02.2024 109,88

112 01.03.2024 109,93

Таблица 3 Прогноз случайного леса

№ Дата Индекс ИПЦ, в %

11 01.04.2023 104,07

22 01.05.2023 102,83

33 01.06.2023 103,70

44 01.07.2023 104,77

55 01.08.2023 106,22

66 01.09.2023 107,76

77 01.10.2023 109,06

88 01.11.2023 109,79

99 01.12.2023 110,18

110 01.01.2024 110,75

111 01.02.2024 110,27

112 01.03.2024 110,26

214

Таблица 4

Прогноз гибридной модели градиентного бустинга и случайного леса

№ Дата Индекс ИПЦ, в %

1 01.04.2023 103,89

2 01.05.2023 102,87

3 01.06.2023 103,59

4 01.07.2023 104,62

5 01.08.2023 106,10

6 01.09.2023 107,54

7 01.10.2023 108,88

8 01.11.2023 109,53

9 01.12.2023 109,93

10 01.01.2024 110,48

11 01.02.2024 110,08

12 01.03.2024 110,09

В таблице 3 представлены результаты прогноза инфляции модели случайного леса для этого же периода прогнозирования.

В таблице 4 представлены результаты прогноза гибридной модели градиентного бустинга и случайного леса.

Согласно таблице 4, полученный прогноз для изменения ИПЦ в период с 01.04.2023 по 01.03.2024 составляет 7,61%. Данный прогноз может быть нарушен в случае возникновения геополитических факторов, поскольку модели машинного обучения не учитывают такие «шоковые» события. Это является существенным недостатком подобных прогнозных моделей, и при появлении новых непредсказуемых условий в мировой и российской экономике может возникнуть необходимость в построении альтернативных прогнозов.

г 4 и ¿Л «Н й.Ч ¿И й з1 й*4

Рис. 1. Важность переменных для ИПЦ в модели градиентный бустинг

Важность переменных в модели градиентного бустинга представлена графически на рисунке 1.

Наиболее значимыми оказались следующие показатели:

1) среднемесячная фактическая ставка по кредитам (в руб.), предоставленным банками в прошлом месяце;

2) индекс МосБиржи;

3) сезонно-скорректированный ряд широкой денежной массы.

Важность переменных в модели случайного леса представлена графически на рисунке 2.

Наиболее значимыми в этой модели оказались показатели:

21

Цм.к^п/Цчич сги ЛИЛ. ГМСО

-I

[ .........._ |Д I

Рис. 2. Важность переменных для ИПЦ в модели случайный лес

1) среднемесячная фактическая ставка по кредитам (в руб.), предоставленным банками в прошлом месяце;

2) индекс потребительских цен Ивановской области на все товары и услуги месяц назад;

3) стоимость бивалютной корзины месяц назад (значение средневзвешенное из курса доллара США с весом 0,55 и евро с весом 0,45).

На графике (рис. 3) отражены результаты обучения моделей и построенный прогноз региональной инфляции, начиная с марта 2023 г. Красным цветом представлен график модели градиентного бустин-га, зеленым — случайного леса, а черным — гибридной модели градиентного бустинга и случайного леса. На графиках также присутствует период обучения, на

Рис. 3. График, показывающий период обучения и прогноза модели градиентного бустинга, случайного леса и гибридной модели

котором представлены фактические данные. Однако, так как график фактических наблюдений совпадает с гоасЬиком модели гоалиентного бустинга на оисунке 3.

Про* паэь. нал*"« н г 14 » "¡КГ. *

Рис. 4. График прогноза гибридной модели градиентного бустинга и случайного леса

218

он не отображен на графике. Результаты прогнозирования могут быть использованы для принятия решений в экономических и финансовых областях, однако следует учитывать, что прогнозы, полученные с помощью моделей машинного обучения, не учитывают возможных «шоковых» событий, что является их ограничением.

На рисунке 4 показан график обучения и прогноза гибридной модели на период с 02.2023 по 01.2024 включительно.

Полученные результаты были протестированы с помощью метода кросс-валидации. Выборка была разбита на пять подгрупп. Четыре подгруппы шли на тренировку модели, а одна на тестирование. И так поочередно в тестирова-

Таблица 5

Средняя абсолютная ошибка прогноза ИПЦ и средняя минимальная

абсолютная ошибка предсказания в тренировочном фолде ИПЦ

Метрика Случайный Градиентный Гибридная

лес бустинг модель

Средняя абсолютная 0,489 0,536 0,498

ошибка ИПЦ

Средняя минимальная 0,017 0,033 0,019

абсолютная ошибка

предсказания

в тренировочном фолде ИПЦ

Средняя максимальная 3,611 3,499 3,528

абсолютная ошибка

предсказания

в тренировочном фолде ИПЦ

Максимальная 8,470 8,161 8,315

абсолютная ошибка (Май 2021) (Май 2021) (Май 2021)

предсказания ИПЦ

нии участвовали все данные. Каждая из подгрупп была один раз на этапе тестирования и четыре раза на этапе обучения.

В таблице 5 приведены результаты сравнения моделей по следующим показателям: средняя абсолютная ошибка прогноза ИПЦ и средняя минимальная абсолютная ошибка предсказания в тренировочном фолде ИПЦ.

Модели прогнозирования инфляции играют важную роль в предсказании будущих уровней цен [20]. Они позволяют учитывать сложные взаимосвязи и зависимости в данных, включая нелинейные и неочевидные паттерны, что помогает учитывать реальные факторы, влияющие на инфляцию.

Выводы

Результаты исследования показали, что гибридная модель, объединяющая градиентный бустинг и случайный лес, демонстрирует более точный прогноз региональной инфляции на 2023 г. по сравнению с результатами каждой модели в отдельности.

Было исследовано влияние различных экономических факторов на региональную инфляцию в России. В результате было обнаружено, что среди рассмотренных факторов, оказывают заметное влияние на региональную инфляцию:

— среднемесячная фактическая ставка по кредитам (в руб.), предоставленным банками в прошлом месяце (MIACR);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— индекс потребительских цен Ивановской области на все товары и услуги месяц назад (ИПЦ (СР1));

— стоимость бивалютной корзины месяц назад (значение средневзвешенное из — курса доллара США с весом 0,55 и евро с весом 0,45) (Вгуа!и^);

220

— индекс МосБиржи (IMOEX);

— сезонно-скорректированный ряд широкой денежной массы (Money).

Выявлено, что существующие модели машинного обучения, применяемые для прогнозирования экономических показателей, обычно не учитывают возможные «шоковые» события. Это означает, что при появлении новых непредсказуемых условий в мировой или российской экономике данные модели могут предоставить альтернативные варианты прогнозов, которые не всегда соответствуют реальным изменениям.

В связи с этим в продолжении исследования в данном направлении необходимо разработать общую систему, основанную на гибридных моделях машинного обучения. Такие модели могут включать комбинацию различных подходов, таких как рекуррентные нейронные сети, линейная регрессия и другие методы машинного обучения.

Библиографический список

1. Астраханцева И.А., Герасимов А.С., Астраханцев Р.Г. Прогнозирование региональной инфляции с помощью алгоритмов машинного обучения. Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. — 2022. — № 4(54). — С. 6-13. DOI 10.6060/ivecofin.2022544.620. — EDN ITYDFE.

2. Инфляция в России в 2023 году: прогнозы и реальный рост уровня цен. Информационно-аналитическое финансовое издание «Банки Сегодня» 14.12.2022, Выпуск #073 [Электронный источник]. Доступ по ссылке: https://bankstoday. net/last-articles/inflyatsiya-v-rossii-2023 (дата обращения: 30.01.2023).

3. Официальный сайт. АРБ. Ассоциация Российских банков. Про деньги. Индекс потребительских цен. [Электронный источник] Доступ по ссылке: https://arb.ru/ (дата обращения: 30.01.2023).

4. Федеральная служба государственной статистики (Росстат). [Электронный источник] Доступ по ссылке: https://rosstat.gov. ru/price (дата обращения: 30.01.2023).

5. Астраханцева И.А., Астраханцев Р.Г. Экономическая сущность и правовой статус криптовалют. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. № 4 (46). 2020. С. 3-13. DOI: 10.6060/ ivecofin.2020464.502.

6. Akhmatov КЬА., Astrakhantseva I.A., Kutuzova A.S., Votchel L.M., Vikulina V.V. Harmonization of banking business models with the needs of the economy by encouraging the exogenous social responsibility. Journal OualityAccess to Success. 2020. Vol. 21. № 174. P. 81-87.

7. Астраханцева И.А., Кутузова А.С., Астраханцев Р.Г. Рекуррентные нейронные сети для прогнозирования региональной инфляции. Научные труды Вольного экономического общества России. 2020. Т. 223. № 3. С. 420-431. DOI: 10.38197/2072-20602020-223-3-420-431. EDN OAHOYN.

8. Балацкий Е.В., Юревич М.А. Прогнозирование инфляции: практика использования синтетических процедур. Мир новой экономики. 2018. № 4. С.20-31.

9. Среднемесячная фактическая ставка по кредитам (в руб.), предоставленным московскими банками [Электронный источник]. Доступ по ссылке: http://www.cbr.ru/hd_base/mkr/mkr_base/ (дата обращения: 10.10.2023).

10. Цена на нефть марки Юралс. [Электронный источник]. Доступ по ссылке: https://www.minfin.ru/ru/press-center/ (дата обращения: 30.01.2023).

11. Сезонно-скорректированный ряд широкой денежной массы [Электронный источник]. Доступ по ссылке: https://www.cbr.ru/ statistics/macro_itm/dkfs/ (дата обращения: 30.01.2022).

12. Индекс МосБиржи [Электронный источник]. Доступ по ссылке: https://www.moex.com/ru/index/IM0EX/archive/#/from=2008-12-01&till=2019-10-01&sort=TRADEDATE&order=desc (дата обращения: 30.01.2023).

13. Спред между доходностями долгосрочных (10 лет) и среднесрочных (1 год) облигаций. [Электронный источник]. Доступ по ссылке: http://www.cbr.ru/hd_base/zcyc_params/ (дата обращения: 30.01.2023).

14. Курс валют — Курс ЦБ — Курс валют ЦБ РФ [Электронный источник]. Доступ по ссылке: https://www.kursvaliut.ru (дата обращения: 30.01.2023).

15. Астраханцева И.А., Астраханцев Р.Г. Экономическая сущность и правовой статус криптовалют. Известия высших учебных заведений. Серия «Экономика, финансы и управление производством» [Ивэкофин]. № 4 (46). 2020. С. 3-13. DOI: 10.6060/ ivecofin.2020464.502.

16. Байбуза И. Прогнозирование инфляции с помощью методов машинного обучения. Деньги и кредит. — 2018. — № 4. — С. 42-59.

17. Astrakhantseva I., Kutuzova A., Astrakhantsev R. Artificial Neural Networks in Inflation Forecasting at the MesoLevel. SHS Web of Conferences: III International on New Industrialization and Dig-italization (NID 2020). Ekaterinburg: EDP Sciences. 2021. P. 02005. DOI: 10.1051/ shsconf/20219302005.

18. Картиев С.Б., Курейчик В.М. Алгоритм классификации, основанный на принципах случайного леса, для решения задачи прогнозирования.Программные продукты и системы. Компьютерные и информационные науки — 2016 — № 2 — С 11-15. DOI 10.15827/0236-235X.

19. О. Семитуркин, А. Шевелев. Прогнозирование региональной инфляции с помощью методов машинного обучения на примере макрорегиона Сибирь. Банк России. Серия докладов об экономических исследованиях. № 91 Март 2022. [Электронный источник]. Доступ по ссылке: https://cbr.ru/ec_research/ser/ wp_91/.

20. Свидетельство о государственной регистрации программы для ЭВМ № 2022680832 Российская Федерация. Приложение для построения модели и прогнозирования индекса потребительских цен: № 2022680125: заявл. 27.10.2022: опубл. 07.11.2022 / Р.Г. Астраханцев, И.А. Астраханцева, А.С. Кутузова; заявитель Федеральное государственное бюджетное образовательное учреждение высшего образования «Ивановский государственный химико-технологический университет». - EDN BYDGBY.

References

1. Astrakhantseva I.A., Gerasimov A.S., Astrakhantsev R.G. Prognozirovanie regional>noi inflyatsii s pomoshch>yu algoritmov mashinnogo obucheniya. Izvestiya vysshikh uchebnykh zavedenii. Seriya: Ehkonomika, finansy i upravlenie proiz-vodstvom. - 2022. - № 4(54). - S. 6-13. DOI 10.6060/ivecof-in.2022544.620. - EDN ITYDFE.

2. Inflyatsiya v Rossii v 2023 godu: prognozy i real'nyi rost urovnya tsen. Informatsionno-analiticheskoe finansovoe izdanie «Banki Se-godnYA» 14.12.2022, Vypusk #073 [Ehlektronnyi istochnik]. Dostup po ssylke: https://bankstoday.net/last-articles/inflyatsiya-v-ros-sii-2023 (Data obrashcheniya: 30.01.2023).

3. Ofitsial'nyi sait. ARB. Assotsiatsiya Rossiiskikh bankov. Pro den'gi. Indeks potrebitel'skikh tsen. [Ehlektronnyi istochnik] Dostup po ssylke: https://arb.ru/ (Data obrashcheniya: 30.01.2023).

224

4. Federal'naya sluzhba gosudarstvennoi statistiki (Rosstat). [Ehlek-tronnyi istochnik] Dostup po ssylke: https://rosstat.gov.ru/price (Data obrashcheniya: 30.01.2023).

5. Astrakhantseva I.A., Astrakhantsev R.G. Ehkonomicheskaya su-shchnost' i pravovoi status kriptovalyut. Izvestiya vysshikh uchebnykh zavedenii. Seriya «Ehkonomika, finansy i upravlenie proizvodstvoM» [Ivehkofin]. № 4 (46). 2020. S. 3-13. DOI: 10.6060/ ivecofin.2020464.502.

6. Akhmatov Kh.A., Astrakhantseva I.A., Kutuzova A.S., Votchel L.M., Vikulina V.V. Harmonization of banking business models with the needs of the economy by encouraging the exogenous social responsibility. Journal OualityAccess to Success. 2020. Vol. 21. № 174. P. 81-87.

7. AstrakhantsevaI.A.,KutuzovaA.S.,AstrakhantsevR.G.Rekurrentnye neironnye seti dlya prognozirovaniya regional>noi inflyatsii. Nauchnye trudy Vol'nogo ehkonomicheskogo obshchestva Rossii. 2020. T. 223. № 3. S. 420-431. DOI: 10.38197/2072-2060-2020-2233-420-431. EDN OAHOYN.

8. Balatskii E.V., Yurevich M.A. Prognozirovanie inflyatsii: praktika ispol'zovaniya sinteticheskikh protsedur. Mir novoi ehkonomiki. 2018. № 4. S.20-31.

9. Srednemesyachnaya fakticheskaya stavka po kreditam (v rub.), predostavlennym moskovskimi bankami [Ehlektronnyi istochnik]. Dostup po ssylke: http://www.cbr.ru/hd_base/mkr/mkr_base/ (Data obrashcheniya: 10.10.2023).

10. Tsena na neft' marki Yurals. [Ehlektronnyi istochnik]. Dostup po ssylke: https://www.minfin.ru/ru/press-center/ (Data obrashcheniya: 30.01.2023).

11. Sezonno-skorrektirovannyi ryad shirokoi denezhnoi massy [Ehlektronnyi istochnik]. Dostup po ssylke: https://www.cbr.ru/statistics/ macro_itm/dkfs/ (Data obrashcheniya: 30.01.2022).

12. Indeks MoSBirzhi [Ehlektronnyi istochnik]. Dostup po ssylke: https://www.moex.com/ru/index/IMOEX/archive/#/from=2008-12-01&till=2019-10-01&sort=TRADEDATE&order=desc (Data obrash-cheniya: 30.01.2023).

13. Spred mezhdu dokhodnostyami dolgosrochnykh (10 let) i srednes-rochnykh (1 god) obligatsii. [Ehlektronnyi istochnik]. Dostup po ssylke: http://www.cbr.ru/hd_base/zcyc_params/ (Data obrash-cheniya: 30.01.2023).

14. Kurs valyut - Kurs TSB - Kurs valyut TSB RF [Ehlektronnyi istochnik]. Dostup po ssylke: https://www.kursvaliut.ru (Data obrashcheniya: 30.01.2023).

15. Astrakhantseva I.A., Astrakhantsev R.G. Ehkonomicheskaya su-shchnost' i pravovoi status kriptovalyut. Izvestiya vysshikh uchebnykh zavedenii. Seriya «Ehkonomika, finansy i upravlenie proizvodstvoM» [Ivehkofin]. № 4 (46). 2020. S. 3-13. DOI: 10.6060/ ivecofin.2020464.502.

16. Baibuza I. Prognozirovanie inflyatsii s pomoshch'yu metodov mash-innogo obucheniya. Den>gi i kredit. 2018. № 4. S. 42-59.

17. Astrakhantseva I., Kutuzova A., Astrakhantsev R. Artificial Neural Networks in Inflation Forecasting at the MesoLevel. SHS Web of Conferences: III International on New Industrialization and Digi-talization (NID 2020). Ekaterinburg: EDP Sciences. 2021. P. 02005. DOI: 10.1051/ shsconf/20219302005.

18. Kartiev S.B., Kureichik V.M. Algoritm klassifikatsii, osnovannyi na printsipakh sluchainogo lesa, dlya resheniya zadachi prognozirovaniya. Programmnye produkty i sistemy. Komp'yuternye i informatsionnye nauki - 2016 - № 2 - S. 11-15 -DOI 10.15827/0236-235X.

19. O.Semiturkin. A.Shevelev. Prognozirovanie regional'noi inflyatsii s pomoshch'yu metodov mashinnogo obucheniya na primere mak-roregiona Sibir'. Bank Rossii. Seriya dokladov ob ehkonomicheskikh

22

issledovaniyakh. № 91 Mart 2022. [Ehlektronnyi istochnik]. Dostup po ssylke: https://cbr.ru/ec_research/ser/wp_91/. 20. Svidetel'stvo o gosudarstvennoi registratsii programmy dlya EHVM № 2022680832 Rossiiskaya Federatsiya. Prilozhenie dlya postroeniya modeli i prognozirovaniya indeksa potrebitel'skikh tsen: № 2022680125: zayavl. 27.10.2022: opubl. 07.11.2022 / R.G. As-trakhantsev, I.A. Astrakhantseva, A.S. Kutuzova; zayavitel' Feder-al'noe gosudarstvennoe byudzhetnoe obrazovatel'noe uchrezhdenie vysshego obrazovaniya "Ivanovskii gosudarstvennyi khimiko-tekhno-logicheskii universitet". — EDN BYDGBY.

Контактная информация / Contact information

ФГБОУ ВО «Ивановский государственный химико-технологический университет», Шереметевский проспект, д.7. Иваново, 153000, Россия Ivanovo state university of chemistry and technology, Sheremetev avenue, 7, Ivanovo, 153000, Russia

Ирина Александровна Астраханцева/ Irina A. Astrakhantseva i.astrakhantseva@mail.ru

Герасимов Александр Сергеевич / Alexandr S. Gerasimov aleksandr132542255@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.