Научная статья на тему 'ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ С ПОМОЩЬЮ РЕКУРРЕНТНОЙ И СВЕРТОЧНОЙ НЕЙРОННЫХ СЕТЕЙ'

ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ С ПОМОЩЬЮ РЕКУРРЕНТНОЙ И СВЕРТОЧНОЙ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Рекуррентные нейронные сети (RNN) / долгосрочная краткосрочная память (LSTM) / сверточные нейронные сети (CNN) / прогнозирование региональной инфляции / машинное обучение / обработка данных / временные ряды / Recurrent neural networks (RNN) / long-term short-term memory (LSTM) / convolutional neural networks (CNN) / forecasting regional inflation / machine learning / data processing / time series

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Астраханцева Ирина Александровна, Герасимов Александр Сергеевич

В статье представлен подробный анализ возможности прогнозирования региональной инфляции с использованием рекуррентных нейронных сетей (RNN), в частности, модулей LSTM, и сверточных нейронных сетей (CNN). Исследование начинается с описания методов измерения инфляции и принципов работы выбранных типов моделей машинного обучения. Далее, авторы детально описывают этапы построения моделей и полученные результаты. Исследование демонстрирует, что обе технологии могут быть эффективно использованы в этой области, однако каждая из них имеет свои предпочтительные области применения. LSTM выделяется своей способностью улавливать временные зависимости в данных об инфляции, что делает её идеальной для анализа временных рядов и краткосрочных прогнозов. CNN же оказывается мощным инструментом для выявления ключевых характеристик и шаблонов в данных. Модель является особенно полезной для долгосрочных прогнозов, основанных на пространственных характеристиках. Выбор между этими двумя подходами должен базироваться на специфике задачи и характеристиках данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Астраханцева Ирина Александровна, Герасимов Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING REGIONAL INFLATION USING RECURRENT AND CONVOLUTIONAL NEURAL NETWORKS

The article presents a detailed analysis of the possibility of forecasting regional inflation using recurrent neural networks (RNN), in particular, LSTM modules, and convolutional neural networks (CNN). The study begins with a description of the methods of measuring inflation and the principles of operation of the selected types of machine learning models. Further, the authors describe in detail the stages of model construction and the results obtained. The study demonstrates that both technologies can be effectively used in this area; however, each of them has its own preferred applications. LSTM stands out for its ability to capture time dependencies in inflation data, which makes it ideal for time series analysis and short-term forecasts. CNN is proving to be a powerful tool for identifying key characteristics and patterns in data. The model is particularly useful for long-term forecasts based on spatial characteristics. The choice between these two approaches should be based on the specifics of the task and the characteristics of the data

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ С ПОМОЩЬЮ РЕКУРРЕНТНОЙ И СВЕРТОЧНОЙ НЕЙРОННЫХ СЕТЕЙ»

ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ С ПОМОЩЬЮ РЕКУРРЕНТНОЙ И СВЕРТОЧНОЙ НЕЙРОННЫХ СЕТЕЙ

FORECASTING REGIONAL INFLATION USING RECURRENT AND CONVOLUTIONAL NEURAL NETWORKS

Астраханцева Ирина Александровна

Заведующий кафедрой информационных технологий и цифровой экономики ФГБОУ ВО «Ивановский государственный химико-технологический университет», руководитель Ивановской региональной организации ВЭО России, доктор экономических наук, доцент

Irina A. Astrakhantseva

Head of the Department of Information Technologies and Digital Economy, Ivanovo State University of Chemical Technology, Head of the Ivanovo regional organization of the VEO of Russia, Doctor of Economics, Associate Professor

Герасимов Александр Сергеевич

Магистр, ФГБОУ ВО «Ивановский государственный химико-технологический университет»

Alexandr S. Gerasimov

Master, Ivanovo State University of Chemical Technology

Аннотация

В статье представлен подробный анализ возможности прогнозирования региональной инфляции с использованием рекуррентных нейронных сетей (RNN), в частности, модулей LSTM, и сверточных нейронных сетей (CNN).

Исследование начинается с описания методов измерения инфляции и принципов работы выбранных типов моделей машинного обучения. Далее, авторы детально описывают этапы построения моделей и полученные результаты.

Исследование демонстрирует, что обе технологии могут быть эффективно использованы в этой области, однако каждая из них имеет свои предпочтительные области применения. LSTM выделяется своей способностью улавливать временные зависимости в данных об инфляции, что делает её идеальной для анализа временных рядов и краткосрочных прогнозов.

CNN же оказывается мощным инструментом для выявления ключевых характеристик и шаблонов в данных. Модель является особенно полезной для долгосрочных прогнозов, основанных на пространственных характеристиках.

Выбор между этими двумя подходами должен базироваться на специфике задачи и характеристиках данных.

Abstract

The article presents a detailed analysis of the possibility of forecasting regional inflation using recurrent neural networks (RNN), in particular, LSTM modules, and convolutional neural networks (CNN).

The study begins with a description of the methods of measuring inflation and the principles of operation of the selected types of machine learning models. Further, the authors describe in detail the stages of model construction and the results obtained.

The study demonstrates that both technologies can be effectively used in this area; however, each of them has its own preferred applications. LSTM stands out for its ability to capture time dependencies in inflation data, which makes it ideal for time series analysis and short-term forecasts.

CNN is proving to be a powerful tool for identifying key characteristics and patterns in data. The model is particularly useful for long-term forecasts based on spatial characteristics.

The choice between these two approaches should be based on the specifics of the task and the characteristics of the data

Ключевые слова

Рекуррентные нейронные сети (RNN), долгосрочная краткосрочная память (LSTM), сверточные нейронные сети (CNN), прогнозирование региональной инфляции, машинное обучение, обработка данных, временные ряды.

Keywords

Recurrent neural networks (RNN), long-term short-term memory (LSTM), convolutional neural networks (CNN), forecasting regional inflation, machine learning, data processing, time series.

Введение

При современной динамичности и нестабильности мировой экономики, задача ее прогнозирования выходит на первый план. Стремясь к таргетированию инфляции, центральные банки сталкиваются с серьезными вызовами в условиях макроэкономических шоков и волатильности рынков. Для принятия эффективных экономических решений требуются все более точные прогнозы инфляции. [1],[2],[3]

Однако традиционные эконометрические модели часто не справляются с задачами прогнозирования в условиях непостоянства и волатильности экономических временных рядов. Как указывается в исследованиях Стока Д. и Уотсона М. [4] качество прогнозов ухудшается, а для серьезного прорыва в этом вопросе требуется новый подход к прогнозированию. Также данная проблема усугубляется дополнительными ограничениями, такими как отсутствие стационарности данных и влияние сезонных факторов [5].

Методы же машинного обучения, в частности рекуррентные и сверточные нейронные сети, представляют собой перспективное направление, способное повысить качество прогнозирования [3]. Для реализации их инновационного потенциала требует разработка специализированных алгоритмов и оценки их эффективности. В работах Павлова Е. и Байбуза И. [6],[7] демонстрируются активное применения различных методов машинного обучения, таких как Lasso, Ridge, Elastic Net и др. Но, несмотря на анализ базовых методов, необходимо и глубокое исследование более сложных современных нейронных сетей, включая LSTM и CNN для оценки их потенциала в прогнозировании макроэкономических показателей.

Среди различных методов машинного обучения эти сети выделяются своей способностью эффективно обрабатывать сложные временные ряды и выявлять скрытые взаимосвязи в данных. RNN, имея уникальную архитектуру, идеально подходят для анализа последовательных данных, таких как временные ряды. Это делает их особенно полезными для прогнозирования динамических экономических процессов. С другой стороны, CNN, которые первоначально были разработаны для анализа визуальной информации, также находят применение в обработке временных рядов. С их помощью появляется возможность эффективно извлекать характеристики из данных.

В данной статье описана работа по созданию моделей рекурреной и сверточной нейронных сетей для прогнозирования региональной инфляции. Исследование также было направлено на анализ и сравнение этих двух типов нейросетей, чтобы определить их преимущества и ограничения в экономическом прогнозировании.

Задачи исследования включали сбор и предварительную обработку соответствующих данных, разработку и обучение RNN и CNN моделей, проведение серии экспериментов для оценки их производительности, анализ полученных результатов. Результаты данного исследования предполагается использовать для улучшения методов прогнозирования инфляции, что будет способствовать более эффективному экономическому планированию и разработке экономической стратегии на региональном уровне.

Метод измерения инфляции

В работе в качестве основного индикатора инфляции был выбран индекса потребительских цен. Был сделан прогноз индекса потребительских цен Ивановского региона (CPI) от месяца к месяцу (м/м) на год вперед (на 12 месяцев с октября 2023 года по сентябрь 2024 года). Он вычислялся как отношение абсолютных значений CPI в текущем месяце к прошлому месяцу, см. формулу 1.

Рм/м = Р1/Р0 ×100 % (1)

где:

Р – индекс потребительских цен от месяца к месяцу;

Р1 – абсолютное значение ИПЦ в текущем месяце;

Р0 – абсолютное значение ИПЦ в прошлом месяце.

Данная методика, известная под именем немецкого экономиста Этьена Ласпейреса, служит для измерения изменений в ценах на товары и услуги. Этот подход используется для расчета официального индекса потребительских цен, который отражает колебания цен в текущем периоде по сравнению с выбранным базовым периодом, при этом анализируются товары и услуги, продававшиеся в базисный период. Таким образом, видна степень изменения цен на базисные товары и услуги в текущем периоде. В России эта методика применяется с 1991 года и играет ключевую роль в экономическом анализе. На международном уровне индекс Ласпейреса используется с 1864 года, что свидетельствует о его долгосрочной важности и надежности в экономических исследованиях.

Выбранный авторами базовый период, а именно, измерения Индекс Потребительских Цен (ИПЦ) на месячной основе является одним из ключевых индикаторов, отражающим динамику изменения стоимости товаров и услуг в потребительской корзине за месячный период. В контексте Российской Федерации, этот показатель месячной инфляции рассчитывается Федеральной службой государственной статистики, Росстатом, путем анализа изменений в индексе потребительских цен по сравнению с предшествующим месяцем.

Важность индекса потребительских цен заключается в его значительном влиянии на денежно-кредитную политику, в частности, на уровень ключевой процентной ставки, устанавливаемой Центральным Банком России. Наблюдается четкая зависимость: повышение инфляции приводит к увеличению ключевой ставки Центральным Банком и, наоборот — при снижении инфляции ключевая ставка обычно уменьшается. Данная политика направлена на достижение целей инфляционного таргетирования, что является одной из основных задач Центрального Банка.

Принципы работы выбранных типов нейронных сетей

Выбор в данном исследовании моделей LSTM и CNN связан с их особенностями и принципами их работы.

Сверточные нейронные сети (CNN) и долгосрочная краткосрочная память (LSTM) являются видами нейронных сетей, при этом LSTM - это разновидность рекуррентных нейронных сетей. Поскольку оба вида они обладают способностью к анализу сложных данных (CNN может эффективно обрабатывать пространственные данные для выявления тенденций, в то время как LSTM идеально подходят для анализа временных рядов и улавливания долгосрочных зависимостей в экономических данных) авторам показалось целесообразным использовать их в своей работе.

В построении данных моделей использовались методы машинного обучения, которые интересуют авторов данной работы, чтобы в дальнейшем иметь возможность выбирать наиболее эффективные. Ранее для прогнозирования инфляции были построены модель градиентного бустинга и гибридная модель градиентного бустинга и случайного леса. [1], [2].

Принцип работы рекуррентных нейронных сетей [8] и, в частности, модулей LSTM (Long Short-Term Memory), заключается в добавлении элемента памяти к стандартной нейронной сети. Это позволяет им эффективно обрабатывать временные последовательности данных и улавливать как краткосрочные, так и долгосрочные зависимости в этих данных [9].

Механизм памяти в отличие от традиционных RNN, LSTM имеет уникальную структуру, позволяющую избежать проблемы так называемой "долговременной зависимости". Это достигается благодаря специальной архитектуре, которая позволяет сети "запоминать" или "забывать" информацию в зависимости от ее актуальности.

Основными элементами LSTM являются ячейки памяти, а также фильтры, такие как фильтры забывания, входные и выходные фильтры. Эти фильтры регулируют, какая информация сохраняется, обновляется или удаляется на каждом шаге временной последовательности. Также LSTM отличается от других архитектур и тем, что не применяет функцию активации внутри своих рекуррентных компонентов, что предотвращает размывание значений с течением времени. [8]

Этот подход обеспечивает сохранение градиента на протяжении длительных временных интервалов, что является важным для эффективного обучения сети методом обратного распространения ошибки. Благодаря своей архитектуре, LSTM способна сохранять информацию не только на короткие, но и на длительные временные интервалы, что делает ее идеальным инструментом для анализа сложных временных рядов, включая экономические данные.

В LSTM-блоках, матрицы весов W и U играют ключевую роль в управлении активностью внутренних вентилей. Эти веса адаптируются для обработки как входящей информации на текущем шаге (например, xt), так и информации, полученной от предыдущего состояния (ht−1). Каждый вентиль в LSTM-блоке использует эти веса для решения, какая информация должна быть сохранена или отброшена. Позволяя блоку эффективно регулировать свою память. Обучение этих весов через процесс, известный как обратное распространение ошибки во времени, позволяет LSTM-блоку оптимизировать свою работу, уменьшая ошибки и улучшая обработку данных во времени.

Принцип работы сверточных нейронных сетей (CNN) заключается в использовании специальных сверточных операций для анализа входных данных. Эти сети, в основном используемые в обработке изображений, способны эффективно извлекать важные признаки благодаря своей уникальной архитектуре. Сверточные слои, являясь основными компонентами CNN, применяют набор фильтров к входным данным для генерации карт признаков. Эти карты содержат информацию об особенностях входных данных, таких как края или текстуры на изображениях.

В отличие от традиционных нейронных сетей, CNN имеют структуру, позволяющую сохранять пространственные отношения между данными, что критически важно для визуального анализа. Это достигается благодаря локальной области восприятия сверточных слоев, где каждый фильтр взаимодействует только с частью входных данных. После сверточных слоев следуют слои пулинга, которые уменьшают размерность данных, сохраняя при этом наиболее важные признаки. [10,14]

Дополнительно, в CNN используются полносвязные слои для классификации или регрессии на основе извлеченных признаков. В этих слоях, данные из предыдущих слоев объединяются, обеспечивая возможность принятия решений.

CNN отличаются от других архитектур также тем, что они обрабатывают данные с учетом их иерархической структуры. Начиная с простых признаков и постепенно переходя к более сложным паттернам, сеть способна эффективно анализировать сложные данные. Это особенно важно в задачах, где входные данные обладают высокой размерностью и сложной структурой, как в случае с изображениями.

Применение CNN не ограничивается только обработкой изображений. Они также могут быть адаптированы для анализа временных рядов, звуковых данных и даже текста, что делает их универсальными инструментами в сфере машинного обучения.[11][12]

Построение моделей

Для разработки программного кода прогнозных моделей RNN и LSTM использовался язык программирования Python, который является идеальным выбором, учитывая его широкие возможности и популярность в сфере науки о данных и машинного обучения. Также для выполнения данной задачи использовались нижеприведенные библиотеки Python.

NumPy - эта библиотека играет ключевую роль в численных вычислениях, предлагая обширный набор математических функций. Использование NumPy особенно ценно для эффективной работы с многоуровневыми массивами данных, что важно при обработке и анализе больших объемов информации, характерных для временных рядов.

Pandas и Pandas Profiling - эта библиотека Pandas известна своими возможностями в области анализа и обработки данных. Она предоставляет мощные инструменты для манипуляций с данными и их очистки, включая поиск и обработку недостающих значений и выбросов. Pandas Profiling может быть полезен для предварительного анализа данных, предоставляя автоматически генерируемые отчеты, которые включают описательную статистику и другую полезную информацию о наборе данных.

PyTorch - это динамичная и понятная библиотека для машинного обучения на Python. Она идеально подходит для экспериментов с глубоким обучением благодаря своей гибкости и поддержке GPU, охватывая задачи от компьютерного зрения до обработки естественного языка. Её легкая совместимость с другими библиотеками Python и активность пользователей делают PyTorch доступным как для начинающих, так и для опытных специалистов в области искусственного интеллекта.

Также в данной работе использовались инструменты и библиотеки, необходимые для анализа данных и разработки моделей машинного обучения, таких как TensorFlow, PyTorch, scikit-learn и другие. Этот набор обеспечивает комплексный и гибкий инструментарий для создания, тестирования и анализа прогнозных моделей, позволяя авторам эффективно обрабатывать и анализировать данные, строить и оптимизировать модели нейронной сети, а также проводить всесторонний анализ результатов.

Написание кода двух используемых в работе нейронных сетей включало в себя следующие этапы:

1. Импортировались вышеперечисленные библиотеки.

2. Производились сбор, загрузка и предварительная обработка данных для обучения и тестирования сети. Это включало в себя анализ структуры данных, чтение данных из файлов, фильтрацию, преобразование в необходимые форматы, нормализацию (для LSTM), определялись обучающие, тестовые, валидационные наборы.

Были использованы показатели потребительских цен Ивановского региона от месяца к месяцу (CPI) с 01.02. 2009 г. по 01.12.2023 г. (см. рис.1.), всего 179 значений. [13]

Рис. 1. Данные для обучения и тестирования LSTM модели на данных индекса потребительских цен (CPI) Ивановской области от месяца к месяцу очищенные от выбросов и сезонно-сглаженные с февраля 2009 года по декабрь 2023 года включительно.

3. Определялась архитектура нейронных сетей, и создавался код. Архитектура LSTM была спланирована, с выбором количества слоев, нейронов и активационных функций. Структура LSTM включала полносвязные слои и слои LSTM. Архитектура CNN включала в себя полносвязные слои и светочный слой с функцией активации RelU (rectified linear activation unit). В качестве функции потерь для обучения обоих сетей выбиралась среднеквадратичная ошибка (MSE).

4. Строились модели сети, согласно выбранной архитектуре.

5. Проводилось обучение моделей на обучающем наборе данных. Были настроены параметры обучения, включая функцию потерь MSE, оптимизатор Adam (адаптивный моментум) и размер мини-пакета. Модели продемонстрировали способность выявлять закономерности в данных. Для модели LSTM количество эпох равнялось 100, использовалось 16 пакетов (batch size). Для модели CNN , количество эпох равнялось 100, использовался 1 пакет (batch size).

Процесс обучения, направлен на минимизацию общей ошибки на тренировочных последовательностях, он включает использование метода обратного распространения ошибки во времени (градиентного спуска). Каждый вес в сети подвергается коррекции, пропорциональной производной относительно ошибки.

Основная проблема в случаях использования этого метода в RNN заключается в экспоненциальном уменьшении градиентов ошибок с увеличением временного интервала между событиями. В LSTM-блоках, при распространении ошибок, они сохраняются в памяти блока. Этот механизм обеспечивает постоянное возвращение ошибки каждому вентилю, чтобы те научились отбрасывать ненужные показатели, делая обратное распространение ошибки эффективным для обучения LSTM-блоков на продолжительные интервалы времени.

Сверточных сети, хотя они и не сталкиваются с проблемой уменьшения или взрыва градиентов в такой степени, как рекуррентные нейронные сети (RNN), имеют свои специфические трудности. Одной из основных проблем является переобучение, особенно при работе с ограниченным объемом тренировочных данных. Содержащие большое количество параметров, они могут слишком точно подстроиться под тренировочные данные, теряя способность к обобщению на новых данных. Другая проблема - это необходимость в большом количестве вычислительных ресурсов и памяти для тренировки. Также важным аспектом является правильный выбор архитектуры сети и параметров свертки, так как они существенно влияют на качество извлечения признаков и, следовательно, на общую эффективность обучения сети.

На рисунках 2 и 3 можно увидеть результат обучения LSTM и CNN моделей на данных индекса потребительских цен (CPI).

Рис.2. Результат обучения LSTM модели на данных индекса потребительских цен (CPI).

Рис. 3. Результат обучения CNN модели на данных индекса потребительских цен (CPI).

7. На этом этапе проводилась оценка моделей. Вначале модели были оценены на валидационном наборе данных, что позволило оценить их способность к обобщению и выявить возможные случаи переобучения.

Затем оценка производительности модели осуществляется с помощью тестового набора данных и визуализации результатов. Результаты тестирования представлены в графическом виде на рисунке 3,4.

Рис. 4. Результат тестирования LSTM модели на данных индекса потребительских цен (CPI).

Рис. 5. Результат тестирования модели CNN модели на данных индекса потребительских цен (CPI).

9. Строился прогноза региональной инфляции на заданный период.

Результаты работы моделей

Для построения прогноза индекса потребительских цен (CPI) от месяца к месяцу был задан период с января 2024 года по декабрь 2024 г.

Графически для модели LSTM прогноз выражен на рисунке 6, для модели CNN на рисунке 7.

Рис. 6. Прогноз LSTM модели для индекса потребительских цен (CPI) от месяца к месяцу с января 2024 года по декабрь 2024 г.

Рис. 7. Прогноз CNN модели для индекса потребительских цен (CPI) от месяца к месяцу с января 2024 года по декабрь 2024 г.

В числовом выражении прогноз можно увидеть в таблице 1.В первой графе таблицы приведена нумерация 12 месяцев, нумерация которых на графиках приведенных выше, была с 0 до 11, соответственно, во второй графе приведены соответствующие календарные месяцы, в третьей графе - прогноз CPI от месяца к месяцу, сделанный моделью LSTM, в четвертой - прогноз CPI от месяца к месяцу, сделанный моделью CNN с января 2024 года по декабрь 2024 г.

Рис.1 Прогнозные значения

для индекса потребительских цен (CPI)

от месяца к месяцу с января 2024 года по декабрь 2024 г.

Month Месяц и год Прогноз CPI от месяца

к месяцу, сделанный

моделью LSTM Прогноз CPI от месяца

к месяцу, сделанный

моделью CNN

1 Январь 2024 101.05 100.96

2 Февраль 2024 100.59 100.98

3 Март 2024 101.38 100.99

4 Апрель 2024 100.67 101.01

5 Май 2024 100.75 101.03

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6 Июнь 2024 100.60 101.05

7 Июль 2024 100.85 101.07

8 Август 2024 101.60 101.09

9 Сентябрь 2024 100.48 101.11

10 Октябрь 2024 101.21 101.13

11 Ноябрь 2024 101.59 101.16

12 Декабрь 2024 101.42 101.18

Из результатов видно, что по прогнозу модели LSTM наибольшие значения инфляция будет принимать в августе и ноябре 2024 г., по прогнозу моделью CNN наибольшее значение инфляции придется на декабрь 2024 г.

Сравнивая процесс создания и работы рекуррентных нейронных сетей (RNN), в частности LSTM и сверточных нейронных сетей (CNN) в контексте прогнозирования потребительской инфляции авторы выделили следующие различия и преимущества.

Рекуррентная нейронная сеть LSTM способна к прогнозированию потребительской инфляции. Особенно она подходят для анализа временных рядов, таких как исторические данные по инфляции, поскольку она способны улавливать временные долгосрочные зависимости и последовательности в данных, что важно для понимания тенденций инфляции.

К достоинствам можно отнести гибкость в обработке последовательностей разной длины. Они могут обрабатывать входные данные разной длины, что полезно для нерегулярных временных рядов.

Недостатками является проблема затухания или взрыва градиента, что затрудняет обучение. Кроме того для LSTM требуется значительная вычислительная мощность для обработки и обучения.

Сверточные нейронные сети (CNN), несмотря на то традиционно используются для анализа изображений, также могут применяться для анализа временных рядов, выявляя пространственные (в данном случае временные) взаимосвязи между данными.

К достоинствам можно отнести то, что для CNN обычно требуется меньше времени на обучение, чем на LSTM. За счет использования операций свертки и субдискретизации (pooling) CNN часто требуют меньше параметров по сравнению с RNN, что упрощает их обучение и уменьшает риск переобучения. Также CNN могут выявлять ключевые шаблоны и характеристики в данных, что может быть в дальнейшем полезно для выявления факторов, влияющих на инфляцию.

Ограниченное улавливание временных зависимостей можно отнести к недостаткам. В отличие от RNN, CNN не разработаны специально для работы с временными последовательностями, что снижает их эффективность в задачах, где необходимо учитывать временные зависимости. Также неудобство при использовании может возникать в связи с тем, что CNN обычно требуют входных данных фиксированной длины, что может быть ограничением при работе с временными рядами.

Заключение

Сравнительный анализ показал, что обе архитектуры нейронных сетей могут успешно использоваться для прогнозирования региональной инфляции.

LSTM предпочтительнее для анализа временных рядов, таких как данные по инфляции, поскольку они лучше улавливают временные зависимости и могут обрабатывать данные с различающейся по времени динамикой.

CNN могут быть полезны для выявления ключевых характеристик и шаблонов в данных об инфляции. Особенно, если подход к анализу данных можно структурировать аналогично обработке изображений.

Выбор между RNN и CNN зависит от конкретных характеристик набора данных и специфики задачи прогнозирования инфляции. Рекуррентные сети могут быть предпочтительными для краткосрочных прогнозов, где важны временные зависимости. Сверточные сети могут быть более подходящими для долгосрочных прогнозов, основанных на пространственных характеристиках данных. В некоторых случаях может быть эффективным комбинировать обе технологии для достижения наилучших результатов.

Наличие данных (значений CPI) ограничено, поэтому дальнейшее совершенствование процесса построения прогноза авторы видят в расширении базы данных для обучения и тестирования сети. Включить в исследование и использовать не только значений CPI, количество которых ограничено их наличием, но и показатели других факторов, оказывающих заметное влияние на инфляцию. Таких как среднемесячная фактическая ставка по кредитам, предоставленным банками, стоимость бивалютной корзины, индекс МосБиржи (IMOEX), сезонно-скорректированный ряд широкой денежной массы(Money)[1], [2].

Для двух этих моделей нейронных сетей, так и для других видов машинного обучения [1],[2] актуальной проблемой на современном этапе развития является отсутствие механизмов учета шоковых событий в обществе, оказывающих непосредственное влияние на инфляцию. Эти события включают в себя политические изменения, экономические кризисы, природные катастрофы или иные внезапные изменения, значительно влияющие на экономическую ситуацию. Разработка и интеграция механизмов, способных учитывать такие события в моделях машинного обучения, значительно повысит точность прогнозирования потребительской инфляции, что будет способствовать более эффективному управлению экономическими процессами и денежно-кредитной политикой.

Библиографический список

1. И.А.Астраханцева, А.С. Герасимов Прогнозирование региональной инфляции на основе гибридной модели машинного обучения: градиентный бустинг и случайный лес НАУЧНЫЕ ТРУДЫ Вольного экономического общества России – 2023. – № 5. – С. 200-226. – DOI: 10.38197/2072-2060-2023-243-5-200-226

2. Астраханцева И.А., Герасимов А.С., Астраханцев Р.Г. Прогнозирование региональной инфляции с помощью алгоритмов машинного обучения. Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. – 2022. – № 4(54). – С. 6–13. DOI 10.6060/ivecofin.2022544.620. – EDN ITYDFE.

3. Астраханцева И.А., Кутузова А.С., Астраханцев Р.Г. Рекуррентные нейронные сети для прогнозирования региональной инфляции. Научные труды Вольного экономического общества России. 2020. Т. 223. № 3. С. 420–431. DOI: 10.38197/2072-2060-2020-223-3-420-431. EDN QAHOYN.

4. Stock J.H., Watson M.W. Why Has U.S. Inflation Become Harder to Forecast? // Journal of Money, Credit and Banking. – 2007. – № 1 – p. 3-33.

5. Лозовская А.Н., Матыцын А.В. Применение адаптивной селективной модели к прогнозированию стоимости низковолатильных акций компании // Экономика и предпринимательство. – 2021. – № 7(132). – c. 865-869. – doi: 10.34925/EIP.2021.132.7.155.

6. Pavlov E. Forecasting Inflation in Russia Using Neural Networks // Russian Journal of Money and Finance. – 2020. – № 1 – p. 57-73. – Doi: 10.31477/rjmf.202001.57.

7. Байбуза И. Прогнозирование инфляции с помощью методов машинного обучения // Деньги и кредит. – 2018. – № 4. – c. 42-59. – doi: 10.31477/rjmf.201804.42.

8. Матицын А.В. Применение LSTM-модели к прогнозированию CPI и уровня инфляции на примере России // Вопросы инновационной экономики. – 2022. – Том 12. – № 2. – С. 1241-1252. – doi: 10.18334/vinec.12.2.114845.

9. Кондратьева Т.Н. Прогнозирование с помощью многослойной рекуррентной нейронной сети LSTM // Обозрение прикладной и промышленной математики. -2017- №1- стр.73-74.

10. В.О. Скрипачев, М.В.Гуйда, Н.В.Гуйда, А.О. Жуков. Особенности работы сверточных нейронных сетей. International Journal of Open Information Technologies ISSN:2307-8162 vol.10,no 12,2022

11. Николенко С., Кадурин А.,Архангельская Е. Глубокое обучение. – СПб: Питер, 2018. – 480 с.ил. – (Серия «Библиотека программиста»). ISBN 978-5-496-02536-2 ББК 32.973.236 УДК 004.8 Н63

12. Морозов, Е. Н. Математические модели для оптимизации машиночитаемых регулятивных систем / Е. Н. Морозов, С. В. Горев // Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. – 2023. – № 4(58). – С. 71-78. – DOI 10.6060/ivecofin.2023584.666. – EDN L'SUGG.

13. Таблицы инфляции. https-y/уровень-инфляции. РФ (дата обращения 17.02.2024).

14. Астраханцева, И. А. Методология оценки прав (требования) по кредитным договорам коммерческих банков / И. А. Астраханцева, Е. В. Баландина // Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. – 2017. – № 3(33). – С. 3-9. – EDN ZOWXOL.

15. Математические модели для оптимизации машиночитаемых регулятивных систем / Е. Н. Морозов, С. В. Горев // Известия высших учебных заведений. Серия: Экономика, финансы и управление производством. – 2023. – № 4(58). – С. 71-78. – DOI 10.6060/ivecofin.2023584.666. – EDN LLSUGG.

References

1. I.A. Astrakhantseva, A.S. Gerasimov Forecasting regional inflation based on a hybrid machine learning model: gradient boosting and random forest SCIENTIFIC PAPERS of the Free Economic Society of Russia – 2023. – No 5. – pp. 200-226. – DOI: 10.38197/2072-2060-2023-243-5-200-226

2. Astrakhantseva I.A., Gerasimov A.S., Astrakhantsev R.G. Forecasting regional inflation using machine learning algorithms. News of higher educational institutions. Series: Economics, Finance and Production Management. – 2022. – № 4(54) – Pp. 6-13. DOI 10.6060/ivecofin. 2022544.620. – EDN ITYDFE.

3. Astrakhantseva I.A., Kutuzova A.S., Astrakhantsev R.G. Recurrent neural networks for forecasting regional inflation. Scientific works of the Free Economic Society of Russia. 2020. Vol. 223. No. 3. pp. 420-431. DOI: 10.38197/2072-2060-2020-223-3-420-431. EDN QAHOYN.

4. Stock J.H., Watson M.W. Why Has U.S. Inflation Become Harder to Forecast? // Journal of Money, Credit and Banking. – 2007. – No 1 – p. 3-33.

5. Lozovskaya A.N., Matytsyn A.V. Application of an adaptive selective model to forecasting the value of low-volatility shares of a company // Economics and entrepreneurship. – 2021. – № 7(132). – c. 865-869. – Doi: 10.34925/EIP.2021.132.7.155.

6. Pavlov E. Forecasting Inflation in Russia Using Neural Networks // Russian Journal of Money and Finance. – 2020. – No.1. – p. 57-73. – Doi: 10.31477/rjmf.202001.57.

7. Baibuza I. Forecasting inflation using machine learning methods // Money and credit. – 2018. – No. 4. – pp. 42-59. – doi: 10.31477/rjmf.201804.42.

8. Matitsyn A.V. Application of the LSTM model to forecasting CPI and inflation on the example of Russia // Issues of innovative economics. – 2022. – Volume 12. – No 2. – pp. 1241-1252. – Doi: 10.18334/vinec.12.2.114845.

9. Kondratieva T.N. Forecasting using a multilayer recurrent neural network LSTM // Review of applied and industrial mathematics. -2017- No.1- pp.73-74.

10. V.O. Skripachev, M.V.Guida, N.V.Guida, A.O. Zhukov. Features of convolutional neural networks. International Journal of Open Information Technologies ISSN:2307-8162 vol.10,no 12,2022

11. Nikolenko S., Kadurin A., Arkhangelskaya E. Deep learning. – St. Petersburg: St. Petersburg, 2018 – 480 p.ill. – (Series "Programmer's Library") ISBN 978-5-496-02536-2 BBK 32.973.236 UDC 004.8 N63

12. Morozov, E. N. Mathematical models for optimization of machine-readable regulatory systems / E. N. Morozov, S. V. Gorev // Izvestia of Higher educational institutions. Series: Economics, Finance and Production Management. – 2023. – № 4(58) – Pp. 71-78. – DOI 10.6060/ivecofin.2023584.666. – EDN L'SUGG.

13. Tables of inflation. https-y/level-of-inflation Russian Federation (accessed 12/17/2023).

14. Astrakhantseva, I. A. Methodology for Assessing Rights (Claims) under Credit Agreements of Commercial Banks / I. A. Astrakhantseva, E. V. Balandina // Proceedings of Higher Education Institutions. Series: Economics, Finance, and Production Management. – 2017. – No. 3(33). – pp. 3-9. – EDN ZOWXOL.

15. Mathematical Models for Optimizing Machine-Readable Regulatory Systems / E. N. Morozov, S. V. Gorev // Proceedings of Higher Education Institutions. Series: Economics, Finance, and Production Management. – 2023. – No. 4(58). – pp. 71-78. – DOI 10.6060/ivecofin.2023584.666. – EDN LLSUGG.

Контактная информация / Contact Information

ФГБОУ ВО «Ивановский государственный химико-технологический университет»

153000, Россия, г. Иваново, Шереметевский проспект, д.7

Ivanovo state university of chemistry and technology

7 Sheremetev avenue, 153000, Ivanovo, Russia

Ирина Александровна Астраханцева / Irina A. Astrakhantseva

ORCID 0000-0003-2841-8639

i.astrakhantseva@mail.ru

Герасимов Александр Сергеевич / Alexandr S. Gerasimov

ORCID 0000-0001-7867-2710

aleksandr132542255@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.