Научная статья на тему 'Применение нейронных сетей архитектуры LSTM для моделирования волатильности фондового рынка'

Применение нейронных сетей архитектуры LSTM для моделирования волатильности фондового рынка Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Фондовый рынок / нейронные сети / моделирование волатильности / LSTM / ARFIMA / Stock market / volatility simulation / neural networks / LSTM / ARFIMA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дмитрий Александрович Патласов, Роберт Викторович Гарафутдинов

Введение. Задача моделирования и прогнозирования волатильности фондового рынка является актуальной, ее решение позволит снизить риски и увеличить доходность от рыночных операций. В настоящее время перспективными методами моделирования волатильности являются методы искусственного интеллекта, в том числе глубокие нейронные сети. Цель. Проверка гипотезы о более высокой точности нейронной сети архитектуры LSTM при моделировании волатильности фондового рынка по сравнению с традиционными авторегрессионными моделями (на примере ARIMA) и моделями с длинной памятью (на примере ARFIMA). Материалы и методы. На данных индекса S&P 500, отражающего динамику фондового рынка США в целом, проведены вычислительные эксперименты для проверки выдвинутой гипотезы. Результаты. LSTM-сеть позволила получить прогнозы, точность которых существенно выше точности прогнозов ARIMAи ARFIMAмоделей на обучающей и тестовой выборках; ARFIMA-модель показала более высокую точность, чем ARIMA, что согласуется с ранее полученными данными. Выводы. Результаты работы позволяют утверждать, что нейронные сети архитектуры LSTM являются перспективным методом прогнозирования волатильности фондовых рынков и могут выступать предметом дальнейших исследований в данной области. Использование методов машинного обучения, в том числе нейронных сетей, не только является способом определения будущей динамики доходностей финансовых активов, но и может применяться в контексте оптимизации существующих алгоритмов разбалансировки портфелей, аппроксимации и моделирования риск-метрик, приближения вероятностных характеристик финансовых инструментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дмитрий Александрович Патласов, Роберт Викторович Гарафутдинов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stock market volatility simulation with the LSTM neural network

Introduction. Stock market volatility simulation and forecast are relevant issues which could contribute into lower risks and higher revenues of the market transactions. These days, AI-based methods, including deep neural networks, are quite promising for volatility simulation. Purpose. The paper verifies a hypothesis concerning a higher accuracy of LSTM neural network compared to the classical autoregressive models (e.g. ARIMA) and long memory models (e.g. ARFIMA). Materials and Methods. To check the hypothesis, the authors conducted simulation experiments with S&P 500 index data generally illustrating the dynamics of the US stock market. Results. The LSTM neural network gave significantly more accurate forecasts compared to the ARIMAand ARFIMA-based forecasts for learning and test samples; ARFIMA model was more accurate than ARIMA, which supports previous data. Conclusions. The results of the work prove that the LSTM neural network is a promising method to forecast stock market volatility and could be further examined in this area. Machine learning methods, including the neural networks, could be used to define the future dynamics in the revenues of financial asserts and optimize current algorithms of portfolio imbalances, approximation and simulation of risk metrics, approximation of probabilistic characteristics for financial instruments.

Текст научной работы на тему «Применение нейронных сетей архитектуры LSTM для моделирования волатильности фондового рынка»

МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ

Вестник Пермского университета. Серия «Экономика». 2024. Т. 19, № 1. С. 41-51. Perm University Herald. Economy, 2024, vol. 19, no. 1, pp. 41-51.

УДК 004.032.26, ББК 22.1:1, JEL Code CI, C6, G17 DOI 10.17072/1994-9960-2024-1-41-51 EDN BHKTOC

Применение нейронных сетей архитектуры LSTM для моделирования волатильности фондового рынка

Дмитрий Александрович Патласов

РИНЦ Author ID: 1111799, И dmitriypatlasov@gmail.com

Роберт Викторович Гарафутдинов

Researcher ID: A-9122-2019, Scopus Author ID: 57315408800, РИНЦ Author ID: 1055831 Пермский государственный национальный исследовательский университет, Пермь, Россия

Аннотация

Введение. Задача моделирования и прогнозирования волатильности фондового рынка является актуальной, ее решение позволит снизить риски и увеличить доходность от рыночных операций. В настоящее время перспективными методами моделирования волатильности являются методы искусственного интеллекта, в том числе глубокие нейронные сети. Цель. Проверка гипотезы о более высокой точности нейронной сети архитектуры LSTM при моделировании волатильности фондового рынка по сравнению с традиционными авторегрессионными моделями (на примере ARIMA) и моделями с длинной памятью (на примере ARFIMA). Материалы и методы. На данных индекса S&P 500, отражающего динамику фондового рынка США в целом, проведены вычислительные эксперименты для проверки выдвинутой гипотезы. Результаты. LSTM-сеть позволила получить прогнозы, точность которых существенно выше точности прогнозов ARIMA- и ARFIMA-моделей на обучающей и тестовой выборках; ARFIMA-модель показала более высокую точность, чем ARIMA, что согласуется с ранее полученными данными. Выводы. Результаты работы позволяют утверждать, что нейронные сети архитектуры LSTM являются перспективным методом прогнозирования волатильности фондовых рынков и могут выступать предметом дальнейших исследований в данной области. Использование методов машинного обучения, в том числе нейронных сетей, не только является способом определения будущей динамики доходностей финансовых активов, но и может применяться в контексте оптимизации существующих алгоритмов разбалансировки портфелей, аппроксимации и моделирования риск-метрик, приближения вероятностных характеристик финансовых инструментов.

Ключевые слова

Фондовый рынок, нейронные сети, моделирование волатильности, LSTM, ARFIMA

Для цитирования

Патласов Д. А., Гарафутдинов Р. В. Применение нейронных сетей архитектуры LSTM для моделирования волатильности фондового рынка // Вестник Пермского университета. Серия «Экономика». 2024. Т. 19, № 1. С. 41-51. DOI 10.17072/ 1994-9960-2024-1-41-51. EDN ВНКТОС.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Статья поступила: 25.12.2023 Принята к печати: 28.02.2024 Опубликована: 10.04.2024

© Патласов Д. А., Гарафутдинов Р. В., 2024

Stock market volatility simulation with the LSTM neural network

Dmitry A. Patlasov

RISC Author ID: 1111799, El dmitriypatlasov@gmail.com Robert V. Garafutdinov

Researcher ID: A-9122-2019, Scopus Author ID: 57315408800, RISC Author ID: 1055831 Perm State University, Perm, Russia

Abstract

Introduction. Stock market volatility simulation and forecast are relevant issues which could contribute into lower risks and higher revenues of the market transactions. These days, AI-based methods, including deep neural networks, are quite promising for volatility simulation. Purpose. The paper verifies a hypothesis concerning a higher accuracy of LSTM neural network compared to the classical autoregressive models (e.g. ARIMA) and long memory models (e.g. ARFIMA). Materials and Methods. To check the hypothesis, the authors conducted simulation experiments with S&P 500 index data generally illustrating the dynamics of the US stock market. Results. The LSTM neural network gave significantly more accurate forecasts compared to the ARIMA- and ARFIMA-based forecasts for learning and test samples; ARFIMA model was more accurate than ARIMA, which supports previous data. Conclusions. The results of the work prove that the LSTM neural network is a promising method to forecast stock market volatility and could be further examined in this area. Machine learning methods, including the neural networks, could be used to define the future dynamics in the revenues of financial asserts and optimize current algorithms of portfolio imbalances, approximation and simulation of risk metrics, approximation of probabilistic characteristics for financial instruments.

Keywords

Stock market, volatility simulation, neural networks, LSTM, ARFIMA

For citation

Patlasov D. A., Garafutdinov R. V. Stock market volatility simulation with the LSTM neural network. Perm University Herald. Economy, vol. 19, no. 1, pp. 41-51. DOI 10.17072/1994-9960-2024-1-41-51. EDN BHKTOC.

Declaration of conflict of interest: none declared.

Received: December 25, 2023 Accepted: February 28, 2024 Published: April 10, 2024

© Patlasov D. A., Garafutdinov R. V., 2024

ВВЕДЕНИЕ

В последнее десятилетие фондовый рынок смог привлечь множество участников, что обусловлено простотой доступа к нему, а также процессами глобализации и интеграции между государствами. Отчасти развитию этих процессов способствовала масштабная цифрови-зация. Параллельно с увеличением внимания к торговым площадкам бурное развитие наблюдалось и в мире информационных технологий, особенно в сфере искусственного интеллекта и машинного обучения. Многие исследователи ищут способы применения нейросе-тевых технологий для решения различного рода управленческих и бизнес-задач, таких как формирование оптимального портфеля ценных бумаг, прогнозирование фондовых рынков, моделирование и имитация поведения участников рынка, ценообразование и др. Применение инновационных методов для решения этих задач требует тщательного исследования, а полученные результаты - компетентного сравнения с результатами классических моделей на стыке финансов и математики.

Не теряющей актуальности является задача моделирования волатильности фондового рынка. Ее решение с достаточно высокой степенью точности позволит получать достоверные прогнозы динамики рынков и использовать их для повышения эффективности управленческих решений. Волатильность на фондовых рынках является непрерывным процессом. Особое внимание участников и исследователей рынков привлекают периоды повышенной во-латильности, к которым относятся ипотечный кризис 2008 г., валютный кризис в Российской Федерации 2014 г., кризис, вызванный пандемией COVID-19 в 2020 г., и др. Существует большое количество математических методов и статистических моделей для прогнозирования волатильности, которая на практике выражается финансовыми временными рядами. К таким методам относятся модели классов ARIMA и GARCH, включающие базовые (классические) алгоритмы и их разнообразные моди-

фикации, в том числе модели с длинной памятью (фрактальные). В настоящем исследовании нами поставлена задача моделирования динамики фондового рынка (на примере развитого рынка США) для предсказания уровня его волатильности при помощи современного инструментария - нейронной сети, а также задача сравнения по точности прогноза указанного метода с более традиционными моделями, а именно авторегрессионной моделью ARIMA и ее модификацией с длинной памятью ARFIMA.

Стоит отметить ряд преимуществ использования нейронных сетей в задаче прогнозирования волатильности, которыми был обусловлен их выбор в качестве метода моделирования [10]. Во-первых, нейронные сети способны извлекать из данных нетипичные признаки и адаптироваться к данным различной структуры, а неоднородность, как известно, характерна для финансовых временных рядов (см. эффекты кластеризации волатильности [8] и чередование участков рядов различной фрактальной размерности [15]). Во-вторых, нейросети обладают свойством учета сложных нелинейных зависимостей в структуре данных. Это важно, так как текущие значения финансовых рядов зачастую нелинейно зависят как от прошлых значений, так и от множества экзогенных факторов [7].

Таким образом, гипотеза нашего исследования состоит в том, что нейронная сеть позволяет получать прогнозы с меньшей ошибкой в сравнении с более классическими статистическими моделями (ARIMA, ARFIMA) при моделировании волатильности фондового рынка США.

МАТЕРИАЛЫ И МЕТОДЫ

В качестве данных в исследовании используются скорректированные цены закрытия фондового индекса S&P 500 (код инструмента SPY). Рассмотрена динамика значений индекса за период с 01.01.2020 по 01.09.2023, частота составляет один день. Источник данных - про-

вайдер рыночной информации Yahoo Finance. В результате сформирована выборка данных объемом 649 наблюдений.

На текущий момент из моделей глубокого обучения на фондовых рынках могут применяться следующие алгоритмы: рекуррентные нейронные сети (RNN), сверточные нейронные сети (CNN), многослойные персептроны, гибридные нейронные сети, автоэнкодеры, нейрогенетические сети, или нейронные сети нечеткого вывода, функционирующие на основе правил нечеткой логики [2; 11].

Для целей моделирования финансовых временных рядов наибольшее распространение получили RNN [2]. Наиболее популярным алгоритмом среди RNN является модель долгой краткосрочной памяти (long short-term memory network, LSTM) [4]. LSTM обучается на основе принципа обратного распространения ошибки. Особенность архитектуры LSTM-сети состоит в том, что в ней вместо нейронов присутствуют «клетки памяти», состоящие из трех частей: входа, выхода и самой зоны памяти. Зоны входа и выхода, по сути, выполняют функции аксона и дендрита обычного нейрона, в то время как зона памяти отвечает за обучение и запоминание нужной информации из данных, подаваемых на зону входа. Таким образом, в настоящем исследовании для решения задачи прогнозирования вола-тильности индекса S&P 500 нами была выбрана нейронная сеть архитектуры LSTM как наиболее широко используемая и доказавшая свою эффективность [3]. В качестве конкурирующих методов использованы такие модели, как интегрированная модель авторегрессии - скользящего среднего (Autoregressive Integrated Moving Average, ARIMA) и дробно-интегрированная модель авторегрессии - скользящего среднего (Autoregressive Fractionally Integrated Moving Average, ARFIMA). ARIMA(p, d, q) является моделью с краткосрочной памятью, в то время как ARFIMA(p, d, q) допускает нецелое значение показателя интегрированности d, что позволяет моделировать эффекты долгосрочной (длинной) памяти. Эти модели широко ис-

следованы и описаны в научной литературе (см., например, [14]).

Для оценивания качества полученных прогнозов при интерпретации результатов нами использованы такие метрики точности прогнозирования: среднеквадратическая ошибка MSE и средняя абсолютная ошибка MAE [9].

Процесс обучения всех трех алгоритмов реализован на смоделированной исторической волатильности индекса S&P 500, которая получена при помощи модели экспоненциальной обобщенной авторегрессионной условной гете-роскедастичности (Exponential Generalized Autoregressive Conditional Heteroskedasticity, EGARCH). Подход, состоящий в сглаживании исходного рыночного ряда с помощью модели, описан в работе Н. И. Берзона и Е. А. Сулицкого [13]. Он позволяет повысить точность моделирования и прогнозирования, поэтому было принято решение обучать нейросеть не на исходных, а на модельных данных. EGARCH(p, q) является модификацией классической модели GARCH(p, q), в отличие от базовой версии, обладающей способностью учитывать асимметричные эффекты между положительной и отрицательной доходностью моделируемого актива. Приведем общую формулу модели EGARCH(p, q):

p

1п(а2) = A0 + ^ a (| st + y. st _ ) +

i= 1

(1)

+ xp , in«,),

j=1

где xt - значение временного ряда в момент времени t; ot - условное стандартное отклонение (условная волатильность) в момент времени t; p - порядок модели компонентов ARCH; a0, a1, a2,..., ap - параметры модели компоненты ARCH; q - порядок модели компонентов GARCH; рь ^2,..., вг - параметры модели компоненты GARCH; et - стандартизированные остатки.

Величины порядков р, q модели определены нами по информационному критерию Акаике (А1С). Способ задания распределения остатков также выбран с помощью данного критерия.

Выбор описанной модификации GARCH-модели обусловлен тем, что волатильность на рынке оказывается выше после поступления негативной информации (отрицательная доходность), чем после поступления позитивной информации (положительная доходность). Данный асимметричный признак называется эффектом левериджа. Таким образом, на основании результатов ряда исследований и экспериментов [1; 13] можно утверждать, что модель EGARCH(p, q) является эффективным инструментом оценки условной волатильности.

НАСТРОЙКА И КАЛИБРОВКА НЕЙРОННОЙ СЕТИ LSTM

Настройка архитектуры нейронной сети включает в себя несколько ключевых этапов.

На первом этапе исходные данные должны быть нормализованы для исключения проблемы «взрывных» градиентов. Нормализация данных реализована при помощи формулы

х = х - тт(х) , (2)

тах(х) - тт(х)

где х - исходный ряд условной волатильности.

Следующим шагом является разделение данных на обучающую и тестовую выборки. В рамках исследования было решено разделить данные в соотношении 9 : 1, в результате объем обучающей выборки составил 584 наблюдения, а тестовой - 65 наблюдений. Тогда интервал дат для обучающей выборки составляет с 01.01.2021 по 25.05.2023, а временной интервал для тестовой выборки - с 26.05.2023 по 01.09.2023.

На втором этапе определяются основные параметры нейронной сети LSTM (так называемый тюнинг): количество слоев и нейронов, механизм оптимизации, функция потерь и метрики для оценки качества модели, вид регу-

ляризации алгоритма для исключения проблемы переобучения модели, настройка гиперпараметров (скорости обучения), задается функция активации и количество эпох обучения.

Обоснуем выбор параметров для построения модели LSTM.

1. Алгоритм оптимизации. Наиболее используемыми методами оптимизации являются алгоритмы Adam, Adamax, Adadelta, Adagrad, SGD, RMSProp [5]. Нами выбран алгоритм оптимизации Adam (Adaptive Moment Estimation), что обусловлено сочетанием в нем как накопления движения, так и более медленного обновления весов для типовых признаков, что, в свою очередь, позволяет отчасти решить проблему переобучения. Кроме того, алгоритм Adam адаптивно определяет скорость обучения, что решает вопрос подбора гиперпараметров. Еще одним достоинством Adam является то, что он комбинирует метод моментов и адаптивное обучение, благодаря чему позволяет эффективно работать как с большими, так и с малыми градиентами.

2. Функция потерь. При работе с временными рядами в сфере искусственного интеллекта и машинного обучения принято использовать функции потерь вида «среднеквадра-тическая ошибка» (Mean Squared Error, MSE) или «средняя абсолютная ошибка» (Mean Absolute Error, MAE) [7]. Входными данными для ней-росети и других прогнозных моделей в нашем случае являются натуральные логарифмы оценок стандартного отклонения ряда, полученных с помощью модели EGARCH(1, 1). Исходные значения находятся в диапазоне от 0,005 до 0,025, т. е. близки к нулю. Это определяет выбор функции потерь в пользу MSE, а не MAE, так как величина MAE может быть неопределенной либо бесконечной в случае, если истинное значение какого-либо наблюдения равно или близко к нулю. Формула функции потерь имеет вид

MSE = -X(xt -х,)2, (3)

n

где MSE - среднеквадратическая ошибка (функция потерь); n - количество примеров в наборе

данных; Xi - фактическое значение целевой переменной для i-го наблюдения; xi - предсказанное значение целевой переменной для i-го наблюдения.

Другим преимуществом метрики MSE как функции потерь является то, что эта величина представляет собой средний квадрат отклонения исходных и предсказанных значений, следовательно, большие ошибки будут приводить к высоким штрафам, что минимизирует влияние крупных выбросов и позволяет более эффективно обучить модель.

3. Функция активации. В архитектурах нейронных сетей используется целый ряд линейных и нелинейных функций активации, таких как линейная, сигмоида, гиперболический тангенс, ReLU (Rectified Linear Unit), Leaky ReLU, Softmax [6]. Нами выбрана функция активации вида «гиперболический тангенс» (tanh) по следующим причинам: динамика исходных данных условной волатильности является нелинейной; tanh помогает LSTM-сети в контексте сохранения и передачи информации, так как LSTM-сеть имеет механизмы для хранения и обновления информации о предыдущих состояниях (с использованием забывающего затухания и входных и выходных ворот); функция активации tanh является вычислительно более эффективной по сравнению с другими функциями активации. Общий вид функции активации tanh следующий:

f (x) =

„x - x

e _ e

ex + e x

(4)

4. Количество слоев и нейронов LSTM-сети и механизмы регуляризации Dropout и L2. Эти параметры сформированы при помощи механизма GridSearch с применением метода кросс-валидации. Определение наилучшего сочетания параметров выполнено методом перебора, при этом использовались следующие наборы параметров:

- количество слоев LSTM (2, 3, 4, 5);

- количество нейронов на слое LSTM (50, 75, 100);

- уровень Dropout - доля нейронов, которые будут случайно отключены во время обучения (0,2; 0,4; 0,6);

- уровень L2 регуляризации - коэффициент, умножаемый на сумму квадратов всех весов параметров LSTM-сети, прибавляемый к функции потерь по время обучения (0,001; 0,01; 0,1).

Таким образом, общее количество комбинаций параметров (различных вариантов LSTM-сетей) составило 4 • 3 • 3 • 3 = 108, среди которых отбиралась наилучшая комбинация по минимальному значению MSE.

Стоит обратить внимание на то, что включение в архитектуру выстраиваемой LSTM-сети механизмов регуляризации является важным шагом к исключению проблемы переобучения модели. Инструменты Dropout и L2 можно использовать как отдельно, так и комбинируя их в одной нейронной сети. В нашем случае L2-регуляризация встраивалась на первый LSTM-слой и выходной плотный (Dense) слой; Dropout, в свою очередь, является отдельным слоем нейронной сети, располагающимся после первого LSTM-слоя.

5. Количество эпох обучения. Параметр позволяет управлять соотношением скорости и качества обучения сети. Мы остановились на величине 200, что является некоторым компромиссом, позволяющим достичь приемлемых величин точности и длительности обучения модели.

В результате проведенных вычислительных экспериментов установлено, что наилучшей точностью обладает LSTM-сеть со следующими параметрами: количество слоев - 4, количество нейронов на каждом LSTM-слое -50, уровень Dropout равен 0,6, уровень L2-регуляризации - 0,1.

В следующем разделе представлены результаты моделирования.

АПРОБАЦИЯ МОДЕЛИ

Обучение нейронной сети и все этапы моделирования выполнены с использованием языка программирования Python 3 в среде

Google Colaboratory. При построении моделей использованы библиотеки arch, keras и ten-sorflow, statsmodels, а также rpy2 (для использования реализации ARFIMA-модели, доступной для языка R).

На рис. 1 представлена архитектура спроектированной LSTM-сети.

lstm_438_input input: [(None, 9, 1)]

InputLayer output: [(None, 9, 1)]

у

lstm_438 input: (None, 9, 1)

LSTM output: (None, 9, 50)

l

dropout_304 input: (None, 9, 50)

Dropout output: (None, 9, 50)

1

lstm_439 input: (None, 9, 50)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

LSTM output: (None, 9, 50)

lstm_440 input: (None, 9, 50)

LSTM output: (None, 50)

y

dense_134 input: (None, 50)

DENSE output: (None, 1)

Источник: составлено авторами. Рис. 1. Разработанная архитектура LSTM-сети Fig. 1. The designed architecture of the LSTM network

Как можно заметить, в представленной нейронной сети используется четыре LSTM-слоя, Dropout-слой после первого LSTM-слоя и плотный Dense-слой на выходе. Общее количество параметров составляет 50 851, все параметры обучены, пропуски отсутствуют.

Динамика функции потерь MSE по время обучения приведена на рис. 2.

Отметим, что явной тенденции к снижению функции потерь MSE во время обучения на 200 эпохах не наблюдается (см. рис. 2). Это связано с адекватной работой механизмов регуляризации Dropout и L2, которые не позволяют модели LSTM переобучаться, сохраняя величину MSE во время обучения на достаточно стабильном уровне.

После обучения LSTM-сети на данных обучающей выборки был реализован прогноз во-латильности на тестовой выборке (рис. 3).

Графический анализ рис. 3 позволяет сделать вывод о том, что прогноз LSTM-сети в целом отражает тренд динамики волатиль-ности на тестовом диапазоне данных. Можно предположить, что построенная нейронная сеть адекватно воспринимает данные вне обучающего набора, которые обладают неизвестной природой. Для подтверждения сформулированной гипотезы далее перейдем к сравнению и интерпретации метрик ошибок LSTM-сети и других моделей прогнозирования временного ряда волатильности.

Training Loss

и

со

0,019 0,018 0,017 0,016 0,015

T 1 [i

kl ■llAî J I I h

i f| и 1У ■ 1 M У ш 1 Т ¿4

Ï H 1 î4 H vfi

0

25

50

75

150

175

200

100 125 Epochs

Источник: составлено авторами.

Рис. 2. Динамика функции потерь MSE в период обучения LSTM-сети Fig. 2. Dynamics of the MSE loss function during the LSTM network training period

0,025

о 0,020 д

H <J

о te

S 0,015 s

H «

О

m

0,010

0,005

1

У i

il J I !

» к

: \ = ' \ m

i i

\s/\A-. h

4 fi WM 'if-fi ■ *

:

-Прогнозы на тестовой

выборке, LSTM

..........Обучающий набор

-----Тестовый набор

i = i s

У

Л U

У! ß

Iii 'W U1

2021-01 2021-05 2021-09 2022-01 2022-05 2022-09 2023-01 2023-05 2023-09

Дата

Источник: составлено авторами.

Рис. 3. Прогноз волатильности с помощью LSTM-сети Fig. 3. Volatility forecast with the LSTM network

СРАВНЕНИЕ МОДЕЛЕЙ И ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Чтобы проверить выдвинутую в исследовании гипотезу, выполним сравнение LSTM-сети с моделями ARIMA и ARFIMA по качеству моделирования, используя метрики MSE и MAE (таблица).

Сравнение точности прогноза волатильности моделей LSTM, ARIMA и ARFIMA

Comparison of volatility forecast accuracy among LSTM, ARIMA, and ARFIMA models

Модель LSTM-сеть ARIMA ARFIMA

MSE (обучающая выборка) 0,018 0,041 0,035

MSE (тестовая выборка) 0,010 0,173 0,171

MAE (обучающая выборка) 0,010 0,143 0,123

MAE (тестовая выборка) 0,074 0,274 0,219

Источник: составлено авторами.

По итогам анализа таблицы можно сделать вывод, что LSTM-сеть имеет наименьшие значения MSE и MAE как на обучающей, так

и на тестовой выборках, т. е. LSTM-сеть наилучшим образом выявила закономерности в данных, что позволило ей сделать более точные прогнозы. Причинами таких преимуществ являются следующие: LSTM-сеть способна учитывать более сложные зависимости и структуры в данных, чем АШМА и ARFIMA, что особенно важно при работе с временными рядами с нелинейными и долгосрочными зависимостями; LSTM-сеть имеет более гибкую и сложную архитектуру и может быть настроена для оптимального прогнозирования при правильном и адекватном подборе гиперпараметров.

Стоит также отметить, что заявленное многими авторами (см., например, работы [12; 14; 16]) превосходство модели с длинной памятью ARFIMA перед ARIMA в задаче прогнозирования финансовых временных рядов в очередной раз подтвердилось, притом что не было проведено исследование фрактальных свойств моделируемого ряда.

К ограничениям проведенного исследования можно отнести следующие:

- для получения базового моделируемого ряда использовалась только одна модель -

EGARCH(1, 1), отобранная исходя из теоретических соображений, другие модели не рассматривались;

- модель ARFIMA обучалась с настройками алгоритма по умолчанию, в то время как, согласно результатам некоторых исследований, например [14], в качестве точной оценки параметра d может быть использована оценка фрактальной размерности ряда методом DFA, что может повысить качество моделирования;

- данные моделировались только на одном временном промежутке; применение метода скользящего окна с усреднением результатов могло бы повысить достоверность полученных результатов.

Невзирая на описанные ограничения, результаты проведенного исследования дают основания считать, что нейронные сети архитектуры LSTM являются перспективным методом прогнозирования волатильности фондовых рынков, позволяя получать более точные прогнозы по сравнению с «традиционными» методами.

ЗАКЛЮЧЕНИЕ

По итогам проведенных экспериментов на данных фондового рынка США можно утверждать, что выдвинутая гипотеза подтвердилась: нейронная сеть (на примере LSTM-

СПИСОКИСТОЧНИКОВ

1. Берзон Н. И., Бобровский Д. И., Вилкул Д. Е., Дубинский Д. В., Мезенцев В. В. Подходы Value-at-Risk и Expected Shortfall для оценки премий опционов и вероятности дефолта на основе ARMA-моделей // Экономика и математические методы. 2021. T. 57, № 3. C. 126-139. DOI 10.31857/ S042473880016417-7. EDN ADRRRM

2. Bucci A. Realized volatility forecasting with neural networks // Journal of Financial Econometrics. 2020. Vol. 18, iss. 3. P. 502-531. DOI 10.1093/jjfinec/nbaa008

3. Hu Y., Ni J., Wen L. A hybrid deep learning approach by integrating LSTM-ANN networks with GARCH model for copper price volatility prediction // Physica A: Statistical Mechanics and its Applications. 2020. Vol. 557. Article 124907. DOI 10.1016/ j .physa.2020.124907

сети) позволяет получать прогнозы волатиль-ности, обладающие более высокой точностью в сравнении с авторегрессионными моделями ARIMA и ARFIMA. Несомненно, применение нейронных сетей в задачах моделирования и прогнозирования фондовых рынков заслуживает самого пристального внимания. Перспективными направлениями дальнейших исследований в этой области можно считать:

- изучение влияния на точность прогнозирования нейронной сети использования в качестве входных данных оценок фрактальной размерности временного ряда, что позволит отнести такую модель к фрактальным методам прогнозирования финансовых рядов;

- применение LSTM-сети в качестве прогнозирующего алгоритма при формировании инвестиционных портфелей и сравнение ее с другими исследованными в рамках данной задачи моделями;

- разработка и тестирование альтернативных LSTM-сети архитектур искусственного интеллекта для решения задачи прогнозирования волатильности фондового рынка;

- сравнение эмпирической эффективности в рамках решения задачи прогнозирования волатильности и динамики финансовых временных рядов при помощи LSTM-сети с методами прогнозирования плотности распределения вероятностей динамики будущих данных.

REFERENCES

1. Berzon N. I., Bobrovsky D. I., Vilkul D. E., Dubinsky D. V., Mezentsev V. V. Value-at-Risk and Expected Shortfall approaches for option premiums and the probability of default estimation based on ARMA models. Ekonomika i matematicheskie metody = Economics and Mathematical Methods, 2021, vol. 57, no. 3, pp. 126-139. (In Russ.). DOI 10.31857/S0424738 80016417-7. EDN ADRRRM

2. Bucci A. Realized volatility forecasting with neural networks. Journal of Financial Econometrics, 2020, vol. 18, iss. 3, pp. 502-531. DOI 10.1093/jjfinec/nbaa008

3. Hu Y., Ni J., Wen L. A hybrid deep learning approach by integrating LSTM-ANN networks with GARCH model for copper price volatility prediction. Physica A: Statistical Mechanics and its Applications, 2020, vol. 557, 124907. DOI 10.1016/j.physa.2020.124907

4. Jiao X., Song Y, Kong Y, Tang X. Volatility forecasting for crude oil based on text information and deep learning PSO-LSTM model // Journal of Forecasting. 2022. Vol. 41, iss. 5. P. 933-944. DOI 10.1002/for.2839

5. JungG., Choi S. Y. Forecasting foreign exchange volatility using deep learning autoencoder-LSTM techniques // Complexity. 2021. Vol. 2021, Special Issue. Article 6647534. 16 p. DOI 10.1155/2021/6647534

6. Kakade K., Mishra A. K., Ghate K., Gupta Sh. Forecasting Commodity Market Returns Volatility: A Hybrid Ensemble Learning GARCH-LSTM based Approach // Intelligent Systems in Accounting, Finance and Management. 2022. Vol. 29, iss. 2. P. 103-117. DOI 10.1002/isaf. 1515

7. Kakade K., Jain I., Mishra A. K. Value-at-Risk forecasting: A hybrid ensemble learning GARCH-LSTM based approach // Resources Policy. 2022. Vol. 78. Article 102903. DOI 10.1016/j.resourpol.2022.102903

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Lei B., Liu Z., Song Y. On stock volatility forecasting based on text mining and deep learning under high-frequency data // Journal of Forecasting. 2021. Vol. 40, iss. 8. P. 1596-1610. DOI 10.1002/for.2794

9. Liu Y. Novel volatility forecasting using deep learning-Long Short Term Memory Recurrent Neural Networks // Expert Systems with Applications. 2019. Vol. 132. P. 99-109. DOI 10.1016/j.eswa.2019.04.038

10. Verma S. Forecasting volatility of crude oil futures using a GARCH-RNN hybrid approach // Intelligent Systems in Accounting, Finance and Management. 2021. Vol. 28, iss. 2. P. 130-142. DOI 10.1002/isaf.1489

11. Wang T. Stock Volatility Forecasting: Adopting LSTM Deep Learning Method and Comparing the Results with GARCH Family Model // FFIT 2022: Proceedings of the International Conference on Financial Innovation, FinTech and Information Technology (October 28-30, 2022, Shenzhen, China). European Alliance for Innovation, 2023. 12 p. DOI 10.4108/ eai.28-10-2022.2328447

12. Балагула Ю. М. Прогнозирование суточных цен на ОРЭМ РФ с помощью модели ARFIMA // Прикладная эконометрика. 2020. № 1 (57). С. 89-101. DOI 10.22394/1993-7601-2020-57-89-101. EDN YJVKGF

13. Берзон Н. И., Сулицкий Е. А. Применение EGARCH моделей для анализа спредов Российских корпоративных еврооблигаций // Облигационный рынок: анализ тенденций и перспектив: монография. М.: ИНФРА-М, 2016. С. 171-178. EDN VZPWBZ

14. Гарафутдинов Р. В. Исследование влияния некоторых параметров модели ARFIMA на точность прогноза финансовых временных рядов // Прикладная эконометрика. 2021. № 2 (62). С. 85-100. DOI 10.22394/1993-7601-2021-62-85-100. EDN GZHIKL

4. Jiao X., Song Y., Kong Y., Tang X. Volatility forecasting for crude oil based on text information and deep learning PSO-LSTM model. Journal of Forecasting, 2022, vol. 41, iss. 5, pp. 933-944. DOI 10.1002/for.2839

5. Jung G., Choi S. Y. Forecasting foreign exchange volatility using deep learning autoencoder-LSTM techniques. Complexity, 2021, vol. 2021, 6647534, 16 p. DOI 10.1155/2021/6647534

6. Kakade K., Mishra A. K., Ghate K., Gupta Sh. Forecasting commodity market returns volatility: A hybrid ensemble learning GARCH-LSTM based approach. Intelligent Systems in Accounting, Finance and Management, 2022, vol. 29, iss. 2, pp. 103-117. DOI 10.1002/isaf. 1515

7. Kakade K., Jain I., Mishra A. K. Value-at-Risk forecasting: A hybrid ensemble learning GARCH-LSTM based approach. Resources Policy, 2022, vol. 78, 102903. DOI 10.1016/j.resourpol.2022.102903

8. Lei B., Liu Z., Song Y. On stock volatility forecasting based on text mining and deep learning under high-frequency data. Journal of Forecasting, 2021, vol. 40, iss. 8, pp. 1596-1610. DOI 10.1002/for.2794

9. Liu Y. Novel volatility forecasting using deep learning-Long Short Term Memory Recurrent Neural networks. Expert Systems with Applications, 2019, vol. 132, pp. 99-109. DOI 10.1016/j.eswa.2019.04.038

10. Verma S. Forecasting volatility of crude oil futures using a GARCH-RNN hybrid approach. Intelligent Systems in Accounting, Finance and Management, 2021, vol. 28, iss. 2, pp. 130-142. DOI 10.1002/isaf.1489

11. Wang T. Stock volatility forecasting: Adopting LSTM deep learning method and comparing the results with GARCH family model. FFIT 2022: Proceedings of the International Conference on Financial Innovation, FinTech and Information Technology (October 28-30,

2022, Shenzhen, China). European Alliance for Innovation,

2023. 12 p. DOI 10.4108/eai.28-10-2022.2328447

12. Balagula Yu. M. Forecasting daily spot prices in the Russian electricity market with the ARFIMA model. Prikladnaya ekonometrika = Applied Econometrics, 2020, no. 1 (57), pp. 89-101. (In Russ.). DOI 10.22394/1993-7601-2020-57-89-101. EDN YJVKGF

13. Berzon N. I., Sulitskii E. A. Primenenie EGARCH modelei dlya analiza spredov Rossiiskikh korporativnykh evroobligatsii. Obligatsionnyi rynok: analiz tendentsii i perspektiv = Bond Market: Analysis of Trends and Prospects. Moscow, 2016, pp. 171-178. (In Russ.). EDN VZPWBZ

14. Garafutdinov R. V. Influence of some ARFIMA model parameters on the accuracy of financial time series forecasting. Prikladnaya ekonometrika = Applied Econometrics, 2021, no. 2 (62), pp. 85-100. (In Russ.). DOI 10.22394/1993-7601-2021-62-85-100. EDN GZHIKL

15. Загайнов А. И. Исследование изменения фрактальности хаотических процессов на рынках капитала // Интеллектуальные технологии на транспорте. 2017. № 4 (12). С. 39-43. EDN YQKOHT

16. Симонов П. М., Гарафутдинов Р. В. Моделирование и прогнозирование динамики курсов финансовых инструментов с применением эконо-метрических моделей и фрактального анализа // Вестник Пермского университета. Серия «Экономика». 2019. Т. 14, № 2. С. 268-288. DOI 10.17072/ 1994-9960-2019-2-268-288. EDN NHKAMR

СВЕДЕНИЯ ОБ АВТОРАХ

Дмитрий Александрович Патласов - аспирант кафедры информационных систем и математических методов в экономике, Пермский государственный национальный исследовательский университет (Россия, 614068, г. Пермь, ул. Букирева, д. 15); Н dmitriypatlasov@gmail.com

Роберт Викторович Гарафутдинов - кандидат экономических наук, доцент кафедры информационных систем и математических методов в экономике, Пермский государственный национальный исследовательский университет (Россия, 614068, г. Пермь, ул. Букирева, д. 15); Н rvgarafutdinov @gmail.com

15. Zagaynov A. I. Investigation of the change in the fractality of chaotic processes in the capital markets. Intellektual'nye tekhnologii na transporte = Intellectual Technologies on Transport, 2017, no. 4 (12), pp. 39-43. (In Russ.). EDN YQKOHT

16. Simonov P. M., Garafutdinov R. V. Modeling and forecasting of financial instruments dynamics using econometric models and fractal analysis. Perm University Herald. Economy, 2019, vol. 14, no. 2, pp. 268288. (In Russ.). DOI 10.17072/1994-9960-2019-2268-288. EDN NHKAMR

INFORMATION ABOUT THE AUTHORS

Dmitry Aleksandrovich Patlasov - Postgraduate student at the Department of Information Systems and Mathematical Methods in Economics, Perm State University (15, Bukireva st., Perm, 614068, Russia); H dmitriypatlasov@gmail.com

Robert Viktorovich Garafutdinov - PhD in Economics, Associate Professor at the Department of Information Systems and Mathematical Methods in Economics, Perm State University (15, Bukireva st., Perm, 614068, Russia); H rvgarafutdinov@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.