Применение сети долгой краткосрочной памяти для прогнозирования цен акций в условиях неопределенности

Бушуев Максим Витальевич; Беришев Марат Шамильевич; Востриков Евгений Иванович

УДК 004.89

DOI 10.52575/2687-0932-2023-50-3-669-680

Применение сети долгой краткосрочной памяти для прогнозирования цен акций в условиях неопределенности

Бушуев М.В., Беришев М.Ш., Беришева Е.Д., Востриков Е.И.

Волгоградский государственный технический университет, Россия, 400005, г. Волгоград, проспект им. В.И. Ленина, д. 28. E-mail: [email protected], [email protected], [email protected]

Аннотация. Прогнозирование цен акций различных компаний является одной из важнейших и сложных задач в финансовой экономике. Чем выше точность прогнозирования, тем больше прибыли может получить инвестор с торговли акциями. В настоящее время существует множество моделей прогнозирования, как статистических, так и с использованием машинного обучения. Однако у всех этих моделей есть один большой недостаток - они не способны учитывать последовательность данных при прогнозировании, что значительно снижает точность предсказания. Для решения данной проблемы было предложено применение модели глубокого обучения - рекуррентной нейронной сети долгой краткосрочной памяти. Данная модель способна учитывать хронологию данных, а также работать с большим количеством исторических данных. Целью данного исследования является анализ и разработка нейронной сети долгой краткосрочной памяти для прогнозирования котировок акций. Для анализа предложенной модели прогнозирования были проведены эксперименты по оценке точности прогнозов, выдаваемых разработанной нейронной сетью. В результате проведенных экспериментов было выявлено, что нейронная сеть долгой краткосрочной памяти по результатам прогнозирования превосходит довольно популярную статистическую модель SARIMAX. Разработанная модель может быть полезна для инвесторов в качестве дополнительного эффективного инструмента прогнозирования котировок акций.

Ключевые слова: машинное обучение, глубокое обучение, искусственная нейронная сеть, прогнозирование финансовых временных рядов, биржевая торговля

Для цитирования: Бушуев М.В., Беришев М.Ш., Беришева Е.Д., Востриков Е.И. 2023. Применение сети долгой краткосрочной памяти для прогнозирования цен акций в условиях неопределенности. Экономика. Информатика, 50(3): 669-680. DOI: 10.52575/2687-0932-2023-50-3-669-680

Application of a Long Short-Term Memory Network to Predict Stock Prices under Uncertainty

Maxim V. Bushuev, Marat Sh. Berishev, Elena D. Berisheva, Evgeniy I. Vostrikov

Volgograd State Technical University, 28 Lenina Ave, Volgograd, 400005, Russian Federation E-mail: [email protected], [email protected]

Abstract. Forecasting the prices of shares of various companies is one of the most important and complex tasks in the financial economy. The higher the forecasting accuracy, the more profit an investor can get from stock trading. Currently, there are many forecasting models, both statistical and using machine learning. However, all these models have one big drawback - they are not able to take into account the data sequence when predicting, which significantly reduces the prediction accuracy. To solve this problem, it was proposed to use a deep learning model a recurrent neural network of long short-term memory. This model is able to take into account the chronology of data, as well as work with a large amount of historical data. The purpose of this study is to analyze and develop a long short-term memory neural network for predicting stock prices. To analyze the proposed forecasting model, experiments were carried out to assess the accuracy of forecasts issued by the developed neural network. As a result of the experiments, it was

found that the neural network of long short-term memory, according to the results of forecasting, is superior to the rather popular statistical model SARIMAX. The developed model can be useful for investors as an additional effective tool for forecasting stock prices.

Keywords: machine learning, deep learning, artificial neural network, financial time series forecasting, stock trading

For citation: Bushuev M.V., Berishev M.Sh., Berisheva E.D., Vostrikov E.I. 2023. Application of a Long Short-Term Memory Network to Predict Stock Prices Under Uncertainty. Economics. Information technologies, 50(3): 669-680 (in Russian). DOI: 10.52575/2687-0932-2023-50-3-669-680

Введение

Одной из важнейших задач в финансовой экономике является прогнозирование будущих цен акций различных компаний. Чем выше точность прогнозирования, тем больше прибыли может получить инвестор с торговли акциями [Tao et al., 2018].

Прогнозирование цены акции - достаточно сложная и нетривиальная задача, поскольку цена акции динамична, нелинейна, имеет высокую волатильность и непостоянную дисперсию. Цена акции зависит от различных факторов, таких как текущее состояние экономики, финансовое положение самой компании - эмитента акции, политическая обстановка, сезонность, текущие предпочтения инвесторов [Нестерова, 2020]. Данные о динамике цен акции представляются в виде временных рядов. Финансовые временные ряды имеют краткосрочный, среднесрочный и долгосрочный тренды, сезонные и циклические колебания, а также случайный шум, что сильно осложняет их анализ и прогнозирование [Обрубов, 2021].

В настоящее время существует большое количество моделей и методов прогнозирования цен акций. В биржевой торговле широко используются экономико-математические, экспертные и статистические методы, прогнозирование с помощью фундаментального и технического анализа. Среди наиболее популярных моделей прогнозирования котировок ценных бумаг, обращающихся на фондовом рынке, можно выделить авторегрессионное интегрированное скользящее среднее (ARIMA), экспоненциальное сглаживание и фильтрацию Кальмана [Передриенко и др., 2020]. Однако все эти методы обладают определенными недостатками, из-за чего всё большую популярность приобретают более продвинутые модели прогнозирования, основанные на машинном и глубоком обучении.

Классические модели и методы могут хорошо работать только со стационарными временными рядами. Их можно использовать и для обработки нестационарных данных, однако производительность будет очень низкой. Стационарные данные можно преобразовать в нестационарные, однако в таком случае исходная структура будет искажена. Почти все классические модели предназначены для работы с данными, которые имеют линейную зависимость. В то же время временные ряды реального мира часто бывают нелинейными [Губарева, 2020].

В отличие от классических моделей прогнозирования, предполагающих реализацию готовых алгоритмов, глубокое обучение основано на системе распознавания скрытых закономерностей. Методы глубокого обучения способны изучать сложные и нелинейные отношения по сравнению с классическими методами [Khoojine, Han, 2020].

Объекты и методы исследования

Целью данного исследования является анализ и разработка нейронной сети долгой краткосрочной памяти для прогнозирования котировок акций.

Существует множество типов и видов искусственных нейронных сетей, которые можно использовать для прогнозирования финансовых временных рядов [Balcl, 2020]. Фи-

нансовые временные ряды являются последовательными данными, они имеют определенный порядок, который важно учитывать. Однако в большинстве архитектур искусственных нейронных сетей каждый входной признак обрабатывается независимо. Таким образом, обычные многослойные нейронные сети практически не способны учитывать порядок данных. Рекуррентные нейронные сети являются наиболее подходящими для обработки финансовых временных рядов, поскольку данные нейронные сети способны учитывать порядок данных [Yan et al., 2022].

Рекуррентная нейронная сеть (RNN) состоит из множества ячеек и представляет собой повторяющуюся комбинацию нескольких идентичных ячеек, где выходные данные каждой ячейки являются входными данными для следующей ячейки [Сунчалин, 2020]. Каждая ячейка в сети содержит набор входных, скрытых и выходных единиц. Отличительной особенностью рекуррентной нейронной сети является способность сохранять внутреннюю память о входных данных. Именно данная особенность и обеспечивает учет хронологии при прогнозировании временных рядов.

Однако у рекуррентных нейронных сетей имеется недостаток - при большом количестве входных данных обучение модели становится слишком медленным либо совсем останавливается. Данная проблема также известна как проблема затухающего градиента [Nayak et al., 2018]. Для решения проблемы затухающего градиента были разработаны модификации рекуррентной архитектуры. Одной из таких модификаций является рекуррентная нейронная сеть долгой краткосрочной памяти (LSTM).

Применение долгой краткосрочной памяти решает проблему сохранения информации в течение более длительных интервалов времени за счет использования градиентного метода, который является улучшением по сравнению с обычной моделью рекуррентной нейронной сети. Обычные рекуррентные нейронные сети имеют достаточно короткую внутреннюю память, в то время как нейронные сети долгой краткосрочной памяти имеют более длинную память и способны учиться на входных данных, которые отделены друг от друга большими временными отрезками. Было проведено множество исследований, в которых сеть долгой краткосрочной памяти значительно превосходит базовые показатели таких моделей машинного обучения, как многослойный персептрон (MLP), метод опорных векторов (SVM) и обычную рекуррентную нейронную сеть при прогнозировании цен открытия и цен закрытия для котировок ценных бумаг [Yamin, Gulzar, 2020].

Архитектура нейронной сети долгой краткосрочной памяти представлена на рис. 1. Сеть принимает на вход вектор входных данных, а на выходе выдает вектор выходных данных. Сеть состоит из ячеек, каждая ячейка содержит в себе нейроны, в которых используется функция активации в виде сигмоида или гиперболического тангенса. Нейронная сеть имеет 3 вентиля: вентиль обновления, вентиль забывания, выходной вентиль. Вентиль обновления определяет, стоит ли добавлять новые данные для обучения. Вентиль забывания удаляет неважную информацию. Выходной вентиль определяет, какую информацию необходимо вывести из нейронной сети.

Результаты и их обсуждение

Была проведена серия экспериментов по оценке точности прогнозов, выполненных при помощи нейронной сети долгой краткосрочной памяти. Прогнозы осуществлялись по следующим параметрам котировок: максимальная цена (High), минимальная цена (Min), цена закрытия (Close), цена открытия (Open). Обучение для каждого финансового временного ряда проводилось по отдельности.

Сеть состоит из 5 слоев: входной слой, 2 LSTM слоя, один промежуточный полносвязный слой, один выходной слой. Входной слой содержит количество нейронов, соответствующее размерности входных данных. Каждый из LSTM слоев содержит большое количество нейронов - 256. Промежуточный полносвязный слой содержит 32 нейрона. Выходной слой содержит лишь один нейрон. В качестве функции активации всех нейронов была

использована ReLU, которая является одной из самых популярных и проверенных функций активации ^ио et а1., 2022].

Производительность и точность работы нейронной сети сильно зависит от выбора гиперпараметров [Имамзазин, 2019]. Обучение нейронной сети на исторических данных только одного финансового инструмента требует больших вычислительных мощностей. Выбор гиперпараметров архитектуры нейронной сети был произведен экспериментальным образом с помощью автоматизированных средств. Поскольку сеть должна обучаться с нуля для каждого отдельного финансового инструмента, при разработке архитектуры сети основное предпочтение отдавалось производительности. Было проведено множество исследований, в которых было установлено, что именно в рекуррентной сети большее число нейронов является более предпочтительным, чем большее число слоев ^ап et а1., 2022]. Схема архитектуры искусственной нейронной сети, примененной в эксперименте, показана на рис. 2.

Рис.1. Архитектура сети долгой краткосрочной памяти Fig.1. Long Short Term Memory Network Architecture

Тип СЛОЯ

Входной

LSTM

Полносвязный Полносвязный

Слой

>S )5

IS и и и о

«=: u Э5 IS IS s ^ u

-Q X л X 3" 2 )S о

X X X =c

а» Oi o_

п. n.

а. Q.

CD > QJ Q_ >* * a> Q- Ш < jQ Ш

Кол-во нейронов

256

32

Рис.2. Архитектура нейронной сети, использованной в экспериментах Fig.2. Architecture of the neural network used in the experiment

Данные являются важным компонентом прогнозирования фондового рынка и играют особую роль в процессе прогнозирования. Для проведения экспериментов были использованы исторические данные изменения цен акций 10 крупных компаний за три года - в период с 1 января 2020 года по 1 января 2023 года. Компании относятся к разным секторам экономики. Технические индикаторы не были использованы в качестве входных данных.

Для всех экспериментов данные были разделены на 2 выборки: обучающая - первые 80% данных, тестовая - 20% данных. Исторические данные были получены с Московской Биржи. Данные прошли предварительную обработку, которая включала в себя удаление неполных записей и минимаксную нормализацию. Множество исследований показали, что использование предварительно обработанных данных приводит к более эффективным прогнозам [Тимофеев, Лебединская, 2022].

Эксперименты проводились в среде Jupyter Notebook с использованием библиотеки глубокого обучения TensorFlow 2, написанной на языке программирования Python.

В качестве оптимизатора обучения нейронной сети был использован современный оптимизатор Adam. Алгоритм Adam является разновидностью мини-пакетного градиентного спуска, при котором обучение проводится на данных, разбитых на мини-пакеты [Liu, Ma, 2022]. Была выбрана минимальная размерность мини-пакета, что, с одной стороны, сильно снижает скорость обработки данных, а с другой - гарантирует максимально возможную точность. Поскольку задача прогнозирования цен акций является задачей регрессии, в качестве функции потерь была использована среднеквадратическая ошибка (Mean Squared Error, MSE). Длительность обучения (количество эпох) варьируется в зависимости от использованного в эксперименте таймфрейма.

Самыми популярными метриками оценки точности прогнозов являются корень из среднеквадратической ошибки и коэффициент детерминации, однако их достаточно сложно интерпретировать [Cui et al., 2019]. Именно поэтому для оценки точности прогнозов использовалась следующая метрика - среднее абсолютное процентное отклонение (MAPE), которая выражает ошибочность модели прогнозирования в виде процентов. Расчет метрики производился на тестовой выборке. Чем меньше MAPE, тем выше точность прогнозов.

Для оценки эффективности разработанной нейронной сети были также проведены эксперименты и с моделью SARIMAX с теми же данными. Для каждого эксперимента было проведено сравнение результатов, полученных с помощью модели SARIMAX и полученных с помощью разработанной нейронной сети.

Модель SARIMAX расшифровывается как «расширенное авторегрессионное интегрированное скользящее среднее с сезонностью». Модель SARIMAX является модификацией модели ARIMA, которая доказала свою эффективность во множестве исследований, посвященных прогнозированию временных рядов [Имамзазин, 2019]. Модель ARIMA -довольно популярная статистическая модель, которая предназначена для прогнозирования будущих значений временного ряда на основе прошлых значений. В отличие от стандартной модели ARIMA, модель SARIMAX использует дополнительные экзогенные переменные, которые могут оказать влияние на временной ряд и помочь улучшить точность прогнозов.

Модель SARIMAX характеризуется множеством параметров, от которых зависит эффективность работы модели для конкретного временного ряда. При проведении экспериментов данные параметры были автоматически подобраны для каждого временного ряда с помощью использования библиотеки «pmdarima».

Модель SARIMAX в результатах экспериментов обозначена как «ARIMA», в то время как сеть долгой краткосрочной памяти обозначена как «LSTM».

В эксперименте №1 данные имеют дневной временной интервал (дневной таймф-рейм). Длительность обучения нейронной сети - 5 эпох. Обучение сети производилось на данных за все 3 года. Результаты проведенного эксперимента продемонстрированы в таблице 1.

Таблица 1 Table 1

Результаты эксперимента №1 по оценке точности прогнозов, выдаваемых сетью LSTM и моделью SARIMAX на данных с дневным таймфреймом Results of experiment No. 1 on assessing the accuracy of forecasts issued by the LSTM network and the SARIMAX model on data with a daily timeframe

Тикер MAPE(Close), % MAPE(High), % MAPE(Low), % MAPE(Open), %

ARIMA LSTM ARIMA LSTM ARIMA LSTM ARIMA LSTM

SBER 10.0 5.59 7.39 1.72 8.67 2.83 10.0 3.00

LKOH 6.92 4.37 6.65 1.80 9.05 3.94 6.92 2.00

VTBR 10.24 9.40 4.57 4.46 2.23 1.86 6.64 4.00

ROSN 10.55 2.82 11.0 2.30 10.79 2.40 10.55 3.82

SIBN 8.32 3.19 7.9 2.22 7.76 2.07 8.32 1.87

TATN 7.31 3.40 7.2 2.00 8.33 4.77 7.31 2.60

RTKM 7.98 3.32 12.05 2.34 6.94 1.73 7.98 1.27

NLMK 8.58 4.13 8.93 2.87 8.16 2.43 8.05 2.66

SNGS 9.65 5.78 9.78 7.94 4.84 3.20 9.65 2.33

GAZP 5.52 2.87 5.39 2.43 10.32 6.11 5.52 3.54

Среднее 8.51 4.49 8.09 3.01 7.71 3.13 8.09 2.71

Исходя из результатов эксперимента №1, приведенных в таблице 1, можно сделать вывод, что для данных с дневным временным интервалом разработанная LSTM-сеть выдает прогнозы большей точности, чем у модели SARIMAX. Нейронная сеть выдает более эффективные результаты для всех параметров котировок и для всех приведенных финансовых инструментов.

В эксперименте №2 данные имеют часовой временной интервал (часовой таймф-рейм). Часовой временной интервал предполагает увеличение объема данных в сравнении с дневным временным интервалом, поэтому в данном эксперименте были использованы данные за последний год, в период с 1 января 2022 года по 1 января 2023 года. Поскольку объем данных в эксперименте больше, чем в предыдущем, длительность обучения нейронной сети была снижена до 3 эпох. Результаты эксперимента №2 продемонстрированы в таблице 2.

По результатам, приведенным в таблице 2, можно сделать вывод, что рекуррентная нейронная сеть демонстрирует более высокие результаты и для данных с часовым временным интервалом. Однако стоит отметить, что в некоторых случаях (например, для тикера КЬМК) модель SARIMAX все же превосходит нейронную сеть. В целом, для данных с часовым временным интервалом, и модель SARIMAX, и нейронная сеть выдают прогнозы высокой точности.

В эксперименте №3 данные имеют 10-минутный временной интервал (10-минутный таймфрейм). 10-минутный временной интервал предполагает очень большой объем данных, поэтому были использованы данные за 6 месяцев, в период с 1 июля 2022 года по 1 января 2023 года. Поскольку объем данных в разы больше, чем в предыдущих экспериментах, была использована всего одна эпоха обучения нейронной сети. Результаты эксперимента №3 продемонстрированы в таблице 3.

По результатам эксперимента №3, приведенных в таблице 3, можно сделать вывод, что модель SARIMAX и нейронная сеть долгой краткосрочной памяти показывают превосходные результаты для обработки достаточно длинных временных рядов. При этом у нейронной сети результаты немного лучше, чем у SARIMAX.

Таблица 2 Table 2

Результаты эксперимента №2 по оценке точности прогнозов, выдаваемых сетью LSTM и моделью SARIMAX на данных с часовым таймфреймом Results of experiment No. 2 on assessing the accuracy of forecasts issued by the LSTM network and the ARIMA model on data with a hourly timeframe

Тикер MAPE(Close), % MAPE(High), % MAPE(Low), % MAPE(Open), %

ARIMA LSTM ARIMA LSTM ARIMA LSTM ARIMA LSTM

SBER 1.63 1.29 1.48 0.81 1.79 1.39 2.02 1.32

LKOH 0.68 0.94 1.72 0.97 2.08 2.54 1.66 1.48

VTBR 3.24 0.66 3.14 0.71 3.17 0.76 3.22 0.78

ROSN 2.64 1.97 2.42 0.96 2.95 2.02 3.21 1.29

SIBN 4.58 1.17 4.43 2.14 4.36 1.67 4.53 1.55

TATN 0.36 2.25 0.37 0.67 0.39 0.83 0.37 0.78

RTKM 2.44 0.42 2.92 0.52 2.63 0.70 2.71 1.46

NLMK 0.76 1.34 0.73 1.37 1.02 0.94 1.11 1.03

SNGS 1.21 0.71 1.43 0.84 1.33 1.45 1.12 1.29

GAZP 1.84 1.10 1.71 1.25 1.77 1.24 1.78 0.86

Среднее 1.94 1.19 2.04 1.02 2.15 1.35 2.17 1.18

Таблица 3 Table 3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Результаты эксперимента №3 по оценке точности прогнозов, выдаваемых сетью LSTM и моделью ARIMA на данных с 10-минутным таймфреймом Results of experiment No. 3 on assessing the accuracy of forecasts issued by the LSTM network and the ARIMA model on data with a 10-min timeframe

Тикер MAPE(Close), % MAPE(High), % MAPE(Low), % MAPE(Open), %

ARIMA LSTM ARIMA LSTM ARIMA LSTM ARIMA LSTM

SBER 1.34 0.33 1.46 0.74 1.42 0.78 1.51 1.07

LKOH 1.23 0.32 1.05 0.28 1.03 0.29 1.07 0.31

VTBR 2.86 0.25 1.56 0.33 1.61 0.31 1.59 0.20

ROSN 2.32 0.87 1.02 0.22 1.58 0.65 1.84 0.73

SIBN 0.56 0.37 0.55 0.36 0.53 0.35 0.51 0.29

TATN 1.63 0.56 1.77 0.92 1.72 0.81 1.66 0.88

RTKM 2.04 0.82 1.99 0.78 1.82 0.72 1.87 0.56

NLMK 2.01 0.81 1.34 0.24 1.69 0.60 1.71 0.75

SNGS 1.53 0.69 1.24 0.37 1.37 0.53 1.49 0.59

GAZP 2.21 0.80 1.98 0.67 1.56 0.48 1.44 0.30

Среднее 1.77 0.58 1.40 0.49 1.43 0.55 1.47 0.57

В эксперименте №4 данные имеют уже недельный временной интервал (недельный таймфрейм). Как и в эксперименте №1, были использованы данные за все 3 года. Поскольку данных небольшое количество, было использовано 10 эпох обучения нейронной сети. Результаты эксперимента №4 продемонстрированы в таблице 4.

Исходя из результатов, полученных в таблице 4, можно сделать вывод, что при обработке данных с недельным временным интервалом сеть долгой краткосрочной памяти в большинстве случаев превосходит модель SARIMAX, однако модель SARIMAX иногда все же демонстрирует более высокие результаты.

В эксперименте №5 данные имеют месячный временной интервал (месячный таймф-рейм). Были использованы данные за все 3 года. Объем данных в данном случае совсем небольшой, поэтому было использовано 20 эпох обучения нейронной сети. Результаты эксперимента №5 продемонстрированы в таблице 5.

По результатам эксперимента №5 можно сделать вывод, что, в целом, сеть долгой краткосрочной памяти превосходит SARIMAX даже при прогнозировании с учетом малого количества исходных данных. Однако имеется немало случаев, в которых модель SARIMAX лучше LSTM нейронной сети.

Таблица 4 Table 4

Результаты эксперимента №4 по оценке точности прогнозов, выдаваемых сетью LSTM и моделью ARIMA на данных с недельным таймфреймом Results of experiment No. 4 on assessing the accuracy of forecasts issued by the LSTM network and the ARIMA model on data with a weekly timeframe

Тикер MAPE(Close), % MAPE(High), % MAPE(Low), % MAPE(Open), %

ARIMA LSTM ARIMA LSTM ARIMA LSTM ARIMA LSTM

SBER 8.51 5.81 7.02 9.22 8.01 11.71 8.03 6.03

LKOH 8.65 7.0 8.0 3.79 9.32 14.56 10.56 5.01

VTBR 10.15 4.41 8.13 8.64 7.82 11.95 11.39 5.37

ROSN 17.43 5.62 16.28 4.58 13.48 7.65 15.15 10.86

SIBN 9.03 6.22 7.86 6.03 8.97 4.27 8.76 8.26

TATN 7.16 4.78 6.92 4.75 7.31 7.09 6.87 6.03

RTKM 4.43 3.31 4.26 3.67 4.42 3.87 4.50 4.11

NLMK 40.29 10.44 38.53 11.23 45.82 15.2 43.17 7.50

SNGS 10.03 24.47 10.40 29.39 10.07 6.04 9.69 20.37

GAZP 45.09 9.34 39.96 13.12 35.17 13.78 32.98 12.61

Среднее 16.08 8.14 14.74 9.44 15.04 9.61 15.11 8.62

Итоговые результаты по всем экспериментам продемонстрированы на графике, изображенном на рис. 3. На графике отображено сравнение результатов модели SARIMAX и нейронной сети долгой краткосрочной памяти. Для каждого из 4 параметров котировок по каждому временному интервалу показано среднее MAPE по всем тикерам.

На основании полученных со всех экспериментов результатов можно сделать несколько выводов. Во-первых, с ростом временного интервала данных результаты моделей становятся все хуже. Модели допускают наибольшие ошибки при прогнозировании данных с недельным и месячным интервалами. Во-вторых, нейронная сеть долгой краткосрочной памяти превосходит модель SARIMAX во всех экспериментах, что говорит об высокой эффективности разработанной модели. Тем не менее, в некоторых ситуациях модель SARIMAX показывала результаты лучше, чем у LSTM-сети.

Таблица 5 Table 5

Результаты эксперимента №5 по оценке точности прогнозов, выдаваемых сетью LSTM и моделью ARIMA на данных с месячным таймфреймом Results of experiment No. 5 on assessing the accuracy of forecasts issued by the LSTM network and the ARIMA model on data with a monthly timeframe

Тикер MAPE(Close), % MAPE(High), % MAPE(Low), % MAPE(Open), %

ARIMA LSTM ARIMA LSTM ARIMA LSTM ARIMA LSTM

SBER 23.08 19.41 36.10 5.72 10.70 9.22 49.80 6.69

LKOH 22.64 7.10 32.51 7.73 7.83 14.89 34.56 10.53

VTBR 22.64 17.80 46.52 18.04 5.95 10.21 72.75 30.22

ROSN 13.96 10.19 31.46 7.48 14.48 18.75 29.14 10.19

SIBN 8.90 9.27 9.76 6.75 12.80 8.61 10.67 11.21

TATN 7.80 12.46 11.33 14.66 6.93 12.49 6.92 10.80

RTKM 9.80 8.53 16.85 4.70 3.95 4.80 8.79 6.61

NLMK 16.29 11.98 9.70 8.32 54.62 15.09 44.19 13.06

SNGS 9.41 25.15 20.12 18.22 14.88 22.49 22.15 15.69

GAZP 37.77 18.39 50.99 23.36 20.41 19.13 33.75 21.18

Среднее 17.23 14.03 26.53 11.50 15.26 13.57 31.27 13.62

Рис.3. Сравнение результатов всех экспериментов, произведенных с помощью моделей SARIMAX и LSTM Fig .3. Comparison of the results of all experiments performed using the SARIMAX and LSTM models

LSTM-сеть показывает отличные результаты на данных с малым временным интервалом. При прогнозировании нейронной сетью временных рядов с 10-минутным таймфреймом MAPE принимает значение в среднем в диапазоне от 0.5% до 1.5%, при часовом тайм-фрейме - от 1% до 2%, при дневном таймфрейме - от 2% до 5%. В то же время при недельном и месячном таймфрейме MAPE может достигать достаточно больших значений.

Во всех экспериментах возможно добиться и более низкого MAPE с помощью повышения количества слоев сети, числа нейронов в них, а также увеличение числа эпох обучения. Однако увеличение значений гиперпараметров требует большей вычислительной мощности и может привести к более длительному обучению [Nor, Zawawi, 2020].

В результате проведенных экспериментов было обнаружено, что искусственная нейронная сеть долгой краткосрочной памяти даже при небольшом количестве слоев и нейронов по точности прогнозов превосходит достаточно популярную и мощную модель SARIMAX. Таким образом, нейронная сеть долгой краткосрочной памяти является весьма эффективной моделью прогнозирования финансовых временных рядов.

Заключение

Экспериментальные результаты показывают, модель рекуррентной нейронной сети с двумя слоями долгой краткосрочной память, содержащих по 256 скрытых нейронов, может обеспечить высокую точность прогнозирования по сравнению с классическими (статистическими) моделями прогнозирования, такими как ARIMA. Предложенную модель можно легко настроить для применения в прогнозировании котировок акций других компаний, где данные демонстрируют аналогичное поведение.

Стоит учесть, что рациональный прогноз зависит не только от результата конкретной модели, но и от волатильности фондового рынка, особенно во время геополитической напряженности, нарушения глобальной цепочки поставок, различных политических и экономических ситуаций. Если текущее поведение рынка достоверно проанализировано и объединено с результатами модели, есть хорошие возможности для получения прибыли [Mezghani et al., 2021].

Индивидуальные инвесторы и трейдеры стремятся как можно более точно предсказать будущую цену, однако невозможно абсолютно точно спрогнозировать цену акции и предсказать ожидаемую доходность [Liu, Ma, 2022]. Рекуррентная сеть долгой краткосрочной памяти показывает многообещающую возможность максимально точно спрогнозировать будущие котировки акции. В результате заинтересованные стороны могут использовать данную модель глубокого обучения в качестве дополнительной информации для принятия верных инвестиционных решений. Кроме того, научные исследователи могут использовать эту модель для расширения своих знаний в области последовательного моделирования данных.

Предложенная модель может быть определенным образом модифицирована для более точных прогнозов. Рекуррентные нейронные сети долгой краткосрочной памяти могут работать не только с историческими данными, но и с неструктурированной текстовой информацией. Текстовой информацией могут быть политические и финансовые новости, данные из социальных сетей, исследовательские отчеты финансовых аналитиков. Следовательно, можно модифицировать предложенную модель таким образом, чтобы она работала не только с численными данными, но и с текстовыми. Учет таких текстовых данных, как финансовые новости, может значительно повысить точность прогнозов [Хоботов, 2021]. Помимо этого, предложенная модель может быть объединена с другими архитектурами нейронных сетей (например, со сверточной архитектурой), что также может привести к более точным прогнозам.

Список литературы

Губарева Е.А. 2020. Нейронные сети в анализе временных рядов. Инновации и инвестиции, 10: 150-153. Губарева Е.А., Хашин С.И. 2021. Вопросы эффективности обучения нейронных сетей при анализе

временных рядов. Экономика: вчера, сегодня, завтра. 9(1): 121-127. Имамзазин Т. Р. 2019. Основные методы и модели прогнозирования будущего курса акций. Наука,

Техника и Образование, 10(63): 63-67. Нестерова К.И. 2020. Обзор современных методов прогнозирования динамики цен на фондовом

рынке. Наукосфера, 7: 91-95. Обрубов М.О. 2021. Применение LSTM-сети в решении задачи прогнозирования многомерных

временных рядов. Национальная Ассоциация Ученых, 68(2): 43-48. Передриенко А.И., Лютая Т.П., Харитонов И.М., Степанченко И.В. 2020. Методы краткосрочного

прогнозирования финансовых временных рядов с малыми объёмами выборки. ИВД, 5: 65. Сунчалин А.М. 2020. Обзор методов и моделей прогнозирования финансовых временных рядов.

Хроноэкономика, 1: 25-29. Тимофеев А.Г., Лебединская О.Г. 2022. Модель применения сверточной нейронной сети (cnn) в сочетании с долговременной памятью (lstm) прогнозирования цены на нефть в условиях неопределенности. ТДР, 2: 35-44.

Хоботов В.А. 2021. Анализ тональности финансовых новостей с применением нейросетевых моделей для прогноза динамики цен на нефть марки Brent. Актуальные вопросы современной экономики, 2: 138-143.

Balcl M. A. 2020. Fractional Interaction of Financial Agents in a Stock Market Network. Applied

Mathematics and Nonlinear Sciences, 5(1): 317-336. DOI: 10.2478/amns.2020.1.00030 Cui X., Hu J., Wu P. 2021. Investigation of stock price network based on time series analysis and complex

network. International Journal of Modern Physics B. DOI: 10.1142/S021797922150171X Guo W., Li Z., Gao C., Yang Y. 2022. Stock price forecasting based on improved time convolution network.

Computational Intelligence. DOI: 10.1111/coin.12519 Khoojine A. S., Han D. 2020. Stock price network autoregressive model with application to stock market turbulence. The European Physical Journal B - Condensed Matter and Complex Systems, 93(7): 133. DOI: 10.1140/epjb/e2020-100419-9 Liu G., Ma.W. 2022. A quantum artificial neural network for stock closing price prediction. Information

Sciences, 598: 75-85. DOI: 10.1016/j.ins.2022.03.064 Mezghani T., Ben Hamadou F., Boujelbene Abbes M. 2021. The dynamic network connectedness and hedging strategies across stock markets and commodities: COVID-19 pandemic effect. Asia-Pacific Journal of Business Administration. DOI: 10.1108/APJBA-01-2021-0036 Nayak S.C., Misra B.B. 2018. Estimating stock closing indices using a GA-weighted condensed polynomial

neural network. Financial Innovation, 4(1): 21. DOI: 10.1186/s40854-018-0104-2 Nor S.M., Zawawi N.H.M. 2020. A neural network approach for fundamental investment analysis: a case

of Athens Stock Exchange. Economic Annals-XXI, 182(4): 56-63. DOI: 10.21003/ea.V182-07 Tao Z., Chunhui L., Muzhou H. 2018. Forecasting stock index with multi-objective optimization model based on optimized neural network architecture avoiding overfitting. Computer Science and Information Systems, 15(1): 211-236. DOI: 10.2298/CSIS170125042T Yamin S., Gulzar S. 2020. Multiples and stock price, new approach for relative valuation through neural

network. Singapore Economic Review. DOI: 10.1142/S0217590820480045 Yan Z., Zhou K., Zhu. X, Chen H. 2022. Application of MEA-LSTM Neural Network in Stock Balance Prediction. Lecture Notes on Data Engineering and Communications Technologies, 121: 60-71. DOI: DOI 10.1007/978-3-030-97057-4_6

References

Gubareva E.A. 2020. Nejronnye seti v analize vremennyh rjadov [Neural networks in time series analysis].

Innovacii i investicii [Innovation and investment], 10: 150-153. Gubareva E.A., Hashin S. I. 2021. Voprosy jeffektivnosti obuchenija nejronnyh setej pri analize vremennyh rjadov [Efficiency Issues of Training Neural Networks in Time Series Analysis]. Jekonomika: vchera, segodnja, zavtra [Economics: yesterday, today, tomorrow]. 9(1): 121-127. Imamzazin T.R. 2019. Osnovnye metody i modeli prognozirovanija budushhego kursa akcij [Basic methods and models for predicting the future stock price]. Nauka, Tehnika i Obrazovanie [Science, Technology and Education], 10(63): 63-67. Nesterova K.I. 2020. Obzor sovremennyh metodov prognozirovanija dinamiki cen na fondovom rynke [Overview of modern methods for forecasting price dynamics in the stock market]. Naukosfera, 7: 91-95. Obrubov M.O. 2021. Primenenie LSTM-seti v reshenii zadachi prognozirovanija mnogomernyh vremennyh rjadov [Application of the LSTM network in solving the problem of predicting multivariate time series]. Nacional'naja Associacija Uchenyh [National Association of Scientists], 68(2): 43-48.

Peredrienko A.I., Ljutaja T.P., Haritonov I.M., Stepanchenko I.V. 2020. Metody kratkosrochnogo prognozirovanija finansovyh vremennyh rjadov s malymi objomami vyborki [Methods for short-term forecasting of financial time series with small sample sizes]. IVD, 5: 65. Sunchalin A.M. 2020. Obzor metodov i modelej prognozirovanija finansovyh vremennyh rjadov [Overview of methods and models for forecasting financial time series]. Hronojekonomika [Chronoeconomics], 1: 25-29. Timofeev A.G., Lebedinskaja O.G. 2022. Model' primenenija svertochnoj nejronnoj seti (cnn) v sochetanii s dolgovremennoj pamjat'ju (lstm) prognozirovanija ceny na neft' v uslovijah neopredelennosti [Convolutional neural network (cnn) combined with long-term memory (lstm) application model for oil price forecasting under uncertainty]. TDR, 2: 35-44. Hobotov V.A. 2021. Analiz tonal'nosti finansovyh novostej s primeneniem nejrosetevyh modelej dlja prognoza dinamiki cen na neft' marki Brent [Sentiment Analysis of Financial News Using Neural Network Models to Predict Brent Oil Prices]. Aktual'nye voprosy sovremennoj jekonomiki [Current issues of modern economics], 2: 138-143. Balcl M. A. 2020. Fractional Interaction of Financial Agents in a Stock Market Network. Applied Mathematics and Nonlinear Sciences, 5(1): 317-336. DOI: 10.2478/amns.2020.1.00030

Cui X., Hu J., Wu P. 2021. Investigation of stock price network based on time series analysis and complex

network. International Journal of Modern Physics B. DOI: 10.1142/S021797922150171X Guo W., Li Z., Gao C., Yang Y. 2022. Stock price forecasting based on improved time convolution network.

Computational Intelligence. DOI: 10.1111/coin.12519 Khoojine A. S., Han D. 2020. Stock price network autoregressive model with application to stock market turbulence. The European Physical Journal B - Condensed Matter and Complex Systems, 93(7): 133. DOI: 10.1140/epjb/e2020-100419-9 Liu G., Ma.W. 2022. A quantum artificial neural network for stock closing price prediction. Information

Sciences, 598: 75-85. DOI: 10.1016/j.ins.2022.03.064 Mezghani T., Ben Hamadou F., Boujelbène Abbes M. 2021. The dynamic network connectedness and hedging strategies across stock markets and commodities: COVID-19 pandemic effect. Asia-Pacific Journal of Business Administration. DOI: 10.1108/APJBA-01-2021-0036 Nayak S. C., Misra B. B. 2018. Estimating stock closing indices using a GA-weighted condensed

polynomial neural network. Financial Innovation, 4(1): 21. DOI: 10.1186/s40854-018-0104-2 Nor S.M., Zawawi N.H.M. 2020. A neural network approach for fundamental investment analysis: a case

of Athens Stock Exchange. Economic Annals-XXI, 182(4): 56-63. DOI: 10.21003/ea.V182-07 Tao Z., Chunhui L., Muzhou H. 2018. Forecasting stock index with multi-objective optimization model based on optimized neural network architecture avoiding overfitting. Computer Science and Information Systems, 15(1): 211-236. DOI: 10.2298/CSIS170125042T Yamin S., Gulzar S. 2020. Multiples and stock price, new approach for relative valuation through neural

network. Singapore Economic Review. DOI: 10.1142/S0217590820480045 Yan Z., Zhou K., Zhu. X, Chen H. 2022. Application of MEA-LSTM Neural Network in Stock Balance Prediction. Lecture Notes on Data Engineering and Communications Technologies, 121: 60-71. DOI: DOI 10.1007/978-3-030-97057-4 6

Конфликт интересов: о потенциальном конфликте интересов не сообщалось. Conflict of interest: o potential conflict of interest related to this article was reported.

ИНФОРМАЦИЯ ОБ АВТОРАХ

Бушуев Максим Витальевич, магистрант кафедры «Программное обеспечение автоматизированных систем», Волгоградский государственный технический университет, г. Волгоград, Россия

Беришев Марат Шамильевич, аспирант кафедры «Энергоснабжение и теплотехника», Волгоградский государственный технический университет, г. Волгоград, Россия

Беришева Елена Дмитриевна, старший преподаватель кафедры «Программное обеспечение автоматизированных систем», Волгоградский государственный технический университет, г. Волгоград, Россия

Востриков Евгений Иванович, магистрант кафедры «Программное обеспечение автоматизированных систем», Волгоградский государственный технический университет, г. Волгоград, Россия

INFORMATION ABOUT THE AUTHORS

Maxim V. Bushuev, undergraduate of the Department "Software for Automated Systems", Volgograd State Technical University, Volgograd, Russian Federation

Marat Sh. Berishev, post-graduate student of the Department of Energy Supply and Heat Engineering, Volgograd State Technical University, Volgograd, Russian Federation

Elena D. Berisheva, senior lecturer, Department of Automated Systems Software, Volgograd State Technical University, Volgograd, Russian Federation

Evgeniy I. Vostrikov, undergraduate of the Department "Software for Automated Systems", Volgograd State Technical University, Volgograd, Russian Federation

Application of a Long Short-Term Memory Network to Predict Stock Prices under Uncertainty

Текст научной работы на тему «Применение сети долгой краткосрочной памяти для прогнозирования цен акций в условиях неопределенности»