Научная статья на тему 'МОДЕЛЬ ПРИМЕНЕНИЯ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ (CNN) В СОЧЕТАНИИ С ДОЛГОВРЕМЕННОЙ ПАМЯТЬЮ (LSTM) ПРОГНОЗИРОВАНИЯ ЦЕНЫ НА НЕФТЬ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ'

МОДЕЛЬ ПРИМЕНЕНИЯ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ (CNN) В СОЧЕТАНИИ С ДОЛГОВРЕМЕННОЙ ПАМЯТЬЮ (LSTM) ПРОГНОЗИРОВАНИЯ ЦЕНЫ НА НЕФТЬ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
602
134
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ / АЛГОРИТМ / НЕЙРОННАЯ СЕТЬ / ПРОГНОЗИРОВАНИЕ ЦЕНЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тимофеев А.Г., Лебединская О.Г.

Прогнозирование рынка является ключевым интересом для профессионалов во всем мире. В дополнение к статистическим моделям многие стали применять современные технологии, в том числе машинное обучение и искусственный интеллект. Методы глубокого обучения оказались успешными при моделировании биржевых динамик цен и индексов. В статье рассматривается один из приемов применения сверточной нейронной сети (CNN) в сочетании с долговременной памятью (LSTM) для прогнозирования цены закрытия индекса фондового рынка.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тимофеев А.Г., Лебединская О.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LONG-TERM MEMORY (LSTM) APPLICATION MODEL FOR OIL PRICE FORECASTING UNDER UNCERTAINTY

Market forecasting is a key interest for professionals around the world. In addition to statistical models, many have begun to use modern technologies, including machine learning and artificial intelligence. Deep learning methods have been successful in modeling stock price and index movements. The article discusses one of the methods of using a convolutional neural network (CNN) in combination with long-term memory (LSTM) to predict the closing price of a stock market index.

Текст научной работы на тему «МОДЕЛЬ ПРИМЕНЕНИЯ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ (CNN) В СОЧЕТАНИИ С ДОЛГОВРЕМЕННОЙ ПАМЯТЬЮ (LSTM) ПРОГНОЗИРОВАНИЯ ЦЕНЫ НА НЕФТЬ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ»

УДК 004.942

УДК 33

DOI 10.52375/20728689_2022_2_54

модель применения сверточной нейронной сети (cNN) в сочетании с долговременной памятью (lstm) прогнозирования цены на нефть в условиях неопределенности

тимофеев А.Г., к.э.н., доцент, ФГБОУВО «РЭУ им. Г.В. Плеханова», e-mail: Timofeev.AG@rea.ru лебединская о.Г., к.э.н., доцент, ФГБОУ ВО «РЭУ им. Г.В. Плеханова», e-mail: Lebedinskaya O.G.@rea.ru

Прогнозирование рынка является ключевым интересом для профессионалов во всем мире. В дополнение к статистическим моделям многие стали применять современные технологии, в том числе машинное обучение и искусственный интеллект. Методы глубокого обучения оказались успешными при моделировании биржевых динамик цен и индексов. В статье рассматривается один из приемов применения сверточной нейронной сети (CNN) в сочетании с долговременной памятью (LSTM) для прогнозирования цены закрытия индекса фондового рынка.

ключевые слова: модель, алгоритм, нейронная сеть, прогнозирование цены

long-term memory (lstm) application model for oil price forecasting under uncertainty

Timofeev A., Ph.D., assistant professor, FSBEIHE «PlekhanovRussian University of Economics», e-mail: Timofeev.AG@rea.ru Lebedinskaya o., Ph.D., assistant professor, FSBEI HE «Plekhanov Russian University of Economics», e-mail: Lebedinskaya O.G.@rea.ru

Market forecasting is a key interest for professionals around the world. In addition to statistical models, many have begun to use modern technologies, including machine learning and artificial intelligence. Deep learning methods have been successful in modeling stock price and index movements. The article discusses one of the methods of using a convolutional neural network (CNN) in combination with long-term memory (LSTM) to predict the closing price of a stock market index.

Keywords: model, algorithm, neural network, price prediction

Платформа RBC-LSTM применяет моделирование временных рядов чтобы предсказать движение следующего дня. Наборы функций включают необработанные данные о ценах целевого индекса, а также зарубежных индексов, технических индикаторов, данные о ценах на сырьевые товары. Модель способна собирать информацию для прогнозирования целевой переменной, т. е. цены закрытия, со средней абсолютной процентной ошибкой 2,54% по данным за 10 лет. Предлагаемая схема демонстрирует значительное улучшение доходности по сравнению с традиционным методом «купи и держи».

Различные алгоритмы стохастической оптимизации были гибридизированы с нейронной сетью для дальнейшей оптимизации сети по параметрам. Метод Extreme Learning Machine (ELM) применяется для прогнозирования обмена скорости, а синусно-косинусный алгоритм (SCA) гибридизируется. Более ранние модели прогнозирования, использующие «машинное обучение (ML)». Методы, основанные на нейронных сетях для прогнозирования цен на акции более сложны и менее точны. Прогнозирование будущего рынка даже за несколько секунд до события может принести значительную прибыль по сравнению с традиционным процессом «купи и держи». Раньше для прогнозирования движений использовались статистические модели, но исследования в области нейронных сетей и искусственного интеллекта в целом позволили исследователям и промышленности полагаться на машины для быстрой и прибыльной торговли ценными бумагами. С появлением современных компьютеров и высокой скорости передачи данных алгоритмическая торговля становится все более жизнеспособной. Некоторые хедж-фонды используют технологию больших данных и скрытые марковские модели для получения прибыли, намного превышающей рыночные ориентиры.

Фондовые рынки кажутся случайными, если смотреть на них со стороны, однако большая группа трейдеров оценивает движение по моделям и ценовым уровням на свечных графиках. Статистические модели и алгоритмы машинного обучения, основанные на правилах, были основой для понимания макроэкономических тенденций, но не могли фиксировать тенденции в более точных временных рамках. Машины опорных векторов (SVM) широко используются для принятия торговых решений путем классификации прогнозов будущих цен. Имеется подтверждение, что простая искусственная нейронная сеть (76%) имеет лучшую точность по сравнению с ядром SVM (72%). Модели идентификации или извлечения признаков (что, по

сути, и является уменьшением размерности) и их влияние на производительность стандартных алгоритмов машинного обучения дают значительные улучшения. Алгоритм уменьшения размерности анализа основных компонентов (PCA) для прогнозирования движения фондового рынка превосходит метод Гаусса-Байеса и метод кроссовера скользящего среднего, однако сравнения с моделями глубокого обучения и другими моделями ML отсутствуют. Уменьшение размерности в сочетании с сетью LSTM (68,5%) работает немного лучше, чем автономное прогнозирование временных рядов с помощью LSTM (67,5%) с существенно меньшим количеством функций. Алгоритмы эволюционных вычислений, такие как генетический алгоритм, довольно широко использовались для извлечения признаков и работают лучше, чем традиционный метод «купи и держи», но им требуется несколько сигналов для эффективного моделирования динамического и сложного характера фондовых рынков. Глубокое обучение — это особая ветвь машинного обучения, которая имитирует человеческий мозг, создавая отдельные нейроны и извлекая сложные функции из данных. Глубокое обучение предлагает уникальное преимущество в автоматическом извлечении признаков из необработанных данных. Искусственные нейронные сети (ANN) использовались такими компаниями, как Tesla, для автоматизированной помощи при вождении; Google, Apple и другие используют формы глубокого обучения в области обработки естественного языка для своих личных помощников. Модели глубокого обучения могут идентифицировать лица и могут подавать звуковые сигналы для идентификации песен, моделируя сложные функции и преобразовывая их в более простые переменные. Поскольку данные фондового рынка также являются последовательными, как генерация текста, используемого в чат-ботах, и в то же время зашумленными и сложными, как данные изображений, глубокое обучение оказывается весьма многообещающим. Простые модели многослойного персептрона (MLP) исследовались исследователями в прошлом. Существуют новые архитектуры, которые превзошли традиционные алгоритмы машинного обучения. Исследователи также использовали алгоритмы глубокого обучения, такие как ограниченные машины Больцмана (RBM), автоэнкодеры (AE). Все вышеперечисленные архитектуры превзошли неглубокие и другие традиционные алгоритмы машинного обучения. Используемые технические индикаторы ограничиваются только индикаторами тренда, в то время как индикаторы импульса, волатильности и силы игнорируются. Кроме того, они не определили движение цен и ограничили пред-

Таблица 1. Выбор алгоритма прогнозирования с выделением признаков и предсказания

объем входные функции извлечение признаков Алгоритм/ы прогнозирования

Австралийская биржа Ценовые данные Нейронная сеть IOWA

NASDAQ Ценовые данные, технические индикаторы PCA DNN

Nikkei 225 index Данные о ценах RBM RNN-DBN

Тегеранская фондовая биржа Технические индикаторы Бинарное отображение Машинное обучение и модели глубокого обучения

MSCI, Великобритания Данные о ценах ANN ANN, LSTM, RF, SVR

Корейский фондовый индекс Данные о ценах AE, PCA, RBM ANN, DNN, AR

Сингапурский фондовый индекс Данные о ценах DNN DNN

Индийский фондовый рынок Ценовые данные, Технические индикаторы Масштабированные необработанные данные LSTM

сказание только направлением будущего движения. Во всех трех рассмотренных выше моделях отсутствует количественная оценка будущих цен. Количественная оценка цены необходима трейдерам и торговой системе, чтобы судить о том, будет ли размер прибыли в соответствии с прогнозом безубыточным даже после затрат на брокерские услуги. Модель, обсуждаемая в настоящей статье, направлена на количественную оценку цен как результата.

Долгосрочная кратковременная память (LSTM) — еще один алгоритм глубокого обучения, который фиксирует временную активность и, следовательно, оказывается полезным для моделирования поведения фондовых рынков во временных рядах. Если в течение периода обучения существует четкий восходящий тренд, модель RNN сможет фиксировать только изменение и масштабирование ценовых колебаний, тогда как взаимозависимости между другими источниками информации будут полностью проигнорированы. Аналогичная проблема встречается в, которые использовали а. Модель RNN и модель ARIMA для прогнозирования цен на известняк. В данных обучения существует четкая восходящая тенденция, в то время как в данных тестирования наблюдается неустойчивое падение цен (в основном из-за распродажи на рынке, вызванной коронавирусом в 2020 году). В результате модель не может эффективно уловить вариацию. Это говорит нам о том, что должен быть дополнительный источник информации для модели временных рядов, чтобы учитывать внешние и шумовые факторы, которые управляют рынками. Модель, обсуждаемая в настоящей статье, должна быть в состоянии решить проблемы, упомянутые выше, поскольку функции могут быть извлечены с помощью сверточных слоев, а сезонность и повторяемость могут быть расшифрованы с помощью слоев LSTM.

Настоящая работа вдохновлена сочетанием технических индикаторов и обработки изображений. Технические модели свечей, такие как бычий тренд, три вороны, вечерняя звезда, дают уникальное представление о направлении рынка и предлагают базовую модель. LSTM может эффективно фиксировать данные временных рядов. Предлагаемый алгоритм, наложенный поверх LSTM, создан для анализа ежедневных тенденций рынков и совершения позиционных сделок, но его также можно модифицировать, чтобы он соответствовал требованиям высокочастотной торговли.

В методологии использования алгоритмов глубокого обучения можно выделить два класса. Первый класс статей посвящен извлечению признаков и использованию множества сложных алгоритмов для извлечения сложных признаков из необработанных данных. Другой класс фокусируется на улучшении качества прогнозирования, когда алгоритм настраивается для повышения точности прогнозирования.

Для извлечения признаков исследователи использовали различные алгоритмы, такие как Отображение технических индикаторов из

непрерывного пространства в дискретное пространство значительно повышает точность прогнозов.

При уменьшении размерности на основе автоэнкодера поместим его в нейронную сеть LSTM включая веб-сканирование для извлечения данных и их обработки на ходу, что является стандартной практикой современного сложного программного обеспечения для алгоритмической торговли.

В результате сравнения трех архитектуры с ARIMA, моделью прогнозирования линейных временных рядов, было обнаружено, что точность CNN превосходит точность других моделей. Их входные данные учитывали более короткий период в 90 минут скользящего перекрытия, и тогда модель предсказывала 10 минут в будущем. Подход со скользящим окном, похоже, соответствует тому, что делает LSTM, поскольку он также обрабатывает последние n временных шагов для прогнозирования будущего. Глубокие сети достигают более высокой точности. Неглубокие сети не могут хорошо обрабатывать данные, что может привести к неточным прогнозам. Благодаря улучшенным алгоритмам градиентного спуска можно быстро обучать глубокие нейронные сети на больших наборах данных. Таким образом, в дополнение к индикаторам тренда, которые использовали авторы, для принятия решений необходимо использовать индикаторы импульса, силы и волатильности, чтобы обеспечить точность и безопасность от внезапной волатильности в направлениях, противоположных нашей торговле.

Сверточные нейронные сети используют для захвата топологии путем извлечения признаков путем применения фильтров к пакетам точек данных. Это можно использовать для захвата последовательных, а также пространственных данных, и поэтому оно широко используется при обработке изображений, распознавании речи, анализе временных рядов и т. д. Сверточная нейронная сеть имеет входной слой, за которым следуют сверточный слой, объединяющие слои и выходные слои. Сверточный слой — это место, где выполняется операция свертки. Операция свертки — это когда фильтры применяются к точкам данных в окрестности, и эффект от этого передается на следующий слой. Фильтр представляет собой просто матрицу, которая умножается на входную матрицу и в основном имеет 2 характеристики, т. е. вес и форму. Веса изучаются моделью во время ее обучения, а форма является покрытием этого фильтра. Пример операции свертки показан на рис.1.

Слой пулинга в основном используется сразу после сверточного слоя для уменьшения пространственного размера (только по ширине и высоте, а не по глубине). Это уменьшает количество параметров, поэтому вычисление уменьшается. Использование меньшего количества параметров позволяет избежать переобучения. Переобучение - это условие, когда обученная модель отлично работает с данными обучения, но не очень хорошо работает в тестовых данных.

Рис. 1. Сверточная работа на входе I с (3 x 3) фильтром K

Наиболее распространенной формой пулинга является максимальный пулинг. Слой пула используется для подвыборки данных. Объединение помогает уменьшить размеры и, следовательно, снижает затраты на вычисления. Пул собирает данные после того, как сверточный слой выводит их, и выводит данные в соответствии с выбранным типом объединения.

Объединение также решает проблему переобучения. Количество параметров, которые должны быть обучены моделью, огромно (512 фильтров) и, следовательно, очень вероятно, что они будут переопределены. Объединение выводит только определенные данные и игнорирует другие, поскольку все значения внутри окна объединения сводятся к одному значению, что делает модель менее склонной к переоснащению. Пример операции объединения показан на рис.2.

вход

Рис.2. Операция объединения

Функции, извлеченные из CNN, присваиваются плотным слоям или полностью связанным слоям. Отношение входа к выходу персептрона в многослойном персептроне (MLP) характеризуется уравнением

= f (£ h O

В качестве идут дневные цены закрытия индекса фондового рынка и в дополнение входные переменные из 32 технических индикаторов. Проблема моделирования на основе этих данных заключается в прерывности, которая присутствует, поскольку рынки Шанхая закрыты на китайские праздники, но рынки Индии продолжали торговать. Единственным способом устранить эти разрывы было в объединении данных по датам. В общей сложности из 2286 записей данных было пропущено только 134 значения. Нейронные сети в отличие от других моделей машинного обучения основаны на правилах, в независимости от масштаба измерений, поэтому данные подаются в необработанном виде, а не нормализованы.

Как мы упоминали выше, входные данные передаются на сверточный слой, где фильтры 1 Ч 48 используются для захвата ежедневных ценовых моделей, где N представляет количество функций. Слой сверточной нейронной сети извлекает тенденции и информацию, которые фиксируют и дополняют большую часть дисперсии зависимой переменной. Операция свертки, представленная в модели, может быть визуализирована на рис.3.

Выходные данные не объединяются, чтобы сохранить сложные детали, а также сохранить временной размер входных данных. В основном это связано с тем, что LSTM, особый вид RNN, лучше работает с моделями анализа временных рядов по сравнению с другими моделями. Далее данные проходят через несколько уровней LSTM. Это позволяет модели понять основную тенденцию рынка не только на основе переменных, используемых для моделирования для одного экземпляра, но и в течение последовательных дней, а также включить информацию о продолжительности. На рисунке 4 представлен цикл архитектуры LSTM в качестве базового элемента модели.

(1)

В уравнении (1), 1 обозначает выход j-го персептрона в нейронной сети, где функция f является функцией активации. Функция активации получает входные данные от предыдущего слоя, которые представляют собой сумму входных данных (j-1)-ra слоя i, умноженных на соответствующий вес W.

Выбывание относится к методу, который в основном используется для решения проблемы переобучения в нейронной сети, делая часть нейронов неактивными, что заставляет модель полагаться только на часть нейронов для эффективного обучения и характеризуется долей неактивных нейронов в плотном слое.

LSTM — это тип рекуррентной нейронной сети со встроенной петлей обратной связи, в отличие от других сетей с прямой связью. LSTM может запоминать предыдущее состояние и учитывать его при прогнозировании. Это помогает в генерации текста, где контекст выводится из предыдущих слов и структуры предложения, а также в последовательных данных, таких как прогнозирование временных рядов.

Гибридная CNN, наложенная поверх LSTM и плотных слоев для прогнозирования будущих цен индекса фондового рынка на NSE при обработке изображений, где широко используются фильтры 3x3 и 5x5, где необходимо зафиксировать пространственную дисперсию в прямоугольном массиве пикселей. Каждая входная функция представлена серией переменных, таких как цена закрытия, значения технических индикаторов, товары и т. д. Входные данные подаются в сеть CNN, которая извлекает функции на дневных уровнях цен и выводит тензор, который затем передается в сеть. LSTM-сеть.

Рис.4. LSTM-визуализация

Выходные данные слоя LSTM позже передаются через слой распределенного времени. TDL используется для поддержания гибкости многомерного моделирования. Поскольку это также добавит дополнительное измерение во входные данные, 3D CNN будет использоваться вместо используемой в настоящее время 2D CNN в качестве начального слоя для нашей модели. Этот слой будет выполнять аналогичную задачу извлечения признаков на основе входных признаков, используемых в дополнительном измерении.

При оптимизации набора данных и параметров надо учитывать, что 70% набора данных используется в качестве обучающего набора, а остальные 30% зарезервированы в качестве тестового набора и полностью не подвергаются воздействию модели. Кроме того, в тестовом наборе мы также зарезервировали 30% набора обучающих данных в качестве проверочного разделения во время обучения модели, что помогло бы модели корректировать веса более обобщенным образом и не перегружать период обучения. Модель обучается с минимизацией «средней абсолютной ошибки» в качестве основного показателя. Модель обучалась итеративно, из-

Ввод (20x48)

Рис.3. Операция свертки над необработанными входными объектами

вход: 20 дней с 48

переменными

LSTM (512)

LSTM (128)

TOL (256)

dropout (0,2)

TDL (512)

LSTM (64)

dropout (0,2)

dense (1)

Рис.5. Архитектура модели

меняя различные параметры в модели. Скорость обучения, функции активации, количество слоев CNN, количество фильтров, количество слоев LSTM, количество нейронов в каждом слое были протестированы для оптимизации архитектуры модели (рис.5). Значения, выделенные жирным шрифтом, представляют собой использованные значения, которые оказались оптимальными для данной модели. Следует отметить, что изменение количества слоев CNN в модели немного увеличило точность, но не настолько значительно, чтобы оправдать дополнительные вычислительные затраты. Аналогично обстояло дело и с количеством фильтров. Настройки оптимизации параметров можно увидеть в таблице 2.

Таблица 2. Значения для настройки оптимизации параметров

Параметры Значение

Learning rate 0.0001, 0.0005, 0.001, 0.005, 0.1

Activation function ReLu, Tanh

LSTM layers 1,2,3,4

CNN layers 1,2,3

Number of neurons in the first layer of LSTM and TDL 128,256,512

Number of filters 1,2,4,8.. .32

Показатели ошибок обучения и тестирования представлены в таблицах 3 и 4 соответственно.

Таблица 3. Показатели ошибок обучения

Метрика Ценность

Поезд R-Square 0,989

Обучить среднюю абсолютную ошибку 168,558

Обучить среднюю абсолютную процентную ошибку 0,0234

Обучить среднеквадратичную ошибку 199.076

Таблица 4. Показатели ошибок тестирования

Метрика Ценность

Тест R-квадрат 0,943

Тестовая средняя абсолютная ошибка 242.418

Тестовая средняя абсолютная ошибка в процентах 0,0310

Среднеквадратическая ошибка теста 413.902

направлении, противоположном нашей сделке. Стоп-лосс — это поручение для брокера автоматически продать акции, когда котировки упадут до определенного уровня. Своего рода ограничитель убытков.

Модель предлагает цену закрытия следующего дня, и сделки совершаются соответственно. Если цена закрытия предыдущего дня ниже прогнозируемого значения, открывается длинная сделка и наоборот. Стоп-лосс поддерживается на уровне -0,38% от капитала, поскольку он находится чуть выше среднего значения движения цены в направлении, противоположном нашей сделке, прежде чем двигаться в прогнозируемом направлении. Это означает, что, если в любой момент времени сделка приносит убыток, превышающий 0,38%, убыток фиксируется за день. Когда модель предсказывает, что цена закрытия следующего дня будет выше, модель инвестирует в этот индекс и не продает до тех пор, пока не прогнозируется, что цена закрытия следующего дня будет ниже. После продажи модель также создает новую короткую позицию и следует за ней до тех пор, пока прогнозируемая цена закрытия не станет выше (см. Рис.6).

Хотя ни одна из осаждавшихся до сих пор моделей не ввела стоп-лосс в свою торговую систему, необходимость защиты капитала очевидна. Глядя на результаты тестирования модели, видно, что модель ложно предсказывает значительное движение вверх между 550 и 600 днями. Этот шаг был в основном связан с фискальным стимулом со стороны правительства, но модель не могла своевременно учесть информацию.

В статье представлен новый способ определения движения фондовых рынков. Модель оптимизирована с помощью различных настроек параметров, как указано в таблице 2. Модель предназначена для прогнозирования цены закрытия индекса по нефти. Алгоритмы, которые используют архитектуру CNN для прогнозирования направления рынков, имеют категориальные целевые переменные, в то время как модель в этой статье имеет непрерывную целевую переменную. Чтобы решить проблему переменных предсказания, предсказания нашей модели также превращаются в категориальные переменные с помощью методологии

Целевая Функция =

.С,

(2)

Данные модели оцениваются по доходам, генерируемым моделью. Стоп-лоссы также учитываются в философии торговли, что является довольно распространенной практикой среди трейдеров. Стоп-лосс устанавливается как среднее движение в процентах в

где -цена закрытия в t -й день Технические индикаторы лишь указывают на возможность возможного разворота. Рынки не реагируют на технические индикаторы, а наоборот. Цены движутся исключительно за счет спроса и предложения, которые создаются за счет поведенческих черт и реакции на определенную цену акций. Поскольку цена колеблется, технические индикаторы колеблются вместе с ними.

Модель LSTM просматривает данные и понимает закономерность, прежде чем прогнозировать результат. Поскольку CNN рассматривает числа как статическое изображение, результаты будут

Nifty tnMnfraufti Hrtly telling rrwlu — MltM rrt» vtf u*

ж • vv^ ioj *» m ад ш m m m я un lui un mi wi iwi trjdinffen 14СКП «no 0 101 toi № 4SI Ut «01

Рис 6. Производительность модели на тренировочном наборе

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ переменная тип источник

1 Open Цена NSE

2 High Цена NSE

3 Low Цена NSE

4 Close Цена NSE

5 скореектированное закрытие Цена NSE

6 Volume объем NSE

7 Trend технический индикатор TA-Lib

8 Wilder's RSI технический индикатор TA-Lib

9 RSI технический индикатор TA-Lib

10 RSI fast K технический индикатор TA-Lib

11 RSI fast D технический индикатор TA-Lib

12 Exponential RSI технический индикатор TA-Lib

13 MACD технический индикатор TA-Lib

14 MACD sign технический индикатор TA-Lib

15 MACD гистограмма технический индикатор TA-Lib

16 20 days MA Скользящее среднее TA-Lib

17 50 days MA Скользящее среднее TA-Lib

18 65 days MA Скользящее среднее TA-Lib

19 200 days MA Скользящее среднее TA-Lib

20 BB нижний уровень технический индикатор TA-Lib

21 BB middle band технический индикатор TA-Lib

22 BB верхний уровень технический индикатор TA-Lib

23 PPO технический индикатор TA-Lib

24 PPO sign технический индикатор TA-Lib

25 PPO hist технический индикатор TA-Lib

26 MOM технический индикатор TA-Lib

27 ROC технический индикатор TA-Lib

28 20 days EMA Экспоненциальная скользящая средняя TA-Lib

29 50 days EMA Экспоненциальная скользящая средняя TA-Lib

30 65 days EMA Экспоненциальная скользящая средняя TA-Lib

31 200 days EMA Экспоненциальная скользящая средняя TA-Lib

32 DPO технический индикатор TA-Lib

33 Доходность облигации за 3 месяца динамика цены Investing.com

34 1-year bond yield динамика цены Investing.com

35 5 years bond yield динамика цены Investing.com

36 Доходность 10-летней облигации динамика цены Investing.com

37 NASDAQ close Цена Yahoo Finance

38 SSE close Цена Yahoo Finance

39 Bovespa close Цена Yahoo Finance

40 Gold Commodity Yahoo Finance

41 INR to CAD товар Yahoo Finance

42 INR to CNY курс Yahoo Finance

43 INR to SGD курс Yahoo Finance

44 INR to HKD курс Yahoo Finance

45 INR to AUD курс Yahoo Finance

46 INR to JPY курс Yahoo Finance

47 INR to USD курс Yahoo Finance

48 INR to EUR курс Yahoo Finance

одинаковыми, если числа идентичны даже при бычьем и медвежьем тренде. Модель LSTM поверх модели CNN устраняет эту проблему и, следовательно, делает модель более интеллектуальной.

Все рассмотренные выше подходы работают только тогда, когда рынок лишен какого-либо внешнего шума. Шумом может быть внезапный всплеск денежных потоков и ликвидности или любые другие новости. Поскольку рынки не всегда рациональны и эффективны, не может быть точного времени, когда акции должны начать движение. Поведение потребителей, непредсказуемые события, такие как пандемия, могут влиять на рынок без какой-либо логики, как на потребителей, которые покупают и продают акции. Следовательно, становится важным, чтобы наша модель не всегда полагалась на необработанные цены и запаздывающие функции, а также учитывала события и корректировала их соответствующим образом. Ограничение модели, налагаемое этой случайностью, требует, чтобы мы не предсказывали цены каждую секунду, а скорее предсказывали на грубом дневном временном интервале.

Еще одна проблема, с которой может столкнуться модель, заключается в том, что модель предполагает фиксированную сумму денег, присутствующую на рынке, но рынки подвергаются постоянным вливаниям и стимулам со стороны иностранных фондов без какой-либо конкретной причины для покупки. В таких случаях теория эффективного рынка может потерпеть неудачу, и модель должна учитывать денежные потоки в каждой моменте. В то время как крупные денежные вливания все еще можно учесть, денежные потоки от активных участников розничных продавцов и индивидуальных инвесторов очень сложно смоделировать, поскольку они не собирают конкретных данных.

Еще одной проблемой, с которой сталкивается модель, является сбор данных, так как модель имеет много входных параметров, и большинство из них имеют разницу в часовых поясах или могут быть закрыты для торговли в определенные дни. Несмотря на то, что при обучении модели мы применили метод обратной засыпки, чтобы избавиться от пропущенных значений, это все равно приведет к ошибке в прогнозировании в реальной торговле. Будущая работа требует решения вышеупомянутых проблем, требует дальнейшего изучения реактивной модели поверх модели прогнозирования и альтернативных моделей сбора данных, основанных на сходстве входных признаков.

Создание модели прогнозного анализа на зашумленном и нелинейном наборе данных оказывается на фондовом рынке сложнейшей задачей. Модель хорошо показала себя на большом наборе данных с разумной точностью, что говорит о том, что модель может хорошо обобщать. Средняя абсолютная процентная ошибка при обучении оказалась равной 2.3% за 7 лет данных обучения, а средняя абсолютная процентная ошибка при тестировании составила 3,1% за 3 года данных тестирования. Подход CNN-LSTM показывает огромный прирост доходности по сравнению с традиционным методом «купи и держи», который дал 107% доходности за 10 лет, в то время как наш подход обеспечил 342% дополнительной доходности с включенными стоп-лоссами. Основная цель этой статьи состояла в том, чтобы предсказать движение рынка, чтобы максимизировать прибыль, используя методы глубокого обучения. Модель может быть дополнительно преобразована в сложную торговую установку, при которой компьютер активно торгует на основе прогнозов модели.

литература:

1. Дейтел, П. Python: Искусственный интеллект, большие данные и облачные вычисления / П. Дейтел, X. Дейтел. - СПб.: Питер, 2020. - 864 с.

2. Коэльо, Л.П. Построение систем машинного обучения на языке Python / Л.П. Коэльо, В. Ричарт. 2-е издание / Пер. с англ. Слинкин А.А. - М.: ДМК Пресс, 2018.-302 с

3. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. — 9-е изд., испр. — М.: Издательский дом «Дело» РАНХиГС, 2021. — 504 с.

4. Тимофеев, А. Г. Создание торговой программы-робота для алгоритмической торговли и биржевых операций / А. Г. Тимофеев, О. Г. Лебединская // Экономика и управление: проблемы, решения. -2018. - Т. 4. - № 4. - С. 97-104.

5. Тимофеев, А. Г. Рынок готовится к алгоритмической торговле / А. Г. Тимофеев, О. Г. Лебединская // Транспортное дело России. -2017. - № 5. - С. 57-59.

6. Теория, методология и практика оценки готовности экономики к национальной технологической инициативе / Н. А. Садовникова, М. О. Григорьева, И. Р. Ляпина [и др.]. - Москва : Общество с ограниченной ответственностью "Издательство "Юнити-Дана", 2018. - 424 с.

7. Spatio-temporal analysis of the development of the transport system: Russian and foreign experience / L. V. Oveshnikova, E. V. Sibirskaya, O. G. Lebedinskaya, G. D. Slepneva // IBIMA Business Review. - 2021. -Vol. 2020. - P. 515342.

8. Statistical evaluation of middle class in Russia / E. Sibirskaya, O. Khokhlova, N. Eldyaeva, O. Lebedinskaya // Mediterranean Journal of Social Sciences. - 2015. - Vol. 6. - No 36. - P. 125-134.

9. Социально-экономическая статистика / L. A. Mikheikina, E. V. Sibirskaya, L. V. Oveshnikova [и др.]. - Москва: Общество с ограниченной ответственностью "Издательство "Юнити-Дана", 2018. - 159 с.

10. Черткова, Е.А. Статистика. Автоматизация обработки информации: учебное пособие для вузов / Е.А. Черткова. - 2-е изд., испр. и доп. - Москва: Издательство Юрайт, 2021. - 195 с. - (Высшее образование).

11. Эконометрика: учебник и практикум для прикладного бакалавриата, Демидова, О. А., 2017.

12. Попов, А. А. Программное приложение для определения условий человеко-компьютерного взаимодействия с использованием законов Фитса и Хика / А. А. Попов, А. О. Кузьмина // Международная научная конференция по проблемам управления в технических системах. - 2019. - Т. 1. - С. 203-207.

13. Попов, А. А. Программное приложение для определения комфортных условий распознавания символов на пользовательском интерфейсе информационной системы / А. А. Попов, А. О. Кузьмина // Международная конференция по мягким вычислениям и измерениям. - 2018. - Т. 2. - С. 3-6.

14. Тимофеев, А. Г. Задача настройки на обнаружение оптимального использования фракталов при stop-контрактах и уровнях сопротивления / А. Г. Тимофеев // Транспортное дело России. - 2019. - № 2. - С. 35-38.

15. Тимофеев, А. Г. Использование модифицированной дюрации Маколея как эластичность цены актива по процентной ставке / А. Г. Тимофеев // Индустриальная экономика. - 2021. - Т. 1. - № 4. - С. 77-82.

i Надоели баннеры? Вы всегда можете отключить рекламу.