Научная статья на тему 'МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ФОНДОВЫХ РЫНКОВ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ'

МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ФОНДОВЫХ РЫНКОВ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
174
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОНДОВЫЙ РЫНОК / ПРОГНОЗ / ДНЕВНОЙ СРЕЗ / АКЦИИ / НЕЙРОННАЯ СЕТЬ / МАШИННОЕ ОБУЧЕНИЕ / ФУНКЦИЯ АКТИВАЦИИ / РАДИАЛЬНО-БАЗИСНАЯ ФУНКЦИЯ / КРОСС-ВАЛИДАЦИЯ / ВРЕМЕННЫЕ РЯДЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Меркулов В.В., Сивко Д.Ю., Дмитриев А.С.

Статья посвящена рассмотрению актуальных вопросов, связанных с изучением возможности прогнозирования динамики фондовых рынков на основе нейросетевых моделей машинного обучения. Выделены перспективы применения нейросетевого подхода для построения инвестиционных прогнозов. Для решения задачи предсказания динамики изменения стоимости ценных бумаг рассмотрены проблемы обучения модели на данных, представленных в форме временных рядов, а также подход к преобразованию обучающих данных. Описан метод рекурсивного исключения признаков, использующийся для выявления наиболее значимых параметров, влияющих на изменения цен на фондовом рынке. Было проведено экспериментальное сравнение ряда нейронных сетей с целью выявления наиболее эффективного подхода к решению задачи прогнозирования динамики рынка. В качестве отдельного примера была рассмотрена реализация регрессии на основе радиально-базисной нейронной сети и представлена оценка качества модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STOCK MARKET FORECASTING MODEL BASED ON NEURAL NETWORKS

The article is devoted to the consideration of topical issues related to the study of the possibility of forecasting the dynamics of stock markets based on neural network models of machine learning. The prospects of applying the neural network approach to building investment forecasts are highlighted. To solve the problem of predicting the dynamics of changes in the value of securities, the problems of training a model on data presented in the form of time series are considered and an approach to the transformation of training data is considered. The method of recursive exclusion of features is described, which is used to identify the most significant parameters that affect price changes in the stock market. An experimental comparison of a number of neural networks was carried out in order to identify the most effective approach to solving the problem of forecasting market dynamics. As a separate example, the implementation of regression based on a radial-basis neural network was considered and an assessment of the quality of the model was presented.

Текст научной работы на тему «МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ФОНДОВЫХ РЫНКОВ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ»

Модель прогнозирования фондовых рынков на основе нейронных сетей

В.В. Меркулов, Д.Ю. Сивко, А.С. Дмитриев ФГБОУ ВО «Волгоградский государственный технический университет»

Аннотация: Статья посвящена рассмотрению актуальных вопросов, связанных с изучением возможности прогнозирования динамики фондовых рынков на основе нейросетевых моделей машинного обучения. Выделены перспективы применения нейросетевого подхода для построения инвестиционных прогнозов. Для решения задачи предсказания динамики изменения стоимости ценных бумаг рассмотрены проблемы обучения модели на данных, представленных в форме временных рядов, а также подход к преобразованию обучающих данных. Описан метод рекурсивного исключения признаков, использующийся для выявления наиболее значимых параметров, влияющих на изменения цен на фондовом рынке. Было проведено экспериментальное сравнение ряда нейронных сетей с целью выявления наиболее эффективного подхода к решению задачи прогнозирования динамики рынка. В качестве отдельного примера была рассмотрена реализация регрессии на основе радиально-базисной нейронной сети и представлена оценка качества модели.

Ключевые слова: фондовый рынок, прогноз, дневной срез, акции, нейронная сеть, машинное обучение, функция активации, радиально-базисная функция, кросс-валидация, временные ряды, рекурсивное исключение.

Фондовый рынок является одной из основных сфер деятельности инвесторов, поэтому прогнозирование ценовых тенденций внутри него всегда является актуальной темой для исследователей как в финансовой, так и в технической областях [1]. Прогнозирование финансовых временных рядов является непростой задачей по причине неявной зависимости данных и высокого уровня шума. Фондовые рынки, в основном, представляют собой непараметрическую, нелинейную и детерминированную хаотическую систему [2].

По мере развития технологий биржевые трейдеры переходят к использованию интеллектуальных торговых систем вместо фундаментального анализа для прогнозирования цен на акции, что помогает им принимать незамедлительные инвестиционные решения. Одной из основных целей трейдера является прогнозирование цены акций таким образом, чтобы он мог продать их до того, как их стоимость упадет, или

купить акции до того, как цена вырастет. Гипотеза эффективного рынка Вейнберга Р.Р. утверждает о невозможности предсказать цену акций в связи с тем, что акции ведут себя как случайные колебания [3].

Исходя из этого, прогнозирование цен на акции представляет интерес не только для экономики, но и для многих смежных областей, включая математику и информатику. Вопрос о том, возможно ли предсказать цены на акции, нашел свое новое решение благодаря появлению искусственного интеллекта, который открывает широкие возможности для различных методов машинного обучения, позволяющих достигнуть значительного уровня статистической достоверности. В эпоху больших данных нейросетевое моделирование и глубокое обучение для прогнозирования цен и тенденций фондового рынка стало еще более популярным, чем раньше.

Среди эффективных технологий и подходов к прогнозированию особое внимание в последние годы уделяется искусственным нейронным сетям, которые используются во многих областях автоматизации многокритериальных задач. Искусственная нейронная сеть - это компьютерная модель, состоящая из множества связанных между собой элементов, называемых искусственными нейронами. Каждый искусственный нейрон преобразует входные сигналы, проходящие через функцию активации, а затем передает их дальше по сети. Модель искусственной нейронной сети может быть представлена математически с помощью системы уравнений, описывающих взвешенные суммы входных сигналов, функции активации и обновление весовых коэффициентов в процессе обучения. Функции активации, соединенные друг с другом, вычисляют при обучении адаптивные веса на исторических данных и используются для дальнейшего предсказания искомых значений [4].

Таким образом, изучение возможностей инструментария нейронных сетей для анализа и прогнозирования динамики фондового рынка

представляет собой перспективную научно-практическую задачу, которая и обуславливает выбор темы данной статьи.

В научной литературе присутствуют труды как отечественных, так и зарубежных авторов, посвященные исследованию и разработке нейронных сетей для составления сценарных моделей поведения фондового рынка. Над решением задачи прогнозирования курсов акций предприятия в условиях игры на фондовой бирже посредством искусственной нейронной сети прямого распространения трудятся такие исследователи, как Тимофеев А.Г., Лебединская О.Г., Левицкая Т.А., Романов К.Г., Lin Yu, Lin Zixiao, Liao Ying.

Отдавая должное научным наработкам по этой проблематике, следует отметить, что ряд вопросов все еще требует отдельного внимания и более углубленного изучения. В частности, в уточнении нуждаются подходы к комплексной настройке модели нейронных сетей для прогнозирования ценовых тенденций на фондовых рынках, а также модели цен акций с высокой волатильностью.

Таким образом, с учетом вышеизложенного, цель статьи заключается в рассмотрении особенностей построения модели прогнозирования фондовых рынков на основе нейронных сетей.

Процедура построения нейронной сети для прогнозирования динамики фондовых рынков состоит из следующих этапов: сбор данных; распределение данных на обучающую и тестовую выборки; определение структуры сети; выбор алгоритма и параметров обучения; обучение и тестирование сети [5]. Перечисленные этапы будут рассмотрены более подробно ниже.

Исходный набор данных представляет из себя список срезов исторических данных за день о ценной бумаге за период с 1 января 2000 года по 1 марта 2023 года. Каждая запись представлена следующими значениями: дата исторического среза, цена акции на момент открытия торгов, наивысшая

стоимость ценной бумаги за день, наименьшая стоимость акции за день, цена акции на момент закрытия торгов и объем торгов за день.

Чтобы обеспечить наилучшую производительность модели прогнозирования, необходимо четко определить перечень используемых данных [6]. Очевидно, что в информации, которая отражает особенности работы фондового рынка, присутствует большое количество признаков. Если учитывать их все, то это не только значительно увеличивает вычислительную сложность, но и вызывает побочные эффекты. Поэтому представляется целесообразным использовать рекурсивное исключение признаков (ЯРЕ) для обеспечения эффективности всех отобранных данных.

Рекурсивное исключение признаков - это метод отбора признаков, основанный на последовательном удалении наименее важных признаков из набора данных. На каждой итерации модель обучается на подмножестве признаков и оценивается качество предсказания. После обучения модели на каждой итерации наименее важные признаки удаляются. Процесс повторяется до достижения заданного числа признаков или же до достижения определенного качества предсказания.

В процессе рекурсивного исключения признаки будут оцениваться по двум атрибутам: коэффициенту и важности признака. Также представляется необходимым ограничить число признаков, удаляемых из пула, одним, что означает, что только один признак будет удаляться на каждом шаге, при этом будут сохраняться все релевантные признаки.

Первым шагом перед использованием РСА является предварительная обработка признаков. Причина добавления этапа предварительной обработки данных заключается в том, что входная матрица, сформированная главными компонентами, не имеет временных шагов [7]. Также предподготовка необходима по причине того, что некоторые признаки после ЯРЕ представляют собой процентные данные, а другие - очень большие числа,

т.е. выходные значения ЯРЕ представлены в разных единицах измерения. Это способно оказать влияние на результат извлечения главных компонент.

В результате применения вышеописанного метода подготовки данных будет получено минимально необходимое число признаков, соответствующих временным шагам для набора исторических данных.

Для распределения данных на обучающую и тестовую выборки целесообразно использовать кросс-валидацию, которая разделяет исходный набор данных на несколько (обычно к) случайных подмножеств. Затем модель обучается на к-1 подмножестве и тестируется на оставшемся подмножестве. Данный процесс повторяется к раз, каждый раз с использованием другого подмножества для тестирования, и результаты обобщаются для получения единой оценки производительности модели, что позволяет получить более надежную оценку производительности модели и снизить вероятность ее переобучения.

Для выбора оптимальной модели прогнозирования изменений на фондовом рынке автором был проведен анализ точности предсказания на основе различных архитектур искусственной нейронной сети, а именно:

- многослойный перцептрон с тремя скрытыми слоями нейронов;

- радиально-базисная нейронная сеть с двумя скрытыми слоями: первый из нейронов с радиально-базисной активирующей функцией, второй - из нейронов с линейной функцией;

- обобщенно-регрессионная нейронная сеть с двумя скрытыми слоями: первый из нейронов с обобщенно-регрессионной активирующей функцией, второй - из нейронов с линейной функцией;

- сеть Элмана с двумя скрытыми рекуррентными слоями нейронов и одним слоем с сигмоидальным нейроном;

- рекуррентная сеть с двумя скрытыми рекуррентными слоями нейронов.

Разработка модели обучения нейронной сети проводилась с использованием фреймворка для машинного обучения TensorFlow. В качестве входных данных для исследования эффективности прогнозирования были выбраны данные торгов с фондовых рынков США по акциям ведущих компаний: ACI - Albertsons Companies, Inc. (USA, Boise), AMCCF - Amcor plc (Switzerland, Zurich), DV - DoubleVerify Holdings, Inc. (USA, New York), QQQ - Invesco QQQ Trust (USA, Chicago).

Результаты испытаний моделей представлены в таблице 1, где для каждого вида нейронной сети указан вариант входных данных, обеспечивающий минимальную усредненную ошибку прогнозирования. Как видно, наивысшую точность предсказания показала радиально-базисная нейронная сеть, имеющая три входа, на которые подаются нормализованные значения цен закрытия за три предшествующих дня относительно t, : ,

tj_2 , tj_з , где i - порядковый номер дневного среза и t - цена закрытия

торгов на г-ый день. Такое число было выбрано в связи с эффектом ложных

связей при малой длине временного ряда в 1 - 2 периода [8].

Таблица № 1

Усредненные ошибки прогнозирования исследуемых нейронных сетей

Нейронная сеть Среднеквадратичная ошибка прогнозирования

Многослойный перцептрон 4,659321-10-2

Радиально-базисная нейронная сеть 0,106527-10-2

Обобщенно-регрессионной сеть 2,306722-10-2

Сеть Элмана 1,239847-10-2

Рекуррентная сеть 4,658576-10-2

На рис. 1 представлен пример структуры радиально-базисной нейронной сети с количеством входов, равным п, из которого наглядно видно, что в сети есть входной слой, только один скрытый (радиально-

базисный) слой и выходной линейный слой.

Рис. 1 - Обобщенная архитектура искусственной нейронной сети с

радиально-базисными функциями [9] Первый уровень состоит из радиально-базисных нейронов и вычисляет свои взвешенные входы с помощью функции евклидового расстояния Л'^, а также удельные входы. Второй уровень состоит из простых линейных нейронов (у = /(х) = х) и вычисляет свой взвешенный вход с помощью соответствующей функции, а также удельные входы. Функция й\81 производит вычисление по формуле [10]:

где - элемент матрицы весов Ж;

Ж - матрица весов, имеющая размерность (Б х Я);

V. - значение у-го входа, у = 1,Я.

Набор данных был разделен на тренировочную и обучающую выборки в соотношении 1 к 5 с равномерно распределенными выходными значениями. Для обучения модели было подобрано необходимое количество эпох, равное 35, и размер батча, равный 150. На рис. 2 представлен график

М Инженерный вестник Дона, №6 (2023) ivdon.ru/ru/magazine/arcliive/n6y2023/8465

ошибки обучения модели.

Modei Loss

12000 10000 8000 Н \

1Л 1 \

trt \ \ £} 6000 - \

4000 - \

2000 - XS.

0 - -

-1-1-1-1-1-1-1-Г-1

0 5 10 15 20 25 30 35

Epoch

Рис. 2 - График ошибки обучения модели.

Тестирование модели производилось по данным о торгах акциями четырех компаний на американской фондовой бирже: ACI, AMCCF, DV, QQQ. Ошибка прогнозирования вычислялась на основе нормализованных реальных и предполагаемых значений по формуле среднеквадратичной ошибки:

где Yt - реальное, 7г - прогнозируемое значение цены акции.

Средняя ошибка прогнозирования для представленного ряда компаний была следующей: ACI - 4,7525-10-2, AMCCF - 2,23344-10-2, DV - 1,8133-10-2, QQQ - 3,1572-10-2.

Таким образом, полученные результаты подтверждают, что искусственные нейронные сети позволяют прогнозировать изменения цен на

инструменты фондовых бирж. Их преимущество заключается в том, что это регулируемые модели, поэтому, в случае появления новых данных, прогнозы обновляются с минимальной задержкой в то время, как эконометрическая модель с постоянными параметрами будет экстраполировать существенно устаревшие зависимости. Адаптация к новым данным, а также способность к самообучению выгодно выделяет нейронные сети среди других инструментов прогнозирования.

Структура нейронной сети, основные ее характеристики, методы обучения и тестирования были выбраны в результате многочисленных экспериментов. Точность прогноза, безусловно, может быть повышена, но только с увеличением количества входных данных, а также усложнением исходной модели. Сравнение прогнозируемых значений и реальных данных подтвердило эффективность построенной модели и целесообразность применения выбранного нейросетевого инструментария для принятия решений участниками фондового рынка.

Литература

1. Алымова Е.В. Совместное применение модели линейной регрессии и нейронной сети в задаче предсказания тренда котировок криптовалюты Bitcoin // Инженерный вестник Дона. 2020. №10. URL: ivdon.ru/ru/magazine/archive/n10y2020/6637/.

2. Maniatopoulos A., Gazis A. Technical analysis forecasting and evaluation of stock markets: the probabilistic recovery neural network approach. International journal of economics and business research, 2023. 1: P. 64-100.

3. Вейнберг Р.Р. Особенности применения новостных сигналов и интуитивного анализа в процессе использования нейронных сетей на фондовом рынке // Плехановский научный бюллетень. 2020. №1. С. 4-11.

4. Клименко Д.Н. Прогнозирование доходности ценных бумаг на

основе применения инструментария нейронных сетей // Современные аспекты экономики. 2021. №3. С. 72-79.

5. Chudziak, A., Predictability of stock returns using neural networks: Elusive in the long term. Expert systems with applications, 2023. 213(C): P. 119203.

6. Курейчик В.М., Картиев С.Б. Выбор алгоритма прогнозирования для разработки аналитического программного обеспечения // Инженерный вестник Дона. 2017. №4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4605/.

7. Тимофеев А.Г., Лебединская О.Г. Применение модели с долговременной памятью (LSTM) в прогнозировании цены в условиях неопределенности // Экономика и предпринимательство. 2022. №4(141). С. 1157-1162.

8. Крылов С.Н., Смирнов Д.А., Безручко Б.П. Роль шума наблюдений и длины временного ряда при оценке связи между осцилляторами по временным рядам // Методы компьютерной диагностики в биологии и медицине - 2017: Материалы Всероссийской школы-семинара, Саратов, 01 октября 2017 года / Под редакцией Д.А. Усанова. - Саратов: Издательство "Саратовский источник", 2017. - С. 110-113.

9. Chi Leung Hui P., Engelbrecht A. Artificial Neural Networks - Recent Advances, New Perspectives and Applications. London: IntechOpen, 2023. 154 p.

10. Городецкая О.Ю. Прогнозирование финансовых рынков с использованием сверточной нейронной сети // Проблемы экономики и юридической практики. 2021. Т. 17. № 3. С. 65-72.

References

1. Alymova E.V. Inzhenernyj vestnik Dona. 2020. №10. URL: ivdon.ru/ru/magazine/archive/n10y2020/6637/.

2. Maniatopoulos A., Gazis A. International journal of economics and

business research, 2023. 1: pp. 64-100.

3. Veynberg R.R. Plekhanovskiy nauchnyy byulleten'. 2020. №1. pp. 4-11.

4. Klimenko D.N. Sovremennyye aspekty ekonomiki. 2021. №3. pp. 72-79.

5. Chudziak, A., Expert systems with applications, 2023. 213(C): p. 119203.

6. Kureychik V.M., Kartiyev S.B. Inzhenernyj vestnik Dona. 2017. №4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4605/.

7. Timofeyev A.G., Lebedinskaya O.G. Ekonomika i predprinimatel'stvo. 2022. №4 (141). pp. 1157-1162.

8. Krylov S.N., Smirnov D.A., Bezruchko B.P. Metody komp'yuternoy diagnostiki v biologii i meditsine - 2017: Materialy Vserossiyskoy shkoly-seminara, Saratov, 01 oktyabrya 2017 goda. Pod redaktsiyey D.A. Usanova. Saratov: Izdatel'stvo "Saratovskiy istochnik", 2017. pp. 110-113.

9. Chi Leung Hui P., Engelbrecht A. Artificial Neural Networks - Recent Advances, New Perspectives and Applications. London: IntechOpen, 2023. 154 p.

10. Gorodetskaya O.U. Problemy ekonomiki i yuridicheskoy praktiki. 2021. T. 17. № 3. pp. 65-72.

i Надоели баннеры? Вы всегда можете отключить рекламу.