СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ АВТОМАТИЗИРОВАННОГО ПРОГНОЗИРОВАНИЯ
ИЗМЕНЕНИЯ ЦЕН АКЦИЙ НА ФОНДОВОМ РЫНКЕ
1 2 Абаньшин П.А. , Барышникова М.Ю.
Email: Abanshin681@scientifictext.ru
1Абаньшин Павел Андреевич - бакалавр; 2Барышникова Марина Юрьевна - доцент, кафедра программной инженерии, Московский государственный технический университет им. Н.Э. Баумана,
г. Москва
Аннотация: рассмотрены особенности автоматизированных методов прогнозирования изменения цены акций. Ввиду потребности инвесторов в надежности прогностических оценок остро стоит вопрос о правильном выборе соответствующих методов. Учитывая многообразие подходов, существующих в этой области, были выявлены основные семейства алгоритмов. Проведен детальный анализ данных методов изучения волатильности ценных бумаг на существующих рынках в разные промежутки времени. На основе полученной информации дана сравнительная характеристика положительных и отрицательных аспектов, а также перспективы их применения. Выявлено, что исследуемые алгоритмы и подходы нарушают одну из основополагающих гипотез экономики, а именно: гипотезу эффективного рынка, что делает их уязвимыми для критики сообщества экономистов. Однако использование реализованных методов позволило найти еще одно применение такой технологии, как машинное обучение и искусственный интеллект. Таким образом, для дальнейшего развития индустрии автоматизированной торговли весьма актуально применение различных методик оценки и проведение критического анализа всех возможных факторов воздействия на рынок с выявлением наиболее эффективных алгоритмов и платформ. Ключевые слова: искусственный интеллект, фондовый рынок, прогнозирование цены, машинное обучение.
COMPARING ANALYSIS OF AUTOMATIC METHODS OF
PREDICTION OF PRICES OF STOCKS ON THE STOCK MARKET
12 Abanshin PA. , Baryshnikova M.Yu.
1Abanshin Pavel Andreevich - Bachelor;
2Baryshnikova Marina Yurievna - Associate Professor, SOFTWARE ENGINEERING DEPARTMENT, BAUMAN MOSCOW STATE TECHNICAL UNIVERSITY, MOSCOW
Abstract: the features of automated methods for predicting changes in stock prices are considered. Due to the needs of investors in the reliability of prognostic estimates, the question of the correct choice of appropriate methods is acute. Given the variety of approaches existing in this area, the main families of algorithms have been identified. A detailed analysis of these methods of studying the volatility of securities in existing markets at different intervals is carried out. Based on the information received, a comparative description of the positive and negative aspects is given, as well as the prospects for their application. It was revealed that the studied algorithms and approaches violate one of the fundamental hypotheses of the economy, namely the hypothesis of an effective market, which makes them vulnerable to criticism of the community of economists. However, the use of the implemented methods allowed us to find another application of such technology as machine
learning and artificial intelligence. Thus, for the further development of the automated trading industry, it is very important to use various valuation techniques and conduct a critical analysis of all possible factors affecting the market with the identification of the most effective algorithms and platform forms.
Keywords: artificial intelligence, stock market, price prediction, machine learning.
Введение
В современном мире фондовый рынок, предоставляет возможность инвестировать собственные средства в ценные бумаги компаний и государств для получения дальнейшей прибыли. При покупке или продаже активов требуется анализировать большой объем информации, который занимает много времени. Именно поэтому все больше инвесторов начинают пользоваться средствами автоматизации торговли на бирже. По некоторым данным на сегодняшний день оборот алгоритмической торговли на фондовой бирже достигает 60% [3]. Таким образом, возникает потребность в правильном использовании методов позволяющих прогнозировать изменение цены акции с наибольшей точностью.
В числе первых применений автоматизации прогнозирования был прогноз изменения Национального индекса ISE 100, при этом в [1] заявляется об уровне точности в 75,74%. Авторы [1] используют набор из 10 индикаторов технического анализа, среди которых наиболее важны следующие: 10-ти дневное среднее, взвешенное 10-ти дневное среднее, момент и.т.д. В [1] проведено тестирование двух моделей, где первая основана на машине опорных векторов, а вторая задействует искусственный интеллект. Результаты, полученные из двух моделей затем аппроксимируются при помощи метода Монте- Карло. При тестировании каждого из методов по отдельности без использования аппроксимации был сделан вывод, что при прогнозировании при помощи искусственного интеллекта точность составила 75,74%, в то время как машина опорных векторов дала показатель в 71,52% (данные получил Кара И., Бояцуоглу М.А. и Боякан О. К. в 2011 году). Столь высокий показатель точности связан с тем, что тестирование метода было проведено на Национальном индексе 100 ФБИ (ISE Natio a 100). Данный индекс более приспособлен к техническому анализу на основе индикаторов, в отличие от фондовой биржи NYSE, которая является одной из самых автоматизированных бирж на планете. Вероятно, что количество конкурирующих алгоритмов на бирже Истамбула существенно меньше, что позволяет прогнозировать с использованием алгоритмических подходов применяемых в техническом анализе.
Однако, есть еще один недостаток в методологии статьи [1], который гораздо более вероятен в значительном увеличении эффективности алгоритмов. Авторы статьи, описывают, что данные для исследования были подготовлены: "Направление ежедневного изменения индекса цен на акции классифицируется как «0» или «1». Если индекс ISE National 100 в момент t выше, чем в момент времени t - 1, направление t равно «1». Индекс в момент времени t меньше, чем в момент времени t - 1, направление t равно «0»" ( перевод c английского).
Сначала это казалось бы разумным, но функции также используют информацию от времени t. Например, расчет скользящей средней A определяется следующим уравнением:
±и 10 >
где: Ct - цена закрытия в момент времени t. В данной формуле скользящая средняя рассчитывается с использованием цены закрытия во время t и t - 1. Фактически все функции, используемые в статье [1], используют некоторую информацию от времени t и t - 1, а также от других, более ранних. Следует заметить, что зависимая переменная является разницей между ценами в моменты времени tit - 1, что фактически означает, что авторы используют информацию о завтрашнем дне для
прогнозирования завтрашней цены. В реальной ситуации ни один трейдер или алгоритм торговли не имеют такой уровень информации о завтрашнем дне, при формировании прогноза. Таким образом, если требуется построить модель прогнозирования фондового рынка, которая полезна в реальном мире, следует использовать только достоверную информацию. Данный факт игнорируется в работе, которая предоставляет модели функции, которые содержат большой объем информации о завтрашнем дне, что нельзя игнорировать при рассмотрении сообщения команды об успехе.
Тем не менее, можно утверждать, что работа может быть полезной. Не смотря на то, что впечатляющую точность предсказания в 75,74% было бы невозможно повторить в реальной модели мира из-за описанных выше проблем, возможно приведенную информацию можно интерпретировать не как точность прогноза, а как данные о том, насколько хорошо согласованы показатели технического анализа с истинным движением цены в определенный день.
Другой подход описан в работе "Прогнозирование фондового рынка с использованием алгоритмов машинного обучении". В статье рассматривается случай использования машинного обучения для прогнозирования больших американских фондовых индексов, включая индекс Dow Jo es I dustria Average. В работе заявлено, что уровень точности по результатам проведенного авторами тестирования достиг 77,6% для Dow Jones.
Команда исследователей [4] рассматривает набор из 16 финансовых продуктов и использует их изменения для прогнозирования движений на американских фондовых биржах. Среди основных финансовых продуктов можно выделить следующие: индекс FTSE, индекс DAX, цена на нефть, курс Евро/Доллар.
В статье [4] хорошо используются исследовательские методы на этапе подготовки данных. Авторы показывают, используя графики, насколько некоторые показатели могут иметь ценность из-за их корреляции с индексом NASDAQ. Затем команда продолжает выбор показателей на основе прогнозирующей мощности каждого из них. После того, как были выбраны 4 лучших показателя, идет сравнение модели SVM (Support vector machine) и модели MART (Multiple Additive Regression Trees) для дальнейшего прогнозирования ежедневного тренда NASDAQ. В результате проведенного сравнения была выбрана модель SVM, которая показала более точный прогноз, составляющий 74,4% (данные получены Шен и др. в 2012 году).
Несмотря на то, что результаты, представленные [4] в этой статье, очень схожи с результатами, которые были представлены ранее [1], с точки зрения используемой методологии они сильно различаются. Например, нет описания того, какая модель использовалась на этапе выбора показателей зависимости или как была использована полученная информация для расчета любого из результатов прогноза.
После успешного обучения и тестирования авторы разработали модель при имитации реального торгового процесса, и получают результат возврата в 8% каждые 50 дней торговли, что можно оценить как крайне положительный. Хотелось бы отметить, что результаты, полученные Шен и др. [4], не учитывают перекрывание торгового времени. Таким образом, например, индекс FTSE, который торгуется в Лондоне, и индекс Dow Jo es, который торгуются в Нью-Йорке, одновременно торгуются в течение трех-четырех часов ежедневно. Этого времени достаточно, чтобы фондовая биржа Нью-Йорка повлияла на Лондонскую фондовую биржу. Из этого следует, что неверно использовать цену закрытия в Лондоне, чтобы предсказать движения на Нью-Йоркской бирже.
Описанные выше [1], [4] методы автоматизации процессов покупки-продажи финансовых активов в том числе применяющие искусственный интеллект подразумевают несостоятельность гипотезы эффективности рынка. Вместе с тем до настоящего времени подобные утверждения не получили однозначного подтверждения.
Гипотеза эффективного рынка, которую независимо друг от друга сформулировали в 60-х годах XX века Юджин Фама и Пол Самуэльсон в и основе которой лежит утверждение, о том, что рыночные цены отражают всю доступную информацию. Данная гипотеза базируется на трех основных положениях: Во-первых, все участники рынка имеют равный доступ к историческим данным о рыночных ценах, публично доступной информации и частной информации. Таким образом, ни один из участников рынка не имеет преимущества перед другими в принятии инвестиционных решений. Во-вторых, рыночные цены изменяются случайным образом, поэтому прошлые тенденции или паттерны не позволяют судить об их движении в будущем. Другими словами, в условиях эффективного рынка применение инструментов технического и фундаментального анализа является абсолютно бесполезным.
Исходя из вышеприведенных рассуждений, автор предлагает использовать текстовый майнинг для анализа новостного потока и оценки оттенка новостей для дальнейшего прогноза поведения ценных бумаг на фондовом рынке. Среди преимуществ следует отметить, что данный метод не пытается ориентироваться на опровержение гипотез эффективного рынка, а предполагает, что на сам рынок находится под влиянием факторов, которые не учитываются традиционными методами экономики и финансов.
Список литературы /References
1. Kara Y., Boyaci oglu M.A. and Baykan O.K., 2011. Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul stock exchange, Science Direct. [Электронный ресурс]. Режим доступа: https://www.sciencedirect.com/science/article/pii/S0957417410011711/ (дата обращения: 10.02.2020).
2. Федонова Гильян Васильевна, Ботнарь Светлана Юрьевна. Особенности алгоритмической торговли на фондовом рынке, 2016, "Теория и практика сервиса: экономика, социальная сфера, технологии". C. 11-14. [Электронный ресурс]. Режим доступа: https://cyberleninka.ru/article/n/osobennosti-algoritmicheskoy-torgovli-na-fondovom-rynke/ (дата обращения: 10.02.2020).
3. Shunrong Shen, Haomiao Jiang and Tongda Zhang. Stock market forecasting using machine learning algorithms, Stanford, 2012. [Электронный ресурс]. Режим доступа: http://cs229. stanford. edu/proj 2012/ShenJiangZhang-
StockMarketForecastingusingMachineLearningAlgorithms.pdf/ (дата обращения: 10.02.2020).
4. Equity forecast: Predicting long term stock price movement using machine learning, Nikola Milosevic School of Computer Science, University of Manchester, 2016. [Электронный ресурс]. Режим доступа: https://arxiv.org/pdf/1603.00751.pdf/ (дата обращения: 10.02.2020).
5. Predicting the Direction of Stock Market Index Movement Using an Optimized Artificial Neural Network Model, Mingyue Qiu, Yu Song, Department of Systems Management, Fukuoka Institute of Technology, Fukuoka, Japan, 2016, Plosone. [Электронный ресурс]. Режим доступа: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0155133/ (дата обращения: 10.02.2020).
6. Ramalingam V.V., PandianA., Bhatt Dwivedi and Jigar P. Analysing News for Stock Market Prediction, Department of Computer Science and Engineering, S.R.M. Institute of Science and Technology, Chennai, India, 2018, Journal of Physics: Conference Series. [Электронный ресурс]. Режим доступа: https://iopscience.iop.org/article/10.1088/1742-6596/1000/1/012026/ (дата обращения: 10.02.2020).