Научная статья на тему 'Сравнение моделей с нейронной сетью и OLS-регрессией при построении стратегии управления риском от дохода по индексу'

Сравнение моделей с нейронной сетью и OLS-регрессией при построении стратегии управления риском от дохода по индексу Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
347
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
MBPN MODELS / VOLATILITY / MEAN SQUARE ESTIMATION / OLS-REGRESSION / TRADE RULES / MBPN-МОДЕЛИ / ВОЛАТИЛЬНОСТЬ / СРЕДНЯЯ КВАДРАТИЧНАЯ ОЦЕНКА / OLS-РЕГРЕССИЯ / ПРАВИЛА ТОРГОВЛИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Щенников Владимир Николаевич, Щенникова Елена Владимировна, Санников Сергей Андреевич

Введение. Модели с нейронной сетью и OLS-регрессией используются на рынке акций и включают в себя переменные, описывающие состояние данного рынка. Одним из возможных способов определения таких зависимостей является их кластеризация с помощью анализа главных компонент. Цель исследования -раскрыть суть двух перспективных эвристических подходов к оценке динамики функциональных связей между доходами на рынке акций и переменных, описывающих состояние рынка. Материалы и методы. Материалами для исследования послужили модели с непрерывной сетью и OLS-регрессия в пространстве стратегий управления доходами, а также математическая статистика. Результаты исследования. Известно, что суть установления фужциональных связей между доходами на рынке акций состоит в их кластеризации с использованием линейного или нелинейного анализа главных компонент состояния рынка. В данной работе приводится анализ двух перспективных эвристических подходов к оценке динамики функциональных связей между доходами на рынке акций и переменными, описывающими состояние рынка. Обсуждение и заключения. В результате исследования было установлено, что полученные нейронные сети имеют преимущество перед более традиционными методами в случаях, когда невозможно точно описать имеющиеся связи, но возможно выделить некоторый набор показателей, характеризующий исследуемое явление. И даже в самой неблагоприятной ситуации MBPN-сеть может превосходить метод OLS-регрессии.Introduction.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The models with neural network and OLS-regressions are used in the stock market and include variables that describe the state of the stock market. One of the possible ways to determine these dependencies is clusterization trough analizing principal components. The main aim of the research is revealing the essence of two promising heuristic approaches to assessment of the dynamics of functional relationships between the incomes in the stock market and variables that describe the state of the market. Materials and Methods. The source data are models with a continuous network and OLS-regression in the area of management strategies. Mathematical statistics revenue management strategies. Results. It is well known that specifics of functional relationship establishment between the income in the stock market lies in their clusterization through a linear (nonlinear) analysis of principal components of the market condition. We analyzed two promising heuristic approaches to the assessment of the dynamics of functional relationships between the income in the stock market and variables describing the state of the market. Discussion and Conclusions. The analysis of the dynamics of functional links between the revenues on the stock market was made.

Текст научной работы на тему «Сравнение моделей с нейронной сетью и OLS-регрессией при построении стратегии управления риском от дохода по индексу»

http://vestnik.mrsu.ru

ISSN Print 0236-2910 ISSN Online 2313-0636

информатика, вычислительная техника и управление /

computer science, computer engineering and management

сравнение моделей с нейронной сетью и OLS-PEГPECCИEй при построении стратегии управления риском от дохода по индексу

В. н. Щенников, Е. В. Щенникова, с. А. санников*

ФГБОУ ВО «МГУ им. Н. П. Огарёва» (г. Саранск, Россия)

*primarx12@yandex.com

Введение. Модели с нейронной сетью и OLS-регрессией используются на рынке акций и включают в себя переменные, описывающие состояние данного рынка. Одним из возможных способов определения таких зависимостей является их кластеризация с помощью анализа главных компонент. Цель исследования -раскрыть суть двух перспективных эвристических подходов к оценке динамики функциональных связей между доходами на рынке акций и переменных, описывающих состояние рынка.

Материалы и методы. Материалами для исследования послужили модели с непрерывной сетью и OLS-регрессия в пространстве стратегий управления доходами, а также математическая статистика.

Результаты исследования. Известно, что суть установления функциональных связей между доходами на рынке акций состоит в их кластеризации с использованием линейного или нелинейного анализа главных компонент состояния рынка. В данной работе приводится анализ двух перспективных эвристических подходов к оценке динамики функциональных связей между доходами на рынке акций и переменными, описывающими состояние рынка.

Обсуждение и заключения. В результате исследования было установлено, что полученные нейронные сети имеют преимущество перед более традиционными методами в случаях, когда невозможно точно описать имеющиеся связи, но возможно выделить некоторый набор показателей, характеризующий исследуемое явление. И даже в самой неблагоприятной ситуации МВР^сеть может превосходить метод OLS-регрессии.

ключевые слова: МВР^модели, волатильность, средняя квадратичная оценка, OLS-регрессия, правила торговли

Для цитирования: Щенников В. Н., Щенникова Е. В., Санников С. А. Сравнение моделей с нейронной сетью и OLS-регрессией при построении стратегии управления риском от дохода по индексу // Вестник Мордовского университета. 2017. Т. 27, № 1. С. 12-20. DOI: 10.15507/0236-2910.027.201701.012-020

УДК 519.876.5:004.942

DOI: 10.15507/0236-2910.027.201701.012-020

© Щенников В. H., Щенникова Е. В., Санников С. А., 2017

COMParISON OF MOdelS

WItH NeUral NetWOrK aNd OlS-reGreSSION IN CONStrUCtING tHe rISK MaNaGeMeNt StrateGy aGaINSt tHe INCOMe aCCOrdING t O INdeX

V. N. Shchennikov, y e. V. Shchennikova, S. a. Sannikov *

National Research Mordovia State University (Saransk, Russia)

*'primarx12@yandex.com

Introduction. The models with neural network and OLS-regressions are used in the stock market and include variables that describe the state of the stock market. One of the possible ways to determine these dependencies is clusterization trough analizing principal components. The main aim of the research is revealing the essence of two promising heuristic approaches to assessment of the dynamics of functional relationships between the incomes in the stock market and variables that describe the state of the market.

Materials and Methods. The source data are models with a continuous network and OLS-regression in the area of management strategies. Mathematical statistics revenue management strategies.

Results. It is well known that specifics of functional relationship establishment between the income in the stock market lies in their clusterization through a linear (nonlinear) analysis of principal components of the market condition. We analyzed two promising heuristic approaches to the assessment of the dynamics of functional relationships between the income in the stock market and variables describing the state of the market.

Discussion and Conclusions. The analysis of the dynamics of functional links between the revenues on the stock market was made.

Keywords: MBPN models, volatility, mean square estimation, OLS-regression, trade rules

For citation: Shchennikov VN, Shchennikova YeV, Sannikov SA. Comparison of models with neural network and OLS-regression in constructing the risk management strategy against the income according to index. Vestnik Mordovskogo universiteta = Mordovia University Bulletin. 2017; 1(27):12-20. DOI: 10.15507/0236-2910.027.201701.012-020

Введение.

Базовая структура сети проста: входной вектор из шести переменных и одномерный выход (переменная VWNY). Способность сети к обобщению может быть увеличена за счет прямых связей входных и выходных элементов [1-3]. Цель работы заключается в раскрытии перспективных эвристических подходов к оценке динамики функциональных связей в нейронной сети.

Если отсутствуют готовые схемы для оптимального выбора модели, необходимо апробировать различные критерии согласия. Для этого необходимо сравнить величины квадратного корня из среднеквадратичной ошибки (переменная RMSE) на тестовом множестве. После этого была задействована архитектура сети, которая выдавала наименьшую среднеквадратичную ошибку (табл. 1).

Т а б л и ц а 1 T a b l e 1

Квадратичный корень из средней квадратичной ошибки на подтверждающем множестве для обученных сетей различной архитектуры Square root of the mean square root error on affirmative set for the trained networks

of various architecture

Конфигурация / Configuration Прямые связи / Direct links Эпохи / Periods RMSE

Коэффициент обучения / Learning factor - 0,93

6-2-1 Нет / No 29 000 0,12240

6-3-1 Нет / No 7 000 0,11090

6-5-4-1 Нет / No 1 800 0,11567

Коэффициент обучения / Learning factor - 2,00

6-3-1 Есть / Yes 22 300 0,10530

0,145 0,140 0,135 0,130 w 0,125

VI

Щ 0,120

0,115 0,110

0,105 0,100

-

\ Обучение, коэффициент = 0,9 /

1 Learning, factor = 0,9

j Тестирование, коэффициент = 0,9 /

\ Testing, factor = 0,9 ~ _

I -L-1- 1 1 В- — ■ 1

2 500 5 000 7 500 10 000 12 500 Количество эпох / Number of periods

15 000 17 500

Р и с. 1. Квадратный корень из среднеквадратичной ошибки для 6-3-1 сети F i g. 1. Square root of the mean square root error for 6-3-1 network

Материалы и методы [4-7] и OLS-регрессия в пространстве

Материалами для исследования по- стратегий управления от доходов, а так-служили модели с непрерывной сетью же математическая статистика [8-10].

0

Результаты исследования

Рассматриваемый алгоритм включал в 2 раза больше эпох по сравнению с тем, в котором было достигнуто наилучшее обобщение. Таким образом, количество эпох было в 2 раза больше, чем показано в табл. 1 и рис. 1. При любом коэффициенте обучения RMSE на тестовом множестве будет меньше, чем на обучающем. Данный эффект мож-

0,145 .0,140 [0,135 | 0,130 И

Среди всех полученных нейронных сетей наилучшей является сеть с архитектурой 6-3-1 с прямыми связями и коэффициентом обучения 0,9. Для того чтобы получить решение в кратчайшие сроки, коэффициент обучения был увеличен в 2 раза. Шаги в направлении градиента значительно увеличились, вследствие чего произошло перескакивание через решение. В связи с этим для оптимального обучения сети понадобится намного большее количество эпох (~ 22 тыс.).

На рис. 1 показано, что RMSE убывает в первых 500 эпохах, а после 12 тыс. начинает колебаться. На

но объяснить зашумленностью обучаемого множества и отсутствием шума в тестовом множестве. Поскольку обучение прекращалось, как только значение RMSE начинало увеличиваться, можно предположить, что сеть не переобучилась, т. е. не «запомнила» шум. Таким образом, наличие больших погрешностей на обучаемом множестве объяснялось только белым шумом (рис. 1-3).

j

500

рис. 3 представлены оценки, полученные на подтверждающем множестве с помощью OLS-регрессии и сети 6-3-1. Показания, которые вывела сеть, оказались как по значениям RMSE, так и по коэффициенту корреляции Пирсона. Однако на новых образцах данных сеть показывает лучшие результаты, чем на обучающем множестве (REG1).

До этого момента сравнивались архитектуры сетей и предполагалось влияние сигнала на результат. В связи с этим возникает вопрос: влияют ли данные переменные на конечный результат (табл. 2-3).

w

S

Обучение, коэффициент = 2,0 / Learning, factor = 2,0

Тестирование, коэффициент = 2,0 / Testing, factor = 2,0

2 500

5 000 7 500 10 000 12 500 Количество эпох / Number of periods

_L

15 000 17

Р и с. 2. Квадратный корень из среднеквадратичной ошибки для 6-3-1 сети с коэффициентом обучения 2

F i g. 2. Square root of the mean square root error for 6-3-1 network with learning factor 2

0

0,25000 0,15000

1 5 m 1 5 m 1 m 1 5

5 5 vo \D \D 00 OO 00

m m m m m m m m m m m m m m m

Случай / Case

-VWNY

- Регрессия / Regression

■ Сеть / Network

Р и с. 3. Сравнение значений переменной VWNY, полученных регрессией и сетью, с ее истинными значениями F i g. 3. Comparison of VWNY variable values obtained by the regression and the network, with its true values

Т а б л и ц а 2 T a b l e 2

Критерии согласования для выходов регрессии и сети Concordance criteria for regression and network outputs

RMSE на обучающем и тестовом множестве / RMSE on learning and testing set

REG1 REG2 Сеть / Network

Обучение / Learning 0,1210 0,1234 0,1189

Тестирование / Testing - 0,1100 0,1030

Корреляция Пирсона / Pearson correlation

VWNY Регрессия / Regression Сеть / Network

VWNY 1,00 - -

Регрессия / Regression 0,66** 1,00 -

Сеть / Network 0,68** 0,98** 1,00

Примечание: ** - при 1%-ных хвостах распределения / Note: ** - in case of 1 % distribution tail areas

Т а б л и ц а 3 T a b l e 3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

вклад переменных в решение на обучающем множестве, тестовых множествах и всех данных the contribution of all variables into the solution based on learning, testing sets and overall data

RMSE

DC631 Ui(t) DEI(t) URP(t) UTS(t) MP(t + 1) YP(t + 12)

Общее /Gen 0,117 0,118 0,120 0,141 0,148 0,117 0,119

Обучающее / Learn 0,119 0,120 0,123 0,143 0,139 0,119 0,121

Тестовое / Test 0,105 0,106 0,108 0,128 0,191 0,106 0,108

Разница в RMSE, % / Difference in RMSE, %

Общее / Gen 100,00 0,94 2,88 20,30 26,45 0,33 1,74

Обучающее / Learn 100,00 0,91 2,87 20,02 16,54 0,26 1,51

Тестовое / Test 100,00 1,19 2,95 22,27 82,91 0,82 3,39

Для того чтобы оценить реальный вклад переменных в результат анализа нейронной сети, необходимо вычислить выход сети с оптимальным вектором. Предположим, что значение каждой переменной неизвестно и должно быть заменено на среднее арифметическое остальных пяти при их постоянных значениях. Таким образом были получены шесть новых входных матриц. После этого вычислялись выходные ряды для полученных входных матриц. Для данных рядов вычислили RMSE и сравнили ее с RMSE исходной входной матрицы. Дело в том, что если переменная активно влияет на решение, то ее RMSE будет значительно больше, чем в исходной матрице. Все найденные среднеквадратичные ошибки оказались больше исходных, а следовательно, замена переменной ее безусловным ожиданием только ухуд-

шает оценку целевой переменной. По результатам регрессионного анализа эти переменные квалифицируются как неактивные. Непредвиденная инфляция и месячная продукция имеют некоторое объясняющее значение и не могут быть заменены комбинациями других входных переменных.

При таком положении вещей различия между нейронной сетью и OLS-регрессией становится просто огромными. Чтобы улучшить результат за счет функции активации OLS-регрессии, можно использовать формулу:

^ _ дисперсия остатков (нелинейная модель) дисперсия остатков (линейная модель)

Значение данной функции лежит в промежутке между 0 и 1. Из-за того, что нейронные сети улавливают нели-

неиности в содержащихся данных, погрешность может только уменьшиться. Значения этих отношений оказываются примерно равными 0,94 и 0,92. Следовательно, либо в данных отсу-ствует нелинейность, либо нейронная сеть недостаточно эффективно использует свои нелинейные возможности. Предположим, что нелинейность в данных отсутствует, поскольку база данных строится с помощью линейных моделей. Большое значение данного отношения можно объяснить тем, что нейронная сеть лишь незначительно превосходит ОЬ8-регрессию по критерию ЯМ8Е. Однако стоит заметить, что нейронные сети все же превосходят ОЬ8-регрессию даже в работе с такими данными, в которых очень слабо выражена нелинейность между входами и целевой переменной.

обсуждение и заключения Нейронные сети имеют преимущество перед более традиционными методами в тех случаях, когда точное описание всех имеющихся взаимосвязей невозможно, но выделяется некоторый набор показателей, характеризующих исследуемое явление. В отсутствие четкой концептуальной модели применение регрессионных методов не представляется возможным. Данные по макроэкономическим факторам, использованные после предварительной

обработки оказываются почти идеально связанными с целевой переменной (доходом на NYSE) линейными связями, на что указывают большие значения коэффициента смешанной корреляции при регрессионном анализе и отношения R.

Выбранная архитектура сети с непосредственными связями между входами и выходами для такой ситуации является довольно удачной.Однако стоит отметить, что даже в сложной ситуации MBPN-сеть может превосходить метод OLS-регрессии по показателю RMSE и коэффициенту корреляции Пирсона. Более того, 6-3-1 сеть даже при работе с новыми данными позволяет составить более точный прогноз, чем оценка регрессии на уже ранее обработанных данных. Очевидна высокая степень согласованности результатов, касающихся вклада отдельных переменных, которые дают обычная регрессия и многослойная сеть. Такое соответствие повышает уверенность в правильности результатов и одновременно говорит о том, что, по крайней мере, линейная составляющая связи между доходом по индексу и выбранным фактором улавливается нейронной сетью достаточно успешно. Таким образом, работа нейронных сетей обретает большую прозрачность.

список использованных источников

1. Тепман Л. П., Эриашвили Н. Д. Управление инвестиционными рисками : учеб. пособие. М. : ЮНИТИ-Дана, 2016. 215 с.

2. Кабушкин С. Н. Управление банковским кредитным риском. М. : Новое знание, 2004. 336 с.

3. Качалов Р. М. Управление хозяйственным риском. М. : Наука, 2002. 344 с.

4. Барский А. Б. Логические нейронные сети : учеб. пособие. М. : Бином, 2012. 352 с.

5. Поспелов Д. А. Моделирование рассуждений: опыт анализа мыслительных актов. М. : Радио и связь. 1989, 184 с. URL: http://www.raai.org/about/persons/pospelov/pages/modras.pdf

6. Фролов Ю. Ф. Интеллектуальные системы и управление решения. М. : МП ГУ, 2000. 294 с.

7. Ежов А., Шумский С. Нейрокомпьютинг и его применение в науке и бизнесе. М., 1998. 224 с. URL: http://www.neuroproject.ru/Papers/Neurocomputing.htm

8. Бондарев А. Б. Прогнозирование биржевых сделок предприятий : практич. пособие. М. : Экономика и финансы, 1999. 240 с.

9. Едронова в. н., малфеева М. в. Общая теория статистики : учеб. 2-е изд., перераб. и доп. М. : Магистр, 2015. 511 с. URL: http://lib.sale/s1atistiki-teoriya/obschaya-teoriya-statistiki-uchebnik-yuristy.html

10. Социально-экономическая статистика. 2-е изд. перераб. и доп. / Под ред. М. Р. Ефимовой. М. : Юрайт, 2016. 591 с. URL: http://virtua.nsuem.ru:8001/mm/2012/000167488.pdf

Поступила 27.10.2016; принята к публикации 25.01.2017; опубликована онлайн 31.03.2017

Об авторах:

Щенников Бладимир Николаевич, профессор кафедры прикладной математики, дифференциальных уравнений и теоретической механики факультета математики и информационных технологий ФГБОУ ВО «МГУ им. Н. П. Огарёва» (430005, Россия, г. Саранск, ул. Большевистская, д. 68), доктор физико-математических наук, OrCId: http://orcid.org/0000-0002-1034-1293 , vnshchenn@yandex.ru

Щенникова Елена владимировна, профессор кафедры фундаментальной информатики факультета математики и информационных технологий ФГБОУ ВО «МГУ им. Н. П. Огарёва» (430005, Россия, г. Саранск, ул. Большевистская, д. 68), доктор физико-математических наук, доцент, OrCId: http://orcid.org/0000-0001-5989-3550, schennikova8000@yandex.ru

Санников Сергей Андреевич, аспирант кафедры прикладной математики, дифференциальных уравнений и теоретической механики факультета математики и информационных технологий ФГБОУ ВО «МГУ им. Н. П. Огарёва» (430005, Россия, г. Саранск, ул. Большевистская, д. 68), OrCI d: http://orcid.org/0000-0002-6135-6954, primarx12@yandex.ru

Вклад соавторов: В. Н. Щенников: научное руководство, постановка задачи, определение методологии исследования, критический анализ и доработка текста; Е. В. Щенникова: сбор и анализ аналитических и практических материалов по теме исследования, критический анализ и доработка решения; С. А. Санников: анализ научных источников по теме исследования, компьютерная реализация решения задачи.

Все авторы прочитали и одобрили окончательный вариант рукописи.

REFERENCES

1. Tepman LP, Eriashvili ND. Upravleniye investitsionnymi riskami: ucheb. posobiye [Investment risk management: Textbook]. Moscow: YuNITI-Dana; 2016. (In Russ.)

2. Kabushkin SN. Upravleniye bankovskim kreditnym riskom [Credit risks management]. Moscow: Novoye Znaniye Publ.; 2004. (In Russ.)

3. Kachalov RM. Upravleniye khozyaystvennym riskom [Economic risk management]. Moscow: Nauka; 2002. (In Russ.)

4. Barskiy AB. Logicheskiye neyronnyye seti: ucheb. posobiye [Logic neural networks: Textbook]. Moscow: Binom; 2012. (In Russ.)

5. Pospelov DA. Modelirovaniye rassuzhdeniy: opyt analiza myslitelnykh aktov [Modelling of reasoning: Experience of analyzing mental acts]. Moscow: Radio i Svyaz Publ. 1989. Available from: http://www. raai.org/about/persons/pospelov/pages/modras.pdf (In Russ.)

6. Frolov YuF. Intellektualnyye sistemy i upravleniye resheniya [Intelligent systems and solutions management]. Moscow: MGPU; 2000. (In Russ.)

7. Yezhov A, Shumskiy S. Neyrokompyuting i ego primeneniye v nauke i biznese [Neurocomputing and its application in science and business]. Moscow; 1998. Available from: http://www.neuroproject.ru/ Papers/Neurocomputing.htm (In Russ.)

8. Bondarev AB. Prognozirovaniye birzhevykh sdelok predpriyatiy: praktich. posobiye [Forecasting exchange transactions enterprises: Textbook]. Moscow: Ekonomika i Finansy Publ.; 1999. (In Russ.)

9. Yedronova VN, Malfeyeva MV. Obshchaya teoriya statistiki: ucheb [General theory of statistics]. 2nd ed. Moscow: Magistr; 2015. Available from: http://lib.sale/statistiki-teoriya/obschaya-teoriya-statistiki-uchebnik-yuristy.html (In Russ.)

10. Yefimova MR. Sotsialno-ekonomicheskaya statistika [Socio-economic statistics]. 2nd ed. Moscow: Yurayt; 2016. Available from: http://virtua.nsuem.ru:8001/mm/2012/000167488.pdf (In Russ.)

Submitted 27.10.2016; revised 25.01.2017;published online 31.03.2017

About the authors:

Vladimir N. Shchennikov, Professor of Chair of Applied Mathematics, Differential Equations and Theoretical Mechanics, National Research Mordovia State University (68 Bolshevistskaya St., Saransk 430005, Russia), Dr.Sci. (Physics and Mathematics), OrCId: http://orcid.org/0000-0002-1034-1293 , vnshchenn@yandex.ru

yelena V. Shchennikova, Professor of Chair of Fundamental Informatics, National Research Mordovia State University (68 Bolshevistskaya St., Saransk 430005, Russia), Dr.Sci. (Physics and Mathematics), OrCId: http://orcid.org/0000-0001-5989-3550 , schennikova8000@yandex.ru

Sergey a. Sannikov, Postgraduate Student, Chair of Applied Mathematics, Differential Equations and Theoretical Mechanics, National Research Mordovia State University (68 Bolshevistskaya St., Saransk 430005, Russia), OrCId: http://orcid.org/0000-0002-6135-6954 , primarx12@yandex.ru

Contribution of the co-authors: V. Shchennikov: scientific management, formulation of the problem, development of research methods, critical analysis and revision of the draft; Ye. Shchennikova: collection and analysis of data on research topic, critical analysis and revision of the decision; S. Sannikov: analysis of the scientific literature on research topic, computer implementation of the solution, writing of the manuscript.

All authors have read and approved the final manuscript.

i Надоели баннеры? Вы всегда можете отключить рекламу.