Научная статья на тему 'Нейросетевой инструментарий для прогнозирования доходности ПИФов'

Нейросетевой инструментарий для прогнозирования доходности ПИФов Текст научной статьи по специальности «Экономика и бизнес»

CC BY
226
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / ARTIFICIAL NEURON NETWORKS / ПАЕВЫЕ ИНВЕСТИЦИОННЫЕ ФОНДЫ / MUTUAL INVESTMENT FUNDS / МАКРОЭКОНОМИЧЕСКИЕ ИНДИКАТОРЫ / MACRO-ECONOMIC INDICATORS / PREDICTING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Гаврилюк Владислав Игоревич

В статье в контексте оценки точности прогнозов проведен сравнительный анализ эффективности нейросетевого и эконометрического подходов к прогнозированию. В качестве эконометрического подхода применена используемая в анализе финансовой статистики модель векторной авторегрессии. Рассмотрен вклад предикторов в решающую способность сетей, что позволило оценить степень индивидуального влияния макроэкономических факторов на динамику российских ПИФов.I

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Гаврилюк Владислав Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n the context of estimating the prediction accuracy the article conducts comparative analysis of neuro-network and econometric approaches to prediction. The author uses the model of vector auto-regression as an econometric approach used to analyze finance statistics. He also discusses the contribution of predictors to solution capability of networks which allows us to assess the degree of individual impact of macro-economic factors on dynamics of Russian mutual investment funds.

Текст научной работы на тему «Нейросетевой инструментарий для прогнозирования доходности ПИФов»

В. И. Гаврилюк

НЕЙРОСЕТЕВОЙ ИНСТРУМЕНТАРИЙ ДЛЯ ПРОГНОЗИРОВАНИЯ

ДОХОДНОСТИ ПИФОВ

В статье в контексте оценки точности прогнозов проведен сравнительный анализ эффективности нейросетевого и эконо-метрического подходов к прогнозированию. В качестве эконо-метрического подхода применена используемая в анализе финансовой статистики модель векторной авторегрессии. Рассмотрен вклад предикторов в решающую способность сетей, что позволило оценить степень индивидуального влияния макроэкономических факторов на динамику российских ПИФов.

Ключевые слова и словосочетания: прогнозирование, искусственные нейронные сети, паевые инвестиционные фонды, макроэкономические индикаторы.

В условиях возрастающей неуправляемости мировых процессов в финансовой сфере традиционные (линейные) методы все чаще оказываются малоэффективными в плане распознавания ключевых переломов в тенденциях рынка. Классические парадигмы финансовой науки, такие как модель случайного блуждания или гипотеза эффективного рынка, утверждают, что финансовые рынки склонны относительно плавно и разумно приспосабливаться к поступающей информации. В этом круге идей вполне убедительно выглядят описания поведения рынка на основе линейных зависимостей и законов обращения трендов (стационарности). Однако в действительности поведение финансовых рынков едва ли может быть описано линейными трендами. В этой связи возникает объективная необходимость поиска технологий, которые основываются на нелинейных методах анализа экономической и финансовой информации. К числу таких систем поддержки принятия решений относятся искусственные нейронные сети (ИНС), представляющие собой сети компьютерных процессоров, взаимодействие которых построено по образцу процессов обучения, происходящих в человеческом мозге1. Одной из областей использования ИНС является прогнозирование.

В основе перспективности ИНС для решения задач прогнозирования лежит ряд существенных особенностей.

Во-первых, в противоположность используемому в экспертных системах подходу, основанному на применении неизменяемых правил, ИНС относятся к категории самоприспосабливающихся, адаптивных нелинейных систем, что позволяет значительно снизить количество априорных допущений при моделировании.

Во-вторых, ИНС обладают способностью к обобщению. В случае если сети представлены зашумленные данные (допустим, имеется неполная или малая статистическая выборка), то после обучения ИНС может с высокой сте-

1 См.: Хайкин С. Нейронные сети: полный курс. - М. : Вильямс, 2006.

пенью корректности уловить статистические характеристики генеральной совокупности и достаточно точно восполнить недостающие наблюдения.

В-третьих, ИНС являются универсальным средством для приближения (аппроксимации) функций. Любую вещественнозначную функцию нескольких переменных на компактной области определения можно сколь угодно точно приблизить с помощью трехслойной нейронной сети. Проще говоря, нейро-сеть может выполнить задачу по аппроксимации любой непрерывной функции с любой желаемой точностью.

Наконец, ИНС способны распознавать нелинейные зависимости при анализе данных. Прогнозирование достаточно долго было прерогативой линейной статистики. Такие традиционные подходы к прогнозированию временных рядов, как методы Бокса - Дженкинса (АЫМА) или модель векторной авторегрессии (УАЯ), предполагают допущение о том, что изучаемые временные ряды возникают в результате линейных процессов. Безусловно, линейные модели обладают рядом таких преимуществ, как доступность, доскональность, простота в описании и реализации, однако они могут быть неприменимы, если лежащий в основе изучаемых процессов механизм нелинеен.

Таким образом, инструментарий ИНС представляет интерес с точки зрения оптимизации процесса инвестирования в ПИФы, которые, будучи инструментом финансового рынка, по своей природе нелинейны. Нейросетевые технологии дают возможность разработки эффективной математически обоснованной системы прогнозирования доходности ПИФов, применение которой позволит снизить риски инвестора при выборе фонда.

Выбор фондов и объясняющих переменных (предикторов)

Эффективность прогностических моделей во многом зависит от выбора объясняющих переменных. В ходе исследования было принято решение об учете влияния как экзогенных, так и эндогенных переменных. При таком подходе, с одной стороны, обеспечивается экономическая обоснованность модели, а с другой - учитывается динамика самого финансового инструмента.

Для определения экзогенных факторов был проведен анализ макроэкономических индикаторов, которые могут оказывать влияние на рынок ПИФов. В связи с этим были рассмотрены показатели, оценивающие следующие сферы экономики РФ: рынок благ - показатели экономического роста (ВВП, ВНП и др.); рынок труда - показатели уровня занятости, безработицы; рынок денег - показатели инфляции (темпы инфляции, денежные агрегаты и др.); валютные рынки - соотношения курсов валют; рынок ценных бумаг - показатели капитализации рынка акций (облигаций)1.

Следует отметить, что целый ряд научных исследований2 свидетельствует о том, что экономические показатели позволяют осуществлять прогноз-

1 См.: Абель Э., Бернанке Б. Макроэкономика / пер. с англ. Н. Габенова, А. Смольского; науч. ред. Л. Симкина. - 5-е изд. - СПб. : Питер, 2008.

2 См., например: Balvers R. J., Cosimano T. F. and McDonald B. Predicting Stock Returns in an Efficient Market // Journal of Finance. - 1990. - Vol. 45; Campbell J. Y. and Hamao Y. Predictable Stock Returns in the United States and Japan; A Study of Long-term Capital Integration // Journal of Finance. - 1992. - Vol. 47; Fama E. F. and French K. R. Business Conditions and the Expected Returns on Stocks and Bonds // Journal of Financial Economics. - 1989. - Vol. 25.

ные оценки доходности активов на фондовом рынке. Поэтому, принимая во внимание, что российские розничные ПИФы - это, по сути, диверсифицированные портфели, состоящие в основном из ценных бумаг, обращающихся на фондовом рынке, справедливо будет предположить, что стоимости паев с некоторым временным лагом отражают изменения макроэкономических факторов.

Динамика стоимости чистых активов российских ПИФов в период мирового финансового кризиса наглядно свидетельствует о том, что наряду с влиянием отечественного фондового рынка российский рынок коллективных инвестиций испытывает на себе сильное воздействие внешних факторов, особенно изменения состояния фондовых рынков в других странах. Безусловно, велико влияние на российский рынок ценных бумаг фондового рынка США, азиатских фондовых рынков и рынков ценных бумаг Западной и Восточной Европы. Анализ динамики основных фондовых индексов мирового рынка ценных бумаг позволяет сделать вывод о том, что тенденции развития этих рынков с большой степенью вероятности проявляются и на российском фондовом рынке.

Также отметим, что помимо ситуации на развитых и формирующихся фондовых рынках на динамику развития российского рынка коллективного инвестирования оказывают влияние цена нефти на международных рынках и курс национальной валюты (рубля) к иностранным валютам.

В качестве экзогенных объясняющих переменных были выбраны следующие макроэкономические индикаторы (эндогенной объясняющей переменной в нашем случае будет динамика стоимости пая конкретного рассматриваемого ПИФа - NAV):

- реальный внутренний валовой продукт (GDP);

- индекс промышленного производства (IIP);

- индекс потребительских цен (CPI);

- денежный агрегат M2 (M);

- индекс реального двухвалютного курса рубля, доллар - евро (ER);

- индекс цен на нефть Brent (IPE);

- индекс ММВБ (MX);

- индекс S&P 500 (SP);

- индекс FTSE-100 (FTSE);

- индекс SSE Composite (SSE).

Для процедуры моделирования было выбрано по одному представителю из пяти наиболее распространенных категорий ПИФов: Альянс РОСНО - акции (FE), Райффайзен - облигации (FB), Газпромбанк - сбалансированный (FMX), БКС - индекс ММВБ (FI), Тройка Диалог - Фонд денежного рынка (FMM).

В целях исследования был создан информационный массив, отражающий динамику ПИФов и макроэкономических индикаторов за период с января 2008 по сентябрь 2012 г. по месяцам. Перейдем непосредственно к описанию разработанных прогностических моделей.

Модель VAR

Для сравнения прогнозов на базе ИНС с результатами традиционных методов прогнозирования изначально для каждого рассматриваемого ПИФа была построена модель VAR, которая является естественным обобщением подхода Бокса - Дженкинса к моделям ARIMA. Каждое уравнение модели VAR описывает зависимость одной из переменных модели от p лаговых значений всех переменных модели. Таким образом, каждое уравнение модели есть комбинация модели с распределенными лагами и модели авторегрессии. Число уравнений модели VAR равно числу переменных. Надо заметить, что если в обычной авторегрессии коэффициенты являются скалярными величинами, то в случае VAR следует рассматривать уже матрицы коэффициентов.

Математическое представление модели VAR имеет следующий вид:

yt = Ay_i +...+ Apyt_p + Bx+ Et, где yt - ^-мерный вектор эндогенных переменных;

A1, ..., Ap и B - матрицы коэффициентов, которые подлежат оцениванию;

xt - d-мерный вектор экзогенных переменных;

Et - вектор возмущений остатков.

Отметим, что применяемая постановка модели VAR характеризуется допущением о том, что предикторы могут влиять на результирующую переменную с разным запаздыванием. Поэтому в базовых моделях для каждого типа фондов переменные рассматривались с лагами 1, 2 и 3-го порядков. В связи с этим изначальное число эндогенных и экзогенных объясняющих переменных в каждой модели VAR увеличилось и составило 33. Затем осуществлялся отбор наиболее существенных объясняющих переменных при 15%-м уровне значимости. Построенные модели оказались достаточно адекватными при оценке их качества по коэффициенту детерминации (R2). По 5 моделям R2 находится в диапазоне 0,60-0,80. Кроме того, был проведен тест Дарбина - Ватсона, который в каждом случае дал значение, близкое к 2, что свидетельствует об отсутствии автокорреляции в разработанных моделях.

После отбора окончательной совокупности участвующих в моделях признаков были получены следующие уравнения:

NAVfe(t + 1) = 0,039 + 0,595 NAVfe(t) - 1,289 SP (t - 1) + 0,453 SSE (t - 2) -

- 3,746 CPI (t - 2) + 0,263 SSE (t - 1) + 0,325 IPE (t) - 0,592 FTSE (t);

NAVfb (t + 1) = -0,152 GDP (t - 2) + 0,208 IIP (t) + 0,902 CPI (t - 1) -

- 1,211 CPI (t - 2) + 0,321 M (t - 1) + 0,286 M (t - 2) - 0,151 ER (t) +

+ 0,152 ER (t - 1) - 0,127 ER (t - 2) + 0,09 IPE (t - 1) + 0,149 MX (t) -

- 0,139 MX (t - 2) - 0,181 SP (t) - 0,39 SP (t - 1) + 0,263 FTSE (t - 1) +

+ 0,2 FTSE (t - 2) + 0,135 SSE (t - 2);

NAVfmx(t + 1) = 0,365 NAVfmx(t) - 0,471 GDP (t - 2) + 0,373 IIP (t) +

+ 3,217 CPI (t-1) - 3,597 CPI (t - 2) + 0,659 M (t-1) + 0,562 M (t - 2) -

- 0,584 ER (t) + 0,727 ER (t - 1) - 0,876 ER (t - 2) + 0,356 IPE (t) -

- 0,373 MX (t - 2) - 1,183 SP (t) - 0,777 SP (t - 1) + 0,922 FTSE (t)

+ 0,6 FTSE (t - 2) + 0,29 SSE (t - 1) + 0,387 SSE (t - 2);

NAVfi (t + 1) = 0,528 NAVfi (t) + 1,98 CPI (t) - 0,794 ER (t) + 0,581 ER (t-1) -

- 0,937 ER (t - 2) - 0,704 SP (t - 1) + 0,621 FTSE (t - 2) + 0,413 SSE (t - 2);

NAVfmm(t + 1) = -0,242 NAVfmm(t - 2) - 0,276 GDP (t) + 0,729 GDP (t - 1) -

- 0,565 GDP (t - 2) - 0,193 IIP (t - 2) + 0,661 M (t - 2) + 0,262 IPE (t - 1) -

- 0,153 IPE (t - 2) + 0,378 MX(t) - 0,456 SP (t) - 0,318 SP (t - 1) + + 0,152 SSE (t - 1) + 0,155 SSE (t - 2).

Нейросетевая модель

Для обеспечения сходимости обучения нейросетей в первую очередь была проведена предобработка входных данных, которая осуществлялась в два этапа.

На первом этапе на листах книги MS Excel были разнесены значения всех экзогенных и эндогенных факторов за рассматриваемый период по месяцам.

На втором этапе по каждому фактору были рассчитаны месячные приращения значений. Таким образом, входные данные были нормализированы в интервале [-1, 1].

Далее с применением модуля Neural Networks программного комплекса IBM SPSS Statistics 19 были опробованы различные конфигурации нейросетевой архитектуры. Базовая структура сети выглядела следующим образом: входной вектор, один скрытый слой и одномерный выход (прирост стоимости пая, т. е. переменная NAV). Остается выбрать число нейронов для входного и скрытого слоев. Поскольку результаты VAR-моделей указывают на присутствие линейных связей между входами и выходом, способность сети к обобщению может быть увеличена за счет прямых связей между входными и выходными элементами. Таким образом, в качестве изначальных входных нейронов принимались переменные уравнений VAR для сетей соответствующих типов фондов.

Затем в порядке убывания своей значимости (основанной также на статистических критериях согласия) добавлялись новые входные элементы в сетевую структуру. Так достигался оптимальный набор нейронов входного слоя с точки зрения минимизации квадратного корня из среднеквадратичной ошибки (RMSE) между фактическими и прогнозными значениями. То есть для дальнейшей работы выбиралась та архитектура сети, которая давала наименьшее RMSE.

Расчет же числа скрытых нейронов производился с помощью эвристического подхода, суть которого сводится к линейной зависимости количества скрытых нейронов от количества входных нейронов.

Оптимальная комбинация коэффициента скорости обучения (п) и коэффициента импульса (а) была определена соответственно как 0,9 и 0,7 и применялась для всех сетей. Максимально допустимое значение RMSE при реализации алгоритма back-propagation было установлено на уровне 0,001 также для всех разработанных сетевых структур.

Параметры нейросетей для прогнозирования динамики значений стоимости паев рассматриваемых ПИФов представлены в табл. 1.

Т а б л и ц а 1

Параметры нейросетей

Параметр Значение

FE FB FMX И1 FMM

Форма сети Персептрон

Количество слоев 3

Количество нейронов во входном слое (без смещения) 10 20 18 8 13

Факторы SP(t - 1), SSE(t - 2), NAVFE(t - 1), СРЩ - 2), SSE(t - 1), 1РЕ(Г), FTSE(t), то, GDP(t), ЕЛ^ - 1) GDP(t - 2), IIPt, CPI(t - 1), СРЩ - 2), М^ - 1), М^ - 2), ЕЛ, ER(t - 1), ER(t - 2), 1РЕ^ - 1), MX(t), - 2), SPt, SP(t - 1), FTSE(t - 1), FTSE(t - 2), SSE(t - 2), ^^ - 2), NAVFвt, NAVFв(t - 2) GDP(t - 2), IIPt, - 1), - 2), М^ - 1), М(t - 2), ЕЛ, ЕЛ? - 1), ЕЛ^ - 2), MX(t - 2), SPt, SP(t - 1), FTSEt, FTSE(t - 2), SSE(t - 1), SSE(t - 2), NAVFмxt СРЛ, ЕЛ, ER(t - 1), ЕЛ? - 2), - 1), FTSE(t - 2), SSE(t - 2), NAVFIt GDPt, GDP(t - 1), GDP(t - 2), ЯР^ - 2), М^ - 2), IPE(t - 1), IPE(t - 2), SPt, SP(t - 1), SSE(t - 1), SSE(t - 2), NAVFммt

Связи со скрытым слоем Прямые

Количество нейронов в скрытом слое (без смещения) 3 8 8 3 5

Функция активации в скрытом слое Сигмоид

Связи с выходным слоем Прямые

Количество нейронов в выходном слое 1

Функция активации в выходном слое Сигмоид

Обучающая выборка [1,37] [1,42] [1,39] [1,37] [1,37]

Контрольная выборка [38,53] [43,54] [40,54] [38,54] [38,54]

Функция ошибки RMSE

Оценка точности прогнозов

В целях оценки точности прогнозов, полученных с помощью разработанных моделей, был рассчитан показатель MAE (Meanabsoluteerror - средняя абсолютная ошибка). MAE применяется для измерения близости прогнозных значений к фактическим и вычисляется по формуле

MAE = 1= J f - У

где fi - фактическое значение временного ряда; yi - прогнозное значение временного ряда.

Как видно из табл. 2, нейросетевые модели и модели VAR характеризуются довольно низкими значениями показателя MAE. Однако значения MAE для нейросетевых моделей в среднем ниже на 31%, что свидетельствует об их более высокой прогностической точности в контексте задач рассматриваемого класса.

Т а б л и ц а 2

MAE прогностических моделей по типам фондов

Тип фонда Нейросетевая модель Модель VAR Снижение MAE при нейросетевом подходе, %

Фонд акций, FE 0,0477 0,0543 -12

Фонд облигаций, FB 0,0099 0,0160 -38

Фонд смешанных инвестиций, FMX 0,0333 0,0431 -23

Индексный фонд, FI 0,0353 0,0545 -35

Фонд денежного рынка, FMM 0,0123 0,0234 -47

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Следует заметить, что прогнозные оценки, сделанные посредством сетей, оказались более точными для всех анализируемых типов фондов. Тем не менее степень улучшения качества прогноза в каждом отдельном случае заметно варьируется. Можно предположить, что это обусловлено наличием большего количества нелинейных зависимостей в данных по некоторым типам фондов, которые сеть улавливает лучше, чем модель VAR.

Анализ вклада объясняющих переменных

Одним из применяемых способов оценки вклада переменных в решающую способность сети является анализ чувствительности погрешности прогноза к изменениям объясняющих переменных. В целях оптимизации вычислительного процесса данный анализ был проведен с использованием соответствующей опции модуля Neural Networks. В результате были получены оценки важности объясняющих переменных, которые в рамках решаемой задачи позволят провести анализ влияния макроэкономических факторов на динамику фондов в разрезе их типов.

Так, в аналитических целях для каждого типа фондов было рассмотрено по пять переменных, имеющих наибольшую важность.

Как видно из рисунка, на динамику всех ПИФов оказывает влияние индекс шанхайской фондовой биржи SSE Composite, что свидетельствует о зависимости российского фондового рынка и, как следствие, рынка ПИФов от ситуации на китайских торговых площадках. Заметим, что особо сильное влияние SSE Composite оказывает на индексный ПИФ и ПИФ облигаций.

Рис. Диаграммы нормализованной важности объясняющих переменных по типам фондов

ПИФ акций находится под значительным влиянием лондонского биржевого индекса FTSE-100. Кроме того, британский индекс определяет динамику ПИФа облигаций и ПИФа смешанных инвестиций. Таким образом, еще раз подтверждается влияние фондового рынка Западной Европы на российский рынок ценных бумаг.

ПИФы денежного рынка и смешанных инвестиций демонстрируют существенную зависимость от американского индекса S&P 500. В меньшей степени от S&P 500 зависит индексный ПИФ.

Индекс цен на нефть марки Brent оказывает влияние на ПИФы акций и денежного рынка. ПИФы облигаций и смешанных инвестиций показывают зависимость от индекса промышленного производства. Существенное влияние на индексный ПИФ оказывает индекс реального двухвалютного курса рубля (доллар - евро).

Важным фактором доходности почти для всех типов ПИФов является их собственная динамика, которая в значительной степени предопределяет будущую стоимость пая.

На основе проведенного исследования сделаны следующие выводы:

- система прогнозирования на основе многослойной нейронной сети обратного распространения с прямыми связями между входами и выходами и логистическими функциями активации является эффективным инструментом для оценки стоимости паев российских ПИФов;

- нейросетевые прогностические модели дают более точные прогнозы, чем традиционные эконометрические подходы, что главным образом обусловлено их способностью улавливать нелинейные зависимости в анализируемом массиве данных;

- нейросетевой инструментарий позволяет проводить детальный анализ факторов, влияющих на рыночную ситуацию, что было доказано на примере российского рынка ПИФов.

Список литературы

1. Абель Э., Бернанке Б. Макроэкономика / пер. с англ. Н. Габенова, А. Смольского; науч. ред. Л. Симкина. - 5-е изд. - СПб. : Питер, 2008.

2. Гаврилюк В. И. Паевые инвестиционные фонды в РФ: хронологический срез развития индустрии // Вестник Российского экономического университета имени Г. В. Плеханова. - 2012. - № 10 (52).

3. Дорохов Е. В. Статистический подход к изучению прогнозирования индекса РТС на основе методов векторной авторегрессии и коинтеграции // Финансы и бизнес. - 2008. - № 1.

4. Картвелишвили В. М., Гаврилюк В. И. Паевые фонды в России: генезис и эволюция отрасли // Наука и практика. - 2012. - № 2 (8).

5. Хайкин С. Нейронные сети: полный курс. - М. : Вильямс, 2006.

i Надоели баннеры? Вы всегда можете отключить рекламу.