Научная статья на тему 'Использование некоторых методов data mining в задачах выбора инвестиционного портфеля'

Использование некоторых методов data mining в задачах выбора инвестиционного портфеля Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
316
96
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОРТФЕЛЬНОЕ ИНВЕСТИРОВАНИЕ / DATA MINING / НЕЙРОННЫЕ СЕТИ / ОПТИМИЗАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Исавнин А. Г., Галиев Д. Р.

Статья посвящена использованию методов Data Mining в задачах выбора оптимального инвестиционного портфеля. Рассмотрено использование нейронных сетей TSK (Такаги Сугено Канга) для прогнозирования временного ряда доходностей и нейронных сетей прямого распространения для прогноза потенциала роста (падения) актива. Рассмотрены модели выбора оптимального портфеля c асимметричными мерами риска и использованием прогнозов нейросетевых моделей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование некоторых методов data mining в задачах выбора инвестиционного портфеля»

УДК 519.865.5

ИСПОЛЬЗОВАНИЕ НЕКОТОРЫХ МЕТОДОВ DATA MINING В ЗАДАЧАХ ВЫБОРА ИНВЕСТИЦИОННОГО ПОРТФЕЛЯ

А. Г. ИСАВНИН,

доктор физико-математических наук, профессор, декан факультета прикладной математики и информационных технологий E-mail: isavnin@mail. ru

Д. Р. ГАЛИЕВ,

студент факультета прикладной математики и информационных технологий E-mail: damir. galiev@mail. ru Филиал Казанского (Приволжского) федерального университета в г. Набережные Челны

Статья посвящена использованию методов Data Mining в задачах выбора оптимального инвестиционного портфеля. Рассмотрено использование нейронных сетей TSK (Такаги - Сугено - Канга) для прогнозирования временного ряда доходностей и нейронных сетей прямого распространения для прогноза потенциала роста (падения) актива. Рассмотрены модели выбора оптимального портфеля c асимметричными мерами риска и использованием прогнозов нейросетевых моделей.

Ключевые слова: портфельное инвестирование, data mining, нейронные сети, оптимизация.

Задача выбора оптимального портфеля

Формирование оптимального инвестиционного портфеля является весьма актуальной задачей как для представителей бизнеса (институциональных инвесторов), так и для частных инвесторов. Применение количественных методов позволяет повысить качество конечного инвестиционного портфеля. Авторское исследование посвящено использованию результатов прогнозов нейросетевых моделей в моделях портфельного инвестирования. Рассмотрено два подхода: точечное прогнозирование цены с помощью нейро-нечеткой модели и прогнозирование

потенциала доходности с помощью неиросетевои модели распознавания паттернов.

Построим сначала математические модели. Пусть x = (x, x2,..., xn ) - вектор, определяющий структуру инвестиционного портфеля, n - коли-

n

чество активов в портфеле. При этом ^ х = 1-

i=1

Доходности активов характеризуются вектором r (r, гг ). Очевидно, что доходность инвес-

n

тиционного портфеля R = ^ rt xi.

i=1

Основной идеей большинства моделей выбора оптимального инвестиционного портфеля является максимизация доходности при ограниченном риске или минимизация риска при ограниченной доходности. В качестве мер риска в авторском исследовании были использованы показатели Value-at-Risk [5] и Mean Semi-Absolute Deviation [9]. На практике можно использовать и другие меры, например, описанные в работе [3].

Рассматриваемые модели выглядят следующим образом.

Модель максимизации доходности при ограниченном Value-at-Risk (VaR).

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жеб7>ЪЯ -и ЪРЛЖкЫ

max Z rx ,

x i=i

VaK=-Vp - Za<p,

X х = 1

1=1

I < х. < и {, I = 1, и,

где ^аЯа - заданный пользователем уровень Vаlue-аt-Risk;

Iи и- отражают дополнительные ограничения в портфеле на актив 1.

Значение УаЯ уровня 1 - а (¥аЯа ) определяется как Р(Яр < -¥аЯа) = а.

Совершив ряд преобразований, получим

P(Rp < -VaRa) = а О P

R pp ~VaK-V p

3,

3,

-VaRa-V p

= аО -p = Za° VaR = p - Za<p ,

<

p

где Rp - доходность портфеля;

^p - средняя доходность портфеля; <p - риск портфеля (среднее квадратичное отклонение);

z - квантиль стандартного нормального распределения порядка а.

При этом полагается, что доходность портфеля имеет распределение, близкое к нормальному. Так, VaR уровня 95 % (т. е. при а = 0,05) будет определяться как VaR 05 = -д +1,6449 <3 .

Модель минимизации MSAD (Mean SemiAbsolute Deviation) при ограниченной снизу доходности и наличии дополнительных ограничений на структуру портфеля.

min M(|min{0, R -MR}|),

Ё rx ^ R,

1=1

п

IX = 1,

1=1

I < х. < и., г = 1, п, где М - математическое ожидание. Целевая функция М(|тт{0, Я -МЯ}\) определяет среднее полуабсолютное отклонение доходности портфеля (MSAD);

R0 - константа, которая задается пользователем модели и означает нижний предельный уровень доходности портфеля;

l . и и. - отражают дополнительные ограничения в портфеле на актив i .

Далее возникает вопрос о том, какую величину использовать в качестве доходности. В первых моделях выбора оптимального портфеля использовались исторические средние доходности. Например, в модели Марковица [10]. Однако этот способ обладает очевидным недостатком: не факт, что значение исторической средней будет такой же и в будущем. В данном исследовании в качестве доходности были использованы прогнозы на основе нейросетевых моделей. Подобные алгоритмы можно отнести к методам Data Mining [1]. Этот термин является собирательным названием и используется для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний [6]. Рассмотрим подробнее эти модели.

Использование результатов прогноза по нечеткой нейросетевой модели

Нечеткие искусственные нейронные сети получили свое название, потому что для аппроксимации зависимости выходного сигнала от входного вектора y = (y y2,...,yN) в них используются выражения, заимствованные из нечетких систем, в частности из системы Такаги - Сугено - Канга (TSK), оперирующих нечеткими множествами [8].

Рассмотрим подробнее особенности и функциональные элементы сети. В рассматриваемой нейронной сети обучение проводится с учителем. То есть для каждого входного вектора имеется желаемое для выхода значение. Выборку принято разбивать на обучающую и проверочную. Наиболее популярные соотношения — 70:30 и 80:20. Обобщенную схему вывода в модели TSK при использовании M правил и N переменных x. можно представить в следующем виде [2]:

1(1) П ?

Я, если у е Ди; у2 е А^,...,уп е А

N

то & = Р10 +Х Р ]■ У ]■,

]=1

Ям, если у е А(М); у2 е А(М),...,Уп е АПМ),

N

то ём = Рм о +Х Рщ У}-, (1)

■ =1

где А. (к) - значение лингвистической переменной у 1 для правила Яу с функцией принадлежности

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жеорпя -и ЪР^тжгсх*

53

lA) (У) =

1 +

У, - c¡k

2b( k

-, i = 1,n; k = 1,M.

a

(k )

В нечеткой нейронной сети Т$К пересечение правил Яу определяется функцией принадлежности в форме произведения

N л

,(к) (

iAk) ( у )=П-

j=1

i+

Г (к)

У/-c()

a(k)

v*k

M

I

g (У )=—

®kgk (y)

M

I

k=1

СО,

гДе gk(У) = Pk0 + IsPkj-yj, С = |<k)(y).

7=1

В сети выделяют пять слоев [2].

Первый слой выполняет раздельную фаззи-фикацию каждой переменной y,, i = 1, N, определяя для каждого k-го правила вывода значение функции принадлежности

I a )(Уг) в соответствии с функцией фаззифика-ции. Это параметрический слой с параметрами c(k), a(k), b(k), которые подлежат адаптации в процессе обучения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Второй слой выполняет агрегирование отдельных переменных y , определяя результирующую степень принадлежности

С = Ia) ( У) для вектора y условиям k-го правила. Это непараметрический слой.

Третий слой представляет собой генератор функции TSK, в котором

У i

ЦА(У1 )

ц A (y i)

У 2

цА(y 2)

яУО:)

Уы-

(2)

цA (Уы)

ц A (Уы)

рассчитываются значения (1). В этом слое также происходит умножение функции gk (у) на юк, сформированных на предыдущем слое. Это параметрический слой, в котором адаптации подлежат линейные параметры (веса) рк0, р^ для к = 1, М, ] = 1, N, определяющие функции последствий правил.

Четвертый слой составляют два нейрона-сумматора, один из которых рассчитывает взвешенную сумму сигналов gk (у), а второй определяет сумму

весов

M

IM= k=1

С

k

При M-правилах вывода композиция и сходных результатов сети определяется по следующей формуле:

Пятый слой состоит из одного-единственного нейрона. В нем веса подлежат нормализации, и вычисляется выходной сигнал ^(у) в соответствии с выражением (2). Слой является непараметрическим.

Нечеткая нейронная сеть TSK задается мно-гослойнойструктурнойсетью,представл е иной на рис.1.

Из приведенного описания следует, что нечеткая сеть Т8К содержит толькодвапараметрических слоя (первый и третий), параметры которых уточняются в процессе обучения. Параметры первого

Рис.1. Структурнаясхема сетиТакаги-Сугено-Канга

1

ЭКОНОМИЧЕСКИЙАНАЛИЗ:^5д?3£? ЪЪР/ГКЖКЪ4

, (к) (к) т(к)ч

слоя (с , а ■ , о: ') называют нелинейными, а параметры третьего слоя {р^} - линейными весами. Количество линейных и нелинейных параметров сети TSK равно М х 3 х N+М N + 1) = М (Ш + 1).

Общее выражение для функциональной зависимости для сети TSK задается следующим образом: Вход Входной слой Правило Выходной слой

& (у) =

1

М М

Выход

Выход

110 [—

М ( N \ N

-X Рко+Ер»у] П^А')(у-).

ЕШ (у■) к=11 ^ }

к=1 :=1

Рассмотрим нейронную сеть TSK на примере прогнозирования цены закрытия обыкновенных акций ОАО «Сбербанк России». Для этого воспользуемся пакетом МАТЬАВ, в котором существуют встроенные средства для создания нейронных сетей [4]. В качестве входных параметров в нейронную сеть подаются цены закрытия за три предыдущих дня, в качестве выходного параметра -цена закрытия на текущий день. Для каждой из входных переменных задано по три лингвистических терма, а в качестве типа их функций принадлежности выбрана треугольная функция. Структура созданной нейронной сети представлена на рис. 2.

Графики реальных и спрогнозированных данных на обучающей и тестовой выборках

соответственно представлены на рис. 3 и 4.

Рис. 2. Структура нейронной сети, созданной в МАТЬАВ

Реальные данные * Спрогнозированные данные

105 100 95 90 85 80 75 70 65

О Ф

+

О О

о о + * %

Т о

+ О *

о * о

® «

о +

6

+

о ф $

о + +

ф б ° + + * +

о

Выход

102 -

101 -

100^

99-

98 -

97 -

96 -

95 -

94 -

93

10 15 20 25 30 35

Индекс

Рис. 3. Реальные и спрогнозированные данные на обучающей выборке

• Реальные данные * Спрогнозированные данные

40

45

_1 10

3 4 £ , „ Б 7 8

Индекс

Рис. 4. Реальные и спрогнозированные данные на тестовой выборке

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ж£брпя "к. ЪР^тжгсх*

55

Таблица 1

Основные характеристики сформированной нечеткой нейронной сети

Характеристика Значение

Количество узлов 27

Количество линейных параметров 27

Общее число параметров 54

Количество нечетких правил 27

Размер обучающей выборки 43

Размер тестовой выборки 10

Число эпох обучения 40

Максимальное отклонение 9,59 %

Суммарная ошибка нейронной сети 1,31

Я2 по реальным и спрогнозированным данным 92 %%

Основные характеристики сети приведены в табл. 1.

Использование результатов прогноза потенциала доходности

Как показывает практика, довольно часто точечные прогнозы не совпадают абсолютно точно с реальными значениями. Для инвестора более полезной могла бы стать информация о потенциале доходности актива. Чтобы определить потенциал доходности, можно использовать методы распознавания паттернов. Для реализации подобных методов также можно применить аппарат нейронных сетей. Одной из подходящих архитектур является двухслойная сеть прямого распространения, которая способна воспроизводить весьма сложные нелинейные зависимости между входом и выходом [4]. Структура слоя сети показана на рис. 5. Как правило, скрытые слои содержат нейроны с сигмоидальными функциями активизации, а выходной слой - нейроны с линейными функциями активизации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассмотрим пример на базе предыдущего инструмента (обыкновенные акции ОАО «Сбербанк России»). В качестве среды реализации снова воспользуемся МАТЪАВ. Структура нейронной сети, предложенной МАТЪАВ для задачи распознавания паттернов, представлена на рис. 6.

Авторами была использована следующая информация источника [7] при построении паттернов для распознавания потенциала доходности актива к концу периода:

- цена открытия актива;

- курс доллара на начало торгового дня;

цена на нефть марки Brent на начало торгов; реализованный потенциал предыдущего периода, т. е. факт роста или падения актива за предыдущий период;

прогноз на день по инструменту из открытых источников (на официальных сайтах брокеров и инвестиционных компаний). Эти параметры являются наиболее часто отражаемыми в отчетах аналитиков. Для простоты эксперимента в данном примере рассмотрим распознавание только основных состояний доходности: падения, незначительного изменения и роста. Основные результаты приведены на рис. 7 на основе трех выборок:

- обучающая (Training) - параметры нейронной сети обучаются на этой выборке; проверочная (Validation) - параметры нейронной сети корректируются на этой выборке; тестовая (Testing) - на этой выборке проверяется способность нейронной сети классифицировать данные вне обучающей и проверочной выборок. Параметры нейронной сети никак не изменяются.

Совокупная информация по всем выборкам отображена в итоговой матрице (All Confusion Matrix).

Наихудшие результаты получаются при попытке распознать незначительное изменение доход-

Структура слоя

Рис. 5. Архитектура слоя сети прямого распространения Скрытый слой Выходной слой

Вход

И -ОС

< J

Выход

Рис. 6. Структура двухслойной нейронной сети прямого распространения, созданной в МАТЬАВ

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жгвТЪсЯ те ЪРЛЖкЫ

28 3 0 90,3%

37,8% 4,1% 0% 9,7%

1 8 0 88,9%

1,4% 10,8% 0% 11,1%

0 5 29 85,3%

0% 6,8% 30,2% 14,7%

96,6% 50% 100% 87,8%

3,4% 50% 0% 12,2%

а

5 1 0 83,3%

31,3% 6,3% 0% 16,7%

0 2 0 100%

0% 12,5% 0% 0%

0 2 6 75%

0% 12,5% 37,5% 25%

100% 40% 100% 81,3%

0% 60% 0% 18,7%

7 1 0 87,5%

43,8% 6,3% 0% 12,5%

0 2 0 100%

0% 12,5% 0% 0%

0 1 5 83,3%

0% 6,3% 31,3% 16,7%

100% 50% 100% 87,5%

0% 50% 0% 12,5%

б

40 5 0 88,9%

37,7% 4,7% 0% 11,1%

1 12 0 92,3%

0,9% 11,3% 0% 7,7%

0 8 40 83,3%

0% 7,5% 37,7% 16,7%

97,6% 48% 100% 86,8%

2,4% 52% 0% 13,2%

ке, чем точечное прогнозирование. Следующим этапом развития этого направления может стать улучшение результатов путем подбора наиболее полного набора характеристик паттерна.

Результаты экспериментов

Правильно расположенные паттерны (количество и процент) Неправильно расположенные паттерны (количество и процент)

Соотношение правильно и неправильно расположенных паттернов Итоговый результат

Рис.7. Результатыраспознавания паттернов: а -обучающаявыборка; б - проверочная выборка; в -тестоваявыборка: г - итоговая матрица

ностиактива. Ошибки нейронной сети нарг^ных выборкахприведены в табл. 2. ЗдесьМ8Е (Мест Squared Error) - среднеквадратическая ошибка

1

MSE = -£ e2, n t7

г=1

где п - объемы выборки;

е( - разность фактического и реального значения для момента г.

Метод распознавания паттернов выглядит более привлекательным для использования на практи-

Таблица 2

Основные характеристики сформированной нечеткой нейронной сети

Выборка Размер выборки Доля от общего объема, % MSE Ошибка, %

Обучающая 74 70 6,85500е-2 12,16

Проверочная 16 15 9,91002е-2 12,50

Тестовая 16 15 1,14828е-2 18,75

При проведении экспериментов в качестве значения rдля каждого актива использовались значения, полученные по двум нейросетевым моделям: точечный прогноз и прогноз потенциала доходности. При точечном прогнозе были использованы конкретные значения прогноза доходности. В случае с методом распознавания паттернов результаты, полученные по нейросетевой модели, кодировались следующим образом: при распознавании потенциала падения r.=- 1, при распознавании незначительного изменения r. = 0, при распознавании потенциала роста ri = 1. При этом меры риска рассчитывались по историческим данным о доходностях активов. Эксперименты проводились по данным российского фондового рынка - объединенной биржи ММВБ и РТ С.

Активы, с которыми проводились эксперименты: обыкновенные акции ОАО «Татнефть» (TATN), ОАО «Газпром» (GAZP), ОАО «Ростелеком» (RTKM), ОАО «ВТБ» (VTB), ОАО «Лукойл» (LKOH), ОАО «Полюс Золото» (PLZL), ОАО «Роснефть» (ROSN), ОАО «МТС» (MTSI), ОАО «Сбербанк России» (SBER). Временной период проведения экспериментов - с 01.11.2011 по 01.06.2012. Для оценки соотношения риска и доходности использовался коэффициент Шарпа. Этот показатель по-другому называют коэффициентом «доходность -разброс» (reward-to-variability ratio) и обозначают как RVAR

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: Ш5б7>ЪЯ те ЪР*?жг(Ъ4

Таблица 3

Краткий обзор результатов экспериментов

Модель Доходность за период, % Максимальная просадка, % Коэффициент Шарпа

Использование средних доходностей

Максимизации доходности при ограниченном УаЯ 12 3,75 1,23

Минимизация М8АБ при ограниченной снизу доходности 11 3,45 1,19

Использование точечного прогноза

Максимизации доходности при ограниченном УаЯ 14,2 3,89 1,29

Минимизация М8АБ при ограниченной снизу доходности 12,5 3,51 1,24

Использование прогноза потенциала доходности

Максимизации доходности при ограниченном УаЯ 14,3 4,1 1,22

Минимизация М8АБ при ограниченной снизу доходности 13,1 3,5 1,18

RVAR =

гр - rf

где гр - средняя доходность портфеля за рассматриваемый промежуток времени; у - среднее значение безрисковой ставки; ар - стандартное отклонение доходности портфеля (общий риск).

В качестве безрисковой ставки использовалась доходность государственных облигаций. Статистика максимальной просадки доходности портфеля (этот показатель в последнее время становится все более популярным) представлена в табл. 3.

По полученным результатам можно сделать основной вывод, который заключается в том, что использование прогнозов доходностей в целом позволяет повысить качество инвестиционных портфелей. Модели, в которых были использованы прогнозы доходностей активов, в большинстве случаев обладают лучшим соотношением риска и доходности по сравнению с моделями, где в качестве доходности была использована историческая средняя доходность. Модели, в которых были использованы результаты распознавания паттерна, в некоторых случаях могут обладать повышенным риском. Такая ситуация может произойти, если один или несколько активов будут обладать лучшим

потенциалом. Тогда большая доля портфеля будет состоять из этих активов, что нарушит принцип диверсификации.

Выводы

Результаты экспериментов на данных российского фондового рынка показали, что использование прогнозов на основе нейронных сетей позволяет повысить результативность моделей портфельного инвестирования. При точечном прогнозе цен нейронные сети могут показывать очень хорошие результаты на обучающей выборке. Однако с удалением от обучающей выборки результаты ухудшаются. Это говорит о том, что сеть необходимо периодически переобучать. Использование идеи распознавания паттернов выглядит довольно перспективным. Исследование различных способов составления паттернов может оказаться тоже весьма интересной задачей.

Список литературы

1. ДюкВ., Самойленко А. Data Mining: учебный курс. СПб: Питер, 2001.

2. Зайченко Ю. П. Нечеткие модели и методы в интеллектуальных системах: учеб. пособие. Киев: Слово, 2008.

3. Исавнин А. Г., Галиев Д. Р. Модели портфельного инвестирования с применением асимметричных мер риска и генетических алгоритмов // Финансовая аналитика: проблемы и решения. 2011. № 48.

4. Медведев В. С., Потемкин В. Г. Нейронные сети. MATLAB 6. М.: Диалог-МИФИ, 2002.

5. Международная конвергенция измерения капитала и стандартов капитала: новые подходы (Базель II). URL: http://www.cbr.ru/today/pk/Basel. pdf.

6. Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям. СПб: Питер, 2009.

7. Экспорт данных // Холдинг «Финам». URL: http://www. finam. ru/analysis/profile041CA00007/ default. asp.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Bellman R., Zadeh L. A. Decision making in a fuzzy environment // Management Science. 1970. № 17.

9. Lohre H. Portfolio construction with Asymmetric Risk Measures / H. Lohre, T. Neumann, T. Winterfeldt; Frankfurt am Main: Union Investment. 2007.

10. Michaud R. The Markowitz Optimization Enigma: Is «Optimized» Optimal? / R. Michaud, O. Richard // Financial Analysts Journal. 1989. № 1.

58

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жгвТЪсЯ те ЪРЛЖгеЫ

i Надоели баннеры? Вы всегда можете отключить рекламу.