Е.С. Герасимов, В.В. Домбровский
АДАПТИВНОЕ УПРАВЛЕНИЕ ИНВЕСТИЦИОННЫМ ПОРТФЕЛЕМ
Рассматривается задача оптимального управления инвестиционным портфелем (ИП). Структура ИП в пространстве состояний описывается системой разностных уравнений со случайными скачкообразно меняющимися параметрами. Параметры уравнений изменяются в соответствии с эволюцией дискретной марковской цепи. Предлагается алгоритм управления ИП с использованием адаптивной фильтрации параметров уравнений, описывающих структуру ИП. Приводятся результаты численного моделирования.
Проблема оптимального управления ИП является одной из центральных задач финансовой инженерии. В последние десятилетия активно развивались различные подходы к решению данной проблемы [1 - 9].
В работах [10, 11] предложена динамическая модель управления ИП в пространстве состояний. Структура ИП описывается в виде динамической стохастической сети, узлы которой представляют капитал, помещенный в данный рисковый или безрисковый финансовый актив, а дуги - направления и объем капитала, перераспределяемого между активами. Задача управления ИП формулируется как динамическая задача слежения по квадратичному критерию за некоторым, задаваемым инвестором, портфелем, имеющим желаемую доходность (гипотетическим эталонным портфелем). В качестве модели эволюции цен рисковых активов (акций) в [10,11] принята классическая модель геометрического (экономического) броуновского движения Блэка -Шоулса [7], в которой параметры уравнений, описывающих динамику цен, не случайны.
В данной работе предполагается, что цены рисковых активов описываются стохастическими разностными уравнениями со случайными скачкообразно меняющимися параметрами. Параметры уравнений изменяются в соответствии с эволюцией дискретной марковской цепи. Подобные модели учитывают случайные изменения как волатильности, так и доходности, характерные для финансовых рынков и относятся к классу моделей неполного рынка [7, 12 - 17], которые более адекватно описывают изменения цен, наблюдаемые на реальных финансовых рынках. Предлагается алгоритм управления ИП с использованием адаптивной фильтрации параметров уравнений, описывающих структуру ИП. Приводятся результаты численного моделирования.
ОПИСАНИЕ МОДЕЛИ ИП И ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ
Рассмотрим ИП, состоящий из п видов рисковых активов (ценные бумаги и их производные), доходность которых является случайной величиной, и безрискового актива (банковский счет, надежные облигации) с неслучайной, но, возможно, переменной доходностью. Управление портфелем осуществляется путем перераспределения капитала между различными видами инвестиций посредством банковского счета.
Предполагается, что цены рисковых активов описываются стохастическими разностными уравнениями со случайными скачкообразно меняющимися параметрами. Параметры уравнений меняются в соответствии с эволюцией дискретной марковской цепи с известной матрицей переходных вероятностей. Эволюция цен рисковых финансовых активов описывается разностными уравнениями вида
St (k +1) = St (k)
1 + h (k, 0k) + X CTy (k, 0k)® j (k)
j=i
(1)
характеризует норму возврата (коэффициент роста); а(к) - некоррелированная случайная гауссовская
последовательность с нулевым средним и единичной дисперсией; 9к - марковская цепь с дискретным временем и конечным множеством наблюдаемых состояний = {а1,..., аV }, которая описывается следующей
матрицей вероятностей перехода:
Р = [Ру ] Ру = РгоЬ{9к+1 = а}- I 9к = а }
I, } = 1,..., V.
Здесь р{ = РгоЬ{90 =аг-}, I = 1,...,V - начальное распределение; ст(к, 9к) = [стгу (к, 9к)] - матрица волатильности (изменчивости), где Сту (к, 9к) - известная функция 9к . Процессы а(к) и 9к независимы. Модель цен со скачкообразной волатильностью рассматривается в работах [12 - 14, 17].
Пусть х(к) е Яп+1 - вектор состояния ИП, компоненты которого равны объему инвестиций в I -й актив, I = 1,...,п +1; компонента хп+1(к) описывает состояние банковского счета. Тогда, учитывая (1), эволюция рисковых вложений описывается уравнениями
X (k + 1) = 1 + Цг (k, 0k ) + X (k, 0k )Ю j (k)
_ j=1
х[x (k) + щ (k)] , эволюция банковского счета следует уравнению
Xn+1(k + 1) = [1 + Г (k)]
Xn+1 (k) -X Ui (k)
(2)
(3)
где r (k) - доходность банковского счета. Если щ (k) > 0, то это означает перевод капитала в сумме щ (k) с банковского счета в i-й вид рисковых вложений, если щ (k) < 0, то - перераспределение капитала с i -го рискового вложения на банковский счет. В результате выбора управляющих воздействий щ (k)
происходит перераспределение капитала между рисковыми инвестициями и банковским счетом и посредством банковского счета - между различными видами рисковых инвестиций. Заметим, что в предложенной модели ИП не накладывается явных ограничений на управления. Кроме того, допускаются отрицательные значения переменных состояния Xi (k), i = 1,..., n +1: если какая-либо переменная хг (k) < 0, i = 1,., n, то это означает участие в операции «short sale» (продажа без покрытия) [7], если xn+j (k) < 0 , то - заем капитала
где (к) - цена / -го рискового актива; цг- (к, 9к) - в сумме | хп+1(к )|. Поскольку предполагается, что
рынок функционирует без «трения», то все сделки производятся в момент времени к в соответствии с вектором управления и(к) є Яп .
Определим стратегию управления ИП путем перераспределения капитала между различными видами инвестиций так, чтобы капитал реального портфеля с наименьшими отклонениями (с минимально возможным риском) следовал капиталу некоторого определяемого инвестором эталонного портфеля, эволюция которого описывается уравнением
к 0(к +1) = [1 + |0(к )]У 0(к), (4)
где |0(к) - задаваемая инвестором (желаемая) доходность портфеля. В качестве меры риска выберем квадратичный функционал вида
V -1
¥ = М{ X [(V0(к) - V(к))2 +
к=0 (5) +ит (к) Я (к, 0к )и (к)] + (V0 (^) - V (^ ))2},
где V(к) = Сх(к) - общий капитал управляемого
портфеля, С = (1,...,1), Ст єЯп+'; матрица
Я(к, 0к) є Япхп положительно определена, начальный
капитал V(0) = V0 (0); ґу - горизонт инвестирования.
Первое слагаемое обеспечивает качество слежения так, чтобы суммарный капитал управляемого портфеля с минимальными отклонениями следовал за капиталом эталонного портфеля, второе слагаемое в функционале (5) учитывает ограничения, связанные с управлением портфелем. Путем выбора элементов матрицы Я(к, 0к) ограничивают амплитуду (мощность) управляющих воздействий и (к), накладывая
«штраф» на большие управления. К сожалению, формальных правил формирования весовых матриц Я(к, 0к) в критерии (5) не существует. Как правило, на практике матрица Я(к, 0к) выбирается диагональной исходя из характера решаемой задачи.
Введем расширенный вектор состояния ИП
г(к) = [хт (к), V0(к)]т є Яп+2; Тогда, используя (2), (3) и (4), запишем уравнение динамики г (к) как
г (к +1) = А (к, 0к) г (к) + В0 (к, 0к )и(к) +
+Х [ А (к, 0к) г (к) + В} (к, 0к )и (к )]ю} (к), (6)
і=1
где матрицы А (к, 0к) є Яп+2хп+2, В} (к, 0к) є яп+2хп, і = 0,..., п имеют следующую структуру:
А ( 0к) = ¿іа§ І1+І1 ( 0к),...,
1 + 1 (к, 0к ),1 + г (к ),1 + |0(к)}
Аі (к,0к) = ¿іая{ст1 ^ (к,0к),...,стпу (к,0к),0,0},
а(к,0к) ст і (к, 0к)
В0 (к, 0к ) = -Ь(к) , В і (к, 0к ) = 0Т
_ 0тп _ _ 0Т _
а(к, 0к) = І1 +1 (к, 0к ) ,...,1 +1п (к, 0к )} , Ь(к) = [1 + г (к),...,1 + г (к)],
ст; (к, 9к) = а!аё{ст1; (к, 9к) ^ Стп; (к, 9к)} ,
1 = 1,., п, 0п е Яп - нулевой вектор-столбец, символ Т означает транспонирование. Система (6) относится к классу гибридных систем (систем со случайной структурой) с мультипликативными шумами.
Определим закон управления в классе линейных с обратной связью по расширенному вектору состояния ИП в следующем виде:
и (к) = К (к, 9к) 2(к), (7)
где К (к, 9к) - матрица коэффициентов обратной связи.
Перепишем функционал (5) как
V ‘/-1
У=*1 [ х (СТ СР (к, аг) +
¿=1 к =0
+КТ (к, аг) Я(к, аг) К (к, аг) Р(к, аг))] + (8)
+СТСР(//, аг)),
где 1г(*) - след матрицы; С = [С, -1];
Р(к, а,) = Е^(к)2Т (к)I(9к =аг)}
- матрица вторых моментов для I -го состояния (при 9к =а,) системы (6), определяется следующей системой взаимосвязанных разностных матричных уравнений:
V п
Р(к +1, а,) = X [X (А1 (к, а,) + Б} (к, а, )К(к, а,)) х
1=1 1=0 (9)
хР(к, а, )(А; (к, а,) + Б] (к, а,)К (к, а, ))Т ] р,г.
Таким образом, задача управления системой (6) сводится к эквивалентной задаче управления детерминированной системой, описываемой матричным уравнением динамики вторых моментов состояний (9), матрицей К (к, 9к) в качестве управляющих воздействий, критерием оптимальности (8). Применяя для ее решения принцип максимума в матричной формулировке [19], получим следующую систему взаимосвязанных разностных матричных уравнений для определения оптимальной стратегии управления:
К (к, а,) = -[Я(к, а,) +
п
+Х БТ (к, а,)Н(к +1, а, )Б; (к, а, )]-1 х (10)
1=0
п
х[ X БТ (к, а,)Н(к +1, а, )А} (к, а,)];
1=0
п
Н (к, а,) = X (А;- (к, а,) + Б(к, а,) К (к, а, ))Т х
_ ;=0
хН (к +1, а, )(А;- (к, а,) + Б}- (к, а,)К (к, а,)) +
+КТ (к, а,)Я (к, а,) К (к, а,) + СТ С, (11)
V
Н (к +1, а,) = X Н (к +1, а,) ра,
,=1
Н(//,а,) = СТС, г' = 1,.,V.
Условием реализации полученной стратегии управления ИП является возможность наблюдения состояний марковской цепи. На практике эти состояния непосредственно не наблюдаются, поэтому необходим алгоритм для их оценки.
АДАПТИВНЫЙ АЛГОРИТМ ФИЛЬТРАЦИИ МАРКОВСКОЙ ЦЕПИ ПО НАБЛЮДЕНИЯМ ЗА ЦЕНАМИ АКТИВОВ
Рассмотрим марковскую цепь 9к с дискретным множеством состояний ЭТ = {а1,.,а^,} и матрицей
V
переходных вероятностей Р = [Ру ], X Рц = 1 . Пред-
i=1
полагается, что состояние цепи не наблюдается, а наблюдается процесс у(к) е Яп , каждая компонента которого описывается следующим уравнением динамики:
Уi(к +1!) = [ц,(к, 9к)+ст,(к, 9к)а,(к)] ,
,, п % (к +1) - % (к)
где у, (к +1) = —-------- -----доходность , -го рис-
% (к)
кового актива за период [к, к +1].
Пусть д(к) е Я'' - вектор апостериорных вероятностей марковской цепи, каждая компонента которого
Ч (к) = Р{9к = а, I у (к)}, X Ч (к) = 1. Согласно [18],
, =1
д, (к) и оценки величин р^ , ц, (к, 9к), ст, (к, 9к) можно получить, вычисляя следующие выражения:
X & (у (к))
Аг (к, а г) =
СТ і (к, а г) =
X Г (к)
X Сг ((у (к ))2)
X г (к)
2|г (к, а г )Х °г (у г (к))
(12)
+ (| (к, аг))
Р*г =
д(к) = -
X ^ (к) X Г (к) ’
X (к)
і = 1,
где
X X (к)’
X (к) = X X (к - 1)Гг (у(к)) Р;
(13)
Ог (*(к)) = X СЇ (*(к - 1))Гг (у (к)) Рг +
г =1
+Хг (к - 1Мк )Гг (у(к)) Рг;
/г (к) = X Х(к - 1)Гг (у( к)) Р +
г =1
+Хг (к - 1)Гг (у (к)) Рг;
(к) = X (к - 1)Гг (у(к)) Рг +
г =1
+Хг (к -1) Рг Гг (у (к ))е*;
ехр
{ у> (к) - (у> (к) -І1 (к, аг ))2 "I
Гг (у( к)) = П-
1=1
2(ст, (к, аг))
ст 1 (к, а г)
векторы X(к), Ог (^(к)), Зг (к), Ыг* (к), Рг, е* є Яv ; Рг - г-й столбец матрицы переходных вероятностей; е* - *-й столбец единичной матрицы, X V
означает сумму элементов вектора V .
Полностью алгоритм адаптивной фильтрации выглядит следующим образом:
1. Полагаем к = 1, выбираем начальные значения
Ч (к -1), Ргі, | (к, аг), СТг (к, аг), X (к -1) = ч(к -1),
Ог (*(к)) = X (к -1) *(к )Гг (у(к)) Рг,
Г (к) = X (к - 1)Гг (у(к))Рг,
Хг* (к) = X (к -1) р^ Гг (у(к ))е*.
2. По наблюдениям (к), Бі (к -1) вычисляем вектор у(к).
3. По формулам (12) находим оценки I(к,аг),
СТг (k, аг ), ргі .
4. Подставляя полученные оценки на предыдущем шаге, по формуле (13) находим вектор апостериорных вероятностей ч(к).
5. Полагаем к = к +1,
Ргі = ргі , I (к, а г ) = А г (к - 1, аг ) ,
стг (к, аг) = естг (к -1, аг), стX(к) = ч(к -1),
переход на шаг 2. При этом переменные г, *, г, меняются в пределах і = 1,...,п; *,г = 1,...,V.
АЛГОРИТМ АДАПТИВНОГО УПРАВЛЕНИЯ ИНВЕСТИЦИОННЫМ ПОРТФЕЛЕМ
Управление (7) будем называть адаптивным, если иа (к) = КГ(к, 0к) г (к), (14)
где К (к, 0к) - матрица коэффициентов обратной связи, вычисленная по уравнениям (11) с использованием оценок параметров уравнения (6), которые получены по предыдущим наблюдениям вектора у(к). Одним из условий использования подхода к управлению системой (6) и рассматриваемого здесь является наблюдаемость состояния марковской цепи 0к . Поскольку наблюдается только вектор у(к), предлагается определять состояние цепи 0к в момент к из условия максимума апостериорной вероятности:
0к = аг Чг (к) = Р{0к = аг I у(к)} =
(15)
= тах
і
пах^Р{0к = а і | у (к)}}.
і, *, г = 1,
, V;
Адаптивный алгоритм управления ИП состоит из следующих шагов:
1. Рассматривается период времени [Ы0, N], к0 -
текущий момент времени, t/ < N, N0 выбирается так, чтобы наблюдений вектора у(1), I е [N,3, к0 ], было достаточно для оценки параметров (например t/ -к0 > к0 -N0), к = к0.
2. Выбираем горизонт инвестирования /, желаемую доходность ц0 (к) и задаем матрицу Я(к, 9к).
г =1
3. По предыдущим наблюдениям вектора
у(I), I е [N0, к] вычисляем оценки ц, (к, а г),
ест, (к, аг), ру , используя адаптивный алгоритм
фильтрации марковской цепи.
4. Вычисляем матрицы КГ(к,а,), , = 1,.,V, и
вектор апостериорных вероятностей д(к), используя оценки параметров, полученные на предыдущем шаге.
5. Определяя состояние цепи 9к в момент к из условия (15), вычисляем вектор управления по формуле (14).
6. Полагаем к = к +1, д(к) = Рд(к -1), если
к > t/, переход на шаг 2 и сдвиг рассматриваемого периода времени на t/ - к0, иначе переход на шаг 5.
ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ
Рассмотрим портфель, состоящий из четырех рисковых активов и одного безрискового актива с доходностью г = 0,00026 . Предполагается, что рынок может находиться в двух состояниях (V = 2 ). Эволюция цен рисковых активов описывается упрощенным вариантом уравнений (1)
% (к +1) = % (к) [1 + ц (к, 9к) + ст, (к, 9к К (к)] (16) со следующими параметрами:
ц1(к, а1) = 0,005; ц2(к, а1) = 0,006;
ц3(к, а1) = 0,004; ц4(к, а1) = 0,0065;
ц1(к, а2) = 0,006; ц2(к, а2) = 0,0065;
ц3(к, а2) = 0,007; ц4(к, а2) = 0,0075;
ст1(к, а1) = 0,002; ст1(к, а2) = 0,004;
ст2 (к, а1) = 0,0025; ст2 (к, а2) = 0,0035;
ст3(к,а1) = 0,0015; ст3(к,а2) = 0,0045; ст4(к, а1) = 0,002; ст4(к, а2) = 0,006.
Марковская цепь 9к описывается следующей матрицей переходных вероятностей:
' 0,9 0,2 л 0,1 0,:
Р =
= а,.
Рис. 2. Динамика доходностей рисковых активов
Согласно процедуре алгоритма адаптивного управления ИП, выбираем горизонт инвестирования
ґу = 100 , желаемую доходность |0(к) = 0,005 и матрицу
Я(к, аг) = Ша§{0,0075;0,0075;0,0075;0,0075}, і = 1,2.
к0 = 50, к = к0, V(к) = V0 (к) = 100.
По наблюдениям вектора у(І), І є [0, к], были получены оценки параметров уравнений (16):
| (к, а1) = 0,00679665; |2 (к, а1) = 0,00534375;
|3 (к, а1) = 0,00401755; |4(к,а1) = 0,00596445;
| (к, а2) = 0,00597472; |2(к, а2) = 0,006151;
|3(к,а2) = 0,00457175; |4(к,а2) = 0,0058537;
<ст (к, а1) = 0,00168285; <ст1 (к, а2) = 0,0021681;
<ст2 (к, а1) = 0,00250223; <ст2(к, а2) = 0,00292732;
<ст3 (к, а1) = 0,00136988; <ст3(к, а2) = 0,00191051;
<ст4(к,а1) = 0,00093735; <ст4(к,а2) = 0,00133539
и матрицы переходных вероятностей
Р = (0,85710385 0,4947896
На периоде времени [0,100] были смоделированы наблюдения цен рисковых активов. На рис. 1 и 2 приводится динамика доходностей рисковых активов.
0,14289615 0,5052104/
Используя полученные оценки, вычислили матрицы коэффициентов обратной связи КС (к, а,), , = 1,2 и
вектор апостериорных вероятностей
0,7415369 0,2584631]'
Рис. 1. Динамика доходностей рисковых активов
Из условия (15) определяем, что 0к = а1. Далее вычисляем адаптивный закон управления, подставляя КГ (к, а1) в (14).
Таким образом, было получено управление ИП на периоде [50,100]. На рис. 3 приводится динамика капиталов эталонного и управляемого портфелей. На рис. 4 отображена эволюция активов управляемого портфеля.
Полученные результаты численного моделирования подтверждают эффективность и работоспособность предложенного адаптивного алгоритма.
Г (к)
V(k)
10i
xfi) x2(k)5(j ДІ3(І) х4(іг) x,(k) ‘
100
50
к
Рис. 3. Динамика капиталов эталонного и управляемого портфелей.
100
50
к
100
Рис. 4. Эволюция активов управляемого портфеля
ЛИТЕРАТУРА
1. Markowitz H. Portfolio Selection // J. Finance. 1952. V.7. No. 1. P. 77-91.
2. Tobin J. Liquidity Preference as Behavior Towards Risk // Rev. Econom. Stud. 1958. V. 26. No. 1. P. 65-86.
3. YoungM.R. A Minimax Portfolio Selection Rule with Linear Programming Solution // Management Science. 1998. V. 44. No. 5. P. 673-683.
4. Dupakova J. Portfolio optimization via stochastic programming: Methods of output analysis // Mathematical Methods of Operations Research. 1999. No. 50. P. 245-270.
5. Kellerer H., Mansisni R., Speranza M. G. Selecting Portfolios with Fixed Costs and Minimum Transaction Lots // Annals of Operations Research. 2000. V.99. P. 287-304.
6. Golub B., Holmer M., McKendall R., et al. A Stochastic programming model for money management // European Journal of Operational Research. 1995. V.85. P. 282-296.
7. MertonR.C. Continuous-time Finance. Cambr. Ma. Blackwell. 1990.
8. Kushner H.J. Consistency Issues for Numerical Methods for Variance Control with Applications to Optimization in Finance // IEEE Transactions on Automatic Control. 1999. V.44. No. 12. P. 2283-2296.
9. BillioM., PellizonL. Value-at-Risk: a multivariate switching regime approach // J. of Empirical Finance. 2000. No. 7. P. 531-554.
10. Dombrovsky V.V., Gerasimov E.S. Dynamic Network Model of Control Investment Portfolio in Continuous Time // Proceedings of the 5th Korea-Russia International Symposium on Science and Technology. Tomsk. Russia. 2001. V. 2. P. 304-308.
11. Герасимов Е.С., Домбровский В.В. Динамическая сетевая модель управления инвестиционным портфелем при квадратичной функции риска // Автоматика и телемеханика. 2002. № 2. C. 119-128.
12. Herzel S. A Simple model for option pricing with jumping stochastic volatility // International Journal of Theoretical and Applied Finance. 1998. V. 1. No. 4. P. 487-505.
13. Cvitanic J., Liptser R., Rozovskii B. Tracking volatility // Proceedings 39-th IEEE Conference on Decision and Control. 2000. P. 1189-1193.
14. Cajueiro D. O., Yoneyama T. Optimum portfolio choice for a class jump stochastic models // Proceedings of the 15th Triennial World Congress. Barselona. Spain. IFAC 2002.
15. Ширяев А.Н. Вероятностно-статистические модели эволюции финансовых индексов // Обозрение прикладной и промышленной математики. 1995. Т. 2. № 4. C. 527-555.
16. BrandtM.W., Sant-Clara P. Simulated likelihood estimation of diffusions with an application to exchange rate dynamics inincomplete markets // J. of Financial Economics. 2002. No. 63. P. 161-210.
17. Elliott R.J., Malcolm W.P. , Tsoi A.H. Robust parameter estimation for asset price models with Markov modulated volatilities // J. of Economic Dynamics and Control. 2003. V. 27. No. 8. P. 1391-1409.
18. Elliott R.J. Exact adaptive filters for Markov chains observed in Gaussian noise // Automatica. 1994. No. 30. P. 1399-1408.
19. Athans M. The Matrix Minimum Principle // Inform. Control. 1968. V.11. P. 592-606.
Отарья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики и кафедрой математических методов и информационных технологий в экономике экономического факультета Томского государственного университета, поступила в научную редакцию 30 апреля 2003 г.