Научная статья на тему 'Оптимальное управление в задаче портфельного трекинга с учетом временных предпочтений инвестора'

Оптимальное управление в задаче портфельного трекинга с учетом временных предпочтений инвестора Текст научной статьи по специальности «Математика»

CC BY
95
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОРТФЕЛЬ / PORTFOLIO / СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ / STOCHASTIC CONTROL / ЭТАЛОННАЯ ТРАЕКТОРИЯ / REFERENCE PATH / ДИСКОНТИРОВАНИЕ / DISCOUNTING / БЕСКОНЕЧНЫЙ ГОРИЗОНТ ПЛАНИРОВАНИЯ. / INFINITE-TIME HORIZON

Аннотация научной статьи по математике, автор научной работы — Паламарчук Екатерина Сергеевна

Рассматривается задача оптимального управления портфелем активов с целью приближения текущего капитала к эталонной безрисковой траектории. Сравнение стратегий производится с учетом временных предпочтений инвестора. Исследован вопрос о стохастической оптимальности закона управления, минимизирующего ожидаемые долгосрочные потери. Определен вид асимптотической верхней оценки (с вероятностью единица) для разности целевых функционалов на оптимальном и произвольном допустимом управлениях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Паламарчук Екатерина Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stochastic optimality in the portfolio tracking problem involving investor’s temporal preferences

We consider an optimal portfolio problem to approximate a risk free reference portfolio. Portfolio management strategies are compared accounting for investor’s temporal preferences. We investigate stochastic optimality of the strategy, which minimizes the expected long-run cost, providing an asymptotically upper estimate (almost surely) of the difference between values of the objective function for the optimal strategy and for any admissible strategy.

Текст научной работы на тему «Оптимальное управление в задаче портфельного трекинга с учетом временных предпочтений инвестора»

УДК 517.977.5 + 519.856 ББК 32.81

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЗАДАЧЕ ПОРТФЕЛЬНОГО ТРЕКИНГА С УЧЕТОМ ВРЕМЕННЫХ ПРЕДПОЧТЕНИЙ ИНВЕСТОРА1

Паламарчук Е.С.2

(Центральный экономико-математический институт РАН,

Москва,

Национальный исследовательский университет «Высшая школа экономики», Москва)

Рассматривается задача оптимального управления портфелем активов с целью приближения текущего капитала к эталонной безрисковой траектории. Сравнение стратегий производится с учетом временных предпочтений инвестора. Исследован вопрос о стохастической оптимальности закона управления, минимизирующего ожидаемые долгосрочные потери. Определен вид асимптотической верхней оценки (с вероятностью единица) для разности целевых функционалов на оптимальном и произвольном допустимом управлениях.

Ключевые слова: портфель, стохастическое управление, эталонная траектория, дисконтирование, бесконечный горизонт планирования.

1 Работа выполнена при финансовой поддержке РФФИ, грант №1001-00767, гранта Правительства РФ для поддержки научных исследований под руководством ведущих ученых (договор 14.A12.31.007 от 15.07.13).

2 Екатерина Сергеевна Паламарчук, кандидат физико-математических наук, и.о. старшего научного сотрудника ([email protected], 117418, Москва, Нахимовский пр., д. 47, тел. (495) 999-27-20).

Управление большими системами. Выпуск 56 Введение

Управление портфелем активов является одной из центральных задач финансовой математики. Ее формализация тесно связана с проблемой моделирования составляющих портфеля и выбора критерия, позволяющего сравнивать различные стратегии. Широко распространен подход, при котором для описания динамики рисковых активов используется геометрическое броуновское движение, а сам портфель рассматривается в виде линейного управляемого случайного процесса (см., например, [9]). При выборе критерия оптимальности отметим возможность как «статической», так и «динамической» постановки задачи оптимизации. В первом случае может проводиться максимизация ожидаемой полезности терминального капитала [9, Раздел 3], хеджирование обязательств [10], минимизация дисперсии портфеля в конечный момент времени при фиксированном среднем [17] и др.

Динамический подход, применяемый в данной работе, включает построение интегральных целевых функционалов. При этом делается акцент на различных мотивах поведения инвестора. Мы будем выделять несколько факторов, оказывающих влияние на формирование критерия оптимальности. Во-первых, это наличие эталонной безрисковой траектории изменения стоимости портфеля [2, 11, 12] и стремление приблизиться к ней. Заметим, что вполне допускается неограниченное возрастание такой функции со временем, например, по экспоненте (см. [14]), а любые отклонения текущего капитала рассматриваются как потери [2, 14]. Во-вторых, у агента существуют временные предпочтения, влияющие на оценку затрат в разные моменты времени, что выражается в дисконтировании будущих значений [5]. Учет перечисленных выше особенностей в полной мере реализуется путем введения интегрального квадратичного целевого функционала, включающего дисконтирующую функцию и траекторию эталонного портфеля. Далее производится поиск стратегии инвестирования, обеспечивающей минимальное значение ожидаемых потерь на больших интервалах планирования. Отметим, что математиче-

ской основой сформулированной таким образом задачи управления портфелем является теория стохастических линейных регуляторов с зависящим от управляющих воздействий аддитивным шумом [8, 16]. Найденные законы управления будем называть оптимальными в среднем. В работах [2], [16, Глава 6] изучалась проблема инвестирования с целью отслеживания (т.е. трекинга) плановой траектории на конечном интервале при отсутствии дисконтирования. Для случая портфеля с постоянными параметрами и критерия, содержащего экспоненциальную дисконтирующую функцию, оптимизация на бесконечном горизонте без включения трансакционных издержек осуществлялась в [14, 15]. Целью данной работы является нахождение управления, оптимального в среднем на бесконечном интервале времени при формировании портфеля с учетом эталонной траектории изменения капитала и временных предпочтений агента, а также анализ полученной стратегии с точки зрения ее стохастической оптимальности. При изучении стохастической оптимальности происходит сравнение целевых функционалов не в среднем по множеству реализаций, а на отдельно взятой траектории случайного процесса. Для линейных стохастических систем стандартного вида такой анализ проводился в [1, 4, 5]. В целях исследования стохастической оптимальности вводится процесс разности целевых функционалов на оптимальном в среднем и произвольном допустимом управлении. В работе будет найдена верхняя оценка для этого процесса в виде детерминированной функции. Далее статья организована следующим образом. В разделе 1 проводится описание модели и постановка задачи поиска оптимального управления. Основные результаты по определению этой стратегии и доказательству оптимальности находятся в разделе 2. Раздел 3 посвящен выводу достаточных условий на параметры системы для проверки требований в основных утверждениях раздела 2.

1. Описание модели и постановка задачи

Рассмотрим самофинансируемый портфель, состоящий из п активов. Предполагается, что имеется полное вероятностное про-

125

странство (Q, F, P) и все исследуемые в дальнейшем случайные процессы определены на нем. Цена для i-го рискового актива (i = 1, n — 1) задается геометрическим броуновским движением

< (i) (i)\

с переменными параметрами (щ ), т.е.

(i) (i)

(1) dSit = ßt Sit dt + иt 'Sitdwit, Si0 = sM,

где wit, t ^ 0, - одномерный стандартный винеровский процесс, si0 - начальное значение цены, предполагаемое неслучайным; процессы wit и Wjt - независимы (i = j), t ^ 0.

Динамика безрискового актива Snt, имеющего доходность rt ,t ^ 0, описывается уравнением

(2) dSnt = rtSnt dt, Sno = snQ,

где rt - ограниченная функция, sn0 - цена безрискового актива

(i)

в начальный момент времени. Предположим, что rt < ßt для любого рискового актива i из портфеля.

Предположим, что инвестор, обладая начальным капиталом x > 0, распределяет его между различными видами активов и формирует портфель. В каждый момент времени инвестор принимает решение о вложениях в те или иные виды активов, цены которых изменяются согласно (1)-(2), соответственно меняя и общий капитал портфеля Xt. Нетрудно показать (см. [9, с. 10-11]), что стоимость портфеля Xt в момент времени t представляет собой одномерный управляемый случайный процесс с динамикой

(3) dXt = rt Xtdt + BtUtdt + Uj-Ctdwt, Xo = x,

где вектор-строка Bt = (ß^ — rt, i = 1,n — lj , матрица Ct = ^diag(a[%i)), i = 1,n — lj; в качестве (^diagfa^), i = 1,n — 1) мы обозначили (n — 1) x (n — 1)-диагональную

матрицу с элементами диагонали at(i), i = 1,n — 1; wt, t ^ 0 -(n — 1)-мерный стандартный винеровский процесс с компонентами wit, i = 1,n — 1; Ut, t ^ 0, - допустимое управление, т.е. (n — 1)-мерный случайный процесс, согласованный с фильтрацией Ft = a{ws, s ^ t}, такой что существует решение (3). Отметим, что Uit определяет величину вложений в i-й рисковый актив в момент времени t (Uit может быть любого знака, отрицательное значение Uit означает заимствование). При этом 126

п— 1

размер безрисковых инвестиций равен Хь — ^^ иц. Множество

г=1

допустимых управлений обозначим и.

Инвестор определяет стратегию вложений иь для приближения своего портфеля к эталонному безрисковому портфелю Уь, задаваемому уравнением

(4) йУг = рьУь <И, Уо = х,

где рь - ограниченная функция времени, определяющая доходность безрискового портфеля. Очевидно, что имеет смысл рассматривать ситуацию рь > гь, £ ^ 0. Таким образом, на рынке отсутствует безрисковый актив с доходностью эталонного портфеля, и инвестор вынужден осуществлять рискованные вложения с целью достижения траектории Уь.

Стратегия управления оценивается с помощью интегрального квадратичного функционала [2, 12], учитывающего потери из-за отклонения портфеля от эталонного, а также издержки по управлению. В данной работе оценка потерь, относящихся к разным моментам времени, производится с учетом временных предпочтений инвестора. Подробнее о феномене временных предпочтений и его связи с дисконтированием см. в статье [5].

Целевой функционал за плановый период [0, Т], таким образом, имеет вид

(5) 1т(и) = [ / ■ [д(Хь — Уь)2 + 41 ии] <1,

о

где и € и - допустимое управление; 4,41 > 0 - константы; /ь -дисконтирующая функция, отражающая временные предпочтения инвестора.

Предположение V. Дисконтирующая функциия

/ > 0, £ ^ 0, не возрастает, дифференцируема, /0 = 1. Ставка дисконтирования фь = — /ь//ь ограничена для £ ^ 0 и

(6) У /ь(Уь)2 <1 < те.

о

Условие (6) означает конечность интегральной меры дисконтированного отклонения эталонного безрискового портфеля от нуля на неограниченном временном интервале.

Заметим, что Jt(U), имеющий вид (5), также носит название функционала риска [2, 10], а подынтегральное слагаемое ЩЩ подчеркивает нежелательность рисковых вложений с точки зрения инвестора.

Рассмотрим задачу

(7) lim sup EJt(U) ^ inf .

t —те и ем

Такая задача управления (7) для системы (3), (5) ранее исследовалась в [14, 15] в случае постоянных параметров портфеля при экспоненциальном изменении дисконтирующей функции ft = e-Yt (y > 0) и эталонной траектории Vt = ept (р > 0), а также отсутствии слагаемого Ut'Ut в целевом функционале (5). Использованные при анализе методы основывались на указанных ограничениях коэффициентов модели и не могут быть распространены на общий случай, рассматриваемый в данной работе.

Замечание 1. Для задач управления портфелем вида (7) на множество допустимых управлений U обычно накладываются дополнительные ограничения, см. [8, 15]. Например, рассматри-

те

ваются только управления, такие что J E||Ut||2 dt < ж (У ■ || -

о

матричная евклидова норма), или же управления, обеспечивающие устойчивость в среднем квадратичном соответствующего им

процесса Xt, т.е. lim E(Xt)2 = 0. t—

Мы не предъявляем дополнительных требований к асимптотическим свойствам процессов и управлений, рассматриваемых в качестве допустимых. Ниже сформулируем условия, которые гарантируют существование U*, являющегося решением задачи

(7).

Для приведения функционала (5) к стандартному виду, не содержащему траектории Vt и дисконтирующей функции ft, сделаем замену переменных

(8) Xt = fXt - Vt), Ut = л/ftUt.

Тогда уравнение управляемого случайного процесса преобразуется к

(9) dXt = UtXtdt + Bt Utdt + ltdt + Ü^Ctdwt, Xo = 0,

где

(10) п = п - (1/2)фг, и = лДь(п - Рь)У. Запишем целевой функционал в новых переменных:

(11) Зт(и)= [ [дХ? + д^Щ (Ь.

Jo

Отметим, что З т(и) = Зт(и). Предположение Р.

а) Функции п, Въ, Съ, Ь ^ 0, таковы, что существует абсолютно непрерывная ограниченная функция П ^ 0, Ь ^ 0, удовлетворяющая обобщенному уравнению Риккати

(12) П + 2пП - П + д = 0,

где Щ = д11п-1 + СП; матрица 1п-1 - единичная матрица размера (п - 1) х (п - 1).

б) Фундаментальная матрица Фа(Ь, 8) для функции Аг = П - ВгЁ-1В'гП + (1/2)ВгК-1С?П-1В[П? допускает экспоненциальную оценку

(13) \\Фа(Ь,В)\\ < К1е-К2(г, 5 < Ь, при некоторых положительных константах К1, К2 > 0. Напомним, что фундаментальная матрица Фа(Ь,э) для функции Аг находится из решения задачи -—-= АгФа(Ь,5),

Фа(5, 5) = 1. Если Фа(Ь, 5) допускает оценку вида (13), то Аъ называется экспоненциально устойчивой. Так как в данном случае система одномерная, то выражение для Фа(~Ь, 8) при Аъ, определенной в п.б), можно выписать в явном виде:

Фа(Ь, 5) =

г

= вхр! (гV - В^иЁ-1В'€П + (1/2)Вьп-1 С2Ё-1В'ЮП2) (V.

Б

2. Основные результаты

2.1. РЕШЕНИЕ ЗАДАЧИ МИНИМИЗАЦИИ ОЖИДАЕМЫХ ПОТЕРЬ

Теорема 1. Пусть выполнены предположения V и Р. Тогда оптимальное управление в задаче (7) имеет вид

(14) и; = -Щ1В[(Пх; - ПУ + Ш/Г),

где процесс X; задается уравнением

(15) dx; =

= (rt-BtR-1 B'tnt)X*tdi+BtR-lB't lt di+(rt-ntXt*)ßtR-lCtdwt с начальным условием X0 = x,

(16) lt = UtVt - mt//ft,

oo

(17) mt = j /f^(s,t)Us(rs - Ps)Vs ds,

t

при этом $(t, s) - фундаментальная матрица для функции Г t - BtR-lB[nt.

Для доказательства теоремы 1 нам потребуются два вспомогательных утверждения.

Лемма 1. Пусть выполнены условия теоремы 1. Тогда для функции mt

а) lim mt = 0 ;

t—

б) существует константа cm > 0, такая что для любого t ^ 0 справедлива оценка

t / t \

j m2s ds ^ cm ¡1 + J ¡Si ds

где функция 1г определена в (10).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. Функция тг является решением линейного неоднородного дифференциального уравнения (18) т г + (цтг + Пк = 0,

оо

с начальным условием т0 = / Ф(в, 0)П515 ds < те, при этом

0

аг = п - ВгК-ХВ[Пг.

Заметим, что из экспоненциальной устойчивости А = аг + (1/2)СгС где С = ВгЕ-1Сг, следует аналогичное свойство и для аг. Поэтому

|mt| ^ J e-K2(s"t)ns|ls| ds = mt.

Используя далее неравенство Коши-Буняковского для оценки m2, получим

оо

(19) m2t < m2t < —eK2tl e-K2SU2sl2s ds.

K2 J

t

Нетрудно показать (см. доказательство Леммы в работе [1]), что правая часть приведенной выше оценки при t ^ ж стремится

оо

к нулю, если J lS, ds < ж. Последнее выполнено в силу (6) и

о

определения функции lt по (10).

При доказательстве б) также воспользуемся соотношением

(19). Тогда

t t / о \

(20) J(ms)2 ds < — J I eK2S j e-K2VП2Х dv I ds.

0 0 V s /

Для нахождения интеграла в правой части (20) обозначим

оо

Nt = eK2t f e-K2Sn2sl2t ds и выпишем уравнение

t

оо

dNt = (K2Nt - n2l2)dt, No = f e-K2Sn2sl2s ds.

tt 0 SS

t t Выражаем / Ns ds = (Nt - N0 + ¡П2^ ds)/n2. С учетом огра-

0 о

ниченности функций Nt и nt приходим к оценке

t t t t

J m2s ds ^ J m2s ds ^ —J Ns ds ^ cm(1 + J l2 ds)

0 0 0 0

при некоторой константе cm > 0. Утверждение доказано.

Лемма 2 [8, c. 79, Теорема 32]. Пусть выполнены условия теоремы 1. Тогда для процесса задаваемого уравнением

(21) dX*t = (rt - BtR-Btn)X*tdt+

+ (lt - BtR-lB't mt)dt - BtR-lCt(ntX*t + mt)dwt с начальным условием = 0, выполняется соотношение lim E(X¡)2 = 0.

t—>оо

Доказательство теоремы 1.

Так как по условию справедливо предположение P, то для системы (9)—(11) зададим управление U* в виде

(22) _ U* = —R-lB[ (ntx; + mt),

где процесс X* определяется по уравнению (21), а функции nt и mt удовлетворяют (12) и (18) соответственно.

Отметим, что вид (22) получен на основе закона управления, являющегося решением задачи EJt(U) ^ inf для систе-

и ей

мы (9)—(11) при конечном горизонте планирования T (см. [16, с. 315, Теорема 6.1]).

Зафиксируем произвольное допустимое управление U G U и процесс Xt по (9). Положим xt := Xt — X*, ut := Ut — U*. Нетрудно заметить, что пара (xt, ut) удовлетворяет уравнению

(23) dxt = rtxtdt + Btutdt + u'tCtdwt, x0 = 0. Тогда получаем следующее представление:

(24)

T T

Jt (U *)—Jt (U) = — j (qx2t+qi u[ut)dt—2j (qX*xt+q i(IJt*)tut)dt.

0 0 Выражение для второго слагаемого в правой части (24) найдем,

выписав разложение для d(xt(ntX* + mt)). Сначала, пользуясь

(12), (18) и (21), определяем d(UtX? + mt) = —(иП + q)X*dt—

—rtmtdt + (Ut*yCtdwt. Далее, d(xt(ntX* + mt)) = —qX*xtdt—

—ut(Ct nt + qiln-i )U**dt + utCfUtUfdt + Mt dwt = —qX*xtdt—

—qiutUt*dt + Mtdwt, где Mt = utC^X* + mt) + xt(U*)tCt.

T

Следовательно, выражение —2 J(qX*xt + ql(U*yut)dt =

0 t t

T

= 2xT(ПтXT + mT) — 2 J Mt dwt. Тогда представление (24) T0 преобразуется к виду

(25) Jt (U *) — Jt (U) =

T T

= — j(qxt + qlu'tut)dt + 2xT(ПтX* + mT) — 2 j Mt dwt.

0

Используем элементарное неравенство ab ^ ca2 + (1/с)Ь2, верное для любой константы с > 0, и ограниченность Пт для получения оценки

(26) Jt(U*) - JT(U) <

T т

^ - J(qx\ + qiu'tut)dt + cixT + C2mT + сз(ХТ)2 - 2 J Mt dwt,

0 0 где ci, C2, сз > 0 - некоторые константы. Покажем, что константу Ci можно выбрать таким образом, чтобы

т

(27) C]_E(xT) ^ E J(qx2t + qiu'tut)dt.

0

Для этого, воспользовавшись (23), выпишем уравнение

dx2 = 2rtx2 dt + 2Btxtutdt + u!tC2utdt + 2xtu'tCtdwt, x0 = 0

т т т

и E(xT) = 2 J UtE(x2)dt + 2f BtE(xtut)dt + f E(utCfut)dt. 0 0 0 Вновь привлечем элементарное неравенство ab < ca2 + (1/c)b2,

что с учетом ограниченности функций rt, Bt, Ct, даст соотно-

т

шение E(xT) ^ c0E f (qx2 + qiu'tut)dt, где c0 > 0 - некоторая

0

константа. Полагая ci = 1/с0, применим (27) при оценке (26):

(28) EJT(U*) - EJT(U) < c2mT + c3E(XT)2.

Используя леммы 1 и 2, осуществим предельный переход при T ^ ж в (28), получая неравенство

limsup EJt(U*) < limsup EJt(U). Теперь покажем, что управление U* обеспечивает конечное

оо

значение критерия Нш8ирЕЗт(и:) ^ с/ Е(X;)2 М для некото-

т^ж 0

рой константы с > 0. Конечность правой части этого неравен-

оо _ оо

ства следует из оценки / Е(х;)2а ^ сх /(I? + ш2)(з (см. [8,

о о

с. 79, Теорема 32], где сх > 0 - некоторая константа) и утверждения леммы 1.

Осталось получить уравнения (14)-(15) для исходных переменных системы (3)-(5). Для этого преобразуем (21) и (22) согласно формулам: и; = (1/Г)и;, х; = (1/Г)Х; + у. Точнее,

и; = (1/^Г)[-в-1вЪ (пX; + ш)] = -п-1в[ (ПХ;/Г+

+Пу - Пу + Шъ/Г) = -Е-1В1 (ПъX; - Пу + Шъ/Г), тем самым получаем (14). Затем подставим (14) в уравнение управляемого процесса (3):

(х; = (пх; - Вък-1В[ п х; + Вък-1В[ п у -

-ВъЯ-1ВЪШ/Г)(Ь - ВъЁ-1(Пъх; - Пу + ш/ГСй-Шъ, что совпадает с (15), если положить = Пъу - шъ/\/Г. Теорема доказана.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оптимальная стратегия инвестирования (14) имеет вид линейной обратной связи по текущему состоянию системы -капиталу х;: и; = К-1В[[-Пъ(х; - уъ)+ Ьъ], где положи-

оо

тельное слагаемое Ь = /(П/Г)Ф(в,Ь)(рБ - г8)П8у, (в может интерпретироваться как цена инструмента с доходностью

= ВъЕ-1В[Пъ - г + (1/2)фъ, по которому непрерывно выплачиваются дивиденды в размере (ръ - гъ)Пъ у. Так как на рынке такого безрискового актива не существует, то данные средства должны распределяться для покупки рисковых. Далее, если х; ^ у, то нужно осуществлять вложения в рисковые активы. Для случая х; > у тип портфельных операций (вложение/заимствование) будет зависеть от соотношения между величиной х; - у превышения капитала портфеля над эталонным (с учетом П ) и добавочным членом Ь .

Замечание 2. В линейных управляемых системах с шумом, зависящим от управления, стандартным достаточным условием для выполнения предположения Р является стабилизируемость тройки (гъ Въ Съ) и положительность коэффициентов в целевом функционале (11), см. [8, с. 139, Утверждение 18]. Ниже приводится определение стохастической стабилизируемости.

Определение 1 [8, с. 85]. Рассмотрим уравнение управляемого процесса

(29) = п^йг + вийг + и'Сйшг, Х3 = х,

где в ^ 0 - фиксированный момент, х - некоторое начальное состояние. Система называется стохастически стабилизируемой (или тройка (г г Вг Сг) стабилизируема), если существует такая ограниченная матрица Кг с кусочно-непрерывными элементами, что при подстановке закона управления Ц = КгХг в (29) решение уравнения

йХг = (г г + ВК)Х< + К'ХСйшг, Х3 = х

является экспоненциально устойчивым в среднем квадратичном для любого в ^ 0.

Экспоненциальная устойчивость в среднем квадратичном означает, что существуют константы К\,К2 > 0, такие что

Е(Хг)2 < к1е-К2(ь-з)х2,

при о ^ в ^ г.

Так как д,д\ > 0, то достаточное условие для выполнения предположения Р будет заключаться в стабилизируемости тройки (г г Вг С).

2.2. СТОХАСТИЧЕСКАЯ ОПТИМАЛЬНОСТЬ НАЙДЕННОЙ

СТРАТЕГИИ УПРАВЛЕНИЯ

Определив по (14)-(15) вид стратегии инвестирования и*, перейдем к исследованию стохастической оптимальности полученного закона управления. Рассматривается процесс разности Зт(и*) — Зт(и) целевых функционалов на оптимальном в среднем и произвольном допустимом управлениях. Его положительная часть показывает, насколько результат применения и * оказывается хуже, чем использование и на конкретной реализации, т.е. «дефект». Построив асимптотическую верхнюю оценку для Зт (и *) — Зт (и), которая справедлива для любого конкурирующего и ей, можно оценить скорость роста процесса «дефекта» и качество оптимальной стратегии и * в стохастическом смысле.

135

Теорема 2. Пусть выполнены условия теоремы 1. Тогда

а) для любого и еЫ существует почти наверное (п.н.) конечный случайный момент времени Т0, такой что неравенство Зт(и*) — Зт(и) ^ Нт выполняется (п.н.) для всех Т >Т0, где Нт > 0 - произвольная, как угодно медленно растущая функция, такая что Нт ^ ж, Т ^ ж;

б) Зт(и*) сходится п.н. к Зо(и*) при Т ^ ж, где Зо(и*) -случайная величина.

Доказательство. Сначала докажем б). Рассмотрим Зт(и*) = Зт(и*). Будем пользоваться подходом из [3, с. 97-98], который применялся при доказательстве сходимости к случайным величинам для интегралов типа Римана, если верхний предел интегрирования стремится к бесконечности.

Зафиксируем некоторое число ^ > 0. Так как

_ оо _ _ _

ЕЗт(и*) = Е /[д(Х*)2 + д1(и**)'и**]йг < ж, то для лю-0

бого п = 1,2,..., можно найти такое Шп ^ 0, что

оо _ _ _

Е $ [д(Х**)2 + дг(и**)'и**]йг < п-2^-2.

Тогда

Е1Зщп+1 (и*) — З№»(и*)| = Е / [д(Х*)2 + д1(и*)'и*]йг <

оо _ _ _

< Е I [д(Х*)2 + дг(и*)'и*]йг < п-2'-2.

оо

Ряд Е

+1 (и*) — ,З№„ (и*)| < У ] йп^п < ж, если по-

п=1 п=1

оо

ложить 5п = еп = п-1-1. При этом 5п = еп < ж.

п=1 п=1

По достаточному условию фундаментальности с вероятностью единица (см. [3, с. 49]) последовательности З]у„ получаем, что последовательность интегралов

f [д(Х**)2 + д1(И*)'И*]йг сходится п.н. к пределу ,Згх>(1и*) 0

при n ^ ж. Далее, для n = 1,2,... определим множества Tn := {T, Wn ^ T < Wn+{} и зададим случайную величину

:= supJ(U*) - Jwn(U*)| = sup f [q(X*)2 + q1(Ut*)'U*]dt <

Tn Tn Wn

Wn+i

< f [q(X*)2 + ql(U*)'U*]dt.

Wn

X

Тогда ElZnI = EZn ^ n-2,1-2 и ряд ^ ElZnl < ж, откуда

n=1

следует, что последовательность Zn ^ 0 п.н. при n ^ ж. Таким образом, Jf (U*) ^ J (U*) п.н., T ^ ж.

Для доказательства а) вспомним, что последовательность неотрицательных случайных величин Jf (U) является неубывающей при T > 0. Следовательно, она либо имеет предел JX(U) = lim JT(U), либо JT(U) ^ ж, T ^ ж. В первом слу-

T—ж

чае разность Jt(U*) — Jt(U) стремится к некоторой случайной величине. Поэтому, выбирая любую возрастающую неограниченную функцию hf, будем иметь Jf (U*) — Jf (U) ^ hf п.н. начиная с момента времени T > To(u). Во втором случае Jt(U*) — Jt(U) ^ —ж, T ^ ж, т.е. функция hf с указанными выше свойствами также будет мажорировать эту разность. Теорема доказана.

3. Проверка достаточных условий

В замечании 2 были приведены условия, выполнение которых влечет за собой справедливость основных предположений. Точнее, требуется стабилизируемость тройки (rt Bt C t). Известные методы проверки этого свойства для систем с постоянными коэффициентами включают исследование линейных матричных неравенств [6] и нахождение решений алгебраических уравнений Риккати с изменяющимися параметрами [13]. Указанные подходы неприменимы в случае, когда элементы матриц зависят от времени. Соответствующее утверждение, содержащее условия достаточно простого вида, приводится ниже.

Утверждение 1. Пусть коэффициенты уравнения (29) таковы, что выполняются следующие условия:

1) Функции Ъ^/ , г ^ 0, ограничены, г = 1,п — 1.

2)

lim sup -

t—*оо

b

Ts - -

E

i=1 OS

ß)

ds

t

< 0.

Тогда тройка (и Вг Сг) является стабилизируемой.

Доказательство. Рассмотрим уравнение (29). Пусть

иг = КгХг, где вектор-столбец Кг = (к^, г = 1,п — . Иными

словами, положим Цц = Хг.

Тогда, записывая уравнение для динамики ЕХг2, получаем

(30)

n— 1

d[EX2] = [2Tt+2^2 [bf-kf + l }]EX2 dt, EX

i=1

2 _ -2

s x .

При kf = -btv/ ( o(V) выражение 2bf ■ Щч + (0(ЧЩЧ) =

k(i)/(Ji)

(i) u(.i'

J^lSi)

= — yt j / [Ot j , и тогда решение (30) имеет вид

/1n 1 2 2 [-v — 2 Е /{O(V') ] dv}.

i=1

Обозначим

/n 1 2 2

[Tv — Е {bV') /{oV') ] dv.

i=1

g(t, s)

Условие 2) эквивалентно тому, что lim sup —-— < 0, где s ^ 0 -

t^<x t s

произвольный фиксированный момент. Из этого соотношения следует существование положительных констант T, T > 0, таких

2

t

1

2

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

2

2

что д(£, в) ^ с - к(£ - в) для любых £ ^ в ^ 0. Тогда в (31) будем иметь ехр [д(1, в)} ^ ехр {с} ехр {-к^ - в)}, в ^ Следовательно, решение (29) при выбранном и = Къхъ является экспоненциально устойчивым в среднем квадратичном, т.е. тройка (К Въ Съ) - стабилизируема. Утверждение доказано.

В формулировке утверждения 1 с Ь(г = - присутствует М(г = (р^ - гъ)/ (у17^^ - величина, обратная к индексу без-рисковости, введенному в работе Аумана и Серрано [7], т.е. условие 1 содержит требование ограниченности показателей рискованности портфельных операций. Если предположить отделимость от нуля матрицы Съ, то это автоматически выполнено. Отделимость от нуля является довольно часто встречающимся ограничением на параметры модели портфеля, см., например, [17].

Замечание 3. Если \\СъУ ^ 0, £ ^ ж, то для экспоненциальной устойчивости решения (31) достаточно проверить стаби-лизируемость пары (гъ Въ), т.е. найти такую ограниченную матрицу Къ, что К + ВъКъ будет экспоненциально устойчивой.

4. Выводы и перспективы

В работе была рассмотрена задача оптимального управления портфелем активов с целью его приближения к эталонной безрисковой траектории изменения капитала. Теоретической основой анализа сформулированной модели явились результаты по управлению линейными стохастических системами с квадратичными целевыми функционалами общего вида. Получен вид стратегии вложений, которая минимизирует ожидаемые потери при стремлении горизонта планирования к бесконечности. Оптимальный закон управления, задающий величину инвестиций в рисковые активы, представляется в виде суммы нескольких слагаемых. Точнее, эта стратегия зависит от разности между текущим состоянием системы (капиталом инвестора) и значением эталонного портфеля (имеет место линейная обратная связь), а также корректировки на неравенство будущих ставок доходностей безрис-

кового актива и эталонного портфеля с учетом дисконтирующей функции инвестора. Показано, что применение оптимального в среднем управления обеспечивает приемлемые результаты и в стохастическом смысле. Верхняя оценка, мажорирующая с вероятностью единица разность целевых функционалов, может быть любой, как угодно медленно растущей функцией. В качестве направления дальнейших исследований отметим актуальность задачи трекинга эталонного портфеля, являющегося случайным процессом, например, рыночным индексом.

Литература

1. БЕЛКИНА Т.А., ПАЛАМАРЧУК Е.С. О стохастической оптимальности для линейного регулятора с затухающими возмущениями // Автоматика и телемеханика. — 2013. — №4. - С. 110-128.

2. ГЕРАСИМОВ Е.С., ДОМБРОВСКИЙ В.В. Динамическая сетевая модель управления инвестициями при квадратичной функции риска // Автоматика и телемеханика. - 2002. -№2. -C. 119-128.

3. КРАМЕР Г., ЛИДБЕТТЕР М. Стационарные случайные процессы. Свойства выборочных функций и их приложения. - М.: Мир, 1969. - 400 с.

4. ПАЛАМАРЧУК Е.С. Асимптотическое поведение решения линейного стохастического дифференциального уравнения и оптимальность почти наверное для управляемого случайного процесса // Журнал вычислительной математики и математической физики. - 2014. - Т. 54, №1. -

С. 89-103.

5. ПАЛАМАРЧУК Е.С. Оценка риска в линейных экономических системах при отрицательных временных предпочтениях // Экономика и математические методы. - 2013. -Т. 49, №3. -C. 99-116.

6. AIT RAMI M. ET AL. Solvability and asymptotic behavior of generalized Riccati equations arising in indefinite stochastic

LQ controls // IEEE Transactions on Automatic Control. -2001. - Vol. 46, No. 3. - P. 428-440.

7. AUMANN R.J., SERRANO R. An economic index of riskiness // J. of Political Economy. - 2008. - Vol. 116, No. 5. - P. 810-836.

8. DRAGAN V., MOROZAN T., STOICA A.M. Mathematical Methods in Robust Control of Linear Stochastic Systems. -N.Y.: Springer, 2006. - 308 p.

9. KARATZAS I., SHREVE S.I. Methods of Mathematical Finace. - N.Y.: Springer, 1998. - 407 p.

10. KOHLMANN M., TANG S. Multidimensional Backward Stochastic Riccati Equations and Applications // SIAM J. Control and Optimization. - 2003. - Vol. 41, No. 6. - P. 16961721.

11. LIM A.E.B., WIMONKITTIWAT P. Dynamic portfolio selection with market impact costs // Operations Research Letters. - 2014. - Vol. 42, No. 5. - P. 299-306.

12. PANTELOUS A.A., ZIMBIDIS A.A., KALOGEROPOULOS G.I. A theoretic stochastic dynamic control approach for the lending rate policy // Neural, Parallel and Scientific Computations. - 2010. - Vol. 18, No. 3. -P. 307-332.

13. WILLEMS J.L., WILLEMS J.C. Feedback stabilizability for stochastic systems with state and control dependent noise // Automatica. - 1976. - Vol. 12, No. 3. - P. 277-283.

14. YAO D.D., ZHANG S., ZHOU X.Y. Tracking a Financial Benchmark Using a Few Assets // Operations Research. -2006. - Vol. 54, No. 2. - P. 232-246.

15. YAO D.D., ZHANG S., ZHOU X.Y. Stochastic linear-quadratic control via semidefinite programming // SIAM J. Control and Optimization. - 2001. - Vol. 40, No. 3. -

P. 801-823.

16. YONG J., ZHOU X.Y. Stochastic controls: Hamiltonian systems and HJB equations. - N.Y.: Springer, 1999. - 438 p.

17. ZHOU X.Y. Markowitz's world in continuous time,

and beyond // Stochastic modeling and optimization with Applications in Queues, Finance, and Supply Chains. - N.Y.: Springer, 2003. - P. 279-309.

STOCHASTIC OPTIMALITY IN THE PORTFOLIO TRACKING PROBLEM INVOLVING INVESTOR'S TEMPORAL PREFERENCES

Ekaterina Palamarchuk, Central Economics and Mathematics Institute of RAS, National Research University Higher School of Economics, Moscow, Cand.Sc., Senior Researcher ([email protected], 117148, Moscow, Nakhimovsky av., 47, (495) 999-27-20).

Abstract: We consider an optimal portfolio problem to approximate a risk free reference portfolio. Portfolio management strategies are compared accounting for investor's temporal preferences. We investigate stochastic optimality of the strategy, which minimizes the expected long-run cost, providing an asymptotically upper estimate (almost surely) of the difference between values of the objective function for the optimal strategy and for any admissible strategy.

Keywords: portfolio, stochastic control, reference path, discounting, infinite-time horizon .

Статья представлена к публикации членом редакционной коллегии Д.А. Новиковым

Поступила в редакцию 16.03.2015. Дата опубликования 31.07.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.