УДК 519.816.4:517.977.54
© В. И. Жуковский, К. С. Сорокин
molostv@isa.ас.ru, kostya-home@mail.ru
РИСКИ и исходы в одной
МНОГОКРИТЕРИАЛЬНОЙ ДИНАМИЧЕСКОЙ ЗАДАЧЕ1
Ключевые слова: риски, критерии, стратегии, оптимум по Парето
Abstract. Guaranteed decision with respect to outcome and risks of multi-criteria linear-quadratic dynamic problem under uncertainty is being formalized and explicit solution is being found
Введение
Современным моделям экономической динамики свойственны
наличие нескольких критериев, оценивающих качество функционирования управляемой экономической системы (увеличение прибыли, снижение себестоимости, расходов и т. д.);
подверженность воздействию неопределенных факторов, о которых отсутствуют статистические характеристики (неожиданное появление конкурента на рынке сбыта, непредсказуемые скачки цен, срыв или изменение номенклатуры поставок); изменение управляемой системы с течением времени; требование экономистов об оптимальном сочетании исходов (значений критериев) и рисков.
1Работа поддержана грантом РФФИ (02-01-00612).
Эти модели исследуются в рамках теории многокритериальных динамических задач при неопределенности. Первой работой этого направления явилась монография [1]. Для учета г'дей-ствияб неопределенности в ней применялась подходящая модификация принципа максиминной полезности [2]. Однако такой подход рассчитан на ^катастрофу© - на реализацию Ламой неблагоприятной© неопределенности. Избежать такого пессимистического подхода удается за счет применения подходяще модифицированного принципа минимаксного сожаления [3]. Кроме того, он позволяет осуществить требование [4. С. 21] экономистов об оптимальном сочетании исходов и рисков.
В данной работе впервые предпринята попытка формализации гарантированного решения с учетом исходов и рисков (на основе объединения принципа Севиджа [3] с векторным оптимумом из [1]). Получен явный вид такого решения для многокритериальной динамической линейно-квадратичной задачи при неопределенности .
1. Постановка задачи
Многокритериальной динамической линейно-квадратичной задачей при неопределенности назовем упорядоченный набор объектов
Здесь управляемая динамическая система Л описывается линейным векторным дифференциальным уравнением
где фазовый вектор х € К” , управляющее воздействие ЛПР (лица, принимающего решения) и € К”, неопределенный фактор г € Кк , постоянные матрицы А, А\ соответствующих размерностей и непрерывная п-вектор функция а(£) заданы априори;
(£,и, 2, 7(и,г,£о,х0)).
(1.1)
X = Ах + и + А г + а(£), х(£о) = хо
(1.2)
фиксированы момент § > О окончания процесса управления и начальная позиция (to,xo) £ [0, § х хМ™. Мпожество U позиционных стратегий
U = {U ^ u(t, x) I u(t, x) = P(t)x + p(t),
vp(•) £ Cnxn[0,§], p0 £ C™[0},
то есть стратегии U у ЛПР отождествляются с функциями вида
u(t, x) = P(t)x + pt),
где матрицы P(t) и p(t) непрерывны па [0, § . Мпожество Zt программных неопределенностей Zt
Zt = {Zt ^ z[t] | z[t] = Bz[t] + 6(t)Vz[t0] £ Mk}, (1.4)
то есть множество Zt образуют непрерывные на [0, §] решения z[t] дифференциального уравнения из (1.4), где В - постоянная к х к матрица, Ь(•) £ Ск[0, §] и неопределенностью фактически становится начальное условие z[to]; такая неопределенность появляется в задачах прогнозирования в связи с моделью Эванса установления равновесной цены [5. С. 197] и учетом непредска-
t
ше использовать и множество позиционных неопределенностей Z (аналогичное U):
Z = {Z^ z(t,x) |z(t,x) = Q(t)x + q(t),
VQ(0 £ Cnxn[0,§],q(•) £ C„[0},
а также множество контрстратегий
= {Uz ^ u(t, x, z[t]) |u(t, x, z[t]) = P(t)x + pt)}, (1.6)
то есть контрстратегия Uz отождествляется с функцией u(t, x, z) такой, что при z = z[t] (VZt ^ z[•], £ Zt) функция
u t, x, z t P t x pt
при некоторых Р(•) € Сгахга[0, $], р(0 € С”[0Заметим, что пара и, 2 будет использована при построении функции риска, а и, 2 - при построении гарантированного решения задачи
(1.1). Процесс принятия решения в задаче (1.1) происходит следующим образом: ЛПР выбирает и использует какую-либо стратегию и ^ и(Ь,х) = Р(Ь)х + р(Ь),и € и. Независимо от такого выбора в задаче (1.1) реализуется конкретная неопределенность Ъ ^ г(Ь, х) = <^(Ь, х)х + ^Ь) го множества 2. Затем строится решение х(Ь),Ь € [Ь0,Щ системы линейных неоднородных дифференциальных уравнений с непрерывными коэффициентами:
х = Ах + и(Ь, х) + А\г(Ь, х) + а(Ь) =
= [А + Р(Ь) + АЯ(Щх + [р(Ь) + А^Ь) + а(Ь)}, (1.7)
= хо.
Такая система имеет [6. С. 29] единственное непрерывное решение х(1;), продолжимое на интервале [¿о, $] • С помощью x(t) находятся указанная стратегия иЩ = Р(Ь)х(Ь) + р(Ь) и позиционная неопределенность г[Ь) = <^(Ь)х(Ь) + д(Ь) . Отметим, что вектор-функции иМ и г^] будут непрерывны па [¿о, $]• Наконец, на всех возможных тройках (х(Ь),иЩ,гЩ| Ь € [Ьо,$]) определен векторный критерий
7(и,г,£0,х0) = (Ли,ъ,г0,х0),^(и ,г,Ьо,х0)), (1.8)
компоненты которого заданы линейно-квадратичными функционалами (г € N = {1,... ,М})
^(Х]¿о, х0) = х'(д)Сгх(д) + 2вгх(гд)+
+ I {и'[£][^и[£] + 2КггЩ + 2М^х(Ь) + 2^]+ (1.9)
Л0
+г'Щ[1цгЩ + 2Жгх(Ь) + 2Щ + х'{ Ь)[Сгх(Ь) + дг] }йЬ,
где использованы заданные априори постоянные п х п матрицы Сг, О г, Мг,С^; п х к матрицы Кг,Ы^ к х к матрицы
11-векторы Сг, йг, дг; к-векторЫ 1г , ПричеМ Сг,Пг,Ьг,Сг симметричны и штрих сверху означает операцию транспонирования. На ^содержательном уровне© цель ЛПР состоит в выборе такой
€и
Л (и,%,Ьо,хо), г € N, принимали возможно большие значения и одновременно риски по каждому критерию становились как можно меньше. При этом ЛПР вынужден учитывать возможность реализации любой неопределенности Ъ € 2 .
и
заменено на а 2 - на 2 , происходит аналогично, описанным выше способом.
В настоящей работе
во-первых, будет найден явный вид функции риска по каждому из критериев,
во-вторых, формализовано гарантированное по исходам и рискам решение задачи (1.1),
в-третьих, будет построен явный вид такого решения. Математическим аппаратом будут подходящие варианты метода динамического программирования. Существенную роль при этом играет объединение метода динамического программирования с методом функции Ляпунова, предложенное Н. Н. Красов-ским для решения задач стабилизации. В целях сокращения объема статьи мы не будем приводить подробные доказательства (они имеются в подготовленной к изданию монографии ).
2. Построение функции риска
Каждому критерию ^(и,Ъ,Ьо,х$),г € N поставим в соответствие однокритериальную задачу
<е , Ц, ,г^0,х0)), (2.1)
где Е та же, что ив (1.1), множество контрстратегий их определено в (1.6), множество неопределенностей Ъъ - в (1.4), критерии Jг(Uz Ьо,хо) - в (1.8), где вместо и применяется иг, а г
заменено на 7ц ■
Для построения функции риска по ¡-.му критерию (1.8) следует,
во-первых, решить оптимизационную задачу тах Jг(Uz ,% г ,Ь0,х0) = Ji(uZi) ,2 г,Ь0,х0) = Ji[Zt ,Ь0,х0] (2.2)
при любых € 2 и начальных позициях (¿о, хо) € [0, $) х Мп ; во-вторых, саму функцию риска построить по формуле
Фг(и,г,Ьо,хо) = Ji[Z,Ь0,х0) — Ji(U,г,Ь0,х0). (2-3)
Заметим, что функционал (2.3) численно оценивает сожаление (риск) ЛПР о том, что при неопределенности Ъг он выбирает (исходя из наличия N различных критериев) стратегию II, а не 1# , удовлетворяющую условию (2.2). Далее для матрицы Б < 0(^ 0, > 0, ^ 0) означает, что квадратичная форма и'Би определенно отрицательна (неположительна, определенно положительна, неотрицательна). С помощью следующего утверждения решаем задачу (2.2).
.
А <0, Сг о, О, — М'Б-Мг О, (2.4)
то контрстратегия удовлетворяющая (2.2) (при любых
Zt € 2 и (¿о,хо) € [0 ,$) х Мп ), имеет вид
1# ^ и(-г (¿,х,г)= /2 5ч
= —х[(©г(¿) + Мг)х + (¿) + Кг)х + (£,(¿) + с!,),
где матрицы ©г(Ь),Ег(Ь) и вектор £,(Ь) являются решениями системы
0 пхп = ©г + ©г [А — Б, 1 М,] + [А' — М,Б,1 *] ©,—
—©,£>-©г + Ог — М'Б-М,, ©,(0) = С* (2.6)
Oraxfc — ^i + ^i [A - Di 1(&i + Щ] + В 'ü i + Ni-
-K'D~l(@i + Mi), ~i( 0) = Onx^ (2.7)
ora = ii + [A'— (©i + Mi')Dix]6 + gi-
-(©i + M[) D-1 di + ®ia{t) + E'i( t)b(t), ii( 0) = Ci, (2.8)
где Onxn - нулевая n x n матрица, a On - нулевой п-вектор.
Замечание 2.1. При выполнении (2.4) матричное дифференциальное уравнение типа Рпккатп (2.6) имеет непрерывное и продолжимое па [0,0] решение ©Дt) . Положив ©i = it
неоднородное уравнение с непрерывными (по t) коэффициентами. Поэтому оно тоже имеет продолжимое па [0,0] решение i t i i t Si = НДt) по той же причине имеет непрерывное и продолжимое
, 0 ii t
вать в (2.5).
Утверждение 2.2. Если при всех i € N выполняются ограничения {2А), то компоненты ФД1!, Z,to,xo), i € N , векторной функции риска
#(U,Z,t0,x0) = (#i(U,Z,t0,x0), ...,#n(U,Z,t0,x0)) (2.9)
имеют вид
ç'd
#i(U,Z,t0,x0) = / {z'[t][Si(t)D~lEi(t) - K'D- Ki)z[t] +
Jt о
+x'(t)[©i{t)D-lQi(t) - M'D-1 Mi]x(t) +
+2x'(t)[©i(^D-3Üt) - M'D~lК)z[t] -
- u' [t][Di u[t] + 2Kiz[t] + 2Mix(t) + 2di}+ '
+2[ii(t)D-Qi{t) - diD~lM^x(t) +
+%[&( t)Di ls a - diDi1 Kà zM +
+Ш tfD-1 &( ^ - diDîl di] №
i t , i t , xii t
3. Формализация гарантированного решения задачи
Задаче (1.1) поставим в соответствие г'расширеннуюб вспомогательную задачу:
(£, и, я, з(и,г,г0,хо), -Фг(и,г,-£о,ж0)) = ,3 _
= (£,и, Я, {I¿(и, г,£0,хо)}^=1,...,2МX
где (Е,и, 2) те же, что в (1.1), а Ф определено в (2.9), (2.10); в(3.1) обозначено 1г = 3г,1и+г = —Фг,г € N. Естественно, при этом предполагаем выполненным требование (2.4).
Определение 3.1. Тройку
(и* ,3 * [*о,хо],Ф * [*о,хо]) €Их М2м
назовем гарантированным по исходам и рискам решением задачи (1.1), если существует неопределенность 2* €2 такая, что ДЛЯ ЬЙ компоненты м-векторов 3*[Ьо,Хо] И Ф*[£о,Хо] выполнены равенства
^[го,хо] = Ми *,г *,го,хо),
Фг*[*о,х0] = Фг(и*,2*,*о,хо), г € N
при любом выборе начальной позиции (¿о,хо) € [0, &) х Мга и, кроме того,
1) для всех и € и несовместна система неравенств
/,-(и,г*,г0,х0) > 13(и*,г*,г0,х0), ] = (з.з)
из которых, по крайней мере, одно строгое.
2) при каждом Ъ € 2 несовместна система неравенств
1^1]*,2,Ь0,х0) < *,2*,*о,хо), ¿ = 1,...,2^, (3.4)
из которых, по крайней мере, одно строгое. Тогда Р\Г-вектор 3*[¿о,хо] назовем гарантированным векторным исходом, Р\Г-вектор Ф*[г0,х0] - гарантированным векторным риском задачи (1.1) с начальной позицией (¿о,хо), а пару и*^* - седловой точкой по Парето задачи (3.1)
Замечание 3.1. Выполнение требования 1) из определения (3.1) означает, что стратегия и* максимальна по Парето в задаче 3.1, где фиксирована неопределенность Ъ = Ъ*, а
*
*
Замечание 3.2. Согласно определению (3.1) для построения (и*, 3 *[£о, х], Ф *[¿0, Ж]) £Мх М2 м достаточно найти
*, *
а затем уже воспользоваться формулами (3.2).
4. Нахождение седловой точки по Парето
Для вектора а = (^\^^ = с
положительными постоянными компонентами введем обозначения:
С(а,г) = сг + а2){Мр-т1 Мг - ©г(¿)В-&г(щ,
(4.1)
1(а,г) = 1г + (К[0^ 1 Лг - Нг(1 &(Щ,
д(а,г) = 9г + «Г(М'°г 1 Лг - ©г{¿Щ 1 &(Щ,
C(a{l)) = Ci, c(ail)) = ^2a<il)ci,
ІЄН ІЄН
где матрицы ©i(t), 3i(t), и вектор t) являются решениями
системы (2.6)-(2.8). Напомним, что при выполнении (2.4) такое решение существует, единственно, непрерывно и продолжимо на
[О, 0 .
Утверждение 4.1. Предположим, что
1) для функционалов (1.8) выполнены условия (2.4) при всех і Є N ;
2) существует постоянный 2И-вектор
і (!) Ю (1) (Ю\
a = (a\,...,a\ ,^,...,œ2 ')
с положительными компонентами, при котором для всех t Є [0, 0]
Ца, t) > О, D— (a) + AL-(a, t)A[ < 0, K(a) = 0гахга, (4.2)
G(a,t) — M'(a)D-(a)M(a) — N'(a,t)L~l(a,t)N(a,t) ^ 0.
Тогда седловая точка по Парето U*,Z* задачи (3.1) существует и имеет вид:
U* ^ u*(t, х) = —D- (a{[©(t) + M(a))x + ^(^^ d(a)}}, (4.3)
Z* ^ z*(t, x) = —L-(a, t){[A/©(t) + N(a, t)]x + l(a, t)]},
D a , C a , M a , L a, t , N a, t , G a, t d(a), c(a), l(a, t) определены в (4.1), a симметричная n x n-матрица и п-вектор £(t),t Є [0,0, являются решением, системы:
0nxn = © + ©[A — AL-(a, t)N(a, t) — D-(a)M(a)} +
+[A — N/(a,t)L- (a,t)A[ — M/(a)D~l (a)]© —
—© [AL-(a,t)A[ + D-(a)]© +
G a, t — M a D- a M a — N a, t L- a, t N a, t ,
©(0) = C(a(1));
(4.4)
0„ = £ + {A' - [© + M'(a)]D_1 (a) —
—[© A\ + N' (a,t)]L_1 (a,t)A[)£ + Qa(t) —
—[© + M'(a)]D_1 (a)d(a) + g(a,t) — (4.5)
— [©A\ + N'(a, t)]L~l (a, t)l(a, t)
£{&) = c(a{l)).
Замечание 4.1. При выполнении ограничений (4.2) матричное дифференциальное уравнение (4.4) имеет единственное непрерывное решение ©(t), продолжимое на [0, 0] . По-
t
ственное непрерывное продолжимое на [0,0 решение £(t) .
Замечание 4.2. Приведенные в работе утверждения позволяют предложить следующую схему построения гарантированного по исходам и рискам решения задачи (1.1):
a) проверить выполнение ограничений (2.4) и затем найти решение ©¿(t),Ei(t),xii(t,i € N) системы (2.6)-(2.8);
b) по формуле (2.10) построить функции риска;
c) найти положительные постоянные a%r{r = l,2;i € N, при которых с учетом (4.5) выполняются условия (4.2);
d) построить решение ®(t),((t) системы (4.5);
e) по формулам (4.3) аналитически сконструировать U*, Z*;
f) используя пункт b и (1.8), по (3.2) найти N-вектора
J*[to, xo], Ф*[tQ, xo]; здесь также можно применить прием, предложенный в [7. С. 81-85].
*, J* t , x , * t , x
образует гарантированное по исходам и рискам решение задачи
(1.1). Заметим, что предложенная здесь схема реализована в [8] для скалярного варианта задачи (1.1).
Список литературы
1. Zhukovskiy V. I., Salukvadze M.E. The Vector-Valued Maximin. N. Y. etc.: Academic Press 1994.
2. Wald A. Contribution to the theory of statistical estimation and testing hypothesis //Annual Math. Statist. 1939. Г1 10. P. 299 - 326.
3. Savege L. Y. The theory of statistical decision //J. American Statistic Association 1951. Г1 46. P. 55 - 67.
4. Уткин Э. А. Риск-менеджмент. М.: ЭКМОС, 1998.
5. Колемаев В. А. Математическая экономика. М.: ЮНИТИ, 2002.
6. Понтрягин Л. С. Обыкновенные дифференциальные уравнения М.: ГИФМЛ, 1961.
7. Жуковский В. И. Введение в дифференциальные игры при неопределенности. М.: МНИИПУ, 1997.
8. Сорокин К. С. Решение одной многокритериальной динамической задачи при неопределенности с учетом риска. (В настоящем сборнике.)