УДК 519 . 816
К.С.Сорокин
СУЩЕСТВОВАНИЕ ГАРАНТИРОВАННОГО ПО ИСХОДАМ И РИСКАМ РЕШЕНИЯ ОДНОЙ МНОГОКРИТЕРИАЛЬНОЙ ЗАДАЧИ
(кафедра оптимального управления факультета ВМиК, e-mail: [email protected])
В настоящей работе рассматривается многокритериальная задача принятия решения в условиях неопределенности в классе измеримых по Борелю контрстратегий. Вводится понятие гарантированного по исходам и рискам решения и доказывается теорема существования.
Введение. Большинство современных математических моделей, изучаемых в теории принятия решений, обладают следующими особенностями:
1) предпочтения ЛПР (лица, принимающего решение) описываются не одним, а сразу несколькими критериями, т.е. задача носит многокритериальный характер;
2) в задаче помимо действий ЛПР учитываются еще и неопределенные факторы, иными словами, рассматривается задача при неопределенности;
3) при формализации решения принимается во внимание не только исход — значение векторного критерия качества, но и риск, возникающий из-за учета неопределенностей.
Таким образом, приходим к постановке многокритериальной задачи при неопределенности (МЗН) и необходимости формализации ее гарантированного по исходам и рискам решения (ГИР). Этим вопросам посвящена монография [1]. Предметом настоящей статьи являются МЗН в классе контр стратегий (или же "при информационной дискриминации неопределенности"). Целью статьи является доказательство теоремы существования ГИР при стандартных для теории принятия решений предположениях типа компактность-непрерывность.
1. Математическая модель. Предполагая информационную дискриминацию неопределенности, будем считать, что ЛПР имеет возможность формировать свою контрстратегию (альтернативу), которую отождествляем с функцией х(у) : Y —> X С К", полагая дополнительно, что компоненты этой вектор-функции измеримы по Борелю на множестве Y С Кт — данный факт обозначаем: х(-) £ B(Y,X). Поэтому рассматриваемую математическую модель принятия решения при неопределенности представим в виде упорядоченной тройки
T = (B(Y,X),Y,{ft(x,y)}teN). (1)
Здесь B(Y,X) — множество контрстратегий (альтернатив) х(у), предполагается, что X — непустое компактное множество в R"; Y — множество неопределенностей у, предполагается также, что Y — непустое компактное множество в Rm; N = {1,..., n} — множество индексов, для ¿-го критерия ЛПР считаем
fi(x,y) = fi(x(y),y), г 6 N, (2)
функция /¿(ж, у) предполагается при этом непрерывной на X xY.
В задаче принятия решения для (1) ЛПР самостоятельно выбирает и использует свою контрстратегию х(у), одновременно в задаче реализуется неопределенность у £ Y. На полученных парах (х(у),у) определен i-й критерий качества /¿(ж, у), i £ N, (2) и его функция риска Ф¿(ж(у),у) — пока она вводится формально (определение будет дано ниже). На "содержательном уровне" цель ЛПР состоит в выборе такой своей контрстратегии х(-) £ B(Y,X), для которой его исход (значения критериев fi(x(y), у)) стали бы возможно большими и одновременно его риски (значения функций риска Фi(x(y),y)) — возможно меньшими. При этом ЛПР ориентируется на реализацию любой неопределенности у £ У.
2. Функция риска (по Севиджу). Обратимся к задаче (1), где число критериев равно 1 (т.е. N = {1}). Каждой неопределенности у* £ Y поставим в соответствие число max f\(ж, у*). Таким
образом, ЛПР определяет для себя наибольшее значение критерия при каждой возможной неопределенности у* 6 У. Далее ЛПР строит разность между указанным наибольшим значением критерия /1 (ж, у*) и значением этого же критерия при любом решении ж 6 X, а именно
шах/ф, у*) - /1 (ж, у*) = Ф1 (ж, у*), (3)
X
где у* — фиксированная неопределенность. Тем самым ЛПР численно оценивает свое сожаление о
том, что он использует ж, а не ж = ащтах/! (ж, у*). Очевидно, что сожаление будет равно нулю,
х£Х
если выбрана альтернатива ж при неопределенности у*. Разность (3) называется [2] функцией риска (функцией сожаления) ЛПР, а ее значение на конкретной паре (х,у*) 6 X X У — риском ЛПР при использовании им альтернативы х 6 X и реализации неопределенности у* 6 У.
Как уже упоминалось ранее, с помощью функции (3) ЛПР оценивает свой риск — разность между "самым хорошим" (максимальным) значением критерия /1 и значением, реализовавшимся в действительности. Естественно стремление ЛПР возможно минимизировать этот риск. Особо отметим, что в данном случае не осуществляется подмена критерия эффективности, наоборот, модифицируется сам принцип оптимальности: вместо привычного принципа максимина используется принцип минимаксного сожаления [2].
Принимая во внимание то, что в однокритериальном варианте задачи (1) имеется дискриминация неопределенности, т.е. при конструировании своей альтернативы ЛПР знает, какая именно неопределенность у 6 У реализуется, использование функции риска не дает ничего нового — действительно, если ЛПР выбирает максимальную контрстратегию ж* (у) = ащтах/! (г, у), то функция риска
тождественно равна нулю, согласно (3). Этот факт следует из того, что при построении функции риска используется тот же класс стратегий, что и при решении основной задачи. Ситуация меняется кардинальным образом, если обратиться к многокритериальному случаю. Следуя желанию учесть возможные риски, ЛПР отдельно для каждой компоненты /(ж, у) находит ее функцию риска по 1-му критерию (ж, у):
Фг(ж,у) = шах/г (г, у) - /г(ж, у), ¿еМ, (4)
X
где X, ]Ч, /¿(ж, у) те же, что были в исходной задаче (1), тогда векторная функция риска Ф(ж,у) = = (Ф1(ж,у),.. .,Флг(ж,у)).
Согласно (4), компоненты векторной функции риска Ф(ж,у) неотрицательны:
Фг(ж, у) ^ 0 \/(ж, у) £ X X У, г 6 14,
и поэтому наименьшее возможное их значение есть нулевое. Считаем, что при выборе контрстратегии ж(-) 6 В(У,Х) ЛПР не только стремится возможно увеличить все компоненты /¿(ж, у), i Е векторного исхода /(ж, у), но и одновременно возможно уменьшить векторный риск (значения всех компонент ФДж, у), г £ ]Ч, векторной функции риска Ф(ж,у)). Фактически тогда перед ЛПР возникает 2Аг-критериальная МЗН
Г' = <£(У,Х),У,{/(ж,у),-Ф(ж,у)}>, (5)
где ЛПР выбором ж(-) 6 В(У,Х) стремится возможно увеличить векторный исход /(ж, у) = = (/1 (ж, у),..., /дг(ж, у)) и одновременно возможно уменьшить векторный риск Ф(ж,у), принимая во внимание возможность появления любой неопределенности у 6 У (сравнение векторов производится по Слейтеру). Еще раз подчеркнем, что желание ЛПР увеличить векторный исход /(ж, у) и одновременно уменьшить векторный риск Ф(ж, у) привело к тому, что он вместо исходной МЗН (1) вынужден рассматривать математическую модель МЗН в виде Г', считая векторную функцию риска ( —Ф(ж,у)) таким же векторным критерием, как и исходный /(ж, у). В ней знак минус перед векторной функцией риска Ф(ж,у) использован для того, чтобы ЛПР при выборе своей альтернативы ж(-) 6 В(У,Х) стремился одновременно увеличить все компоненты 2Аг-векторного критерия
(1(х,у), -Ф(ж,у)) = (Л(ж, у), . . ,,/дг(ж,у), -Ф1(ж,у), . . ., -Фдг(ж,у)),
учитывая возможность реализации любой неопределенности у 6 У ■ Далее при формализации гарантированного по исходу и риску решения МЗН (5) и исследовании его свойств будем применять указанную выше в [1] теорию принятия гарантированных решений в МЗН. Формализацию будем основывать на предложенном в [3] аналоге минимакса.
Отметим, что при дискриминации неопределенности в данном случае использование понятия сожаления по Сэвиджу уже оправданно, так как навряд ли удастся выбрать альтернативу, одновременно максимальную сразу для всех критериев. Значение функции риска в данном случае означает "недобор" по данному критерию, а увеличение числа критериев позволяет оценивать не только исходы, но и потери, которые ЛПР неизбежно несет в силу многокритериального характера задачи.
3. Максимум по Слейтеру. Рассматриваем теперь МЗН (1) и зафиксируем в ней неопределенность у*. Обозначим эту задачу Т(у*), в ней ЛПР выбирает альтернативу ж £ X (неопределенность уже фиксирована) с целью достичь возможно больших значений компонент вектора /(ж, у*).
Альтернатива ж3 £ X называется максимальной по Слейтеру (слабо эффективной [4]) в задаче Г(у*), если для любых ж £ X несовместна система строгих неравенств
¡г(х,у*) > ¡г(х3,у*), геГТ.
Вектор /(ж3,?/*) при этом называется максимумом по Слейтеру в задаче Г(у*).
Множество всех максимальных по Слейтеру альтернатив ж3 задачи Г(у*) обозначим через X3, а множество соответствующих максимумов по Слейтеру — через
/(Х3,у*) = У /(ж, у*)-
Далее используем также множество чисел
Л = |т = (7ь■■■,7м) е и скалярное произведение
>ДГ
N ,
Ъ > 0 (г £ ]Ч) и ^ъ > 0 > ¿=1 '
N
т7 =
¿=1
где штрих означает операцию транспонирования (т.е. у' — Х-вектор-строка), и предполагаем, что компоненты /¿(ж, у) (г £ ]Ч) измеряются в одной шкале.
Приведем два известных свойства максимума по Слейтеру.
Свойство 1 [4]. Множество максимумов по Слейтеру /(Х3,?/*) задачи Г(у*) замкнуто. Свойство 2 [4]. Если для некоторого 7 £ «Л альтернатива ж3 найдена из условия
п N
та?УЛг/г(ж,У*) = У21г1г(х3,У*), (6)
¿=1 ¿=1
то х3 будет максимальной по Слейтеру в задаче Г(у*), а вектор /(ж3, у*) — максимумом по Слейтеру.
Замечание 1. Свойство 2 обосновывает следующий способ построения максимума по Слейтеру в задаче Г (у*). Именно:
- нужно взять n чисел ^ 0 (г £ ]Ч), не равных нулю одновременно;
- найти альтернативу ж3 из условия (6).
Полученная в результате альтернатива ж3 будет максимальной по Слейтеру в задаче Г(у*), а вектор /(ж3,?/*) — максимумом по Слейтеру, при фиксированной неопределенности у* в задаче (1).
Замечание 2 [4]. Если X суть компакт, а (ж,у*) (г £ ]Ч) непрерывны по ж на X, то множество X3 есть непустой компакт.
Лемма 1. При каждом у £ У максимальная по Слейтеру альтернатива ж3 задачи Г (у) остается максимальной по Слейтеру в задаче
Т"(у) = (В(¥,Х),{-Фг(х,у)}гек)
и обратно.
Справедливость леммы следует из цепочки эквиваленций
[ж5 £ х5] ^ [Уж £ X 31 (ж) £ N : /г(х) (ж, у*) > 1цх) (х3, у*)] &
[Уж £ X 31 (х) £ N : - тах//(ж) (г, у*) + ¡1(х){х,у*) ^ - тах (г, у*) + Ь(х){х3 ,у*)} &
[Уж 6 x 31(ж) 6 N : — Ф/(ж) (ж) у*) ^ —^'(ж) у*)] ^ — максимальна по Слейтеру в Г"(у)].
Замечание 3. Согласно лемме 1 максимальная по Слейтеру альтернатива ж3 в задаче Г(у) будет максимальной по Слейтеру в задаче (5). Этот факт будет использован в разделе 7 при определении ГИР.
4. е-минимум по Слейтеру. Рассматриваем 2Аг-критериальную задачу
(глглу)ь=1,.,2м), (7)
в которой ЛПР выбором альтернативы у 6 У стремится достичь одновременно возможно меньших значений всех компонент Р](у) векторного критерия
^(у) = (^(у),...,^2Лг(у)).
Особенность задачи (7) в том, что скалярные критерии Р](у) (] = 1, • • •, 2И) являются измеримыми по Борелю на У, поэтому минимум по Слейтеру (аналогичный максимуму по Слейтеру) может не достигаться. Это обстоятельство и приводит к необходимости использования в задаче (7) векторного е-минимума.
При формализации е-минимума по Слейтеру и перечислению его свойств будем предполагать выполненным
Условие 1. Скалярные функции Р](у) (] = 1,...,2./У) ограничены снизу, т.е. существуют такие числа Mj, что
УуеУ и = 1,...,2Х).
Итак, пусть задан или выбран постоянный 2Х -вектор £ — (^1; • • • ^ с неотрицательными компонентами. Множество таких векторов е обозначим через Е.
Альтернативу удЕУ называют е-минималъной по Слейтеру в задаче (7), если при всех у 6 У несовместна система неравенств
+ < ^(у|), 3 = 1,...,2Х, вектор Р(уд) назовем е-минимумом по Слейтеру.
2ДГ
Свойство 3. Если для задачи (7) существуют 2И чисел а^ ^ 0, ] = 1,...,2./У, ^ а^ > 0, и
3 = 1
альтернатива уе3 6 У, такие, что
а'[^(у)+г] Уу е У, (8)
то уд является е-минимальной по Слейтеру для задачи (7).
Доказательство проводится по схеме "от противного": пусть найденная из (8) альтернатива уе3 не е-минимальна по Слейтеру для задачи (7). Тогда существует у 6 У, такая, что выполняются строгие неравенства
^•(ж*,у|)-г,>^(ж*,у), ] = 1,..., 2Х.
Умножая каждое из этих неравенств на а^ и суммируя по ] = 1, 2,..., 2И левые и правые части, получаем неравенство
а'[Р(у)+е] <«'^(у|), противоречащее исходному условию (8).
5. Полунепрерывные сверху отображения. Обозначим через Х*(у) множество максимальных по Слейтеру контрстратегий ж* (у) задачи (1) при фиксированной неопределенности у £ У. Это множество Х*(у) непусто и компактно при каждом у £ У в силу замечания 2. Рассмотрим теперь многозначное отображение Х*(-) : У —> 2х, где 2х — множество всех непустых подмножеств множества X.
Итак, каждой неопределенности у £ Y поставлено в соответствие непустое и компактное множество Х*(у) С X максимальных по Слейтеру контрстратегий ж* (у) задачи (1) с фиксированной неопределенностью у.
Отображение Х*(-) : Y —> X называется полунепрерывным сверху по включению при изменении у, если справедливо следующее заключение.
Пусть у£ У (к = 1,2,...) есть некоторая последовательность, имеющая предел (покомпонентный)
lim yW = у*, у* £ У,
к —У ОС
а
xWeX*(yW) (к = 1,2,...)
— соответствующая ей последовательность, также имеющая предел
lim ж(/с) = х*.
к —У ос
Тогда Х*(у) полунепрерывно сверху по включению при изменении у, если
Ж* £ Х*(ут).
Лемма 2. Многозначное отображение Х*(-) : Y —у 2х, ставящее в соответствие каждой неопределенности у £ У множество Х*(у) С X максимальных по Слейтеру стратегий ж* (у) задачи (1), полунепрерывно сверху по включению при изменении у £ У.
Доказательство. Пусть у^ £ У — некоторая последовательность неопределенностей, сходящаяся к у*, т.е.
lim = у*.
к —>оо
По {y(*)}f построим соответствующую последовательность максимальных по Слейтеру альтернатив
=х*{уМ)£Х*{у(% к = 1,2,...,
имеющую предел
lim ж(/с) = х*.
к —>оо
Покажем, что справедливо включение х* £ Х*(у*) от противного: пусть х* не будет максимальной по Слейтеру альтернативой задачи (1) при у = у*. Тогда найдется по крайней мере одна альтернатива х £ X, такая, что
fi{x,y*) > fi(x*,y*), г £ N.
Вследствие непрерывности /(ж, у) на X X У существует "достаточно большое" целое число К > О, для которого при всех к > К и i £ N
ft(x,y{k))> Ых{к),у{к)).
Это неравенство противоречит тому, что все х^ = х*(уявляются максимальными по Слейтеру альтернативами в задаче (1) при у = у^к\ что и доказывает лемму.
6. Существование е-минимума по Слейтеру. Установим существование е-минимальной по Слейтеру неопределенности у® в задаче (7) при выполнении условия 1 и любых постоянных 2Дивекторах е £ Е (компоненты которых положительны).
Утверждение. Предположим, что в задаче (7) критерии Fj(y), j = 1,... ,2N, измеримы по Борелю и ограничены снизу на У. Тогда, при любых положительных компонентах £j,j = l,..., 2N, вектора е = (ei,.. .,£2n) в задаче (7) существует е-минимальная по Слейтеру альтернатива у®.
Доказательство. Возьмем числа aj ^ 0, j = 1,...,2N, одновременно не обращающиеся в нуль, и с помощью 2iV-BeKTopa (столбца) а составим скалярную функцию
2N
<x'F(y) = ^,<XjFj(y)-
3 = 1
Эта функция измерима по Борелю и ограничена снизу на У (следует из измеримости и ограниченности снизу Fj(y)). Поэтому существует конечный
inf a'F(y) = 7 = const. yeY
Пусть теперь е = (ffi,.. .,£2n) — какой-либо постоянный вектор-столбец с положительными ком-
2N
понентами £j (j = 1,..., 2N). С учетом aj ^ 0 (j = 1,..., 2N) и aj > 0 число
3 = 1
2 N
OijEj = 01 £ = 5 > 0.
3 = 1
Теперь из свойств точной нижней грани и согласно способу построения числа S > 0 существует альтернатива у® £ У, такая, что
a'F(y) + 5 £ a'F(yl) Vy £ У,
или 5 = a*£, получаем
a'F(y) + 5 = a'[F(y) + e] £ a'F(yt) Vy £ У. Тогда по свойству 3 альтернатива у® будет е-минимальной по Слейтеру в задаче (7).
7. Теорема существования. Вернемся к МЗН (1):
(B(Y,X),Y,{ft(x(y),y)}teN),
для которой (при условии компактности X, Y и непрерывности /¿(ж, у), i £ N) найдем функции риска (4)
&i(x,y) = max fi(z, у) - /¿(ж, у), г £ N. X
Эти функции риска ФДж,у), i £ N, будут непрерывными на X X У [1]. Задаче (1) поставим в соответствие задачу (5):
<£(У,Х),У,{(/г(ж,у),-Фг(ж,у))}геМ>.
В следующем понятии используем iV-векторы / = (/i,--.,/jv) и Ф = (Ф1,...,Фдт) и считаем заданным 2iV-BeKTop е с неотрицательными компонентами.
Определение. Тройку (xs(y), f^, Ф^ ) £ £>(У, X) X М2ДГ назовем e-5-гарантированным по исходам и рискам решением задачи (1) в контрстратегиях, если существует неопределенность yes £ Y, при которой /f = f (xs (y£s), y£s), Фf = $(zs(?/|),?/|), и выполнены условия:
1) контрстратегия xs(y) является максимальной по Слейтеру (при всех у £ У) в задачах
Г(у) = (B(Y,X),{(ft(x(y),y)}teN) Vy £ У;
2) неопределенность y£s будет e-5-минимальной в 2iV-KpHTepHanbHofi задаче
(У,{(/г(ж5(у),у),-Фг(ж5(у),у))}геМ).
Замечание 4. Для доказательства существования e-5-гарантированного решения МЗН (1) достаточно установить факт существования пары
(жS(y),yss) eB(Y,X)xY,
удовлетворяющей требованиям 1 и 2 приведенного определения, тогда само е-5-гарантированное равновесие образует тройка (xs(y), f{xs(y£s), y£s), Ф(ж*(у|), y£s)).
Конечно, при "очень больших" значениях £j > 0, j = 1,.. .,2 N, и ограниченных /¿(ж, у), Ф ¿(ж, у), i £ N, е-5-гарантированное равновесие существует всегда; интерес представляет существование при сколь угодно малых, но положительных числах £j, j = 1,..., 2N.
Теорема. Пусть в многокритериальной задаче при неопределенности (1):
1) множества X и Y компактны;
2) функции выигрыша /¿(ж, у), i £ N, непрерывны на X xY.
Тогда при сколь угодно малых положительных числах £j, j = 1,..., 2N, в МЗН (1) существует £-S-гарантированное по исходам и рискам решение в контр стратегиях.
Доказательство разобьем на два этапа. На этапе I докажем существование максимальной по Слейтеру контрстратегии xs(y),xs(-) £ B(Y,X), в задаче (1), а на этапе II покажем, что существует е-минимальная по Слейтеру неопределенность y£s £ Y. Тогда, по замечанию 4, е-5-гарантированное по исходам и рискам решение МЗН (1) существует и определяется тройкой {Xs{у), f(xs(yes), yes), $(xS(yss), yss)).
Этап I. Рассмотрим многозначное отображение Х*(у) : Y —> X, определяемое множеством всех максимальных по Слейтеру контрстратегий жs(y) в iV-критериальной задаче при неопределенности (1),
Т(у) = (B(Y,X),{Mx(y),y)}teN)
при каждом у £ У. Множество Х*(у):
1) непусто при каждом у £ У;
2) при каждом у £ У является компактным подмножеством множества X;
3) полунепрерывно сверху по включению при изменении у £ У (согласно лемме 2). Учитывая, кроме этих трех фактов, компактность X и У, по теореме об измеримом выборе [5, с. 26]
получаем, что существует измеримый по Борелю селектор ж5(-) многозначного отображения Х*(-), т.е. существует измеримая по Борелю вектор-функция ж5(у) £ Х*(у), которая при каждой неопределенности у £ У и каждом г £ N удовлетворяет требованию 1 приведенного в этом разделе определения.
Этап II. Скалярные функции /¿(ж, у) и —ФДж,у), i £ N, в силу их непрерывности и компактности множеств X и У ограничены снизу на X X У. По этим функциям и полученной на этапе I контрстратегии xs(у) построим суперпозиции Fi(y) = /¿(ж5(у), у), ^¿_|_дг(у) = —ФДж5(у), у), г £ N. Скалярные функции Fj(y), j = 1,..., 2N, ограничены снизу, так как га-вектор-функция xs(y) : У —> X измерима по Борелю по у на У (как суперпозиция непрерывной от измеримой функции). Таким образом, мы получили 2iV-KpHTepHanbHyro задачу
(Y,{Fj(.y)h=1.....2JV>.
В этой задаче критерии Fj(y), j = 1,..., 2N, измеримы по Борелю и ограничены снизу на У.
Пусть компоненты £j, j = 1,..., 2N, вектора е = (ei,..., £2n) — сколь угодно малые положительные числа. Тогда, согласно приведенному в этом разделе утверждению, существует e-5-минимальная неопределенность yss.
Следовательно, в результате этапов I и II показано, что существует пара (ж5(у), у|), удовлетворяющая требованиям 1 и 2 определения. Согласно замечанию 3, тогда е-5-гарантированное по исходам и рискам решение МЗН (1) примет вид
(ж5(у),/(ж5(у|),у|),Ф(ж5(у|),у|)). СПИСОК ЛИТЕРАТУРЫ
1. Жуковский В. И., Салуквадзе М. Е. Риски и исходы в многокритериальных задачах управления. Тбилиси: Интелекти, 2004.
2. Savage L.Y. The theory of statistical decision // J. American Statistic Association. 1951. N 46. P. 55-67.
3. Zhukovskiy V.l., Salukvadze M.E. The vector-valued maximin. N.Y.: Academic Press, 1994.
4. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.:Наука, 1982.
5. Аркин В. И., Левин B.JI. Выпуклость значений выпуклых интегралов, теоремы измеримого выбора и вариационные задачи // Успехи матем. наук. 1972. № 3. С. 21-77.
Поступила в редакцию 22.02.07