Научная статья на тему 'Гарантированное решение для рисконейтрала: аналог максимина в однокритериальных задачах'

Гарантированное решение для рисконейтрала: аналог максимина в однокритериальных задачах Текст научной статьи по специальности «Математика»

CC BY
83
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
STRATEGY / UNCERTAINTY / GAIN / FUNCTION OF RISK / RISK ACCORDING TO THE NIEHANS-SAVAGE / PRINCIPLE OF MINIMAX REGRET / СТРАТЕГИЯ / НЕОПРЕДЕЛЕННОСТЬ / ВЫИГРЫШИ / ФУНКЦИЯ РИСКА / РИСК ПО НИХАНСУ-СЭВИДЖУ / ПРИНЦИП МИНИМАКСНОГО СОЖАЛЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Жуковский В. И., Сачков С. Н., Сачкова Е. Н.

В середине прошлого столетия американский математик и статистик профессор Мичиганского университета Леонард Сэвидж (1917-1971) и известный швейцарский экономист, профессор Цюрихского университета Юрг Ниханс (1919-2007) независимо друг от друга предложили подход к выбору решения в однокритериальной задаче при неопределенности (ОЗН), названный впоследствии принципом минимаксного сожаления (по Нихансу-Сэвиджу). Этот принцип, наравне с вальдовским принципом гарантированного результата (максимина) играет важнейшее значение при принятии гарантированного решения в ОЗН. Основную роль в принципе минимаксного сожаления выполняет функция сожаления, определяющая риск по Нихансу-Сэвиджу в ОЗН. Такой риск получил в последние годы широкое применение в практических задачах микроэкономики. В настоящей статье предложен один из возможных подходов к нахождению решения в ОЗН «с позиции» рисконейтрала лица, принимающего решение (ЛПР), который стремится одновременно улучшить свой выигрыш (исход) и уменьшить риск («убить сразу двух зайцев одним выстрелом»). В качестве приложения явный вид такого решения найден для линейно-квадратичного варианта ОЗН достаточно общего вида.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Guaranteed Decision for Risk-neutrality: the Analogue of Maximin in One-criterion Problem

In the middle of the last century, the American mathematician and statistician Professor of the University of Michigan Leonard Savage (1917-1971) and the famous Swiss economist, Professor of the University of Zurich Jurg Niehans (1919-2007) independently proposed an approach to the choice of the solution in the one-criterion problem under uncertainty (OPU), called the principle of minimax regret (according to Niehans-Savage). This principle, along with the Wald’s principle of guaranteed result (maximin), plays a crucial role in making a guaranteed decision in OPU. The main role in the principle of minimax regret is the function of regret, which determines the risk according to the Niehans-Savage in the OPU. This risk has been widely used in practical management tasks in recent years. In this article, one of the possible approaches to finding a solution in OPU «from the position» of risk-neutrality the person making the decision, who simultaneously tries to improve its gain (outcome) and reduce the risk («to kill two birds with one stone with one shot ») is proposed. As an application, the explicit form of such solution is found for a linear-quadratic variant of the OPU in general form.

Текст научной работы на тему «Гарантированное решение для рисконейтрала: аналог максимина в однокритериальных задачах»

удк: 519.853.53:519.816 msc2010: 90с47

ГАРАНТИРОВАННОЕ РЕШЕНИЕ ДЛЯ РИСКОНЕЙТРАЛА: АНАЛОГ МАКСИМИНА В ОДНОКРИТЕРИАЛЬНЫХ ЗАДАЧАХ

© В. И. Жуковский

Московский государственный университет им. М. В. Ломоносова

факультет вычислительной математики и кибернетики Ленинские горы, Москва, ГСП-1, 119991, Российская Федерация e-mail: [email protected], istina.imec.msu.ru/profile/Zhukovskii_ VI

© С. Н. Сачков, Е. Н. Сачкова

Государственный гуманитарно-технологический университет физико-математический факультет ул. Зеленая, д.22, г.Орехово-Зуево, Московская область, 142600, Российская Федерация e-mail: [email protected], [email protected]

Guaranteed Decision for Risk-neutrality: the Analogue of Maximin in One-criterion Problem.

Zhukovskiy V. I., Sachkov S. N., Sachkova E. N.

Abstract.

In the middle of the last century, the American mathematician and statistician Professor of the University of Michigan Leonard Savage (1917 1971) and the famous Swiss economist, Professor of the University of Zurich Jurg Niehans (1919 2007) independently proposed an approach to the choice of the solution in the one-criterion problem under uncertainty (OPU), called the principle of minimax regret (according to Niehans Savage). This principle, along with the Wald's principle of guaranteed result (maximin), plays a crucial role in making a guaranteed decision in OPU. The main role in the principle of minimax regret is the function of regret, which determines the risk according to the Niehans Savage in the OPU. This risk has been widely used in practical management tasks in recent years. In this article, one of the possible approaches to finding a solution in OPU «from the position» of risk-neutrality the person making the decision, who simultaneously tries to improve its gain (outcome) and reduce the risk («to kill two birds with one stone with one shot ») is proposed. As an application, the explicit form of such solution is found for a linear-quadratic variant of the OPU in general form.

Keywords: strategy, uncertainty, gain, function of risk, risk according to the Niehans Savage, the principle of minimax regret.

1. Введение

1.1. Интервальные неопределенности. Математическая модель принятия решения в конфликте в настоящей статье представлена в виде ОЗН — однокритери-альной задачи при неопределенных факторах (интервальных неопределенностях). Считаем, что о неопределенностях ЛПР (лицу, принимающему решение) известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют (по тем или иным причинам). Сами неопределенности возникают за счет неполноты (неточности) знаний о реализациях выбранных ЛПР стратегий. Например, экономическая система, как правило, подвергается неожиданным трудно прогнозируемым возмущениям как извне (изменение количества и номенклатуры поставок, скачки спроса на товары, выпускаемые данным производством), так и изнутри (появление новых технологий, поломка и замена оборудования, несовпадение реальных сроков пуска нового оборудования с планируемыми и так далее). Естественно возникает вопрос: как при выборе стратегий учитывать наличие неопределенностей? Наконец, в публикациях по экономике отмечается, что

во-первых, современные экономические системы отличаются большим количеством элементов и связей между ними, высокой степенью динамичности, наличием нефункциональных связей между элементами, а также действием субъективных факторов, обусловленных участием человека или коалиции в процессах функционирования экономических систем; иначе говоря, экономическая система обычно функционирует в условиях неопределенности внешней и внутренней среды;

во-вторых, как уже упоминалось, источниками неопределенностей в экономических системах являются: отсутствие достаточных сведений об экономических процессах и условиях их протекания, случайное или преднамеренное противодействие со стороны других субъектов, действие случайных факторов, которые нельзя предугадать, предсказать в силу неожиданности их возникновения;

в-третьих, для оценки неопределенности используют детерминированные, вероятностно-статистические подходы, а также подходы, основанные на понятии лингвистической переменной и нечеткого множества.

В экономической литературе, вообще говоря, складывается следующая классификация неопределенностей:

- по степени неопределенности: вероятностная, лингвистическая, интервальная, полная неопределенность;

- по характеру неопределенности: параметрическая, структурная, ситуационная, стратегическая;

- по использованию получаемой в ходе управления информации: устранимая и неустранимая.

Заметим, что у Диева В. С. в [1] приводится более подробная классификация неопределенностей в современных экономических системах.

Обзор интервальных неопределенностей можно найти так же в книгах [2, 3] и других публикациях.

Каждый из видов неопределенностей требует (для ее учета) своего подхода. В настоящей статье мы ограничимся только интервальными неопределенностями (о них известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют по тем или иным причинам), а учет самих неопределенностей будет осуществляться способом, предложенным В. И. Жуковским в [4-6], который дает возможность перехода от исходной задачи принятия решения в однокритериальной задаче при неопределенности (ОЗН) к однокритериальной задаче, но уже без неопределенности.

1.2. Принцип минимаксного сожаления. Одной из важнейших задач математической теории ОЗН традиционно считается выработка принципов оптимальности, т. е. ответ на вопрос: какое поведение ЛПР следует считать оптимальным (разумным, целесообразным), а также исследование вопросов существования и способов построения гарантированного решения. Как раз возможному ответу на эти вопросы для ОЗН и посвящена настоящая статья.

Во главу понятия оптимальности математическая теория игр рекомендует ставить концепцию устойчивости: отклонение ЛПР от рекомендованной в настоящей статье оптимальной стратегии не может улучшить, но может и ухудшить выигрыш и связанный с его получением риск.

Перейдем к постановке задачи. Рассматривается однокритериальная задача при неопределенности Г(1) = (X, У, /(х, у)). В Г(1) ЛПР выбирает свою стратегию х € X С И,п, стараясь максимизировать значение скалярного критерия /(х,у), ориентируясь на всевозможные реализации неопределенности у € У С И,т. Напомним, что о неопределенности известны только границы, внутри которых она принимает значения.

Присутствие неопределенностей приводит к появлению множества результатов

/(х, У) = {/(х,у)| Уу € У} ,

«порожденных» х € X. Множество /(х, У) можно «сузить», используя риски.

Учет рисков является актуальной задачей в экономике, что подтверждает Нобелевская премия 1990 года, присужденная Гарри Максу Марковицу [7] за новый

подход к исследованию риска инвестиционных доходов. Что же такое риск? Известный российский специалист по теории оптимизации Талгат Касимович Сиразетдинов считает, что в настоящее время не существует строгого математического определения риска [8, с. 31]. В монографии [9, с. 15] рассматривается шестнадцать различных определений риска. Большинство из них требуют статистических данных о неопределенности. Однако зачастую исследователь операций (ИО) не обладает подобной информацией (по тем или иным причинам). Именно такие ситуации и рассматриваются в настоящей статье.

Под риском будем понимать возможность отклонения реализующихся значений критерия от желаемых. Заметим, что это определение перекликается с «обычными» микроэкономическими рисками, подробно описанными, например, в [10, с. 40-50].

Напомним, что в 1939 году румынский математик, эмигрировавший в 1938 году в Америку, Абрахам Вальд (1902-1950) ввел [11, 12] принцип максимина (гарантированного результата), позволяющего находить гарантированный исход в частности и для однокритериальной задачи при неопределенности (ОЗН). Почти через 10 лет известный швейцарский экономист Юрг Ниханс в 1948 году и американский математик, экономист и статистик Леонард Сэвидж (1917-1971) в 1951 году независимо предложили в [13, 14] принцип минимаксного сожаления, позволяющий для ОЗН строить гарантированный риск, получивший в литературе название «риск по Сэви-джу» (позднее назван «критерием Ниханса-Сэвиджа»). Заметим, что Леонард Сэвидж во время Второй мировой войны работал ассистентом по статистике у самого Джона фон Неймана, что несомненно сказалось на появлении принципа минимаксного сожаления, а с 1997 года в США утверждена премия Сэвиджа, которая ежегодно присуждается авторам двух самых выдающихся диссертаций в области экономики и статистики.

Для однокритериальной задачи Г(1) = (X,Y,f (x,y)) принцип минимаксного сожаления заключается в построении пары (xr, Rf) G X xR, удовлетворяющей цепочке равенств

Rf = max Rf (xr ,y) = minmax Rf (x, y), (1)

f ygY xgX ygY

где функция риска (по Нихансу-Сэвиджу)

RfУ) = maX f (z, У) - f (x, y)- (2)

zgX

Само значение Rf из (1) называют риском (по Нихансу-Сэвиджу) в задаче Г(1). Функция риска Rf (x, y) оценивает насколько реализовавшееся значение критерия f (x, y) «не достает до самого лучшего» (для ЛПР в задаче Г(1)) значения maxzgX f (z, y). Очевидно, что ЛПР стремится (за счет выбора своей стратегии x G X)

возможно уменьшить Rf(х,у), естественно рассчитывая (по принципу гарантированного результата) на наибольшее противодействие со стороны неопределенности (см. (1)). Поэтому следуя (1) и (2), ЛПР является оптимистом (стремится к «самому хорошему для себя» значению шаххеХ /(х, у), в отличие от ЛПР-пессимиста (ориентированного на «самый плохой для него» случай: на вальдовское максиминное решение (х0, /0 = шахжех шт^у /(х, у) = шт^у /(х0, у)).

Далее будем считать, что ЛПР в задаче Г(1) выступает как оптимист: он при принятии решения формирует для /(х, у) функцию риска (по Нихансу-Сэвиджу) (2), значение которой принято называть риском (по Нихансу-Сэвиджу). Отметим два обстоятельства: во-первых, критерию /(х, у) из Г(1) будет отвечать «свой» риск Rf (х,у) (см. (2)), во-вторых, ЛПР стремится выбрать стратегии х € X таким образом, чтобы возможно уменьшить риск Rf(х,у), одновременно ориентируясь на реализацию любой стратегической неопределенности у(-) € Ух, у(х) : X ^ У.

Замечание 1. Модели вида Г(1) появляются, например, на рынке, когда продавец в условиях непредвиденного импорта пытается максимизировать свою прибыль и уменьшить связанный с этим свой риск.

Учет рисков является актуальной задачей в экономике, что, как упоминалось выше, подтверждает Нобелевская премия 1990 года, присужденная Гарри Максу Мар-ковицу [7] за новый подход к исследованию риска инвестиционных доходов. Также во многих публикациях по макроэкономике [2, 10] всех ЛПР делят на три категории. К первой относятся те, кто не любит рисковать (рискофобы - греч. «ркоЬоз» означает «боязнь» чего-либо), вторые - любители риска (рискофилы - греч. «рНИга» означает «любовь» к чему-либо) и, наконец, третьи, кто решил одновременно учитывать как исходы, так и риски (рисконейтралы). В этой статье будем считать ЛПР рисконейтралом (и, конечно, как упомянуто выше, оптимистом).

1.3. Иерархическая интерпретация принципа минимаксного сожаления. Перейдем к двум иерархическим интерпретациям: первая возникает при самом формировании функции риска по Нихансу-Сэвиджу Rf (х, у) = шахгех /(г, у) — /(х, у), вторая — при нахождении решения (хг, Rf) € X х И задачи Г(1) с точки зрения рискофила.

Иерархическая интерпретация процесса построения функции риска по Нихансу-Сэвиджу. Иерархические игры представляют собой математическую модель конфликта с фиксированной последовательностью ходов и обменов информацией между его участниками [19, с. 477]. Активное развитие иерархических игр в России началось во второй половине прошлого века, возглавлялось Юрием Борисовичем Гермейером [15] (создателем кафедры исследования операций на факультете

вычислительной математики и кибернетики МГУ имени М.В. Ломоносова) и продолжается сейчас его учениками. Для игр двух лиц такие игры описывают взаимодействие между верхним (ведущим) и нижним (ведомым) уровнями иерархии. Задается последовательность ходов игроков, т. е. очередность выбора стратегий и (возможно) сообщение об этом выборе партнеру.

Важной частью иерархических игр является выбор класса используемых стратегий в зависимости от доступной игрокам информации. В теории иерархических игр четко сформулировано [16] математическое определение информационного расширения игры, которое, например, в частном случае, приводит к использованию в Г(1) наряду с чистыми неопределенностями y 6 Y и так называемых информированных (стратегических) неопределенностей — m-вектор-функций y(x) : X — Y, y(-) 6 YX.

Перейдем непосредственно к иерархической интерпретации построения функции риска для ОЗН Г(1). Будем предполагать, что ведомый игрок может применять только свою чистую стратегию y 6 Y, а ведущий имеет возможность использовать «любую мыслимую информацию» [17, с. 353]. Итак, ограничимся чистыми стратегиями ведомого y 6 Y и контрстратегиями ведущего x(y) : Y — X, x(-) 6 XY (множество функций x(y), определенных на Y со значениями в X). При формировании функции риска будем рассматривать следующую двухуровневую двухшаговую иерархическую игру

Гй = (XY, Y, f (x,y)> .

В ней первый ход за ведомым (игроком нижнего уровня иерархии): он сообщает на верхний уровень свои возможные чистые стратегии y 6 Y.

Второй ход за ведущим (игроком верхнего уровня): он, во-первых, аналитически конструирует свою контрстратегию x(y) : Y — X:

x(y) 6 Y(x) = Arg max f (x,y) Vy 6 Y,

т. е. находит скалярную функцию f [y] = f (x(y), y) = maxxgX f (x, y); во-вторых, формулирует затем саму функцию риска по Нихансу-Сэвиджу

Rf (x,y) = f [y] - f (x,y).

Построение решения игры Г(1) для рискофила. Здесь считаем, что уже найден явный вид функции риска Ниханса-Сэвиджа Rf (x,y) = maxzgX f (z,y) — f (x,y), а задача сводится к построению пары (xr, Rf) 6 X х R, определяемой как решение ОЗН Г(1) «с позиции» рискофила (любителя рисков):

Rf = min max Rf (x,y) = max Rf (xr,y).

f xgX y£Y V&Y

Рассматривая задачу Г(1), предполагаем, что ведущий ограничился только выбором чистой стратегии х € X, а другой игрок (ведомый) может использовать любую мыслимую информацию [17, с. 353], в том числе и знание стратегии х € X (информационная дискриминация ведущего); затем формирует свою стратегию (неопределенность) как функцию у(х) : X ^ У, у(-) € Ух. В таком случае критерий в Г(1) определяется скалярной функцией /(х,у(х)).

Напомним, что функции вида у(-) € Ух (множество т-вектор-функций, определенных на X со значениями в У) в теории дифференциальных игр называются контрстратегиями, а задача вида Г(1), где контрстратегии используются для представления неопределенности, названа в [17] минимаксной игрой.

Итак здесь рассматриваем иерархическую двухуровневую трехшаговую игру двух лиц (ведущего и ведомого), но в отличие от Гд ведущий использует чистую стратегию х € X, а ведомый — контрстратегию у(х) : X ^ У, у(-) € Ух.

Первый ход за ведущим: он передает на нижний уровень свои возможные стратегии х € X.

Второй ход за ведомым: он аналитически конструирует у(х), согласно

шах Rf (х, у) = Rf (х,у(х)) = Rf [х] Ух € X, у(-)еУ х

предполагая, что вектор-функция у(х) единственна (например, для строго вогнутой по у при каждом х € X скалярной функции Rf(х,у)), передает Rf [х] на верхний уровень.

Третий ход за ведущим: он строит стратегию хг € X такую, что шшхех Rf [х] = Rf [хг] = R^.

Приведенное «трехходовое понятие» укладывается полностью в определение гарантированного результата первого (ведущего) игрока в игре

Г(1) (

по Гермейеру), если в работе [5, с. 104] заменить функцию выигрыша ведомого на —Rf (х, у). Не трудно видеть также, что находясь в рамках игры Гд, ведущий игрок, если знает правило поведения ведомого, может сам вычислить реакцию ведомого и сазу реализовать третий ход. Еще раз подчеркнем, что аналог и модификацию такого «трехходового понятия» удобно применять к построению гарантированного решения для рискофи-ла с учетом исходов и рисков для бескоалиционного и кооперативного вариантов конфликта.

Замечание 2. Минимаксное решение для рискофила определяется парой (хг, Rr• = штхех шаху(.)еУх Rf (х, у) = шахуеу Rf (хг, у)) по двум причинам:

а) каждой стратегии х € X (в результате операции внутреннего максимума из второго хода шахуеу Rf (х,у) = Rf (х, у(х)) = Rf [х]) ставится в соответствие «самый

большой» из возникающих при стратегии x риск по Нихансу-Сэвиджу

Rf [x] = max Rf (x, y) > Rf (x,y) Vy £ Y,

yeY

т. е. Rf (x,y) не может при Vy £ Y стать больше Rf [x] и поэтому Rf [x] можно считать гарантией, обеспеченной рискофилу при выборе им стратегии x; заметим, что согласно (2), всегда Rf (x, y) > 0, поэтому возможные значения функции риска по Нихансу-Сэвиджу Rf (x,y) £ [0,Rf [x]] при всех (x, y) £ X x Y;

b) рискофил, как любой ЛПР, хотел бы реализовать свои решения (выбор x £ X) с наименьшим риском (лучше с нулевым!); этим обстоятельством как раз и вызван третий ход — при принятии решения рискофилом.

Таким образом, рискофилу предлагается применить в задаче Г(1) стратегию xr, тем самым «обеспечивая себе» наименьшую (минимальную) гарантию Rf [xr] = Rf(xr,y(xr)) > R(xr,y) Vy £ Y. Этот же прием применим при формализации сильно гарантированного по исходам и рискам решения задачи Г(1).

Приведем результат из теории исследования операций, касающийся информированных неопределенностей и стратегий.

Лемма 1. Если в Г(1) = (X, Y, f (x, y)) множества X, Y суть компакты, а функция f(x,y) непрерывна на X x Y, то функция максимума (минимума) maxxgX f (x,y) (minygY f (x,y)) непрерывна на Y(X).

Лемма 1 — известный факт, имеющийся в почти всех учебных пособиях по исследованию операций, например [18, с. 54,187].

Замечание 3. Из леммы 1 следует непрерывность функции риска (2) на X x Y (только если в Г(1) множества X и Y компактны и f (x, y) непрерывна на X x Y).

Замечание 4. Пусть в Г(1) множества X £ comp Rn (множество компактов из Rn), Y £ comp Rm и f (■) £ C(X x Y) (непрерывна на X x Y), тогда гарантированное по риску решение (xr, Rf) существует.

Действительно, функция риска по Нихансу-Сэвиджу Rf (x, y) из (2) непрерывна на X x Y (замечание 2). Но тогда, согласно лемме 1, непрерывной на X будет и функция maxygY Rf (x, y) = Rf [x] (существует измеримая по Борелю контрстратегия — селектор y(x) : X ^ Y такая, что

max Rf (x, y) = Rf (x,y(x)) = Rf [x] Vx £ X,

yeY

и Rf [x] непрерывна на X). По теореме Вейерштрасса непрерывная на компакте X функция Rf [x] достигает минимума в точке xr £ X. Тогда, если оба множества X и Y компакты и функция f (x, y) непрерывна, гарантированное по рискам решение (xr, Rf), определенное в (1), существует.

Таким образом, следуя хг, рискофил «обеспечивает» себе гарантию по риску Я/ > Я/ (X, у) Уу € У и эта гарантия Уж € X будет наименьшей по сравнению с остальными гарантиями Я/ [ж] > Я/ (ж, у) для всех стратегий ж € X. Подчеркнем еще раз, что такая процедура характерна для рискофила (любителя рисковать). Мы же дальше в данной статье обсудим аналогичную процедуру для рисконейтрала.

2. Новый подход к принятию РЕШЕНИЯ в ОЗН для РИСКОНЕЙТРАЛА

2.1. Предварительные замечания. Здесь используем подход, предложенный для бескоалиционных игр в [21]. Для этого от ОЗН Г(1) (при неопределенности) перейдем к «задаче гарантий», но уже без неопределенностей.

На содержательном уровне задачей ЛПР до сих пор было выбор им стратегии таким образом, чтобы добиться возможно большего своего выигрыша. Но рисконей-тралу этого мало! Он стремится выбрать стратегию таким образом, чтобы не только его выигрыш стал бы возможно большим, но и одновременно возникший при этом риск возможно меньшим. Именно, напомним, что ЛПР формирует функцию риска по Нихансу-Сэвиджу Rf (x, y) (2), значение которой называется риском ЛПР, а сам риск по Нихансу-Сэвиджу Rf определяется цепочкой равенств (1). Пара (xr, Rf) образует решение задачи Г(1) для рискофила (любителя рисковать), ибо число Rf (x, y) характеризует риск ЛПР при выборе и реализации стратегии x 6 X. Причем считаем,что именно такой риск ЛПР стремится по возможности уменьшить. Здесь естественно возникают два вопроса:

1. Как совместить для ЛПР указанные два желания (увеличение выигрыша и одновременно уменьшение риска) с помощью только одного критерия?

2. Как ЛПР осуществить оба желания единой ситуацией и при этом дополнительно учесть «действия» неопределенностей?

2.2. Как объединить желание ЛПР увеличить выигрыш и одновременно уменьшить риск?

Построение функции риска по Нихансу-Сэвиджу. Напомним, что, согласно принципу минимаксного сожаления (по Нихансу-Сэвиджу) и разделу 1.3 из настоящей статьи, риск у ЛПР определяется значением функции риска (сожаления) Rf (x,y) = maxzgX f (z, y) — f (x, y), где f (x,y) — платежная функция ЛПР в задаче Г(1). Итак, чтобы построить функцию риска Rf (x,y) для ЛПР следует, в первую очередь, определить «зависимый» максимум f [y] = maxxgX f (x,y) при Vy 6 Y. Для нахождения f [y] приходится в свою очередь предполагать (в соответствии с приведенной в разделе 1.3 теории двухуровневых иерархических игр) дискриминацию игрока нижнего уровня, формирующего неопределенность y 6 Y и передающего эту

информацию на верхний уровень при построении контрстратегии x(y) : Y ^ X такой, что

maxf (x,y) = f (x(y),y) = f [y] Vy £ Y.

IgX

Множество таких контрстратегий обозначается через XY (множество n-вектор-функций x(y) : Y ^ X, определенных на Y со значениями в X). Итак, при нахождении первого слагаемого в (2) на верхнем уровне иерархии следует для каждой неопределенности y £ Y решить однокритериальную задачу (XY, Y, f (x, y)), где напомним XY — множество контрстратегий x(y) : Y ^ X. Задача состоит в построении скалярной функции f [y], которая определяется формулой

f [y] = „max- f (x, y) Vy £ Y. (3)

А уже затем строятся функции риска (по Нихансу-Сэвиджу) по формуле (2).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Непрерывность функции риска, сильно гарантированные выигрыши и сильно гарантированные риски. Здесь и ранее множество компактов евклидова пространства Rk обозначались comp Rk, факт непрерывности скалярной функции ■ (x) на множестве X обозначаем ф(-) £ C(X).

Основную роль в этом подразделе будет играть (см. лемму 1)

Утверждение 1. Если X G comp Rn, Y G comp Rm и функция f (■) G C(X x Y), то

a) функция максимума maxxgX f (x,y) также будет непрерывной на Y;

b) функция минимума minygY f (x, y) непрерывна на X.

Следствие 1. Если в задаче Г(1) множество X G comp Rn, Y G comp Rm и f (■) G C(X x Y), то функция риска по Нихансу-Сэвиджу Rf (x, y) будет непрерывной на X x Y (см. замечание 3).

Перейдем к сильно гарантированным выигрышу и риску в ОЗН Г(1). В серии статей [4, 5] предложено три разных способа учета неопределенностей для принятия решения в конфликтных задачах при неопределенности. Ограничимся здесь одним из трех. Он заключается в том, что платежной функции /(х, у) в задаче Г(1) ставится в соответствие ее сильная гарантия /[х] = штуеу /(х,у). Отсюда же следует, что ЛПР, выбирая свои стратегии х € X, обеспечивает себе выигрыш /[х] < /(х,у) Уу € У (при реализации любой неопределенности у € У). Такой сильно

гарантированный выигрыш (исход) / [ж] достаточно естественен при рассматриваемых в этой статье интервальных неопределенностях у € У, ибо о у кроме информации о множестве возможных значений У С И,™ никаких дополнительных вероятностных характеристик у ЛПР не имеется. Наконец, утверждение 1, следствие 1, а также непрерывность /(ж, у) и Я/ (ж, у) на X х У позволяет сразу установить

Утверждение 2. Если в ОЗН Г(1) множества X и У суть компакты, а платежная функция /(ж, у) непрерывна на X х У, то сильно гарантированный выигрыш

f [x] = min f (x,y) (4)

yeY

и сильно гарантированный риск

Rf [x] = max Rf (x,y) (5)

yeY

будут непрерывными на Х скалярными функциями.

Замечание 5. Во-первых, смысл гарантированного выигрыша f [x] из (4) в том, что для любых y 6 Y реализовавшийся выигрыш f (x, y) будет не меньше, чем f [x], то есть используя в Г(1) свою стратегию x 6 X, ЛПР «обеспечит» себе выигрыш f (x,y) не меньший, чем f [x] при любой неопределенности y 6 Y. Таким образом, сильно гарантированный выигрыш (исход) f [x] ограничивает снизу возможные выигрыши f (x,y), которые только возникают, когда неопределенность y «пробегает» все значения из Y. Во-вторых, сильно гарантированный риск Rf [x], наоборот, ограничивает сверху все риски (по Нихансу-Сэвиджу Rf(x,y)), которые только могут реализоваться при любых неопределенностях y 6 Y. Действительно, из (5) сразу следует неравенство

Rf [x] > Rf (x,y) Vy 6 Y.

Итак, применяя свою стратегию x 6 X, ЛПР, с одной стороны «обеспечивает себе» сильную гарантию по выигрышу f [x], и, с другой стороны, одновременно сильную гарантию по риску Rf [x].

Переход от ОЗН Г(1) к двухкритериальной задаче векторной оптимизации. Отвечает желанию ЛПР увеличить свой выигрыш и одновременно уменьшить риск новая математическая модель двухкритериальной задачи при неопределенности и двухкомпонентным векторным критерием

Г2 = (X, Y, {f (x,y), —Rf (x,y)}>.

Здесь X и Y те же, что и в Г(1), новым является лишь переход от однокомпонентного f (x,y) к двухкомпонентному критерию {f (x,y), —Rf (x,y)}, причем Rf (x,y) является функцией риска (по Нихансу-Сэвиджу) для ЛПР. Заметим, что Rf (x, y) в задаче

Г2 взято со знаком «минус», ибо в этом случае ЛПР выбором своей стратегии х € X стремится возможно увеличить оба критерия одновременно. При этом предполагается реальность появления любой неопределенности у € У. Заметим, что в силу Л/ (х, у) > 0 при У(х, у) € X х У, увеличение —Л/(х, у) эквивалентно уменьшению

Л/ (х,у).

Использование в задаче Г2 лишь интервальных неопределенностей у € У (о них известны лишь границы изменения), обосновывает для ЛПР возможность ориентироваться на сильно гарантированный выигрыш / [х] из (4) и сильно гарантированный риск Л/ [х] из (5). Такой подход приводит к переходу от Г(1) к двухкомпонентной задаче векторной оптимизации, но уже без неопределенности

Г2 = (X, {/[х], —Д/[х]» ,

в которой ЛПР следует выбрать свою стратегию х € X таким образом, чтобы достичь возможно больших значений обоих критериев /[х] и —Л/ [х] одновременно.

Затем для практического построения сильно гарантированных выигрыша и риска в Г2 следует привлечь многочисленные результаты математической теории векторной оптимизации, например, из [22] с ее различными подходами и результатами. Остановимся здесь на решении многокритериальной задачи, предложенной в 1909 году итальянским экономистом и социологом Вильфредо Парето [23]. Для Г22 максимальность по Парето (эффективность) стратегии хр сводится к несовместности, для любых х € X, системы из двух неравенств /[х] > /[хр], —Л/[х] > —Л/[хр], из которых хотя бы одно строгое. В результате приходим к следующему понятию

Определение 1. Тройку (хр,/[хр],Л/[хр]) назовем сильно гарантированным па-ретовским решением по исходам и рискам (СГИР) задачи Г2, если

a) хр — максимально по Парето в задаче Г2;

b) / [хр] — значение сильно гарантированного выигрыша / [х] = штуеу / (х, у) в Г2 при х = хр;

c) Л/ [хр] — значение сильно гарантированного риска Л/ [х] = шахуеу Л/ (х, у) также при х = хр.

Замечание 6. В определение 1 можно было бы привлечь и другие концепции оптимальности из теории многокритериальных задач: максимальность по Слейтеру, по Борвейну, по Джоффриону, А-максимальность, конусную оптимальность. Все эти концепции можно найти в книге [24], там также охвачена и связь между различными векторными оптимальными стратегиями.

Согласно определению максимальности по Парето

a) если xP — максимальна по Парето, то увеличение одного из критериев при x = xP и x 6 X, неизбежно приведет к уменьшению одного из оставшихся;

b) не существует такой стратегии x 6 X, при которой значения всех критериев увеличатся по сравнению со значениями x = xP.

Отметим, что впервые термин «максимальность по Слейтеру» появился в России, повидимому, в книге [25] в статье Гурвица Л.

Если вместо оптимальности по Парето в определении 1 применить максимальность по Слейтеру (слабая эффективность), то определение 1 примет вид

Определение 2. Тройку (xS, f [xS],Rf [xS]) назовем сильно гарантированным слей-теровским решением задачи Г22, если

a) стратегия xS 6 X — максимальна по Слейтеру в задаче Г22, т. е. при любых x 6 X несовместна система из двух строгих неравенств

f [x] > f [xS], —Rf [x] > —Rf [xS];

b) f [xS] — значение сильно гарантированного выигрыша при x = xS в игре Г2;

c) Rf [xS] — значение сильно гарантированного риска при x = xS в игре Г22.

Любая эффективная (максимальная по Парето) стратегия является одновременно слабо эффективной, что сразу следует из определений 1 и 2, обратное утверждение, вообще говоря, не имеет места, также свойство b) из замечания 6 справедливо и для сильно гарантированного слейтеровского решения задачи Г(1). Очевидно следующее

Утверждение 3. Если в задаче Г22 существует xP 6 X и числа а, в 6 (0,1) такие, что хр является максимизатором скалярной функции Ф^] = af [x] — в Rf [x], то есть

Ф^р] = max (af [x] — вRf [x]), (6)

то xP будет максимальной по Парето в задаче Г22, то есть при любых x 6 X несовместна систем из двух неравенств

f [x] > f [xP], Rf [x] < Rf [xP], (7)

из которых хотя бы одно строгое (будем использовать а = в = 1).

Замечание 7. Свертка критериев (4) и (5) в виде Ф^] = af [x] — в Rf [x] представляет интерес. Действительно, если даже при x = xP получим увеличение гарантированного исхода f [x] > f [xP], то, в силу максимальности по Парето стратегии xP и Rf [x] > 0, такое улучшение гарантированного выигрыша f [x] > f [xP] неизбежно приведет к увеличению гарантированного риска Rf [x] > Rf [xP] и, наоборот,

уменьшение гарантированного риска Rf [x] < Rf [xP] по тем же причинам приведет к уменьшению исхода f[x] < f [xP] (оба случая для ЛПР нежелательны). Таким образом, во-первых, замена двухкритериальной задачи Г2 на однокритериальную (X, Ф[x] = af [x] — ßRf [x]) отвечает желанию ЛПР увеличить f [x] и одновременно уменьшить Rf [x]. Во-вторых, увеличение разности af [x] — ßRf [x], в силу Rf [x] > 0 и a, ß G (0,1), отвечает также желанию ЛПР увеличить гарантированный выигрыш f [x] и одновременно уменьшить гарантированный риск Rf [x].

Перейдем к ответу на второй вопрос из раздела 2.1: как осуществить оба желания ЛПР единой стратегией и учесть при этом наличие именно интервальной неопределенности? Для этого от задачи Г(1) последовательно перейдем к задачам Г1, Г2, Г3, где

Г = (X, Y, {f (x,y), —Rf (x,y)}) ,

Г2 = (X, {f [x], —Rf [x]}), (8)

Гз = (X, {ФИ = f [x] — Rf [x]}).

Во всех трех задачах стратегии x G X С Rn, неопределенности y G Y С Rm, на парах (x, y) G X x Y определена платежная функция f (x, y), а в (2) — функция риска (по Нихансу-Сэвиджу) Rf (x,y).

В игре Г1 платежная функция становится двухкомпонентной: к платежной функции f (x,y) в задаче Г(1) добавлена «минус» функция риска Rf (x,y) из (2).

В игре Г2 функции выигрыша f (x, y) и риска Rf (x, y) заменены их гарантиями f [x] = minygY f (x, y) и Rf [x] = maxygY Rf (x, y). Наконец, в игре Г3 вместо двухкомпонентной платежной функции использована линейная свертка гарантий f [x] и —Rf [x], диктуемая утверждением 3.

Замечание 8. Перечислим достоинства приведенного в определениях 1 и 2 решения.

Во-первых, снова напомним, что экономисты подразделяют ЛПР (лиц, принимающих решение) на три группы. К первой относятся те, кто не любит рисковать (рискофобы), вторые - любители риска (рискофилы) и, наконец, третьи, кто решил одновременно учитывать выигрыши и уменьшать риски (рисконейтралы). В определениях 1 и 2 считаем ЛПР рисконейтралом, т. е. учитывающим одновременно как выигрыш (исход), так и риск.

Во-вторых, для выигрышей определены границы снизу f [xP] < f (xP, y) Vy G Y, а для рисков — границы сверху Rf [xP] > Rf (xP, y) Vy G Y; заметим, что существование и непрерывность гарантий f [x] и Rf [x] есть следствие X G comp Rn, Y G comp Rm и f (■) G C(X x Y) (утверждение 1).

В-третьих, улучшение гарантированного паретовского выигрыша (по сравнению с f [xP]) неизбежно вызовет увеличение гарантированного риска (по сравнению с Rf [xP]), а уменьшение риска автоматически «спровоцирует» уменьшение гарантированного выигрыша.

Замечание 9. Определения 1 и 2 позволяют предложить следующий конструктивный способ построения СГИР. Он сводится к четырем этапам.

Этап I. По f (x,y) найти f [y] = maxxgX f (x,y) и построить функцию риска (по Нихансу-Сэвиджу) для критерия f (x,y), именно Rf (x,y) = f [y] — f (x,y).

Этап II. Определить сильные гарантии исхода f [x] = minygY f (x, y) и риска Rf [x] = maxygY Rf (x, y).

Этап III. Для двухкритериальной вспомогательной задачи Г2 вычислить максимальную по Парето стратегию xP. Здесь можно применить утверждение 3.

Тогда нахождение максимальной по Парето стратегии в задаче Г3 сведется к построению максимизатора xP для

max (f [x] — Rf [x]) = f [xP] — Rf [xP]. (9)

xgX

Этап IV. По xP определить значения сильных гарантий f [xP] и Rf [xP].

Полученная в результате тройка (xP, f [xP],Rf [xP]) как раз и образует искомое СГИР — решение, удовлетворяющее определению 1, то есть в результате применения стратегии xP порождается для платежной функции f (x,y) гарантированный исход f [xP] с гарантированным риском (по Нихансу-Сэвиджу) Rf [xP].

Предложенный здесь способ построения СГИР в следующем разделе настоящей статьи будет реализован для линейно-квадратичной ОЗН самого общего вида.

3. Явный вид Функции риска по Сэвиджу-НихАнсу для линейно-квадратичного варианта ОЗН

3.1. Постановка задачи. Рассматриваем однокритериальную линейно-квадратичную задачу при неопределенности

Г„ = (Rn, Rm, f (x,y)> .

Здесь множество стратегий x совпадает с n-мерным евклидовым пространством Rn, множество неопределенностей y есть Rm, платежная функция задана следующей линейно-квадратичной формой

f (x, y) = x'Ax + 2x'By + y'Cy + 2a'x + 2c'y + d,

где n x n-матрица А и m x m-матрица С постоянны и симметричны, прямоугольная n x m-матрица В постоянна, n-вектор а, m-вектор с, число d постоянны, штрих

сверху означает операцию транспонирования. В за счет выбора стратегии х € Ип ЛПР стремится достичь возможно больших значений платежной функции и возможно меньших значений функции риска, учитывая допустимость реализации любой неопределенности у € И™.

Задача состоит в построении в соответствии с замечанием 9 явного вида функции риска по Нихансу-Сэвиджу для , а затем и СГИР.

Далее используем обозначения:

для квадратной постоянной матрицы А > 0 (А < 0) ^^ квадратичная форма с матрицей А определенно положительна (соответственно, отрицательна);

0П — нулевой п-вектор; 1

1 =

дх

=

дх2

дх^

1

дхп д21

В'х\В'х\

д21

— градиент скалярной функции /(х, у) по х при фиксированном у;

д21

Вх\дхп

д21

гессиан функции /(х, у) по х при фиксированном

у;

дх„дх1 дх„дх„

— означает определитель матрицы А;

Еп — единичная п х п-матрица.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Непосредственно можно проверить, что

д д д д2 — (х'Ах) = 2Ах, —- (2х'Ву) = 2Ву, — (2а'х) = 2а, —- (х'Ах) = 2А. дх дх дх дх

3.2. Явный вид функции риска по Сэвиджу—Нихансу. Итак, приступим к построению явного вида функции риска Л/ (х, у) для задачи (в соответствии с этапом I из замечания 9).

Этап I. Построение явного вида функции риска Л/(х, у) по Сэвиджу-Нихансу для Гг<?.

Утверждение 4. Если в задаче матрица А < 0, то функция риска по Сэвиджу-Нихансу имеет вид:

Л (х,у) = — (х'А + у'В' + а' )А-1(Ах + Ву + а).

Доказательство. Достаточными условиями существования п-вектор-функции х(у), определенной на И™ со значениями в Ип и удовлетворяющей условию

тах/(г,у) = /(х(у),у) Уу € И™,

будут ограничения

df (x,y)

|x=x(y) = 2Ax(y) + 2By + 2a = 0n Vy 6 Rm,

x=x(y) = 2A < 0-

d x

d2f (x,y)

d x2

Второе требование выполнено в силу А < 0, а из первого тождества получаем

x(y) = — A-1(By + a).

Подставим x = x(y) в f (x,y)

max f (z, y) = f (x(y), y) = (y'B' + a' )A-1(By + a) — 2(y'B' + a' )A-1By+

zgR"

+y'Cy — 2a'A-1 (By + a) + 2c'y + d = — (y'B' + a' )A-1(By + a) + y'Cy + 2c'y + d = = y' [C — B'A-1B]y + 2(c' — a'A-1B )y + (d — a'A-1a). Тогда функция риска по Нихансу-Сэвиджу

Rf (x, y) = f (x(y), y) — f (x, y) = —x'Ax — 2x'By — 2a'x — y'B'A-1By—

—2a'A-1By — a'A-1a = —(x'A + y'B' + a' )A-1(Ax + By + a), что и требовалось доказать. □

3.3. Построение сильной гарантии для функции риска.

Этап II. Построим функцию Rf [x] = maxygRm Rf (x, y).

Утверждение 5. Пусть в задаче r1q

A < 0, detB = 0.

Тогда

Rf [x] = max Rf (x, y) = 0 Vx 6 Rn.

Доказательство. Прежде всего отметим, что из условия detB = 0 следует, что B — квадратная матрица, т. е. n = m. Для нахождения Rf [x] определим n-вектор-функцию y(x) : Rn ^ Rn такую, что

max Rf (x, y) = Rf (x, y(x)) = Rf [x] Vx 6 Rn.

При этом воспользуемся достаточными условиями достижения максимума при y = y(x) : Rn ^ Rn:

dRf^;,y) 1У=У(Х) = —2B'x — 2B'A-1By(x) — 2B'A-1a = 0m Vx 6 Rn,

^^^ |у=у(х) = —2В'А-1В > 0. (10)

Так как матрица А < 0, и = 0, то справедлива цепочка импликаций А-1 < 0 В'А-1В < 0 —В'А-1В > 0 —2В'А-1 В > 0 (т. е. имеет место второе требование из (10)).

Из первого тождества в (10) получаем, с учетом

(В'А-1В)-1 = В-1А(В' )-1,

у(ж) = — (В'А-1В )-1(В'ж + В'А-1а) = —В-1А(ж + А-1а) = — В-1(Аж + а). Подставляя найденное у = у(ж) в Лу [ж] имеем

[ж] = (ж,у(ж)) =

= — (ж'А — ж'А — а' + а')А-1(Аж — Аж — а + а) = 0 Уж е И", таким образом, справедливо тождество Лу [ж] = 0 Уж е Ип. □

Продолжая этап II (из замечания 9), найдем сильную гарантию выигрыша (исхода) штуеу /(ж, у), с учетом

/ (ж, у) = ж'Аж + 2ж'Ву + у'Су + 2а'ж + 2с'у +

Перейдем к построению сильной гарантии исхода / [ж] = ттуеи,т /(ж, у) при А < 0 и С > 0.

Лемма 2. [26, с. 89]. Для любой положительно определенной п х п-матрицы С существует и причем единственная положительно определенная п х п-матрица Б такая, что Б2 = С. Матрица Б называется квадратным корнем из матрицы С и обозначается С2. Причем собственные числа матрицы С равны квадратам собственных чисел матрицы С2.

Лемма 3. Если симметричная п х п-матрица С > 0, то С-1 = [Б2]-1 = [Б-1]2.

Доказательство. Действительно, для Б = С1 будет

С = Б ■ Б = Б2 С-1 = [Б ■ Б]-1 = Б-1 ■ Б-1 = [Б-1]2.

Лемма 4. Имеет место импликация

А < 0 Л С > 0=^ (А — ВСВ') < 0 УВ € Ипхт, где Ипхт — множество постоянных п х т-матриц. Доказательство. В самом деле, справедлива цепочка импликаций С > 0 С-1 > 0 ВС-1В' > 0 УВ € Ипхт —ВС-1В' < 0 УВ € Ипхт А — ВС-1В' < 0 УВ € Ипхт.

Утверждение 6. Если матрицы А < 0 и С > 0, то

f [x] = min f (x,y) = x'[A - BC-1B']x + 2x'[a - BC-1c] + d - c'C-1c. (11)

Доказательство. Согласно лемме 2 существует матрица S такая, что C = S2, причем C > 0 S > 0 Л S = S'. Тогда, с учетом S-1 S-1 = C-1 (лемма 3), SS = C и S-1S = En получим

f (x, y) = x'Ax + 2x'By + y'Cy + 2a'x + 2c'y + d =

= | | S-1 B'x + Sy + S-1c11 2 - x'BC-1B'x - 2x'BC-1c - c'C-1c - y'Cy-

—2x'By - 2c'y + x'Ax + 2x'By + 2a'x + d >

> x'[A - BC-1B']x + 2x'[a - BC-1c] + d - c'C-1c = f [x]

при yx G Rn,y G Rm, ибо евклидова норма ||-|| > 0. Тогда, по определению сильной гарантии исхода

f (x,y) > f [x] yx G Rn,y G Rm приходим к справедливости (11). □

Этапы III-IV (построение максимальной по Парето стратегии xP в задаче Г2 из (8) и нахождение f [xP]).

Как было установлено утверждением 5, если в r1q

A < 0, m = n, detB = 0, (12)

то сильно гарантированный риск Rf [x] = 0 при всех x G Rn, а значит и для максимальной по Парето стратегии xP в задаче Г3 из (8). Поэтому построение максимальной по Парето стратегии в задаче r1q при ограничениях (12) и C < 0 сведется к нахождению максимизатора для f [x], именно, к

mR f [x] = f [xP]. (13)

3.4. Явный вид сильно гарантированного паретовского решения задачи Г/9

Утверждение 7. Пусть в задаче

А < 0, С > 0, т = п, деШ = 0.

Тогда

жр = —[А — ВС-1В' ]-1 (а — ВС-1с), (14)

/ [жр] = —(а' — с'С-1В' )[А — ВС-1В']-1(а — ВС-1с) + д — с'С-1с. (15)

Доказательство. Достаточные условия существования стратегии жр из (13) сводят-

ся к

/ж |х=хр = 2[А — ВС-1В']жр + 2(а — ВС-1с) = 0п, (16)

/л 1х=хР = 2[А — ВС-1В']-1 < 0. (17)

Но (17) имеет место согласно лемме 4 и А < 0, С > 0, а из равенства (16) получаем, с учетом А — ВС-1В < 0,

жр = —[А — ВС-1В' ]-1 (а — ВС-1с).

Подставляя найденное здесь жр в (11), приходим к

/[жр] = (а' — с'С-1В')[А — ВС-1В']-1[А — ВС-1В'] ■ [А — ВС-1В']-1(а — ВС-1с) —

—2(а' — с'С-1В' )[А — ВС-1В' ]-1(а — ВС-1с) + д — с'С-1с = = —(а' — с'С-1В' )[А — ВС-1В' ]-1(а — ВС-1с) + д — с'С-1с.

Замечание 10. Итак для ОЗН Г1д получен следующий результат: если в линейно-квадратичной задаче

Г/9 = (И", Ит, /(ж, у) = ж'Аж + 2ж'Ву + у'Су + 2а'ж + 2с'у + д)

выполнены ограничения А < 0, С > 0, де£В = 0, то тройка (жр, /[жр],Л/[жр]), где

жр = —[А — ВС-1В' ]-1 (а — ВС-1с),

/ [жр] = —(а' — с'С-1В' )[А — ВС-1В']-1(а — ВС-1с) + д — с'С-1с, (18)

Л/ [жр ] = 0

является сильно гарантированным паретовским решением .

Этот результат, с точки зрения математической теории игр означает: если ЛПР будет в использовать стратегию хр из (18), то обеспечит себе сильно гарантированный исход /[хр] (см.(18)) с «самым хорошим» для ЛПР нулевым риском Л/[хР] = 0 (т. е. «наверняка»!). Причем, согласно лемме 4 «существенная» часть этого исхода

— (а' — с'С-1В')[А — ВС-1В']-1(а — ВС-1с) > 0.

Заключение

Простейшей конфликтной задачей при неопределенности была и остается «игра с природой», где следует выбрать действие (стратегию), оптимизирующее заданный критерий (например, прибыль). При этом каждое действие сопровождается неполнотой или неточностью информации (неопределенностью) о результатах такого действия.

Здесь возникает вопрос о риске, сопровождающем достигнутый результат. Целое направление исследований такого плана выделяется специальным видом неопределенностей (интервальных), о которых известны лишь границы изменения, но отсутствуют статистические характеристики.

Примером таких неопределенностей может служить задача о диверсификации между различными валютами годового вклада [27].

Неопределенности, о которых известны лишь границы изменения, в России получили [28] название «дурные неопределенности» из-за непредсказуемости их реализаций. Именно для оценки «действий» таких неопределенностей и используется функция риска по Сэвиджу-Нихансу, значение которой при конкретной стратегии и является мерой риска.

В статье решается задача выбора стратегии в ОЗН (однокритериальной задаче при неопределенности), которая бы учитывала, во-первых, «действия» неопределенности, во-вторых, стремление улучшить (увеличить) исход с одновременным уменьшением связанного с этим риска. Применяя концепцию сильной гарантии из [4, 5], в работе предложен новый подход, учитывающий все три указанных фактора (неопределенность, исход и риск) и сводящийся к построению «игры гарантий», в которой уже не содержится неопределенностей. А уже для игры гарантий решается задача двухкритериальной оптимизации. Заметим, что авторы в дальнейшем надеются применить другой подход из [4, 5], связанный с векторными гарантиями. Но уже предложенный здесь позволил найти явный вид гарантированного по риску и исходу решения в достаточно общем линейно-квадратичном варианте ОЗН и установить,

что гарантированный риск, а значит и любой риск по Нихансу-Сэвиджу, при этом будет нулевым.

Авторы благодарят участников семинара факультета вычислительной математики и кибернетики МГУ имени М.В. Ломоносова «Риски в сложных системах управления» за обсуждение работы и замечания.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №14-00-90408 Укр_а и НАН Украины проект №03-01-14.

СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Диев, В. С. Управленческие решения: неопределенность, модели, интуиция. — Новосибирский государственный университет, 2001. — 195 с.

DIEV, V. S. (2001) Managerial decisions: uncertainty, models, intuition. Novosibirsk state University. 195 p.

2. Черемных, Ю. Н. Микроэкономика. Продвинутый уровень . — М.: ИНФРА-М , 2008. — 843 с.

CHEREMNYKH, Yu. N. (2008) Microeconomics. Advanced level. M.: INFRA-M.

3. Жуковский, В. И. Риски в конфликтных ситуациях. — М.: URSS , 2011. — 330 с. ZHUKOVSKIY, V. I. (2011) Risks in conflict situations. М.: URSS.

4. Жуковский, В. И., Кудрявцев, К. Н. Уравновешивание конфликтов при неопределенности. Аналог максимина / / Математическая теория игр и ее приложение. — 2013. — II-T.5, № 2. — C. 3-45.

ZHUKOVSKIY, V. I. and KUDRYAVTSEV, K. N. (2013) Balancing conflicts under uncertainty. The Analogue of Maximinus. Mathematical game theory and its application. II-V.5, N. 2. p. 3-45.

5. Жуковский, В. И., Кудрявцев, К. Н. Уравновешивание конфликтов при неопределенности. Аналог седловой точки // Математическая теория игр и ее приложение. — 2013. — I-T.5, № 1. — C. 27-44.

ZHUKOVSKIY, V. I. and KUDRYAVTSEV, K. N. (2013) Balancing conflicts under uncertainty. The Analogue of a saddle point. Mathematical game theory and its application. I-V.5, N. 1. p. 27-44.

6. Жуковский, В. И., Кудрявцев, К. Н., Смирнова, Л. В. Гарантированные решения конфликтов и их приложения. — М.: КРАСАНД/URSS , 2013. — 368 с.

ZHUKOVSKY, V. I., KUDRYAVTSEV, K. N., SMIRNOVA, L. V. (2013) . Guaranteed solutions to conflicts and their applications. M: KRASAND/URSS.

7. MARKOVITS, N. P. (1952) Portfolio selection. Journal of Finance. Vol. 7. N. 1. p. 77-89.

8. Сиразетдинов, Т. К., Сиразетдинов, Р. T. Проблема риска и его моделирование // Проблемы человеческого риска. — 2007. — № 1. — C. 31-43.

SIRAZETDINOV, T. K., SIRAZETDINOV, R. T. (2007) The Problem of risk and its modeling. Problems of human risk. V.1. p. 31-43.

9. Ш^хов, В. В. Введение в страхование. Экономический аспект. — М.: Финансы и статистика, 2001. — 286 c.

SHAKHOV, V. V. (2001) Introduction to insurance. Economic aspect. M.: Finance and statistics. 286 p.

10. Цветкова, Е. В., Арлюкова, Н. О. Риск в экономической деятельности. — СПб.: ИВЭСЭП, 2002. — 64 c.

TSVETKOVA, E. V., ARLYKOVA, N. O. (2002) Risk in economic activities. SPb.: IVESEP. 64 p.

11. WALD, A. (1939) Contribution to the theory of statistical estimation and testing hypothesis. Annuals Math. Statist. V. 10. p. 299-326.

12. WALD, A. (1950) Statistical Decision Functions. N.Y.: Wiley. .192 p

13. SAVAGE, L. J. (1951) The theory of statistical decision. J. American Statistical Association. N. 46. p. 55-67.

14. NIEHANS, J. (1948) Zur Preisbildungen bei ungewissen Erwartungen. Schweizerische Gesellschaft fur Volkswirtschaft und Statistik. V. 84, N. 5. p. 433-456.

15. Гермейер, Ю. Б. Игры с непротивоположными интересами. — М.: Наука, 1978. — 327 c.

GERMEYER, Yu. B. (1978) Games with neprotivlenie interests. Moscow: Nauka. 327 p.

16. Кукушкин, И. С., Морозов, В. В. Теория неантагонистических игр. — М: МГУ им. М.В.Ломоносова, 1984. — 156 c.

KUKUSHKIN, I. S., MOROZOV, V. V. (1984) Theory of non-antagonistic games. M.: MGU im. M. V. Lomonosov. 156 p.

17. Красовский, Н. Н. , Субботин, А. И. Позиционные дифференциальные игры. — М.: Наука, 1974. — 456 c.

KRASOVSKII, N. N., SUBBOTIN, A. I. (1974) Positional differential games. Moscow: Nauka. 456 p.

18. Морозов, В. В., Сухарев, А. Г., Федоров, В. В. Исследование операций в задачах и упражнениях. — М.: Высшая школа, 1986. — 286 c.

MOROZOV, V., SUHAREV, A. and FEDOROV, V. (1986) Operations research in problems and exercises. Moscow: Nauka. 286 p.

19. Ватель, И. А., Ерешко, Ф. И. Игра с иерархической структурой // Математическая энциклопедия. — М, 1979. — Т.2. — C. 477-481.

VATEL ' I. A. and ERESHKO F. I. (1979) A Game with a hierarchical structure. Mathematical encyclopedia. M. V.2. p. 477-481.

20. Ватель, И. А., Ерешко, Ф. И. Математика конфликта и сотрудничества. — М.: Знание, 1974. — 64 c.

VATEL ' I. A. and ERESHKO F. I. (1974) Mathematics of conflict and cooperation. Moscow: Znanie. 64 p.

21. ZHUKOVSKIY, V. I., MAKARKINA, T. V. and VYSOKOS, M. I. (2007) A New Approach to Noncooperative Game Under Uncertainty. International Game Theory Review. V. 2, N. 19. p. 1750024-1-1750024-19.DOI 10. 1142/s0219198917500244

22. Подиновский, В. В., Ногин, В. Д. Парето-оптимальные решения многокритериальных задач. — М.: ФИЗМАТЛИТ, 2007. — 256 c.

PODINOVSKI, V. V., NOGIN, V. D. (2007) Pareto optimal solutions of multicriteria problems. M.: FIZMATLIT. 256 p.

23. PARETO, V. (1909) Manuel d'economic pohikique. Paris: Geard.

24. ZHUKOVSKIY, V. I.,SALUKVADZE, M. E. (1994) The Vector-Valued Maximin. N.Y. etc.: Academic Press. .396 p.

25. Эрроу, К. Дж., Гурвиц, Л., Удзава, Х. Исследования по линейному и нелинейному программированию. — M.: ИНЛ, 19б2. — 33б c.

ARROW, K. J., GURVITS, L., UZAWA, H. (19б2) Studies in linear and nonlinear programming. M: INL. 33б p.

26. Воеводин, В. В., Кузнецов, Ю. А. Mатрицы и вычисления. — M.: Наука, 19S4. — 31S c.

VOEVODIN, V. V., KUZNETSOV, Yu. A. (19S4) Matrices and calculations. Moscow: Nauka. 31S p.

2T. ZHUKOVSKIY, V. I., MOLOSTVOV, V. S. and TOPCHISHVILI, A. L. (2014) Problem of multicurrency deposit diversification - three possible approaches to risk accounting. International Journal of Operations and Quantitative Management. V. 20, N. 1. p. 1-14.

28. Вентцель, E. С. Исследование операций. — M.: Наука, 19SS. — 20S c. VENTZEL, E. S. (1988) Operations Research. Moscow: Nauka. 208 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.