Научная статья на тему 'Принцип "value at risk" в иерархической игре'

Принцип "value at risk" в иерархической игре Текст научной статьи по специальности «Математика»

CC BY
98
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ ТЕОРИЯ ИЕРАРХИЧЕСКИХ СИСТЕМ / INFORMATIONAL THEORY OF HIERARCHICAL SYSTEMS / ИГРЫ С НЕОПРЕДЕЛЕННЫМИ ФАКТОРАМИ / GAMES UNDER UNCERTAINTY / МАКСИМАЛЬНЫЙ ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ / MAXIMAL GUARANTEED PAYOFF / УПРАВЛЕНИЕ РИСКАМИ / RISK MANAGEMENT

Аннотация научной статьи по математике, автор научной работы — Горелов Михаил Александрович

Рассматривается иерархическая игра двух лиц, в которой функция выигрыша игрока нижнего уровня зависит от случайного фактора. Новым является принцип оптимальности: считается, что игрок верхнего уровня желает получить наибольший возможный результат с наперед заданной вероятностью. Таким образом, модель позволяет достаточно гибко учитывать склонность игрока верхнего уровня к риску.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The "value at risk" principle in hierarchical game

The two-player hierarchical game is considered. The bottom level player’s payoff is supposed to depend on random factor. The top level player is supposed to know the set of possible values of uncertain factors and probability measure on this set. And he assumes that the bottom level player knows the realized value of random factor when he chooses his control. The optimality principle is new. It is supposed that top level player wishes to obtain maximal possible result with prescribed probability. In such a way the model permits to take into account the inclination to risk of the top level player. Open loop and closed loop models are investigated. In both cases the original setting of the problem contains non elementary operation of choice of a set of negligible values of uncertain factors. The obtained results permit to replace this operation by the operation of calculating of mathematical expectation of random value. In both models the problem of calculating of maximal guaranteed result of top level player and search of his optimal strategy is reduced to calculating a minimax on “finite-dimensional” sets.

Текст научной работы на тему «Принцип "value at risk" в иерархической игре»

УДК 519.865 + 519.95 ББК 22.165

ПРИНЦИП «VALUE AT RISK» В ИЕРАРХИЧЕСКОЙ ИГРЕ

Горелов М. А.1

(Вычислительный центр им. А.А. Дородницына ФИЦ ИУ РАН, Москва)

Рассматривается иерархическая игра двух лиц, в которой функция выигрыша игрока нижнего уровня зависит от случайного фактора. Новым является принцип оптимальности: считается, что игрок верхнего уровня желает получить наибольший возможный результат с наперед заданной вероятностью. Таким образом, модель позволяет достаточно гибко учитывать склонность игрока верхнего уровня к риску.

Ключевые слова: информационная теория иерархических систем, игры с неопределенными факторами, максимальный гарантированный результат, управление рисками.

1. Введение

Исследование иерархических игр с неопределенными факторами было начато в начале семидесятых годов прошлого века [7, 8, 14]. Примерно в то же время аналогичные модели стали исследоваться в теории активных систем [3-5] и теории контрактов [2, 16, 118]. При этом преимущественно исследовались два способа устранения неопределенности.

В одном из них предполагается, что игрокам известны лишь множества возможных значений неопределенных факторов и они осторожны, т. е. ориентируются на наихудший для себя вариант. В другом считается, что на множествах неопреде-

1 Михаил Александрович Горелов, кандидат физико-математических наук ([email protected]).

ленных факторов заданы вероятностные меры, а игроки риск-нейтральны, т.е. готовы ориентироваться на математические ожидания своих выигрышей. Возможен и третий, в некотором смысле промежуточный способ устранения неопределенности. В финансовой инженерии он получил название принципа «value at risk» [15, 17]. О развитии этих идей можно прочесть в монографии [1] и других работах того же автора.

На содержательном уровне смысл его можно объяснить следующим образом. Не думаю, что, принимая решения на бытовом уровне, люди очень уж часто оценивают какие-то вероятностные распределения и уж тем более вычисляют математические ожидания. И на профессиональном уровне мне ни разу не приходилось сталкиваться с заказчиком, формулирующим задачу в вероятностных терминах. А вот приверженность принципу гарантированного результата заказчики несколько раз явно формулировали. Но принцип максимального гарантированного результата имеет одну не очень привлекательную сторону. Если проводить его совсем уж последовательно, то нельзя исключать возможность того, что игроку «не свалится на голову кирпич» или не произойдет еще что-то столь же неприятное. А постоянно ориентируясь на такого рода случаи, вряд ли можно принимать действительно эффективные решения.

На практике, да и в теории [6], из этой ситуации используется следующий выход. Часть совсем уж «фатальных» значений неопределенного фактора исключается из рассмотрения, а по отношению к оставшейся части используется принцип максимального гарантированного результата. На каком же основании некоторые возможности исключаются из рассмотрения? Видимо потому, что оперирующая сторона считает их «маловероятными».

Разумеется, возникает соблазн перенести эту работу по исключению неблагоприятных факторов с уровня формирования модели на уровень ее исследования. Для этого нужно, чтобы оперирующая сторона приняла некоторое вероятностное распределение и сказала, что с заданной вероятностью ^ она хочет получить выигрыш, превышающий величину у. Конечно, жела-

тельно, чтобы величина у была побольше. Таким образом мы и приходим к постановке задачи, рассматриваемой ниже.

Вряд ли все это имеет смысл при анализе решений на бытовом уровне. А вот при анализе решений в бизнесе задача управления рисками в последнее время стала весьма актуальной, если не модной. При этом рассмотренный выше способ оценки риска является одним из двух наиболее популярных1. Но при этом обычно исследуются задачи централизованного принятия решений в условиях риска. Теоретико-игровые модели такого рода, по-видимому, до настоящего времени не изучались.

Дальнейшее изложение строится следующим образом. В следующем разделе дается формальная постановка задачи. Оставшаяся часть статьи посвящена ее «решению». По традиции под решением иерархической игры понимается сведение вычисления максимального гарантированного результата в игре со «сложной» структурой к неким «элементарным» операциям, например, вычислению максимумов и минимумов на «простых» множествах. Мы будем следовать этой традиции. В рассматриваемой задаче «неэлементарная» операция выбора множества исключаемых из рассмотрения неопределенных факторов появляется уже в играх, не наделенных дополнительной структурой. Их исследованию посвящен параграф 3. В четвертом параграфе решается более традиционная задача поиска максимального гарантированного результата в игре «с обратной связью».

2. Игры со случайными факторами

Итак, приступим к описанию моделируемого конфликта.

Игрой со случайными факторами в дальнейшем будем называть шестерку Г = (и, V, А, g, И, р). Здесь и, V и А - множества, g - функция, отображающая декартово произведение и х V в множество действительных чисел Я, И: и х V х А ^ Я, а р - вероятностная мера на множестве А.

1 Насколько мне известно, теоретико-игровые модели, в которых риск оценивается с помощью дисперсии, пока тоже не исследовались.

Интерпретируются эти конструкции следующим образом. Предполагается, что в игре принимают два участника, которых будем называть первым и вторым игроками. Множество V интерпретируется как множество управлений первого игрока, множество V - как множество управлений его партнера. Будем полагать, что интересы первого и второго игроков описываются стремлением к максимизации функций g и к соответственно. Значение неопределенного фактора а е А выбирается некоторой третьей стороной - Природой. Этот выбор осуществляется случайным образом в соответствии с распределением р.

Сделаем традиционные технические предположения, заметно упрощающие дальнейшее изложение. Множества V, V и А будем считать наделенными топологиями и компактными. Функции g и к будем предполагать непрерывными по совокупности своих аргументов. Меру р будем считать борелевской.

К сожалению, не все результаты удается получить в столь общей постановке. Дополнительные условия на рассматриваемую игру, если они потребуются, будут указываться при формулировке соответствующего результата.

Игра Г описывает возможности и интересы игроков. Для замыкания модели нужно еще описать динамику принятия решений и отношение игроков к имеющейся у них неопределенности. Начнем с интерпретации.

Считаем, что все параметры игры Г точно известны первому игроку. Будем предполагать, что события разворачиваются следующим образом. Вначале первый игрок выбирает свое управление и е V. Затем реализуется конкретное значение неопределенного фактора а е А (в соответствии с заданной вероятностной мерой р). Значения и и а становятся известными второму игроку. Таким образом, для второго игрока никакой неопределенности не остается. Для него все управления V е V разделятся на «разумные», при выборе которых он получит выигрыш, больший или равный некоторому числу X, и «неразумные», выбор которых сулит ему выигрыш, меньший X (разумеется, число X зависит от и и а). Такой принцип поведения известен первому игроку, но он осторожен и потому рассчиты-

вает на наихудший результат, который может получиться при «разумном» выборе партнера. Но поскольку значение а первому игроку не известно, для него этот результат является случайной величиной. Отношение первого игрока к этой неопределенности следующее. Он согласен исключить из рассмотрения некоторое число «форсмажорных» событий, суммарная вероятность которых не превосходит заданной величины 1 - £. А в остальном он ориентируется на наихудший для себя случай и хочет получить максимальный гарантированный результат.

Формально сказанное описывается следующим образом. Определение 1. Пусть задано действительное число £ е [0, 1]. Число у является ^-гарантированным результатом первого игрока в игре Г, если существуют измеримое множество B с A, мера p(B) которого больше или равна £, и такая стратегия u е U, что для любого а е B найдется число Л, для которого выполняются следующие условия:

1°. существует w е V, для которого h (u, w, а) > Л; 2°. для любого v е V либо g(u, v) > у, либо h(u, v, а) < Л. Точная верхняя грань £-гарантированных результатов первого игрока называется его максимальным £-гарантированным результатом.

Замечание 1. В этом определении можно было бы отказаться от предположения об измеримости множества B, заменив меру p(B) соответствующей внешней мерой. Из дальнейшего будет видно, что при сделанном предположении о том, что мера р является борелевской, а функция h - измеримой, такая модификация определения ничего не меняет по существу.

Замечание 2. Определение 1 - это видоизменение определения максимального гарантированного результата, предложенного автором [9]. В более традиционных терминах максимальный £-гарантированный результат может быть определен формулой

supsupinf min g(u,v),

B иеи аеВ vEBR(u,a)

где внешний супремум берется по всем измеримым подмножествам B множества A, для которых p(B) > £, а

BR(u,a) = <v е V: h(u,v,a) = maxh(u,w,a)> .

(. weV )

Доказательство эквивалентности этих определений лишь незначительно отличается от рассуждений из [9]. Значительная часть этой работы будет, по сути, проделана в следующем разделе. Для более сложных задач определение 1 все же удобнее, поэтому будем использовать его.

Замечание 3. Все вероятности в данной статье можно рассматривать как субъективные, а именно, как оценки оперирующей стороной (первым игроком) осуществимости тех или иных событий. В дальнейшем не используется никаких результатов типа закона больших чисел. Поэтому нет нужды заботиться о какой-то статистической устойчивости. Действительно важна лишь готовность оперирующей стороны устранять неопределенность описанным в определении 1 способом.

3. Игра без обратной связи

Вычисление максимального ^-гарантированного результата, например, по формуле из замечания 2 предполагает вычисление точной верхней грани по классу подмножеств множества A. Регулярных методов вычисления такого супремума не существует даже для относительно простого случая, когда множество A представляет собой отрезок. В данном параграфе мы упростим решение задачи, заменив операцию вычисления такой верхней грани операцией вычисления математического ожидания. Традиционно такая операция считается «элементарной».

Введем обозначение

m(u,a) = max h(u, v, a).

veV

Пусть у является ^-гарантированным результатом первого игрока в игре Г. Выберем множество B с A и стратегию u е U, существование которых предусмотрено определением 1. Фиксируем произвольное a е B.

Для стратегии w е V, существование которой постулируется пунктом 1° определения, выполняется неравенство

h(u, w, а) > Л, тем более это неравенство должно выполняться для стратегии w0, удовлетворяющей условию h(u, w0, а) = = m(u, а). Следовательно, число Л, фигурирующее в определении 1, должно удовлетворять условию Л < m(u, а).

Поэтому, если пункт 2° определения выполняется при каком-то значении Л, он тем более выполняется при Л = m(u, а). Но при таком значении Л пункт 1° тоже заведомо выполняется: достаточно выбрать, например, w = w0.

Таким образом, число у является ^-гарантированным результатом первого игрока в игре Г, если существуют измеримое множество B с A, мера fp(B) которого больше или равна и такая стратегия u е U, что для любого а е B и любого v е V либо g(u, v) > у, либо h(u, v, а) < m(u, а).

Рассмотрим множество

ВЯ(и,а) = lv е V: h(u,у,а) = maxh(u,^,а)> .

(. weV )

Если v е BR(u, а), то h(u, v, а) = m(u, а), следовательно, в силу второго пункта определения 1 должно выполняться неравенство g(u, v) > у Обратно, если последнее неравенство выполняется для всех v е BR(u, а), то число у является ^-гарантированным результатом. Действительно, для w е BR(u, а) и Л = m(u, а) выполняется первый пункт определения. Для того же значения Л и v <t BR(u, а) пункт 2° выполняется, поскольку в этом случае h(u, v, а) < m(u, а), а для v е BR(u, а) - так как по предположению g(u, v) > у.

Итак, число у является ^-гарантированным результатом первого игрока в игре Г, если существуют измеримое множество B с A, мера fp(B) которого больше или равна и такая стратегия u е U, что для любого а е B и любого v е BR(u, а) верно неравенство g(u, v) > у. То же условие можно сформулировать иначе: число у является ^-гарантированным результатом первого игрока в игре Г, если существуют измеримое множество B с A, мера fp(B) которого больше или равна и такая стратегия u е U, что для любого ае B имеет место неравенство

(1) min (uv)^у.

уеВК(и,а)

Рассмотрим множество C(u) = \а<Е A : min g(u, v) >у\.

veBR(u,a) J

Так как условие (1) выполняется для всех а е B, множество B должно содержаться в множестве C(u), а значит, должно выполняться условие р (C(u)) > р(B) > Е

Обратно, если условие р (C(u)) > Е выполнено для некоторой стратегии u, то условие (1) будет выполнено для всех а е B = C(u), и, значит, у является ^-гарантированным результатом.

Определим функцию d(x) условием Î1, если x > 0,

0( x) ЧП o,

[0, если x < 0. Мера множества C(u) равна М#( min g (u, v) -у),

\veBR(u ,a) /

где символом М обозначается оператор вычисления математического ожидания по мере р.

Отсюда немедленно получается следующий результат. Теорема 1. Для того чтобы число у было Е-гарантиро-ванным результатом первого игрока в игре Г, необходимо и достаточно, чтобы либо

(2) max М#| min g (u, v) -у)>Е ,

ueU \veBR(u,a) /

либо

sup М#( min g (u, v)-у)>Е ,

ueU \veBR(u,a) J

если верхняя грань в последней формуле не достигается.

Замечание 4. В [10, 11] в аналогичном виде были сформулированы условия, характеризующие максимальный гарантированный результат для игр с интервальной неопределенностью и игр с риск-нейтральным первым игроком. В более ранних работах [13, 14], пусть при некоторых дополнительных предположениях, были получены явные формулы для максимальных гарантированных результатов в этих задачах. В задаче,

рассматриваемой в данной статье, не видно подобной альтернативы даже для более простого аналога задачи оптимизации, соответствующей игре Г, в которой множество V состоит из одной точки.

Замечание 5. От формулы (2) можно было бы оттолкнуться в попытке дать более традиционное определение максимального гарантированного результата. Но такое определение в данном случае потребовало бы пояснения. И, по-видимому, это пояснение неизбежно было бы похоже на определение 1. Кроме того, совсем уж «классическую» форму этому определению придать не удается, поскольку число у входит в аргумент функции в. Таким образом, уже в данном случае следовать традициям не очень удобно. В следующем разделе преимущество нового определения станет еще более очевидно.

Дабы не отвлекаться на технические детали, в доказательстве теоремы 1 был оставлен пробел. Чтобы заполнить его, нужно доказать следующее утверждение.

Лемма 1. Для любого u е Uмножество C(u) измеримо.

Доказательство. Фиксируем u е U. Достаточно доказать, что измеримой является функция (р(а) = min g(u, v). Для

veBR(u,a)

этого достаточно доказать, что измеримой является функция -q(a) = 0 - <f(a). А потому достаточно доказать, что при любом умножество

C0(u) = {ае A: -ф(а) <-у\ = 1ае A: min g(u, v) > у\

veBR(u,a) J

является измеримым1.

Поскольку мера цр предполагается борелевской, достаточно доказать, сто множество C0(u) является открытым. Допустим противное.

Тогда существует а е C0(u) и последовательность а1, а2, ... такие, что lima = а и ak i C°(u) для всех k = 1, 2, ...

1 Для удобства в этой части доказательства используются лишь факты, явно сформулированные в [11] на стр. 283.

Множество BR(u, ak) задается условием типа равенства, поэтому оно является замкнутым в силу непрерывности функции h. Так как множество V предполагается компактным, компактным будет и множество BR(u, ak). Значит, в некоторой точке vk е BR(u, ak) достигается минимум функции g(u, v) на множестве BR(u, ak). Так как по предположению ak i C0(u), выполняется неравенство g(u, vk) < у.

Поскольку множество V компактно, можно, не ограничивая общности, считать, что последовательность vi, v2, ... сходится к некоторому элементу v е V.

Фиксируем произвольное w е V. Поскольку vk е BR(u, ak), выполняется неравенство h(u, vk, ak) > h(u, w, ak). Так как функция h непрерывна, переходя к пределу в этом неравенстве, получим h(u, v, a) > h(u, w, a). В силу произвольности w отсюда следует, что v е BR(u, a). А переходя к пределу в неравенстве g(u, vk) < у, получим g(u, v) < у, и тем более min g(u, v) <у,

veBR(u,a)

что противоречит условию a е C0(u).

Полученное противоречие доказывает лемму. Тем самым и теорема 1 полностью доказана.

Замечание 6. Сформулированные в предыдущем разделе предположения о топологической и метрической структуре игры Г могут быть изменены, а возможно, и просто ослаблены. Вопрос о наиболее слабых предположениях, при которых лемма 1 и дальнейшие результаты подобного рода остаются верными, представляет определенный интерес, но выходит за рамки данной статьи. Наиболее интересные модельные примеры заведомо удовлетворяют сформулированным выше условиям, поэтому дальнейшее обсуждение мы опускаем.

Замечание 7. Доказательство леммы 1 вполне стандартно, но довольно длинно. По этой причине далее доказательство аналогичных результатов опущено.

Вполне осмысленным является вопрос о поиске оптимальной стратегии первого игрока в рассматриваемой игре. С учетом полученных результатов, ответ на него найти несложно.

Прежде всего отметим, что точная верхняя грань в определении максимального «^-гарантированного результата может не достигаться. Поэтому может не существовать стратегии, позволяющей получить такой результат с вероятностью Этот эффект понятен, поскольку аналогичный факт имеет место уже в игре без неопределенности (т.е. с одноточечным множеством A).

Если же число у является ^-гарантированным результатом, то любое решение неравенства

М#( min g(u,v)-у\>Е,

\veBR(u ,a) /

если верхняя грань в формуле (2) достигается, или неравенства

( min .g(uv)-у)><5

yvEBR^a) )

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М<9.

(u,a)

в противном случае, является искомой стратегией. В обоих случаях неравенства имеют решения, поскольку по предположению у является ^-гарантированным результатом.

Одно их «подходящих» этой стратегии множеств B можно определить условием B = С(и).

Разумеется, такой выбор множества В не является единственно возможным. Впрочем, в общем случае то же относится и к выбору оптимальной стратегии и.

4. Игра с обратной связью

Рассмотрим еще одну игру Г* = (и*, V*, А, g*, Н*, р), определенным образом связанную с игрой Г.

Обозначим через Ф(Х, У) класс всех функций из множества X в множество У. Пусть и* = Ф^ х А, и), V* = V х А, а функции g* и Н* определяются условиями g*(u*, V*) = g(u*(v, Р), V), Н*(и*, V*, а) = Н(u*(v, Р), V, а), где V* = (V, Р). Множество А и мера р на нем те же, что и в игре Г.

Интерпретировать эти конструкции можно следующим образом. Игроки выбирают свои «физические» управления из множеств и и V. Но к моменту выбора своего управления и е и

первый игрок получает достоверную информацию об управлении v е V, выбранном его партнером. Кроме того, второй игрок может передать первому информацию о реализации неопределенного фактора. Однако эта информация не обязана быть достоверной, т.е. второй игрок вправе выбрать некоторое сообщение ß е A, которое он передаст партнеру. Свое физическое управление u*(v, ß) первый игрок выбирает на основе всей полученной информации, а выигрыши обоих игроков зависят лишь от сделанных ими физических выборов и не зависят от того, какой информацией они обменивались.

Игра Г* имеет ту же структуру, что и игра Г, поэтому можно ставить вопрос о поиске максимального ^-гарантированного результата в этой игре. Решением этой задачи мы и займемся.

При анализе этой задачи пользоваться русским языком уже совсем неудобно. Поэтому перейдем на язык исчисления предикатов.

Для игры Г* определение ^-гарантированного результата у будет выглядеть следующим образом:

3B3u е Ф(У х A,U )Va е BS Л: p(B) > £ &

(4) &[3w е VЗие A: h(u,(w,и),w,a) > Л]&

&[Vv е VVß е A g(u.(v,ß),v) > у v h(u.(v,ß), v,a) < Л].

Данная формула не является «элементарной», поскольку в ней один квантор существования относится к классу всех измеримых подмножеств B множества A, а еще один - к классу всех функций u* из множества V х A в множество U. Ее можно упростить, но для этого придется сделать следующее предположение.

Гипотеза 1. Функция h такова, что существует такое управление up е U, что для любого v е V и любого а е A выполняется равенство h(up, v, а) = minh(u, v, а) .

uеU

По сути, здесь предполагается существование универсальной (не зависящей от а) стратегии наказания второго игрока первым.

Теперь можно заняться преобразованием формулы (4). Как и в предыдущем разделе, начнем с конкретизации значения X. Положим

l(а, у) = max h(u, v, а).

(u,v)eH (у)

В содержательных терминах Н(у) - это множество «приемлемых» для первого игрока исходов игры. Число ¡(а, у) характеризует максимальный выигрыш, который может получить второй игрок, при условии, что первый тем или иным способом обеспечит себе получение «приемлемого» результата (разумеется, этот максимальный выигрыш зависит от неопределенного фактора а).

Если множество B и функция с* таковы1, что

Va е B3X: p(B) & [3w A: h(c (w,v), w,a) >X] &

(5) &[Vv е VV/ е A g(с (v, /),v) > у v h(c(v, /), v,а) < X],

то найдется функция u*, для которой выполнено условие Vaе B B) > ^ &

(6) &[3w eVBve A: h(u(w,и), w,а) > l(а,у)] &

&[Vv е VV/ е A g(u (v, /), v) > у v h(u. (v, /), v, а) < 1(а, у)].

Докажем это. Пусть выполнено условие (5). Тогда множество Н(у) не пусто. Действительно, фиксируем любое а е B. Тогда в силу условия (5) имеем h(c*(w, и), w, а) > X. Значит, в силу того же условия g(c*(w, и), w) > у, следовательно (c*(w, и), w) е Н(у).

Для каждого а е A фиксируем пару (иа, уа) е Н(у) так, что h(иа, уа, а) = ¡(а, у). Положим

Тогда для любого ае A условие

1 Существование такого множества и такой функции предусмотрено условием (4).

H(у) = {(u, v) е U х V: g(u, v) > у),

иа, если v = va и /3 = а, с (v,/) в остальных случаях.

Зw е VЗ о е А: к(и„ ^, о), w, а) > /(а, у) выполнено (можно взять w = уа и о = а). Кроме того, из неравенства к(а*(м>, о), w, а) > Л следует, что Л< 1(а, у), поэтому условие(5)влечет

(7) g(a*(v,¡), V) > у Vк(а*(у,¡), V,а) < /(а, у).

Если ®*(у, р ^ м*(у, ¡), то по построению g(u*(v, р), V) > у, значит, условие

(8) g(u (V, ¡), V) > у V к(и* (V, ¡), V, а) < /(а, у)

выполнено. В противном случае условия (7) и (8) равносильны.

Таким образом, доказано, что из условия (5) следует условие (6). Обратная импликация очевидна. Поэтому условия (5) и (6) эквивалентны.

Ровно той же «модификацией» стратегии первого игрока доказывается, что условие

ЗВЗи е Ф(У х А, и)Уа е В р(В) >£&

е VЗ о е А: к(и,(^,о), w,а) > /(а,у)] &

е V У3 е А g (и (V, ¡), V) >уv к(и, (V, ¡), V, а) < /(а, у) ]

равносильно более простому условию

ЗВЗи е Ф^ х А,и)Уа е В р(В) > £ &

&[Vv е VVр е А g(и (V, ¡), V) > у V Л(и.(V, ¡), V,а) < /(а, у)].

Соответствующие рассуждения практически не отличаются от приведенных выше, поэтому мы их опускаем.

Поменяем порядок кванторов общности в последней формуле:

ЗВЗи е Ф^ х А, U)Vv еVV р е А р(В) > £ &

&[g(u.(v,р), V) > у V Vа е В к(и,(у,Р),v,а) </(а,у)].

Теперь можно воспользоваться структурой множества стратегий первого игрока, чтобы поменять порядок кванторов существования и общности:

ЗBVv е VVр е АЗи е и :р(В) > £ &

&[ g (и, V) >уvVа е В к(и, v,а) < / (а, у)].

Переменная р в квадратных скобках «исчезла», поэтому данную формулу можно еще упростить:

3BVv е V3u е U :p(B) > £ &

&[g(u,v) >/vVa е B h(u,v,a) <l(a,/)].

Обозначим

E(/) = <v eV: maxg(u, v) </\.

V ueU )

Тогда предыдущее условие можно переписать в эквивалентном виде

3BVv е E(y)3u е U: p(B) > £ & Vae B h(u, v, a) < l(a, /),

или

3BVvеE(/)p(B) > £ &3u еи:VaeB h(u,v,a) <l(a,/). Теперь воспользуемся гипотезой 1, чтобы поменять порядок кванторов общности и существования:

3BVvеE(/)p(B) > £ &VaeB3u еи: h(u,v,a) <l(a,/). Еще раз поменяв порядок кванторов общности, получим 3Bp(B) > £ & Va е BVv е Е(/) 3u еи: h(u, v, a) < l(a, /). Пусть

fl, если x > 0, ■9( x) = i

[0, если x < 0.

Заменяя кванторы общности и существования на операторы максимума, минимума и математического ожидания, как это делась в предыдущем разделе, получим следующий результат.

Теорема 2. Пусть гипотеза 1 верна. Тогда для того чтобы число / было £-гарантированным результатом, необходимо, чтобы

Мв\ inf max (l(a,/) - h(u, v,a) ))>£ ,

\уеЕ(/) ueU V !

и достаточно, чтобы

(9) M^i inf max (l(a,v) - h(u, v,a))]>£.

\уеЕ(/) u^U V 'J

Замечание 8. Существуют игры Г, для которых точная верхняя грань чисел / удовлетворяющих необходимому условию в теореме, отличается от точной верхней грани чисел / удовлетворяющих условию достаточному условию. Для таких игр полученные результаты не дают окончательного ответа на

вопрос, чему равен максимальный ^-гарантированный результат. Но заниматься уточнением полученных необходимых и достаточных условий в данном случае не имеет смысла, поскольку понятно, что для таких игр задача вычисления максимального ^-гарантированного результата не устойчива по отношению к малым изменениям параметров игры Г. Поэтому требуется дополнительное исследование этой задачи, которое выходит за рамки данной статьи. Впрочем, такие игры являются в определенном смысле «исключительными».

Замечание 9. Принятие гипотезы 1 с формальной точки зрения кажется довольно ограничительным, поскольку, по существу, предполагается наличие седловых точек у всех функций из некоторого параметрического семейства. Но во многих содержательных моделях ее использование представляется вполне оправданным. Скажем, если первый игрок выбирает цену, он может выбрать ее минимальной из возможных, если он выделяет партнеру ресурс, то может выделить его «по минимуму» при всех а. А.Ф. Кононенко вообще считал, что в экономических моделях гипотеза 1 выполняется всегда. Я не вполне разделяю эту точку зрения, поскольку нужно учитывать принцип соответствия суровости наказания тяжести проступка. Но в данном случае отказаться от этой гипотезы не получается. В этом смысле рассматриваемая в данной работе задача оказывается сложнее задачи с риск-нейтральным игроком, где, как показано в [11], от аналогичной гипотезы можно отказаться за счет введения некой «калибровочной» добавки к функции выигрыша второго игрока.

Анализ приведенного доказательства показывает, что гипотезу 1 можно заменить следующим предположением.

Гипотеза 2. Существует такое управление и е U, что неравенство max h(u, v^) < 1(а,у) выполняется для всех а е A.

vеV

Поскольку неравенство в гипотезе 2 строгое, нельзя утверждать, что она слабее гипотезы 1. Однако вполне можно рассчитывать, что найдется достаточно много содержательных моделей, в которых гипотеза 2 выполняется, а гипотеза 1 - нет.

В качестве основной принята гипотеза 1, поскольку она проще интерпретируется.

Если достаточное условие (9) из теоремы 2 выполнено для некоторого числа у, то полученные выше результаты позволяют сконструировать одну из стратегий, позволяющих получить результат ус вероятностью Е

В качестве множества В, фигурирующего в определении максимального гарантированного результата, можно взять множество

:(/(а,у) - Н(ы, у,а)) > о|.

В = <ае А: тГ тах (/(а,у) - Н(ы, у,а))> (

I уеБ(у) ыеи

Для каждого а из так определенного множества В выберем произвольную пару (иа, vа) из множества Н(у) удовлетворяющую условию Н(иа, vа) = ¡(а, у). Положим

I ыа, если аеВ и V = vа, ы* (V, а) = <!

[ыр во всех остальных случаях.

Непосредственно проверяется, что так определенная стратегия и* является искомой.

Интерпретация этих конструкций стандартна. Второму игроку предлагается выбрать управление V" если реализовалось значение неопределенного фактора а е В, и сообщить истинную информацию об этом факторе. В этом случае первый игрок обещает использовать «поощряющее» управление иа. В противном случае второму игроку грозит наказание. Управления иа и vа выбраны так, что сообщение достоверной информации действительно выгодно второму игроку. Случаи а £ В первым игроком исключены из рассмотрения. Поэтому, в частности, для таких значений а может быть пустым множество Н(у). В этих случаях для пущей надежности используется стратегия наказания.

5. Заключение

Кроме описанной во введении «методологической» интерпретации исследованная модель имеет и другую, быть может, более интересную. Величину 1 - Ев данной модели естественно рассматривать как меру риска. Таким образом, в модели явно описываются как «доходность», оцениваемая величиной выигрыша g(u, V), так и риск. Это представляется достаточно важным.

Вполне естественно можно предположить, что величина Е является управлением оперирующей стороны (первого игрока), наряду с и. Здесь можно предполагать, что порядок принятия решений является следующим. Вначале первый игрок фиксирует величину Е и стратегию и (или и* соответственно), затем реализуется значение неопределенного фактора а, потом свое управление выбирает второй игрок. В данном случае не принципиально, получает ли второй игрок информацию о выбранном значении Е, поскольку от него его выигрыш не зависит.

Правда, здесь уже получается не полностью сформулированная модель, поскольку в таком случае естественно предполагать наличие двух критериев: мера риска 1 - Е и отвечающий ей Е-гарантированный результат. Из определения непосредственно следует, при увеличении Е соответствующий Е-гарантированный результат не возрастает. Выбор баланса между двумя критериями остается за оперирующей стороной. Но если исследователь операции будет иметь эффективный способ подсчета Е-гарантированного результата, это будет серьезным подспорьем в решении этой задачи.

Описанный способ учета риска, конечно же, не является единственно возможным. Но уже на основе исследованной модели можно конструировать другие осмысленные постановки.

Например, можно предположить, что оперирующая сторона выбирает несколько значений Е\ Е2, •••, Е"- Для каждой стратегии и е и можно найти выигрыш первого игрока уг(и), который

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с вероятностью обеспечивает выбор стратегии u при рациональных действиях партнера. А дальше решается многокритериальная задача с критериями yl(u), y(u)2, ..., y(uf. К этим критериям можно добавить еще математическое ожидание гарантированного выигрыша в первого игрока.

Таким образом, получаем достаточно широкий спектр постановок, каждую из которых можно «примерять» на моделируемую ситуацию. По-видимому, ключевой шаг в исследовании соответствующих задач сделан в данной статье.

Литература

1. АГАСАНДЯН Г.А. Применение континуального критерия VAR на финансовых рынках. - М.: ВЦ РАН, 2011. - 299 с.

2. БРЕМЗЕН А.С., ГУРИЕВ С.М. Конспекты лекций по теории контрактов. - М.: РЭШ, 2005. - 72 с.

3. БУРКОВ В.Н. Основы математической теории активных систем. - М.: Наука, 1977. -255 с.

4. БУРКОВ В Н., НОВИКОВ Д А. Теория активных систем: состояние и перспективы. - М.: Синтег, 1999. - 128 с.

5. ВОРОНИН А.А., ГУБКО М.В., МИШИН СП., НОВИКОВ Д.А. Математические модели организаций. - М.: ЛЕНАНД, 2008. - 360 с.

6. ГЕРМЕЙЕР Ю.Б. Введение в теорию исследования операций. - М.: Наука, 1971. - 383 с.

7. ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1976. - 327 с.

8. ГОРЕЛИК В.А., ГОРЕЛОВ М.А., КОНОНЕНКО А.Ф. Анализ конфликтных ситуаций в системах управления. - М.: Радио и связь, 1991. - 287 с.

9. ГОРЕЛОВ М.А. Максимальный гарантированный результат при ограниченном объеме передаваемой информации // Автоматика и телемеханика. - 2011. - №3. - С. 124-144.

10. ГОРЕЛОВ М.А. Иерархические игры с неопределенными факторами // Управление большими системами. 2016. -Вып. 59. - С.6-22.

11. ГОРЕЛОВ М.А. Иерархические игры со случайными факторами // Управление большими системами. 2016. -Вып. 63. - С.87-105.

12. КОЛМОГОРОВ АН., ФОМИН СВ. Элементы теории функций и функционального анализа. - М.: Наука, 1981. -543 с.

13. КОНОНЕНКО А.Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов // Ж. вычисл. матем. и матем. физ. - 1973. -Т. 13, №2. - С. 311-317.

14. КОНОНЕНКО А.Ф., ХАЛЕЗОВ А.Д., ЧУМАКОВ ВВ. Принятие решений в условиях неопределенности. - М.: ВЦ АН СССР, 1991. - 197 с.

15. МАРШАЛЛ ДЖ.Ф., БАНСАЛ В.К. Финансовая инженерия. - М.: ИНФРА-М, 1998. - 784 с.

16. BOLTON P., DEWATRIPONT M. Contract Theory. - Mass.: MIT Press, 2005. - 740 p.

17. DEMPSTER M.A.H. (ed.) Risk Management. Value at Risk and Beyond. - Cambridge: Cambridge University Press, 2002. -290 p.

18. LAFFONT J.-J., MARTIMORT D. The Theory of Incentives: The Principal-Agent Model. - Princeton: Princeton University Press, 2002. - 440 p.

THE «VALUE AT RISK» PRINCIPLE IN HIERARCHICAL GAME

Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., ([email protected]).

Abstract: The two-player hierarchical game is considered. The bottom level player's payoff is supposed to depend on random factor. The top level player is supposed to know the set of possible values of uncertain factors and probability measure on this set. And he assumes that the bottom level player knows the realized value of random factor when he chooses his control. The optimality principle is new. It is supposed that top level player wishes to obtain maximal possible result with prescribed probability. In such a way the model permits to take into account the inclination to risk of the top level player. Open loop and closed loop models are investigated. In both cases the original setting of the problem contains non elementary operation of choice of a set of negligible values of uncertain factors. The obtained results permit to replace this operation by the operation of calculating of mathematical expectation of random value. In both models the problem of calculating of maximal guaranteed result of top level player and search of his optimal strategy is reduced to calculating a minimax on "finite-dimensional" sets.

Keywords: informational theory of hierarchical systems, games under uncertainty, maximal guaranteed payoff, risk management.

Статья представлена к публикации членом редакционной коллегии В.Н. Бурковым.

Поступила в редакцию 05.06.2017.

Опубликована 31.03.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.