Научная статья на тему 'Иерархические игры со случайными факторами'

Иерархические игры со случайными факторами Текст научной статьи по специальности «Математика»

CC BY
184
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ ТЕОРИЯ ИЕРАРХИЧЕСКИХ СИСТЕМ / ИГРЫ С НЕОПРЕДЕЛЕННЫМИ ФАКТОРАМИ / МАКСИМАЛЬНЫЙ ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ / INFORMATIONAL THEORY OF HIERARCHICAL SYSTEMS / GAMES UNDER UNCERTAINTY / MAXIMAL GUARANTEED PAYOFF / CONTRACT THEORY

Аннотация научной статьи по математике, автор научной работы — Горелов Михаил Александрович

Рассматривается иерархическая игра двух лиц, в которой функция выигрыша игрока нижнего уровня зависит от случайного фактора. В момент принятия решений игрок нижнего уровня знает реализацию этого фактора. Игрок верхнего уровня, принимая решение, знает только распределение вероятностей на множестве возможных значений этого фактора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Hierarchical games under uncertainty

The two-players hierarchical game is considered. The payoff function of low-level player (agent) depends on a random variable. The low-lever player knows the value of this variable at the moment of decision making. And high-level player (principal) knows only probability distribution on the domain when making his decision. We obtain the optimal strategy for the principal under the assumption that she is trying to maximize the guaranteed payoff. This results are tightly coupled with some work in the theory of contracts.

Текст научной работы на тему «Иерархические игры со случайными факторами»

УДК 519.865 + 519.95 ББК 22.165

ИЕРАРХИЧЕСКИЕ ИГРЫ СО СЛУЧАЙНЫМИ ФАКТОРАМИ

Горелов М. А.1

(вВычислительный центр им. А.А. Дородницына РАН,

Москва)

Рассматривается иерархическая игра двух лиц, в которой функция выигрыша игрока нижнего уровня зависит от случайного фактора. В момент принятия решений игрок нижнего уровня знает реализацию этого фактора. Игрок верхнего уровня, принимая решение, знает только распределение вероятностей на множестве возможных значений этого фактора.

Ключевые слова: информационная теория иерархических систем, игры с неопределенными факторами, максимальный гарантированный результат.

1. Введение

В данной работе рассматривается иерархическая игра двух лиц, в которой выигрыш игрока нижнего уровня зависит от неопределенного фактора, выбор которого не контролируется ни одним из участников конфликта. Аналогичная модель была рассмотрена в [4]. Отличие заключается в том, что в данной работе игрок верхнего уровня более информирован о характере неопределенности. А именно, кроме множества возможных значений неопределенного фактора в момент принятия решений он знает некое вероятностное распределение на этом множестве. Соответственно, предполагается, что он ориентируется на математическое ожидание своего выигрыша.

1 Михаил Александрович Горелов, кандидат физико-математических наук (griefer@ccas.ru).

Такая задача является более сложной1, однако ее удается решить с помощью метода, предложенного в [4]. Впрочем, появляются и некоторые детали, которые представляют самостоятельный интерес.

Иерархические игры с вероятностной неопределенностью изучались гораздо более активно, чем аналогичные модели с интервальной неопределенностью. В России исследования велись в рамках теории иерархических игр [6-7, 10-13] и теории активных систем [3, 5, 8]. За рубежом соответствующий раздел науки получил название теории контрактов [14-15]. Обстоятельный обзор полученных результатов содержится в [1].

Рассмотренная ниже задача была впервые поставлена А.Д. Халезовым в [6-7]. Благодаря новому методу исследования удается избавиться от двух дополнительных предположений, сделанных при решении задачи в [6-7]. Одно из этих предположений заключается в наличии «универсальной» стратегии наказания игрока нижнего уровня, не зависящей от значения неопределенного фактора. Второе предположение носит характер «общности положения». Оно не слишком ограничительно, но довольно трудно проверяемо.

Изложение в статье построено следующим образом. В разделе 2 дается определение игры со случайным фактором. Эта модель «замыкается» заданием принципа оптимальности, в данном случае - принципа максимального гарантированного результата, который определяется в разделе 3. Определение дается по схеме, отличной от предложенной Ю.Б. Гермейером и ставшей классической. В разделе 4 решается задача вычисления максимального гарантированного результата. В разделе 5 на основе найденного решения строится оптимальная стратегия первого игрока. В разделе 6 обсуждается связь нового определения максимального гарантированного результата с классическим.

Игра со случайным фактором - довольно сложная конструкция. Поэтому пока не удалось доказать, что два определения

1 Этому утверждению можно придать точный математический смысл. Подробнее об этом будет сказано в заключении.

максимального гарантированного результата всегда приводят к одному ответу1. Впрочем, два определения заведомо приводят к одинаковым результатам, например, если множество стратегий второго игрока конечно (это несложно доказывается по схеме, приведенной, например, в [4]). Предположение о бесконечности множества стратегий - это, конечно же, математическая абстракция, во многих случаях весьма удобная. Таким образом, вопрос о предпочтительности одного из определений, если они действительно не совпадают, - это вопрос о том, какое из них лучше согласуется с абстракцией бесконечности. В разделе 6 приводятся некие аргументы в пользу того, что новое определение в этом плане предпочтительнее. Кроме того, из сравнения рассуждений параграфов 3-5 с аналогичными рассуждениями в [6-7] видно, что новое определение логически проще и удобнее в обращении. По этим причинам можно рассматривать разделе 6 как некую дань традиции. Цель его написания состояла в том, чтобы убедить в этом читателя.

2. Игры со случайными факторами

Игрой со случайными факторами в дальнейшем будем называть набор Г = (и, V, А, g, И, р). Здесь и, V и А - множества; g - функция, отображающая декартово произведение и х V в множество действительных чисел Я; И: и х V х А ^ Я; р - вероятностная мера на множестве А.

Предполагается, что в игре принимают два участника, которых будем называть первым и вторым игроками. Множество и интерпретируется как множество управлений первого игрока, множество V - как множество управлений его партнера. Будем полагать, что интересы первого и второго игроков описываются стремлением к максимизации функций g и И соответственно. Значение неопределенного фактора а е А выбирается некоторой

1 Впрочем, и построить пример, в котором различие имеется, пока тоже не удалось.

третьей стороной - Природой. Этот выбор осуществляется случайным образом в соответствии с распределением р.

Будем предполагать, что все параметры модели Г известны первому игроку. Будем считать его риск-нейтральным по отношению к имеющейся природной неопределенности, т.е. будем предполагать, что он всякий раз согласен на усреднение своего результата по заданной вероятностной мере. Относительно второго игрока достаточно предполагать, что ему известны множества V, V и А и его собственная функция выигрыша к.

Сделаем традиционные технические предположения, заметно упрощающие дальнейшее изложение. Множества V и V будем считать наделенными топологиями и компактными. Функцию g будем считать непрерывной по совокупности своих аргументов. Будем предполагать также, что при любом фиксированном а е А функция к непрерывна на множестве V х V.

Основные результаты будут получены при следующем дополнительном предположении. Множество А = {а1, а2, ..., ап} будем считать конечным (обозначим N = {1, 2, ..., п}). Соответственно, вероятностное распределение р будем отождествлять с набором р = (рьр2, ...,рп) неотрицательных действительных чисел р,, в сумме дающих единицу. Число р, интерпретируется как вероятность реализации значения а, неопределенного фактора.

Игра Г описывает возможности и интересы игроков. Опишем динамику принятия решений и информированность участников конфликта.

Будем предполагать, что события разворачиваются следующим образом. Вначале реализуется конкретное значение неопределенного фактора ае А. Эта реализация становится известной второму игроку. Зная а, второй игрок выбирает свое управление V е V, и достоверная информация об этом выборе становится доступной первому игроку. Используя всю эту информацию, первый игрок выбирает свое управление и е V.

Все сказанное формально описывается игрой со случайными факторами Г* = (V*, V*, А, g*, к*,р), в которой V* - семейство всех функций и* : V ^ V, V* = V, а функции выигрыша опреде-

ляются следующими условиями: g»(u», V») = g(u»(v»), V») и И»(и», V», а) = И(и»^»), V», а).

Адекватное описание анализируемого конфликта дает игра Г», но наличие ее связи с игрой Г позволит в дальнейшем получить содержательные выводы о характере оптимальных решений в рассматриваемой ситуации.

3. Максимальный гарантированный результат

На сей раз удобно сразу начать с неклассического варианта определения максимального гарантированного результата.

Допустим, первый игрок выбрал стратегию и» е и» и сообщил партнеру об этом выборе, и к тому же реализовалось значение ае А неопределенного фактора. Тогда для второго игрока его выигрыш однозначно связан с выбором его же стратегии. Поэтому он может разделить все множество своих стратегий V» на выгодные и невыгодные. Предположим, что это разделение происходит с помощью порогового значения, т. е. существует такое число Л, что стратегии V», для которых И»(и», V», а) < Л второй игрок считает невыгодными, а все остальные - выгодными. Разумеется, множество выгодных стратегий не должно быть пустым, поскольку по условию какой-то выбор второй игрок сделать должен.

Тогда первый игрок может оценить множество выгодных стратегий и, соответственно, наихудший результат уа), который он может получить при разумных действиях партнера. Поскольку мы предполагаем первого игрока риск-нейтральным, он будет ориентироваться на максимизацию математического ожидания у= Му(а). Точную верхнюю грань величины этого математического ожидания по всем выборам стратегии и» е и» естественно считать максимальным гарантированным результатом первого игрока.

Эти соображения являются мотивировкой следующего определения.

Определение 1. Число у является гарантированным результатом первого игрока в игре Г», если существуют такая стратегия и» и такая случайная величина у(а), что для любого а е А

найдется число Л, для которого выполняется одно из двух условий:

1°. Существует w* е V*, для которого к*(и*, w*, а,) > Л.

2°. Для любого V* е V* либо g*(u*, V*) > у(а), либо

к*(и*, V*, аг) < Л,

и, кроме того, у> Му(а). Точная верхняя грань гарантированных результатов первого игрока называется его максимальным гарантированным результатом.

С этим определением можно уже работать стандартным образом.

4. Вычисление максимального гарантированного результата

Далее, чтобы каждый раз не оговариваться, будем считать, что все вероятности р, строго больше нуля. Разумеется, это не ограничивает общности рассуждений.

Дальнейшие рассуждения удобно провести формально. Перепишем определение 1 с учетом конечности множества А:

Зи* еи*3/1,/2,.../гУг еN3Л(Зу* е V*:И(и*,> Л)&

п

&(Уу* е V* g*(u*,V*) > у VИ*(и*,) < Л)&Xру1 > у.

1=\

Удобно поменять в этой формуле порядок кванторов общности и существования:

Зи* еи3уlу2,..■Уn3\Л,...

..,ЛпУ1 е N(Зу е V*: И(и,, V,а) > Л )&

п

&(Уу е V* g*(u*, V*) > у VИ*(и*,) < Л )& XР'У > У.

1=\

Проанализируем первую часть этой формулы, соответствующую пункту 1 ° определения 1. Пусть для каждого , стратегия V, е V* = V удовлетворяет условию этого пункта, а и, = u*(vг■).

Тогда в силу второго пункта определения должны, в частности, выполняться условия (1) V, = V] ^ иг = и,

(2) | *4' ^ ) ^' г = 1, 2, щщ, v,. а,) >л,,

(3) г = 1, 2, ..., п, ] = 1, 2, ..., п.

Щ(и-, V] ,аг) <Я,,

Обозначим через Н(у) множество всех наборов

Н = (у, 72, Гп, Л, Л, ..., Лп, Щ, Щ, ..., Пп, VI, V2, ..., Vn),

п

удовлетворяющих условиям (1)-(3) и ^ р{ у{ > у .

г=1

Справедлива

Лемма 1. Число у является максимальным гарантированным результатом в игре Г* тогда и только тогда, когда

ЗН е Н(у)Зи*Уг е NУv* еУ* ( **(и*, V*) > у V

(4) ч VЩ*(и*,v*,аi) < Л ).

Доказательство. Необходимость, по сути, уже доказана. Докажем достаточность.

Фиксируем стратегию и*, набор чисел у, Л и управлений щ и vг (г = 1, 2, ..., п), существование которых предусмотрено условием леммы. Определим функцию со*: V^ и следующим образом. Положим со*^г) = иг (г = 1, 2, ..., п), а для остальных значений аргументов пусть гэ*(^) = и*(^-). Для а = аг положим у(а) = у.

Покажем, что выполняется условие 1°. Пусть а = аг. Тогда выберем w* = vг и Л = Л. Тогда по построению функции со* будем иметь Н*(ю*, w*, аг) = И(ю(уг), vг, а) = Ь(иг, VI, а) > Л = Л

Установим справедливость условия 2°. Пусть заданы произвольные параметр а = аг и стратегия V* е V*. Фиксируем Л = Лг .

Если V* = V] для некоторого ], то в силу условия (3) имеем либо g*(с*, V*) = g(a(v]), V]) > у = уа), либо

п

и

1 Разумеется, здесь можно считать, что] Ф г.

к*(®*, V*, а,) = к(®(] V], а) = к(и;, V], а,) < Л = Л. В противном случае в силу условия (4) имеем либо

g*(®*, V*) = g(®*(v*), V*) = g(u*(v*), V*) = g*(u*, V*) > у, = у(а),

либо

к*(®*, V*, а) = к(®^*), V*, а,) = к(и(у*), V*, а,) =

= к*(и*, V*, а) < Л = Л.

Таким образом, условие 2° во всех случаях выполнено. Неравенство у> Му(а) выполняется в силу определений функции у и множества Н(у). Лемма доказана.

Поменяем в формуле (4) порядок кванторов общности:

Зе е Н(у)3и*Уу* е У*Уг е N( g*(u*,V*) > у V

VИ*(и*,) <Л).

Далее используем структуру множеств стратегий в игре Г*. Предыдущая формула может быть переписана в виде Зе е Н(У3и,Уу е VУ! е N ( g(и,(у), V) > у V

V И(и*(у), ) <л ).

А теперь можно поменять местами кванторы общности и существования:

Зе е Н (у)Уу е V Зи е и У! е N ( g (и, V) > у V

V И(и, у,а) < Л).

Это условие выписано уже полностью в терминах исходной игры Г, поэтому основную задачу данной статьи можно считать решенной.

Заменив кванторы операторами верхних и нижних граней1, можно записать полученный результат в чуть более слабой, но, может быть, более привычной форме.

Теорема 1. Для того чтобы число у было гарантированным результатом в игре Г*, необходимо, чтобы выполнялось

1 Функция 1(у, а) может быть разрывной, поэтому внешняя верхняя грань, вообще говоря, не достигается.

inf max min max min(r - g(u, v), h(u, v,a ) -Л) < 0 ,

EsH(r) vsV usU i=1,2,...,n '

и достаточно, чтобы выполнялось

inf max min max min(r - g(u, v), h(u, v,a ) -Л) < 0 .

EsH(r) vsV usU i=1,2,...,n

5. Оптимальная стратегия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Структура формулы (5) позволяет уже без большого труда выписать оптимальную стратегию первого игрока.

Пусть r - гарантированный результат. Тогда выполняется условие (4). Фиксируем произвольный набор

Е = (r, Г2, .••, Гп, Л, Л .••, Л Ul, U2, .••, un, Vb V2, ..., V„),

существование которого гарантирует это условие.

Определим функцию u* : V ^ U следующим образом. Если V = V, для некоторого i = 1, 2, ..., п, то положим u*(v) = U,.

В противном случае условие (5) гарантирует, что система из n совокупностей неравенств

g(u, v) ~ Г'

(6)

i = 1, 2, h(u, v,4) <Л,

имеет решение относительно и. Выберем любое из них и обозначим его через и*(^.

Таким образом, функция и* будет полностью определена. Положим у(а) = у, если а = а.

Если значение а = а,, то выбрав Л = Л, и w* = V,, получим к*(и*, w*, а,) = к(и*(^-), V,) = к(и, V,) > Л (неравенство справедливо, поскольку набор Е принадлежит множеству Н(у), а, следовательно, выполняется условие (2)). Таким образом, условие 1 ° определения 1 выполнено.

Докажем справедливость условия (3). Для а = а положим Л = Л. Выберем любую стратегию V* е V*.

Если для некоторого / выполняется равенство V* = V,, то в силу условия (2) имеем g*(u*, V*) = g(u*(vг■), V,) = g(ui, V,) > у =

= у(а).

п

В противном случае в силу условия (6) имеем либо g*(u*, V*) = g(u*(v*), v*)> у = у(а), либо И*(и*, V*, а) =

= И(и*(у*), V*) < Л.

Таким образом, условие 2° во всех случаях выполнено. Неравенство у> Муа) выполняется в силу определения множества Н(у) и принадлежности набора Н этому множеству.

Таким образом, построенная стратегия и* — искомая.

6. Классическое определение максимального гарантированного результата

Традиционно определение максимального гарантированного результата дают в иной форме, предложенной Ю.Б. Гермейером. В данном разделе эта постановка будет сравнена с рассмотренной выше. Приведем классическое определение.

Будем предполагать, что игрок номер 1 первым выбирает свою стратегию и* е и* и сообщает о своем выборе партнеру.

Второй игрок доверяет этому сообщению. Поскольку к моменту принятия решений он знает и реализацию неопределенного фактора, для него задача выбора его стратегии V* из множества V* сведется к обычной задаче оптимизации. Поэтому естественно предполагать, что этот выбор будет произведен из множества

BR(u,,a) = <v, еК : h(u,,v,a) = maxh(u,,w,,a)

Так как на структуру функции u* не накладывается никаких ограничений, максимум в последней формуле может не достигаться. В таком случае естественно предположить, что существует такое положительное число к, что выбранная вторым игроком стратегия будет принадлежать множеству

BR(u, ,a) = \v е V : h (u, v ,a) > sup h (u,, w ,a) -к>.

[ w,eV, J

Формально нужно считать, что параметр к известен первому игроку, но ниже будет показано, что от этого параметра мало что зависит.

При сделанных предположениях первый игрок гарантированно может рассчитывать на выигрыш inf g (u, v ) .

v* eBR(u*,a)

Этот выигрыш зависит от неопределенного фактора а е A, не известного первому игроку. Но поскольку первый игрок считается риск-нейтральным, он будет ориентироваться на результат М inf g (u, v ) ,

v* eBR(u ,a)

где символом M обозначен оператор вычисления математического ожидания по вероятностному распределению р. При сделанных выше предположениях

n

М inf g (u, v ,а) = V p inf g (u, v).

v*e BR(u*,a) v*e BR(u*,a)

Таким образом, максимальный гарантированный результат первого игрока равен

R = sup М inf g (u, v ) .

u eU, v* eBR(u-.a)

Обозначим через R' максимальный гарантированный результат в смысле определения 1. Достаточно просто получается следующий результат.

Лемма 2. Для любой игры Г справедливо неравенство R' > R.

Доказательство. Фиксируем произвольное число у< R. Тогда существует такая стратегия u* е U*, что М inf g (u, v ) >Y.

v* eBR(u*,a)

n

Положим у = inf g (u, v). Очевидно, V pt у > у

v* eBR(u*,a )

Пусть = maxh(u, v,a) для тех i, для которых макси-

v*eV*

мум в этой формуле достигается, и = sup h (u, v ,a ) ~к для

v* eV

остальных значений i.

Покажем, что число у является гарантированным результатом в смысле определения 1. Стратегия u* уже выбрана. Определим случайную величину у(а), положив у(а) = yi.

Для любого ai е A выберем Л = Л- Тогда для w* е BR(u*, а) справедливо неравенство h*(u*, w*, а) > Л, т.е. пункт 1° определения 1 выполнен.

Если стратегия v* второго игрока принадлежит множеству BR(u*, а), то в силу определения числа у(а) имеет место неравенство g*(u*, v*) > у(а). А если стратегия v* не принадлежит множеству BR(u*, а), то в силу выбора числа Л и определения множества BR(u*, а) справедливо неравенство h*(u*, v*, а) < Л. Следовательно, пункт 2° тоже выполнен.

Как уже отмечалось, справедливо и неравенство у> Му(а).

Значит, у - гарантированный результат, и потому R > у. А поскольку у - произвольное число, удовлетворяющее неравенству у< R, будем иметь R > R, что и требовалось доказать.

Обратное неравенство доказать пока не удается. Все упирается в следующее предположение.

Гипотеза. Для любого у< R существует такая стратегия u* е U*, что

М inf g (u, v ) >у

v* eBR(u ,а)

и для любого а е A верхняя грань suph (u,v,а) достигается.

v*eV*

Если гипотеза неверна, то величина R будет, вообще говоря, зависеть от параметра к. А величина R' от к не зависит. Таким образом, свойство, сформулированное в гипотезе, является необходимым условием выполнения равенства R' = R. Если же гипотеза верна, то неравенство R' < R устанавливается без особого труда.

Геометрия рассматриваемой задачи довольно сложна, поэтому доказать гипотезу не получается. Впрочем, и попытки построить опровергающий ее пример натыкаются на серьезные трудности. Поэтому гипотеза кажется довольно правдоподобной.

Для величины R можно получить нижнюю оценку, аналогичную только что полученной верхней. Она представляет определенный самостоятельный интерес, поэтому остановимся на ней несколько подробнее.

И в классическом определении, и в определении 1 неявно предполагается, что второй игрок абсолютно рационален, то есть стремится абсолютно точно реализовать максимум своего выигрыша, по крайней мере, если этот максимум достигается. Видимо, это предположение адекватно описывает реальность далеко не всегда. Как альтернативу можно принять гипотезу ограниченной рациональности в духе Г. Саймона [9]. А именно, можно предположить, что существует такое число к, что второй игрок не чувствителен к разнице своих выигрышей, меньшей к. Тогда определение 1 следует заменить следующим.

Определение 2. Число у является к-гарантированным результатом первого игрока в игре Г*, если существуют такая стратегия и* и такая случайная величина у(а), что для любого а е А найдется число Л, для которого выполняется одно из двух условий:

1°. Существует w* е V*, для которого И*(и*, w*, а) > Л.

2°. Для любого V* е V* либо g*(u*, V*) > у(а), либо

н*(и*, V*, а) < Л - к,

и, кроме того, у> Му(а). Точная верхняя грань к-гарантированных результатов первого игрока называется его максимальным к-гарантированным результатом.

По аналогии с теоремой 1 можно получить необходимые и достаточные условия того, что у является к-гарантированным результатом.

Условия (2) и (3) заменятся условиями

и

(8)

Если обозначить через Нк(У множество всех наборов

^ = (у, у2, ..., Уп, Л, Л ..., Л, ии иъ ..., ип, VI, V2, ..., Vn),

n

удовлетворяющих условиям (1), (7), (8) и ^ piу >у , то окон-

i=\

чательный результат можно сформулировать следующим образом.

Теорема 2. Для того чтобы число у было ^-гарантированным результатом в игре Г*, необходимо, чтобы величина

inf max min max mmiy - g(u, v), h(u, v.а ) -Л+к)

EgH(у) veV usU i=\,2,...,n i i

была неположительной, и достаточно, чтобы эта величина была отрицательной.

Доказательство этой теоремы практически дословно повторяет доказательство теоремы 1, поэтому приводить его не станем.

Обозначим максимальный к-гарантированный результат через R ". Обещанная оценка выглядит следующим образом.

Лемма 3. Для любой игры Г справедливо неравенство R " < R.

Доказательство. Пусть у - к-гарантированный результат, и* и у(а) - стратегия и случайная величина, существование которых предусматривает определение 2. Для а= а обозначим через Л величину Л, удовлетворяющую этому определению.

В силу пункта 1° для некоторой стратегии w* выполняется неравенство h*(u*, w*, а) > Л, значит, l = sup h(u*, v*,ai) >Л.

wsBR(u,a)

Если стратегия v* принадлежит множеству BR(u*, а), то справедливо неравенство h*(u*, w*, а) > k - к. Тогда в силу пункта 2° определения 2 имеет место неравенство g*(u*, v*) > у(а). Следовательно, inf g*(u*, v*) >у(а,).

v* eBR^^)

Применив к этому неравенству оператор вычисления математического ожидания, получим

М inf g(u, v) >Му(а) >у

v*eBRU^ ) и тем более

R" = sup М inf g (u, v ) >у .

u,eU, veBR(u*,a )

Поскольку сказанное справедливо для любого ^-гарантированного результата у, получим нужное неравенство R " < R.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Замечание. Если положить

BR"(u„,а) = <! v е V : h(u,v,а) > sup h(u, w,а) l

[ w*eV* J

(независимо от того, достигается верхняя грань в этой формуле или нет), то получим

R" = sup М inf g (u, v ) .

u, eU v* eBR"(u>,a)

Действительно, неравенство

R" < sup М inf g (u, v ),

u, eU, v* eBR'(u>.a)

по сути, только что доказано. Доказательство обратного неравенства аналогично доказательству леммы 2. Таким образом, на самом деле имеется «классический» вариант определения ^-гарантированного результата, причем эквивалентность этих определений не зависит ни от топологических свойств рассматриваемой игры, ни от предположения о конечности множества A .

Выше был, надеюсь, наглядно продемонстрирован более конструктивный характер определения 1 по сравнению с классическим вариантом. Стоит упомянуть еще одну причину, по которой новое определение стоит предпочесть классическому, если они не эквивалентны.

Практически всегда бесконечное множество - это более удобная замена большого конечного (например, часто считают прибыль действительным числом, в то время как она измеряется целым числом копеек). Эта замена правомерна, если решения задач в обоих случаях близки. Нетрудно видеть, что если сформулированная выше гипотеза неверна, то с классическим вариантом определения максимального гарантированного результата это не так.

Предположим, что топологии на множествах U и V задаются некоторыми метриками. Аппроксимируем эти множества конечными ¿-сетями. Что произойдет с максимальным гаранти-

рованным результатом? В аппроксимирующей игре верхняя грань в определении множества рациональных ответов будет достигаться. Поэтому максимальный гарантированный результат не будет зависеть от к, т.е., если гипотеза неверна, он будет отличаться на конечную величину от максимального гарантированного результата в аппроксимируемой игре при сколь угодно малом г!

Таким образом, задача вычисления классического максимального гарантированного результата неустойчива по отношению к конечным аппроксимациям игры и потому требует уточнения. Разумеется, нельзя утверждать, что от этого недостатка свободно новое определение. Несовпадение необходимых и достаточных условий в теореме 1 говорит как раз о возможности неустойчивости. Однако причин возникновения неустойчивости в данном случае меньше.

7. Заключение

Как отмечалось выше, задачи со стохастическими неопределенными факторами сложнее аналогичных задач с интервальными неопределенностями. После проведенного исследования это становится понятным. В первом случае к двум кванторам общности и существования добавляется еще оператор вычисления математического ожидания. Причем возможность перестановки разноименных операторов зависит от информационной структуры рассматриваемой игры. Понятно, что чем больше типов операторов, тем более жесткие условия нужно наложить на задачу, чтобы ее удалось решить.

В [4] удалось воспользоваться тем, что в определении максимального гарантированного результата рядом стояли два квантора общности и их удалось поменять местами. В данной же работе вместо одного из этих кванторов общности оказался оператор вычисления математического ожидания, и выбранная структура информированности не позволила произвести перестановку естественным образом. Пришлось использовать искусственный прием, откуда и появилось дополнительное ограничение на конечность множества неопределенных факторов А.

Стоит отметить еще одно отличие постановки задачи в данной работе от задачи, рассмотренной в [4]. В [4] предусматривалась возможность добровольной передачи не обязательно достоверной информации от второго игрока к первому. Такая возможность может быть выгодной обоим игрокам (и уж, во всяком случае, не принесет им вреда), поэтому, видимо, такую возможность следует предусматривать в постановке. Кроме того, такое увеличение информированности «регуляризирует» решение задачи и делает его поиск более простым.

Сделанное предположение о конечности множества А позволило решить задачу в более сложном варианте. Но и вариант с добровольным обменом информации может быть исследован аналогично. Условие (1) из определения множества Н нужно будет исключить, и дальнейшие рассуждения из раздела 4 повторятся практически дословно. А конструкции раздела 5 нужно будет поменять достаточно естественным образом.

Количество «разумных» постановок игровых задач с неопределенными факторами весьма велико. Поэтому исследование одной из них, наверное, представляет не слишком большой интерес, если оно не диктуется конкретными практическими нуждами. В данной работе, как и в [4], основная цель состояла в демонстрации возможностей метода решения таких задач. Задачи, которые были поставлены раньше, но не решены в полном объеме, подходят для этой цели как нельзя лучше. Именно этим и определялся их выбор.

Литература

1. БУРКОВ ВН., ЕНАЛЕЕВ А.К., НОВИКОВ ДА. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и телемеханика. -1993. - №11. - С. 3-30.

2. БУРКОВ ВН., ЕНАЛЕЕВ А.К., НОВИКОВ ДА. Вероятностная задача стимулирования // Автоматика и телемеханика. - 1993. - №12. - С. 140-145.

3. БУРКОВ В Н., НОВИКОВ Д А. Оптимальные механизмы стимулирования в активной системе с вероятностной не-

определенностью II // Автоматика и телемеханика. - 1995. -№10. - С. 121-126.

4. ГОРЕЛОВ М.А. Иерархические игры с неопределенными факторами // Управление большими системами. -Вып. 59. - М.: ИПУ РАН, 2016. - С. 6-22

5. ЕНАЛЕЕВ А.К., НОВИКОВ Д.А. Оптимальные механизмы стимулирования в активной системе с вероятностной неопределенностью I // Автоматика и телемеханика. - 1995. -№9. - С. 117-126.

6. КОНОНЕНКО А.Ф., ХАЛЕЗОВ А Д. Общее решение задачи Центр - Агент с несимметричной информацией в условиях неопределенности и риска // Ж. вычисл. матем. и матем. физ. - 2000. - Т. 40. - №4. - С. 532-545.

7. КОНОНЕНКО А.Ф., ХАЛЕЗОВ А.Д., ЧУМАКОВ ВВ. Принятие решений в условиях неопределенности. - М.: ВЦ АН СССР, 1991. - 197 с.

8. НОВИКОВ Д.А. Стимулирование в вероятностных активных системах: роль неопределенности // Автоматика и телемеханика. - 1997. - №8. - С. 168-177.

9. САЙМОН Г. Науки об искусственном. - М.: Едиториал УРСС, 2004. - 144 с.

10. ХАЛЕЗОВ А.Д. Приближенное вычисление оптимальной стратегии в играх с фиксированной последовательностью ходов при неполной информации // Ж. вычисл. матем. и матем. физ. - 1979. - Т. 19. - №2. - С. 527-533.

11. ХАЛЕЗОВ А.Д. Об одном классе многошаговых конфликтов в условиях риска // Ж. вычисл. матем. и матем. физ. -1982. - Т. 22. - №1. - С. 42-48.

12. ХАЛЕЗОВ А.Д. Применение уточняемых стратегий в многошаговых конфликтах в условиях риска // Автоматика и телемеханика. - 1990. - №2. - С. 113-123.

13. ХАЛЕЗОВ А.Д. Общее решение задачи Центр - Агент с симметричной информацией в условиях риска // Ж. вычисл. матем. и матем. физ. - 2001. - Т. 41. - №3. - С. 374-383.

14. BOLTON P., DEWATRIPONT M. Contract Theory. - Cambridge: The MIT Press, 2004. - 744 pp.

15. LAFFONT J.-J., MARTIMORT D. The Theory of Incentives: The Principal-Agent Model. - Cambridge: The MIT Press, 2002. - 440 pp.

HIERARCHICAL GAMES UNDER UNCERTAINTY

Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., (griefer@ccas .ru).

Abstract: The two-players hierarchical game is considered. The payoff function of low-level player (agent) depends on a random variable. The low-lever player knows the value of this variable at the moment of decision making. And high-level player (principal) knows only probability distribution on the domain when making his decision. We obtain the optimal strategy for the principal under the assumption that she is trying to maximize the guaranteed payoff. This results are tightly coupled with some work in the theory of contracts.

Keywords: informational theory of hierarchical systems, games under uncertainty, maximal guaranteed payoff, contract theory.

Статья представлена к публикации членом редакционной коллегии Г. А. Угольницким.

Поступила в редакцию 10.11.2015.

Опубликована 30.09.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.