УДК 519.865 + 519.95 ББК 22.165
ОБ ОДНОЙ ГИПОТЕЗЕ В ОСНОВАНИЯХ ТЕОРИИ ИЕРАРХИЧЕСКИХ ИГР
Горелов М. А. 1
(Вычислительный центр РАН, Москва)
При исследовании игр с фиксированным порядком ходов обычно принимается некоторая гипотеза о поведении игрока нижнего уровня, существенно упрощающая как «ответ» в получающейся задаче, так и рассуждения, приводящие к этому ответу. Ниже обсуждается адекватность этой гипотезы. При этом рассматривается простейшая игра двух лиц, на примере которой видны как основные проблемы, так и некоторые подходы к их решению.
Ключевые слова: иерархические игры, максимальный гарантированный результат, устойчивость.
Введение
Пусть имеется игра двух лиц, в которой первый игрок выбирает свои управления из множества и, а второй - из множества V. Будем считать, что цели игроков описываются стремлением к максимизации функций g и И соответственно.
Рассмотрим следующую схему взаимодействия игроков (по традиции носящей имя игры Г2 [3]). Предположим, что первый игрок рассчитывает и действительно будет иметь информацию о выборе его партнером управления V е V до принятия своего окончательного решения. Таким образом, стратегиями первого
1 Михаил Александрович Горелов, кандидат физико-математических наук, ([email protected]).
игрока являются всевозможные функции и* из множества V в множество и (множество всех его стратегий обозначим и*). При этом будем считать, что игрок 1 первым выбирает свою стратегию и* е и* и сообщает ее партнеру.
Как в этой ситуации следует поступать первому игроку? Для ответа на этот вопрос мы будем пользоваться общими методологическими принципами, изложенными в [4]. В данной работе наиболее существенными будут два из них.
Принцип 1. Эффективность стратегий должна оцениваться на основе получения гарантированной величины выигрыша.
Принцип 2. Исследователь операции должен использовать всю доступную ему информацию.
На основе второго принципа следует использовать информацию о функции выигрыша второго игрока для оценки множества его возможных ответов на стратегию и*. Как это сделать? Поскольку второй игрок знает выбранную партнером стратегию, его результаты зависят только от его решений. Поэтому естественно было бы считать, что он непременно выберет одну из точек максимума своего критерия И(и«.(V), V). Однако тут возникает как минимум два вопроса.
Вопрос 1. Как описать поведение второго игрока, если максимум функции И(и«.(V), V) не достигается ни в одной точке?
Вопрос 2. Можно ли считать, что второй игрок будет добиваться абсолютно точной реализации максимума своего выигрыша?
Первый вопрос является по преимуществу математическим, а потому решается сравнительно несложно. Второй - скорее содержательный, и для ответа на него требуются более тонкие рассуждения.
Начиная с работы [9] эти проблемы решаются следующим образом. Множество рациональных ответов второго игрока на стратегию и* определяется одним из следующих условий:
(1) В(и*) = {V еV: И(и«(V),V) = тахй(и*(^), ^)|,
I \
если максимум в формуле (1) достигается;
(2) B(u*) ={vе V: h(u*(v),v) > suph(u*(w),w) -S(u*)|
I weV J
в противном случае. Здесь S - функционал, определенный на множестве U* и принимающий положительные значения. Игрока с таким поведением будем называть абсолютно рациональным. Тогда стратегия u* гарантирует первому игроку получение выигрыша
r(и*) = inf h(u*(v),v),
veB(u)
а его максимальный гарантированный результат равен
(3) R = sup inf h(u*(v), v).
u*eU* veB(u*)
Таким образом, даются ответы на оба поставленных выше вопроса, причем на второй - определенно положительный. Между тем, это явно противоречит первому из приведенных выше методологических принципов. В самом деле, Плюшкин, видимо, сидит в душе каждого человека, но возведение его принципа поведения в абсолют - это определенная идеализация. И оправдана она лишь тогда, когда от этого не сильно меняется найденное решение, по крайней мере, в типичных случаях. К этому могут быть добавлены стандартные рассуждения о том, что функция выигрыша противника не может быть известной абсолютно точно, что при поиске максимума неизбежны ошибки округления и т. д. (см. [1, 11, 12, 15].
На первый взгляд, обсуждение таких тонкостей может представлять интерес лишь для любителей математической строгости. Однако детальное знакомство с иерархическими играми показывает, что они весьма часто оказываются неустойчивыми к малым изменениям параметров модели (см. [5, 13]), а потому данный вопрос является далеко не праздным.
Добавим, что после работы [9] этот прием использовался многократно. Большое число примеров и далеко не полный список ссылок можно найти в монографиях [5, 10]. Для всех этих случаев вопросы, исследуемые в данной заметке, являются
актуальными. Но рискну предположить, что решать их можно по одной схеме.
1. О достижимости максимума
Обсудим первый из поставленных выше вопросов. Везде в дальнейшем будем предполагать, что множества U и V наделены топологией и компактны, а функции g и h непрерывны.
Примем следующее допущение.
Гипотеза 1. Если v е B(u*) и h(u*(w), w) > h(u*(v), v), то w е B(u*).
По-видимому, это самое слабое предположение, согласующееся с представлением о том, что функция h хоть как-то описывает цели второго игрока.
Эта гипотеза примерно соответствует концепции ограниченной рациональности, предложенной Г. Саймоном в пятидесятых годах прошлого века [16].
Для игры с абсолютно рациональным вторым игроком эта гипотеза выполняется.
Из гипотезы 1 следует существование такого функционала
S, определенного на множестве U* и принимающего неотрицательные значения, что
vе V: h(u*(v),v) > suph(u*(w),w) -S(u*)| с B(u*)
weV J
и
B(u*) с {vе V: h(u*(v),v) > suph(u*(w),w) - S(u*)
i wеV
Доказательство этого факта не вызывает труда.
Отказываясь от предположения о том, что второй игрок ведет себя подобно Плюшкину, следует определять множество рациональных ответов второго игрока формулой (2) для всех стратегий u*. Игрока, поведение которого описывается таким образом, будем называть S-рациональным.
s
Три важных частных случая функционала 8 выделены в [13] (один из них совпадает с вводимым ниже понятием к-рациональности). Но можно представить себе и другие, более сложные варианты. Например, очень привлекательно выглядит предположение о том, что значение 8(и*) тем больше, чем сложнее задача, стоящая перед вторым игроком, т. е. чем сложнее найти максимум функции (р(у) = к(и*(у), V).
Можно ожидать, что решение задачи с абсолютно рациональным вторым игроком существенно проще, чем решение аналогичной задачи для игры с 8-рациональным противником. Из дальнейшего будет видно, что это ожидание оправдано. Поэтому естественно ставить вопрос о том, насколько корректно можно рассматривать модель с абсолютно рациональным противником как идеализацию (предельный случай) игры с 8-рациональным вторым игроком.
Разумеется, та же постановка вопроса правомерна и в том случае, когда максимумы в задаче второго игрока заведомо достигаются (например, в иерархической игре Г1). Но в таком случае естественно выглядят предположения о компактности множеств управлений и непрерывности функций выигрыша игроков. А в этих предположениях задача решается стандартными методами математического анализа. В нашем случае задать подходящую топологию на множестве стратегий и* не удается (см. по этому поводу [7, 8]), а потому приходится искать обходные пути. А именно, приходится описывать структуру некоторых оптимальных стратегий в терминах множеств и и V, и использовать их топологию.
Аналогичные вопросы поднимались и в [1, 15], но и там рассматриваются модели без обмена информацией о действиях игроков, а потому проблемы решаются стандартным образом.
Не накладывая дополнительных ограничений на функционал 8, вычислить значение максимального гарантированного результата первого игрока в игре с 8-рациональным противником и найти структуру оптимальных стратегий крайне сложно. Поэтому воспользуемся оценками.
Начнем с рассмотрения частного случая, когда для любой стратегии u* значение d(u*) равно одному и тому же числу к. Игрока с таким поведением назовем к-рациональным.
Непосредственно проверяется, что если для всех стратегий и* выполняется неравенство d(u*) < к, то максимальный гарантированный результат первого игрока в игре с ^рациональным противником не меньше аналогичного результата в игре с к-рациональным вторым игроком.
Для получения обратной оценки потребуется
Лемма 1. В игре с абсолютно рациональным вторым игроком для любой стратегии (О* е U* первого игрока найдется такая стратегия и*, что r(u*) > r(w*) и верхняя грань suph(u*(v),v)
veV
достигается.
Доказательство. Пусть v , v , ... - последовательность точек из множества B(w), для которой
lim h(rn,(vt), vt) = sup h(rn,(v), v).
t—¥ veV
В силу компактности, не ограничивая общности, можно считать, что последовательности v1, v2, ... и ffl*(v'), ffl*(v2), ... сходятся к v0 и u0 соответственно.
Положим u*(v) = w*(v) для v Ф v0 и u*(v0) = u0. Тогда верхняя грань sup h (u*(v), v) достигается в точке v0 и
veV
r(u*) > g(u0, v0) > lim g(ffl*(vt), vt) > r(ffl*).
t—— ¥
Заметим, что в случае абсолютно рационального первого игрока его максимальный гарантированный результат не зависит от функционала S. Поэтому справедливо
Следствие. Максимальный гарантированный результат первого игрока в игре с абсолютно рациональным вторым игроком не меньше аналогичного результата в игре
с ^рациональным вторым игроком.
Аналогично лемме 1 доказывается
lO
Лемма 2. В игре с к-рациональным вторым игроком для любой стратегии o е U* первого игрока найдется такая стратегия u*, что r(u*) > r(ffl*) и верхняя грань sup h(u*(v), v) достигает-
ve V
ся.
Доказанные леммы отчасти отвечают на вопрос 1. Впрочем, нетрудно придумать такой функционал 8, что аналог лемм 1 и 2 для соответствующей игры с 8-рациональным вторым игроком неверен. Но такие контрпримеры плохо интерпретируются.
Заметим, что в учебнике [2] множество рациональных ответов первого игрока определяется формулой (1), если максимум в ней достигается, и равенством B(w*) = V во всех остальных случаях. Пожалуй, a priori такое определение является совсем не мотивированным. Лемма 1 ставит все на свои места.
2. Вычисление максимального гарантированного результата
Для игр с абсолютно рациональным и к-рациональным вторым игроком максимальный гарантированный результат (3) может быть выражен в терминах множеств U и V и функций g и h, что и будет сделано в данном разделе. Введем необходимые обозначения. Положим
L = maxmin h(u, v), D(l) = {(u, v) e U*V: h(u, v) > /},
veV ueU
E(l) = {v eV :min h(u,v) > /], K(l) = sup g(u,v),
L ueU i (u ,v )eD( l)
M(l) = min max g (u, v).
veE(l) ueU
Начнем с замечания: если стратегии u* и w таковы, что B(u*) с B(w*) и u*(v) = co*(v) при v e B(u*), то r(u*) > r(ffl*).
Обратимся к игре с абсолютно рациональным вторым игроком. В силу леммы 1 при поиске оптимальной стратегии первого игрока можно ограничиться рассмотрением таких стратегий, что максимум в определении множества рациональных ответов
противника достигается. Пусть ю* - такая стратегия, V0 е Б(ю*) и и0 = ю*(у0).
Множество Е(Ь) не пусто и выбор любого управления из этого множества гарантирует второму игроку получение выигрыша, большего или равного Ь. Поэтому И(и°, V0) > Ь.
Если Н(и 0, V0) > Ь, то стратегию ю* можно подправить так, что в множестве рациональных ответов второго игрока останется одна точка V0, отчего гарантированный результат первого игрока может только улучшиться. В самом деле, определим стратегию наказания и* условием
И(и* (V), V) = шт Н(и,V),
иеи
и рассмотрим стратегию u* такую, что
Г 0 0
I u , если v = v ,
(4) u*(v)=i ,()
[u* (v) в противном случае.
Эта стратегия гарантирует первому игроку выигрыш g(u0, v0), который в силу сделанного замечания не хуже выигрыша, гарантируемого стратегией О*.
Выбрав подходящим образом точку (u0, v0) e D(L) и используя стратегию вида (4), можно гарантированно получить выигрыш, сколь угодно близкий к K(L).
Пусть теперь стратегия О* такова, что h(u0, v0) = L. Тогда во множество B(o*) входит все множество E(L). Поэтому стратегия ОО* не может гарантировать первому игроку выигрыша, большего M(L). Стратегию О* можно подправить, исключив из множества B(o*) все другие точки и не ухудшив при этом гарантированного выигрыша. А в точках множества E(L) разумно выбирать управления первого игрока в соответствии с его абсо-
и и а и
лютно оптимальной стратегией u* , определенной условием g(u* (v),v) = max g(u, v).
ueU
Рассмотрим стратегию
I u* (v), если v e E(L),
u*(v) = ^
[up (v) в противном случае.
Для нее B(u*) с E(L), поэтому она гарантирует первому игроку выигрыш, не меньший чем M(L).
Таким образом, мы установили, что в игре с абсолютно рациональным вторым игроком R = max{K(L), M(L)}.
Этот результат получен впервые в [3]. Приведенная схема рассуждений позволяет получить аналогичный результат и для игр с к-рациональным вторым игроком. Обратимся к их исследованию.
Пусть О* - произвольная стратегия первого игрока, для которой верхняя грань sup h(o*(v), v) достигается в точке и v0, и
veV
u0 = <o*(v0). Теперь придется выделить три случая.
1) Если h(u0, v0) > L+к, то стратегия (О* не может гарантировать выигрыша, большего K(L + к), а стратегия вида (4) при подходящем выборе точки (u0, v0) позволяет гарантированно получить результат, сколь угодно близкий к K(L+k).
2) Если h(u0, v0) = L, то в B(o*) входит все множество E(L - к), поэтому стратегия а позволяет гарантированно получить выигрыш, не больший M(L - к), а стратегия вида
I u* (v), если v e E(L - к), u*(v) = ^
[up (v) в противном случае.
позволяет получить именно такой выигрыш.
3) Остается рассмотреть случай L < h(u0, v0) < L + к. Пусть g(u0, v0) = l. Тогда в множество B(o*) входят точка v0, множество E(l - к) и, возможно, еще какие-то точки. Поэтому такая стратегия а» не может гарантировать выигрыш больший, чем Щк), где
N (к) = sup min{g (u, v), M (g (u, v) - к)},
(u ,v)eF (к)
^(к) = {(u, v) e U*V: L < g(u, v) < L + к}.
Если теперь выбрать произвольную точку (u0, v0) из множества ^(к) и рассмотреть стратегию
u* (v) =
0 0 u , если v = v ,
u*(v), если ve E(g(u0,v0) - к), но v Ф v0, up в остальных случаях,
то множество B(u*) будет содержаться в объединении {v0} и E(g(u0, v0) - к), а потому первый игрок гарантированно получит выигрыш min {g(u0, v0), M(g(u0, v0) - к)}. За счет подходящего выбора точки (u0, v0) можно гарантировать получение выигрыша, сколь угодно близкого к Щ(к).
Таким образом, доказана
Теорема 1. В игре с к-рациональным вторым игроком имеет место равенство R = max {K(L + к), M(L - к), Щ(к)}.
Заметим, что подобные конструкции появлялись в [11] при регуляризации задачи поиска максимального гарантированного результата в игре с абсолютно рациональным вторым игроком. Но игры с к-рациональным вторым игроком там не рассматривались.
3. Предельные соотношения
Естественно поставить вопрос о связи максимального гарантированного результата в игре с абсолютно рациональным вторым игроком и в игре с к-рациональным вторым игроком при малых значениях к. Ответ на него дает
Теорема 2. Максимальный гарантированный результат в игре с к-рациональным вторым игроком стремится к максимальному гарантированному результату в игре с абсолютно рациональным вторым игроком, когда к, убывая, стремится к нулю.
Доказательство. Заметим, прежде всего, что
(5) Нш К(Ь + к) = К(Ь).
К —>0+
В самом деле, Б(Ь + к) с О(Ь), а потому К(Ь + к) < К(Ь) (Ь+к) < К(Ь) при к > 0. С другой стороны, выберем точку (ие, Vе) е О(Ь) так, что g(uг, Vе) > К(Ь) - г. В этой точке
h(ue, Vе) > L, а потому для всех к < g(ue, ve) - L точка (ue, ve) принадлежит D(L + к). Значит, K(L + к) > g(ue, Vе) > K(L) - e. В силу произвольности е отсюда следует равенство (5).
В силу следствия из леммы 1 этим доказывается теорема в случае, когда max {K(L), M(L)} = K(L).
Аналогичным образом, если max {K(L), M(L)} = M(L), то теорема следует из равенства
(6) lim M(L - к) = M(L).
К ——0+
Остается установить его.
Непосредственно из определения следует, что при к > 0 выполняется неравенство M(L-h) < M(L). Поэтому lim M (L - к) < M (L).
к—0+
Допустим, что
lim M (L - к) < M (L).
к—0+
Тогда существует такое е > 0, что для любого к > 0 найдется точка vK^ V, для которой minh(u,vK) > L - к и
ueU
max g(u, vк) < M(L) - e .
ueU
В силу компактности пространства V множество К : к = 1/и, и = 1, 2, ...} содержит предельную точку v0. Так как функции j(v) = min h(u,v) и y(v) = max g(u,vxr) непрерывны, в
ue U ueU
этой точке выполняются неравенства min h(u, v0) > L и
ueU
maxg(u,v0) <M(L) -e . Первое из них означает, что точка v0
ueU
принадлежит множеству E(L), а тогда второе противоречит определению величины M(L).
Полученное противоречие доказывает равенство (6) а с ним и теорему.
Следствие. Для любой игры и любого е > 0 найдется такое к > 0, что для любого функционала 8, ограниченного сверху числом к, максимальные гарантированные результаты первого игрока в играх с абсолютно рациональным и с ^рациональным
вторым игроком отличаются меньше чем на е.
Назовем игру сильно регулярной, если К(Ь) > М(Ь) и верхняя грань в определении величины К(Ь) достигается в некоторой точке (и0, V0). Из приведенного доказательства видно, что в сильно регулярных играх при к < g(u0, V0) - Ь максимальные гарантированные результаты первого игрока в играх с абсолютно рациональным и к-рациональным вторым игроком попросту совпадают. В [6] показано, что в некотором естественном смысле сильно регулярные игры типичны.
Разумеется, типичность следует понимать как типичность в некотором фиксированном классе, и предыдущее замечание относится к классу всех игр с фиксированными множествами управлений и произвольными непрерывными функциями выигрыша, близость которых оценивается с помощью равномерной метрики. Если на класс игр накладываются какие-то дополнительные ограничения, что может диктоваться, например, природой моделируемого конфликта, то типичными могут оказаться и игры, не являющиеся сильно регулярными. Поэтому их рассмотрение может представлять значительный интерес. Как показывают примеры следующего раздела, характер стремления максимального гарантированного результата первого игрока в игре с к-рациональным вторым игроком к аналогичному результату в игре с абсолютно рациональным вторым игроком может быть весьма различным.
4. Примеры
Во всех примерах данного раздела будем полагать и = V = [0, 1].
Пример 1. Рассмотрим линейные игры с функциями выигрыша g(u, V) = аи - bv и Н(и, V) = си + ^, где а, Ь, с и ё - некоторые положительные константы.
Со всякой игрой бывает удобно связать множество
С = {(х,у) е Я2: х = g(и, V), у = Н(и, V), и е и, Vе V}.
Для данной игры это множество представляет сбой параллелограмм с вершинами (0, 0), (a, c), (-b, d) и (a - b, c + d).
Если множество C выпукло, то максимальный гарантированный результат первого игрока в игре с абсолютно рациональным вторым игроком равен
(7) max x,
(x, y )eC (L)
где C(l) = {(x, y) e C: y > /}, а L, как и прежде, - максимальный гарантированный результат второго игрока.
В данном примере L = d и характер решения зависит от соотношения параметров.
Если c > d, то максимум в формуле (7) достигается в вершине (a, c), поэтому игра является сильно регулярной и при к < c - d максимальные гарантированные результаты первого игрока в играх с абсолютно рациональным и к-рациональным вторым игроком совпадают.
Если же c < d, то максимальный гарантированный результат первого игрока в игре с к-рациональным противником меньше его максимального гарантированного результата в игре с абсолютно рациональным вторым игроком на величину кЬ/d.
Разумеется, оба случая являются типичными в классе игр с линейными функциями выигрыша.
Пример 2. Рассмотрим игру с функциями выигрыша g(u, v) = v cos(2n(u + v)) и h(u, v) = v sin(2n(u + v)).
В этой игре максимальный гарантированный результат второго игрока L = 0, множество C представляет собой единичный круг с центром в начале координат и потому максимальный гарантированный результат первого игрока в игре с абсолютно рациональным противником равен 1, хотя и не достигается ни на одной из стратегий.
В силу выпуклости круга величина K(L + к) = K(^ равна max x . Поэтому величина K(L + к), а значит, и максимальный
(x, y )eC (к)
гарантированный результат первого игрока в игре с к-рациональным вторым игроком, отличается от такого же
результата в игре с абсолютно рациональным вторым игроком на величину порядка к2 (при к ® 0).
Пример 3. Пусть функции выигрыша игроков имеют вид g(u, V) = V С08(2п(м + V)) и
И(ы, V) = V 8т(2п(и + V)) - (V С08(2п(и + V)))2.
В этой игре, как и прежде, Ь = 0, а множество С представляет собой выпуклую яйцеобразную фигуру, вписанную в квадрат {(х, у) е Я2: -1 < х < 1, -1 < у < 1} . Максимум в формуле (7)
достигается для этой игры в точке
а потому макси-
мальныи гарантированным результат первого игрока в игре с
б >/5 -1
абсолютно рациональным вторым игроком равен —^—.
УгловоИ коэффициент касательной к границе множества С
у/5 -1
в точке
\
,0
равен Я = - ((-1)'^5+2 . Поэтому
K(L + k) отличается от 1 на величину порядка Ik.
Если стратегия u* такова, что suph(u„(v),v) < k, то точка
veV
v = 0 принадлежит множеству B(u*), а значит, такая стратегия гарантирует первому игроку выигрыш, не больший нуля, что меньше K(L + k). Поэтому в данной игре разница между максимальными гарантированными результатами первого игрока в играх с абсолютно рациональным и k-рациональным вторым игроком составляет величину порядка Ik (при k ® 0).
Пример 4. Пусть n - нечетное число. Рассмотрим игру с функциями выигрыша g(u, v) = v cos(2n(u + v)) и
h(u, v) = (v sin(2n(u + v)) - (v cos(2n(u + v)))2)n.
Поскольку функция f(x) = xn монотонно и непрерывно отображает отрезок [-1, 1] на себя, максимальный гарантированный результат первого игрока в игре с абсолютно рациональ-
ным вторым игроком будет таким же, как в предыдущем примере (это следует из леммы 1).
А вот его максимальный гарантированный результат в игре с к-рациональным противником изменится. Разница результатов в двух рассматриваемых моделях составит величину порядка
(Як )П.
Более того, при большом значении п множество С в данной игре будет весьма точно аппроксимироваться в Хаусдорфовой метрике объединением отрезков {(х, у) е Я2: х = 0, -1 < у < 1} и
|(х, у) е Я2 : у = 0, - ^2 1 < х < ^2 11. Поэтому при любом
фиксированном значении к можно подобрать настолько большое значение п, что разница между максимальными гарантированными результатами первого игрока в играх с абсолютно рациональным и к-рациональным вторым игроком будет больше, скажем, 1/2.
Замечание. Качественные эффекты, обнаруженные в рассмотренных примерах, разумеется, не зависят от единиц измерения, в которых выражаются выигрыши игроков. Но количественные характеристики (например, величина Я в двух предыдущих примерах) конечно же, зависят от выбора этих единиц. В примерах 2-4 функции выигрыша нормированы условиями
тах р(и,V) = тах к(и,V) = 1,
(и ,v)еUхV (и^ )еUхV
тт р(и,V) = тт к(и,V) = -1,
(и ^)еихГ (и ^ )е иXV
поэтому можно считать, что величина к измерена в естественных безразмерных единицах, а потому и количественные результаты являются осмысленными.
5. Заключение
Попробуем теперь ответить на вопросы, сформулированные во введении. К сожалению, однозначного ответа получить не удается. Причина этого заключается в следующем.
Традиционно интересы игроков задаются с помощью функций, принимающих действительные значения. Какой смысл вкладывается в эту конструкцию - обычно не оговаривается. Существует по крайней мере три способа ее интерпретировать.
1) Можно использовать только отношение порядка на множестве Я для того, чтобы выяснить, какой из двух исходов игры лучше (т. е. функции выигрыша известны с точностью до любого монотонного преобразования).
2) Можно использовать наличие на множестве действительных чисел отношения порядка и согласованной с ним топологии (т. е. критерии известны с точностью до монотонного непрерывного преобразования).
3) А можно использовать еще и согласованность этой топологии с арифметическими операциями, чтобы сделать цель игрока количественной (т. е. функции выигрыша известны с точностью до монотонного аффинного преобразования).
В зависимости от моделируемого конфликта, адекватным может быть каждое из этих пониманий.
Из результатов раздела 3 следует, что при третьем понимании модель с абсолютно рациональным вторым игроком можно считать правильно отражающей реальность. При этом от ответа на первый вопрос по существу ничего не зависит, по крайней мере, если выполняется гипотеза 1.
Примеры 2-4 показывают, что при первом понимании эта модель может оказаться далекой от действительности. В этом случае «функционал скупости» 3 следует выписывать явно, исходя из анализа моделируемой системы.
Второе понимание занимает промежуточное положение, и в таком случае для ответа на поставленные вопросы следует обращаться к детальному анализу моделируемого конфликта.
Обратим внимание на еще одно обстоятельство. В статье [9] и некоторых более поздних работах рассматриваются более сложные, но аналогичные игры с неопределенными факторами. При исследовании на функционал 3 приходится накладывать гораздо более жесткие ограничения, и в дальнейшем они используются по существу. Вероятно, это связано с тем, что в этих играх возможны другие типы неустойчивости с более сложной геометрией. В связи с этим исследование вопросов, аналогичных обсуждавшимся выше, становится необходимым, если пытаться использовать эти модели в прикладных исследованиях.
Подведем итоги. Рассмотренная выше классическая модель уже проходила некоторую проверку практикой. Результаты данной работы можно рассматривать как некое математическое обоснование этой модели.
Заметим, что проблемы, аналогичные рассмотренным выше, возникают не только в играх с обменом информацией. Например, в [13] предложена модель, в которой первый игрок управляет ограничениями на область выборов противника, т. е. множество его стратегий есть семейство всех подмножеств некоторого множества (т. е. опять «бесконечномерное» пространство). Самый естественный подход к исследованию этой модели состоит в том, чтобы применить на начальном этапе идею работы [6], а затем проверить корректность этого подхода.
Заметим, кстати, что в работе [13] (в связи с этой моделью), так же как и в работе [3], вопросы достижимости максимумов обходятся молчанием. Это, видимо, вполне оправданно и разумно на этапе постановки новой задачи, но требует уточнения при ее детальном исследовании.
Сделаем пару замечаний о математической стороне дела.
Факт, установленный в лемме 1, известен давно. Но обычно он получается как следствие теоремы Гермейера о структуре оптимального решения в игре Г2. Попытка аналогичным образом решить задачу с к-рациональным вторым игроком довольно неожиданно наталкивается на значительные трудности. Предложенное выше видоизменение классической схемы доказа-
тельства теоремы Гермейера, видимо, имеет определенные методологические и методические преимущества. В частности, именно оно позволяет доказать более общую теорему 2.
При исследовании сложных теоретико-игровых моделей построение примеров, обладающих заданными свойствами, представляет определенные трудности. Использованный при построении примеров 2-4 способ, основанный на подборе подходящего преобразования в «плоскости критериев», представляется достаточно гибким.
Литература
1. ВАСИЛЬЕВ Д. К., ЗАЛОЖНЕВ А. Ю., НОВИКОВ Д. А., ЦВЕТКОВ А. В. Типовые решения управления проектами. -М.: ИПУ РАН, 2003.
2. ВАСИН А. А., МОРОЗОВ В. В. Введение в теорию игр с приложениями к экономике. - М.: МАКС Пресс, 2005.
3. ГЕРМЕЙЕР Ю. Б. Об играх двух лиц с фиксированной последовательностью ходов // ДАН. - 1971. - Т. 198, №5. -С.1001-1004.
4. ГЕРМЕЙЕР Ю. Б. Введение в теорию исследования операций. - М.: Наука, 1971.
5. ГОРЕЛИК В. А., ГОРЕЛОВ М. А., КОНОНЕНКО А. Ф.
Анализ конфликтных ситуаций в системах управления. -М.: Радио и связь, 1991.
6. ГОРЕЛОВ М. А. Теоретико-множественная постановка задачи синтеза рациональных процедур обмена информацией в иерархических играх двух лиц // Журн. вычисл. ма-тем. и матем. физ. - 2003. - Т. 43, №3. - С. 376-387.
7. ГОРЕЛОВ М. А. Энтропия иерархических игр // Автоматика и телемеханика. - 2008. - №12. С. 139-148.
8. ГОРЕЛОВ М. А. Геометрия информационных расширений // Автоматика и телемеханика. - 2009. - №8. - С. 145-155.
9. КОНОНЕНКО А. Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последова-
тельностью ходов // Журн. вычисл. матем. и матем. физ. -1973. -Т. 13, №1. - С. 311-317.
10. КОНОНЕНКО А. Ф., ХАЛЕЗОВ А. Д., ЧУМАКОВ В. В.
Принятие решений в условиях неопределенности. - М.: ВЦ АН СССР, 1991.
11. МОЛОДЦОВ Д. А. Устойчивость принципов оптимальности / Современное состояние теории исследования операций. - М.: Наука, 1979. - С. 236-262.
12. МОЛОДЦОВ Д. А. Устойчивость принципов оптимальности. - М.: Наука, 1987.
13. НОВИКОВ Д. А. Институциональное управление организационными системами. - М.: ИПУ РАН, 2003. - 68 с.
14. САЙМОН Г. Науки об искусственном. - М.: Едиториал УРСС, 2004.
15. NOVIKOV D. A. Management of active systems: stability or efficiency // Systems science. - 2001. - Vol. 26, №2. - P. 85-93.
16. SIMON H. A. Model of Man. - New York, 1956.
ON A HYPOTHESIS IN FOUNDATIONS OF HIERARCHICAL GAMES THEORY
Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., ([email protected]).
Abstract: In the study of hierarchical games a hypothesis on the behavior of the low-level player is normally accepted. It simplifies sufficiently both the solution of the problem in hand and its reasoning. The adequacy of this hypothesis is discussed below. The simplest two-player game is used to illustrate both the major problems and some approaches to their solution.
Keywords: hierarchical games, maximum guaranteed result, robustness.
Статья представлена к публикации членом редакционной коллегии Д. А. Новиковым