УДК 519.83 В. В. Розеи
Вестник СПбГУ. Сер. 10, 2006, вып. 3
ИГРЫ С КВАЗИУПОРЯДОЧЕННЫМИ ИСХОДАМИ НА ПОЗИЦИОННЫХ ГРАФАХ
1. Введение. Первым типом игр на графах, ставших предметом рассмотрения теории игр, были игры на конечных деревьях (в шахматной терминологии их изучал еще Э. Цермело [1]). Игры на графах общего вида были введены К. Бержем [2, 3]. Переход от дерева к произвольному графу характеризуется тем, что уже в конечном случае утрачивается взаимно однозначное соответствие между партиями и их окончательными позициями. Поэтому в общем случае в качестве исходов игры на графе надо рассматривать партии, а не их окончательные позиции. Однако при таком подходе нарушается фундаментальное свойство игр на графах с полной информацией — наличие ситуаций равновесия в чистых стратегиях (при понимании стратегий в смысле Бержа). Действительно, рассмотрим следующий
Пример. Возьмем поочередную антагонистическую игру на графе (см. рисунок), в которой А\ — {00,03,04} - множество позиций игрока 1 и Л 2 = {ai, 02,05} - множество позиций игрока 2. Функцию выигрыша игрока 1 на множестве партий определим так:
/(00,0!,03,05,07) - /(00,02,04,05,00) = 1, /(ao,ai,a3,05,a6) = f(a0,a2,a4,a5,a7) = 0.
Здесь у игрока 1 имеются 2 стратегии S[ и S[. определяемые условиями 5{(оо) = oi, 5[(а0) = 02, а также 2 стратегии Sl2 и у игрока 2, где 62(05) = ае, ¿>2(05) = а7. Указанная игра не имеет седловой точки (т. е. ситуации равновесия) в чистых стратегиях, так как maxmin/(si,s2) = 0, а
Sl S2
minmax/(si, S2) = 1-
S 2 »1
Принципиальным является тот факт, что свойство наличия ситуаций равновесия «восстанавливается», если расширить понятие стратегии таким образом, чтобы в каждой фиксированной позиции выбор следующей позиции учитывал «предысторию», т. е. последовательность ранее пройденных позиций. Такое понимание стратегии в игре на графе, введенное автором в работах [4, 5], принимается и здесь, при этом стратегии в смысле Бержа составляют некоторое подмножество множества стратегий (в данном расширенном понимании) и называются в дальнейшем простыми стратегиями. В настоящей работе рассматриваются игры на позиционных графах двух типов:
1) исходами являются окончательные позиции,
2) исходами являются партии.
В соответствии с этим целевая структура для игр 1-го типа задается с помощью отношений квазипорядка на множестве окончательных позиций, а для игр 2-го типа -на множестве партий. Заметим, что задание целевой структуры игры в форме отношения квазипорядка (т. е. рефлексивного и транзитивного бинарного отношения) не требует количественной оценки исходов, а предполагает лишь их сравнение по принципу «лучше-хуже».
© В. В. Розен, 2006
Поочередная антагонистическая игра на графе.
В п. 2 дана наиболее общая формулировка условий существования ситуации равновесия в играх с квазиупорядоченными окончательными позициями.
В п. 3 изучаются игры, в которых исходами являются партии. Отметим, что вопрос существования ситуаций равновесия для игры на графе с квазиупорядоченными партиями может быть сведен (при отсутствии в графе бесконечных путей) к соответствующему вопросу для игры с квазиупорядоченными окончательными позициями на некотором новом графе - древовидной форме первоначального графа.
В п. 4 рассматриваются антагонистические игры на достижимость целей.
2. Игры с квазиупорядоченными окончательными позициями. Граф (ориентированный) с множеством вершин А рассматривается как пара (А, 7), где 7CÍ2. Срез 'у(а) представляет собой множество вершин графа, следующих за а; через Af обозначается множество вершин, для которых нет следующих за ними вершин. Граф {А, 7) называется n-позиционным, если задано разбиение {Ai,... ,Ап} множества A\Af. Принимая теоретико-игровую терминологию, будем называть А{ множеством позиций игрока i (i = 1 ,...,п), Af - множеством окончательных позиций. Траектория (или путь) в графе {А, 7) - это последовательность (конечная или бесконечная) его вершин ао, ai,..., a¿,..., в которой для каждого к — 1,..., í,... выполняется а^ € 7(0^-1). Траектория называется партией, если она либо бесконечная, либо содержит вершину ar € Af. Все остальные траектории называются дебютами. Всякое отображение s¿ : Ai —А, удовлетворяющее условию s¿ С 7, будем называть простой стратегией игрока г; множество всех простых стратегий игрока г обозначим через 5г. Выбор позиции a £ А и n-системы (si,..., sn) & Si х ... х Sn, называемой ситуацией в простых стратегиях, определяет партию (a,si,..., sn) — a, s(a), s2(a),..., где s = si U ... U sn. Если в графе (А, 7) нет бесконечных путей, то с любой позицией связано отображение Fa : Si х ... х Sn —Af, которое каждой ситуации в простых стратегиях (si,...,sn) ставит в соответствие окончательную позицию партии (a,s 1,..., sn). Зададим для каждого г = 1,..., п на множестве A¡ окончательных позиций отношение квазипорядка иг. Фиксируя начальную позицию ao G А, получаем простую игру Сао(Г) на позиционном графе Г — {А, 7, Ai,..., Ап, u>i,..., шп) с квазиупорядоченными окончательными позициями, в которой множеством стратегий игрока г (i = 1,... ,п) является Si, множеством исходов - Af, функцией реализации - отображение Fao, отношением предпочтения игрока г - отношение квазипорядка .
Теорема 1. Пусть для каждой позиции а € Ai (i — 1,... ,п) любое непустое подмножество множества окончательных позиций, достижимых из а в графе (А, 7), имеет наибольший элемент относительно квазипорядка w¿. Тогда существует ситуация в простых стратегиях, которая является ситуацией равновесия по Нэгиу для всех игр Gao(Г), где ао € А. Другими словами, в позиционном графе Г существует ситуация абсолютного равновесия.
Доказательство. Следуя Бержу [2], определим по индукции для каждого порядкового числа а подмножество Са С А следующим образом: а) Со = Af, b) пусть для всех порядковых чисел /3 < а определено подмножество Ср С i. Если а - непредельное порядковое число (т. е. для него существует предшествующее порядковое число а — 1), то полагаем Са = Са-\ U {а € A\Af : 7(a) С Ca_ 1}; если а -
предельное порядковое число, то полагаем Са = U Ср. Степенью вершины а е А на-
/3<а
зовем наименьшее порядковое число р(а), для которого а € Ср(ау Ввиду отсутствия в графе (А,7) бесконечных путей каждая его вершина имеет степень [3], причем степень вершины является непредельным порядковым числом. Индукцией но степени вершины
определим отображение s : А —> А следующим образом. Для каждой вершины а нулевой степени (т. е. для а G Af) полагаем s(a) = о. Пусть теперь вершина а G A\Af имеет степень р(а) = а и для всех вершин a' G А, для которых р(а') < а, отображение s(a') уже определено, причем так, что если 7(а1) ф 0, то s(a') G 7(0'). Тогда s определено на Ca-i и удовлетворяет условию s С 7. Обозначим через ограничение построенного отображения s на подмножестве Ca_i П А3 (j = 1,... ,п). Так как подмножество Са-\ является 7-устойчивым, то всякая партия, начальная позиция которой попадает в Ca_i, целиком находится в Ca_i, поэтому можно рассматривать как простую стратегию игрока j в подыгре, индуцированной на Са-\. Учитывая, что a G Са\Са-1, получаем 0 ф 7(а) С Са -1 и, в силу сказанного выше, функция Fx(s"~1,..., s™-1) определена при всяком х G 7(а>. Положим Та = {Fx(s^\..., я«"1) : х е 7{а)}, т. е. множество окончательных позиций тех партий, в которых каждый из игроков j — 1,... ,п использует стратегию s" ~1, а начальная позиция «пробегает»множество 7(а). Очевидно, что Та является непустым подмножеством множества окончательных позиций, достижимых в графе (Л,7) из позиции а. Считая, что а € А;, получаем по условию теоремы, что в подмножестве Та существует наибольший элемент а* относительно квазипорядка Шг- Полагаем s(a) = х*, для которого Fx* ..., s""1) = а*. Таким образом, для всех
х G 7 (а) выполняется соотношение
Fx(sr\- ■ ■, С-1) ^ Fx. (sar\- ■ ■, «Г1)- (1)
По индукции отображение s определено для всех a G А, причем если 7(а) Ф 0, то s(a) G 7(0), т. е. s С 7. Пусть s¿ - ограничение отображения s на Aj, тогда Sj - простая стратегия игрока j. Индукцией по степени начальной позиции ао покажем, что набор (si,..., sn) является ситуацией равновесия по Нэшу в любой игре <7О0(Г), где а0 G А.
База индукции. Пусть р(ао) — 0, т. е. a G Со = Af. В этом случае значение функции Fao есть а0 независимо от ситуации. Следовательно, любая ситуация будет ситуацией равновесия по Нэшу.
Шаг индукции. Пусть а - фиксированное порядковое число и ситуация (si,..., sn) является ситуацией равновесия по Нэшу в любой игре (?Ж(Г), где р(х) < а. Возьмем начальную позицию а0 G А, для которой р(а0) = ос, и покажем, что (sx,...,sn) ~ равновесие по Нэшу в игре Сао(Г). Будем считать, что а0 G Aj. Предположим, что игрок j (j = 1,..., п) вместо простой стратегии Sj использует простую стратегию s'j. Если j ф i, то, учитывая, что позиция, следующая за а0, принадлежит Ca-i, получаем требуемое утверждение по предположению индукции. Остается рассмотреть случай j — i. Положим Si(a0) — ai, s¿(a0) = a[. В силу (1) выполняется
Fa> (si,..., sn) ^ Fai (s 1,..., sn).
Так как a[ G 7(00) Q Ca-1, то по предположению индукции
OJi
Fa¡i (si,..., S¿_1, ssi+i ,...,sn)^Fa^(s!,..., sn).
Из последних двух соотношений получаем
F^ (si,..., sí-i, s-, sí+i, ...,sn)^Fai(s 1,..., sn). (2)
По построению выполняются равенства
Fao{si,...,sn) = Fai(si,...,sn),
Fa0(s 1, • • • , Si— i, Si+l, . . ■ , Sn) — Fa\ (slj • - ■ j Si-lj S't-fl; ■ ■ • j sn)
и, согласно (2), находим
i
-Pao j ■ • ■ i 1) ^i+1 j ■ ■ ■ j ®n) ^ -Pao
т. e. (si,..., sn) - ситуация равновесия по Нэшу в игре Сао(Г). Теорема 1 доказана.
Обобщенная теорема Цермело [2] является непосредственным следствием теоремы 1. Действительно, рассмотрим игру, в которой для каждого игрока г его функция выигрыша fi принимает конечное число значений. Полагая
Ш i
fi(ai) ^ /¿(a2),
получаем, что w¿ является линейным квазинорядком, причем эквивалентность £,; = шг П ыГ1 имеет конечное число классов. В этом случае каждое непустое подмножество в At имеет наибольший элемент относительно указанного квазипорядка т. е. выполнены все условия теоремы 1. Отметим еще несколько следствий теоремы 1.
Следствие 1. Если для каждого г — 1 ,...,п квазиупорядоченное множество (Af,Ui) удовлетворяет условию обрыва возрастающих цепей, то существует ситуация в простых стратегиях (si,..., sn) Е (5i x ... x Sn), которая является ситуацией равновесия для всех игр Gao(r), где а о Е А. Это означает, что для любых г = 1,... , п и s[ Е Si неравенства
i
-Pao 5 • • • 5 si—1) sii з • • ■ > ^ -Pao (S17 ■ • • ; sn)
нет.
Следствие 2. Если в графе (А, 7) Для каждогоа Е А выполняется |7(а)| < оо, то существует ситуация в простых стратегиях, являющаяся ситуацией равновесия для каждой игры Сао(Г), где üq Е А.
3. Игры с квазиупорядоченными партиями. Перейдем к рассмотрению игр на графах, в которых исходами являются партии. Как отмечалось в п. 1, в данном случае множества простых стратегий недостаточно для обеспечения существования ситуаций равновесия. Требуемое расширение этого множества производится следующим образом. Пусть {А, 7, Ai,... ,Ап) - позиционный граф, а Е A¿. Через La будем обозначать множество всех дебютов с последней позицией а и называть его множеством дебютов игрока г, через L - множество всех дебютов, через L* - множество всех партий. Отображение a i, которое каждому дебюту I Е Ьа игрока г ставит в соответствие некоторый элемент множества 7(а), называется стратегией игрока i. Множество всех стратегий игрока г обозначается через X¡¿. Стратегия ст, «выбирает» в каждой позиции а Е А% одну из следующих за ней позиций, причем такой выбор обусловливается не только самой позицией а, но и всем предшествующим ей дебютом. Отметим, что формально всякую простую стратегию можно считать стратегией a i, удовлетворяющей условию
кМ Е La =$> ai{h) = OÍ{12).
Выбор дебюта I Е L и п-системы (ai,... ,ап) стратегией игроков 1,... ,п единственным образом определяет партию {I] ai,..., <тп), являющуюся продолжением дебюта I. Пусть Ff - отображение, которое каждой ситуации (ai,... ,ап) Е Si х ... х Еп ставит
в соответствие партию (/; а\,..., ап). Если для каждого г — 1 ,...,п задать на множестве Ь* всех партий отношение квазипорядка то полумается позиционный граф Д с квазиупорядоченными партиями
Д = {А,-у,Аи...,Ап-,С1и...,Пп).
Фиксируя начальный дебют ¿о 6 получаем игру С(*о(Д) с квазиупорядоченными исходами, в которой множеством стратегий игрока г является множеством исходов - множество Ь* всех партий в графе'{А, 7), отношением предпочтения игрока г -отношение квазипорядка П*, функцией реализации - отображение Р^.
Задача нахождения условий существования ситуаций равновесия в игре (Д) может быть сведена к аналогичной задаче для простой игры на некотором новом позиционном графе, называемом древовидной формой графа Д. Под древовидной формой графа Д понимается система
П1 ) • • ■ ) ^71/ >
где А - множество всех путей в графе {А, 7); 7 - отношение продолжения путей £ 7 означает, что путь 1\ получается из пути ¿2 отбрасыванием его последней вершины); А^ - множество дебютов, последняя позиция которых находится в А,. Так как в графе (А, 7) нет бесконечных путей, их не будет и в графе (А, 7), причем окончательными позициями в графе (А,7) будут в точности все партии в графе {А,7). Таким образом, Д представляет собой позиционный граф с квазиупорядоченными окончательными позициями. Поэтому, фиксируя начальный дебют 1о, для него можно построить, как в п. 2, простую игру С?г0(Д). Имеет место следующий принципиальный факт.
Лемма 1. Если в графе (А, 7) нет бесконечных путей, то игры С*1(} (Д) и (7г0(Д) изоморфны.
На основании леммы получаем из теоремы 1 и следствий 1 и 2 следующие условия существования ситуаций равновесия в игре С*1о (Д).
Следствие 3. Если в графе (А, 7) нет бесконечных путей и для каждого дебюта игрока г любое непустое подмножество партий, являющихся его продолжениями, имеет наибольший элемент относительно квазипорядка Гто существует набор стратегий (о\,... ,ап) 6 £1 х ... х Еп, являющийся равновесием по Нэшу во всех играх С*(Д), где I £ Ь.
Следствие 4 [6]. Если в графе (А,7) нет бесконечных путей и для каждого I = 1 ,...,п квазиупорядоченное множество удовлетворяет условию обрыва
возрастающих цепей, то существует набор стратегий {а±,... ,ап) € £1 х ... х Еп, являющийся ситуацией равновесия в любой игре С*1о (Д), где 1о € Ь.
Следствие 5. Если в графе {А,7) нет бесконечных путей и |7(а)| < оо для всех а е А, то существует набор стратегий, являющийся ситуацией равновесия в каждой игре (7*о(Д), где 10 е Ь.
4. Игры на достижимость целей. Под целью в графе (А, 7) будем понимать некоторое подмножество М его партий. Рассмотрим 2-позиционный граф, в котором выделена цель М С Ь*:
Ам - (А,1,А1,А2,М).
Фиксируя в нем произвольным образом начальный дебют I, получаем антагонистическую игру С;*(Дм) игроков 1 и 2, в которой множеством стратегий игрока г (г — 1,2)
является Sj, а функция выигрыша fi игрока 1 определена условием
, . . ¡1, если (/,<71, <т2) G М;
10, если (/,<7i,<72) ф. М.
Игру С^(Дм) будем называть игрой на достижимость цели М из начального дебюта I. Формально ее можно рассматривать как игру квазиупорядоченными партиями, поэтому к ней применимы результаты п. 3. В частности, если в графе (А, 7) нет бесконечных путей, то, согласно следствйю 3, существует ситуация (of, а®) G Ei х Е2, которая является равновесием по Нэшу во всех играх G*(Am)-
Дебют I называется выигрышным дебютом игрока 1, если существует стратегия (7i € Si, гарантирующая игроку 1 цель М из дебюта I (т. е. V <72 G Е2 (Z,<7i,ct2) € М). Дебют I называется выигрышным дебютом игрока 2, если существует стратегия ст2 € £2, запрещающая игроку 1 цель М из дебюта I (т. е. V € Si (Z,<7i,<72) ^ М). Легко видеть справедливость следующего утверждения.
Лемма 2. Ситуация (<7i,(72) G £1 х Е2 является ситуацией равновесия по Нэшу в игре на достижимость цели М из начального дебюта I тогда и только тогда, когда либо <7i гарантирует цель М, либо а2 запрещает цель М игроку 1 из дебюта I.
С учетом следствия 3 получаем следующий результат.
Теорема 2. Пусть в 2-позиционном графе (Л,7, Л.1,Л2) выделена цель М С L*. Если в графе (А, 7) нет бесконечных путей, то
1) каждый его дебют является выигрышным дебютом либо игрока 1, либо игрока 2;
2) существуют оптимальные стратегии а^ € Ei и G Е2 такие, что
a) стратегия гарантирует игроку 1 цель М из любого выигрышного дебюта игрока 1;
b) стратегия запрещает игроку 1 цель М из любого выигрышного дебюта игрока 2.
Summary
Rosen V. V. Games with quasiordered outcomes on positional graphs.
We consider games on graphs in which outcomes are plays or its final positions. In these games, the goal structure with quasiorder relations on the set of outcomes is given. One generalization for strategy conception in a game on graph (in the sense of C. Berge) is proposed such that for every fixed position the choice of the next position depends on all earlier passed positions. Some sufficient conditions for existence of equilibrium points (and also Nash equilibrium) are found.
Литература
1. Цермело Э. О применении теории множеств к теории шахматной игры // Матричные игры / Под ред. Н. Н. Воробьева. М.: Физматгиз, 1961. С. 167-172.
2. Берж К. Общая теория игр нескольких лиц / Пер. с франц.; Под ред. В. Ф. Колчина. М.: Физматгиз, 1961. 126 с.
3. Берж К. Теория графов и ее применения / Пер. с франц.; Под ред. И. А. Вайнштейна. М.: Иностр. лит-ра, 1962. 319 с.
4. Розен В. В. Достижимость в позиционных графах // Кибернетика. 1970. № 3. С. 103-106.
5. Розен В. В. Основные задачи теории позиционных графов // Математические модели поведения: Сб. науч. трудов. Саратов: Изд-во Саратовск. ун-та, 1973. С. 49-60.
6. Гилъмап Е. А., Шимельфениг О. В. Игры на графах // Современные направления теории игр: Сб. науч. трудов. Вильнюс: MOKCJ1AC, 1976. С. 44-62.
Статья поступила в редакцию 6 марта 2006 г.