Научная статья на тему 'Иерархические игры с неопределенными факторами'

Иерархические игры с неопределенными факторами Текст научной статьи по специальности «Математика»

CC BY
325
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ ТЕОРИЯ ИЕРАРХИЧЕСКИХ СИСТЕМ / ИГРЫ С НЕОПРЕДЕЛЕННЫМИ ФАКТОРАМИ / МАКСИМАЛЬНЫЙ ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ / INFORMATIONAL THEORY OF HIERARCHICAL SYSTEMS / GAMES UNDER UNCERTAINTY / MAXIMUM GUARANTEED PAYOFF

Аннотация научной статьи по математике, автор научной работы — Горелов Михаил Александрович

Рассматривается иерархическая игра двух лиц, в которой игроку верхнего уровня неточно известны интересы партнера. Вычисляется максимальный гарантированный результат игрока верхнего уровня. Предлагается новое определение максимального гарантированного результата, эквивалентное традиционному. Благодаря этому, решение задачи сводится к простым преобразованиям формул исчисления предикатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Hierarchical games under uncertainty

Hierarchical game of two players is considered. It is supposed that the leader has incomplete information about follower’s interests. The maximum guaranteed payoff of the leader is calculated. An alternative definition of the maximum guaranteed payoff is suggested, which is shown to be equivalent to the classical one. It is used to reduce the problem of maximum guaranteed payoff simple transformations of predicate calculus expressions.

Текст научной работы на тему «Иерархические игры с неопределенными факторами»

УДК 519.865 + 519.95 ББК 22.165

ИЕРАРХИЧЕСКИЕ ИГРЫ С НЕОПРЕДЕЛЕННЫМИ ФАКТОРАМИ

Горелов М. А.1

(Вычислительный Центр им. А.А. Дородницына Российской академии наук, Москва)

Рассматривается иерархическая игра двух лиц, в которой игроку верхнего уровня неточно известны интересы партнера. Вычисляется максимальный гарантированный результат игрока верхнего уровня. Предлагается новое определение максимального гарантированного результата, эквивалентное традиционному. Благодаря этому, решение задачи сводится к простым преобразованиям формул исчисления предикатов.

Ключевые слова: информационная теория иерархических систем, игры с неопределенными факторами, максимальный гарантированный результат.

1. Введение

Исследование иерархических игр с неопределенными факторами было начато в 1973 году сразу четырьмя статьями [2-4, 6]. За этими статьями последовало большое число работ, в которых исследовались аналогичные модели при различных предположениях об информированности игроков и правилах их взаимодействия. Значительное число результатов и дальнейшие ссылки по этой теме можно найти в [5].

Параллельно исследование подобных моделей велось в рамках теории активных систем. Обзор результатов, полученных данной школой, приведен в [1].

1 Михаил Александрович Горелов, кандидат физико-математических наук, ([email protected]).

Практически во всех работах решение поставленной задачи ищется по одной схеме: сначала угадывается структура оптимальной стратегии игрока верхнего уровня, а затем доказывается, что эта стратегия действительно является оптимальной (с помощью построения соответствующей верхней оценки).

Общая логика поведения игрока верхнего уровня во всех случаях одинакова: он предлагает партнеру некоторый взаимовыгодный план действий и использует наказание в случае, когда игрок нижнего уровня отказывается следовать предложенному плану. Но реализация этой схемы в каждом случае своя. Часто она оказывается весьма сложной и требует от решающего задачу большой изобретательности.

Ниже предлагается другой, более формальный подход к решению подобных задач. Он основан в значительной степени на преобразовании формул, быть может, несколько длинных, но простых. Как представляется, этот подход является достаточно универсальным.

В данной статье предлагаемый метод демонстрируется на примере решения задачи, поставленной в [2]. В этой работе поставленная задача решена в предположении конечности множества неопределенных факторов. Для предлагаемого там метода решения это принципиально: исходная задача сводится к поиску максимума функции п действительных переменных, где п - число точек в множестве неопределенных факторов. Ниже та же задача решена в предположении компактности множества неопределенных факторов и непрерывности функции выигрыша игрока нижнего уровня.

2. Игры с неопределенными факторами

Будем рассматривать конфликтное взаимодействие двух участников. Одного из них будем отождествлять с оперирующей стороной, т.е. конфликт будем описывать с его точки зрения и исследование проводить в его интересах. По традиции будем называть этого участника первым игроком.

Предположим, что представления первого игрока о конфликте задаются пятеркой Г = (и, V, А, g, И). Здесь и, V и А -множества, g - функция, отображающая декартово произведе-

ние и х V в множество действительных чисел Я, а функция И: и х V х А ^ Я.

Множества и и V интерпретируются как множества управлений первого и второго игроков соответственно. Стремлением к максимизации функции g описываются интересы первого игрока. А функция И вместе с множеством А описывают представления первого игрока об интересах партнера. А именно, первый игрок считает, что второй стремится максимизировать значение И(и, V, а) при некотором значении параметра а, но само значение а ему неизвестно. Известно лишь, что а е А.

В дальнейшем будем предполагать, что множества и, V и А наделены топологиями и компактны, а функции g и И непрерывны во всех точках своих областей определения.

Игра Г описывает «технологическую» сторону конфликта. Чтобы получить полное его описание, нужно задать информированность игроков.

Будем считать, что до окончательного выбора своего управления первый игрок получает достоверную информацию об управлении, выбранном его партнером. Кроме того, второй игрок может сообщить ему информацию о своих интересах, назвав некоторый элемент 5 е А. Но при этом он может солгать, а первый игрок не имеет возможности проверить достоверность полученной информации. Формально это описывается с помощью игры Г* = (и*, V*, А, g*, И*), имеющей следующую структуру.

Второй игрок выбирает, во-первых, свое управление V е V, а во-вторых, сообщение ¡е А, т.е. его множество стратегий представляет собой декартово произведение V* = V х А. Множество стратегий и* первого игрока представляет собой семейство всех функций и* : V х А ^ и. Функция выигрыша первого игрока g* задается условием

g*(u*, V*) = g(u*(v, 5), V), где V* = ^,5). Представления первого игрока о целях партнера задаются функцией

И*(и*, V*, а) = И(и*(у, ¡), V, а).

Игра Г* дает полное и адекватное описание представлений оперирующей стороны о конфликте, в котором она участвует.

Наличие связи этой игры с более простой игрой Г задает на модели Г* некоторую дополнительную структуру, которая позволяет упростить ее исследование.

3. Максимальный гарантированный результат

Предположим, что в игре Г* игрок номер один обладает правом первого хода, т.е. он первым выбирает свою стратегию и* и имеет возможность сообщить о сделанном выборе партнеру. В таком случае он может использовать свои знания о целях партнера для того, чтобы предсказать его реакцию на выбор стратегии и*.

А именно, если интересы второго игрока описываются стремлением к максимизации функции И*(и*, V*, а), то естественно предположить, что в ответ на выбор стратегии и* второй игрок выберет стратегию V* из множества рациональных ответов

БЯ(и, ,а) = е У : К (и, V ,а) = тах К (и, ж ,а)\.

( ж, еУ, )

Формально необходимо предусмотреть и случай, когда максимум в последней формуле не достигается. В таком случае обычно полагают множество рациональных ответов равным

BR(u, ,а) = < v, eV: h (и, v, ,а) > sup h (и, w, ,а) - к

[ w,eV,

где к - некоторый положительный параметр, известный первому игроку.

Первому игроку не известно действительное значение неопределенного фактора а, поэтому он может гарантированно рассчитывать лишь на то, что выбранная вторым игроком стратегия будет принадлежать объединению IJ BR(u. ,а). Соответ-

ссеА

ственно, выбор первым игроком стратегии и* гарантирует ему получение выигрыша inf inf g (и, v),

aeA v*eBR(и*,а)

а его максимальный гарантированный результат равен R = sup inf inf g (u, v).

ueU aeA v*eBR(u*,a)

Таково классическое определение максимального гарантированного результата. Наша ближайшая цель будет состоять в том, чтобы заменить его более простым эквивалентным определением. Для этого потребуется следующий вспомогательный результат.

Лемма 1. Для любого у< R существует такая стратегия

u* е U*, что

inf inf g, (u, v) >у

aeA v* eBR(u ,а)

и для любого а е A верхняя грань sup h (u, v,а) достигается.

v*eV*

Доказательство. Если у удовлетворяет условию у< R, то существует стратегия со*, для которой (1) inf inf g. (с, v,) >у .

аеА veBR(с а)

Рассмотрим множество О(с*) = {(u, v) е U х V: 3 а е A: c*(v, а) = u} и его замыкание Q(®*). По построению множества О(с*) и Q(®*) обладают следующими двумя свойствами:

1) для любого v е V найдется u е U, для которого (u, v) е Q(®*);

2) для любого а е A выполнено неравенство max h(u, v,а) < sup h (с, v ,а).

(иУ)еП(ю,~) ^ еК

Кроме того, для а е A определим множества О(с*, а) = {(u, v) е U х V: 3 ре A: (v, р) е BR(a*, а) & & c*(v, а) = u} и их замыкания Q(®*, а). Очевидно, 0(ю*,а) с Q(®*). Определим функцию u*: V х A ^ U в два этапа. Первый этап. Для каждого а е A выберем точку ^а, Vа) е Q(®*, а), для которой h(иа,vа,а) = max h(u,v,d),

(и ,v )еП (с а)

и положим т^а , а) = ua. В силу свойства 2) будет выполнено и равенство h(ua,va,а) = max h(u,v,а).

(u,v)еП(с)

Второй этап. Для остальных значений аргументов определим значения функции произвольно, но так, чтобы выполнялось

условие (u*(v, ff), v) e O(a*) (это можно сделать в силу свойства 1) множества O(a*)).

Покажем, что так построенная функция и* удовлетворяет всем условиям леммы.

В силу выбора точки (иа, Va) и непрерывности функции h имеем

Н(иа, va,a) = max h(u, v^) = sup h(u, v^) =

(u ,v )eQ |>*,а) (и,у)еО(а*,а)

sup h(a, (v,f), v^) = sup h , v, ,а) =

(yfeBRim,,^) v^eBR^^)

= suphv,,а) .

v*eV*

С другой стороны, в силу построения функции и* для любых v* = (v, ff) e V х A = V* имеем (u*(v, ff), v) e Q(®*), поэтому в силу свойства 2) множества Q(®*) имеем

h(u,,v,а) = h(u„(v,f),v,а) < max h(u,v,а) <

(u ,v )eQ )

< suphv,,а).

v* eV*

Следовательно, верхняя грань sup h (u., v ,а) достигается,

v*eV*

например, в точке v* = (vа, а).

Теперь покажем, что функция и* гарантирует первому игроку получение выигрыша, не меньшего у. Рассмотрим произвольную стратегию v* = (v, ff). Возможны два случая.

Если значение и = u*(v, ff) было выбрано на первом этапе, то в любой окрестности точки (и, v) найдется точка (и', v') e O(rn*, а) для некоторого а e A. Но для всех таких точек g(и', v') > у (в силу условия (1)), а, следовательно, g*(u*, v*) = g(и, v) > у.

Если значение и = u*(v, f), было выбрано на втором этапе, то возможно два случая. Если для некоторого а выполнено равенство

h(u,у,а) = max h(u',у',а),

(u ,v )eO(№,а)

то тогда g*(u*, v*) = g(u,v) > у А в противном случае стратегия v* не принадлежит множеству BR(u*, а) ни при каком а (здесь используется, что верхняя грань sup h (u, v ,а) достигается).

v*еV*

Итак, в любом случае либо первый игрок получает выигрыш, не меньший у, либо стратегия не принадлежит множеству рациональных откликов. Это доказывает, что построенная стратегия u* удовлетворяет условиям леммы.

Содержательно утверждение леммы 1 означает следующее: среди оптимальных стратегий первого игрока непременно найдется такая, что при всех значениях неопределенного фактора верхняя грань в определении множества рациональных ответов достигается. Из этого факта вытекает следующее утверждение.

Следствие. Максимальный гарантированный результат R в игре Г* на самом деле не зависит от параметра к, который формально присутствует в его определении.

Анализируя доказательство леммы 1, можно установить, что справедливо следующее утверждение, имеющее и самостоятельное значение.

Лемма 2. Для любого у< R существует такая стратегия u* е U*, что

inf inf g, (u, v) >у

аеА v*еBR(u*,а)

и для любого а е A существует такое v е V, что (v, а) е BR(u*, а).

Доказательство. Условиям леммы 2 удовлетворяет стратегия u*, построенная при доказательстве леммы 1.

Интерпретировать это утверждение можно следующим образом: среди оптимальных стратегий первого игрока всегда найдется такая, что передача ложной информации о неопределенном факторе не принесет второму игроку дополнительной выгоды.

Теперь все готово для того, чтобы дать альтернативное определение максимального гарантированного результата.

Определение 1. Число у является гарантированным результатом первого игрока в игре Г*, если существует такая

стратегия u*, что для любого а е A найдется число Л, для которого выполняется одно из двух условий:

1°) существует w* е V*, для которого h*(u*, w*, а) > Л; 2°) для любого v* е V* либо g*(u*, v*) > у, либо h*(u*, v*, а) < Л.

Точная верхняя грань гарантированных результатов первого игрока называется его максимальным гарантированным результатом.

Корректность использования двух определений для одного термина основывается на следующей лемме.

Лемма 3. Максимальный гарантированный результат (в смысле предыдущего определения) равен R.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. Временно обозначим максимальный гарантированный результат в смысле определения 1 через R. Докажем сначала, что R > R.

Выберем произвольное у< R. Тогда существует стратегия u*, для которой inf inf gt (и,, v,) >у. Не ограничивая

аеА v eBR(и ,а)

общности можно считать, что для любого ае A верхняя грань sup h (и, v ,а) достигается. Фиксируем произвольное ае A и

v,e¥,

положим Л = maxh (и,V,а). Тогда для v* е BR(u*, а) выпол-

v, еУ,

няются неравенства g*(u*, v*) > у и h*(u*, v*, а) > Л, а для v* g BR(u*, а) справедливо неравенство h*(u*, v*, а) < Л. Следовательно, у - гарантированный результат в смысле определения 1. В силу произвольности у отсюда следует неравенство R' > R.

Докажем обратное неравенство R' < R. Допустим противное. Тогда можно выбрать число у так, что R' > у > R.

Так как R' > у, существует стратегия u*, гарантирующая (в смысле определения 1) получение выигрыша у

Но так как у > R, для этой стратегии u* выполняется неравенство inf inf g (и, v) < у. Фиксируем а е A, для которого

аеА V,еBR(и* ,а)

inf g (и, V) < у , и допустим, что для этого а верхняя грань

V еBR(u ,а)

sup h (u,,v, ,а) достигается. Выберем в множестве BR(u*, а)

v*eV*

точку v* так, что g*(u*, v*) < у.

Тогда в силу пункта 2 определения 1 должно выполняться неравенство h*(u*, v*, а) < Л. А в силу сделанного допущения h (u, v,, а) = sup h (u,, w,, а), и потому из пункта 1 определе-

w*eV*

ния 1 следует h*(u*, v*, а) > Л. Получено противоречие.

Для завершения доказательства леммы остается избавиться от сделанного допущения. Для этого можно воспользоваться аналогом леммы 1 для нового определения максимального гарантированного результата. Это утверждение может быть доказано с помощью той же техники, что и лемма 1. Но поскольку ниже будет предъявлена явная конструкция оптимальной в смысле определения 1 стратегии первого игрока, для которой соответствующее утверждение очевидно, повторяться вряд ли стоит.

Определение 1 логически проще, и, как будет видно из следующего раздела, удобнее в обращении классического определения. Кроме того, оно имеет столь же ясную содержательную интерпретацию. В самом деле, стратегия и* гарантирует первому игроку выигрыш у, если множество V* стратегий второго игрока разбивается на две части так, что выбор стратегии из первой части дает первому игроку выигрыш у или больше, а выбор стратегии из второй части не выгоден второму игроку. Разумеется, поскольку какой-то выбор второй игрок все-таки должен сделать, первая часть не должна быть пустой.

На основании сказанного, определение 1 следует признать основным. А классическое определение приведено выше как дань традиции.

4. Вычисление максимального гарантированного результата

Положим Н(у) = {(и, v) e U х V: g(u, v) > у} и

l(а,у) = max h(u,у,а) .

(u,v)eH (у)

Из стандартных теорем анализа следует, что при фиксированном у функция ¡(а, у) непрерывно зависит от а e A, а при фиксированном а она монотонно не возрастает по у.

Лемма 4. Число уявляется гарантированным результатом в игре Г* тогда и только тогда, когда существует такая стратегия со*, что для любого а e A и любой стратегии v* e V* выполнялось одно из неравенств g*(c*, v*) > уили h*(m, v*, а) < ¡(а, у).

Доказательство. Пусть и* и Л удовлетворяют определению 1, а w* = (w, Р) - стратегия, существование которой гарантируется пунктом 1 этого определения. Тогда в силу пункта 2° выполняется неравенство g*(u*, w*) > у, т.е. пара (u*(w, Р), w) принадлежит множеству Н(у). Но тогда в силу пункта 1° имеем Л< ¡(а, у). Значит, из пункта 2° следует выполнение для любых а и v* одного из неравенств g*(u*, v*) > уили h*(u*, v*, а) < ¡(а, у).

Таким образом, необходимость доказана. Докажем достаточность.

Пусть стратегия с* удовлетворяет условию леммы 4. Для каждого а e A фиксируем пару (иа, vO) e Н(у), для которой

h(ua,va,a) = max h(u,v,a).

(u,v)eH (у)

Определим функцию и*: V х A ^ U, положив u*(va, а) = иа и u*(vа, а) = co*(v , а) для всех остальных значений аргументов.

Покажем, что стратегия и* и число Л = ¡(а, у) удовлетворяют определению 1. Для любого а стратегия (va, а) удовлетворяет пункту 1. Если стратегия v* имеет вид v* = (va, а) для некоторого а, то выполняется условие g*(u*, v*) = g(ua, va) > у. В противном случае имеем g*(u*, v*) = g*(c*, v*) и h*(u*, v*, a) = h*(a*, v*, а), поэтому для любого a e A справедливо одно из неравенств g*(u*, v*) > у или h*(u*, v*, a) < ¡(а, у) = Л. Таким образом, во всех случаях условие 2 тоже выполнено.

Лемма доказана.

Следствие. Для любого у< R' существует стратегия и* e U*, гарантирующая получение результата у (в смысле определения 1) такая, что для любого a e A верхняя грань sup h (u, v, ,a) достигается.

Доказательство. Этому условию удовлетворяет построенная при доказательстве достаточности стратегия и*, поскольку соответствующая верхняя грань достигается, например, в точке V* = (V, а).

Это следствие завершает доказательство леммы 3, поэтому далее можно считать, что Л' = R.

Лемму 4 также можно было бы принять за определение максимального гарантированного результата, но она логически сложнее определения 1, да и содержательно мотивировать такое определение непросто. А вот для вычисления максимального гарантированного результата она очень удобна.

Теперь можно сделать самый радикальный, но и самый простой шаг - выразить критерий гарантированности результата в игре Г* в терминах игры Г.

Для этого запишем утверждение леммы 4 в символической форме:

3®* е и* Уа е А Vv* е V* g*(®*, V*) > у V И*(®*, V*, а) < 1(а, у). Очевидно, в этой формуле можно поменять местами порядок кванторов общности:

3®* е и* Vv* е V* Уа е А

g*(®*, V*) > у V И*(®*, V*, а) < 1(а, у).

Теперь нужно вспомнить о структуре стратегий игроков в игре Г*. Будем обозначать через Ф(Х, У) множество всех функций, отображающих множество X в множество У. Тогда предыдущее высказывание запишется в виде

3®* е Ф^х А, и) V (V, //) е Vх А Уа е А g(®*(v, /), V) > у V И(®*^, //), V, а) < 1(а, у). В неравенства этой формулы переменная / явно не входит1, поэтому последнее высказывание равносильно высказыванию 3®# е Ф(^ и) V V е VУа е А g(®#(v), V)) > у V И(®#^), V, а) < 1(а, у).

1 Зависимость выбора управления первого игрока от / уже была использована. Дальше она не существенна, да и не нужна.

А теперь уже можно поменять местами кванторы общности и существования, записав формулу в эквивалентном виде:

V v е V 3 ue U Va e A g(u,v)) > yv h(u,v,a) < l(a,y). Пусть

E (у) = |v eV :max g (u, v) <y \.

(, ueU )

Предыдущее высказывание эквивалентно следующему:

V v е E(y) 3 ue U Va e A h(u, v, a) < l(a, y).

Теперь, заменив кванторы общности и существования операторами максимума и минимума, можно выписать основной результат.

Теорема. Для того чтобы число у было гарантированным результатом в игре Г* необходимо и достаточно, чтобы либо sup minmax(h(u,v,a) -1(а,у))< 0 ,

veE(y) ueU aeA

либо

sup minmax(h(u,v,a) -1(a,y)) = 0 ,

veE(y) ueU aeA

но верхняя грань по v в этой формуле не достигалась1.

5. Структура оптимальной стратегии

Точная верхняя грань чисел из некоторого множества может не принадлежать этому множеству. Поэтому максимальный гарантированный результат R может, вообще говоря, не быть гарантированным результатом2. Но если y - гарантированный результат, то теперь уже нетрудно построить стратегию, гарантирующую первому игроку получение именно такого выигрыша.

Действительно, пусть y - гарантированный результат. Для этого yвыберем набор точек (ua, va) e H(y), для которых

1 Напомним, что множество Е(у) задается строгим неравенством, поэтому данная верхняя грань достигаться не обязана.

2 Эта фраза выглядит несколько парадоксально, но придумать более удачную терминологию не получается.

h(ua,va,a) = max h(u,v,a).

(u,v)eH (j)

Теперь определим функцию u*: V x A ^ U следующим образом. Если стратегия v* = (v, ß) такова, что v = Vß, то положим

u*(v, ß) = Uß.

Если v Ф vß, но v g E(j), то выберем u = u*(v, ß) так, что g(u,v) = maxg(a,v).

aeU

Если же v Ф vß, но v e E(j), то выберем u = u*(v, ß) так, что max (h(u, v,a) -1 (a,j)) = min max (h(a, v,a) -1 (a,j)) .

aeA aeU aeA

Покажем, что так построенная стратегия u* и набор чисел Л = l(a, j), a e A, удовлетворяют определению I.

В самом деле, при каждом a выбор стратегии w* = (va, a) приведет к выбору первым игроком управления ua, и потому будет иметь место равенство h*(u*, w*, a) = l(a, j). Следовательно, условие 1 выполнено.

Покажем, что выполняется условие 2. Фиксируем произвольное ae A.

Если стратегия v* имеет вид v* = (vß, ß) для некоторого ß e A, то u*(v*) = uß и пара (uß, vß) e H(j), а потому

g*(u*, v*) = g(uß, vß) > j.

Если v* = (v , ß) и равенство v = vß не выполняется, но v g E(j), то по построению

g,(u„,v*) = maxg(a,v) >y

aeU

(неравенство следует из определения множества E(j).

Если же для v* = (v , ß), равенство v = vß не выполняется и v g E(j), то

max (h (u,, v ,a) -1(a, j)) = min max (h(a, v,a) - l(a,j)) .

aeA aeU aeA

Предполагается, что j - гарантированный результат, а тогда по теореме 1 правая часть последнего равенства отрицательна. Значит,

max(h (u,,v,,a) -1(a, j)) < 0,

aeA '

и тем более h*(u*, v*, a) < l(a, j).

Таким образом, свойство 2 выполняется во всех случаях.

В частности из приведенных рассуждений следует, что для построенной стратегии и* и стратегии V* = (V , /3) е БЯ(и*, а) выполняется включение V е V \ Е(у), а потому

т£ т£ (и, V,) >у.

аеА V еБЯ(и а)

Построенная стратегия и* имеет ясную содержательную интерпретацию. Первый игрок предлагает партнеру «пряник» в виде выбора управления иа в ответ на выбор управления Vа. В остальных случаях он действует эгоистично, максимизируя свой выигрыш, до тех пор, пока партнер не выйдет за некие рамки, и наказывает партнера за выход из этих рамок. Вообще говоря, существует много оптимальных стратегий. Для построенной выше упомянутые рамки выбраны максимально широкими.

6. Заключение

Предложенный выше метод вычисления максимального гарантированного результата представляется весьма универсальным. Пожалуй, наименее стандартными являются геометрические рассуждения из раздела 3, доказывающие эквивалентность двух определений максимального гарантированного результата. Но эту часть работы можно в значительной степени считать данью традиции. Определение 1 кажется не менее мотивированным содержательно, чем классическое определение. Соответствующая интерпретация приведена в конце раздела 3. А в работе оно удобнее (можно сравнить, например, приведенные выше рассуждения с аналогичными рассуждениями из [6]). Поэтому вполне можно принимать его за исходное.

Все остальные рассуждения носят вполне рутинный характер. Понятно, что кванторы, относящиеся к функциям, нужно «перетаскивать» вправо. Результаты о возможности перестановок кванторов общеизвестны. А из вида окончательной формулы очевидной становится и структура оптимальной стратегии, приведенная в разделе 5.

Кстати, стоит отметить, что эта структура менее «кровожадна», чем используемая обычно: если «классическая» структура предполагает использование наказания всякий раз, когда второй игрок отклоняется от предложенного плана, то стратегия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

из раздела 5 предусматривает наказание только в тех случаях, когда выбор второго игрока не позволяет первому получить приемлемый результат.

Справедливости ради отметим, что в исходной работе [2] максимальный гарантированный результат определен несколько иначе, чем это сделано выше. А именно, множество рациональных ответов второго игрока определено формулой

BR(u„,a) = <! v e V : h(u,v,,a)> suph(u,w,a) -к>,

[ w* eV J

независимо от того, достигается верхняя грань в этой формуле или нет. Предложенный выше метод позволяет решить задачу и в такой постановке. Определение 1 модифицируется естественным образом. Доказательство эквивалентности двух определений осуществляется даже проще (в частности, нет нужды в доказательстве аналога леммы 1). А рассуждения из разделов 4 и 5 воспроизводятся практически дословно.

Наконец, отметим еще одну особенность предложенного метода. Она состоит в том, что в результате «игры в перестановку кванторов» получается формула, эквивалентная исходному определению. Соответственно, в каждом конкретном случае это дает возможность достаточно легко понять, допускает ли задача вычисления максимального гарантированного результата в информационном расширении некоторой игре редукцию к задаче, выписанной в терминах исходной игры.

В самом деле, нетрудно составить полный список логически возможных перестановок кванторов. «Допустимые» перестановки, приводящие к эквивалентным формулам, хорошо известны. Результаты, относящиеся к «недопустимости» всех остальных перестановок, в опубликованном виде мне не попадались. Но соответствующие контрпримеры строятся без труда. Поэтому можно просто начать преобразования и в результате мы либо придем к формуле без кванторов, относящихся к функторам, либо «упремся» в необходимость выполнения недопустимой перестановки (определение максимального гарантированного результата содержит не слишком много кванторов, поэтому перебор возможных вариантов преобразований тут невелик).

При попытке построить получить формальное доказательство невозможности решения какой-то задачи, вероятно, могут возникнуть определенные трудности. Но для «экспресс-анализа» приведенные рассуждения вполне подходят.

Литература

1. БУРКОВ В Н., НОВИКОВ Д А. Теория активных систем: состояние и перспективы. - М.: Синтег, 1999. - 128 с.

2. ВАТЕЛЬ И.А., КУКУШКИН Н.С. Оптимальное поведение игрока, обладающего правом первого хода, при неточном знании интересов партнера // Ж. вычисл. матем. и матем. физ. - 1913. - Т. 13, №2. - С. 303-310.

3. ЕРЕШКО Ф.И., КОНОНЕНКО А.Ф. Решение игры с правом первого хода при неточной информации о цели партнера // Ж. вычисл. матем. и матем. физ. - 1913. - Т. 13, №1. -С.211-221.

4. КОНОНЕНКО А.Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов // Ж. вычисл. матем. и матем. физ. - 1913. -Т. 13, №2. - С. 311-311.

5. КОНОНЕНКО А.Ф., ХАЛЕЗОВ А.Д., ЧУМАКОВ ВВ. Принятие решений в условиях неопределенности. - М.: ВЦ АН СССР, 1991. - 191 с.

6. КУКУШКИН Н.С. Об одной игре с неполной информацией // Ж. вычисл. матем. и матем. физ. - 1913. - Т. 13, №1. -С. 210-216.

HIERARCHICAL GAMES UNDER UNCERTAINTY

Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., ([email protected]).

Abstract: Hierarchical game of two players is considered. It is supposed that the leader has incomplete information about follower's interests. The maximum guaranteed payoff of the leader is calculated. An alternative definition of the maximum guaranteed payoff is suggested, which is shown to be equivalent to the classical one. It is used to reduce the problem of maximum guaranteed payoff simple transformations of predicate calculus expressions.

Keywords: informational theory of hierarchical systems, games under uncertainty, maximum guaranteed payoff.

Статья представлена к публикации членом редакционной коллегии В.Н. Бурковым

Поступила в редакцию 18.09.2015.

Опубликована 31.01.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.