УДК 519.865 + 519.95 ББК 22.165
ИГРЫ С ДОРОГИМИ ИНФОРМАЦИОННЫМИ ОБМЕНАМИ
Горелов М. А.1
(ФГБУН Вычислительный Центр им. А.А. Дородницына РАН, Москва)
В статье рассматривается иерархическая игра двух лиц с возможностью обмена информацией о выборе игрока нижнего уровня. Объем и содержание этой информации определяет игрок верхнего уровня. Но при этом предполагается, что получение и обработка информации требует определенных затрат, что влияет на выигрыш игрока. Вычисляется максимальный гарантированный результат игрока верхнего уровня в соответствующей игре и строится его оптимальная стратегия.
Ключевые слова: иерархические игры, информационные расширения, максимальный гарантированный результат.
1. Введение
Одно из основных положений информационной теории иерархических систем [4, 8] состоит в том, что иерархия возникает там и постольку, где и поскольку невозможна своевременная централизованная обработка информации. Пожалуй, центральным здесь является тезис о том, что информация, которой обладает лицо, принимающее решения, в момент выбора ограничена.
Ограничения такого рода могут возникать по разным причинам, а потому имеют различную природу и должны моделироваться по-разному.
1 Михаил Александрович Горелов, кандидат физико-математических наук, ([email protected]).
Видимо, впервые модель такого рода изучалась в [1] (есть более поздние работы тех же авторов, в которых примерно те же идеи реализуются в более сложных моделях). Там содержание информации, получаемой элементом верхнего уровня, задавалось в модели экзогенно . Такого рода ограничения могут возникать, например, из-за наличия иерархии характерных времен принятия решений. Во многих системах, например, экономических, элементы нижнего уровня принимают решения чаще, чем элемент верхнего уровня. Если моделировать такую систему с помощью статической игры, то вполне естественно возникает ситуация, когда элемент верхнего уровня не может иметь доступа к какой-то информации о выборах подчиненных.
Второй класс моделей был предложен в [6] и развит в нескольких последующих работах. В этом случае предполагается, что элемент верхнего уровня сам вправе выбирать содержание получаемой им информации, но ограничен объем этой информации. Такая ситуация может возникать, например, если ограничено время на выработку решения элементом верхнего уровня.
В обоих случаях информационные ограничения имели «жесткий» характер. В данной работе будет рассмотрен третий вариант, когда получение информации в принципе возможно, но сопряжено с определенными затратами, а потому может оказаться нерациональным. Эти затраты могут оказаться связанными с необходимостью платить за покупаемую информацию. Но, наверное, чаще встречаются случаи, когда они связаны с затратами рабочего времени «офисного планктона» на обработку информации и денег на их оплату. По косвенным признакам можно судить о том, что с развитием информационных технологий этот слой трудящихся только растет, поэтому исследование данного случая представляется актуальным.
1 Исторически эта модель исследовалась после и рассматривалась как некое обобщение игры Гермейера Г2. Поэтому авторы предпочитают говорить об агрегировании информации.
На важность такого рода исследований неоднократно указывал А.Ф. Кононенко при личном общении, но построение соответствующих моделей наталкивалось на определенные трудности.
Прежде всего, если модель предусматривает наличие у игрока верхнего уровня права выбора объема получаемой информации, то модели типа [1] принципиально не годятся.
Далее, если игрок обладает правом решать, стоит ли ему платить за информацию, то он вправе знать о ее содержании. То есть нужно как-то описывать семантику. Здесь возникают принципиальные трудности. В какой-то мере эти трудности удалось обойти в [6], предоставив игроку право самому решать, какую информацию он хочет получить. Тот же подход используется и в данной работе.
Наконец, если стремиться явно описать в модели затраты на получение и обработку информации, то нужна количественная мера объема информации. А такая мера возможна, только если этот объем конечен. Модели такого рода до недавнего времени также не рассматривались. В этом смысле данной статье опять используется подход, предложенный в [6].
Далее исследуется лишь простейшая модель рассматриваемого типа: иерархическая игра двух лиц. Из дальнейшего изложения станет ясно, что усложнение модели (по крайней мере на теоретическом уровне) приводит скорее к количественному, чем к качественному усложнению ее исследования. Разумеется, жизнь может «подкинуть» и дополнительные вопросы принципиального характера, но пока они не видны.
2. Постановка задачи
Рассмотрим следующую игру двух лиц в нормальной форме Г = (и, V, g, И). В ней участвуют два игрока, которых по традиции будем называть первым и вторым. Здесь и и V- это множества, а g и И - функции, определенные на декартовом произведении и х V и принимающие значения из множества действительных чисел R.
Относительно элементов игры Г сделаем обычные предположения. А именно, будем предполагать, что множества U и V наделены топологиями и компактны в этих топологиях. Функции g и h будем считать непрерывными в топологии произведения U х V.
Элементы множества U интерпретируются как управления первого игрока, а элементы множества V - как управления второго. Функции g и h интерпретируются как функции выигрыша первого и второго игроков соответственно. В согласии с этой терминологией цели игроков описываются стремлением к увеличению своих выигрышей.
В дальнейшем предполагается, что все параметры этой игры известны обоим игрокам.
Во избежание недоразумений сделаем одно терминологическое замечание. На протяжении всей статьи будет систематически рассматриваться пара игр: игра Г и построенная на ее основе игра Г# . Поэтому термин «управление» будем относить к элементом множеств U и V. Более распространенный термин «стратегия» сохраним для элементов аналогичных множеств в игре Г# . В содержательных терминах стратегия - это способ выбора управлений в зависимости от получаемой информации. Такая терминология достаточно широко распространена и позволяет избежать излишне тяжеловесных оборотов.
Игра Г описывает «технологические» возможности игроков. В данной статье основной интерес будет представлять не она, а другая игра, которая строится следующим образом.
В дальнейшем будем считать, что оперирующая сторона в моделируемом конфликте отождествляется с первым игроком. Соответственно, исследование модели будет производиться с его позиций.
Будем предполагать, что первый игрок занимает привилегированное положение в моделируемой системе. В частности, он имеет право получать информацию об управлении, выбранном вторым игроком. Более того, первый игрок сам выбирает объем и содержание получаемой информации.
Для количественной оценки объема получаемой информации предположим, что эта информация может быть закодирована некоторой последовательностью из нулей и единиц. Длину соответствующей последовательности и будем считать объемом информации.
Сделанное в предыдущем абзаце предположение полностью соответствует действительности, если обмен информацией происходит, например, по электронной почте. Если обмен информацией происходит на каком-то естественном языке, то возможность такой кодировки тоже не вызывает сомнений. Какие-то проблемы могут возникнуть, если информация передается в виде визуальных образов, запахов и т.п. Но поскольку предполагается использование развиваемой техники при моделировании экономических систем, эти проблемы обсуждать не будем.
Разумеется, длина последовательности из нулей и единиц, кодирующей то или иное сообщение, зависит от способа кодировки. В контексте данной статьи естественно считать, что этот способ кодировки выбирается оптимальным способом. Иначе это предположение можно сформулировать следующим образом: первый игрок сам может выбирать способ кодировки.
Формализовать сделанные предположения можно следующим образом.
Пусть N = {0, 1,...} - множество натуральных чисел (в данном случае удобно считать ноль натуральным числом, как это принято, например, в теории алгоритмов). Для п е N обозначим через Вп = {0, 1}п п-ю декартову степень множества В = {0, 1}. Естественно считать, что множество В состоит из одной точки. Если X и У - множества, то Ф(Х, У) будет обозначать множество всех функций из X в У.
Положим
и # = N х П [Ф^, Вп) х Ф( Вп и))
пеП
и V# = V. Определим отображение л: и# х V# ^ и х V следующим образом. Если и# = (п,(Р0,и0),(Р1,и!),...,(Рп,и*),...), а
v# = V, то
л(и#, v#) = (ип(Рп(V)),V) .
Содержательно эти конструкции интерпретируются следующим образом. Первый игрок выбирает натуральное число п, характеризующее объем информации, который он готов переработать. Далее он выбирает отображение Рп, описывающее содержание этой информации и способ кодировки. И, наконец, он же задает способ и* выбора своего управления в зависимости от полученной информации. Если все эти элементы зафиксированы, а второй игрок выберет управление V, то первый получит сообщение Рп^) длины п и в согласии со способом и* выберет свое управление и*п (Рп (V)).
Таким образом, определены множества стратегий в игре Г# = (и#, ¥#, g#, h#). Остается задать функции выигрыша.
Для определенности будем считать, что ^и#, v#) = ^п(и#, v#)) (напомним, что по определению п(и#, v#) - это пара управлений в исходной игре Г). Это соответствует предположению о том, что все затраты на добывание и переработку информации о выборе второго игрока ложатся на игрока номер один1.
Для первого игрока в данной ситуации имеется стандартная двухкритериальная задача. С одной стороны, при выборе стра-
1 Альтернативное предположение о том, что второй игрок несет затраты по передаче сообщения партнеру, тоже вполне реалистично. Формализуется оно практически так же, как это делается ниже для функции выигрыша первого игрока. Формулы в этом случае получаются чуть более сложными, но никаких принципиально новых трудностей не появляется. Поэтому ограничимся рассмотрением одного, более простого варианта.
тегий и# = (п,(Р0,и0),(Р1,и1),...) и v# = V первый игрок получает
выигрыш g(к(u#, v#)), который хочется максимизировать. С другой стороны, есть желание минимизировать объем перерабатываемой информации п. В соответствии с общими принципами теории исследования операций [2], чтобы получить корректную модель, следует задать свертку S: R х N ^ R так, чтобы стремление к ее максимизации верно описывало цели игрока. Формально соответствующие конструкции могут выглядеть следующим образом.
Зададим отображение ш: и# ^ N условием
ш (п,(Р0,и0),(Р1,и1),...^ = п . Тогда функция выигрыша первого
игрока в новой игре Г# будет задаваться условием g#(u#,v#) = £(g(я(^)),ш (и#)) .
Функцию £ будем считать непрерывной по первому аргументу.
Вероятно, наибольший интерес представляет линейная свертка, при которой g# (и#, у# ) = g (я(и#, v#))-рш(и#) . В этом
случае можно считать, что выигрыш g(п(u#, v#)) измеряется в рублях, а р - цена получения и обработки одного бита информации. Впрочем, получить какие-то дополнительные результаты, используя специфику именно этого способа свертки, не удается. Поэтому в дальнейшем будет рассмотрен общий случай.
Чтобы завершить описание конфликта, следует задать отношение игроков к имеющимся у них неопределенностям. В данной статье рассмотрим следующий вариант.
Будем считать, что игрок номер один обладает правом первого хода, т.е. он первым выбирает свою стратегию и# и сообщает ее партнеру.
При таких условиях второй игрок, принимая решения, может совершенно однозначно предсказать размер получаемого выигрыша. Из уже сделанного предположения о том, что второй игрок стремится максимизировать функцию h, будет следовать тогда, что он выберет управление из множества
BR(u#) = \v# е V# : h#(u#,v#) = maxh#(u#, w#)},
по крайней мере, если максимум в последнем выражении достигается. Для корректности следует описать поведение второго игрока и в случае, когда стратегия u# выбрана так, что этот максимум не достигается. Сделаем это стандартным образом, положив
BR(u#) = \v# е V# : h#(u#,v#) > sup h#(u#, w#) - к
L w#eV#
в случае, когда верхняя грань не достигается1.
Если первому игроку известна функция выигрыша партнера, он вполне может оценить множество его рациональных ответов BR(u#) на свою стратегию u# . Но конкретный выбор стратегии партнера останется ему неизвестным. Будем предполагать, что в этих условиях он будет ориентироваться на наихудший случай, т.е. максимизировать свой гарантированный результат
inf )gA^v#).
v#eBR(u#)
Соответственно, его максимальный гарантированный результат будет равен
R(r#) = sup rnf )g#(u^v#).
u#eU# v#iBR(u#)
3. Вычисление максимального гарантированного результата
Стратегии первого игрока в игре Г# выглядят устрашающе. Поэтому и задача вычисления максимального гарантированного результата R(r#) представляется весьма сложной. Упростить ее
1 Здесь к - дополнительный параметр модели, известный обоим игрокам, как и все остальные параметры. В дальнейшем будет видно, что на самом деле от его выбора ничего не зависит.
и, главное, понять качественную структуру оптимальных стратегий помогает приводимая далее теорема.
Введем следующие обозначения. Как обычно, U" будет обозначать множество всех наборов (u0, ..., um-1), где U e U (i = 1, ..., m). Положим
L(u0,...,um4) = max min h(ui,v),
veV 0<i<m-1
D(u0,...,um-1) =
= {(ui,v): h(ui,v) > L(u0,...,um-1), i = 0,...,m-1, v е V}, K (и, u0,..., um4) = sup S (g (ui, v), n),
(u',v)eD(u0,...,um-1)
E(u0,...,um4) = (veV: min h(u',v) = L(u0,...,um4)} , M(n,u0,...,um4) = min max S(g(u',v),n).
veE (u0,...,um-1)0<i<m-1
Справедлива
Теорема. Имеет место равенство
R(r#) = sup sup max {K (u 0,..., ue(n)), M (u0,..., ue( n))},
neN (u0,...,ue(n))eUn
где e(n) = 2n - 1.
Доказательство. Докажем сначала неравенство (1) R(r#) < sup sup max{K(u0,...,ue(n)),M(u0,...,ue(n))} .
neN (u°,...,ue(n))eUn
Пусть u# = ( n, (P0, u*0), (P1, u1) ,...) - произвольная стратегия
первого игрока в игре Г# . Положим m = 2n. Отождествим для удобства набор (b0, bb..., bn-i) е {0, 1}n с натуральным числом b0 + 2b1 +...+ 2n-1bn. Это число принадлежит множеству {0, ., m - 1}. Обозначим u*n(i) = u' (i = 0, ., m - 1).
Рассмотрим сначала случай, когда эта стратегия такова, что
верхняя грань sup h#(u#,w#) не достигается. Это значит, что не
w#eV#
достигается верхняя грань sup h(u*n (Pn (w)), w). Оценим эту
weV
верхнюю грань.
Значение u*n (Pn (w)) при любом выборе w принадлежит множеству {u0, ..., um-1}. Поэтому
h(u*(Pn (w)), w) > min h(ui, w).
0<i'<m-1
Следовательно,
suph(un(Pn(w)), w) > max min h(u', w) = L(u0,...,um4).
weV weV 0<i<m-1
Допустим, что
suph(u*n(Pn(w)),w) = max min h(ui,w) = L(u0,...,um4).
weV weV 0<i<m-1
Тогда, выбрав v e E(u0,.--,um-1), получим
h(u*(Pn (v)),v) > min h(ui,v) = max min h(ui,v) =
0<i<m-1 veV 0<i <m-1
t / 0 m-1 \
= L(u ,...,u ). А по сделанному предположению
h(un, (Pn (v)),v) < suph(un, (Pn (w)), w) = L(u0,...,um4).
weV
Это означает, что верхняя грань sup h#(u#, w#) достигается в
w#eV#
любой точке множества E(u0, ..., um1), вопреки предположению о стратегии u# . Значит, на самом деле suph(un(Pn(w)), w) > L(u0,...,um-1).
weV
Но тогда в множестве BR(u#) найдется такая точка v0, что h(u*(Pn(v0)),v0) > L(u0,...,um1) . В силу определения величины K(n, u0, ..., um1) тогда выполняется неравенство
(2) S (g (u* (Pn (v0)), v0), n) < K (n, u0,..., um-1). А поскольку v0 e BR(u#), будем иметь
(3) inf S(g(u*(Pn(v)),v),n) < K(n,u0,...,um-1),
veBR(u#)
и, тем более,
inf S(g (un (Pn (v)), v), n) <
veBR(u#)
(4)
< sup sup max {k (u0,..., ue(n)), M (u0,..., ue(n))}.
neN (u0,...,ue(n))eUn
Теперь рассмотрим случай, когда максимум max h(u*n (Pn (w)), w) достигается.
weV
Как и выше доказывается, что
maxh(u*n (Pn(w)),w) > L(u0,...,u""1).
weV
Но в данном случае имеется два варианта.
1) maxh(un(Pn(w)),w) > L(u0,...,um4);
weV
2) maxh(ut(Pn(w)),w) = L(u0,...,um-1).
weV
Если реализуется первый вариант, то для любой стратегии V0 e BR(u#) выполняется включение (un(Pn(v0)),v0) e D(u0,...,um-1), а, следовательно, имеет место неравенство (2) и, тем более, неравенство (3).
Если же реализуется второй вариант, то все множество E(u , ..., um- ) содержится в множестве BR(u#).
Пусть V принадлежит E(u , ..., um- ), а, значит, и BR(u#). Вновь воспользовавшись тем фактом, что u*n(Pn(v)) e |u0,...,um-1} , получим неравенство
S(g(un(Pn(v0)),v0),n) < max S(g(u',v0),n)
0<i <m-1
и, следовательно,
inf 1 S(g(u*n (Pn (V)), v), n) <
veE (u0,...,um-1)
< min max S(g(u',v),n) = M(n,u0,...,um1).
veE (u0,...,um-1)0<i<m-1
В силу включения E(u0,. ,,um_1) с BR(u#) получим отсюда inf S(g(u*n(Pn(v)),v),n) <M(n,u0,...,um-1).
veBR(u#)
Таким образом, в обоих вариантах выполняется неравен-
ство
inf )S(g(иП (Pn (v)), v), n) <
veBR(u#)
< max {k (n, и0,..., um4), M (n, и0,...,
Отсюда немедленно следует неравенство (4). А поскольку, как установлено, неравенство (4) выполняется для любой стратегии и# , выполняется и неравенство (1). Теперь докажем противоположное неравенство
(5) R(r#) > sup sup max{k(u0,...,ue(n)),M(u0,...,ue(n))} .
beN (u°,...,ue("•)еУ"
Фиксируем произвольное s > 0. Выберем n е N так, что
sup max {к (u0,..., ue(n)), M (u0,..., ue(n ))}>
(u0,..., ue (n))eUn
> sup sup max{K(u0,...,ue(k)),M(u0,...,ueW)}-s.
keN (u0,...,ue(k))eUk
Положим m = 2n. Далее, выберем такой набор (u0, ..., um-1), что max {K (u0,..., um-1), M (u0,..., um-
{K (u 0,..., a""1), M (u0,..., um"1)}> > sup max {k (w0,..., w"—1), M (w0,..., w"4))
/,.,0 1 ^ T xra ^ ^
(»•..„i-^eW
Теперь придется рассмотреть два случая. Допустим сначала, что K(u0, .... um-1) >M(u0, ..., um-1).
Тогда сформируем стратегию u# следующим образом. Ее первым элементом, определяющим объем перерабатываемой информации, будем считать уже выбранное число п. Понятно, что в таком случае от отображений P и u* при i Ф п ничего не зависит, поэтому их можно выбрать произвольно. Остается определить функции P" и u".
Фиксируем в множестве D(u0, ..., um-1) такую точку (u7, v0), что S(g(u!, v0), n) > K(n, u0, ..., um-1) - s. Определим отображения Q" : V ^ {0,1}m и u" : {0,1}m ^ U так, что u"(i) = ui и при любом v e V выполняется равенство
h(u"(Qn (v),v) = min h(ui,v).
•<i <m-1
Определим отображение P": V ^ {0,1}m условием
P" (v) = j 7'если v = v°,
[Qn(v) в противном случае.
Таким образом, полностью определена стратегия u„ = 1n,| P",u • ), IP, u
:( П, (P 0, U0 ) , (P1, Ml ) ,...) .
Для этой стратегии и# выполняется равенство BR(u#) = {V0}. В самом деле, по определению
я(щ,v0) = (u.n(Pn(v0)),v0) = (u.n(j),v°) = (uj,v0) .
Следовательно, h#(u#, v0) = h(n(u#, v0)) = h(u!, v0), а точка (U, v0) принадлежит множеству D(u0, ..., um-1), поэтому h(uj v0) > L(u°, ..., um-1). С другой стороны, при v Ф v0 имеем h#(u#, v) = h(n(u#, v)) = h(u"" (Pn (v)), v) = h(u" (Qn (v)), v) =
= min h(u',v)<max min h(u',v) = L(u0,...,um-1).
0<i'<m-1 veV 0<i'<m-1
Таким образом, максимум max h#(u#,v) достигается, причем в
veV# =V
одной точке v0, откуда и следует равенство BR(u#) = {v0}. А тогда
veBRfu#) sA^ v) = g#(u#, v0) = S (g (n^ v°)), n) =
= S(g(uj,v0),n) > K(n,u0,...,-e =
= max{K (n, u0,..., um-1), M (n, u0,..., um-1)} - e (последнее неравенство выполняется в силу выбора точки u v0)).
Теперь обратимся к случаю K(u0, ..., um 1) < M(u0, ..., um 1). Пусть функции Qn :V ^ {0,1}m и u.n :{0,1}m ^U определены как в предыдущем случае. Определим еще отображение Tn : V ^ {0,1}m так, что при любом v е V выполняется равенство S(g(u.n(Tn(v)),v),n) = max S(g(u',v),n)
0<i<m-1
и положим
Pn(v) = |Tn(v), если v е E(u0,...,um-1), [ Qn(v) в противном случае. Определив отображения P и u. при i Ф n произвольным образом, получим стратегию u# = (n,(P0,u.0),(P1,u!),...) . Оценим множество рациональных ответов второго игрока на эту стратегию.
Если v i E(u0, ..., um-1), то будем иметь
h# (u#, v) = h(n(u#, v)) = h (u.n(ö"(v)), v) = min h(u',v) < <max min h(u',v) = L(u0,...,um-1)
veV 0<i' <m-1
(неравенство строгое потому, что v g E(u0,.--,um-1)). Если же v e E(u0, ..., um-1), то g#(u#, v) = S (g (n(u#, v)), n) = S (g (u." (T (v)), v), n) =
= max S(g(u',v),n) > min max S(g(u',v),n) =
0<i<m-1 veE(u0 ,...,um-1) 0<i<m-1
= M(n,u0,...,um-1) > K(n,u0,...,um-1). Но неравенство S(g(u.n(T(v)),v),n) > K(n,u0,...,um1) говорит о том, что точка (u.n (T (v)), v) не принадлежит множеству D(u0,...,um-1) и, следовательно, h(u.n(T(v)),v) <L(u0,...,um1). А с другой стороны, так как v e E(u0, ..., um1) имеем h(u.n(T(v)),v) > min h(u',v) =
1<i<m-1
= max min h(u',v) = L(u0,...,um1).
veV 1<i<m-1
Значит, на самом деле h(u.n(T(v)),v) = L(u0,...,um1).
Таким образом, приходим к выводу, что максимум maxh#(u#,v) достигается в любой точке множества E(u0, ...,
veV# =V
u ) и только в них.
Но, как уже показано, если v e E(u0, ..., um1), то g#(u#, v) >M(n, u0, ..., um-1), следовательно,
inf ) g^ v) = inf „1, g^ v) > M (n, u 0,..., um-1) =
veBR(u#) veE(u ,...,u )
= max{K(n,u0,...,um-1),M(n,u0,...,um-1)} > > max{K (n, u0,..., um-1), M (n, u0,..., um-1)} - e. Подведем итоги. В любом случае существует стратегия u# , для которой
inf g#(u#,v) > max{K(n,u0,...,um-1),M(n,u0,...,um-1)} -e.
veBR(u#)
Следовательно, тем более
Я(Г#) > max{K(n,u0,...,um-1),M(n,u0,...,um-1)} -e.
Но тогда в силу выбора управлений (и0,... ,um 1) имеем
R(r#) > sup max{K(w0,..., wm-1),M(w0,...,wm-1)}- 2s,
...m-1 \r-T rm
#
(w0,...,wm-1)eUm
а в силу выбора числа n выполняется неравенство
R(T#) > sup sup max {К (и0,..., ие{к)),М (и0,..., ие(к))}- 3s.
keN (и»,...,и'(k))eUk
В силу произвольности s отсюда следует неравенство (5).
Из неравенств (1) и (5) немедленно следует результат теоремы.
4. Некоторые оценки
Даже с учетом доказанной теоремы задача вычисления максимального гарантированного результата в игре Г# представляется весьма сложной, поэтому приведем некоторые априорные оценки. Из формулировки теоремы видно, что сложность построения оптимальной стратегии и# в значительной степени определяется объемом щ(и#) соответствующей ей информации. Эту величину и попытаемся оценить.
Начнем с заполнения одного пробела в доказательстве теоремы. Дело в том, что множество N не компактно, поэтому при сделанных предположениях максимальный гарантированный результат может оказаться бесконечным. В этом случае рассуждения из доказательства можно модифицировать так, что будет доказано, что если бесконечна одна часть равенства из утверждения теоремы, то бесконечна и вторая. Впрочем, это не представляет значительного интереса по следующим причинам.
По смыслу свертки S эта функция должна быть неубывающей по первому аргументу при фиксированном втором и невоз-растающей по второму при фиксированном первом. Если принять это предположение, то можно утверждать, что R(r#) < S(M, 0), где
M = max g(и,v).
(^v)eU xF
Дальнейшие оценки существенным образом зависят от «геометрии» задачи, поэтому приведем их для случая
g# (v#) = g (л (u#, v#)) " Рт (u#) .
Из содержательных соображений понятно, что с ростом объема обрабатываемой первым игроком информации уменьшаемое в этой формуле будет расти (формальное доказательство этого можно найти в [6]), так же как и вычитаемое. Но уменьшаемое может меняться в пределах от и = min g(u,v)
(u,v)eU xV
до M, поэтому при поиске оптимальных стратегий в игре Г# можно ограничиться рассмотрением лишь таких, у которых
. . M - и rn(u#) <-.
Р
Качество этой оценки можно улучшить, увеличив / или уменьшив M.
Первого можно добиться, заменив / на результат, гарантированный какой-либо конкретной стратегией u# . Разумеется, от выбора этой стратегии будет зависеть как качество оценки, так и сложность вычисления гарантированного результата. В качестве первого приближения можно использовать наилучшую стратегию при нулевом объеме обрабатываемой информации. Таким образом приходим к задаче вычисления максимального гарантированного результата в иерархической игре Гермейера Г1 (см., [3]). Он равен
ух = supmin g(u,v),
ueU veE(u)
где
E (u) = <v eV: h(u, v) = max h(u, w)\.
(. weV )
Второго можно добиться, используя следующие соображения. Очевидно, максимальный гарантированный результат в игре Г# будет только расти с уменьшением р. Поэтому для получения верхней оценки можно рассмотреть случай р = 0. Но в этом случае игра Г# будет квазиинформационным расширением игры Г, а как доказано в [7], тогда максимальный гарантированный результат в игре Г# не превосходит максимального
гарантированного результата у2 в иерархической игре Гермейера Г2. Его вычисление даже проще, чем вычисление у1. Явные формулы приводить не будем. Их можно найти в [3, 7].
Таким образом, приходим к следующей оценке
rn(u#) < ^^ Р
объема обрабатываемой информации в оптимальной стратегии u# .
Приведем оценку другого типа. Ее сформулируем сразу для случая p = 0, поскольку из сказанного выше ясно, что при переходе к положительным p эта оценка сохранится.
Определим величину
L = max min h(u, v).
veV ueU
В [5] показано, что для «типичных» в некотором смысле игр максимум
max g (u, v)
(u ,v)eUxV
по незамкнутому множеству
D={(u,v) e U x V: h(u,v)>L} достигается в некоторой точке (u , v), и для этой точки g(u , v*) = у2 > R(r#). Именно такие «типичные» игры будем далее рассматривать.
Из рассуждений, использованных при доказательстве теоремы, следует, что при поиске оптимальной можно ограничиться рассмотрением только таких стратегий u#, для которых значение n =w(u#) - это минимальное число, при котором пространство V может быть покрыто m = 2n множествами вида
0(u')={v e V: h(u, v) < h(u*, v*)}, u1 e U, i = 0, ..., m-1. Остается оценить это значение n.
Предположим, что множество V содержится в кубе K со стороной а, расположенном в d-мерном евклидовом пространстве так, что его ребра параллельны осям координат. Будем считать, что функция h определена на U x K и липшицева по второму аргументу с константой Л, т.е. при любом u e U и любых v1, v1 e K выполняется неравенство
\h(u,v1) - h(u,v2)| < ijjv1 - v2||.
В качестве нормы в данном случае удобно использовать равномерную:
||(xd) -(Jl,..., Уа= max|X -У{\.
•<i<d
Фиксируем произвольное v e V и выберем uг e U так, что h(ui,v) = minh(u,v).
ueU
Тогда множество O(u') будет содержать куб со стороной
b = 2 h(u',v>) -L Л
ребра которого параллельны осям координат.
Покроем куб K кубами со стороной b. Для этого, очевидно, достаточно l = ([a/b] + 1)d штук (квадратные скобки здесь и далее обозначают целую часть числа). Обозначив центры кубов покрытия как ui, i = 1, ..., l, получим покрытие множества V множествами O(u'). Отсюда получается оценка
п <
d log21 ЬЬ | +1
+1.
Эта оценка довольно грубая, но, по-видимому, правильно характеризует сложность решаемой задачи в наихудшем случае.
Вообще понятно, что сложность вычисления максимального гарантированного результата в игре Г# в значительной степени определяется «сложностью» функции h. Точно определить взятый в кавычки термин пока не получается. Но, вероятно, пару параметров й и Л можно использовать, чтобы оценить эту «сложность» сверху.
5. Заключение
Пожалуй, главным в этой работе является построение сбалансированной модели, позволяющей сопоставить прагматическую ценность получаемой оперирующей стороной информации со стоимостью ее получения и обработки. Техника ее исследования уже была развита ранее и является достаточно стандартной.
Полученные результаты выглядят сложнее, чем аналогичные результаты для классических моделей. Но это вполне естественно, поскольку в модели, построенной выше, описываются
более тонкие черты моделируемой ситуации.
Литература
1. АЛИЕВ В С., КОНОНЕНКО А.Ф. Точное агрегирование в теоретико-игровых моделях. М.: ВЦ АН СССР, 1990. -26 с.
2. ГЕРМЕЙЕР Ю.Б. Введение в теорию исследования операций. - М.: Наука, 1971. - 383 с.
3. ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1976. - 327 с.
4. ГЕРМЕЙЕР Ю.Б., МОИСЕЕВ Н.Н. О некоторых задачах теории иерархических систем управления // Проблемы прикладной математики и механики. - М.: Наука, 1971. -С. 30-43.
5. ГОРЕЛОВ М.А. Теоретико-множественная постановка задачи синтеза рациональных процедур обмена информацией в иерархической игре двух лиц // Ж. вычисл. матем. и ма-тем. физ. - 2003. - Т. 43, №3. - С. 376-387.
6. ГОРЕЛОВ М.А. Максимальный гарантированный результат при ограниченном объеме передаваемой информации // Автоматика и телемеханика. - 2011. - №3. - С. 124-144.
7. КУКУШКИН Н.С., МОРОЗОВ ВВ. Теория неантагонистических игр. - М.: МГУ, 1984. - 104 с.
8. МОИСЕЕВ Н.Н. Математические задачи системного анализа. - М.: Наука, 1981. - 488 с.
GAMES WITH COSTLY INFORMATION TRANSFER
Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., ([email protected]).
Abstract: We consider a principal-agent model with information transfer about the agent's choice, where the principal chooses information volume and contents. Information transfer and processing incurs costs influencing the payoff of the principal. We calculate the guaranteed payoff of the principal and build her optimal strategy.
Keywords: hierarchical games, informational extension, guaranteed payoff.
Статья представлена к публикации членом редакционной коллегии В.Н. Бурковым
Поступила в редакцию 11.02.2014.
Опубликована 31.05.2014.
XI Всероссийская школа-конференция молодых ученых «Управление большими системами»
9-12 сентября, 2014, Арзамас http://ubs2014.ru/
Срок подачи доклада 23. 06.2014