Научная статья на тему 'Игры с обменом недостоверной информацией'

Игры с обменом недостоверной информацией Текст научной статьи по специальности «Математика»

CC BY
213
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИЕРАРХИЧЕСКИЕ ИГРЫ / ИНФОРМАЦИОННЫЕ РАСШИРЕНИЯ / СЕМАНТИКА / HIERARCHICAL GAMES / INFORMATIONAL EXTENSION / SEMANTICS

Аннотация научной статьи по математике, автор научной работы — Горелов Михаил Александрович

Обсуждается возможность формализации некоторых вопросов, связанных с семантикой информации, которой обмениваются игроки в процессе принятия решений. Предложен достаточно общий способ моделирования конфликтов, в которых стороны обмениваются не обязательно достоверной информацией.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Games with unreliable information transfer

We consider formalization of semantics of information, which players transfer while making their decisions, and suggest a rather general approach to modeling of conflict situations, where transfer of unreliable information is possible.

Текст научной работы на тему «Игры с обменом недостоверной информацией»

УДК 519.865 + 519.95 ББК 22.165

ИГРЫ С ОБМЕНОМ НЕДОСТОВЕРНОЙ ИНФОРМАЦИЕЙ

Г орелов М. А. 1

(Вычислительный центр РАН, Москва)

Обсуждается возможность формализации некоторых вопросов, связанных с семантикой информации, которой обмениваются игроки в процессе принятия решений. Предложен достаточно общий способ моделирования конфликтов, в которых стороны обмениваются не обязательно достоверной информацией.

Ключевые слова: иерархические игры, информационные расширения, семантика.

1. Введение

Одним из центральных пунктов при построении математических моделей конфликтных ситуаций является описание информированности участников конфликтов о действиях партнеров. На практике любая из сторон конфликта может получать такую информацию несколькими способами: добывать эту информацию самостоятельно, получать ее от незаинтересованного посредника или обмениваться сообщениями с другими участниками. В последнем случае передаваемая информация может целенаправленно искажаться. Разумеется, искажения информации могут возникать и по другим причинам, например, из-за неточности измерений или искажений в каналах связи, но в данной статье эти аспекты обсуждаться не будут.

1 Михаил Александрович Горелов, кандидат физико-математических наук, ([email protected]).

В теории принятия решений, пожалуй, первостепенное значение имеет прагматический аспект информации, т.е. способ действий получателя информации в зависимости от полученного сообщения. Модели, нацеленные на изучение этого аспекта, наиболее активно изучались в теории иерархических игр (см., например, [6-8, 13]). Но, видимо представляет интерес и семантика передаваемых сообщений. В частности, если игроками могут передаваться заведомо ложные сообщения, то правомерна постановка вопроса об истинности передаваемой информации и создании механизмов, стимулирующих игроков к передаче достоверных сообщений. Такой вопрос, вероятно, впервые был поставлен В.Н. Бурковым [1] и позднее активно исследовался в теории активных систем [2-3, 10-12, 15].

Но до сих пор понятие истинности передаваемой информации не формализовывалось. В каждой конкретной модели оно задавалось «естественным» образом и особенно не обсуждалось. По сути, использовался следующий прием. Игрок, передающий информацию, выбирал некоторый элемент из множества, представляющего собой точную копию множества «объективных» параметров игры (управлений или неопределенных факторов). А игрок, получающий информацию, выбирал свое управление как функцию этого выбора партнера. Истинность передаваемой информации понималась как совпадение элементов исходного множества и множества-копии.

Анализ имеющихся работ показал, что все использовавшиеся в них способы формализации понятия истинности передаваемой информации могут быть уложены в одну общую схему. Получившийся класс моделей во многих случаях позволяет адекватно описать конфликт. Впрочем, в последнем разделе статьи приводится несколько примеров игр, в которых данная схема формализации оказывается явно не удовлетворительной. Поэтому семантика передаваемых сообщений в моделях принятия решений нуждается в дальнейшем исследовании.

В данной статье все идеи обсуждаются на примере иерархической игры двух лиц с неопределенным фактором. В первом разделе приведен общий способ описания обменов информацией

и примеры того, как конкретные способы обмена как достоверной, так и недостоверной информацией могут быть уложены в предлагаемую схему. Там же приведено несколько примеров таких описаний, отражающих как ситуации, в которых достоверность передаваемой информации гарантируется правилами игры, так и ситуации, в которых возможна передача заведомо ложной информации. Второй раздел статьи посвящен определению принципа максимального гарантированного результата, который используется при анализе иерархических игр. В данной статье и, вероятно, во многих других случаях, удобно определить это понятие по-новому. Но, как следствие, пришлось доказывать, что новое определение эквивалентно традиционным. Задав игру, описав информированность игроков и их отношение к неопределенностям, формализованное с помощью принципа оптимальности, получим замкнутую модель конфликта. В третьем разделе такая классическая модель дополняется формализованным описанием истинности передаваемой информации. Кроме того, в этом и следующем разделе приводятся два простых, но весьма общих результата, касающихся игр с передачей недостоверной информации. Первый из них описывает условия, при которых игрок верхнего уровня может добиться получения от партнера истинной информации без снижения своего максимального гарантированного результата. Второй выделяет достаточно широкий класс задач, в которых обмен информацией не имеет смысла, если нет механизмов, гарантирующих передачу истинности сообщений. Следует отметить, что к этим результатам приводит более общий взгляд на суть проблемы.

2. Информационные расширения

Будем рассматривать следующую модель конфликта.

Игрой двух лиц с неопределенным фактором (или просто игрой) будем называть набор Г = (и, V, A, g, И), где и, V, А - множества; g - функция, определенная на декартовом произведении и х V и принимающая действительные значения,

а И - функция из множества и х V х А в множество действительных чисел.

Множества и и V интерпретируется как множества управлений (стратегий) первого и второго игроков соответственно. Множество А имеет смысл множества возможных значений неопределенного фактора. Интересы первого игрока описываются стремлением к максимизации значения функции g, а второй игрок стремится максимизировать функцию И.

В дальнейшем конфликт будет рассматриваться с позиций первого игрока (оперирующей стороны в терминологии [5]). Соответственно игра Г - это субъективное описание с точки зрения этого игрока. Множество А и зависимость функции И от неопределенного фактора а е А моделируют неточные представления первого игрока о целях партнера.

Возможна несколько иная интерпретация тех же конструкций. Можно считать, что а е А - это некий «природный» неопределенный фактор, значение которого становится известным второму игроку до выбора им своего управления. А первый игрок, выбирая свое управление, не знает значения этого неопределенного фактора, имея лишь информацию о том, что оно принадлежит множеству А.

Описанная модель принадлежит к так называемому классу игр в нормальной форме. Последнее означает, что игроки выбирают свои управления независимо, не имея информации о выборе партнера.

Конфликты, предполагающие обмены информацией в процессе выработки решений, тоже могут быть смоделированы в рамках игр в нормальной форме. Для этого удобно понятие квазиинформационного расширения, предложенное

Н.С. Кукушкиным [13]. На случай игр с неопределенными факторами это определение обобщается следующим образом.

Определение 1. Игра Г* = (и*, V*, А, g*, И*) является ква-зиинформационным расширением игры Г = (и, V, А, g, И), если задан набор (ж, с, ё) функций

ж и* х V* х А ^ и х V, с: и ^ и*, ё: V ^ V*, удовлетворяющий следующим двум аксиомам:

а) для любых и* е и*, V* е V*, а е А выполняются равенства g*(u*, V*) = g(ж(u*, V*, а)) и И*(и*, V*, а) = И(п(и*, V*, а), а);

б) для любых и е и, V* е V*, а е А найдется такое ^ е V, что п(с(и), V*, а) = (и, м>) и аналогично для любых

V е V, и* е и*, а е А найдется такое со е V, что п(и*, ё(у), а) = (о, V).

Содержательно стратегии и* е и* и V* е V* могут интерпретироваться как некоторые способы выработки решений на основе обмена информацией. Отображение п показывает, какие «физические» управления и е и и V е V будут выбраны, если каждый из игроков зафиксирует определенный способ выбора управлений. Первая аксиома обозначает, что выигрыши игроков зависят лишь от этих «физических» управлений и не зависят от способов, которыми они были выбраны. Вторая аксиома говорит о том, что первый игрок может фиксировать любое управление и е и и решить выбирать его независимо от того, какую информацию он получит (правилами игры Г* это не запрещено), и аналогично для второго игрока.

Замечание. Когда речь идет об отдельной игре, термины «управление» и «стратегия» употребляются в данной работе как синонимы. Когда приходится говорить о паре игр - игре и ее квазиинформационном расширении - удобно термин «управление» относить к исходной игре, а термин «стратегия» - к расширению.

Определение 2. Квазиинформационное расширение, в котором стратегии каждого игрока проинтерпретированы как способы реагировать на определенную информацию о поведении партнеров, называется информационным расширением.

Это определение не является формальным, но им иногда бывает удобно пользоваться.

Приведем несколько простейших примеров информационных расширений.

Пример 0. Всякая игра Г является своим информационным расширением. В данном случае можно считать, что отображение ж.и х Vх А ^ и х V на самом деле не зависит от

а е А и тождественно на и х V, а с: и ^ и и ё: V ^ V - просто тождественные отображения.

Пример 1. Допустим, первый игрок в момент выбора своего управления будет иметь информацию о выборе партнера. Это предполагает, что второй игрок выберет свое управление раньше первого. Но если моделировать такую ситуацию с помощью игры в нормальной форме, то следует считать, что стратегии выбираются игроками одновременно. Выход из этой коллизии дает следующий трюк. Первый игрок одновременно с партнером и независимо от него выбирает свою стратегию как функцию информации, которую он получит в дальнейшем. А по получении информации он просто вычисляет значение выбранной функции и находит свое управление.

Формально это выглядит так. Здесь и далее будем обозначать формулой Ф(Х, У) множество всех функций из X в У. Рассмотрим игру ГV = (Цу, Vv, А, gv, hv), где ^ = Ф(^, Ц), Vv = V, gv(uv, Vv) = g(uv(vv), Vv), hv(uv, Vv, а) = h(uv(vv), Vv, а). Данная игра является квазиинформационным расширением, моделирующим ситуацию, описанную в предыдущем абзаце. Отображение п в данном случае задается условием Ж(иу, vv, а) = (uv(vV), vv). В качестве с в данном примере можно взять отображение, которое элементу и е Ц ставит в соответствие функцию с(и) из множества Ф(^, Ц), тождественно равную и. А ё можно считать тожественным отображением. Аксиомы из определения 1 в данном примере проверяются непосредственно.

Пример 2. Допустим, первый игрок к моменту выбора своего управления получит информацию о действительном значении неопределенного фактора а е А. Эту ситуацию можно моделировать игрой ГА = (ЦА, VA, А, gA, ИА), в которой Ц = Ф(А, Ц), VA = V, gA(uA, VA) = g(uA(а), vA),

ИА(иА, vA, а) = И(иА(а), vA, а). Эта игра является квазиинформа-ционным расширением игры Г. Соответствующие отображения строятся аналогично примеру 1.

Пример 3. Если первый игрок к моменту выбора будет иметь полную информацию и о выборе противника и о неопределенном факторе, то конфликт моделируется информационным расширением Г va = (Uva, Vva, Л, gvA, hvA ), где

UVA = 0(V x A, U), VVA = V, а функции выигрыша определяются условиями

gvA(uvA, Vva) = g(uvA(vvA,a), Vva),

hvA(uvA, Vva, a) = h(uvA(vvA,a), Vva, a).

Интересно отметить, что игра rVA является информационным расширением игры rV. А именно, она получается из игы ГV тем способом, который описан в примере 2, т.е. rVA = (rV)A. Это следует из существования естественного изоморфизма между множествами Ф(Л, 0(V, U)) и Ф(Л x V, U). Содержательно этот факт означает, что все равно, получит ли первый игрок сначала информацию о выборе противника, а потом информацию о неопределенном факторе, или же он получит всю эту информацию сразу.

Аналогично, игра ГVA является квазиинформационным расширением игры ГЛ.

До сих пор рассматривались примеры, в которых первый игрок получал достоверную информацию, т.е. либо он сам добывал ее, либо получал ее от партнера, но существовал некий механизм, заставляющий второго игрока передавать истинную информацию.

Можно рассматривать конфликты, в которых второй игрок может передавать не обязательно правдивую информацию. Для их моделирования можно предложить следующую общую конструкцию.

Пусть отображения (ж, c, d) задают квазиинформационное расширение Г* = (U*, V*, Л, g*, h*) игры Г = (U, V, Л, g, h). По-

строим новое квазиинформационное расширение Г*? = (U*?, V*?, Л, g*?, h*?) той же игры следующим образом.

Поскольку ж: U* x V* x Л ^ U x V, существуют и единственны такие отображения ж1: U* x V* x Л ^ U и

ж2: U* x V* x Л ^ V, что ж(и*, v*, a) = (ж1(и*, v*, a), ж2(и*, v*, a))

для всех и*, V* и а. Положим Ц*? = Ц*, V*? = V* х V*. Отображения ж, с?, ё? определим условиями п?(и*?, (V*?, ^*?), а) = = (ж(и*?, ^*?, а), п2(и*?, V*?, а)) для всех и*?, V*?, ^*? и с?(и) = с(и), ё?0^) = (ё{у), d(v)) для любых и и V. Функции g*?, И*? определим так, чтобы выполнялась аксиома а) из определения 1.

Интерпретируется эта конструкция следующим образом. В игре Г*? происходит обмен той же по смыслу информацией, что и в игре Г*. Но в игре Г* передаваемая информация заведомо достоверна, а в игре Г*? второй игрок может передавать и ложные сведения. Проще всего это понять на примерах.

Пример 0?. Как отмечалось выше, всякая игра является квазиинформационным расширением самой себя. Поэтому предложенную конструкцию можно применить и в этом случае. Получим игру Г?, в которой первый игрок выбирает управление и е Ц, второй - пару управлений V е V и w е V, а выигрыши игроков вычисляются по формулам g?(u, (^), а) = g(u, V) и И?(и, С^), а) = И(и, V, а). Видно, что выигрыши не зависят от w, поэтому полученная игра практически не отличается от исходной игры Г, что вполне можно было ожидать, исходя из содержательного смысла.

Пример 1?. Рассмотрим расширение Г^- из примера 1. В этом случае второй игрок выбирает, во-первых, свое физическое управление V е V, а во-вторых, сообщение w е V об этом выборе, которое он передаст партнеру. Первый игрок выбирает свое управление иу?^) в зависимости от полученного сообщения, а выигрыши игроков в игре Г у? определяются условиями gv?(uv?, (^)) = g(uу?(w), V) и hу?(uу?, (^), а) = h(uv?(w), V, а).

Пример 2?. Аналог ГА? игры ГА выглядит следующим образом. Второй игрок выбирает свое «физическое» управление V и сообщение р е А об известном ему неопределенном параметре а. А первый игрок выбирает свое управление в зависимости от полученного сообщения р. Детали такие же, как в предыдущем примере.

Пример 3?. Конструкции для игры Гт из примера 3 строятся аналогично. Но здесь имеется одна особенность. Как отме-

чалось выше, игра TVA изоморфна играм (ГУ)А и (rA)V. Поэтому наряду с игрой rVA?, в которой первый игрок получает непроверенную информацию и об управлении противника, и о неопределенном факторе, можно рассмотреть игру (rV)A?, в которой игрок 1 получает истинную информацию о v и недостоверную об а, и игру (ГА)р?, в которой информация об а правдива, а о v -нет. Разумеется, можно рассмотреть и игры (Гр?)А и (rA?)V, но они, как нетрудно видеть, изоморфны играм (rA)V? и (rV)A? соответственно.

3. Обобщенный принцип максимального гарантированного результата

Данный слегка устаревший термин используется для того, чтобы подчеркнуть следующее. В ранних работах по теории игр максимальным гарантированным результатом первого игрока называлась величина

max min g (u, v).

ueU veV

Ю.Б. Гермейер предложил несколько иной принцип оптимальности для игр с фиксированным порядком ходов (см. [5]). О нем и пойдет речь ниже.

В [6] предложен и обоснован ряд методологических принципов исследования операций, из которых нас будут интересовать два.

1. Принимая решение в условиях неопределенности, игрок должен быть осторожен, т.е. ориентироваться на наихудшие значения неопределенных факторов.

2. При этом он должен учитывать всю имеющуюся у него информацию.

Этих двух принципов достаточно, чтобы получить принцип рационального поведения первого игрока в рассматриваемой нами игре, если он обладает правом первого хода.

В таком случае неопределенность для первого игрока сводится к неизвестному выбору партнера. Но по условию задачи ему известно множество управлений V. Кроме того, ему извест-

но, что он имеет дело с рациональным партнером, и имеется информация о его интересах, «закодированная» множеством неопределенных факторов А и функцией И.

Зная это, он может рассуждать следующим образом: «Получив информацию о выбранной мною стратегии, противник встанет перед задачей выбора своего управления, которая, по существу, является задачей оптимизации. Поскольку он рационален, то он выберет управление, при котором оптимизируемая функция имеет достаточно большое значение. На это мне и следует рассчитывать». Формализуя эти рассуждения, придем к следующему определению.

Определение 3. Число у называется гарантированным результатом первого игрока в игре Г = (Ц, V, А, g, И), если существует стратегия и е Ц и для любого а е А существует такое число Л, что выполняются условия

а) существует V е V, для которого И(и, V, а) > Л (такие стратегии V называют рациональными откликами второго игрока на стратегию и при данном а);

б) для любого V е V либо g(u, V) > У либо И(и, V, а) < Л. Верхняя грань ^(Г) всех гарантированных результатов называется максимальным гарантированным результатом в игре Г.

Условие а) означает, что при любом выборе первого игрока у его партнера найдется рациональный ответ. Условие б) соответствует тому, что результат у можно получить гарантированно, если выбор противника либо приносит первому игроку выигрыш у, либо не рационален.

Число Л в данном определении, разумеется, зависит от а, что в дальнейшем иногда будет подчеркиваться в обозначениях.

Традиционно эти же методологические принципы формализуются несколько иначе. Продемонстрируем, что предложенный способ формализации эквивалентен традиционному. Поскольку при традиционном подходе принцип оптимальности для игры Г и каждого ее информационного расширения определяется заново, сформулировать общую теорему затруднительно.

Мы ограничимся рассмотрением одного случая, на котором видны все идеи.

Ограничимся случаем, когда множество A состоит из одной точки, т.е. функция h от а, по сути, не зависит. Рассмотрим информационное расширение ГV (по традиции такую игру называют игрой Г2).

Чтобы определить максимальный гарантированный результат, сначала определяют множество рациональных ответов B(uV) второго игрока на стратегию uV игрока 1. Если максимум (1) max h(uV (v), v)

В противном случае это множество определяют по-разному [4, 7], но наиболее распространенный способ такой. Если стратегия uV такова, что максимум (1) не достигается, то задают положительное число S(uV) и полагают

B(uV) = <v е V: h(uV (v),v) > sup h(uV (w), w) - S(uV )>.

Максимальным гарантированным результатом называют число

Лемма 1. Если множества и и V наделены топологией и компактны, а функции g и h непрерывны, то ^'(Г) = ^(Г).

R'(H < R(r). В самом деле, фиксируем произвольное s> 0 и выберем стратегию uV так, что inf g(uV (v), v) > R'(r) - s . Непо-

veV

средственно проверяется, что для у = R'(r) - s, стратегии uV и Л = sup h(uV (v), v) - S(uV) (здесь полагаем, что если максимум

(1) достигается, то 3(ыу) = 0) выполняются условия а) и б) из определения 3, т.е. число ^'(Г) - є является гарантированным результатом. В силу произвольности є отсюда получаем нужное неравенство.

достигается, то полагают

B(uV) = jv є V: h(uV (v),v) = maxh(uV (w),w

Доказательство. Легко доказывается неравенство

Докажем, что ^'(Г) > Л(Г). Пусть у, uV и Л выбраны так, что выполняются условия а) и б) из определения 3.

Пусть стратегия uV такова, что максимум (1) не достигается. Определим стратегию a>V е UV следующим образом. Выберем последовательность v1, v2, ... элементов множества V так, что lim h(uV (vk),vk) = sup h(uV (v), v).

k^“ veV

В силу сделанных предположений о компактности такую последовательность можно выбрать так, что она сама сходится к некоторому v0 е V, а последовательность uy(v2), uy(v2), ... сходится к u0 е U. Положим

Г о о

I u , если v = v ,

®(v) =1 / Ч о

[u(v), если v Ф v .

Так как функции выигрыша непрерывны, для тройки у, a>V и Л условия а) и б) выполняются, и при этом максимум max h(aV (v), v) достигается.

veV

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поэтому с самого начала можно ограничиться рассмотрением только таких стратегий uV, для которых максимум (1) достигается. Заметим, что если условие б) выполняется для какого-то Л, то оно будет выполняться и для больших чисел. Поэтому можно, не ограничивая общности, считать, что Л = maxh(uV (v),v) .

veV

Но тогда для любого v е B(uV) неравенство h(uV(v), v) < Л не выполняется, а значит, выполняется неравенство g(uV(v), v) > у. Но тогда должно быть у< Л'(Г). В силу произвольности у получаем нужное неравенство.

Лемма доказана.

Весьма важен следующий простой результат.

Лемма 2. Если Г* - квазиинформационное расширение игры Г, то Я(Г *) > Я(Г).

Доказательство. Пусть у - гарантированный результат, и для тройки у, u, Л(а) выполняются условия а) и б) определения 3. Рассмотрим тройку у, c(u), Л(а). Пусть v е V таково, что выполняется условие а). Тогда h*(c(u), d(v), а) = h(u, v, а) > Л(а).

Если теперь V* е V* - произвольная стратегия второго игрока в игре Г* и я(с(и), V*, а) = (и, V), тогда в силу свойства б) либо g*(c(u), V*) = g(u, V) > у, либо Ь*(с(и), V*, а) = ^и, V, а) < А(а).

Таким образом, тройка у, с(и), Л(а) удовлетворяет условиям а) и б) определения 3, отнесенного уже к игре Г*. Это доказывает, что у - гарантированный результат в игре Г*. Отсюда следует утверждение леммы.

4. Достоверность передаваемой информации

Если информационное расширение таково, что достоверность передаваемой информации не гарантируется правилами игры, то естественно ставить вопрос об истинности передаваемых сообщений при рациональных действиях игроков.

Данный вопрос не выражается в рамках формальных моделей, рассмотренных выше. Поэтому эти модели требуют некоторого уточнения. Сделаем их для частного случая информационного расширения из примера 2?.

В этом примере второй игрок может передавать партнеру сообщение о значении неопределенного фактора. То есть, по сути, в модели должно быть задано некоторое множество S возможных сообщений, из которых второй игрок и выбирает сообщение, передаваемое игроку 1. Обычно такие сообщения -это тексты на некотором естественном или искусственном языке. Не будем детализировать описание этого языка. Заметим только, что сообщения будут иметь семантику. И смысл некоторых сообщений будет соответствовать истинному значению неопределенного фактора, а смысл других - нет. Например, если 1 декабря стояла ясная солнечная погода, то сообщение коммунальной службы о том, что «1 декабря выпала месячная норма осадков», явно не соответствует действительности.

Таким образом, семантика выбранного языка задает точечно-множественное отображение Т: А ^ S, смысл которого таков. Если действительное значение неопределенного фактора равно

а, то сообщения из множества Т(а) истинны, а все прочие -ложны. Вполне допустимо, что каждому значению а может

соответствовать несколько истинных сообщений. Поэтому используются точечно-множественные отображения.

До сих пор в основном рассматривались модели, в которых S = А, а отображение Т определялось условием Т(а) = {а}. Это, разумеется, идеализация, так как если, например, неопределенные факторы - это состояния погоды, влияющие на выигрыш игрока, то передать «погоду» нельзя. Можно передать лишь сообщение о погоде, а это объект совсем другой природы. Но поскольку это не приводило к неверным выводам, такая идеализация вполне оправдана.

Описанное в предыдущем абзаце отображение Т обладает следующим свойством.

Условие В. Существует инъективная функция Р. А ^ S такая, что ^а) е Т(а) для любого а е А.

Итак, имеются игра Г = (и, V, А, g, И) и ее информационное расширение Г* = (и*, V*, А, g*, ^), задаваемое отображениями (ж, с, ф, такие, что V* = V х S,

и* = Ф^, и), ж(и*, V*, а) = (и*^), V) (здесь V* = (V, s)), отображение с ставит в соответствие элементу и е и функцию и*: S ^ и, тождественно равную и, й(V) = ), где s - произвольный

фиксированный элемент множества S, а функции g* и ^ определены так, что выполняется условие а) определения 1. Кроме того, задано отображение Т: А ^ S. Хочется знать, будет ли при рациональном выборе стратегии и* и рациональном выборе стратегии V* = (V, s) выполняться включение s е Т(а)?

Для игр с фиксированным порядком ходов ответ дается следующей теоремой.

Теорема 1. Допустим, отображение Т удовлетворяет условию В. Пусть стратегия и* гарантирует первому игроку получение выигрыша у. Тогда существует такая стратегия со*, гарантирующая первому игроку тот же выигрыш у, что при любом а среди рациональных откликов второго игрока на стратегию с * непременно найдется такая стратегия (у^), что t е Т(а).

Доказательство. По определению 3 для любого а найдутся число Л(а) и такая стратегия (Ка), s(а)), что

Щи*^(а)), v(а), а) > Я(а).

Обозначим я-1(с) = {а е А: s(а) = с} полный прообраз элемента се S при отображении я, а ф~'(с)) = {те S: т = t(a), а е я-1(с)} - полный образ множества я-1(с) при отображении t. В силу инъективности отображения t множества ^“'(с1)) и ^^(с2)) не пересекаются при 0 Ф с2. Поэтому существует такая функция с*, что ю*(^а)) = и*(я(а)) для любого а е А. Это условие определяет функцию с* только для се {те S: т = t(a), а е А}. Для остальных с положим с*(с) = и*(о). Покажем, что стратегия с* - искомая.

Очевидно, ^а*^(а))), v(a), а) = h(u*(s(a)), v(a), а) > Я(а), т.е. (v(a), ^а)) - рациональный отклик второго игрока на стратегию с*, отвечающий неопределенному фактору а.

Пусть теперь ^, с) произвольная стратегия второго игрока, для которой g(с*(с), w) < у. Если с= ^Р) для некоторого Р е А, то тогда g(u*(s(Р)), w) = g(a*(t(Р)), w) = g(ю*(с), w) < у. В силу выбора стратегии и* тогда ^и*(я(Р)), w, а) < Л(а) и, следовательно, ^ю*(с), w, а) = ^ю*(^Р)), w, а) = ^и*(я(Р)), w, а) < Я(а). А если сё {те S: т = t(Р), Р е А}, то g(u*(о),w) = g(с*(с),w) < у. Следовательно, ^ю*(с), w, а) = ^и*(с), w, а) < А(а). В обоих случаях получили, что стратегия ^, с) не является рациональным откликом второго игрока на стратегию с*. Значит, стратегия с* гарантирует первому игроку выигрыш у.

Как установлено, ^(а), ^а)) является рациональным откликом на стратегию с*, и в силу определения функции t выполняется включение ^а) е Т(а). Теорема доказана.

Остановимся на содержательной интерпретации конструкций, использованных при доказательстве теоремы. Как только первый игрок выберет стратегию и* и сообщит ее партнеру, у сообщения я(а) появится некий внутренний смысл. А именно, выбирая сообщение я(а), второй игрок, по сути, сообщает, что в множестве Е = {и е и: и = и*(я), я е S} наиболее предпочтительным для него является управление и*(я(а)). Если стремиться к тому, чтобы второму игроку было выгодно сообщать правду,

то нужно, не меняя множества Е, выбрать стратегию с* так, чтобы для некоторого сообщения t е Т(а) выбиралось то же самое управление ю*(0 = и*(я(а)). То есть нужно подходящим образом закодировать этот внутренний смысл фразой из множества S.

Разумеется, для того чтобы такая кодировка была возможной, выбранный язык должен быть достаточно выразительным. За это и отвечает условие В.

Заметим, что в подавляющем большинстве рассматривавшихся ранее постановок задач общение происходило на некоторых искусственных языках. Действительно, почти всегда квази-информационное расширение задавалось при постановке задачи (даже если авторы модели не пользовались этим термином). Но если задано, например, расширение ГА (или ГА?), то на соответствующем языке можно обмениваться информацией только о значениях неопределенных факторов, но нельзя поговорить о выбранных вторым игроком управлениях или на какие-то отвлеченные темы. Это в известной степени отражает сложившуюся практику, когда общение между игроками происходит путем заполнения стандартных бланков (а в последнее время все чаще в этих бланках нужно просто расставить «галочки»). Поэтому считать, что условие В выполняется автоматически, не правильно.

Если множество S конечно, то критерий выполнения условия В дает теорема Холла о трансверсалях [17]. Если S бесконечно, то это условие становится менее обременительным, Но в этом случае возникает возможность появления патологических решений, свидетельствующая о неадекватности постановки (об этом кое-что сказано в разделе 5 ниже).

Видимо, условие В является наиболее слабым из тех, которые не используют информацию о функциях выигрыша. Впрочем, это условие пока не кажется настолько важным, чтобы доказывать его необходимость. Понять, что не удастся совсем отказаться от условий такого типа, сохранив вывод теоремы 1, можно на совсем простых примерах, скажем, рассмотрев такое

отображение Т, что множество Т(а) состоит из одного элемента, не зависящего от а.

5. Бесполезная информация

Можно указать один важный случай, когда обмен информацией, достоверность которой не гарантируется правилами игры, не приносит ощутимой выгоды.

Рассмотрим игру Г = (и, V, А, g, h), в которой множество А состоит из одного элемента. Для упрощения формул в дальнейшем зависимость от а указывать не будем, не меняя обозначений. Для игр указанного типа справедлив следующий результат.

Теорема 2. Пусть отображения (ж, с, й) задают квазиин-формационное расширение Г* = (и*, V*, А, g*, ^) игры Г. Тогда для соответствующего расширения Г*? справедливо равенство Д(Г) = Д(Г*?).

Доказательство. Неравенство R(Г) < R(Г *?) следует из леммы 2. Докажем неравенство R(Г) > R(Г *?).

Пусть стратегия и*? = и* в игре Г*? гарантирует первому игроку получение выигрыша у. Тогда найдутся стратегия

V*? = (V*, w*) и число Л, удовлетворяющие определению 3. В частности ^?(и*?, V*?) = h(жl(u*,w*), ж2(и*^*)) > Л. Положим

и = Ж1(и*, w*), V = ж2(и*, V*). Тогда, очевидно, ^иу) > Л.

Пусть теперь стратегия V второго игрока в игре Г удовлетворяет условию g(u, V') < у. Обозначим V*?' = (й(V'), w,). Тогда

g,?(u,?,V,?') = g(ж1(и*,w,),ж2(u,,й(V')) = g(и,V') < у . Так как стратегия и*? гарантирует первому игроку получение выигрыша у, отсюда следует, что К?(и„?,V*?') < Л. Но тогда

^и, V') = ^жДи,., w,),ж2(u,,й(V')) = Д»?(и„?, V*?') < Л.

Это означает, что стратегии и, V и число Л удовлетворяют условию определения 3, т.е. стратегия и гарантирует первому игроку выигрыш у в игре Г. Поскольку в качестве у можно было

выбрать любое число, меньшее R(Г *?), неравенство R(Г) > R(Г *?), а с ним и теорема доказаны.

6. Примеры

Но иногда даже недостоверная информация может быть полезной, как показывает следующий

Пример 4. Рассмотрим игру Г = (и, V, А, g, h), в которой и = V = А = {0, 1}, g(u, V) = V, ^и, V, а) = V - 2v(u - а)2 и ее расширение ГА?, описанное в примере 2?.

В игре Г какое бы управление и не выбрал первый игрок, второму будет выгодно выбрать V = 0, если окажется, что и Ф а. Поэтому первый игрок может гарантированно получить только нулевой выигрыш.

А в игре ГА? первый игрок может выбрать стратегию иА?(Р) = р. Тогда единственным рациональным ответом второго игрока будет (1, а). Поэтому первый игрок гарантированно получит выигрыш, равный 1.

При наличии неопределенного фактора к увеличению выигрыша может привести и обмен информацией о выбранном управлении, как показывает

Пример 5. Пусть игра Г - та же, что и в предыдущем примере. Рассмотрим ее информационное расширение Гр?, описанное в примере 1?.

Рассмотрим стратегию иу?^) = w. Если а = 1, то единственным рациональным ответом на нее будет выбор (1, 1). А если а = 0, то второму игроку выгодно выбрать стратегию (1, 0). В обоих случаях первый игрок гарантированно получает 1.

Обсудим вопрос об истинности передаваемой информации в естественном предположении, что отображение Т задано условием Т(а) = {а}.

Понятно, что при описанной стратегии первого игрока его партнеру будет выгодно солгать, если окажется а = 0. Кроме описанной выше существует еще только одна стратегия первого игрока, гарантирующая ему выигрыш 1, а именно иу?^) = 1 - w.

Но при такой стратегии второму игроку будет выгодно солгать, если окажется, что а = 1.

Впрочем, нетрудно сообразить, что в данном случае игроки пользуются эзоповым языком, передавая информацию о неопределенном факторе при помощи сообщений об управлениях. Поэтому вопрос об истинности сообщений становится, пожалуй, бессодержательным. К использованию иносказаний игроков вынуждает неудачный выбор языка общения (в данном случае информационного расширения Г р?).

Сказанное в предыдущем абзаце совершенно естественно, но чтобы формализовать эти соображения, нужно более тонкое описание семантики языка, чем использовано выше.

В данном простом примере понятно, что расширение ГА ? «гораздо лучше», чем расширение Гр?. Но уже довольно давно известны примеры, где все далеко не так очевидно (см., например, параграф 7.3 из [8]). Поэтому постановка задачи о рациональном выборе языка общения является весьма актуальной. Но при этом, видимо, придется довольно глубоко погрузиться в математическую лингвистику.

Кстати, выше намечен и один из подходов к решению этой задачи. Можно обмениваться не информацией о выборе второго игрока и неопределенном факторе. Лучше, если второй игрок будет передавать информацию о желательном для него выборе первого игрока. Здесь должны получится задачи, аналогичные рассмотренным в [9-11].

Пример 5 объясняет, между прочим, почему теорема 1 доказана в меньшей общности, чем другие результаты данной работы. Без дополнительных предположений соответствующий результат может стать попросту неверным.

Отметим, что если бы выбранный язык был более выразительным, то можно было бы воспользоваться идеями из доказательства теоремы 1 и получить оптимальную стратегию, обеспечивающую передачу истинной информации. Например, положим в расширении, описанном в третьем разделе S = V х V и Т(1) = {(1, 0), (1, 1)}, Т(0) = {(0, 0), (0, 1)}. Тогда стратегия и*(я) = я2, где я = (я1, я2), гарантирует первому игроку выиг-

рыш 1, так как единственным рациональным откликом на эту стратегию будет выбор (1, (1, а)). Этот отклик предполагает передачу истинной информации. Правда, проблем с осмысленностью такого понимания истины это не снимает.

В следующей игре те же проблемы проявляются по-иному.

Пример 6. Рассмотрим игру Г = (и, V, А, g, И), в которой

и = [0, 1] х [0, 1], V = [0, 1], А = [0, 1] х [0, 1],

g(u, V) = V, И(и, V, а) = V - v((u1 - а1)2 + (и2 - а2)2), где и = (и1, и2) и а = (а1, а2).

Найдем максимальный гарантированный результат первого игрока в информационном расширении ^ из примера 1.

Фиксируем произвольное положительное е. Отрезок [1-е, 1] имеет мощность континуума, так же как и квадрат А. Поэтому существует взаимно однозначное отображение у А ^ [1-е, 1]. Рассмотрим стратегию ир, определенную условием

, Ч I у_1(у), если V е[1 - е,1],

^ (V) = <!

[(0,0) в противном случае.

Выбрав управление V = у(а), второй игрок получит выигрыш, больший или равный 1 - е. А больше 1 он получить не может. Следовательно, такой выбор будет рациональным ответом на стратегию и^ При этом первый игрок получит выигрыш 1 - е.

Следовательно, максимальный гарантированный результат первого игрока в данной игре равен 1 и обеспечивается использованием стратегий указанного вида.

Вроде бы решение найдено. Но отображение у устроено так [14], что его можно рассматривать скорее как математический курьез. Во всяком случае ни о каком практическом применении подобных стратегий не может идти речи.

Причина появления этой патологии заключается в том, что второй игрок эзоповым языком передает партнеру информацию о неопределенном факторе. (Кстати, правилами игры достоверность этой информации не гарантируется.)

В данном конкретном примере ситуация немного смягчается тем, что такая е-оптимальная стратегия не единственна. Для того чтобы второму игроку было выгодно выбирать управление

V близкое к 1, достаточно, чтобы и было «примерно равно» а, а потому можно эзоповым языком передавать лишь конечный объем информации. При этом е-оптимальные стратегии будут выглядеть попроще. Но в более сложных моделях такая аппроксимация оказывается невозможной (соответствующие примеры есть, например, в параграфе 7.3 из [8]).

Г ораздо более радикальный и естественный способ решения возникающих проблем состоит в том, чтобы перейти от рассмотрения расширения ^ к изучению игры Г^?, в которой первый игрок получает достоверную информацию об управлении противника и еще не обязательно истинную информацию о неопределенном факторе. Тогда стратегия ит-Ау, Р) = р гарантирует первому игроку выигрыш в точности равный 1, так как единственным рациональным ответом второго игрока на эту стратегию будет выбор (1, а) (при этом второй игрок получает 1).

Таким образом, здесь опять встает вопрос о рациональном выборе языка общения.

7. Заключение

Выбранный способ формализации понятия истинности передаваемой информации обобщает предположения, уже использовавшиеся в более ранних моделях [1-3, 6-8, 10-12, 15]. Эти предположения сводятся к тому, что информация может быть либо истинной, либо ложной (третьего не дано).

Как показывают приведенные примеры, это предположение может оказаться слишком грубым. Впрочем, для специалистов по лингвистике последний вывод не является новым [16].

Приведенные доказательства чрезвычайно просты. Они основаны, скорее, не на математических идеях, а на простой житейской логике. Это дает основание предполагать, что те же

идеи будут работать не только для рассмотренных выше моделей, которые намеренно выбирались максимально простыми.

Литература

1. БУРКОВ В.Н. Основы математической теории активных систем. - М.: Наука, 1977. -255 с.

2. БУРКОВ В.Н., ЕНАЛЕЕВ А.К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. - 1985. - №3. - С. 73-80.

3. БУРКОВ В.Н., НОВИКОВ Д А. Теория активных систем: состояние и перспективы. - М.: Синтег, 1999. - 128 с.

4. ВАСИН А.А., МОРОЗОВ В.В. Теория игр и модели математической экономики. - М.:МАКС Пресс, 2005. - 272 с.

5. ГЕРМЕЙЕР Ю.Б. Введение в теорию исследования операций. - М.: Наука, 1971. - 383 с.

6. ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1976. - 327 с.

7. ГОРЕЛИК В.А., КОНОНЕНКО А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. - М.: Радио и связь, 1982. - 144 с.

8. ГОРЕЛИК В.А., ГОРЕЛОВ М.А., КОНОНЕНКО А.Ф. Анализ конфликтных ситуаций в системах управления. -М.: Радио и связь, 1991. -288 с.

9. ГОРЕЛОВ М.А. Модель институционального управления // Управление большими системами. - 2011. - №35. -С. 68-93.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. ЕНАЛЕЕВ А.К. Оптимальный механизм функционирования в активной системе с обменом информацией // Управление большими системами. - 2010. - №29. - С. 108-127.

11. ЕНАЛЕЕВ А.К. Оптимальность согласованных механизмов функционирования в активных системах // Управление большими системами. - 2011. - №33. - С. 143-166.

12. КОРГИН Н.А. Неманипулируемые механизмы обмена в активных системах. - М.: ИПУ РАН, 2003. - 127 с.

13. КУКУШКИН Н.С., МОРОЗОВ В.В. Теория неантагонистических игр. - М.: МГУ, 1984. - 104 с.

14. НАТАНСОН И.П. Теория функций вещественной переменной. - М.: Гостехиздат, 1950. - 399 с.

15. НОВИКОВ Д.А. Теория управления организационными системами. - М.: МПСИ, 2005. - 584 с.

16. УСПЕНСКИЙ В.А. Математическое и гуманитарное: преодоление барьера. - М.:МЦНМО, 2011. - 48 с.

17. ХОЛЛ М. Комбинаторика. - М.: Мир, 1970. - 424 с.

GAMES WITH UNRELIABLE INFORMATION TRANSFER

Mikhail Gorelov, Computer Center of RAS, Moscow, Cand.Sc., ([email protected]).

Abstract: We consider formalization of semantics of information, which players transfer while making their decisions, and suggest a rather general approach to modeling of conflict situations, where transfer of unreliable information is possible.

Keywords: hierarchical games, informational extension, semantics.

Статья представлена к публикации членом редакционной коллегии В. Н. Бурковым

i Надоели баннеры? Вы всегда можете отключить рекламу.