ТЕОРЕТИКО-ИГРОВОЕ МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННОГО УПРАВЛЕНИЯ
Чхартишвили А.Г.
(Институт проблем управления РАН, Москва) 8аікІго_с1і@,таі1. ги
1. Введение. Модель информационного управления
Задача управления социально-экономической - активной -системой (элементы которой способны к целенаправленному поведению) с теоретико-игровой5 точки зрения состоит в том, чтобы создать для управляемых субъектов (агентов) игру с такими правилами, чтобы ее исход (набор действий агентов) был как можно более благоприятным для управляющего органа (центра). Сам центр не входит в число игроков6, а лишь формирует условия их взаимодействия («правила игры»)7. В дальнейшем понятия «игрок» и «агент» будем считать синонимами (отметим, что первое характерно для теории игр, второе - для микроэкономики).
Предметом рассмотрения в настоящей работе является информационное управление, то есть воздействие на информированность принимающих решение субъектов - элементов активной системы, осуществляемое с целью побуждения их к совершению требуемых действий. Например, бизнесмен принимает решения о производстве того или иного товара в том или ином объеме на основе своей информированности о рынке (потреби-
5 Обзор теории игр, ее основных разделов — см., например, [0, 0, 0].
6 Отметим, что существует и другой подход, согласно которому центр является одним из игроков («метаигроком»). Сопоставление этих подходов выходит за рамки данной работы.
7 Например, государство устанавливает правила игры для действующих на его территории юридических и физических лиц при помощи системы налогообложения (и, разумеется, многих других рычагов воздействия).
телях) и о конкурентах. Избиратель принимает решение проголосовать за того или иного кандидата на выборах на основании информированности об этом кандидате, о прочих кандидатах, о мнениях и предпочтениях других избирателей. Соответственно, любое целенаправленное воздействие на информированность бизнесмена в первом случае и избирателя во втором является информационным управлением. Рассмотрение информационных аспектов дает возможность в ряде случаев расширить множество рациональных исходов игры, что, в свою очередь, увеличивает эффективность управления (см. примеры в [0, 0]).
Рис. 1. Модель информационного управления
На рис. 1 показана модель информационного управления, предложенная в работе [0]. Управляемый субъект (агент) выбирает действие на основе своей информированности о существенных параметрах. Совершив действие, агент наблюдает ре-
зультат этого действия8, причем наблюдаемый результат зависит, вообще говоря, от действий остальных агентов. Продолжая пример с бизнесменом можно сказать так: он принимает то или иной решение, но результат (например, полученный им доход) зависит также и от действий конкурентов (и, косвенно, от их информированности). Наблюдаемый результат, естественно, оказывает влияние на информированность. На рисунке цикл «информированность - действие - наблюдаемый результат -информированность» обведен пунктирным прямоугольником, обозначающим управляемую подсистему. С другой стороны, информированность агента приводит, через его действие, к результату, более или менее желательному с точки зрения управляющего органа (центра). Поэтому центр стремится, путем осуществления управляющего воздействия, добиться той или иной информированности агента9.
2. Рефлексивные игры
Перейдем к более систематическому изложению результатов исследований информационного управления. Начнем с описания информированности агентов и связи информированности с их действиями. Собственно говоря, именно эта задача является ключевой для любой теоретико-игровой модели -описание зависимости между «правилами игры» и ее результатом при условии рационального поведения участников.
Как известно, игра с полной информированностью в нормальной форме задается перечислением множества игроков (агентов), множеств их допустимых действий и набором их целевых функций. Однако существенным является вопрос: известно ли само это описание участникам игры? Долгое время в теории игр «по умолчанию» предполагалось, что игра известна
8 В данной работе мы рассматриваем лишь «одноходовые игры» (т.е. игры в нормальной форме), в которых игроки выбирают свои действия одновременно и независимо.
9 Отметим, что одной из возможных задач центра является согласование представлений агентов (о проблеме взаимопонимания в контексте рефлексивного подхода см., напр., [0]).
всем ее участникам и, более того, она является общим знанием среди участников. Этот технический термин - общее знание -был введен философом Дэвидом Льюисом [0], а в теорию игр Робертом Ауманном [0] для обозначения факта, о котором известно всем агентам, и всем агентам известно, что о нем известно всем агентам и т.д.
Ясно, что далеко не всегда игра является общим знанием. Для моделирования таких ситуаций введено понятие рефлексивной игры [0].
В отличие от игры с общим знанием целевые функции агентов в рефлексивной игре зависят (кроме набора действий агентов) от неопределенного параметра в, называемого также состоянием природы. У каждого из агентов, вообще говоря, может быть свое представление о том, какое состояние природы имеет место (на рис. 2 эти представления обозначены в\, ..., в„). Далее, у каждого агента может быть свое представление о преставлениях оппонентов (параметры вида 0и на рис. 2), о представлениях о представлениях и т.д. Совокупность всех этих представлений образует структуру информированности игры -
бесконечное и-арное дерево. Структура информированности каждого агента представляет собой некоторое поддерево структуры информированности игры I. Это дерево можно интерпретировать следующим образом: наряду с п реальными агентами -участниками ситуации - для анализа необходимо учитывать образы этих агентов в сознании оппонентов - фантомные агенты10. На рис. 2 выделены реальный первый агент (его структура информированности - 1{) и его образ в сознании /-го агента (обозначается 1а). Эти два дерева, две структуры информированности могут как совпадать, то есть быть тождественными, так и различаться. Если они тождественны, то /-й агент адекватно информирован о первом агенте, если нет - неадекватно.
Таким образом, описание рефлексивной игры отличается от описания «обычной» игры в нормальной форме наличием структуры информированности I.
Если общее число попарно-различных фантомных агентов конечно, то структура информированности игры имеет конечную глубину - уровень, при превышении которого каждое поддерево совпадает с одним из поддеревьев менее глубокого уровня. Например, если каждое поддерево /,д- совпадает с одним из поддеревьев , то глубина структуры информированности не более двух. Если имеет место общее знание, то все фантомные агенты тождественны реальным (в смысле совпадения соответствующих поддеревьев) и глубина равна единице. В общем случае глубина может принимать любое конечное значение, а также быть бесконечной.
3. Информационное равновесие
Описав структуру информированности игры, определим концепцию ее решения, то есть ответ на вопрос, какие действия
10 Говоря неформально, фантомный агент (не совпадающий с реальным) присутствует в ситуации тогда, когда один агент заблуждается насчет другого. Например, в комедии Н. Гоголя «Ревизор» герои общаются с фантомным агентом — ревизором, а не с реальным агентом —Хлестаковым.
выберут рациональные агенты в рамках своей информированности. Иными словами, какова связь между информированностью агента и избранным им действием. Решением рефлексивной игры является информационное равновесие [0] - набор действий реальных и фантомных агентов, при котором каждый агент максимизирует свою целевую функцию в рамках своей информированности о состоянии природы и такого же выбора ожидает от оппонентов. При этом тождественные агенты выбирают одинаковые действия.
Информационное равновесие является обобщением равновесия Нэша - наиболее общераспространенной концепции решения некооперативной игры11. Глубина структуры информированности предполагается конечной. Это обусловлено как содержательными, так и формальными соображениями. С содержательной точки зрения ограниченность глубины рефлексии агентов представляется достаточно естественной. Чем плоха бесконечная глубина с формальной точки зрения? Оказывается, что справедлив следующий результат [0]: при некоторых дополнительных условиях неограниченность глубины структуры информированности означает, что любое допустимое действие агента оказывается равновесным.
4. Наблюдаемый результат и информированность. Стабильные информационные равновесия
В «обычной» игре с полной информированностью равновесие имеет самоподдерживающий характер - если игра повторяется несколько раз, ни одному из агентов не выгодно отклонять-
11 Равновесие Нэша — это такая ситуация (набор действий игроков), от которой никому из участников игры невыгодно отклоняться в одностороннем порядке. Иными словами: «Если все оппоненты выбирают именно эту ситуацию, то и я ничего не выигрываю, отклоняясь от нее» — и так для каждого игрока. Как и равновесие Нэша, информационное равновесие может не существовать, либо быть неединственным. Обсуждение возникающих при этом сложностей и способов их решения выходит за рамки данной работы.
ся от равновесия в одностороннем порядке. Для рефлексивных игр это, вообще говоря, не так - если какой-либо агент наблюдает не тот результат, который ожидал увидеть, принимая решение, его представление о реальности может измениться. Поэтому представляется необходимым выделить те информационные равновесия, для которых свойство стабильности равновесия выполняется. Для этого дополним определение рефлексивной игры функциями наблюдения, отражающими ту информацию, которую каждый агент наблюдает в результате разыгрывания игры. Информационное равновесие будем называть стабильным, если каждый агент (как реальный, так и фантомный), наблюдает именно тот результат, на который рассчитывал. Если информационное равновесие стабильно, агенты не имеют оснований менять свои представления.
5. Информационное управление. Рефлексивные отображения.
Следующий элемент модели информационного управления
- зависимость между информированностью агентов и тем результатом, той полезностью, которую центр получает в результате игры.
Важным вспомогательным инструментом для исследования вопроса о том, чего может достичь центр в результате информационного управления, являются рефлексивные отображения. Областью значений рефлексивного отображения каждого агента является множество его всевозможных наилучших ответов при заданном состоянии природы и заданной обстановке12. Если начать с равновесия при единичной глубине структуры информированности (это параметрическое равновесие Нэша), можно при помощи рефлексивных отображений получать множество всевозможных равновесий при данной глубине структуры. Справедлив следующий факт: с увеличением глубины множест-
12 Обстановкой для данного агента называется набор действий остальных агентов.
во равновесий не сужается. Это означает, в свою очередь, что не сужаются возможности центра по управлению.
Особым случаем являются стационарные рефлексивные отображения, когда множество равновесий не расширяется с увеличением глубины структуры информированности. Оказывается, что если рефлексивные отображения стационарны, то при осуществлении информационного управления увеличение ранга рефлексии свыше первого не приводит к появлению новых информационных равновесий.
6. Информационные воздействия
Следующий элемент модели информационного управления
- информационное управляющее воздействие. Вопрос состоит в следующем: как формируется информационная структура игры в зависимости от тех или иных информационных воздействий центра. Здесь необходимо признать, что сколько-нибудь исчерпывающий ответ на этот вопрос, по-видимому, невозможно получить, оперируя исключительно математическими (и, в частности, теоретико-игровыми) моделями. Это обусловлено, в первую очередь, тем, что процесс усвоения человеком той или иной информации в очень большой степени обусловлен факторами социально-психологического порядка. Тем не менее, можно выделить и формализовать некоторые виды информационных воздействий.
Первым, наиболее простым видом управляющего воздействия является однородное информационное регулирование -центр сообщает агентам значение неопределенного параметра. Данное значение становится общим знанием среди агентов.
Следующий вид воздействия - неоднородное информационное регулирование. Каждому агенту сообщается значение неопределенного параметра, однако, каждому - свое. Для каждого агента данное значение субъективно становится общим знанием.
Следующий вид воздействия - рефлексивное управление. Каждому агенту сообщается значение неопределенного параметра и представления других агентов. В результате формирует-
ся более сложная структура информированности, вообще говоря
- глубины 3.
Более тонким видом информационного воздействия является активный прогноз. Агентам сообщается некая величина, зависящая от состояния природы и действий агентов (например, суммарное действие агентов). Центр как бы сообщает агентам: «Если вы будете действовать рационально, то есть выберете равновесные действия, то результат будет таким, как я прогнозирую». Далее каждый агент на основании прогноза может «восстановить» информацию о состоянии природы и использовать эту информацию (как и при информационном регулировании) при вычислении равновесных действий (в том числе и собственного действия). Классический пример активного прогноза: эксперт по фондовому рынку дает прогноз: «цены на акции резко упадут». Услышав это, все держатели акций начинают спешно их продавать, и цены действительно резко падают.
7. Формирование структур информированности: простые сообщения
Пусть центр (начальник) может вызывать к себе на собрание любую группу агентов (подчиненных), т.е. любое подмножество множества агентов. На собрании он сообщает всем присутствующим значение неопределенного параметра, которое принимается на веру собравшимися агентами. Кроме собственных представлений формируются также рефлексивные представления агентов о том, что думают другие агенты, также бывшие на совещании - ведь каждый участник совещания видит, например, что его сосед осведомлен теперь о том, что третий участник думает о неопределенном параметре и т.д. Пусть, далее, центр может проводить любое конечное число раз, вызывая последовательно такие группы агентов, которые считает нужным. Сделаем предположение, что агенты, которые побывали на нескольких собраниях, верят последнему сообщению о значении неопределенного параметра и то же предполагают о других агентах. В рамках поставленной модели удалось найти ответы на вопросы о том, все ли возможные структуры инфор-
мированности может создать центр, используя данную процедуру простых сообщений, а если не все, то какие, как их можно описать, какие они имеют характеристические свойства (глубина, сложность и т.д.). Также удалось сформулировать легко проверяемое необходимое и достаточное условие того, что данная структура информированности может быть сформирована при помощи механизма простых сообщений.
8. Заключение
Введение структуры информированности и информационного равновесия позволяет при помощи единого математического аппарата описывать и анализировать разнообразные ситуации коллективного принятия решений агентами, обладающими различной информированностью, в том числе информированностью друг о друге. Рассмотрение взаимной информированности агентов дает возможность, во-первых (с нормативной точки зрения), расширить множество рациональных исходов их игры, что, в свою очередь, увеличивает эффективность управления. Во-вторых (с дескриптивной точки зрения), многие наблюдаемые на практике ситуации, которые не могут быть интерпретированы как «обычные» равновесия Нэша в условиях общего знания, являются информационным равновесием.
В заключение отметим, что перспективным представляется дальнейшее развитие формальных моделей информационного управления, в том числе исследование динамики формирования информационной структуры под воздействием последовательности целенаправленных сообщений.
Литература
1. АБРАМОВА H.A. Рефлексивный подход и проблема взаимопонимания / Человеческий фактор в управлении. М: КомКнига, 2006. С. 52-82.
2. БУРКОВ В.Н. Основы математической теории активных систем. М.: Наука, 1977.
3. БУРКОВ В.Н., ИРИКОВ В.А. Модели и методы управления организационными системами. М.: Наука, 1994.
4. БУРКОВ В.Н., НОВИКОВ Д.А. Теория активных систем: состояние и перспективы. М.: СИНТЕГ, 1999.
5. ГУБКО М.В., НОВИКОВ Д.А. Теория игр в управлении организационными системами. М.: СИНТЕГ, 2002.
6. ДАНИЛОВ В.И. Лекции по теории игр. М.: Российская экономическая школа, 2002.
7. НЕЙМАН Дж. фон, МОРГЕНШТЕРН О. Теория игр и экономическое поведение. М.: Наука, 1970.
8. НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Активный прогноз. М.: ИПУ РАН, 2002.
9. НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. М.: СИНТЕГ, 2003.
10. ОЛЕЙНИК А.Н. Институциональная экономика. М.: ИН-ФРА-М, 2000.
11. ПИНДАЙКР., РУБИНФЕЛБД Д. Микроэкономика. М.: Дело, 2001.
12. ЧХАРТИШВИЛИ А.Г. Равновесие Байеса-Нэша: точечные структуры информированности бесконечной глубины // АиТ. 2003. № 12. С. 105 -111.
13. ЧХАРТИШВИЛИ А.Г. Теоретико-игровые модели информационного управления. М.: ПМСОФТ, 2004.
14. AUMANN R.J. Agreeing to disagree И The Annals of Statistics. 1976. Vol. 4. № 6. P. 1236 - 1239.
15. LEWIS D. Convention: a philosophical study. Cambridge: Harvard University Press, 1969.
16. MAS-COLELL A., WHINSTON M.D., GREEN J.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995.
17. MYERSON R.B. Game theory: analysis of conflict. London: Harvard Univ. Press, 2001. - 4th printing.