УДК 021.8 + 025.1 ББК 78.34
ТЕХНИКА ГРАФОДИНАМИЧЕСКОГО МОДЕЛИРОВАНИЯ БИНАРНЫХ ИГР НА ОСНОВЕ СЦЕНАРНЫХ СВЯЗОК
Юдицкий С. А.1
(Учреждение Российской академии наук Институт проблем управления РАН, Москва)
Предложена техника моделирования (описания) бинарных игр, базирующаяся на интеграции техники знаковых структур и техники сетей Петри. Введены понятия графа целедействий, линейного сценария поведения субъекта игры, бинарной сценарной связки. Техника моделирования проиллюстрирована на примере реальной политической бинарной игры.
Ключевые слова: бинарная игра, графодинамическое моделирование, граф целедействий, линейный сценарий субъекта игры, бинарная сценарная связка.
1. Введение
Одним из распространенных видов взаимодействий в системах различного назначения (социальных, экономических, политических, техногенных и т.д.) являются игры с двумя участниками - бинарные игры. Проведению игры, как правило, предшествует ее моделирование, в ходе которого исследуются возможные варианты развития ситуация в системе и формируется сценарий игры. Моделирование выполняется системным аналитиком, который играет за обоих участников, и либо выбирает вариант сценария, выгодный одному из них, либо завершает игру «вничью» с обоюдным выигрышем (проигрышем) участников.
1 Семен Абрамович Юдицкий, доктор технических наук, профессор, главный научный сотрудник (8 (916) 730-54-09, [email protected]).
Эффективность моделирования бинарных игр зависит от используемого формального аппарата - техники моделирования, которая должна сочетать наглядность с высокой информативностью. Примером такой техники могут служить когнитивные карты (знаковые графы) [5], аппарат рефлексивной алгебры [3], аппарат графодинамики, оперирующий переменными в виде графов и отношениями (функциями), определенными на графах [1]. С точки зрения наглядности и информативности наиболее эффективна, по нашему мнению, графодинамическая техника.
В рамках графодинамики бинарных игр отметим рассмотренный в [6] графический способ описания взаимного отношения участников (субъектов) игры и отношения субъектов к доминантным внешним факторам в виде так называемых знаковых структур (5-структур). В терминах s-структур в [6] промоделированы стандартные бинарные игры - позиционные дилеммы сотрудничества, доверия, сдерживания, искушения, угрозы, вины, изучавшиеся в теории драмы [10] - расширении теории игр.
В [7] предлагалось интегрировать технику s-структур и технику конечных автоматов: моделировать игру автоматом, состояниям которого сопоставлены s-структуры.
Данная работа, которая является развитием [7], посвящена совместному применению при моделировании бинарных игр техники s-структур и техники, определяемой триадным подходом [9] (последний ориентирован на моделирование взаимовлияния целей, действий и показателей в процессах развития дискретных систем на основе аппарата сетей Петри и их расширений [8]).
В работе введены новые графические формализмы:
• граф целедействий (ГЦД), интегрирующий два базовых компонента триадной модели;
• линейный сценарий поведения субъекта игры, формируемый по ГЦД;
• бинарная сценарная связка, моделирующая взаимодействие субъектов игры.
Описание формализмов дано в последующих разделах статьи. Изложение иллюстрируется примером бинарной игры,
ведущейся между властями и террористами при теракте. Группа террористов захватила заложников и в обмен за их освобождение требует выполнения своих условий. В противном случае угрожает казнить заложников. Субъекты бинарной игры -власти (В) и террористы (Т), доминантный фактор для властей -жизнь заложников (З), для террористов - выдвинутые ими условия (У).
Структура бинарной игры в терминах введенных формализмов дана на рис. 1.
Субъект 1 Субъект 2
Рис. 1. Структура бинарной игры
2. Графы целедействий
ГЦД представляет собой сеть Петри [2, 4] - двудольный ориентированный граф с двумя компонентами связности (подсетями), моделирующими соответственно процессы последовательно-параллельного выполнения действий субъектами игры и инициированного действиями достижения целей. Сеть должна быть «живой» (любое ее неконечное состояние, достижимое из
начального состояния, не является тупиковым) и «безопасной» (в любом достижимом состоянии в любой позиции содержится не более одного маркера). Методы проверки живости и безопасности сетей Петри достаточно полно освещены в литературе [2, 4, 8].
Позиция ГЦД (изображается кружком) соответствует либо действию, либо цели. Наличие маркера в позиции интерпретируется как выполнение действия и достижение цели. Переход ГЦД (изображается прямоугольником) моделирует скачкообразное изменение состояния сети: удаление маркеров из входных позиций перехода и внесение маркеров в его выходные позиции. Взаимодействие подсетей ГЦД изображается пунктирными стрелками.
Примеры ГЦД субъектов политической бинарной игры, спровоцированной захватом заложников, даны на рис. 2 и 3.
Рис 2. ГЦД субъекта 1 - властей
Цели власти:
с1 - сохранение жизни заложников;
с2 - наказание террористов;
с3 - устранение последствий теракта.
Действия власти:
а1 - подготовка к силовому освобождению заложников;
й?2 - переговоры с террористами;
й3 - достижение соглашения о мирном освобождении заложников;
^ - силовое освобождение заложников (штурм);
- арест террористов; ё6 - следствие и суд.
Рис. 3. ГЦД субъекта 2 - террористов
Цели террористов:
в\ - привлечение внимания к проблеме, в решении которой заинтересованы террористы (например, освобождение сообщников из тюрем, получение денежного выкупа и т.д.);
е2 - частичное решение проблемы, устраивающее террористов;
е3 - минимизация наказания;
е4 - политический эффект теракта.
Действия террористов:
Р\ - захват заложников;
р2 - предъявление требований к властям;
Р3 - мирное освобождение заложников;
р4 - ультиматум властям с угрозой уничтожения заложников;
р5 - сдача властям;
р6 - реализация угрозы заложникам;
р7 - вооруженное сопротивление при штурме.
Дадим некоторые пояснения к ГЦД на рис. 2. Действия властей начинаются с подготовки к штурму независимо от исхода переговоров (маркер в позиции ^). Начало переговоров отмечается перемещением маркера в позицию а?2 при срабатывании перехода ^. Позитивный исход переговоров моделируется переходом 12, который передает маркер в позицию ё3 и далее, при срабатывании а?4, маркеры вносятся в позицию действия й5 и целевую позицию с1. Переход 16 передает маркер в позицию ё6, а переход ^7 - в позицию с2. Неудача переговоров властей с террористами моделируется срабатыванием ^3, внесением маркера в ё4 и далее в й5, а?6, с2. Наличие маркеров в целевых позициях с1, с2 инициирует переход ?8, который срабатывает, если его выходная позиция с3 пуста (т.е. с3 = 0). Наличие двух стрелок «туда и обратно», соединяющих с1, с2 и ^8, говорит о том, что после срабатывания маркеры остаются в позициях с1, с2. Повторное срабатывание исключено, т.к. с3 = 1.
ГЦД на рис. 3 подобным образом моделирует возможные варианты поведения террористов.
3. Линейный сценарий поведения субъекта игры
Сценарий субъекта моделируется линейным графом, формируемым на основе ГЦД. Вершины сценарного графа соответствуют действиям (позициям), дуги - переходам сети Петри. Каждому действию сопоставляется 5-структура, выражаемая графом отношений: субъекта 1 к субъекту 2 и наоборот, обоих субъектов к доминантному внешнему фактору (факторам). Субъектам игры могут соответствовать как одинаковые, так и разные факторы. Отношение может быть нейтральным (отсутствие на графе отношений соответствующей дуги), позитивным (сплошная дуга) и негативным (пунктирная дуга).
Вершины сценарного графа условимся изображать в виде квадратов, внутрь которых помещать графы отношений, а стрелками, примыкающими к верхней стороне квадрата, пока-
зывать цели, достигнутые при выполнении действия. Определенный таким образом линейный сценарий поведения субъекта игры отображает реализуемую им последовательность действий, динамику отношений и динамику достижения целей в процессе реализации этой последовательности.
В рассматриваемом примере (рис. 2, 3) возможны два линейных сценария поведения обоих субъектов игры - жесткий и мягкий. Жесткие сценарии для властей и террористов приведены на рис. 4.
Сі
І.
С2, Сз
І.
З о В •«-- Т и З / В +±Т ^3 З в<,т І5 З tб З
В «Г-Т В ^-Т
й1 А?2 ^4 ^5 ^3
Сценарий поведения властей
е1 і
У В -«--Т 4і У В -<--Т 4з У 'О В .«--т 45 У В -«--Т 46 У
В 5Й-Т
Р1 Р2 Р4 Рб Р7
Сценарий поведения террористов
Рис. 4. Линейные сценарии субъектов игры
£-структуры, помещенные внутрь квадратов, отображают видение отношений соответствующим субъектом. При подготовке силового освобождения (действие власти исходят из доминанты спасения заложников и относятся к террористам как к врагам. Они учитывают также негативное отношение (озлобленность) террористов по отношению к ним и заложникам. На стадии переговоров (действие й2) власти и террористы вынуждены относиться друг к другу как к партнерам, для властей доминирует спасение заложников, террористы относятся к заложникам нейтрально. При силовом освобождении (действие
й4) субъекты, естественно, выступают как враги, спасение заложников доминантно, хотя их жизнь (достижение цели С;) не может быть полностью гарантирована. При аресте террористов, проведении следствия и суде (действия й5, имеют место только отношения между субъектами, отношение к заложникам нейтрально. В результате действия а?6 достигаются цели с2, с3.
В сценарии на рис. 4, каким он видится террористам, все действия, кроме конечного р7, характеризуются одинаковым отношением между субъектами и субъектов к доминантному фактору У (условия террористов). При сопротивлении во время штурма (действие р7) отношение к У нейтрально.
4. Бинарная сценарная связка
Бинарная сценарная связка позволяет совместно рассмотреть выбранные сценарии субъектов игры и установить между ними ограничительные отношения путем регламентации длительности действий. Например, из рис. 4 видно, что заложников необходимо освободить (действие прежде чем террористы успеют привести в исполнение свои угрозы (действие р7). Но террористы выдвигают ультиматум с определенной задержкой Т после начала переговоров, а приступают к исполнению угроз с задержкой т2 после предъявления ультиматума. Величина т; и Т2 определяется представлением террористов о степени успешности переговоров. Пусть т3 - минимальное время, необходимо властям для подготовки штурма.
Для того чтобы имело место Т + Т2 > т3 необходимо, помимо ускорения подготовки штурма - уменьшения Т3, увеличивать Т + т2 путем затягивания переговоров и создания у террористов впечатления об их успешности.
5. Заключение
В статье на понятийном уровне изложен подход к графодинамическому моделированию бинарных игр. В рамках подхода для каждого субъекта игры формируется граф целедействий, на основе которого выявляются все возможные линейные сценарии
поведения этого субъекта (предполагается, что граф целедейст-вий не содержит циклов и, следовательно, число сценариев ограничено). Далее отбираются все пары совместимых по смыслу сценариев субъектов, образующие сценарные связки. В нашем примере совместимы два жестких и два мягких сценария, но не совместимы жесткий с мягким. Для каждой связки анализируется развитие ситуации и, если это необходимо, вводятся ограничительные отношения.
Дальнейшее развитие подхода должно предусматривать, в частности, моделирование самоорганизации бинарной игры. Сценарная связка при этом формируется в процессе игры: очередной ход субъекта (переход на графе целедействий) выбирается из множества возможных и зависит от предыдущего хода (последовательности ходов) противника и от внешнего воздействия на систему. В модели самоорганизующейся бинарной игры переходы графа целедействий дополнительно помечаются («нагружаются») логическими и, возможно, вероятностными функциями.
Литература
1. АЙЗЕРМАН М.А, И ДР. Динамический подход к анализу структур, описываемых графами (основы графодинамики) // Автоматика и телемеханика, 1977, I. №7. С. 135-151, II. №9. С. 123-136.
2. КОТОВ В.Е. Сети Петри: - М.: Наука, 1984.
3. ЛЕФЕВР В.А., СМОЛЯН Г.Л. Алгебра конфликта: - М.: КомКнига, 2007.
4. ПИТЕРСОН ДЖ. Теория сетей Петри и моделирование систем: Пер. с англ. - М.: Мир, 1984.
5. РОБЕРТС Ф.С. Дискретные математические модели с применением к социальным, биологическим и экономическим задачам: Пер. с англ. - М.: Наука, 1986.
6. СВЕТЛОВ В.А. Управление конфликтом: - СПб.: Росток, 2003.
7. ЮДИЦКИЙ С.А. Графодинамическая автоматная модель разрешения конфликтов в организационных системах //
Управление большими системами. Выпуск 23, 2008. С. 126136.
8. ЮДИЦКИЙ С А., ВЛАДИСЛАВЛЕВ П.Н. Основы предпро-ектного анализа организационных систем: - М.: Финансы и статистика, 2005.
9. ЮДИЦКИЙ С.А., ВЛАДИСЛАВЛЕВ П.Н., ТОЧ Д.С. Три-адный подход к моделированию систем сетецентрического управления // Управление большими системами. Выпуск 28, 2010. С. 24-39.
10. HOWARD N. Drama Theory and its relation to Game Theory // Group Decision and Negotiation, 1994, Vol. 32. P. 187-206, 207-253.
A TECHNIQUE FOR GRAPH-DYNAMIC MODELING OF BINARY GAMES BASED ON SCENARIO BINDINGS
Semen Yuditskiy, Institute of Control Sciences of RAS, Moscow, Doctor of Science, professor (Moscow, Profsoyuznaya st., б5, tel. (495) 339-59-10).
Abstract: A technique for binary games modeling (describing) is suggested. It is based on integration of signed graPhs and Petri nets techniques. The notions of “aimed-action graPh”, “linear scenario of behavior of game Party”, “binary scenario binding” are introduced. The modeling technique is illustrated on the examPle of a real Politic binary game.
Keywords: binary game, graph-dynamic modeling, aimed-action graph, linear scenario of game party, binary scenario binding.
Статья представлена к публикации членом редакционной коллегии М. В. Губко