Научная статья на тему 'Моделирование конфликтных ситуаций с несогласованными представлениями у агентов на основе игр на линейных когнитивных картах'

Моделирование конфликтных ситуаций с несогласованными представлениями у агентов на основе игр на линейных когнитивных картах Текст научной статьи по специальности «Математика»

CC BY
761
107
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ТЕОРИЯ ИГР / АНАЛИЗ СИТУАЦИЙ С ИСПОЛЬЗОВАНИЕМ КОГНИТИВНЫХ КАРТ / СЛАБОСТРУКТУРИРОВАННЫЕ СИТУАЦИИ / РАВНОВЕСИЕ НЭША / GAME THEORY / THE ANALYSIS OF SITUATIONS USING COGNITIVE MAPS / ILL-STRUCTURED SITUATIONS / NASH EQUILIBRIUM

Аннотация научной статьи по математике, автор научной работы — Куливец Сергей Геннадьевич

Рассмотрены две теоретико-игровых модели конфликтов между агентами в слабоструктурированной ситуации. В качестве представления знаний агентов о ситуации используются линейные когнитивные карты. Когнитивные карты у различных агентов могут отличаться.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Моделирование конфликтных ситуаций с несогласованными представлениями у агентов на основе игр на линейных когнитивных картах»

£1—

УДК 519.833

МОДЕЛИРОВАНИЕ КОНФЛИКТНЫХ СИТУАЦИЙ С НЕСОГЛАСОВАННЫМИ ПРЕДСТАВЛЕНИЯМИ У АГЕНТОВ НА ОСНОВЕ ИГР НА ЛИНЕЙНЫХ КОГНИТИВНЫХ КАРТАХ

С.Г. Куливец

Рассмотрены две теоретико-игровых модели конфликтов между агентами в слабоструктурированной ситуации. В качестве представления знаний агентов о ситуации используются линейные когнитивные карты. Когнитивные карты у различных агентов могут отличаться.

Ключевые слова: теория игр, анализ ситуаций с использованием когнитивных карт, слабоструктурированные ситуации, равновесие Нэша.

ВВЕДЕНИЕ

В некоторых задачах комплексного управления в сферах, связанных с жизнью общества (в социально-экономической, политической и др.), объект управления оказывается слабо структурированным. Понятие слабой структурированности подробно рассматривается в работе [1]. Одно из его свойств заключается в следующем: ситуация слабоструктурированная, если ее основные параметры носят качественный, а не количественный характер, и их значения представляют собой субъективные оценки экспертов. Для решения задач управления слабоструктурированными ситуациями пользуются когнитивными картами. Когнитивная карта — это одна из возможных моделей представления знаний эксперта (или группы экспертов) о ситуации, описанная в виде взвешенного ориентированного графа. Вершины когнитивной карты соответствуют факторам, в терминах которых описывается ситуация. Фактор можно трактовать как переменную, например «Обороноспособность государства», которая может принимать различные значения, такие как «высокая», «низкая» и т. п. Взвешенная дуга трактуется как непосредственное причинно-следственное влияние одного фактора на другой.

Задачи анализа ситуаций на основе когнитивных карт можно разделить на два типа: статические и динамические [2]. Статический анализ — это анализ текущей ситуации, заключающийся в вы-

делении и сопоставлении непосредственных и опосредованных причинно-следственных путей влияния одних факторов на другие. Динамический анализ — это генерация и анализ возможных сценариев развития ситуации во времени. Далее мы будем рассматривать только задачу динамического анализа когнитивной карты. В работах [3, 4] подробно рассматриваются задачи, связанные с динамическим анализом когнитивных карт. Базовой моделью при рассмотрении этих задач служит модель импульсных процессов, предложенная в книге [5]. В работе [3] описываются решения обратной задачи для линейных моделей при задании фиксированной и нефиксированной целей управления с ограниченными ресурсами. Под фиксированной целью управления понимается задание численных значений, соответствующих лингвистическим переменным, определяющих требуемые состояния целевых факторов. Под нефиксированной целью управления понимается обеспечение желательных направлений изменения всех целевых факторов. Поиск решения задач управления для линейных моделей в общем случае осуществляется с помощью различных оптимизационных методов. По-видимому, первой работой, в которой было приведено общее описание теоретико-игровой модели взаимодействия нескольких агентов в динамической системе, представленной в виде когнитивной карты ситуации, была работа [6]. В ней были перечислены основания для классификации теоретико-игровых моделей конфликта на когнитивной карте и

Рис. 1. Представления агентов о ситуации, формализованные в виде когнитивных карт

рассмотрена одна игра в нормальной форме на линейной когнитивной карте. Описание этой игры, в частности, послужило прямым прообразом для модели, рассмотренной в § 3 настоящей работы.

В настоящей статье рассматривается ситуация взаимодействия нескольких агентов, каждый из которых обладает в общем случае собственной когнитивной картой (рис. 1). В отличие от модели, рассмотренной в работе [6], не только цели агентов могут не совпадать, но и их представления о ситуации могут быть различны.

В этом случае агенты могут по-разному предвидеть результаты одного и того же совместного действия. Это порождает определенную специфику их взаимодействия. В частности, в игре двух агентов с одним общим целевым фактором и с разными желаемыми значениями для него становится возможным такое совместное воздействие агентов, что каждый из агентов в своих представлениях полностью достигает своей цели. Иначе говоря, несогласованные представления могут в некоторых случаях компенсировать существенное отличие в целевых установках и послужить причиной к полному согласию там, где его не могло бы быть в случае согласованных представлений.

1. УПРАВЛЕНИЕ СИТУАЦИЕЙ В МОДЕЛИ ЛИНЕЙНОЙ КОГНИТИВНОЙ КАРТЫ

Под линейной когнитивной картой понимается взвешенный орграф, вершины и дуги которого удовлетворяют описанным далее условиям, и задано правило изменения значений вершин (см. далее). Каждая вершина этого орграфа представляет фактор из предметной области. Множество всех

факторов обозначим M = {І, ..., m}. Ориентированные дуги представляют причинно-следственные связи между факторами в рассматриваемой предметной области. Фактор-причина — это фактор, из которого выходит дуга, а фактор-следствие — это фактор, в который она входит. Далее, под матрицей смежности орграфа W будем понимать матрицу, элементы которой w.. є R соответствуют весам

J.

дуг, задающих силу и вид причинно-следственных связей. Абсолютное значение веса дуги |w..\ задает

J.

силу причинно-следственной связи j-го фактора-причины на i-й фактор-следствие. Знак веса дуги задает вид связи: если w.. > 0, то причинно-след-

Ji

ственная связь j-го фактора на i-й фактор положительная, если w. < 0, то причинно-следственная

J.

связь отрицательная [І].

Пусть время дискретно и начальному состоянию системы соответствует нулевой момент времени. Автономный импульсный процесс во взвешенном орграфе определяется по правилу (І) с вектором начальных значений факторов x(0) = (x1(0),

x2(0), ..., xm(0)), x(0) є Rm, и векторомp(0) = (p1(0), p2(0), ..., pm(0)), p(0) є Rm, задающим внешний импульс, вводимый в каждую вершину в нулевой момент времени [5].

x.(t + І) = x.(t) + p.(t),

где p. (t) =

p, і 0),

t = 0

I w]p]іt- І), t = І, 2, 3,

J Є M

(І)

где w■^ — элементы матрицы смежности W орграфа.

)7

Зафиксируем дискретный момент времени Т > 0. Вектор значений всех факторов х(Т) определяется из выражения

х(Т) = х(0) + р(0) + р(1) +... + р(Т - 1) =

= х(0) + р(0) + р(0^ +... + р(0^т х.

Если вынести за скобки общий множитель р(0), то получим

х(Т) = х(0) + р(0)(Е + W +...+ WT - х) =

= х(0) + р(0)та

где Е — единичная матрица. Матрицу т0 = Е +

т_і

+ W + ... + W будем называть матрицей достижимости воздействий к моменту времени Т для матрицы смежности W. Тогда сумма последовательных приращений для фактора х. представима в виде

I p/o = I тqkjPk(00),

t = 0 к Є м

(2)

где т — элементы матрицы тО. Рассмотрим задачу управления слабоструктурированной ситуацией в модели линейной когнитивной карты. Под управляющими воздействиями будем понимать внешние импульсы, вводимые в каждую вершину в начальный момент времени р(0); причем р.(0) = 0, если на у'-ю вершину воздействие не оказывается. Под результатом управления понимается совокупность значений всех факторов в момент времени Т:

т

х.(Т) = х.'(0) + Xр/?), У є М. (3)

ґ = 0

Определение цели управления задается условиями, налагаемыми на результат управления

х(Т) = (хДТ), х2(Т), ..., хт(Т)), х(Т) є Вт.

2. ОПИСАНИЕ ТЕОРЕТИКО-ИГРОВОЙ МОДЕЛИ КОНФЛИКТА

Рассмотрим задачу управления слабоструктурированной ситуацией, в которой управляющие воздействия в нулевой момент времени осуществляют сразу несколько агентов. Выбор управляющего воздействия агентом определяется правилом индивидуального рационального выбора [7]. При таком управлении возникает конфликтная ситуация или игра между агентами, т. е. взаимодействие агентов, в котором полезность каждого агента зависит как от его собственного действия (стратегии), так и от действий других агентов. Обозначим множество всех агентов через N = {1, ..., и]. Каждый из агентов

I е N формально может быть представлен тройкой параметров <Бр /,, С.>:

— возможностями по оказанию управляющего воздействия на ситуацию, которые задаются множеством стратегий Б;

— целью управления, которая описывается в виде функции полезности для агента

— знаниями агента об управляемой ситуации, которые задаются в виде линейной когнитивной карты С..

Рассмотрим каждый из параметров более подробно. Будем считать, что линейные когнитивные карты всех агентов С1, С2, ..., Сп имеют одинаково упорядоченное множество факторов М = {1, ..., т], но могут отличаться причинно-следственными связями между факторами. Таким образом, когнитивные карты разных агентов имеют в общем виде различные матрицы смежности орграфов Ж(1), Ж(2), ..., Ж(п). Однако вполне возможно, что у некоторых (в частном случае — у всех) агентов

матрицы смежности могут совпадать W(i) = W(j). Будем считать, что дискретное время в моделях когнитивных карт у всех агентов протекает одинаково. Начальный момент времени фиксирован для всех и равен 0. Всем агентам известен вектор начальных значений факторов x(0) є Rm.

Агент с номером i є N располагает непустым подмножеством факторов Mi є M, доступных ему для управляющего воздействия. Будем называть М. множеством управляемых факторов i-го агента. Для любых двух агентов i, j є N: M. П M. = 0, и

i J

Uk(sNMk с M. Число факторов в множестве М. будем обозначать mi.

В векторе совместных управляющих воздействий p(0) = (p1(0), p2(0), ..., pm(0)) отражается воздействие каждого из агентов. Стратегией i-го агента si будем считать вектор, состоящий из упорядоченных компонентов вектора p(0) с номерами из множества {^2, ..., km.} = Mt: s. = (ph (0), p^ (0),

..., pk ^(0)). Каждый агент воздействует на ситуацию, задавая значения лишь для «своих» компонентов вектора p(0). Остальные компоненты вектора p(0), на которые не воздействует ни один из агентов, равны нулю: (Vj є M\Uk(ENMk), pJ(0) = 0.

Воздействие требует затрат определенного количества ресурсов, которые, как правило, ограничены. Введем простейшие ограничения на управляющие воздействия по каждому фактору в виде отрезка допустимых значений: (Vj є U^NMk)

min max min max

PJ(0) є [pj , pj ], где pj , pj є R. Тогда мно-

жество стратегий i-го агента S. можно представить как декартово произведение mi отрезков

min max min max min max

[Pk, , Pk, ] х [Pk2 , P*2 ] х ... х [Pkmt , Pkmi ]. Фактически множество стратегий i-го агента S. является m.-мерным прямоугольным параллелепипедом, однако далее для краткости будем называть его m-мерным гиперкубом, а множество всех возможных стратегий агентов S1 х ... х Sn — просто гиперкубом. Будем рассматривать {s,.},. є n как вектор стратегий всех агентов (s1, s2, ..., sn) є S1 х ... х Sn.

Для каждого агента определим на множестве результатов управления функцию полезности f.(x^T), x2(T), ..., xm(T)). Цель управления i-го агента заключается в максимизации значения функции f Рассмотрим по отдельности два случая, для которых будут построены функции полезности.

І. Агенту i важно неограниченное увеличение (либо уменьшение) значения фактора х.. Тогда в

случае увеличения значения фактора необходимо максимизировать выражение (х.(Т) — х.(0)), а в случае уменьшения значения фактора необходимо максимизировать выражение — (х.(Т) — х.(0)).

2. Агенту / важно неограниченное приближение значения фактора х. к некоторому выгодному

для него значению х*. Тогда будем считать, что для него желательно максимизировать выражение -(х.(Т) - х * )2.

Отметим, что выражения в п. 1 и 2 записаны так, чтобы максимум их значений соответствовал цели агента. В случае, когда агенту «небезразличны» значения более одного фактора, можно записать свертку по вышеописанным выражениям для таких факторов с соответствующими коэффициентами, каждый из которых интерпретируется как «доля важности» ограничений на значение соответствующего фактора. Для обоих случаев запишем соответствующий вид функции полезности для произвольного /-го агента.

Функция полезности для случая 1 имеет вид:

ДхДТ), х2(Т), ..., хт{Т)) =

= X уда - х/О^

У є м

(4)

где |у..| — «доля важности» значения у-го фактора среди остальных факторов для /-го агента, у..є [-1, 1], сумма величин | у.. | равна единице для фиксированного / є N. Знак коэффициента у.. отражает направление изменения значения фактора, выгодное для агента. Если у.. > 0, то /-й агент стремится неограниченно увеличить значение у-го фактора. Если у.. < 0, то /-й агент стремится неограниченно уменьшить значение у-го фактора. Если у. = 0, то /-му агенту безразлично значение у-го фактора.

Функция полезности для второго случая будет иметь вид:

ДхДТ), х2(Т), ..., хт(Т)) =

= - X т^(х.(Т) - х*. )2,

У є М

(5)

где у.. — «доля важности» значения у-го фактора для /-го агента, у.. є [0, 1], сумма величин у.. равна

У У

единице для фиксированного / є N.

Фактор, в выражении для которого в записи функции полезности для /-го агента в виде (4) или (5) коэффициент у. ^ 0, будем называть целевым фактором для /-го агента.

Определив все параметры игры, запишем ее в нормальной форме:

Перечислим в явном виде допущения, из которых мы будем исходить при рассмотрении игры (6):

1) множества факторов в когнитивных картах всех агентов совпадают;

2) множества управляемых факторов для всех агентов заданы и не пересекаются;

3) агенты знают когнитивные карты, функции полезности и множества стратегий друг друга;

4) каждый агент верит в адекватность лишь собственной когнитивной карты;

5) п. 1—4 являются общим знанием среди агентов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Далее мы будем рассматривать две игры, в каждой из которых функции полезности одновременно всех агентов описываются либо в виде (4), либо в виде (5). Для краткости, пользуясь терминологией из работы [3], будем их называть моделью с нефиксированной целью управления и моделью с фиксированной целью управления соответственно. Решения обеих игр будем искать в соответствии с концепцией равновесия Нэша в чистых стратегиях [7]. В зависимости от игры будут определяться равновесие в доминантных стратегиях в случае модели с нефиксированной целью управления, и равновесие Нэша в чистых стратегиях в модели с фиксированной целью управления.

3. ПОИСК РЕШЕНИЯ ДЛЯ МОДЕЛИ С НЕФИКСИРОВАННОЙ ЦЕЛЬЮ УПРАВЛЕНИЯ

Рассмотрим игру (6), в которой все функции полезности агентов записаны в виде (4). Отметим, что подобная задача решена в статье [6] и переформулирована в используемых нами обозначениях в работе [8]. В этих работах рассмотрен случай, когда у всех агентов когнитивные карты совпадают или, иначе, они все играют на одной когнитивной карте. В настоящей статье постановка задачи другая: когнитивные карты агентов различны. Однако рассуждения, изложенные в работах [6, 8], могут быть успешно повторены и для нашей постановки.

Выберем произвольного агента / е N, и далее будем рассматривать ситуацию с его точки зрения. Преобразуем его функцию полезности /(х1(Т), х2(Т), ..., хт(Т)) к виду, в котором явно отражена зависимость его выигрыша от действий всех агентов gj(s1, 52,..., 5п). Для этого в выражение (4) вместо х.(Т) подставим правую часть выражения (3). Получим:

X Уу(х/т) - х/0)) = X У/х/0) + Xр/0

У є м У є М ґ = 0

гс = ^ є N, є N є ж)

(6)

Далее, используя выражение (2), получаем

І т

У є

м

X ^ X рУ({)

Ч = 0

X Ъу і X т^к(0 )) =

У є М к є М

X X угк? рк(0)

У є

Мк є М

X

к є М

X "^ут#ку)рк(0)

У є М

Заметим, что при подстановке выражения (2) использовались элементы гЯку(г) матрицы достижимости воздействий к моменту времени Т Г0(г) для

матрицы смежности орграфа Цг), т. е. знания /-го агента о ситуации. Это обосновано четвертым допущением, сделанным в предыдущем параграфе, о том, что каждый агент верит в адекватность лить собственной когнитивной карты.

Обозначим та(к = ( X У .утяку) . Тогда функцию

У е М

полезности /-го агента можно записать в виде, называемом целевой функцией /-го агента:

X т аг'к рк(0)

кє М

= X Рк(0) + X Рк(0). (7)

к е М(. к е М\ М(.

Представление целевой функции gi в виде (7) позволяет аддитивно выделить зависимость ее значения от выбранной /-м агентом стратегии. Согласно лемме из работы [7] у агента / есть доминантная стратегия, следовательно, решением в модели с нефиксированной целью управления будет совокупность доминантных стратегий агентов 5* (равновесие в доминантных стратегиях). Доминантные стратегии агентов вычисляются по формуле

р*(0) =

8ІБП( та}})< 0,

0)

п ’

тах

Р~га;у ) > 0, У/, / е М, О, для определенности, иначе.

4. ПОИСК РЕШЕНИЯ ДЛЯ МОДЕЛИ С ФИКСИРОВАННОЙ ЦЕЛЬЮ УПРАВЛЕНИЯ

Рассмотрим игру (6), в которой все функции полезности агентов записаны в виде (5). Вновь выберем произвольного агента / е N, и далее будем рассматривать ситуацию с его точки зрения. Преобразуем его функцию полезности /(х1(Т), х2(Т), ... , хт(Т)) к виду, в котором явно отражена зависимость его выигрыша от действий всех аген-

тов gi(sl, 52, ..., 5п). Для этого в выражение (5) вместо ху(Т) подставим правые части выражений (3) и (2):

X Уу[-(х/Т) - ху)2] =

У е М

= - X у у(*у(°) + X г яку Рк(°) - х у )2.

у е М к е М

Заметим, что при подстановке выражения (2), как и в предыдущем разделе, при записи функции

( )

использовались элементы гяку матрицы достижимости воздействий к моменту времени Т г0( г) для

матрицы смежности орграфа Цг). Как и при записи функции (7), это обосновано четвертым допущением о том, что каждый агент верит в адекватность лишь собственной карты. Таким образом, из функции полезности (5) получаем целевую функцию

Ь = - X у Су + X гС Р,(0)

у е М к е М

= - X Уу(су + гя!у + гЯу 5-г )2. (8)

у е М

Здесь Су = ху(0) - ху; гЯу и ТЯу — векторы, составленные из соответствующих коэффициентов

(г)

г Яку в первой и второй суммах соответственно; и 5-г — транспонированные вектор стратегий и вектор обстановки игры соответственно для /-го агента. Функция (8) строго вогнута по переменной-

стратегии 5г: Уа е (0, 1) ьг(а5* + (1 - а) 5**, 5-.) > > аьг( 5*, 5-г) + (1 - а)ьг( 5**, 5-г). Кроме того, функция (8) непрерывна по всем своим переменным, как суперпозиция непрерывных функций. Согласно соответствующей теореме из работы [7] для модели с фиксированной целью управления существует равновесие Нэша в чистых стратегиях.

Отметим, что модель с фиксированной целью управления формально похожа на олигополию Курно [9]. Далее для поиска решения в модели с фиксированной целью управления, аналогично решению задачи олигополии Курно, построим систему уравнений для поиска наилучшего ответа

дЬг(5*, 5*.) _

каждого из агентов:

= 0, V/ є М, V/ є N. 5р/(0) , .,

Запишем эту систему уравнений в явном виде после соответствующего преобразования:

X І X І'у-т?У’ тії >і(0> = - X Їу-М

к є М у є М

У є М

чутчу CІУ,

V/ є М,, V/ є N.

()

тіп

Как отмечалось ранее, в выражении (9) Рк(0) = 0, У к <£. и. е мМ{, т. е. по неуправляемым факторам управляющие воздействия отсутствуют. Подобно решению задачи олигополии Курно [9] можно утверждать, что если решение системы уравнений (9) существует и принадлежит гиперкубу 51 х ... х Sn, то оно является равновесием Нэша в чистых стратегиях для модели с фиксированной целью управления. Также можно показать, что если точка равновесия Нэша в чистых стратегиях для модели с фиксированной целью управления принадлежит внутренности гиперкуба 51 х ... х 5п, то она является решением системы уравнений (9).

Из этих двух утверждений и из существования равновесия Нэша в чистых стратегиях для модели с фиксированной целью управления следует справедливость того, что если ни одно из решений системы уравнений (9) не принадлежит гиперкубу 51 х ... х Sn, то точка равновесия Нэша в чистых стратегиях для модели с фиксированной целью управления лежит на границе гиперкуба 51 х ... х 5

5. ПРИМЕР

Рассмотрим пример взаимодействия двух агентов, когнитивные карты которых содержат три фактора А, Б и С (рис. 2).

Начальное значение каждого фактора указано в вершинах графа: А = 1, Б = —7, С = 11. Пусть А — целевой фактор для обоих агентов, Б — управляемый фактор первого агента, С — управляемый фактор второго агента. За момент времени для регистрации результата управления примем Т = 3. Управляющие воздействия на фактор Б ограничены отрезком [—10, 10], а на фактор С — отрезком [—15, 15]. Эти отрезки являются множеством стратегий первого и второго агентов соответственно: ^ = [—10, 10], S2 = [—15, 15]. Рассмотрим случай с нефиксированными целями управления, когда цели агентов противоположны. Пусть целью пер-

Рис. 2. Когнитивные карты двух агентов

вого агента будет неограниченное уменьшение значения фактора А, а целью второго — его неограниченное увеличение. В этом случае целевые функции агентов примут вид: /1 = —(хА(3) - 1) = 0,04рв(0) - 0,02рс(0), /2 = (хА(3) — 1) = 0,08рв(0) — 0,35 рс(0). Очевидно, решением игры будет равновесие в доминантных стратегиях (р* (0), р** (0)) = (10, —15). Это решение — единственное оптимальное по Парето в игре, так как доставляет максимальный возможный выигрыш и первому, и второму агенту одновременно, и другого такого набора стратегий нет. Этот пример иллюстрирует возможность того, что агенты с противоположными исходными целями могут образовать коалицию «по действиям» из-за несогласованности представлений. Можно видеть, что, если в данном примере цели агентов были бы одинаковы, например, оба агента стремились бы к неограниченному уменьшению значения фактора А, то действия одного агента мешали бы другому в достижении поставленной цели, и наоборот. Отмеченный факт может служить иллюстрацией того, что агенты с одинаковыми целями, но разными представлениями о ситуации, могут вступить в конфронтацию. И наоборот — агенты с противоположными целями и различными представлениями о ситуации могут действовать совместно.

Рассмотрим тот же пример взаимодействия двух агентов в случае с фиксированными целями управления. Пусть первому агенту важно неограниченное приближение значения фактора А к 0, а второму агенту — к 2. В этом случае целевые функции агентов примут

вид: = -(Ха(3) — 0)2 = —(1 — 0,04рв(0) + 0,02р<(0))\

/2 = -(Ха(3) — 2)2 = —(0,08рв(0) — 0,35рс(0) — 1)2. Решением системы уравнений (9) для данной задачи будет вектор (26,61; 3,23), который, очевидно, не принадлежит множеству всех возможных наборов стратегий агентов ^ х S2. В этом случае единственным равновесием Нэша будет точка на границе множества ^ х S2: (10; —0,57). Значения целевых функций у агентов: /1 (10; —0,57) = —0,35, /2 (10; —0,57) = 0. Однако первый агент может улучшить свой выигрыш, если сообщит заведомо ложную информацию о своей когнитивной карте второму агенту, искажая силу влияния В ^ С с +1,2 на +0,5, и С ^ В с +0,9 на +0,3. Отметим, что этот пример выпадает из наших предположений, сделанных в § 2 о том, что все агенты знают истинные когнитивные карты друг друга.

В этом случае равновесие Нэша для второго агента смещается в точку (—6,71; —4,39). Этим может воспользоваться первый агент, сохраняя свою истинную наилучшую стратегию. Построим граф рефлексивной игры (рис. 3) и рассчитаем информационное равновесие [10].

Вершины графа соответствуют реальным (1 и 2) и фантомным (21) агентам, т. е. попарно нетождественным структурам информированности. Дуги графа отражают взаимную информированность агентов: направление стрелки от одного агента к другому обозначает, что второй агент адекватно информирован о первом. Решением будет информационное равновесие (10; —4,39)

Рис. 3. Граф рефлексивной игры

[10], значения целевых функций агентов будут следующими: /1 (10; —4,39) = —0,26; /2 (10; —4,39) = —1,79. При сравнении выигрышей первого агента в двух случаях видно, что он смог добиться его увеличения от —0,35 до —0,26 путем дезинформации второго агента.

ЗАКЛЮЧЕНИЕ

Рассмотрены модели конфликта интересов, в которых агенты представлены различными описаниями собственных знаний о ситуации в целом, формализованными в виде линейных когнитивных карт. Получены решения для обеих моделей в рамках концепции решения равновесия Нэша в чистых стратегиях. Эти результаты опираются на сделанные в § 2 допущения. Еще раз отметим два важных момента.

• Формальному описанию подвергается внутреннее видение агентами законов развития ситуации во времени. В этом случае агенты по-разному предвидят результаты одного и того же действия, но каждый агент верит в адекватность лишь собственного результата. Как следствие, в приведенных моделях выигрышем агента считается величина, рассчитанная, исходя из представлений лишь этого агента о своем выигрыше: агент, принимая решение, понимает не только то, что у остальных агентов другие цели, но и то, что они видят мир иначе. Такая постановка приводит к целесообразности рассмотрения рефлексивных игр [9, 10] на когнитивных картах.

• В рассмотренных моделях знания агентов о ситуации представлены разными когнитивными картами и отсутствует какая-либо информация о том, какая из когнитивных карт адекватно описывает ситуацию, если такой картой обладает кто-либо из агентов. Иначе говоря, решаемая нами задача прогноза действий агентов не зависит от того, кто из них (а, может быть, и никто) адекватно представляет ситуацию в целом. В рамках примеров (см. § 5) были продемонстрированы некоторые эффекты, возникающие при моделировании взаимодействий агентов с несогласованными представлениями. Например, то, что агенты с противоположными исходными целями и

различной информированностью могут образовать коалицию «по действиям». В частности, в первом примере именно различие когнитивных карт у агентов послужило причиной максимизации их общего благосостояния. Также представлен случай, когда одинаковые цели и разные представления о ситуации приводят к конфронтации участников. В примере с фиксированными целями показана возможность увеличения выигрыша агента путем дезинформации им своих оппонентов относительно собственной когнитивной карты. Все это позволяет ставить и решать задачи информационного управления на когнитивных картах, причем управление может осуществляться как самими агентами, так и внешними по отношению к ним сторонами для достижения собственных целей.

ЛИТЕРАТУРА

1. Кузнецов О.П., Кулинич А.А., Марковский А.В. Анализ влияний при управлении слабоструктурированными ситуациями на основе когнитивных карт // Человеческий фактор в управлении. — М.: КомКнига, 2006. — С. 313—344.

2. Кузнецов О.П. Интеллектуализация поддержки управляющих решений и создание интеллектуальных систем // Проблемы управления. — 2009. — № 3.1. — С. 64—72.

3. Максимов В.И., Корноушенко Е.К. Аналитические основы применения когнитивного подхода при решении слабоструктурированных задач // Труды ИПУ РАН. — М., 1999. — Т. II. — С. 95—109.

4. Максимов В.И. Структурно-целевой анализ развития социально-экономических ситуаций // Проблемы управления. — 2005. — № 3. — С. 30—38.

5. Робертс Ф. Дискретные математические модели с приложениями к социальным, биологическим и экологическим задачам. — М.: Наука, 1986. — 325 с.

6. Новиков Д.А. «Когнитивные игры»: линейная импульсная модель // Проблемы управления. — 2008. — № 3 — С. 14—22.

7. 7.Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. — М.: СИНТЕГ, 2005. — 138 с.

8. Куливец С.Г. Теоретико-игровые модели на линейных когнитивных картах // Сб. науч. тр. V междунар. науч.-техн. конф. «Интегрированные модели и мягкие вычисления в искусственном интеллекте». — М., 2009. — С. 379—386.

9. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. — М.: ЗАО «ПМСОФТ», 2004. — 227 с.

10. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. — М.: СИНТЕГ, 2003. — 160 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Статья представлена к публикации членом редколлегии

чл.-корр. РАНД.А. Новиковым.

Куливец Сергей Геннадьевич — аспирант, Институт проблем

управления им. В.А. Трапезникова РАН, г. Москва,

® (495) 334-76-39, И skulivec@yandex.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.