Научная статья на тему 'Модель информационного управления на основе игры на линейной когнитивной карте'

Модель информационного управления на основе игры на линейной когнитивной карте Текст научной статьи по специальности «Математика»

CC BY
307
80
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННОЕ УПРАВЛЕНИЕ / ЛИНЕЙНЫЕ КОГНИТИВНЫЕ КАРТЫ / ТЕОРИЯ ИГР / ИГРА С НЕСОГЛАСОВАННЫМИ ПРЕДСТАВЛЕНИЯМИ / INFORMATION CONTROL / LINEAR COGNITIVE MAPS / GAME THEORY / GAME WITH INCONSISTENT BELIEFS

Аннотация научной статьи по математике, автор научной работы — Куливец Сергей Геннадьевич, Коргин Николай Андреевич

Рассмотрена модель информационного управления одним агентом другими в игре с несогласованными представлениями с использованием линейных когнитивных карт. Сформулированы условия возможности информационного управления, приводится условие его неактуальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model of information control for game on linear cognitive map

The model of information control was studied for a game with agents’ inconsistent beliefs presented by linear cognitive maps. The conditions are derived for the possibility of information control, and also for information control irrelevancy.

Текст научной работы на тему «Модель информационного управления на основе игры на линейной когнитивной карте»

УДК 519.8 ББК 22.18

МОДЕЛЬ ИНФОРМАЦИОННОГО УПРАВЛЕНИЯ НА ОСНОВЕ ИГРЫ НА ЛИНЕЙНОЙ КОГНИТИВНОЙ

КАРТЕ

Куливец С. Г.1, Коргин Н. А.2

(Учреждение Российской академии наук Институт проблем управления РАН, Москва)

Рассмотрена модель информационного управления одним агентом другими в игре с несогласованными представлениями с использованием линейных когнитивных карт. Сформулированы условия возможности информационного управления, приводится условие его неактуальности.

Ключевые слова: информационное управление, линейные когнитивные карты, теория игр, игра с несогласованными представлениями.

1. Введение

В целях совершенствования процесса принятия решений, впервые в [9], были предложены когнитивные карты. Когнитивная карта - математическая модель системы представлений лица принимающего решение (ЛПР) относительно проблемной ситуации, заданная в виде взвешенного орграфа. Вершины когнитивной карты соответствуют факторам, в терминах которых описывается ситуация. Взвешенные дуги трактуются как непосредственные причинно-следственные влияния факторов друг на друга. Одним из применений когнитивных карт является использование их для анализа возможных сценариев развития ситуации в зависимости от осуществляемого управления (в виде

1 Сергей Геннадьевич Куливец, аспирант (skulivec@ya.ru).

2 Николай Андреевич Коргин, кандидат технических наук (nkorgin@ipu. ги).

воздействия на некоторые факторы) [3]. Такие модели используются в слабо структурированных системах (социальноэкономических и политических), в которых основные параметры носят качественный характер, и их значения являются субъективными оценками экспертов [1]. В этих системах часто сталкиваются с тем, что управление осуществляют сразу несколько сторон.

В случае взаимодействия нескольких ЛПР (агентов) в слабо структурированной ситуации, в которой полезность каждого зависит как от его собственных действий, так и от действий других, можно рассматривать игру на когнитивной карте. В такой игре когнитивная карта будет представлять модель слабо структурированного объекта управления и однозначно описывать динамику ситуации при известных начальных значениях всех факторов и фиксированном управлении. Использование когнитивной карты в игре позволяет более детально и наглядно моделировать среду, в которой разворачивается конфликт, в виде простых причинно-следственных связей, описывать цели и стратегии агентов в терминах этой среды, а значит, более удобно и адекватно моделировать реальные конфликты. Общее описание игры нескольких агентов в динамической системе, представленной в виде когнитивной карты ситуации, приведено в [4].

В силу того, что любая когнитивная карта есть математическая модель системы представлений относительно фиксированной проблемной области, возможно рассмотрение задачи взаимодействия агентов, системы представлений у которых различны. Иначе говоря, в процессе анализа ситуации и выбора стратегии различные агенты исходят из различных когнитивных карт, т. е. можно рассматривать игру с несогласованными представлениями у агентов [2]. Учитывая тот факт, что отличия в системах представлений, а значит, и в когнитивных картах, у агентов могут быть ими осознаны, целесообразным оказывается рассмотрение у них возможности рефлексивного восприятия. То есть каждый агент не просто представляет себе то, как будет развиваться ситуация, но и то, что другие агенты думают на этот счет. А также что эти агенты думают о представлениях друг друга. Вся эта информация влияет на выбор стратегии каждого из агентов. В этом случае возникает рефлексивная игра [6] на ко-

гнитивных картах. В такой игре возможно осуществление одним из агентов информационного управления, т. е. увеличения выигрыша за счет дезинформации оппонентов относительно собственной когнитивной карты. Такая возможность показана на примере в [2]. Настоящая работа посвящена постановке и исследованию задачи информационного управления одним агентом другими в игре с несогласованными представлениями.

В разделе 2 статьи приведено краткое описание игры с несогласованными представлениями о ситуации. В этой игре когнитивная карта каждого агента является общим знанием. В разделе 3 показана сводимость игры с несогласованными представлениями к игре на линейной когнитивной карте разделенных влияний (ККРВ). В разделе 4 приведена постановка задачи информационного управления для игры с несогласованными представлениями, обосновывается целесообразность рассмотрения ККРВ.

2. Описание игры с несогласованными представлениями

Кратко рассмотрим теоретико-игровую модель взаимодействия агентов с несовпадающими когнитивными картами (системами представлений), подробно описанную в [2] как модель с фиксированной целью управления. Знания каждого агента о ситуации представлены в виде линейной когнитивной карты.

(1) ГС1 = } {/■<} .Т }

Здесь N = {1, ..., п} - множество агентов, Si - множество стратегий агента i, ^ - функция полезности агента i, зависящая от значений целевых факторов в момент времени Т, Ci - линейная когнитивная карта агента i (везде далее под когнитивной картой мы будем иметь в виду линейную когнитивную карту), Т

- момент времени для измерения результата управления (целевой момент времени). Когнитивная карта Ci представлена совокупностью факторов М = {1, ..., m} с их начальными значениями, заданными вектором х(0) е Rm, и матрицей ^г) взаимного влияния факторов друг на друга. Когнитивные карты разных агентов в общем виде различаются матрицами W(I'). Множество

всех управляемых i-м агентом факторов обозначим Mi = {к1, к2, ..., кт7}. Для любых двух агентов 7,] е N. М7 П Му = 0 . Тогда множество стратегий 7-го агента Si можно представить как декартово произведение mi отрезков:

Sí = [рГ.рП х [рГ.рГ] х ••• х Р“рС],

где р™ , Р™ах - соответственно нижнее и верхнее ограничение

для воздействия на управляемый фактор к в момент времени 0. Каждый из отрезков ограничивает управляющие воздействия по соответствующему управляемому для агента i фактору в С7. Стратегией 7-го агента si будем считать вектор, состоящий из упорядоченных компонент вектора р(0) с номерами из множества (к:, к2, ., ктг} = М{. sI = [рК (0).Ркг (0).....рк^ (0)). После

оказания воздействия каждым агентом на соответствующие факторы, задаваемое вектором р(0), с точки зрения 7-го агента будет иметь место автономный импульсный процесс [7] до момента времени Т. Значения факторов в момент Т с точки зрения агента i определяются по формуле:

(2) х(0(Г) = х(0) + р(0) + р(0)^г) + ... + р(0) У-1 =

= х(0) + р(0)(Е + W■i) + ... + (Я'®)7'"1) = х(0) + р(0ье(г). Далее матрицу т0(г) = (Е + ^) + ... + (^})г-1) будем называть матрицей достижимости воздействий. Функция полезности fi (х(Т)) для 7-го агента задается на множестве значений всех факторов в момент Т следующим образом.

(3) (х(,)(Т))=-(х«(Т) - х* )2 .

Здесь х7]- - желаемое 7-м агентом значение для у-го фактора, который называется целевым. Таким образом, у каждого агента есть только один целевой фактор, то есть имеет место функция ] = у(7). Подставляя (2) в (3), получим целевую функцию для 7-го агента.

(4) в,(р(0))=-(х, (0) + Е т як] • Рк(0) - х*)2

кЕМ

В силу строгой вогнутости функции (4), для поиска равновесия Нэша в чистых стратегиях можно воспользоваться системой уравнений [2]:

(5) - 2 т 4° • (xJ (0) + X т Чц • Рк (0) - х* ) = 0

кєМ

V/ е Mi, т я (ц Ф 0, V/ е N.

Из [2] следует, что если решение системы уравнений (5) существует и принадлежит гиперкубу 51 X . х 5п, то оно является равновесием Нэша в чистых стратегиях 5 = (5 , s2 , ., sn*) для игры (1). Кроме того, если 5 Е 51 X ... X 5П, то 5 является решением системы уравнений (5). В этом равновесии каждый из агентов достигает своего максимально возможного выигрыша. Если ни одно из решений системы уравнений (5) не принадлежит гиперкубу 51 х ... х 5П, то равновесие Нэша в чистых стратегиях для модели с фиксированной целью управления лежит на границе гиперкуба 51 х ... х 5п.

Пример. Рассмотрим описанную игру на простом примере взаимодействия двух агентов, когнитивные карты которых содержат три фактора: х1, х2 и х3 (см. рис. 1).

агент № 1 агент №2

Рис. 1. Когнитивные карты двух агентов

Начальное значение каждого фактора указано в вершине графа: х1(0) = 1, х2(0) = -7, х3(0) = 11. Пусть х1 - целевой фактор для обоих агентов, х2 - управляемый фактор первого агента, х3 -управляемый фактор второго агента. За момент времени для регистрации результата управления примем Т = 3. Множества стратегий первого и второго агентов соответственно равны:

51 = [-10, 10], £2 = [-15, 15]. Пусть первому агенту важно приблизить значение фактора хі в момент Т к нулю, а второму агенту к 2. В этом случае целевые функции агентов примут вид:

¡1 = -(х1(3) - 0)2 = -(1 - 0.04р2(0) + 0.02-рз(0))2,

/2 = -(х1(3) - 2)2 = -(0.08^2(0) - 0.35рз(0) - 1)2.

Решением системы уравнений (5) для данной задачи будет вектор (26.61, 3.23), который, очевидно, не принадлежит множеству всех возможных наборов стратегий агентов 51 х 52. В этом случае единственным равновесием Нэша будет точка на границе множества 51 х 52: (10, -0.57). Значения целевых функций агентов в точке (10, -0.57) равны соответственно:

/1 (10, -0.57) = -0.35, /2 (10, -0.57) = 0.

3. Сводимость игры с несогласованными

представлениями агентов к игре на линейной когнитивной карте

Построим отображение игры с несогласованными представлениями (1) в игру на линейной когнитивной карте и докажем её сводимость к ней. Игру в нормальной форме Г будем называть сводимой к игре в нормальной форме Г' с совпадающим множеством агентов и их стратегий (Ы = N ',

& к* = Ме^ X если существует отображение у. {/' ^ ^

{¿Ь , такое что ЫЕ(Г) = ЫЕ(Г'). Здесь {^ 1еМ , Йе* - множе-

множества функций полезности в играх Г и Г'; ЫЕ(Г), ЫЕ(Г') -множества равновесий Нэша в играх Г и Г'.

Множество агентов N в игре на линейной когнитивной карте не меняется. Линейная когнитивная карта С строится на основе когнитивных карт агентов С1, С2,..., Сп в игре (1). Когнитивную карту С будем называть когнитивной картой разделенных влияний (ККРВ) с матрицей смежности Ж. Процесс построения ККРВ состоит из трех этапов.

1. Составим множество факторов когнитивной карты С из тех факторов, которые являются управляемыми в когнитивных картах всех агентов С1, С2,..., Сп в игре (1): икЕЫМк. Эти факторы сохраняют свое свойство управляемости. Множество всех управляемых факторов обозначим и (и = и кЕ*ик = и кЕ*Мк, где и = Мк с сохранением нумерации факторов в и*еЛг Мк), и будем называть множеством

ства стратегий соответственно

управляемых факторов. Для любых двух агентов і,/ є N

Ц П Ц = 0.

2. Выделим из множества факторов М когнитивных карт С1, С2, ..., Сп такие, которые являются целевыми факторами хотя бы для одного агента в игре (1). Добавим их в множество факторов когнитивной карты С, создав для каждого из них такое число копий, каково число агентов, для которых он является целевым. Сохраним в качестве целевого фактора за каждым из агентов одну копию того фактора, который являлся для него целевым в исходной игре. Пусть х/ - целевой фактор в игре (1) для одного или нескольких агентов. Тогда для обозначения каждой его копии в когнитивной карте С будем использовать нотацию .у/®, где / - номер продублированного фактора в множестве факторов М, а і - номер агента, для которого полученная копия будет целевым фактором. В случае, если фактор являлся целевым лишь для одного агента, добавляем его в С в единственном экземпляре. Для обозначения этого фактора для единообразия также будем использовать нотацию у/'\ где / - номер целевого фактора в множестве факторов М, а і - номер агента, для которого этот фактор был целевым фактором в игре (1). Множество всех целевых факторов в когнитивной карте С обозначим О.

3. Построим дуги из множества факторов Ц в множество факторов О по следующему правилу. При фиксированных і, / є N (быть может, совпадающих) от управляемого фактора хк є Ці к целевому фактору у® идет дуга с весом, равным элементу в матрице т= Е+И/()+...+(И/())т-1. Заметим что граф построенной когнитивной карты С является взвешенным двудольным ациклическим орграфом. В нем содержатся только управляемые Ц и целевые О факторы для всех агентов, и все дуги идут из вершин-факторов множества Ц в вершины-факторы множества О. Веса дуг содержат интегральные влияния факторов множества Ц на факторы множества

О, так как они были взяты из соответствующих матриц т$'1>. Отметим, что в силу того, что орграф двудольный и ациклический, после воздействий в начальный момент времени р(0) на

управляемые факторы значения всех факторов в когнитивной карте С уже после момента времени 1 не будут меняться.

Для каждого управляемого фактора из множества и сохраним ограничения на управляющие воздействия в виде отрезка допустимых значений, как в игре (1 ). В этом случае множества стратегий для каждого агента в игре на линейной когнитивной карте и в игре (1) будут полностью совпадать. Начальные значения всех факторов в когнитивной карте С для игры на линейной когнитивной карте совпадают с начальными значениями соответствующих факторов в игре (1); так, в частности, имеет место равенство у/г)(0) = у(0) = хД0) для всех целевых факторов в игре на линейной когнитивной карте.

Для фиксированного агента / е N его функция полезности в игре на линейной когнитивной карте строится на основе его функции полезности (3) в игре (1). В функции полезности агентов в игре (1) все вхождения значений целевых факторов х®(Т) заменяются на значения соответствующих им целевых факторов в когнитивной карте С в первый момент дискретного времени

у/°(1).

Тогда функция полезности для игры на ККРВ будет иметь

вид:

(6) = -(уУ)(1)-х*)2.

Получим запись целевой функции для агентов в игре на ККРВ:

(7) V, (р(0)) = -(у])(0) wk] • рк (0) - х*)2.

кЕМ

Здесь wкj - элементы матрицы смежности когнитивной карты С.

Мы закончили построение игры на линейной когнитивной карте для фиксированной игры вида (1):

(8) Гс = *,&}„„,&}„„ ,С}.

Игра (8), в отличие от игры (1) - это игра агентов на одной когнитивной карте.

Утверждение 1. Для любого набора когнитивных карт Сь С2, ..., Сп несогласованных представлений существует когнитивная карта разделенных влияний С такая, что игра (1) с не-

согласованными представлениями Сь С2,..., Сп сводима к игре (8) на когнитивной карте С.

Доказательство приведено в приложении.

Пример

На рис. 2 кратко представлена схема процесса построения когнитивной карты для игры (8) на примере игры двух агентов. Здесь слева представлены когнитивные карты С! и С2 агентов, справа указаны матрицы достижимости воздействий к моменту времени Т = 3, = Е+^і)+(^і))2, для обоих агентов

і Є {1, 2}. Также справа представлена когнитивная карта С, полученная в результате вышеописанного процесса построения.

Рис. 2. Пример построения когнитивной карты вспомогательной игры

Теперь мы полностью определили игру (8), соответствующую игре (1). Функции полезности агентов в игре (8) будут выглядеть соответственно: И1 = -(у1(1)(1) - 0)2, И2 = -(у1(2)(1) - 2)2. Целевые функции агентов в игре (8), полученные на основе ко-

гнитивной карты С (рис. 2) и функций полезности, будут иметь вид:

v1 = -(1 - 0.04р2(0) + 0.02р3(0))2, у2= -(0.08р2(0) - 0.35р3(0) -1)2. Заметим, что записи целевых функций агентов в игре (8) и в игре (1) идентичны. А значит, в условиях полного совпадения множеств стратегий агентов в обеих играх решением игры (8) будет то же равновесие Нэша (10, -0.57).

Ввиду того, что для игры (1 ) всегда можно построить соответствующую ей игру (8), далее будем рассматривать задачу информационного управления в игре агентов на ККРВ в виде игры (8).

4. Задача информационного управления одним агентом другими

в игре с несогласованными представлениями

Информационное управление, согласно [5], определяется как целенаправленное влияние на информацию, используемую агентами при принятии решений. Рассмотрим задачу информационного управления со стороны одного активного агента остальными, пассивными, агентами в игре с несогласованными представлениями. В процессе рассмотрения задачи будем считать, что активный агент адекватно информирован обо всех пассивных агентах, и пассивные агенты не подвергают сомнению сообщаемую активным агентом информацию. Под структурой информированности агента, согласно [6], мы будем подразумевать его знание о собственной когнитивной карте, о когнитивных картах других агентов и их взаимных представлениях о знаниях друг друга. Понятие информационного равновесия есть расширение понятия равновесия Нэша на случай, когда отсутствует общее знание и агенты имеют разные структуры информированности [6]. Под поиском информационного управления будем понимать процесс нахождения таких значений параметров когнитивной карты активного агента, сообщение которых остальным агентам (пассивным) приводило бы к информационному равновесию, которое наиболее выгодно для активного агента.

Далее будем рассматривать игру (1) с функциями полезности агентов вида (4).

Будем считать первого агента активным, а всех остальных -пассивными. В разделе 2 было отмечено, что если существует равновесие Нэша, принадлежащее внутренности гиперкуба стратегий, то оно является решением системы уравнений (5), и в нем каждый агент достигает своей максимально возможной полезности в игре (равновесие Нэша оптимально по Парето). Таким образом, если решение системы уравнений (5) принадлежит гиперкубу стратегий 51 х ... х £и, то увеличение выигрыша первого агента невозможно. Ввиду того, что когнитивная карта является формализацией внутреннего видения агентом ситуации, очевидно влияние когнитивной карты агента на его выбор стратегии. В то же время, как было отмечено ранее, по системе уравнений (5) можно проследить, каким образом информация о параметрах когнитивной карты одного агента влияет на выбор стратегий остальных агентов, т.е. можно определить, как выбор стратегии отдельным агентом зависит от сообщений о параметрах когнитивных карт других агентов. В таком случае, зная такую зависимость, можно рассматривать задачу информационного управления одним агентом другими при ряде допущений, сделанных выше. Единственным случаем, когда такая зависимость полностью отсутствует, будет существование у агента доминантной стратегии - им невозможно будет управлять рассматриваемым способом. В таком случае актуальным будет ответ на вопрос: есть ли в игре агенты, у которых нет доминантных стратегий?

Решить задачу информационного управления, в которой искомым параметром является матрица смежности когнитивной карты, полностью достаточно сложно. С другой стороны, из системы уравнений (5) видно, что для принятия решения отдельным агентом ему достаточно обладать информацией об оценках агрегированного влияния управляемых факторов на целевой фактор для каждого агента Тц1 ), ..., тЦтс'>. В разделе 3 была показана сводимость игры с несогласованными представлениями к игре на одной линейной когнитивной карте. Рассмотрим задачу информационного управления в игре на когнитивной карте разделенных влияний.

Предположим, что общим знанием среди агентов в игре (8) являются функции полезности агентов и множества их стратегий. Первый агент в игре (8) знает оценки влияния управляемых

может рассчитать равновесие Нэша в чистых стратегиях для игры (истинное равновесие). Остальные агенты знают оценки вли-

для каждого агента, кроме первого. Об этом знает первый агент. В таком случае он при определенных условиях имеет возможность осуществлять информационное управление остальными агентами с целью увеличения собственной ожидаемой полезности. Как уже было отмечено нами в рамках игры (8), каждый агент в процессе принятия решения использует информацию, предоставленную ему другими агентами относительно параметров их когнитивных карт (оценок влияния управляемых факторов на его целевой фактор): тд1с(г),..., . Тогда параметрами

информационного управления первым агентом остальными являются величины 7,~1(с1),...,7,. На рис. 3 целевой для первого агента фактор выделен жирной линией, а параметры, которыми он может манипулировать - пунктирной линией.

Рис. 3. Граф когнитивной карты для вспомогательной игры

В данном случае решение задачи информационного управления можно записать в виде:

факторов на целевой фактор тд^,..., тдтс^ для каждого агента и

яния управляемых факторов на целевой фактор д^,..., тдт^')

Здесь 5** = БЯ1 (/_1 (т ,...,т )), gl - целевая функция первого агента вида (7). Задача поиска информационного управления заключается в нахождении первым агентом таких значений набора параметров ^С®,...^С^ собственных оценок влияния управляемых факторов на целевой фактор ус(1), сообщение которых остальным агентам максимизировало бы его полезность. При этом у первого агента существуют истинные оценки влияния управляемых факторов на целевой тд1с(1:1,..., тд)ЯС1'1'1, описывающие его действительное мнение о ситуации, которые он утаивает от остальных агентов. Первый агент, варьируя значения гС1"1,...^С(1>, варьирует структуры информированности остальных агентов, а значит, изменяет рефлексивную игру [6].

Выше мы говорили о двух случаях в игре, когда информационное управление первым агентом либо невозможно применить, либо применять нецелесообразно. Один из таких случаев возникает тогда, когда у каждого агента из множества {2, ..., п} в игре есть доминантная стратегия. В этом случае у каждого из них отсутствует зависимость выбора стратегии от выбора стратегий остальных, а, следовательно, и от представлений когнитивных карт других агентов. Раз такой зависимости нет у агента, то управление осуществлять невозможно. Под возможностью информационного управления первым агентом будем подразумевать тот случай, когда он может сообщением ложной информации о значениях параметров своей когнитивной карты тС1,..^ С (1> изменить обстановку 5-1 в новой равновесной ситуации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В игре (8) для каждого агента, приравняв к нулю целевую функцию вида (7) и помня, что wkj■ = тЦ;1>, можно записать уравнение гиперплоскости:

(10) Ьг : ^ тс" • ^ = х* - у ®(0).

кеМ

Здесь ^ - переменная, соответствующая величине воздействия рк(0) на управляемый фактор к в момент времени 0. Из (7) можно заключить, что чем меньше расстояние от точки р(0) = (57, s-7) до гиперплоскости, соответствующей 7-му агенту (10), тем ситуация р(0) лучше для 7-го агента. Рассмотрим слу-

чай, когда для агента i соответствующая ему гиперплоскость

(10) не имеет общих точек с внутренностью гиперкуба int (iS1 х ... х Sn). В таком случае существует точка (быть может, не одна) на поверхности гиперкуба S1 х ... х Sn с минимальным евклидовым расстоянием до гиперплоскости, соответствующей i-му агенту. Очевидно, что, по крайней мере, одной из таких точек будет одна из вершин гиперкуба S1 х ... х Sn. Легко показать, что та часть координат точки гиперкуба с минимальным расстоянием до гиперплоскости (10), которая соответствует стратегиям из Si, образует множество доминантных стратегий i-го агента. Следовательно, если точка гиперкуба (si , s_i*> - это точка с минимальным расстоянием до Li, то V s-i е S-i si = BRi(s-i).

Утверждение 2. Информационное управление, осуществляемое первым агентом, возможно тогда и только тогда, когда существует агент i Ф 1, такой, что для него

Li П int (S1 х . х Sn) Ф 0 и 31 е M ,Г qf Ф 0 .

Доказательство приведено в приложении.

Вопрос целесообразности применения информационного управления не менее важен, и он не исчерпывается определенной выше возможностью информационного управления. Например, если решение системы уравнений (5) для игры с целевыми функциями (4) принадлежит гиперкубу стратегий S1 х ... х Sn, то увеличение выигрыша первого агента невозможно. Другими словами, если выполняется условие

bL Ь Sх-х Sn Ф0 ’

то информационное управление неактуально. Под актуальностью информационного управления первым агентом подразумевается тот случай, когда информационное управление возможно, и сообщение им ложной информации о значениях параметров j-q®,...^q^ позволяет активному агенту увеличить свою

полезность в сравнении с полезностью, получаемой им, если он сообщит истинные оценки влияния управляемых факторов на целевой rqic(V>,..., TqJv>.

Обозначим через Nd тех агентов, которые имеют в игре (8) доминантные стратегии. Сами доминантные стратегии этих

агентов будем обозначать si = ((0) , (0), ..., рк (0))

і є N¡1. Запишем систему уравнений (5) для всех агентов из N \^, подставляя значения соответствующие доминантным стратегиям для остальных агентов из N¡1. Коэффициенты уравнения для первого агента С® являются искомыми па-

раметрами для задачи (9).

(11) X • Рк + X тІЇкС • Рк = Ас - X (0)

кєМ\{Мг >,?є^ кєМг ,ієИа

X т сії • Рк + XX т сії • Рк=X* - X (0) ,

кєМ\{М1 },ґєМк кєМг ,гє^к

V/ є N \(^ и{1>), j = „/'(і)

Здесь с - номер целевого фактора для первого агента. Выпишем из (11) выражения для рк в виде параметрической зависимости от т‘С<Іс,...,тЯ.<1 : рк = Рк ^...ТТ^ЛЇ, >£" ) ,

кєМ\ {Мі}, ґ є N4. В записи параметрической зависимости Рк

от Д®,...,,.С(1) возникает совокупность переменных {РІ>т-п в том случае если т > п. Полученные выражения для Рк из системы (11) подставляем в выражение для целевой функции первого

агента и решаем задачу оптимизации с ограничениями в виде неравенств:

( у

(12), хс(0)“+ X гЯь • Рк + X Г?*? ■ ^ + X Г9®

хг'З'.к }_/=1’ кеМ\и(Мг}, кеМг, кеМ!

р/ /е«\( / и{1}) геИа у

РГ < Рк < рГ , к е М\ {М,}, Г е ^ \ {1}.

Здесь Ьрк — {р*}кеМ\XJ\M,},tеN\(и{1}) , {рк }kеMt¿еЫа ). При-

емлемое допустимое решение этой задачи при относительно небольшом количестве ограничений в виде неравенств может быть найдено, например, с помощью обобщенного метода множителей Лагранжа [8]. Рассмотрим задачу поиска информационного управления (12), осуществляемого первым агентом для игры из примера (см. рис. 2). Система уравнений (11) будет иметь вид:

| 7^21 ■ Рг +Т<?31 ■ рз = 1

| 0.08^р -0.35^р3 = 1

После решения системы уравнений относительно парамет-

ров (Т Ч <7з1)) запишем задачу (12):

( ( Л(1) _|_п по А

Ш1П

Ч(‘) Ч(‘) т Чи тч31

1 - 0 - 0.04-БЯХ

Ч(1/ + 0.08

0.35-у, Ч (1) + 0.08-г Чз1)

- 0.02---------т<Ч21 + 0.08

0.35-г Ч21 + 0.08-г Чз!

-10<---------^ ^----------— < 10

-0.35-гЧ2? - 0.08-г^

Ч(1)

-15<----------------т*2' --------- < 15

^(1) _п по. Л(1)

4(1 + 0.08 -0.35^Чп -0.08><7(;;

Решение этой задачи было найдено численно: (тФп’т ^з! ) = (0.3547, -0.4953). Путем проверки можно убедиться, что данное решение обеспечивает наилучшее информационное равновесие для первого агента - (10, -5.1).

5. Заключение

В настоящей работе рассмотрена модель информационного управления одним агентом другими в игре с несогласованными представлениями на основе линейных когнитивных карт. Информационное управление осуществляется за счет сообщения одним агентом остальным таких собственных оценок влияния управляемых факторов на целевой, которые максимизировали бы его выигрыш. Сформулированы условия для возможности и актуальности осуществления информационного управления.

6. Приложение

Доказательство утверждения 1.

Множества агентов и их стратегий полностью совпадают в играх (1) и (8). Для сводимости игры (1) к игре (8) достаточно показать совпадение соответствующих целевых функций в играх (1) и (8), так как в этом случае будут совпадать и множества равновесий Нэша.

Т

Рассмотрим целевые функции агентов для обеих игр (4) и (7). Легко видеть схожесть в записях обеих функций. Видны два различия в записи:

- В (4) используется запись х;(0), в (7) используется запись у/г)(0). Однако, согласно правилу построения ККРВ, начальные значения всех факторов в когнитивной карте С для игры на линейной когнитивной карте совпадают с начальными значениями соответствующих факторов в игре (1); так, в частности, имеет место равенство у/г)(0) = У](0) = х;(0) для всех целевых факторов в игре на линейной когнитивной карте.

- В (4) используются элементы матрицы достижимости

воздействий тЦк^, а в (7) элементы матрицы смежности для ККРВ С wkj. Из построения ККРВ следует, что Ук еи’ У/ е G = м^-. Значения целевых функций (4) и

(7) могут отличаться лишь для слагаемых, в которых к £ и . Пусть к £ и, тогда фактор с номером к не является управляемым и рк(0) = 0. Следовательно, данное слагаемое будет нулевым в обеих целевых функциях (4) и (7).

Таким образом, мы показали полное совпадение значений целевых функций агентов на всей области определения. Из этого следует, что решение игры (1) в соответствии с концепцией решения равновесия Нэша в чистых стратегиях будет в точности совпадать с соответствующим решением игры (8). □ Доказательство утверждения 2.

Отметим, что в случае сообщения информации о значениях параметров своей когнитивной карты ^ . ’г Я(^ первый агент сообщает о параметрах своей функции выбора, т.к. величины ТС1(1 ’...’Г с} ^ характеризуют силы влияния с точки зрения первого агента всех управляемых факторов на его целевой фактор. То есть эти параметры напрямую влияют на то, какое действие будет выбирать первый агент при той или иной обстановке. Таков механизм информационного воздействия первым агентом на других агентов. Следовательно, для возможности информационного управления

- должен существовать агент i, кроме первого, у которого нет доминантной стратегии (иначе информационное управление не возможно согласно определению);

- выбор наилучшего действия агента i (BR,) должен зависеть от действий первого агента: BRi = f (si), f (•) Ф const.

В разделе 4 было показано, что Li П int (S1 х ... xSn) = 0 -это достаточное условие существования доминантной стратегии агента i. В случае если Li П int (S1 х... xSn) Ф 0 , агент i имеет доминантную стратегию лишь тогда, когда в уравнении его гиперплоскости Li выполняется условие (V/ еM \Mt),Tq(i = 0 . В

этом случае доминантная стратегия определяется как решение уравнения (10) (существование решения гарантируется условием Li П int (S1 х ... х Sn) Ф 0). В противном случае, выбор его стратегии зависит от стратегий других агентов. Эта зависимость задаётся уравнением (10).

Пусть существует агент i Ф 1, такой, что для него Li П int (S1 х ... х Sn) Ф 0 и 3/ еMj,Т(£у Ф 0 . Первое условие

исключает наличие у агента i доминантной стратегии. Второе условие означает, что через уравнение гиперплоскости (10) можно в явном виде выразить зависимость оптимальных действий агента i от действий первого агента. Следовательно, возможно осуществление первым агентом информационного управления, согласно определению.

Пусть осуществление информационного управления первым агентом возможно. Из этого следует, что существует агент

i, у которого нет доминантной стратегии, а значит, Li П int (S1 x.xSn) Ф 0 . Возможность информационного управления предполагает, что выбор наилучшего ответа агента i зависит от действий первого агента BRi = f (s1). Такая зависимость

отсутствует лишь в случае V/ е Mx ,Tq\i = 0. Следовательно, условием наличия такой зависимости будет 3/ е Mx ,Т q^) Ф 0. □

Литература

1. КУЗНЕЦОВ О.П., КУЛИНИЧ А.А., МАРКОВСКИЙ А.В.

Анализ влияний при управлении слабоструктурированными ситуациями на основе когнитивных карт // Человеческий фактор в управлении - М.: КомКнига, 2006. - С. 313-344.

2. КУЛИВЕЦ С.Г. Моделирование конфликтных ситуаций с несогласованными представлениями у агентов на основе игр на линейных когнитивных картах // Проблемы управления. - 2010 - №4 - С. 42-48.

3. МАКСИМОВ В.И., КОРНОУШЕНКО Е.К. Аналитические основы применения когнитивного подхода при решении слабоструктурированных задач // Труды Института проблем управления им. В.А. Трапезникова РАН. Том II. - М., 1999. - С. 95-109.

4. НОВИКОВ ДА. "Когнитивные игры”: линейная импульсная модель // Проблемы управления. - 2008. - № 3 - С. 14-22.

5. НОВИКОВ Д А., ЧХАРТИШВИЛИ А.Г. Активный прогноз. М.: ИПУ РАН, 2002. - 101 с.

6. НОВИКОВ Д А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. - М.: СИНТЕГ, 2003. - 160 с.

7. РОБЕРТС Ф. Дискретные математические модели с приложениями к социальным, биологическим и экологическим задачам. - М.: Наука, 1986. - 325 с.

8. ТАХА, ХЕМДИ А. Введение в исследование операций. М.: Издательский дом «Вильямс», 2005. - 912 с.

9. AXELROD R. Structure of Décision: The Cognitive Maps of Political Elites. - Princeton, 1976. - 395 p.

MODEL OF INFORMATION CONTROL FOR GAME ON LINEAR COGNITIVE MAP

Sergei Kulivets, Institute of Control Sciences of RAS, Moscow, student (skulivec@mail.ru).

Nikolay Korgin, Institute of Control Sciences of RAS, Moscow, Cand.Sc. (nkorgin@ipu.ru).

Abstract: The model of information control was studied for a game with agents ’ inconsistent beliefs presented by linear cognitive maps. The conditions are derived for the possibility of information control, and also for information control irrelevancy.

Keywords: information control, linear cognitive maps, game theory, game with inconsistent beliefs.

Статья представлена к публикации членом редакционной коллегии О.П. Кузнецовым

i Надоели баннеры? Вы всегда можете отключить рекламу.