«Когнитивные игры»: линейная импульсная модель

Новиков Д.А.

с

истемный анализ

УДК 519.83; 517.977

«КОГНИТИВНЫЕ ИГРЫ»: ЛИНЕЙНАЯ ИМПУЛЬСНАЯ МОДЕЛЬ

Д.А. Новиков

Институт проблем управления им. В.А. Трапезникова РАН, г. Москва

Проведен анализ возможности и целесообразности совместного использования теоретико-игровых и когнитивных моделей для описания сложных систем. В целях интеграции этих двух подходов классифицированы возникающие на их пересечении задачи, что дало возможность систематизировать возможные направления будущих исследований. В качестве примера игра на линейной когнитивной карте с импульсным начальным управлением сведена к классической игре в нормальной форме.

ВВЕДЕНИЕ

Согласно определению, предложенному в [1], теория игр — раздел прикладной математики, исследующий модели принятия решений в условиях несовпадения интересов сторон (игроков), когда каждая сторона стремится воздействовать на развитие ситуации в собственных интересах. Результаты, полученные в теории игр, нашли множество приложений в самых разных областях — в социологии [2], экономике [3—5], организационном управлении [6, 7], экологии [8, 9], военном деле [10, 11] и др.

Когнитивный анализ или когнитивный подход, предмет которого (так же, как и теории игр) составляет описание развития ситуаций1, в настоящей работе будем понимать в узком его значении [12], как основывающийся на применении когнитивных карт — взвешенных ориентированных графов (термин, введенный впервые в работе [13]) — для учета причинно-следственных связей и взаимовлияния факторов, а также для моделирования динамики слабо формализуемых систем. В широком понимании когнитивный анализ подразумевает учет когнитивных аспектов человеческой деятельности при решении задач описания и управ-

1 В соответствии со Словарем русского языка С.И. Ожегова, ситуация — совокупность обстоятельств, положение, обстановка.

ления слабоструктурированными объектами и ситуациями [12]. У когнитивных моделей множество приложений — см. работы [9, 14—26]. Для первоначального ознакомления с этой областью можно порекомендовать классические монографии [9, 26] и современные обзоры [12, 15, 20, 23, 27].

Основная цель применения когнитивных карт заключается в качественном анализе, основывающемся в большинстве случаев на имитационном моделировании (реже аналитически решаются обратные задачи управления) динамики ситуаций (тенденций, направлений изменения значений факторов, исследовании сценариев и т. д.). Для це-

Цели и средства количественного и качественного анализа динамики ситуаций

Цель Средство

Качественный анализ Количественный анализ

Описание ситуации Когнитивные карты Дифференциальные или разностные уравнения

Анализ и управление (централизованное) ситуацией Имитационное моделирование Теория оптимального управления

Анализ взаимодействия субъектов, заинтересованных в развитии ситуации «Когнитивные игры» Динамические игры

лей количественного анализа традиционно применяется аппарат дифференциальных или разностных уравнений и теории оптимального управления, в игровой постановке — аппарат динамических или дифференциальных игр (см. таблицу).

Интуитивно напрашивается синтез теоретико-игрового и когнитивного подходов, что позволило бы говорить об «играх на когнитивных картах», т. е. «когнитивных играх»1, в которых динамика факторов описывается когнитивной картой, причем эта динамика зависит от действий (формулируемых, быть может, в качественных терминах) активных субъектов, имеющих, с одной стороны, возможность так или иначе влиять на факторы, а с другой — заинтересованных в определенных значениях этих факторов.

Необходимо признать, что как когнитивное, так и теоретико-игровое моделирование сегодня являются чрезвычайно развитыми, разветвленными и интенсивно развивающимися научными направлениями. Поэтому попытка какого-либо их полного обзора обречена на неудачу. Тем не менее, «стык» этих направлений, хотя и привлекал внимание многих исследователей, не только не достиг завершенного в первом приближении состояния, но и не приобрел четко очерченных границ — грубо говоря, задача пока даже не сформулирована (единственное исключение составляет работа [28], в которой рассматривается одна частная позиционная игра двух лиц).

Возникает вопрос — имеют ли «когнитивные игры» право на самостоятельное существование, и что это, вообще, такое?

1. ОПИСАНИЕ КОГНИТИВНОЙ КАРТЫ

Под когнитивной картой в настоящей работе будем понимать взвешенный ориентированный граф С = (М, G), множество М = {1, 2, ..., т} вершин которого представляет собой совокупность факторов, описывающих состояние исследуемой системы или моделируемую ситуацию. Значение

2 В силу условности данного термина в настоящей работе он употребляется в кавычках. Термин «когнитивные модели» интуитивно гораздо шире, чем сложившееся и ставшее почти общепринятым его применение для обозначения динамических моделей, основанных на взвешенных ориентированных графах. Поэтому и употребляемый на уровне переноса понятий термин «когнитивная игра» шире, чем предлагаемое в настоящей работе его значение в смысле «игры на когнитивной карте». Действительно, под когнитивной игрой можно понимать и игру, в которой существенны когнитивные возможности, или развиваются когнитивные способности игроков («когнитивный» — в соответствии с Философским энциклопедическим словарем — «познаваемый, соответствующий познанию»; но и это определение представляется слишком узким и однозначным — см. работу [16]), или игру, моделирующую процессы познания, распознавания ситуаций и (или) образов и др.

у-го фактора (фазовая переменная в терминах теории управления) у. является действительным чис-

о

лом . Множество дуг О с М х М отражает причинно-следственные связи между факторами и их влияние друг на друга. Обычно когнитивная карта описывается квадратной матрицей А = ||аи||тХт,

элементы которой ак1 е Ж1 отражают непосредственное влияние /-го фактора на к-й фактор (знак элемента ак1 показывает «направление» влияния, а его абсолютная величина — «силу влияния», нулевое значение соответствует отсутствию влияния).

Отметим, что в когнитивных моделях иногда (но достаточно редко) используются функциональные графы (в которых «сила влияния» одного фактора на другой зависит — является известной функцией — от значений этих факторов [9, 21]; другой вариант раздельного учета положительного и отрицательного влияний факторов состоит в применении так называемых «расщепленных» когнитивных карт [15]). Еще реже встречаются графы с запаздыванием (в которых изменение значения одного фактора приводит к изменению значения другого фактора с некоторой задержкой [9]), модулируемые графы (в которых «сила» влияния одного фактора на другой может зависеть от значения третьего — модулирующего — фактора [9, 20, 21]), иерархические графы (см., например, в работе [29]) и вероятностные графы (в которых каждой дуге, помимо силы связи, поставлена в соответствие вероятность реализации воздействия; данный класс моделей на сегодня ближе к марковским цепям [9], однако со временем, наверное, будут частично применяться и подходы, развитые для Байесовских сетей [30]). Различные интерпретации вершин, ребер и весов на ребрах, а также различные функции, определяющие влияние связей на факторы, приводят к различным моделям (модификациям когнитивных карт) и средствам их анализа [17]. Достаточно распространены нечеткие карты, в которых факторы и связи между ними принимают нечеткие значения [15, 19, 20, 31]. Последний случай как раз в наибольшей степени соответствуют качественному анализу, на который, с точки зрения автора, в основном и ориентированы когнитивные модели. Завершив краткое описание видов когнитивных карт, вернемся к формальной модели.

Пусть время дискретно и начальному состоянию исследуемой системы соответствует нулевой момент времени. В настоящей работе рассматри-

3 Значение фактора может быть действительнозначным вектором или может априори быть ограниченным некоторым отрезком (например, от —1 до + 1) и т. д. Значения факторов и связи между ними могут оцениваться экспертами по лингвистической шкале, а затем переводиться в числа и т. д.

вается случай линейной взаимосвязи между приращениями значений факторов:

ук(і + 1) = Ук(і) + X ОыОДО - у( - 1))’

і є м

к є М, і = 0, 1, ... (1)

при известных начальных значениях факторов (ук(0))кє м и их начальных приращениях (ук(0) — — ук(—1))кєМ. Другими словами, система разностных уравнений (1) однозначно описывает динамику ситуации при известных начальных значениях состояния и его изменения. Иногда, вводя «скорости» (импульсы в терминах работы [9]) рк(і) = = Ук(і) — Ук(і — 1), динамику описывают в виде

рк(і + 1) = X акіРі(і), к є М, і = 0, 1, ..., (2)

і є М

считая известными начальные «скорости» (рк(0))кєМ и начальные значения факторов (ук(0))к є м.

С помощью когнитивных карт можно решать следующие задачи:

— прогноз саморазвития ситуации — изучение динамики изменений значений факторов в отсутствии управления;

— прогноз развития ситуации при фиксированном управлении (прямая задача) — варьируя управления, можно анализировать различные сценарии [21, 24];

— нахождение управления, обеспечивающего требуемую динамику ситуации (реализацию требуемого или желательного сценария) — обратная задача.

Обозначим ук = (ук(0), ук(1), ..., ук(і)) — вектор динамики к-го фактора до момента времени і, к є М, Y(t) = (уДі), у2(і), ..., ут(і)) — вектор значений факторов в момент времени і, Y^ = (Y(0), Y(1), ..., Y(і)) — траектория, т. е. матрица динамики всех факторов до момента времени і, і = 0, 1, 2.... Аналогичные обозначения будем использовать и для «скоростей».

Важнейшая особенность когнитивных карт заключается в возможности отражения опосредованного влияния факторов друг на друга, когда изменение значения одного фактора через «цепочку влияний» сказывается на изменении значения другого фактора, не связанного с первым непосредственно. Обозначим {Ьа — элемент квадратной матрицы

В = Ет + А + А2 + ... + А, і = 1, 2, ..., (3)

где Ет — единичная матрица размера т х т (матрица тВ — транзитивное замыкание когнитивной карты). Из выражений (1) и (3) следует, что в мат-

ричном виде динамика значений факторов описывается следующим образом:

Щ = ,Щ0) + (Ет - <Я) Д—1), г = 1, 2, ... (4)

Если считать, что у.(г) = 0, г < 0 (отметим, что этим

4

предположением «отметается» вся «история» динамики системы и теряется полугрупповое свойство системы (4)), то р.(0) = у(0), у е М, и выражение (4) примет вид

Щ = ,Щ0), г = 1, 2, ..., (5)

или в терминах «скоростей»:

Р(г) = (А)'Д0), г = 1, 2, ...

Пусть матрица А такова, что все ее собственные значения содержатся внутри окружности единичного радиуса на комплексной плоскости5. Это требование устойчивости достаточно для обеспечения сходимости суммы (3) натуральных степеней

матрицы А (ЖБ « (Еы — А) 1) и асимптотической устойчивости нулевого положения равновесия системы (2).

Обозначим qkl = жЬк1 (элемент qkl содержательно отражает «интегральное» (с учетом всех опосредованных влияний) влияние изменения /-го фактора на к-й, к, / е М. Из выражения (5), устремляя время к бесконечности, для вектора «установившихся» значений факторов получаем:

^ = „ЯД0). (6)

Таким образом, описав взаимосвязь между факторами в виде (1) или (2) и задав начальные значения, можно анализировать динамику факторов,

«установившиеся» значения (6) и др.6, рассматривая все эти аспекты с точки зрения лиц, заинтересованных в том или ином развитии ситуации, или исследуя несовпадение целей различных субъектов (см. работы [14, 18, 21, 23]). Традиционно, явное взаимодействие нескольких игроков рассматривает

4 Одним из возможных обоснований данного предположения является использование двух «времен» [32] — «медленного времени» (в котором осуществляется управление) и «быстрого времени», в котором переходные процессы, вызванные управляющими воздействиями, успевают закончиться.

5 Для выполнения данного требования, например, посредством нормировки, при решении практических задач необходимо иметь в виду содержательные интерпретации производимых преобразований.

Подчеркнем существенность всех (!) введенных выше предположений. Так, например, введение ограничений на значения факторов или применение дискретных шкал приведет к потере линейности связи между факторами (см. выражение (1)), т. е. выражения (4) и (6) уже не будут справедливы. Об этом достаточно часто забывают при разработке тех или иных прикладных моделей.

теория игр, поэтому попробуем описать соответствующий случай в теоретико-игровых терминах, т. е., определив, что понимается под когнитивной картой, рассмотрим общее описание «когнитивной игры».

2. ОБЩЕЕ ОПИСАНИЕ «КОГНИТИВНОЙ ИГРЫ»

Пусть имеется конечное множество N = {1, 2, ..., п}, состоящее из п игроков, и фиксирован момент окончания игры Т; 1-й игрок осуществляет

т

выбор действия (управления) х1 = (х;(0), х;(1), ..., т

х(Т)) е Х{ из множества его допустимых дейст-7 Т

вий Х{ , / е N. Этот выбор может производиться

т

или однократно (выбор сразу всего вектора х1 в начальный момент времени), или в периоде г может выбираться компонента х(г) вектора хТ.

Пусть состояние управляемой игроками динамической системы описывается следующей системой разностных уравнений:

¥(г + 1) = У(г) + ддг), ¥(г — 1), Х(г)), (7)

где ДО — известная вектор-функция, Х(г) — веко

тор действий игроков в момент времени г, г = 1, 2, ..., Т.

Целевая функция /-го игрока Д¥т, хТ) зависит в общем случае от матрицы ¥т динамики всех факторов и от его действия хТ, т. е. Жт тх Хт ^ Ж1, / е N.

Предположим, что множество игроков, множества их допустимых действий, целевые функции и уравнение (7) являются общим знанием среди игроков, т. е. перечисленные параметры известны всем игрокам, всем известно, что всем это известно и так далее до бесконечности [33]. Будем считать, что на каждом шаге игроки выбирают действия одновременно.

В теории игр под стратегией игрока понимается отображение его информированности во множество возможных действий. Введенные выше предположения об информированности игроков (отсутствие неопределенности и ненаблюдаемых переменных, наличие общего знания) позволяют решать задачу поиска игроками оптимальных с их

7 Отметим, что мы не рассматриваем управление структурой «когнитивной карты», заключающееся в изменении множества факторов (удалении или (и) добавлении факторов) и связей между ними. В том числе, и в изменении весовых функций, характеризующих эти связи.

8 Часть или все действия игроков могут совпадать с состо-

яниями системы.

точки зрения стратегий в виде программных управлений (условных — зависящих в каждый момент времени от текущей истории игры — управлений на все будущие периоды, выбираемых однократно в начальный момент времени).

Итак, описав множество игроков, множества их допустимых стратегий, функции выигрыша, информированность и порядок принятия решений, мы получили динамическую игру, поиск решений которой (равновесных действий игроков) представляется в силу абстрактности описания неразрешимой в общем виде задачей, которая в различных частных постановках привлекала внимание многих исследователей. Анализ результатов исследования динамических игр не является целью настоящей работы (см. обзоры в работах [5, 10, 34, 35]), поэтому в § 4 рассматривается частный случай — линейные «когнитивные игры».

Динамическая система (7) в дискретном времени может интерпретироваться как некоторая достаточно сложная «когнитивная карта» (выражение (1) — частный случай выражения (7)), поэтому определенная выше динамическая игра может в рамках традиции когнитивного анализа трактоваться как «обобщенная когнитивная игра» (см. таблицу во Введении).

Сделав маленькое отступление, подчеркнем, что даже в отсутствии игровой составляющей (при управлениях, выбираемых одним управляющим органом) изучение управляемой динамической системы (7) представляет собой самостоятельную задачу, составляющую теории оптимального управления. Кроме того, отдельный вопрос — устойчивость, причем устойчивость как самой системы,

так и решений по параметрам модели9 (корректность задачи и др.) [36, 37].

Итак, по большому счету, если в случае нескольких игроков отбросить содержательные интерпретации и эволюционно сложившиеся традиции, «когнитивная игра» представляет собой динамическую игру, и для когнитивного игрового моделирования можно и нужно использовать и развивать все богатство результатов, накопленное в теории динамических (и дифференциальных) игр. Так как очень во многих случаях теория динамических игр не дает возможности найти явный вид решения игры, а когнитивный анализ «привык» опираться на интуитивно прозрачные и со-

9 Приходится с сожалением признать, что в большинстве «когнитивных» приложений, выписывая систему из большого числа разностных уравнений и производя имитационное моделирование, исследователи-практики даже не задаются вопросом о том, насколько изменятся траектории, отражающие поведение моделируемой системы, при незначительном изменении параметров модели (начальных условий, значений связей между факторами и т. д., не говоря уже об изменении состава факторов и (или) связей между ними).

держательно интерпретируемые результаты, то в смысле приложений целесообразным представляется либо поиск аналитических выражений для равновесий в «когнитивных играх», либо имитационное моделирование взаимодействия активных субъектов, влияющих на ситуацию, описываемую когнитивной картой.

Введем сначала систему классификаций «когнитивных игр», а затем для одного из частных случаев сведем задачу анализа взаимодействия игроков «на когнитивной карте» к классической игре в нормальной форме.

3. КЛАССИФИКАЦИЯ «КОГНИТИВНЫХ ИГР»

Приведенное в § 2 описание динамической («когнитивной») игры является лишь одним из множества возможных. Для систематизации всего многообразия различных «когнитивных игр» введем систему их классификаций с позиций теории

игр10, перечислив основания классификации и

возможные значения признаков классификации11.

1. Вид динамической системы. По этому основанию будем различать линейные игры (когда приращение значения фактора линейно зависит от значений других факторов, их приращений и «управления») и нелинейные игры.

2. Информированность игроков. Возможные значения признаков классификации — параметры и текущие результаты игры являются общим знанием или общее знание отсутствует. В последнем случае получаем рефлексивные «когнитивные игры» (см. в работе [33] описание рефлексивных игр в нормальной форме). Этот класс игр может оказаться эффективным инструментом моделирования информационного противоборства, информационных войн и др. [21, 22, 38—40]. В зависимости от того, какие параметры наблюдаемы для различных игроков, может иметь место информационная дискриминация некоторых игроков.

3. Наличие или отсутствие неопределенности (как симметричной, так и асимметричной — когда игроки обладают различной априорной частной информацией, и этот факт является общим знанием). Более прост детерминированный случай, в то время как, например, «когнитивные игры» с неопределенностью (симметричной) могут отражать си-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 г-т.

Так как «когнитивная игра» определяется как «игра на когнитивной карте», то еще одной системой классификаций «когнитивных игр» может служить классификация собственно когнитивных карт — см. краткое перечисление некоторых видов когнитивных карт § 1.

11 По каждому основанию возможно выделение большего числа подклассов (числа значений признаков классификации).

Можно также увеличивать и число оснований, заимствуя их из теории оптимального управления, из исследования операций

и др.

туации принятия решений и (или) сценарного моделирования в условиях неопределенности.

4. Дискретность или непрерывность времени.

В случае зависимости факторов от действий только соответствующих игроков получаем классические дифференциальные игры, представляющие чрезвычайно развитое и богатое результатами направление теории игр (см. работы [10, 11, 35, 41—43] и ссылки в них).

5. Структура целевых функций игроков. Выше описан случай, когда целевая функция каждого игрока зависит от динамики всех факторов (траекто-

12

рии) и его собственного действия . Возможны обобщения, когда выигрыш каждого игрока зависит от действий всех игроков. Возможны интегральные критерии — когда выигрышем игрока является интеграл по времени (быть может, нормированный на продолжительность — усредненный критерий) от траектории и действий игроков или терминальные критерии — когда выигрыши игроков зависят от значений факторов в конечный момент времени. Возможно выделение для каждого из игроков собственного множества целевых факторов (см. сноску 12) и т. д.

6. Интервал времени, на котором рассматривается динамика и для которого решается задача управления. Этот интервал может быть конечным или бесконечным.

7. Структура ограничений. В сформулированной выше динамической игре присутствовали только ограничения на индивидуальные действия игроков. Дополнительно могут присутствовать и ограничения совместной деятельности [7, 44], или (и) индивидуальные ограничения могут задаваться конструктивно (например, в виде ограниченности тех или иных «интегралов» по времени от действий игроков).

8. Дальновидность игроков. Выше предполагалось, что в условиях полной информированности и общего знания при конечном интервале времени, на котором рассматривается динамика, игроки могут сразу выбрать вектор своих действий на все будущие периоды времени (так называемое «программное» принятие решений). Дальновидность игроков, т. е. число учитываемых ими будущих периодов, может быть меньше интервала времени, на котором рассматривается динамика. Тогда необходимо рассматривать скользящее принятие решений,

12 В когнитивном анализе принято выделять управляемые факторы (т. е. те факторы, на которые непосредственно воздействуют игроки), релаксационные факторы (те, которые изменяются только вследствие изменений других факторов, но не явных действий игроков) и целевые факторы (от значений которых зависят предпочтения игроков или лиц, оценивающих ситуацию). В общем случае множество целевых факторов может пересекаться с множеством управляемых или с множеством релаксационных факторов.

при котором игроки могут брать или не брать на себя обязательства друг перед другом о выборе определенных действий (см. модели динамических активных систем в работе [34]).

9. Моменты времени выбора игроками своих действий. В частности, возможны следующие варианты: «импульсное» управление (термин, принятый в когнитивном анализе) — когда действия игроков явно влияют на изменения факторов только в одном (как правило, в начальном) периоде или в течение нескольких первых периодов, а дальше имеет место релаксационная динамика. Управление может быть непрерывным — когда действия игроков явно влияют на изменения факторов в каж-

13

дом периоде .

10. Множества факторов, контролируемых различными игроками. В рассмотренной выше динамической игре динамика каждого фактора зависит в общем случае от действий всех игроков. В частном случае возможно выделение для каждого игрока множества непосредственно управляемых им факторов. Множества факторов, управляемых различными игроками, могут пересекаться или пересечения могут быть запрещены.

11. Последовательность ходов. Выше считалось, что в каждом периоде времени игроки принимают решения (выбирают действия) одновременно. Последовательность выбора агентами действий может быть различна внутри одного временного интервала — получаем в случае двух агентов многошаговые иерархические игры [42, 45], в случае большего числа агентов — многошаговые многоуровневые иерархические игры [46]. Или различные агенты могут выбирать свои действия в различные временные интервалы — получаем аналог игр в развернутой форме или позиционных игр.

12. Возможность образования коалиций. Принимая решения, агенты могут обмениваться информацией, договариваться о совместных действиях и перераспределении выигрышей, что приведет к кооперативной игре [47, 48].

Комбинируя различные значения признаков по каждому из перечисленных оснований классификации, а также выбирая тот или иной вид когнитивной карты, можно, с одной стороны, систематически перечислить различные виды «когнитивных игр». С другой стороны, любую конкретную игру можно попытаться отнести к тому или иному классу.

13 Естественно, в общем случае у каждого игрока может быть собственная последовательность моментов времени, в которые выбранные им действия в явном виде влияют на изменение значений тех или иных факторов.

4. ЛИНЕЙНЫЕ ИМПУЛЬСНЫЕ «КОГНИТИВНЫЕ ИГРЫ»

Рассмотрим «когнитивную игру», которая в соответствии с введенной выше классификацией:

1) линейная;

2) происходит в условиях общего знания без информационной дискриминации игроков;

3) детерминированная;

4) дискретная;

5) с терминальными критериями выигрыша игроков, зависящими только от значений факторов;

6) с бесконечным интервалом времени;

7) без ограничений совместной деятельности;

8) с программным принятием решений дальновидными игроками (число учитываемых ими будущих периодов не меньше интервала времени, на котором рассматривается динамика);

9) с импульсным управлением, влияющим на начальные приращения значений факторов;

10) с непересекающимися множествами факторов, управляемых различными игроками;

11) с одновременным выбором действий игроками в начальный момент времени;

12) с невозможностью образования коалиций.

Напомним, что под решением игры понимается

прогнозируемый устойчивый исход взаимодействия игроков [6]. Так как «устойчивость» исхода игры (совокупность действий игроков) можно трактовать по-разному, соответственно различным трактовкам могут возникать различные типы решения (равновесия игры) — см. подробное обсуждение различных концепций равновесия в работах [5, 6, 49—51].

Предположим, что14:

13) динамика значений факторов описывается выражением (1);

14) матрица А такова, что все ее собственные значения содержатся внутри окружности единичного радиуса на комплексной плоскости;

15) множества игроков и факторов совпадают (И = М), и каждый игрок имеет возможность воздействовать на фактор, номер которого равен номеру этого игрока;

16) целевая функция /-го игрока Жт ^ Ж1 определяет размер его выигрыша в зависимости от значений всех (в общем случае) факторов, / е N

17) целевые функции игроков зависят от вектора «установившихся» значений факторов (см. выражение (7)): /{ = /{(¥те), / е N

18) игроки однократно, одновременно и независимо в нулевой момент времени выбирают на-

14 Некоторые из предположений 13—20 являются частными случаями одного из предположений 1—12.

чальные значения соответствующих факторов15, т. е. т

обозначим условно хг- = х;(0) = у.(0), / е N

19) множества допустимых действий игроков Х{

= [х- , х+ ] с Ж1, где —то < х- < х+ < +то, / е N;

20) пп. 1—19 являются общим знанием среди игроков.

Обозначим х; = х..(0), / е N, х = (х1, х2,..., хи).

Базовым понятием теории игр является понятие игры Г в нормальной форме [6, 51], которая задается перечислением множества игроков N (принимающих решения однократно, одновременно и независимо в условиях общего знания), множеств их допустимых действий (х.. е X). е N и целевых функций (Е(х)). е № т. е.: Г = N (х. е X.). е №

(ВД), е *}.

Одна и та же игра в нормальной форме может «порождать» множество других игр различных типов. Например, отказываясь от предположения о наличии общего знания и вводя структуру информированности игроков I — см. подробности в работе [33], получаем рефлексивную игру: Г1 = N (х, е X) е N, (т\ е N, 1}.

Если предположить, что выигрыши игроков зависят от значений факторов, которые, в свою очередь, зависят (эта зависимость определяется когнитивной картой С — см. выражения (1), (3) и (6)) от действий игроков, т. е. ^(х) = /(хБх), / е N, то получим «когнитивную игру»: Гс = {Ж, (х. е Х) е N,

(ВД), е N С}.

К игре Гс уже можно применить весь богатый инструментарий, накопленный в теории игр.

Отметим, что, базируясь на одной и той же игре Г в нормальной форме, можно, варьируя структуры информированности (когнитивные карты), построить множество рефлексивных (соответственно — когнитивных) игр.

«Когнитивную игру» Гс, удовлетворяющую свойствам 1—20, назовем линейной импульсной «когнитивной игрой». Рассмотрим в качестве иллюстрации частный случай, когда предпочтения игроков линейны: /■(¥сю) = £ у..¥х., т. е.

У е N

р(х) = £ £ №**,

у е N к е N

(8)

где {у..} — известные константы, причем без потери общности можно считать, что X. = [0; 1], / е N.

В линейных системах типа (8) в рамках предположения 19 у каждого игрока существует доминантная стратегия (т. е., действие, максимизирующее его целевую функцию независимо от игровой обстановки — действий других игроков [6]):

х? = sign(a й), где а ш = £ у. /, k е N sign(г) =

у е N

1, г > 0 г < 0

Обозначим р. = £ а... Тогда суммарный выи-

!Е N

грыш агентов (критерий Бентама в экономике общественного благосостояния [4])

(9)

У е N

Такая модель условно может рассматриваться как импульсная, поскольку если, как предполагалось выше, у() = 0, г < 0, то р;.(0) = у(0), з е М.

Парето-оптимальное (доставляющее максимум выражению (9)) действие /-го игрока есть р

х. = sign(p.), / е N.

Если V / е N sign(a .) = sign(Д■), то равновесие в доминантных стратегиях эффективно по Парето. Если 3 / е N: sign(a й) ^ sign(p.), то требуется согласование интересов игроков. Если между игроками допустимы взаимные платежи, то можно найти условия (ограничения на систему взаимных платежей), при выполнении которых удается согласовать интересы игроков (см. подробности в работах [7, 52]).

5. ВОЗМОЖНЫЕ НАПРАВЛЕНИЯ РАЗВИТИЯ МОДЕЛИ

Линейная импульсная «когнитивная игра» описана в рамках предположений 1—20. Возможным направлениям развития модели соответствует ослабление или изменение вводимых предположений. Изменение одного или нескольких предположений 1—12 приведет к принципиально новой модели (см. Заключение), а модификация предположений с тринадцатого по девятнадцатое — к «локальному» изменению модели линейной импульсной «когнитивной игры».

Например, предположение 15 можно модифицировать, предположив, что п т т и задано разбиение {N■}г■ е N множества М, т. е. N. п N. = 0,

j ^ /, /, j е N, и N ■ = N (содержательно, N. — мно-

!Е N

жество факторов, контролируемых /-м игроком), / е N. Можно также допустить, что на один фактор могут воздействовать несколько игроков (правда, пока не ясно, как в общем случае формализовать такое воздействие). Или считать, что есть управляемые игроками факторы, а есть релаксацион-

ные. Или модифицировать предположение 16, сузив и (или) «персонифицировав» множества целевых факторов, или допустив, что предпочтения агентов — нечеткие и имеют иерархическую структуру (см. работу [19]). Или изменить предположение 18, задав начальное состояние и считая, что игроки выбирают начальные импульсы, и т. д.

Перспективным также представляется усложнение предположения 17. Первый шаг — ввести затраты на выбор того или иного первоначального изменения значения фактора, а также добавить нелинейность — например, выигрыш в виде индикаторных функций окрестностей желаемой ситуации (когда, «попадая» в окрестность некоторой целевой точки, игроки получают фиксированные выигрыши, а «промахиваясь», не получают никакого выигрыша).

И так далее — можно легко сгенерировать множество различных вариантов (выбор конкретного варианта должен диктоваться, в значительной степени, содержательными соображениями) и исследовать их аналитически и (или) «тестировать» их на имитационных моделях.

ЗАКЛЮЧЕНИЕ

В настоящей работе мы попытались посмотреть на когнитивные модели в смысле игрового взаимодействия участников ситуации. Наверное, не стоит настаивать на использовании термина «когнитивная игра» (так как имеется более общий термин «динамическая игра» — см. обсуждение во Введении). Однако в ряде научных направлений это понятие позволяет корректно определить предмет и аппарат исследования16. Вспомним, что широко распространенный в когнитивном анализе термин «когнитивная карта» не является самодостаточным, так как когнитивная карта — частный случай динамической системы (сравните выражения (1) и (7)). Тем не менее, все чаще под когнитивной моделью понимают (по крайней мере, специалисты по математическому моделированию) именно когнитивную карту. Другими словами, наличие для «когнитивных игр» самостоятельного «места под солнцем» обосновывается простотой и богатством качественных содержательных интерпретаций результатов анализа динамики процессов, описываемых когнитивной картой и

16 Для специалистов по теории игр образование термина «когнитивная игра», наверное, естественно, так как эта игра получается посредством расширения канонической игры в нормальной форме путем добавления когнитивной карты, отражающей связь между действиями игроков и переменными, от которых зависят их выигрыши. Для специалистов по когнитивному анализу более привычным и интуитивно корректным будет, наверное, термин «игра на когнитивной карте».

происходящих под влиянием решений, принимаемых заинтересованными субъектами.

Рассмотрение «когнитивных игр» представляется полезным как для когнитивного анализа (благодаря применению теоретико-игрового аппарата расширяются возможности корректного описания взаимодействия активных субъектов), так и для теории игр (применение когнитивных моделей дает возможность рассматривать слабо формализуемые и описываемые на качественном уровне ситуации).

Полученные в настоящей работе результаты, заключающиеся, по сути, в корректном сведении линейной импульсной «когнитивной игры» к классической игре в нормальной форме (см. § 5), представляются более чем скромными. Тем более грандиозными на их фоне видятся такие перспективные задачи будущих исследований, как теоретическое изучение и практическое применение моделей «когнитивных игр», перечисленных в § 2: нелинейных, рефлексивных, иерархических, кооперативных, описывающих принятие качественных решений (на основе нечетких и (или) вероятностных и (или) функциональных когнитивных карт) в условиях неопределенности.

Наряду с теоретическим исследованием аналитических решений «когнитивных игр» чрезвычайно актуальным представляется имитационное когнитивное моделирование динамики факторов как результата взаимодействия активных субъектов, влияющих на ситуацию.

ЛИТЕРАТУРА

1. Воробъев Н.Н. Теория игр для экономистов-кибернетиков. — М.: Наука, 1985. — 272 с.

2. Shubik M. Game Theory in the Social Sciences: Concepts and Solutions. — Massachusetts: MIT Press, 1982. — 514 p.

3. Мулен Э. Кооперативное принятие решений: аксиомы и модели. — М.: Мир, 1991. — 464 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Mas-Collel A., Whinston M.D., Green J.R. Microeconomic Theory. — N.-Y.: Oxford Univ. Press, 1995. — 981 p.

5. Myerson R.B. Game Theory: Analysis of Conflict. — London: Harvard Univ. Press, 1997. — 584 p.

6. Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. — М.: СИНТЕГ, 2002. — 148 с.

7. Новиков Д.А. Теория управления организационными системами. — М.: Физматлит, 2007. — 584 с.

8. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. — М.: Радио и связь, 1982. — 144 с.

9. Робертс Ф.С. Дискретные математические модели с приложениями к социальным, биологическим и экологическим задачам. — М.: Наука, 1986. — 496 с.

10. Вайсборд Э.М., Жуковский В.И. Введение в дифференциальные игры нескольких лиц и их приложения. — М.: Советское радио, 1980. — 304 с.

11. Жуковский В.И., Салуквадзе М.Е. Некоторые игровые задачи управления и их приложения. — Тбилиси: Мецниереба, 1998. — 462 с.

12. Абрамова Н.А. О развитии когнитивного подхода к управлению слабоструктурированными объектами и ситуациями // Тр. VII междунар. конф. «Когнитивный анализ и управление развитием ситуаций». — М.: ИПУ РАН, 2007. — С. 9—15.

13. Tolman E. Cognitive Maps in Rats and Men // Psychological Review. — 1948. — N 55. — P. 189—208.

14. Корноушенко Е.К., Максимов В.И. Структуризация целенаправленного взаимодействия участников в сложных ситуациях // Тр. I-й междунар. конф. «Когнитивный анализ и управление развитием ситуаций». — М.: ИПУ РАН, 2001. — С. 118—135.

15. Корноушенко Е.К. Моделирование ситуаций с использованием «расщепленных» когнитивных карт // Тр. VII-й междунар. конф. «Когнитивный анализ и управление развитием ситуаций. — М.: ИПУ РАН, 2007. — С. 137—141.

16. Кубрякова Е.С. О когнитивной лингвистике и семантике термина «когнитивный» // Вестник ВГУ / Сер. «Лингвистика и межкультурная коммуникация». — 2001. — № 1. — С. 4—10.

17. Кузнецов О.П., Кулинич А.А., Марковский А.В. Анализ влияний при управлении слабоструктурированными ситуациями на основе когнитивных карт // Человеческий фактор в управлении. — М.: КомКнига, 2006. — С. 311—344.

18. Кулинич А.А. Выбор сторонников в неструктурированных конфликтных ситуациях (когнитивный подход) // Тр. междунар. конф. «Интеллектуальное управление: новые интеллектуальные технологии в задачах управления» (ICIT'99). Переславль-Залесский, 6—9 декабря 1999 г. (www.raai.org/library).

19. Кулинич А.А., Титова Н.С. Интеграция нечетких моделей динамики и оценивания ситуаций // Тр. V-й междунар. конф. «Когнитивный анализ и управление развитием ситуаций». — М.: ИПУ РАН, 2005. — С. 107—117.

20. Кулинич А.А. Систематизация когнитивных карт и методов их анализа / Когнитивный анализ и управление развитием ситуаций // Тр. VII-й междунар. конф. «Когнитивный анализ и управление развитием ситуаций». — М.: ИПУ РАН, 2007. — С. 50—56.

21. Методы формирования сценариев развития социально-экономических систем / В.В. Кульба, Д.А. Кононов, С.А. Косяченко, А.Н. Шубин. — М.: СИНТЕГ, 2004. — 296 с.

22. Информационная безопасность систем информационного управления / В.В. Кульба и др. — М.: Наука, 2006. — Т. 1. — 496 с.; Т. 2. — 438 с.

23. Максимов В.И. Структурно-целевой анализ развития социально-экономических ситуаций // Проблемы управления. — 2005. — № 3. — С. 30—38.

24. Нижегородцев Р.М, Грибова Е.Н. Сценарный подход в задачах экономического прогнозирования // Теоретические основы и модели долгосрочного макроэкономического прогнозирования. — М.: МФК, 2004. — С. 205—295.

25. Axelrod R. The Structure of Decision: Cognitive Maps of Political Elite. — Princeton: Princeton University Press, 1976. — 404 p.

26. Когнитивный подход в управлении / З.К. Авдеева, С.В. Коврига, Д.И. Макаренко, В.И. Максимов // Проблемы управления. — 2007. — № 3. — С. 2—8.

27. Нижегородцев Р.М. Информационная экономика. Кн. 3. Взгляд в Зазеркалье: технико-экономическая динамика кризисной экономики России. — М.: МГУ, 2002. — 170 с.

28. Горелова Г.В. Позиционные игры на взаимодействующих когнитивных моделях // Тр. VI междунар. Конф. «Когнитивный анализ и управление развитием ситуаций». — М.: ИПУ РАН, 2006. С. 185—191.

29. Горелова Г.В. Модели задач принятия решений на иерархических динамичных когнитивных картах взаимодействия сложных систем // Там же. — С. 163—172.

30. Тулупьев А.Л., Николенко С.И., Сироткин А.В. Байесовские сети. Логико-вероятностный подход. — М.: Наука, 2006. — 607 с.

31. Kosko B. Fuzzy Cognitive Maps // International Journal of Man-Machine Studies. — 1986. — Vol. 1. — P. 65—75.

32. Юдицкий С.А., Мурадян И.А., Желтова Л.В. Моделирование динамики развития конфигураций организационных систем на основе сетей Петри и графов приращений // Проблемы управления. — 2007. — № 6. — С. 26—34.

33. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. — М.: СИНТЕГ, 2003. — 160 с.

34. Новиков Д.А., Шохина Т.Е. Механизмы управления динамическими активными системами. — М.: ИПУ РАН, 2002. — 124 с.

35. Петросян Л.А., Томский Г.В. Динамические игры и их приложения. — Л.: Изд-во ЛГУ, 1982. — 252 с.

36. Малинецкий Г.Г. Хаос. Структуры. Вычислительный эксперимент: введение в нелинейную динамику. — М.: Наука, 1997. — 255 с.

37. Молодцов Д.А. Устойчивость принципов оптимальности. — М.: Наука, 1987. — 280 с.

38. Лефевр В.А. Конфликтующие структуры. — М.: Советское радио, 1973. — 158 с.

39. Новиков Д.А., Чхартишвили А.Г. Прикладные модели информационного управления. — М.: ИПУ РАН, 2004. — 130 с.

40. Таран Т.А., Шемаев В.Н. Метод моделирования рефлексивного управления на основе когнитивных карт» // Тр. IV междунар. конф. «Когнитивный анализ и управление развитием ситуаций. — М.: ИПУ РАН, 2004. — С. 132—139.

41. Айзекс Р. Дифференциальные игры. — М.: Мир, 1967. — 480 с.

42. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. — М.: Радио и связь, 1991. — 288 с.

43. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. — М.: Наука, 1974. — 456 с.

44. Гермейер Ю.Б. Игры с непротивоположными интересами. — М.: Наука, 1976. — 327 с.

45. Кононенко А.Ф, Халезов А.Д., Чумаков В.В. Принятие решений в условиях неопределенности. — М.: ВЦ АН СССР, 1991. — 211 с.

46. Новиков Д.А. Сетевые структуры и организационные системы. — М.: ИПУ РАН, 2003. — 102 с.

47. Губко М.В. Механизмы управления организационными системами с коалиционным взаимодействием участников. — М.: ИПУ РАН, 2003. — 118 с.

48. Оуэн Г. Теория игр. — М.: Мир, 1971. — 230 с.

49. Вилкас Э.Й. Оптимальность в играх и решениях. — М.: Наука, 1990. — 256 с.

50. Данилов В.И. Лекции по теории игр. — М.: Российская экономическая школа, 2002. — 140 с.

51. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. — М.: Высшая школа, 1998. — 304 с.

52. Новиков Д.А. Механизмы стимулирования как инструмент согласования интересов // Управление инновациями и стратегия инновационного развития России: Сб. научн. тр. — М.: Доброе слово, 2007. — С. 43—55.

® (495) 334-75-69, e-mail: novikov@ipu.ru

Статья представлена к публикации членом редколлегии

О.П. Кузнецовым. □

«Когнитивные игры»: линейная импульсная модель Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Новиков Д. А.

Похожие темы научных работ по математике , автор научной работы — Новиков Д. А.

COGNITIVE GAMES: A LINEAR STEP-FUNCTION MODEL

Текст научной работы на тему ««Когнитивные игры»: линейная импульсная модель»