Научная статья на тему 'Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз'

Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз Текст научной статьи по специальности «Математика»

CC BY
308
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БЕСКОАЛИЦИОННЫЕ ИГРЫ / РАВНОВЕСИЕ ПО НЭШУ / АКТИВНОЕ РАВНОВЕСИЕ / РАВНОВЕСИЕ УГРОЗ И КОНТРУГРОЗ / NONCOOPERATIVE GAMES / NASH EQUILIBRIUM / ACTIVE EQUILIBRIUM / EQUILIBRIUM OF OBJECTIONS AND COUNTEROBJECTIONS

Аннотация научной статьи по математике, автор научной работы — Жуковский В. И., Кудрявцев К. Н., Самсонов С. П., Высокос М. И., Бельских Ю. А.

Исследованию позитивных и негативных свойств «царствующей» в экономике концепции равновесия по Нэшу (как решения бескоалиционной игры) посвящен непрекращающийся поток публикаций. В основном они связаны с неединственностью, и, как следствие, отсутствием эквивалентности, взаимозаменяемости, внешней устойчивости, а также неустойчивостью к одновременному отклонению от таких решений двух и более игроков. Игра «дилемма заключенных» выявила также свойство «улучшаемости». Подробному анализу таких «отрицательных» свойств для дифференциальных позиционных игр посвящена книга В.И. Жуковского и Т.Н. Тынянского «Равновесные управления многокритериальных динамических задач»,1984. Вывод, к которому приводят авторы этой книги: либо использовать те ситуации равновесия по Нэшу, которые одновременно свободны от некоторых из указанных недостатков, либо вводить новые решения бескоалиционной игры, которые, обладая достоинствами ситуации равновесия по Нэшу, позволяли бы избавиться от отдельных ее недостатков. Одной из таких возможностей для дифференциальных игр, связанной с концепцией угроз и контругроз, и посвящена настоящая статья. Используемые в ней понятия угроз и контругроз основываются на известной в классической теории игр концепции угроз и контругроз. Теоретическим основанием этой концепции стали работы Э.И. Вилкаса 1973 года. Термин «активное равновесие» предложил Э.Р. Смольяков в 1983 г., понятие равновесия угроз и контругроз в дифференциальных играх было использовано впервые, по-видимому, в 1974 г. Э.М. Вайсбордом, затем подхвачено первым автором настоящей статьи в упомянутой выше книге 1984 г., но применялась и применяется эта концепция в дифференциальных играх, по нашему мнению, недостаточно широко. Этот факт и «вызвал к жизни» настоящую работу. В ней выявляется класс дифференциальных игр двух лиц, в которых отсутствует привычная ситуация равновесия по Нэшу, но наличествует равновесие угроз и контругроз.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLASS OF DIFFERENTIAL GAMES WITH NO NASH EQUILIBRIUM, BUT WITH EQUILIBRIUM OF OBJECTIONS AND COUNTEROBJECTIONS

A nonstop stream of publications is devoted to the investigation of positive and negative properties of Nash equilibrium concept prevailing in economics (as solution of noncooperative game). Mostly they are related to non-uniqueness and, as a consequence, to the lack of equivalence, interchangeability, external stability as well as instability to simultaneous deviation of such solutions of two and more players. The game "dilemma of prisoners" also revealed the property of "ability to improve".The book Equilibrium Control of Multi-criteria Dynamic Problems (V.I. Zhukovskiy and N.T. Tynyanskiy, M.: MSU, 1984) is devoted to detailed analysis of such "negative" properties for differential positional games.The authors of this book com to the following conclusion: either make use of those situations of Nash equilibrium that are simultaneously free from some of the stated disadvantages, or introduce new solutions of noncooperative game. Such solutions having the merits of Nash equilibrium situation would allow to get rid of its certain disadvantages. The present article is devoted to one of such possibilities for differential games related to concepts of objections and counterobjections. The concepts of objections and counterobjections used in it are based on the concepts of objections and counterobjections well-known classical game theory. The papers of E.I. Wilkas [1973] are devoted to theoretical questions of this concept. The term "active equilibrium" suggested R.E. Smolyakov in 1983, the notion of equilibrium of objections and counterobjections in differential games was first used apparently by E.M. Vaisbord in 1974, and then it was picked up by the first author of the present article in the above mentioned book [1984], but this concept was applied and is being applied in differential games, in our opinion, insufficiently widely. This fact "called to life" the present paper. In it the class of differential games of two persons is revealed, where the usual Nash equilibrium situation is absent, but the equilibrium of objections and counterobjections is present.

Текст научной работы на тему «Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие угроз и контругроз»

Математика

УДК 519.833.2 DOI: 10.14529/mmph180201

КЛАСС ДИФФЕРЕНЦИАЛЬНЫХ ИГР, В КОТОРЫХ ОТСУТСТВУЕТ РАВНОВЕСИЕ ПО НЭШУ, НО СУЩЕСТВУЕТ РАВНОВЕСИЕ УГРОЗ И КОНТРУГРОЗ

В.И. Жуковский1, К.Н. Кудрявцев2, С.П. Самсонов1, М.И. Высокос3, Ю.А. БельскиХ

Московский государственный университет им. М.В. Ломоносова, г. Москва, Российская Федерация

2 Южно-Уральский государственный университет, г. Челябинск, Российская Федерация

3 Государственный гуманитарно-технологический университет, г. Орехово-Зуево, Российская Федерация

E-mail: kudrkn@gmail.com

Исследованию позитивных и негативных свойств «царствующей» в экономике концепции равновесия по Нэшу (как решения бескоалиционной игры) посвящен непрекращающийся поток публикаций. В основном они связаны с неединственностью, и, как следствие, отсутствием эквивалентности, взаимозаменяемости, внешней устойчивости, а также неустойчивостью к одновременному отклонению от таких решений двух и более игроков. Игра «дилемма заключенных» выявила также свойство «улучшаемости». Подробному анализу таких «отрицательных» свойств для дифференциальных позиционных игр посвящена книга В.И. Жуковского и Т.Н. Тынянско-го «Равновесные управления многокритериальных динамических задач», 1984. Вывод, к которому приводят авторы этой книги: либо использовать те ситуации равновесия по Нэшу, которые одновременно свободны от некоторых из указанных недостатков, либо вводить новые решения бескоалиционной игры, которые, обладая достоинствами ситуации равновесия по Нэ-шу, позволяли бы избавиться от отдельных ее недостатков. Одной из таких возможностей для дифференциальных игр, связанной с концепцией угроз и контругроз, и посвящена настоящая статья. Используемые в ней понятия угроз и контругроз основываются на известной в классической теории игр концепции угроз и контругроз. Теоретическим основанием этой концепции стали работы Э.И. Вилкаса 1973 года. Термин «активное равновесие» предложил Э.Р. Смольяков в 1983 г., понятие равновесия угроз и контругроз в дифференциальных играх было использовано впервые, по-видимому, в 1974 г. Э.М. Вайсбордом, затем подхвачено первым автором настоящей статьи в упомянутой выше книге 1984 г., но применялась и применяется эта концепция в дифференциальных играх, по нашему мнению, недостаточно широко. Этот факт и «вызвал к жизни» настоящую работу. В ней выявляется класс дифференциальных игр двух лиц, в которых отсутствует привычная ситуация равновесия по Нэшу, но наличествует равновесие угроз и контругроз.

Ключевые слова: бескоалиционные игры; равновесие по Нэшу; активное равновесие; равновесие угроз и контругроз.

1. Введение

Рассматривается бескоалиционная линейно-квадратичная дифференциальная игра двух лиц в нормальной форме, заданная упорядоченной четверкой,

Г = ({1,2|, S,[U, Ц^Ц (U, ^ х0)}г=12).

В Г множество порядковых номеров игроков {1,2}, управляемая динамическая система S описывается векторным линейным дифференциальным уравнением

S — x = A(t ) x + u1 + u2, x(t0) = x0. (1)

Здесь фазовый n -вектор x e Rn ; момент окончания игры J = const > 0, а само это время продолжительности игры t e [0, J] ; управляющее взаимодействие i -го игрока ut e Rn (i = 1,2); n X n -матрица A(t), будем предполагать непрерывность на [0, J] элементов матрицы A(t) и обозначать

этот факт A( ) e CnXn [0, J] ; пара (t, x) e [0, J] X Rn - текущая позиция игры Г, (t0, x0) - начальная позиция.

Стратегию i -го игрока Ut будем отождествлять с n -вектор-функцией ut (t, x) (обозначим Uj — ut (t, x) ), тогда множество стратегий i -го игрока

и ={U, — u (t, x), u, (t, x) = Qi (t ) x | "Qi (•) e [0, J]} ; таким образом, выбор своей стратегии i -м игроком сводится к выбору n X n -матрицы Qi(t) (i = 1,2).

Игра с течением времени развертывается следующим образом. Игроки, не объединяясь в коалиции, выбирают каждый свою стратегию Ut — Qi (t)x ; в результате образуется ситуация игры U = (U1,U2) eU = U1 XU2 . Затем находят решение x(t), t0 < t < J, системы (1) при ut = Qt(t)x (i = 1,2), т. е.

x(t) = [A(t) + Q1 (t) + Q2 (t)]x(t), x(t0 ) = x0 . (2)

Система линейных однородных дифференциальных уравнений (2) с непрерывными на [t0, J] коэффициентами имеет непрерывное продолжимое на [t0, J] решение x(t). Потом игроки строят реализации выбранных ими стратегий ui [t] = Qi (t)x(t) (i = 1,2) и соответствующую реализацию ситуации u[t] = (u1[t],u2[t]), которую образуют два непрерывных на [t0, J] вектора (u1[t],u2[t]).

Функцию выигрыша i -го игрока тогда образует определенный на непрерывных тройках ( x(t ), u1[t ], u2[t ] 11 e [t0, J]) квадратный функционал

J

Jx(U1,U2,t0,x0) = x'(J)Cix(J) + J (u[[t]Di1u1[t] + u2[t]Dl2u2[t])dt (i = 1,2), (3)

f0

где, не уменьшая общности, считаем постоянные nXn -матрицы С,,Оу (i, j = 1,2) симметричными; штрих сверху означает операцию транспонирования ( x' - n -вектор-строка), значение функционала (3) называется выигрышем i -го игрока. Полагаем, что игроки заинтересованы выбрать в игре Г свою стратегию таким образом, чтобы увеличить свой выигрыш.

Цель настоящей статьи - выявить достаточно общий класс линейно-квадратичных дифференциальных позиционных игр двух лиц в нормальной форме вида Г, в котором отсутствует равновесие по Нэшу, но одновременно существует равновесие угроз и контругроз.

Прежде всего приведем для игры Г четыре базовых определения: максимума по Парето, равновесия по Нэшу, активного равновесия и равновесия угроз и контругроз.

Для этого игре Г поставим в соответствие двухкритериальную динамическую задачу

Г =(S,U ,{J (U, t0, ъ)}^).

Здесь динамическая система S совпадает с (1), множество альтернатив U совпадает с множеством ситуаций {U} игры Г, два критерия Jt(U,t0,x0) (i = 1,2) определены в (3).

Цель ЛПР (лица, принимающего решения) в задаче Гу - выбор такой альтернативы (ситуации) UP e U , при которой оба векторных критерия (3) принимали бы одновременно возможно большие значения. Общепринятым здесь является понятие максимума по Парето.

Определение 1.1. Альтернатива (ситуация) UP = (Up,Up)e U называется максимальной по Парето в Гу , если при "U eU и "(t0, x0) e [0, J) X Rn , x0 Ф 0n несовместна система неравенств

J (U, t0, x0) > Ji (UP, t0, x0) (i = 1,2),

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

из которых хотя бы одно строгое, при этом JP = (J1(UP, t0, х0), J2(UP, t0, x0)) называется максимумом по Парето.

Отметим здесь два обстоятельства, которые сразу следуют из определения 1.1. Свойство 1.1. Справедлива импликация:

Jt (U,t0,x>) > Ji(UP,t0,x0) ^ Jj (U,t0,x0) < Jj (UP,t0,x0) (i, j = 1,2; j Ф i).

Свойство 1.2. Если для a = const > 0

max{J1 (U,t0,x0) + aJ2(U,t0,x0)} = Idem{U ® UP}, (4)

UeU 1 J

то ситуация UP - максимальна по Парето в Гу ; напомним, что Idem{U ® UP} означает выражение в фигурных скобках из (4), где U заменено на UP .

Перейдем к понятиям равновесных решений игры Г, где J = (J1, J2).

t0, x0^

Определение 1.2. Пара (Ue, Je = J(Ue,t0,x0))e UXR2 называется равновесием по Нэшу иг-

ры Г , если

1 <ТТ Г/2,'0,x0) = J1(U = (U1 ,U2),'0,x0

max J1(U1,U2,t0,x0) = J1(Ue = (U1e,U2),t0,x0) = J^,

U1eU1

max J2U,U2,t0,X0) = J2Ue = (Uf,U2),^X0) = J2

U2eU2

при любых "(t0, x0) e [0,^) X Rn , x0 -Ф- 0n (0n - нулевой n-вектор).

Более громоздко выглядит понятие равновесия угроз и контругроз.

Пусть U = (U1 , U2) некоторая фиксированная ситуация игры Г. Будем считать, что у первого игрока имеется угроза на ситуацию U, если у него существует стратегия U( e U1 , что

J1U,U2,t0,X0) > J1(U1,U2,t0,X0). (5)

Наличие угрозы не означает ее обязательное применение, а лишь «animus denuntiandi»1. Применение угрозы «выгодно» первому игроку, так как при этом, согласно (5), его выигрыш увеличивается по сравнению с выигрышем в ситуации U .

В ответ на угрозу первого игрока U[ у второго имеется «неполная» контругроза, если у него существует стратегия U2 e U2 , при которой

J1 (U/, U2, t0, Х0) < J1 (U1, U2, t0, Х0), (6)

и у второго имеется «полная» контругроза, если существует такая стратегия U2 e U2 , что одновременно с неравенством (6) выполняется

J2U,U2,t0,Х0) > J2U,U2,t0,X0) . (7)

При наличии «неполной» контругрозы второй игрок за счет выбора своей стратегии U2 приводит, согласно (6), выигрыш первого (угрожающего) игрока к значению, не превосходящему его первоначальный выигрыш в ситуации U (но может и уменьшиться!). Все происходит как по девизу Наполеона I «Order, contre-order, disorder»2. Таким образом, наличие «неполной» контругрозы «сводит к нулю» применение угрозы. В дополнение к этому, «полная» контругроза «толкает» второго к применению Uс, ибо в (полученной в результате угрозы и контругрозы) ситуации (U1, U2) выигрыш второго увеличится по сравнению с выигрышем в ситуации (U/ ,U2), сложившейся при реализации угрозы.

Аналогично определяется угроза второго игрока на ситуацию U и ответная контругроза («полная» или «неполная») первого.

Естественно, если в ответ на каждую угрозу на U любого игрока у другого имеется контругроза («полная» или «неполная»), то игроку не имеет смысла применять угрозу, ибо в результате

1 Намерение пригрозить (лат.)

2 Распоряжение - контрраспоряжение - беспорядок (фр.)

реакции (контругрозы) на эту угрозу другого игрока его выигрыш не увеличится (но может и уменьшиться!). Этим еще раз подтверждается знаменитый закон римского права «Aequum est ne-minem cum alterius detrimento et injuria fieri locupletiorem»1.

Определение 1.3. Ситуация UP = (Up,Up)e U называется активно равновесной в игре Г,

если при любой начальной позиции (t0, х0) e [0, J) X Rn , x0 Ф 0n

1) UP максимальна по Парето в Гу,

2) в ответ на каждую угрозу U¡ e U¡ любого игрока у оставшегося имеется неполная контругроза.

Определение 1.4. Пара (UP, JP) e U X R2 называется равновесием угроз и контругроз в игре

Г , если при любой начальной позиции (t0, x0) e [0, J) X Rn , x0 Ф 0n

1) U - максимальна по Парето в игре Г,

2) в ответ на каждую угрозу любого игрока у оставшегося имеется полная контругроза, здесь JP = (Jp, Jp), Jp = J(UP, t0, x0) (i = 1,2).

Из определений 1.3 и 1.4 следует, что любое равновесие угроз и контругроз является одновременно активным равновесием, а равновесие по Нэшу (в силу определения 1.2) не допускает угроз, причем только «самые хорошие» из них (одновременно максимальные по Парето) будут активно равновесными.

Как уже упоминалось в аннотации, приведенные здесь понятия угроз и контругроз основываются на известной [1] в классической теории игр концепции угроз и контругроз. На ее основе в [1, с. 109] определяются устойчивые коалиционные структуры, впервые, по-видимому, рассмотренные для дифференциальных коалиционных игр в [2]. Концепция «угроз и контругроз» для дифференциальных игр введена Э.М. Вайсбордом в 1974 г. в статье [3], развита В.И. Жуковским в [4, 5]. Теоретическим аспектам посвящены работы Вилкаса [6, 7]. Свой способ классификации решений бескоалиционной игры, включающий как составную часть равновесие угроз и контругроз, предложил Э.Р. Смольяков [8] в 1983 г., им же был введен термин «активное равновесие»; развитие этого направления в [9, 10]. Понятие активного равновесия для позиционных, дифференциальных, бескоалиционных игр активно использовалось в [11]. Способ доказательства существования активной равновесности был предложен первым автором настоящей статьи в [11] и затем успешно применен при установлении факта существования такого решения в дифференциальных позиционных играх, описываемых уравнениями с частными производными [12, 13], стохастическими [14], в банаховом пространстве [15], уравнениями с постоянным запаздыванием [16], при использовании программных стратегий [9].

Активно равновесным ситуациям и равновесиям угроз и контругроз присущи все «положительные» свойства ситуации равновесия по Нэшу [17, с. 49]:

- во-первых, они устойчивы к отклонению отдельного игрока;

- во-вторых, удовлетворяют свойству индивидуальной рациональности;

- в-третьих, совпадают с седловой точкой в случае антагонистической игры.

Одновременно с тем эти неулучшаемые равновесия свободны от следующих недостатков

[17, с. 58]:

- существуют в ряде случаев, когда равновесие по Нэшу отсутствует (например, как в настоящей статье);

- в отличие от равновесия по Нэшу неулучшаемы и внутренне устойчивы;

- наличие в игре равновесия по Нэшу влечет существование некоторых видов неулучшаемых равновесий, выигрыши всех игроков при которых не меньше, чем при равновесии по Нэшу;

- наконец, лишь «самые хорошие» ситуации равновесия по Нэшу (которые одновременно максимальны по Парето) являются равновесиями угроз и контругроз. Однако лишь частные виды игр обладают такими «самыми хорошими» решениями.

Заметим, что указанные свойства имеют место и для позиционных дифференциальных бескоалиционных игр, а в [17] использована математическая формализация стратегий игроков и порожденных ими движений динамической системы, предложенная Н.Н. Красовским в [18].

1 Справедливость требует, чтобы никто не обогащался незаконно и в ущерб другому лицу (лат.)

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

2. Максимальные по Парето ситуации и выигрыши

Далее D < 0 (> 0) означает, что квадратичная форма xDx определенно отрицательна (соответственно, положительна).

Прежде всего приведем вспомогательное утверждение (лемму 2.1) Рассмотрим двухкритериальную статическую задачу

Г| = ^X = R2", {f (u) = «1 Dfl«i + u2D,2U2 ],= J ,

в которой ЛПР (лицо, принимающее решение u = (u1,u2) е R2" ) выбирает альтернативу (ситуацию) u с целью достичь одновременно возможно больших значений обеих компонент векторного критерия f (u) = (f1 (u), f2 (u)). Аналогом определения 1. 1 здесь будет:

альтернатива uP максимальна по Парето в Г2 , если при "u е R2" несовместна система неравенств f (u) > f (uP) (i = 1,2), из которых хотя бы одно строгое. Ниже используем аналог свойства 1.2.

Лемма 2.1. Если в задаче Г симметричные матрицы Dj , Ci и числа Л,,, Лу (i, j = 1,2; i Ф j) такие, что

Dtt > 0 (i = 1,2), D12 < 0, D21 < 0,

Л11 Л 22 <l12 ^ то существует a = const > 0 , при котором квадратичная форма

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

f (u, a) = f1(u) + af2(u) = u1D1 (a)u1 + u2 D2 (a)u2 становится определенно отрицательной; здесь D1(a) = D11 +aD21 , D2(a) = D12 +aD22, кроме того Аи - наибольший корень характеристического уравнения D(L) = det[Dii - hEn ] = 0 (i = 1,2);

— Лу (i Ф j) так же наибольший (по абсолютной величине наименьший) корень ¿>(Л) = det || Dij — ЛЕ" ||= 0 , En - единичная nXn -матрица.

Доказательство. В силу симметричности всех четырех используемых в Г2 матриц Du, Dj (i, j = 1,2; i Ф j) корни обоих характеристических уравнений D(L) = 0 и ¿>(Л) = 0 вещественны, причем корни D(L) = 0 положительны, а ¿>(Л) = 0 - отрицательны. Обозначим наибольший из n корней уравнения det[Dii — LEn ] = 0 через Аи , а наибольший из корней уравнения ¿>(Л) = 0 через

— Лц , тогда из [19, с. 281] следует, что при "u, е R" будет

u'Dhu, £Lnu',u, (i = 1,2),

u2D^^ £ , U1D21U1 £ Л2lUlUl .

Поэтому

f (u,a) = f1(u) + af2(u) = u1D1(a)u1 + u2D2(a)u2 = u^D11 +aD21]u1 + u2[D12 +aD22]u2 £

(L11 — a/l21)u1 u1 + (—Л12 + aЛ22)u2u2 . Поэтому f (u, a) £ 0 "u е R2n , если

Л11 — аЛ21 < 0, — Л12 +аЛ22 < 0.

Таким образом, при

Л1 <а<Л^ f (u,a)£0 "u = (u1,u2)е R2n . (9)

Л21 Л22

Заметим, что, во-первых, (9) имеет место, если Л11 Л22 <Л21 Л12 , во-вторых, можно считать

a = 1[Лп/Л21 +Л2/Л22] .

Лемма 2.2. Решениям x(t) системы X = K(t)x, x(t0) = x0 , где K()е CnXn[0, J] присуще свойство

x0 Ф 0n ^ x(t) Ф 0n "tе [t0, J].

Здесь 0п - ноль-вектор из Яп .

Доказательство от противного: пусть 3г1 е [10, г\ такой, что х(^) = 0п . Тогда бы в момент г1 через позицию (^,0п) «проходило» бы два решения системы х = К (1) х: именно тривиальное

х(1)(1) = 0" и нетривиальное х(2)(11), «порожденное» ненулевым начальным условием х0 Ф 0п , что противоречит теореме единственности решения линейного дифференциального уравнения. Утверждение 2.1. Если в дифференциальной игре Г

А1 > 0, £>22 > 0, Д2 < 0, £>21 < 0, С, < 0 (, = 1,2), Л11 Л22 < Л2 Л , (10)

то максимальная по Парето ситуация ир = (ир, ир) в двухкритериальной задаче Гу будет

UP = (Up ,Up) - (uf (t, x), u2 (t, x)) = uP (t, x) = (Qp (t) x, Qp (t) x) = (-D- (a)0P (t) x, - D2-1 (a)0P (t) x),

(11)

где симметричная непрерывная на [0, J] n X n -матрица:

J

QP (t) = [ X-1 (t )]'{C (a) + J X-1 (t)[Df1 (a) + D2-1 (a)] [ X (t)]' dt}-1 X (t) (12)

D1(a) = D11 + aD21, D2(a) = D12 + aD22, C(a) = С1 + aC2, a = 1

L11 + /¡12

(13)

. ^21 Л22 .

Л,, - наибольший корень характеристического уравнения det[Dг■г■ - ЛЕп \ = 0 (, = 1,2) г,

= /1(и1г ,ир, 10, х0) - УДг0, х0) - наибольший корень характеристического уравнения det[В г] -1Е" \ = 0, (,, ] = 1,2; , Ф ;);

Еп - единичная п X п -матрица, X(1) - фундаментальная матрица решений векторного уравнения х = А(г)х, X(г?) = Еп .

Доказательство. Найдем максимальную по Парето ситуацию ир , применяя лемму 2.1 (конкретно, используя (4)) и метод динамического программирования (МДП) из [20, с. 112\. Сам МДП, с учетом свойства 1.2, здесь сведется к осуществлению двух этапов. Если для задачи Гу удалось найти число а > 0, непрерывно дифференцируемую скалярную функцию V(1, х), а также две п -вектор-функции и, (1, хУ) (■ = 1,2) такие, что

V(г, х) = хСх "х е Яп (С = С +аС 2). (14)

ЭТАП I.

С помощью скалярной функции

ЭУ

ЭV

W (t, x, u1u2,V) =-+

Эt

dx

(A(t) x + u1 + u2) + u1D1(a)u1 + u2 D2(a)u2

ЭУ

найти две п -вектор функции и, (1, х,У) (■ = 1,2), исходя из (-= grаdх V )

Эх

тах Ж (г, х, и1, и2,У) = Мет {и, ® и, (г, х,У)}, (15)

щи2

при любых ге [0,гУ\, хе Яп , У е Я . Достаточные условия существования и(г,х,У) в (15) сводятся к

,ЭЖ =ЭУ Эи 'и } = Эх Э 2Ж

(—)u (t,x,v) = —+ 2D, (a)u (t, x,V) = 0n (, = 1,2), (16)

Эм 2

= 2D, (a) < 0 (, = 1,2), (17)

где, напомним, 0п - нулевой п -вектор-столбец из Яп , а Д(а) < 0 в силу леммы 2.1. Из (16) получаем

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

ыг (Г, х,У) = -1 Д-1(а) ЭУ (/ = 1,2), (18)

2 ох

и тогда

ЭУ

Ж и, х, ы^, х,У ),У) = Ж и, х,У ] =-+

О

ЭУ

/ /

- 41 ЭУ) [В1~1(а)+^2-1(а)] ОУУ ■

Ох

ЭТАП II. Найдем решение вида У = Ур (¿, х) = х'0рх, 0р = [0р ^)] ' дифференциального уравнения с частными производными

Ж [¿, х,У ] = 0

и граничным условием (С = С1 + аС2),

У{&, х) = х Сх "х е Я" , т. е. для "tе [0,г?], "хе Я" имеет место

Ж х,У (t, х) = х ©р (t) х] = 0, У (г, х) = х Сх "х е Я" . Оба эти требования выполнены, если п X п -матрица 0р (0 удовлетворяет матричному дифференциальному уравнению типа Риккати (0пХп - нулевая п X п -матрица)

0р (t) + 0р ^)Л^) + Л ^)0р (t) - 0р (t)[£- (а) + ^ (а)]0р ^) = 0"Х" , 0р (г) = С = С1 +аС2 .

Решение 0р (0 полученного матричного уравнения типа Риккати имеет [20, с. 65] вид (12), здесь учтена импликация С, < 0 (, = 1,2) ^ С1 + аС2 < 0 . Наконец, из (18) и

У^,х) = х'0р(t)х ^ ОУ(t,х) = 20р(t)х приходим к справедливости (11). Таким образом, макси-Эх

мальная по Парето ситуация ир в задаче Гу имеет вид (11)—(13).

Перейдем к построению максимальных по Парето выигрышей Зр = (J1 (ир, t0, х0), J2 (ир, t0, х0)) = (J1P, Jр) опять-таки с помощью идей МДП.

Утверждение 2.2. Пусть выполнены требования (10) (из утверждения 2.1) и для дифференциальной игры Г удалось найти две скалярные непрерывно дифференцируемые функции вида У (^ х) = х'0,- ^)х (, = 1,2) и такие, что

1) У (г, х) = х Сх "х е Я" ; (19)

2) система из двух уравнений с частными производными

ЭЭУ- + [ Эр-) (^)х + х'0р (0Мг ^ )0р (t) х ) = 0, У (г, х) = х'Сгх "х е Я" (, = 1,2), (20)

имеет решение вида У (^ х) = х'0, (t)х , [0 , (t)]/ = 0 , (t) (, = 1,2).

Тогда при любой начальной позиции х0) е [0,г) XЯ" , х0 ^ 0" имеет место

JP = J¡(UP,to,х0) = х00Р(to)xo (, = 1,2). В (20) непрерывные " X " -матрицы

N^) = Л^) - (Б-1 (а) + £>2-1 (а))0р ^),

М, (0 = 0р (0[Д~1 (а) В,1В1-1 (а) + Б- (а) Д2 Б-1 (а)]0р (t) (, = 1,2), "X" -матрицы Д(а), 0р(t) приведены в (12), (13), а симметричная "X" -матрица

(21)

0,(0 = [7)]'{С, -1¥'(т)0р(т)М,(т)0р(т)¥{т)йт}7-1(t), (, = 1,2). (22)

г

Наконец, 7(0 — фундаментальная матрица решения однородной системы у = Ni (0у, 7(#) = Е" . Доказательство. Составим две скалярные функции

г

/

Щ [', х, У ] = ЭУ + ( ^ | (N(')х + [ир (', х)]' Оаир (', х) + [ир (', х)]' Опир (', х))а (I = 1,2), (23) Э' ^ Эх ^

причем ир (t, х) - п -вектор функции, определенные в (11).

Ищем решение У (', х) (I = 1,2) системы из двух уравнений с частными производными

Щ [', х, У ] = 0, У (#, х) = х ' С х "х е Яп (I = 1,2) (24)

в виде квадратичной формы у (t, х) = х'0 г- (t)х , [0 г- (t)]/ = 0 ^ (') (I = 1,2). Установим два факта.

Во-первых. Решению системы (23), (24) присуще свойство

Ухо) = ¿,(ир,to,хо) (/ = 1,2), (25)

где ситуация ир = (ир,ир) имеет вид (11). В самом деле, если ир — ситуация из (11)—(13), то, согласно (23) и (24), решение хр (') системы х = N(t)х, х('о) = х0 , с учетом (23) и (24) при

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

( ЭУ (t, хр (t)) ^

х = xP (t) будет

0 = W[t, xP (t),y (t, xP (t))] = ЭУ ^ (t)) +

Эх

N(t) x (t) +

+£[ир}(t,хр(t))]'О/Р(',хр(t)) = ЩМ Vtе [^г].

1 =1

Интегрируя обе части этого тождества в пределах от 'о до г?, с учетом граничных условий из (24), приходим к

г г иуР Р (')) г 2

о = | Щ [' л = | . )) л+1 £ [ир (t, хр ('))]' ои (t, хр (' ))Л =У Р (г, хр (г)) - у (^, хо) +

'о 'о 'о]=

J 2 J 2

'........"" ........ "" " "" — .......- - ..........,0,xo)

to J =1 io J=1

+i (t, xP (t))]' DjuP (t, xP (t))dt = x,(J)Cix(J) + ji[uP (t, xP (t))]'Dj«P (t, xP (t))dt - y (to, xo) =

= JI (ир, 'о, хо) - У ('О, хо) (I = 1,2). Откуда сразу следует справедливость равенств (25).

Во-вторыа, установим, что решение У (', х) (I = 1,2) системы (24) имеет вид У(', х) = х'0, (')х, где симметричная п Xп -матрица 0 , (') представима в виде (22). В самом деле, подставив У = х '0 , (') х в (24), получаем справедливость (24), если только 0 , (') (I = 1,2) является решением матричного линейного неоднородного дифференциального уравнения

0,+0^+ N 0 I +0р (' )М ,(' )0р (') = опхп, 0,(г) = С (I = 1,2). (26)

Нетрудно подстановкой 0 {(') из (22) убедиться, что симметричная п X п -матрица 0 Д') из (22) в самом деле является решением (26), что и завершает доказательство утверждения 2.2.

3. Леммы о мажорантах

Перейдем к утверждениям, которые,

- во-первых, позволяют сразу судить об отсутствии в дифференциальных играх вида Г равновесия по Нэшу,

- во-вторых, реализуют для Г концепцию равновесия угроз и контругроз.

Причем эти сведения получаются только на основании специальной знакоопределенности квадратичных форм, используемых в интегральных слагаемых функций выигрыша (3).

Не оговаривая особо, далее предполагаем выполненными ограничения (1о), и поэтому существует максимальная по Парето в Г^ ситуация

ир = (ир ,ир) - ир (', х) = (ир (', х), ир (', х)) = (ар (')х, др (')х) = (-О1-10р (')х, -О-10р (')х).

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

Лемма 3.1. Пусть в (3) при , = 1 матрица £>п > 0, тогда для максимальной по Парето в Г^

¿0 , х0 ) > 0 хакал, что при V р — р (и , 10 , х0 )

ситуации ир существует постоянная р(1) (ир, х0) > 0 такая, что при "р — р(1) (ир, ^, х0) > 0 и

стратегии первого игрока и + рх будет

I (и/,и2р, to,х0) > Л (ир,ир,х0) (27)

для любых начальных позиций (t0,х0)е [0,#)X[Я" \{0"}].

Доказательство. В утверждении 2.2 установлено существование функции Беллмана У (^ х) = х/01 (0х, для которой

/1 (ир, х0) = Уl(to, х0) = х0 01 (to) х0, (28)

где непрерывная на [0, г?) матрица 01 (t) имеет вид (22) (, = 1).

Рассмотрим теперь стратегию первого игрока и1 + и[ х) = р х , а величину числового параметра р> 0 определим ниже. Вследствие симметричности матрицы Б11 и дополнительно Б11 > 0 имеет место

и1011и1 — 1 ЦмЦ2 = Я1ы'ы1 "и1 е Я", (29)

где Ц — евклидова норма и \ > 0 — наименьший корень характеристического уравнения аег[Б11 -1Е" ] = 0 [21, с. 89].

Далее будем использовать п Xп -матрицу 0р t е [0,#] из (12) и (13), а из (11) стратегию

и2р ^бР (0х второго игрока и неравенство (29).

Рассмотрим теперь скалярную функцию

Ж х] = Ж1 (t, х, и1 (t, х) = р х, ир ^, х) = Ор ^)х, У1 (t, х) = х'01 ^)х) =

ЭУ1(t, х) ГЭУМ, х) , .. и ч р/ Ч1 = —^ + [—' [ Л^) х + и1 ^, х) + ир ^, х)] + Эt Эх

+[и1 (t, х)]' Б11и11 (t, х) + [ир ^, х)]' Д2ир (t, х) — ©ДО ' ор ' 1 г>2^ , .Ллр^^п

х' —^х + 2х'01 (t)[Л(t) + рЕ" + ^ № + х'1Р2Епх + х'[б2р а)]]'А202 (t)х = = х' I + ©l(t)[Л(t) + рЕ" + б2р (t)] + [Л,(t) + рЕ" + О (t)]']©l(t) + 1р2 Е" +

+[Ор (t)]] БО. (0

х = хМ (¿,р) х.

Стоящая здесь в фигурных скобках п X п -матрица М (¿,р) симметрична и имеет следующий вид (с учетом епеп =п)

М^,р) =1р2 Е" + 2р0^) + Г ^),

здесь п X п -матрица

К (0 = 0^) + 20[ Л(t) + $ (t)] + О (t)]' а).

Элементы матрицы М(¿,р) непрерывны по t е [0,г] и, следовательно, равномерно ограничены на компакте [0, г?], множитель р2 входит только в диагональные элементы матрицы М(^ р); напомним, что \ > 0 является наименьшим корнем характеристического уравнения det [Б11 - 1Еп ] = 0 , а Еп — единичная п X п -матрица. Поэтому постоянную р = р(1) (и р, t0, х0) > 0 можно выбрать настолько большой, чтобы все ведущие миноры матрицы М (¿,р) стали положительными "t е [0,г] и "р —р(1)(и1). Согласно критерию Сильвестра и лемме 2.2 [5, с. 88] квадратичная форма х'М ^,р)х будет определенно положительной для всех t е [0,#] и постоянных

р>р(1)(иР, *0, х0) (так как знак х'М(',р)х определяется знаком квадратичной формы

?2 -

b \nx'x).

Фиксируем постоянную р(1) > Ь(1) (и Р, х0) и тогда

ЩГ, х] = х'М1С,р(}))х > 0 "х е[0,Ф], "х е Я"\{0п}. Обозначим через х(') решение (при t е [0, Ф]) векторного уравнения

х = Л(')х + Ь(1)х + бР(0х, х0 = х('0). Так как [х0 Ф 0п] ^ [хх^) Ф 0п "tе Ф]], то, согласно (29), будет

ЖxX(t)] > 0 "е [^Ф].

Отсюда, интегрируя обе части последнего неравенства в пределах от t0 до ^ и учитывая граничное условие ©ДФ) = С, и/ [t] = Ь(1) x(t), получаем

Ф Ф С Л

0 < Г Ж ^, хС)] Л = Г | + []' [Л(t)х + Ь(1)Епх + ЯР С)х] 1 Л +

0 I I Эt Эх х=х(г)

+ Г |х'Ь(1)Д^х + [ЯР С)х]^12б2Р (t)х} Л =

-1 1 1 х=х с)

'0

Ф С Л Ф

= Л ЭУ(Эх(')) I^ + Г |[и1 [t]] 'ДХ[t] + [иР^]]'Д2иР^]}л' =

= х'(Ф)С1х (Ф) + Г |[и1 [t ]]' ДХ [t ] + [иР [t ]]' Д2иР [t ]} Л - УС0, х0) =

= ли! ,иР, to, х0) - У^, х0). Отсюда и из 11 (ир, иР, t0, х0) = У1 (^, х0) сразу следует справедливость леммы 3.1.

Замечание 3.1. Рассмотрим внутреннюю оптимизационную задачу в игре Г: найти

тах 11(и1,иР,t0,х0) при ограничении (1), фиксированной стратегии иР е и2 второго игрока и

и1еи1

любых х0)е [0,Ф)X[Я" \{0п}]. Фактически лемма 3.1 утверждает, что при Б11 > 0 и х0 Ф 0п эта задача максимизации не имеет решения. В самом деле, какую бы стратегию и1 е и1 первый игрок не выбрал, всегда существует стратегия и е и1 этого игрока такая, что

(Ц^1,иР) > /1(и1,и2Р) "^0, х0) е[0,Ф) X [Я" \{0"}] . Такой результат позволяет сразу «отметать» (при выборе решения игры Г) те концепции принятия равновесных решений игровых задач вида Г, в условиях которых фигурирует максимизация функции выигрыша первого игрока (например, не применять при 011 > 0 концепцию равновесия по Нэшу в качестве принципа выбора решения в игре Г).

Таким образом, в дифференциальной игре Г ситуация равновесия по Нэшу ие е и не существует. Одновременно с тем, стратегия первого игрока и + р х , "р > р(1) = р(1) (иР, t0, х0) реализует, согласно (5), угрозу первого игрока на максимальную по Парето ситуацию иР . В следующих леммах считаем начальную позицию , х0) «замороженной» и совпадающей с той, которая фигурирует в лемме 3.1, а в «угрожающей» стратегии первого игрока и + р х также считаем скалярную постоянную р = р(1) . Напомним, что, не оговаривая особо, считаем выполненными ограничения (10).

Лемма 3.2. Справедлива импликация

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

D12 < 0 ^ 3^(2) = b(2)(UP,U<): "b > b(2), (30)

¡1(Ul,Ub,t0,x0) <I1(UP,t0,x0), (31)

т. е. стратегия Ub + b x реализует в игре Г неполную контругрозу на ситуацию UP е U .

Доказательство проведем, как и в лемме 3.1, в два этапа. На первом построим функцию Беллмана V1 (t, x) = x'01 (t)x, такую, что

I1(U1 UP, t0, x0) = V1(t0, x0,b), (32)

на втором установим, что $b(2) =b<(2)(U1 ,Up) = const такая, что имеет место импликация (30),

(31).

ЭТАП I. Рассмотрим скалярную функцию («диктуемую» МДП)

WW1[t, x,V1] = W1(t,x,u1 (t,x) = b(1) x,up (t,x) = —D2"1(a)0P (t)x, V1) =

= Э^ + ^ ,[ ^(t) + b(i) En — D—1 (a)0P (t )]x + [ui (t, x)]' D1 X (t, x) + at ox

+[up (t, x)]D12uP (t, x) =0V1 + [ A(t) + b(1) En — D—1(a)0P (t )]x + (33)

at ax

+x '[(b(1))2 D11 + 0P (t )D—1 (a) D12 D—1(a)0P (t)] ' x. Тогда WW([t, x,V1(t, x) = x0((t)x] = 0, если 01у (t) будет решением матричного линейного неоднородного дифференциального уравнения

0У + 0У [ A(t) + b(1) En — D2—1 (a)0P (t)] + [ A'(t) + b(1) En — 0P (t )D2—1 (a)]0y + +(b(1) )2 D11 + 0P (t )D2—1D12 D—10p (t) = 0nxn, 0{ (J) = C1.

Решение этого уравнения 0f (t) существует, единственно и продолжимо на [t0, J] . Пусть n-

t0,

вектор xy (t), t е [t0, J] является решением однородного линейного дифференциального вектор-

ного уравнения

x = [ A(t) + b(1) En — D2—1 (a)0P (t )]x, x(t0) = x0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Тогда с учетом (33)

W [t, xy (t), V (t, xy (t)) = (xy (t))' 01 (t) xy (t)] =

= ЭУ1(Л хУ (t)) + [и1у (t, ху (t ))]'Б 1и1у (t, ху (t)) + [ир (t, ху ^))]' Б12ир (t, ху ^)) = 0.

Эt

Интегрируя обе части этого равенства в пределах от ^ до г?, получаем (с учетом и1у = и( )

V (J, xy (J)) — V1(t0, x0) + f [(u 1y [t ])' D11u 1y [t ] + [u2P [t ]] ' D^up [t ]]dt =

<0

= I1 (U1У ,U P, t0, x0) — y(t0, x0) = 0, что и доказывает справедливость (32).

ЭТАП II. Здесь учтем, что из симметричности D12 < 0 ^ $Л12 = const > 0 такого, что

II 2

u2D12u2 £ —Л12u2 u2 = —Л12 u2 "u2 е Rn, (34)

где —Л12 наибольший корень характеристического уравнения det [D12 — ЛЕп ] = 0. С учетом (33) вернемся к скалярной функции W1(t, x,V1), где учтем (34) и V1(t,x) = x'01y (t)x:

W 1[t, x] = i^[t, x, u[ (t, x), u2 =bx, V = x '0y (t) x] =

0V I ov —1 + —1

I 0x У

I Эт7 V

. Л (A(t) + b(1)En +bEn) x + (b(1))2 x'Dnx +

at

+b2 x'D12 x £ —Л12Ь2 x'x + 2 x'0y (t)[ A(t) + b(1) En + bEn ]x +

+(р(1))2 х'В11х = х'Щ,р) х, ЬС ,р) = Ь 'С ,р), где ЬС ,р) = -Л12р2 Е" + 2р©1' С) + »1С).

Элементы матрицы Ь(',р) непрерывны на компакте [0,Ф] и, следовательно, равномерно ограничены, множитель р2 входит только в диагональные элементы матрицы Ь(',р). Тогда существует достаточно большое положительное число р (2) , такое, чтобы при р> р (2) все ведущие миноры матрицы Ь(',р) нечетного порядка были отрицательны и четного - положительны. Согласно [22, с. 88], при р>р(2) квадратичная форма х'Ь($,р)х становится определенно отрицательной.

Воспользуемся снова уже введенной выше скалярной функцией Ж1 [^ х], где заменим х на хс ^) - решение однородного векторного дифференциального уравнения

хс = [ ЛС) + р(1) +р]хс, хс С0) = х0. В силу леммы 2.2 хс ^) Ф 0п при "t е [t0, Ф], и поэтому для р > р (2) будет

Ж1[',хсС)] = (хсС)) 'Ь(',р)хсС) < 0 "tе [Ф . Интегрируем в пределах от t0 до Ф обе части полученного строгого неравенства, с учетом И (t, х) = р(1)х, V (Ф, х) = хС1х, х = хс ^) приходим к

Ф Ф

0 < |WW.lt,хсС)Л = |{ЭМдр) + [ЭШэ£Ш]'[Л(') + р + р)Е"]хсС) +

*0 *0

+[U (t, (xc (t))]' D1 U (t, (xc (t)) + b2 (xc (t ))'D12 xc (t )}dt =

J J

= J ^^(t)) dt + J [(«/[t])'D1lM1 [t] + b2(xc (t))'D12xc (t)]dt =

'0

J

= У (J, xc (J)) - Vy(to, xo) + J [(ul [t ]) ' Dy yul [t ] + b2( xc (t))' D12 xc (t )]dt =

<0

= Ii(Ul ,U 2, to, xo) - V (to, xo). Отсюда и из (32) сразу получаем справедливость (31).

Аналогично доказательству лемм 3.1 и 3.2 устанавливается справедливость следующих утверждений (леммы 3.3 и 3.4). В них, напомним, считаем «замороженными» начальную позицию

(to, xo), n X n -непрерывную матрицу Qp (t), стратегию U2 + ft2 x неполной угрозы, фигурирующих в леммах 3.1 и 3.2 и выполнены ограничения (Ю).

Лемма 3.3. Имеет место импликация D22 > o ^ 3b(3) =b(3)(UP,U,to,x) = const > o такая, что при "b ^ b(3), и стратегии U£ + b x будет

12(U1 ,U2,to,xo) >12(U^,uP,to,xo), (35)

т. е. стратегия второго игрока U2 ^(b = max(b<(2),b<'3^})x завершает полную контругрозу (совместно с U2 + b(2) x) на угрозу первого на UP .

Доказательство начнем с применения неполной контругрозы Uf первого игрока на UP , такой, что

I1U ,U p, to, xo) > I1UP U P, to, xo). На основании максимальности по Парето Up , а также свойства 1. 1 (из раздела 1 настоящей

статьи) получаем

12U U 2 , to, xo) < 12 (UP ,U 2 , to, xo).

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

Затем, также как в доказательстве леммы 3.1, во-первых, установим существование функции

Беллмана У2(^ х) = х '02^) х, для которой

12 (и 1 ,ир, to, х0) = У2^0, х0) = xO02(to) х0, (36)

во-вторых, с учетом А2 = 0'22 и А2 > 0 и учетом неравенства

и2Б22и2 — 1 ||и21|2 = 12и2 и2 "и2 е Я", где 1 > 0 — наименьший корень характеристического уравнения det [А2 - 1Еп ] = 0, составим Ж2^,х] = Ж2[t,х,иу (t,х) = р(1)х,и2 =рх, У2 = х'02^)х] =

/

: ЭV2(t, x) + ( 0V2 | (A(t)x + uy (t, x) + u2) + [uy (t, x)] 'D21u1y (t, x) + b2x D22x > Ot ^ Ox у

= ^ J0« + 02(t)[A(t) + b(1) En +bEn ]x + [ A' (t) + b(1) En +bEn ]02(t) + (b(1))2 D21 +^2b2 En

x=

= x M 2(t,b) x.

При достаточно больших b>b(3), квадратичная форма M2(t,b) > 0 (согласно критерию Сильвестра), кроме того, решение x(t) системы

x = [ A(t) + b(1) En +bEn ]x, x(<0) = x0. При x0 Ф 0 ^ x(t) Ф 0n (лемма 2.2), поэтому x'(t)M2(t,b)x(t) > 0 "tе [t0, J]. Интегрируя обе части этого неравенства, получаем

J J dV (t (t)) J

0 < f x (t)M2(t,b)x(t)dt = f —2(<,x( )) dt + f {u([t]D21u([t] + u| [t]D22u2 [t]}dt =

¡0 ¡0 ¡0

= 12 (U\ ,U2c , t0, x0) — Vi(t0, x0). Отсюда и из (36) сразу следует справедливость (35). Аналогично лемме 3.2 доказывается

Лемма 3.4. Пусть Ut2 - угроза второго игрока на максимальную по Парето в Гу ситуацию UP = (UP ,U f), т. е. нашлась стратегия U2 + b x b>b> 0 такая, что

I2UP,U2,t0,x0) > 12(Up,UP,t0,x0) (такая стратегия U2t существует вследствие D22 > 0 ). Тогда справедлива импликация

D21 < 0 ^ 3b(4) = const > 0: "b = const > b(4) 12(Ub,U2,t0,x0) <I2{UP,t0,x0) стратегии Ub b x , т. е. Ub реализует в игре Г неполную контругрозу на ситуацию UP .

для

4. Доказательство существования

Теорема 4.1. Предположим, что для игры Г выполнены ограничения (10). Тогда тройка

(ир, 1р, 12р) = ((ир, и 2), /1(ир, to, х0), 12(ир, to, х0)) =

= ((-А-1 (а)0р (t) х, - А-1 (а)0р (t) х), х001 (to) х0, х002 (to) х0)

является равновесием угроз и контругроз для дифференциальной игры

Г = ({1,2|, X -(1.1),{и,},=1,2,{I, (и1,и 2, to, х0)}.=1,:

здесь матрица

0р (t) = [X-1 (t)] 'IС-1 (а) +1X-1 (т)[А1-1 (а) + А-1 (а)][X(т)]'¿т | X_1 (t),

В, (а) = Ви + аВ2/, С (а) = С1 + аС2, а =1 А + А

2 _ А1 Л22

где Лгг- - наибольший корень уравнения det[Вг■г■ -ЛЕп] = 0, —Ау - наибольший корень уравнения det[В у —АЕп ] = 0, X^) - фундаментальная матрица системы х = Л(')х , X(Ф) = Еп (/ , у = 1,2;/ Ф у), а симметричные матрицы 0 ■ (t) (/ = 1,2) определены в (22).

Доказательство. Во-первых, из В11 > 0 следует сразу два вывода: отсутствие в Г ситуации равновесия по Нэшу и наличие угрозы и( со стороны первого игрока на максимальную по Паре-то ситуацию ир в двухкритериальной задаче Гу (замечание 3.1). Существование максимальной по Парето ситуации и максимальных по Парето выигрышей в Гу (а также их явный вид при этом) получены в утверждениях 2.1 и 2.2 соответственно. Условие В21 < 0 позволяет построить неполную контругрозу ир второго игрока в ответ на угрозу первого (лемма 3.2), а В22 > 0 и

лемма 3.3 дают возможность довести второму игроку неполную контругрозу и2 до полной и2 . Одновременно требование В22 > 0 влечет отсутствие ситуации равновесия по Нэшу (не существует тах 12(и1,и2,t0,х0) при "и1 е и1) и возможность аналитически сконструировать второму

и2

игроку угрозу и2 е и2 на ир в игре Г:

12(Щ ,и 2, х0) < 12{ир, х0).

Условие В21 < 0 и лемма 3.4 обеспечивают существование неполной контругрозы ис е и1 первого игрока на угрозу и'2 второго:

12(ир,и2,х0) < 12{ир,to,х0).

Наконец, из максимальности по Парето ир и свойства 1.1 будет следовать

11(ир,и2,х0) < 11(ир,to,х0), а из В11 > 0 и леммы 3.1. получаем существование и с е и1 , такого, что

Лй,и2,to,х0) > 11(ир,и2,х0). Таким образом, мы установили, что в игре Г в ответ на угрозу на максимальную по Парето уац му 4.1.

ситуацию ир любого игрока, у оставшегося имеется полная контругроза, что доказывает теоре-

Заключение

Итак, в предлагаемой читателю статье установлено, что в линейно-квадратичной позиционной дифференциальной игре Г при выполнении ограничений (10) не существует ситуации равновесия по Нэшу и одновременно существует равновесие угроз и контругроз. Этот факт показывает настоятельную необходимость дополнительных исследований свойств этого равновесия, вопросов существования, нахождения других классов игр (и не дифференциальных тоже!), обладающих выявленным теоремой 4.1 свойством (отсутствием ситуации равновесия по Нэшу и одновременного существования равновесия угроз и контругроз). Интерес представляют и вопросы устойчивости коалиционных структур [23]. Этому вопросу авторы надеются посвятить дальнейшие исследования.

Литература

1. Оуэн, Г. Теория игр / Г. Оуэн. - М.: Изд-во ЛКИ/ИЯ^, 2010. - 216 с.

2. Жуковский, В.И. Равновесные управления многокритериальных динамических задач / В.И. Жуковский, Н.Т. Тынянский. - М.: Изд-во МГУ, 1984. - 224 с.

3. Вайсборд, Э.М. О коалиционных дифференциальных играх / Э.М. Вайсборд // Дифференциальные уравнения. - 1974. - Т. 10, № 4. - С. 613-623.

Жуковский В.И., Кудрявцев К.Н., Самсонов С.П. и др.

Класс дифференциальных игр, в которых отсутствует равновесие по Нэшу, но существует равновесие...

4. Вайсборд, Э.М. Введение в дифференциальные игры нескольких лиц и их приложения / Э.М. Вайсборд, В.И. Жуковский. - М.: Советское радио, 1980. - 304 с.

5. Zhukovskii, V.I. The Vector-Valued Maximin / V.I. Zhukovskii, M.E. Salukvadze. - N.Y. etc.: Academic Press, 1994. - 404 p.

6. Вилкас, Э.И. Формализация проблемы выбора теоретико-игрового критерия оптимальности / Э.И. Вилкас // Математические методы в социальных науках: Сб. статей. Вильнюс: Ин-т математики и кибернетики АН Лит. ССР, 1972. - Вып. 2. - С. 9-55.

7. Вилкас, Э.И. Решения: теория, информация, моделирование / Э.И. Вилкас, Е.З. Майминас.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- М.: Радио и связь, 1981. - 328 с.

8. Смольяков, Э Р. Теория конфликтных равновесий / Э.Р. Смольяков. - М.: УРСС, 2005. -301 с.

9. Смольяков, Э.Р. Обобщенное оптимальное управление и динамические конфликтные задачи / Э.Р. Смольяков. - М.: МАКС Пресс, 1983. - 232 с.

10. Смольяков, Э.Р. Равновесные модели при несовпадающих интересах участников / Э.Р. Смольяков. - М.: Наука, 1986. - 223 с.

11. Zhukovskii, V.I. Some Problems of Non-Antagonistic Differential Games / V.I. Zhukovskii // Mathematical Method in Operation Research: сб. науч. тр. - Bulgaria, Sofia: Academy of Sciences, 1985. - P. 103-195.

12. Biltchev, S.J. e- Z- Equilibrium in a Differential Game Described by a Parabolic System / S.J. Biltchev // Many Players Differential Game. - Bulgaria, Rousse: Technical Univ., 1984. - P. 47-52.

13. Tersian, St.A. On the Z-Equilibrium Points in a Differential Game / St.A. Tersian // Many Players Differential Game. - Bulgaria, Rousse: Technical Univ., 1984. - P. 106-111.

14. Gaidov, S.D. Z-Equilibrium in Stochastic Differential Game / S.D. Gaidov // Many Players Differential Game. - Bulgaria, Rousse: Technical Univ., 1984. - P. 53-63.

15. Rashkov, P.I. Sufficient Conditions for Z-Equilibrium in a Differential Game in Banach Spase / P.I. Rashkov // Many Players Differential Game. - Bulgaria, Rousse: Technical Univ., 1984. - P. 91-99.

16. Dochev, D.T. Existence of Z-Equilibrium in a Differential Game with Delay / D.T. Dochev, N.V. Stojanov // Many Players Differential Game. - Bulgaria, Rousse: Technical Univ., 1984. -P.64-72.

17. Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие угроз и контругроз / В.И. Жуковский. - М.: КРАСАНД, 2010. - 192 с.

18. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский,

A.И. Субботин. - М.: Наука, 1984. - 456 с.

19. Гантмахер, Ф.Р. Теория матриц / Ф.Р. Гантмахер. - М.: Физматлит, 2004. - 560 с.

20. Жуковский, В.И. Дифференциальные уравнения. Линейно-квадратичные дифференциальные игры. Учебное пособие для ВУЗов / В.И. Жуковский, А.А. Чикрий. - М.: Юрайт, 2017. -322 с.

21. Жуковский, В.И. Равновесие по Нэшу и по Бержу в одной линейно-квадратичной игре /

B.И. Жуковский, А.С. Горбатов, К.Н. Кудрявцев // Математическая теория игр и ее приложения.

- 2017. - Т. 9. - Вып. 1. - С. 62-94.

22. Воеводин, В.В. Матрицы и вычисления / В.В. Воеводин, Ю.А. Кузнецов. - М.: Наука, 1984. - 320 с.

23. Zhukovskiy, V.I.Coalition equilibrium in a three-person game / V.I. Zhukovskiy, K.N. Kudryavtsev // 2017 Constructive Nonsmooth Analysis and Related Topics (dedicated to the memory of V.F. Demyanov) (CNSA). - St. Petersburg, 22-27 May 2017. - pp. 1-4.

Поступила в редакцию 27 февраля 2018 г.

Bulletin of the South Ural State University Series "Mathematics. Mechanics. Physics" _2018, vol. 10, no. 2, pp. 5-21

DOI: 10.14529/mmph180201

CLASS OF DIFFERENTIAL GAMES WITH NO NASH EQUILIBRIUM, BUT WITH EQUILIBRIUM OF OBJECTIONS AND COUNTEROBJECTIONS

V.I. Zhukovskiy1, K.N. Kudryavtsev2, S.P. Samsonov\ M.I. Vysokos3, Yu.A. Belskih3

1 Lomonosov Moscow State University, Moscow, Russian Federation

2 South Ural State University, Chelyabinsk, Russian Federation

3 State University of Humanities and Technology, Orekhovo-Zuyevo, Russian Federation

A nonstop stream of publications is devoted to the investigation of positive and negative properties of Nash equilibrium concept prevailing in economics (as solution of noncooperative game). Mostly they are related to non-uniqueness and, as a consequence, to the lack of equivalence, interchangeability, external stability as well as instability to simultaneous deviation of such solutions of two and more players. The game "dilemma of prisoners" also revealed the property of "ability to improve".

The book Equilibrium Control of Multi-criteria Dynamic Problems (V.I. Zhukovskiy and N.T. Tynyanskiy, M.: MSU, 1984) is devoted to detailed analysis of such "negative" properties for differential positional games.

The authors of this book com to the following conclusion: either make use of those situations of Nash equilibrium that are simultaneously free from some of the stated disadvantages, or introduce new solutions of noncooperative game. Such solutions having the merits of Nash equilibrium situation would allow to get rid of its certain disadvantages. The present article is devoted to one of such possibilities for differential games related to concepts of objections and counterobjections. The concepts of objections and counterobjections used in it are based on the concepts of objections and counterobjections well-known classical game theory. The papers of E.I. Wilkas [1973] are devoted to theoretical questions of this concept. The term "active equilibrium" suggested R.E. Smolyakov in 1983, the notion of equilibrium of objections and counterobjections in differential games was first used apparently by E.M. Vais-bord in 1974, and then it was picked up by the first author of the present article in the above mentioned book [1984], but this concept was applied and is being applied in differential games, in our opinion, insufficiently widely. This fact "called to life" the present paper. In it the class of differential games of two persons is revealed, where the usual Nash equilibrium situation is absent, but the equilibrium of objections and counterobjections is present.

Keywords: noncooperative games; Nash equilibrium; active equilibrium; equilibrium of objections and counterobjections.

References

1. Owen G. Game theory. New York: Academic Press, 1995, 447 p.

2. Zhukovskiy V.I., Tynyanskiy N.T. Ravnovesnye upravleniya mnogokriterial'nykh di-namicheskikh zadach (Equilibrium control of multicriteria dynamic problems), Moscow: Izdatel'stvo MGU Publ., 1984, 224 p. (in Russ.).

3. Vaisbord E.M. O koalicionnyh differencial'nyh igrah (Coalition differential games). Differ. Uravn., 1974, Vol. 10, no. 4, pp. 613-623. (in Russ.).

4. Vaisbord E.M., Zhukovskii V.I. Introduction to Multi Player Differential Game and Their Application. New York etc., Gordon and Breach, 1988, 581 p.

5. Zhukovskii V.I., Salukvadze M.E. The Vector-ValuedMaximin. N.Y. etc.: Academic Press, 1994, 404 p. DOI: 10.1016/s0076-5392(08)x6114-4

6. Vilkas E.I. Formalizatsiya problemy vybora teoretiko-igrovogo kriteriya optimal'nosti (Formalization of the problem of choosing a game-theoretic criterion of optimality). Matematicheskie metody v sotsial'nykh naukakh: sb. statey. (Mathematical Methods in Social Sciences: a collection of articles). Vil'nyus, Institut matematiki i kibernetiki AN Lit. SSR Publ., 1972, Issue. 2, pp. 9-55. (in Russ.).

Жуковский В.И., Кудрявцев К.Н., Класс дифференциальных игр, в которых отсутствует

Самсонов С.П. и др. равновесие по Нэшу, но существует равновесие...

7. Vilkas E.I., Mayminas E.Z. Resheniya: teoriya, informatsiya, modelirovanie (Solutions: theory, information, modeling). Moscow, Radio i svyaz' Publ., 1981, 328 p. (in Russ.).

8. Smol'yakov E.R. Teoriya konfliktnykh ravnovesiy (Theory of Conflict Equilibria). Moscow, URSS Publ, 2005, 301 p. (in Russ.).

9. Smol'yakov E.R. Obobshchemoe optimal'noe upravlenie i dinamicheskie konfliktnye zadachi (Generalized optimal control and dynamic conflict problems). Moscow, MAKS Press Publ., 1983, 232 p. (in Russ.).

10. Smol'yakov E.R. Ravnovesnye modeli pri nesovpadayushchikh interesakh uchastnikov (Equilibrium models with non-coinciding interests of participants). Moscow, Nauka Publ., 1986, 223 p. (in Russ).

11. Zhukovskii V.I. Some Problems of Non-Antagonistic Differential Games. Mathematical Method in Operation Research. Bulgaria, Sofia, Academy of Sciences, 1985, pp. 103-195.

12. Biltchev S.J. e- Z- Equilibrium in a Differential Game Described by a Parabolic System. Many Players Differential Game. Bulgaria, Rousse: Technical Univ., 1984, pp. 47-52.

13. Tersian St.A. On the Z-Equilibrium Points in a Differential Game. Many Players Differential Game. Bulgaria, Rousse: Technical Univ., 1984, pp. 106-111.

14. Gaidov S.D. Z-Equilibrium in Stochastic Differential Game. Many Players Differential Game. Bulgaria, Rousse: Technical Univ., 1984, pp. 53-63.

15. Rashkov P.I. Sufficient Conditions for Z-Equilibrium in a Differential Game in Banach Spase. Many Players Differential Game. Bulgaria, Rousse: Technical Univ., 1984, pp. 91-99.

16. Dochev D.T., Stojanov N.V. Existence of Z-Equilibrium in a Differential Game with Delay. Many Players Differential Game. Bulgaria, Rousse: Technical Univ., 1984, pp. 64-72.

17. Zhukovskiy V.I. Vvedenie v differentsial'nye igry pri neopredelennosti. Ravnovesie ugroz i kon-trugroz (Introduction to differential games under uncertainty. The equilibrium of objections and counterobjections). Moscow, KRASAND Publ., 2010, 192 p. (in Russ.).

18. Krasovskiy N.N., Subbotin A.I. Pozitsionnye differentsial'nye igry (Positional-differential games). Moscow, Nauka Publ., 1984, 456 p. (in Russ.) [Krasovskii N.N., Subbotin A.I. Game-theoretical control problems. New York: Springer, 1988. 517 p.]

19. Gantmakher F.R. Teoriya matrits (Theory of matrices). Moscow, Fizmatlit Publ., 2004, 560 p. (in Russ.).

20. Zhukovskiy V.I., Chikriy A.A. Differentsial'nye uravneniya. Lineyno-kvadratichnye differentsial'nye igry (Differential equations. Linear-quadratic differential games). Moscow, Yurayt Publ., 2017, 322 p. (in Russ.).

21. Zhukovskiy V.I., Gorbatov A.S., Kudryavtsev K.N. Ravnovesie po Neshu i po Berzhu v odnoy lineyno-kvadratichnoy igre (Berge and Nash equilibrium in a linear-quadratic differential game), Mat. Teor. Igr Pril., 2017, Vol. 9, no. 1, pp. 62-94. (in Russ.).

22. Voevodin V.V., Kuznetsov Yu.A. Matritsy i vychisleniya (Matrices and calculations). Moscow, Nauka Publ., 1984, 320 p. (in Russ.).

23. Zhukovskiy V.I., Kudryavtsev K.N. Coalition equilibrium in a three-person game. 2017 Constructive Nonsmooth Analysis and Related Topics (dedicated to the memory of V.F. Demyanov) (CNSA), St. Petersburg, 22-27 May 2017, pp. 1-4. DOI: 10.1109/CNSA.2017.7974037.

Received February 27, 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.