УДК 517.977.1 © А. Ф. Клеймёнов
ПОСТРОЕНИЕ РЕШЕНИЙ НЭШЕВСКОГО И ШТАКЕЛЬБЕРГОВСКОГО ТИПОВ В ОДНОЙ НЕАНТАГОНИСТИЧЕСКОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ДВУХ ЛИЦ ПРИ НАЛИЧИИ ДИНАМИЧЕСКОЙ ПОМЕХИ1
В игре с простой динамикой на плоскости оба игрока действуют в классе стратегий с памятью, а реализация помехи является кусочно-непрерывной функцией. Определяются гарантированные выигрыши каждого игрока. Вводятся понятия равновесного по Нэшу решения и решения по Штакельбергу. От равновесного решения невыгодно отклоняться в одиночку, причем невыгодность понимается в смысле невозрастания гарантированного выигрыша уклониста. Найдены решения игры при некоторых фиксированных значениях параметров.
Ключевые слова: неантагонистическая дифференциальная игра двух лиц, стратегии с памятью, динамическая помеха, решения по Нэшу и Штакельбергу.
Динамика игры описывается уравнением
x = u + v + w, ||u|| ^ a, ||v|| ^ в, ||w|| ^ S, tо ^ t ^ x[to] = xo (1)
где x, u, v, w € R2 — векторы состояния, управления первого игрока, управления второго игрока и помехи, соответственно; [to,$] — заданный отрезок времени; а, в, S — заданные положительные числа. Цель i-го игрока, i = 1,2, заключается в максимизации функционала I = ^i(x[&]), где Ui — непрерывные функции.
Предполагаем, что оба игрока знают уравнение (1), ограничения на управления игроков и на помеху. В то же время игроки не имеют никакой информации о реализации помехи w[t],to ^ t ^ $. Известно только, что реализация является измеримой по Борелю функцией, удовлетворяющей ограничению. Предположим далее, что игроки знают всю предысторию фазового вектора x[-, to, t] = {х[т], to ^ т ^ t}. Тогда игроки могут действовать в классе стратегий с памятью. Формализация этих стратегий производится в соответствии с [1,2]. Движения (аппроксимационные и предельные), порожденные парой стратегий с памятью (U, V) определяются также аналогично [1,2].
Для заданной пары стратегий с памятью (U, V) и начальной позиции (t*,x*) вводится понятие гарантированного выигрыша i-го игрока. Даются определения нэшевских и штакельберговских решений. При определении нэшевских решений невыгодность отклонения игрока понимается в смысле невозрастания его гарантированного выигрыша. Вводятся две вспомогательные антагонистические позиционные дифференциальные игры Г1 и Г2 [3], в каждой из которых один игрок максимизирует свой собственный функционал, а другой игрок вместе с помехой противодействует ему. Далее формулируются задача нахождения таких пар стратегий, которые обеспечивают игрокам выигрыши, не меньшие гарантированных им в играх Г^ Множество решений задачи составляет основу для построения множества нэшевских равновесий.
Найдены решения игры при некоторых фиксированных значениях параметров.
Список литературы
1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
2. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.
3. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.
Поступила в редакцию 15.02.2012
A. F. Kleimenov
Construction of Nash and Stackelberg types’ solutions in a non-antagonistic differential two-person game in the presence of dynamic disturbances.
Keywords: non-antagonistic differential two-person game, strategies with memory, dynamic disturbance, Nash solution, Stackelberg solution.
Mathematical Subject Classifications: 49L20, 34K35
Клейменов Анатолий Федорович, д.ф-м.н., ведущий научный сотрудник, Институт математики и механики УрО РАН, 620990, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. E-mail: [email protected]
Kleimenov Anatolii Fedorovich, Doctor of Physics and Mathematics, Leading Scientific Researcher, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620990, Russia
хРабота поддержана РФФИ (грант № 12-01-00290).