Научная статья на тему 'Равновесные решения в одной неантагонистической позиционной дифференциальной игре двух лиц'

Равновесные решения в одной неантагонистической позиционной дифференциальной игре двух лиц Текст научной статьи по специальности «Математика»

CC BY
206
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕАНТАГОНИСТИЧЕСКАЯ ПОЗИЦИОННАЯ ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ВЕКТОРНЫЕ КРИТЕРИИ / ИНТЕГРАЛЬНЫЕ КРИТЕРИИ / NON-ZERO SUM POSITIONAL DIFFERENTIAL GAME / VECTOR CRITERIA / INTEGRAL CRITERIA

Аннотация научной статьи по математике, автор научной работы — Клейменов Анатолий Федорович

В рассматриваемой игре с простой динамикой критерий качества первого игрока представляется суммой терминального и интегрального членов. Второй игрок имеет векторный критерий качества. Предполагается, что первый игрок действует в классе позиционных контрстратегий [1,2], а второй – в классе чистых стратегий. Предложены понятия гарантированного выигрыша первого игрока и множества гарантированных выигрышей второго игрока [3, 4]. Дано определение равновесного решения игры нэшевского типа. Установлена структура таких решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EQUILIBRIUM SOLUTIONS IN A NON-ZERO SUM POSITIONAL TWO-PERSON DIFFERENTIAL GAME

In considered game with a simple dynamics the cost functional of the first player is assumed as the sum of terminal and integral terms. The second player has a vector cost functional. The first player acts in the class of positional counterstrategies [1, 2], while the second player acts in the class of pure strategies. Concepts of the guaranteed payoff for the first player and the set of guaranteed payoff for the second player are proposed [3, 4]. An equilibrium solution of Nash type is defined. The structure of such solutions is established.

Текст научной работы на тему «Равновесные решения в одной неантагонистической позиционной дифференциальной игре двух лиц»

measure plus a certain family of usual measurable functions, which we will designate by associated family. The reason to introduce these associated functions is to select a single trajectory from the integral funnel and, thus, they can be regarded as controls acting at the discontinuities of the trajectory.

In the present report, we aim at extending the classic calculus of variations and/or optimal control problems by introducing a new type/design of impulsive controls. We will provide appropriate theorems for the existence of solution in constrained impulsive control problems.

ACKNOWLEDGEMENT: This research was supported by the Russian Foundation for Basic Research with the projects 12-01-33023-MOL-a-ved and 13-01-00494-a.

Карамзин Д.Ю., Перейра Ф.Л. О НЕКОТОРЫХ РАСШИРЕНИЯХ ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Без привлечения сложной техники и избегая достаточно трудоемких деталей мы описываем проблему расширений классической теории управления на вводном уровне.

Ключевые слова: импульсное управление; расширение классической теории.

УДК 517.977.1

РАВНОВЕСНЫЕ РЕШЕНИЯ В ОДНОЙ НЕАНТАГОНИСТИЧЕСКОЙ ПОЗИЦИОННОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ДВУХ ЛИЦ

© А.Ф. Клейменов

Ключевые слова: неантагонистическая позиционная дифференциальная игра; векторные критерии; интегральные критерии.

В рассматриваемой игре с простой динамикой критерий качества первого игрока представляется суммой терминального и интегрального членов. Второй игрок имеет векторный критерий качества. Предполагается, что первый игрок действует в классе позиционных контрстратегий [1, 2], а второй - в классе чистых стратегий. Предложены понятия гарантированного выигрыша первого игрока и множества гарантированных выигрышей второго игрока [3, 4]. Дано определение равновесного решения игры нэ-шевского типа. Установлена структура таких решений.

Динамика игры описывается уравнением

х = и + V, х,п,у € М2, ж(£0) = х0 (1)

где х - фазовый вектор; управления и и V стеснены ограничениями ||и|| ^ц, ^|| ^ц, ц>

> 0; [£0,$] - заданный отрезок времени.

Функционалы качества игроков имеют вид:

1\ = ||х($)|| + J -ш(т)||и(т)+ v(т)Ц2йт ^ шги, (2)

*0

9

I2 = (—||х($) _ а\\> J w(r)||«(t)+ v(t)||2dr) ^ max, (3)

to

2550

где a - заданная точка. Управление и выбирается первым игроком, в то время как второй игрок выбирает пару управлений (v, w), где a1 ^ w ^ а2, а2 > ai > 0.

Задачу можно интерпретировать следующим образом. Первый игрок, выбирающий управление и, стремится минимизировать расстояние от состояния в конечный момент $ до начала координат и одновременно минимизировать суммарную стоимость энергии при условии, что цену w на энергию выбирает второй игрок. В свою очередь, второй игрок, который выбирает управление v и цену на энергию w , имеет две цели (два критерия): во-первых, минимизировать расстояние от состояния в момент $ до точки а, а во-вторых, максимизировать суммарную стоимость энергии.

Частный случай этой задачи, когда, во-первых w(t) = const, а, во-вторых, второй игрок имеет только один критерий (второй из двух) рассматривался в [3].

Предполагаем,что оба игрока знают знают текущее значение фазового вектора x(t). Кроме того, полагаем, что первый игрок знает текущие значения обоих управлений v(t) и w(t) второго игрока. Тогда первый игрок действует в классе позиционных контрстратегий Uv , а второй - в классе чистых стратегий V. Используемая в рассматриваемой игре формализация стратегий игроков и движений, ими порождаемых, базируется на формализации и результатах теории антагонистических позиционных дифференциальных игр [1, 2].

При фиксированных начальной позиции (to,xo) и наборе (Uv,V) определяются понятия гарантированного выигрыша первого игрока pi(to,Xo,Uv,V) , а также множества W(to,xo, Uv, V) гарантированных выигрышей второго игрока (при этом используется специальное бинарное отношение ц-доминирования множеств).

В качестве равновесного решения игры нэшевского типа предлагается набор (Uv,V), обладающий следующим свойством: начиная из любого позиции (t, x[r]) на любой траектории x[-] , порожденной этим набором, ни первый игрок не может увеличить гарантированный выигрыш pi(t, x[t], Uv, V) , отклоняясь в одиночку от набора, ни второй игрок не может «улучшить» множество W(t, x[r],Uv,V) гарантированных выигрышей (в смысле ц -доминирования), также отклоняясь в одиночку.

Рассматриваются две вспомогательные антагонистические позиционные дифференциальные игры Г1 и Г2 с динамикой (1), в которых первый игрок действует в классе позиционных контрстратегий, а второй - в классе чистых стратегий. В игре Г1 первый игрок минимизирует функционал (2), а второй ему противодействует. Эта игра имеет универсальную седловую точку. Игра Г2 представляет собою антагонистическую игру сближения [1, 2], в которой первый игрок стремится обеспечить попадание всего пучка движений на специально сконструированное множество.

Установлена структура равновесных решений, в которой использованы элементы решений игр Г1 и Г2.

ЛИТЕРАТУРА

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.:Наука, 1974.

2. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.

3. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.

4. Клейменов А.Ф. Неантагонистическая позиционная дифференциальная игра двух лиц с интегральными и векторными показателями игроков // Труды Ин-та математики и механики УрО РАН. 2013. Т.19. № 1. С. 130-135.

БЛАГОДАРНОСТИ: Работа выполнена при поддержке РФФИ (проект 12-01-00290) и в рамках программы Президиума РАН «Динамические системы и теория управления» при финансовой поддержке УрО РАН (проект 12-П-1-1002).

2551

Kleimenov A.F. EQUILIBRIUM SOLUTIONS IN A NON-ZERO SUM POSITIONAL TWO-PERSON DIFFERENTIAL GAME

In considered game with a simple dynamics the cost functional of the first player is assumed as the sum of terminal and integral terms. The second player has a vector cost functional. The first player acts in the class of positional counterstrategies [1, 2], while the second player acts in the class of pure strategies. Concepts of the guaranteed payoff for the first player and the set of guaranteed payoff for the second player are proposed [3, 4]. An equilibrium solution of Nash type is defined. The structure of such solutions is established.

Key words: non-zero sum positional differential game; vector criteria; integral criteria.

УДК 519.837

СТОХАСТИЧЕСКИЕ ПРОГРАММНЫЕ КОНСТРУКЦИИ В ЗАДАЧАХ КОНФЛИКТНОГО УПРАВЛЕНИЯ © А.Ю. Коврижных

Ключевые слова: динамическая система; конфликтное управление; стохастический программный синтез.

Рассматривается задача управления динамической системой в условиях неопределенно действующей помехи. Показатель качества процесса управления — функционал от реализации движения и представляет собой сумму двух типичных оценок, включающих нормы фазовых состояний системы в заданные моменты времени. Первая оценка — сумма норм, вторая — максимум норм или норма вида нормы в Ьр. Задача формализуется в дифференциальную квазипозиционную игру в рамках концепции развиваемой в Екатеринбурге и базируется на результатах теории игр научной школы академика Н.Н. Красовского. Основной результат — детальное построение и обоснование программной стохастической процедуры для вычисления цены игры.

Пусть система описывается уравнением

dx/dt = Л(£)х + Е(£)и + С(t)v, £ € [£0,§], (1)

х € Кп, и € Р С Кг, V € Я С К3,

где х — фазовый вектор; и и V — векторы управления и помехи, соответственно; Л(£), Е(£), С(£) — непрерывные при £ € [£0,§] матрицы-функции; £0 и § — фиксированные

моменты времени (£0 <§); Р, Я — выпуклые компакты. Пусть имеются два разбиения

отрезка времени [£0, §] :

Лл«] = {£[1а] : 41] ^ £0, £0а+1] >йа\ г» = 1,...,Яа - 1}, а = 1, 2, (2)

ьа

^ = £24 г1 = 1,...,Ы1, г2 = 1,...,Ы2, тах^!^1 ],£2^2]} = §.

Заданы нормы Ха^(х), х € Кп, га = 1,..., Ыа, а = 1, 2. Допустимы измеримые по Борелю реализации и[£0[-]§) = {и[£] € Р, £0 ^ £<§} и v[t0[•]§) = ^[£] € Я, £0 ^ £<§}. Такие реализации порождают единственным образом абсолютно непрерывные движения х[£0^]§] = = {х[£], £0 ^ ^ §, х[£0] = х0} системы (1) (х0 — задано).

2552

i Надоели баннеры? Вы всегда можете отключить рекламу.