Известия Института математики и информатики Удмуртского государственного университета
2024. Том 64. С. 70-96
УДК 517.957
© В. Н. Ушаков, А. В. Ушаков, О. А. Кувшинов
СБЛИЖЕНИЕ КОНФЛИКТНО УПРАВЛЯЕМЫХ СИСТЕМ НА КОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ
Рассматривается нелинейная конфликтно управляемая система на конечном промежутке времени и в конечномерном евклидовом пространстве. Изучается задача о сближении с компактным целевым множеством в фиксированный момент времени. В рамках задачи о сближении исследуется один из ключевых вопросов — приближенное конструирование множеств разрешимости задачи. Обсуждается подход к приближенному конструированию, основу которого составляет модель, дополняющая метод унификации Н. Н. Красовского в теории дифференциальных игр.
Ключевые слова: управление, конфликтно управляемая система, целевое множество, дифференциальное включение, седловая точка в маленькой игре, задача о сближении, множество разрешимости задачи о сближении, максимальный минимаксный и-стабильный мост, максимальный минимаксный и-стабильный тракт, А-система.
001: 10.35634/2226-3594-2024-64-06 Введение
Рассматривается конфликтно управляемая нелинейная система на конечном промежутке времени и в конечномерном евклидовом пространстве. Изучается задача о сближении системы с компактным целевым множеством в фазовом пространстве системы в конечный момент времени из рассматриваемого промежутка времени. Задача формулируется как позиционная игровая задача о сближении, стоящая перед первым игроком. В условиях, наложенных на систему и задачу, не предполагается, вообще говоря, выполнение так называемого условия существования седловой точки в маленькой игре. В связи с этим задача формулируется и исследуется не как дифференциальная игра в классах позиционных стратегий игроков, а как минимаксная игровая задача о сближении, стоящая перед первым игроком; при этом имеет место информационная дискриминация первого игрока вторым игроком, состоящая в том, что второй игрок использует в игре контр-стратегии. Это означает, что в каждый момент времени из рассматриваемого временного промежутка второй игрок знает выбор управления в этот момент первым игроком и использует это знание при формировании своего управления. Такова суть минимаксной игровой задачи о сближении.
При том подходе к решению этой задачи, который практикуется в теории позиционных дифференциальных игр, созданной Н. Н. Красовским и А. И. Субботиным в первой половине 70-х годов XX века, одним из главных компонентов разрешающей конструкции задачи о сближении является множество разрешимости Ж0 задачи. В настоящей работе основное внимание сфокусировано на проблеме выделения (аналитического описания или приближенного вычисления) множества Ж0. Можно охарактеризовать процедуру выделения множества Ж0 в пространстве позиций конфликтно управляемой системы как наиболее сложную и трудоемкую часть этой процедуры.
Множество Ж0, как показано в [2-4], обладает важным характеристическим свойством минимаксной и-стабильности. Именно это свойство, точнее, — его привлечение ведет к точному или приближенному конструированию множества Ж0 в ряде конкретных игровых задач о сближении. Свойство минимаксной и-стабильности допускает различные варианты описания. Эффективное описание этого свойства облегчает процедуру выделения Ж0
в некоторых конкретных нетривиальных игровых задачах о сближении. В связи с этим в работе применяются унификационные конструкции минимаксной и-стабильности [7-9], дополняющие метод Н. Н. Красовского [5,6] в теории дифференциальных игр.
Работа посвящена вопросам приближенного конструирования множества Ш0, в том числе, в конкретных задачах о сближении. Для этого вводится система, дуальная к исходной конфликтно управляемой системе. Эта система фактически представляет собой исходную конфликтно управляемую систему, записанную в терминах обратного времени. В связи с этим и множество разрешимости Ш0 — максимальный минимаксный и-стабильный мост в задаче о сближении представляется в терминах, связанных с обратным временем, как максимальный минимаксный и-стабильный тракт дуальной конфликтно управляемой системы. С использованием унификационной схемы [7-9] вводятся А-системы — конечные наборы множеств в фазовом пространстве конфликтно управляемых систем, отвечающие конечным разбиениям Г промежутка [¿°, $], на котором рассматривается задача о сближении. А-системы сходятся к множеству Z0 в хаусдорфовой метрике при диаметре Д(Г) разбиения Г, стремящемся к нулю. Факт сходимости А-систем к Z0 является основанием для приближенного конструирования тракта Z0, а следовательно, и множества разрешимости Ш0 задачи о сближении.
В последнем пункте работы рассмотрены задачи о сближении нелинейных конфликтно управляемых систем на плоскости М2, для которых не выполняется условие существования седловой точки в маленькой игре. Для таких систем проведено приближенное вычисление множества Z0 в виде А-систем множеств в М2 и приведено их графическое представление.
Тематика работы и методы формирования разрешающих конструкций в задаче 1.1 близки к некоторым из конструкций, примененных А. И. Субботиным в созданной им во второй половине XX века теории минимаксных решений уравнений Гамильтона-Якоби. Постановка задачи о сближении и методология исследования задачи имеют одним из источников работы В. Флеминга [11], Л. С. Понтрягина [12,13], а также примыкают к работам сотрудников и коллег Л. С. Понтрягина [14-17]. По своей тематике работа близка к [18-23].
§ 1. Постановка задачи
Конфликтно управляемая система в евклидовом пространстве описывается на промежутке времени [¿0,$], ¿0 ^ $ < то, дифференциальным уравнением
^ = ¡{г,х,и,у), х{г0) = х{0), иеР, у е <3; (1.1)
здесь х € — фазовый вектор системы (1.1), и и V — управления первого и второго игроков, Р и Q — компакты в пространствах Мр и М9, соответственно.
Предполагается, что выполнены следующие условия.
A. Вектор-функция f (¿, х, и, V) определена, непрерывна на [¿0, $] х х Р х Q, и для любого компакта П С [¿0, $] х найдется Ь = Ь(П) € (0, то), удовлетворяющее следующему условию
||f(¿, х*, и, V) — f(¿, х*, и, V) || ^ Ь||х* — х*||, (¿, х*, и, V), (¿,х*,и, V) € П х Р х Q.
B. Найдется такое ^ € (0, то), что
(¿,х, и, V) || ^ ^(1 + ||х||), (¿,х,и, V) € [¿0,$] х х Р х Q.
Наложенные на систему (1.1) условия — достаточно общие; они охватывают широкий класс конфликтных управляемых систем. При этом упомянутые условия не исключают выполнение известного в теории дифференциальных игр локального условия седловой точки в маленькой игре [1,2]. Это условие выполняется, например, для линейных конфликтно
управляемых систем [1,2]. В то же время для многих нелинейных систем (1.1), удовлетворяющих условиям A, B, условие седловой точки в маленькой игре не выполняется. Для таких систем не имеют место ключевые положения теории позиционных дифференциальных игр (см. [2,3]), рассматриваемых при вполне естественных предположениях относительно классов допустимых стратегий игроков — позиционном характере стратегий. Так, например, для дифференциальных игр сближения-уклонения, в которых участвуют такие системы, в классах позиционных стратегий игроков не выполняется известная альтернатива (см. [2, 3]).
Однако альтернатива в дифференциальной игре сближения-уклонения будет выполнена, если для стратегий игроков допустить определенную информационную неравновесность, — например, одному из игроков предоставить преимущество перед другим игроком в получении информации о реализующихся игровых ситуациях и использовать эту информацию в процессе управления.
В работе, формулируя задачу о сближении, стоящую перед первым игроком, мы допустим информационную дискриминацию его вторым игроком — сознательно поставим его в неблагоприятные информационные условия, как бы пытаясь заранее предусмотреть для него возможность возникновения неблагоприятных для него в информационном плане игровых ситуаций. А именно, сформулируем игровую задачу о сближении в минимаксной постановке.
Пусть (t*, я*) £ [t0, х Rm, M £ comp (Rm), где comp (Rm) — пространство компактов в Rm с хаусдорфовой метрикой.
Задача 1.1 (см. [2-4]). Первому игроку требуется определить позиционную стратегию u*(t, я), (t, я) £ [t0,$] х Rm, гарантирующую приведение конечной точки я($) движения x(t), x(t*) = я*, системы (1.1) на M при любой контр-стратегии v(t,x,u), (t,x,u) £ [t0,$] х Rm х P второго игрока.
Формулировка задачи 1.1 представляет преимущество в информационном плане второму игроку: при формировании в каждый момент t £ [t0,$] своего управления он знает управление u £ P, выбранное в этот момент первым игроком, и использует это знание.
Строгая формулировка задачи 1.1 и относящихся к ней понятий дана в [2,3].
Из работ [2,3] следует, что позиционная стратегия u*(t, я) первого игрока, разрешающая задачу 1.1, может быть реализована для любой исходной позиции (t*,x*) £ W0 системы (1.1), где W0 — множество позиционного поглощения в задаче 1.1 (см. [2,3]) — множество разрешимости задачи 1.1. Эта стратегия u*(t,x) определяется, согласно [2,3], как экстремальная стратегия первого игрока к множеству W0. Поэтому важным и одним из основных этапов решения задачи 1.1 является в конкретных игровых задачах процедура выделения множества W0. При этом вполне естественно в этих задачах встает вопрос о точном выделении (аналитическом описании) множества W0. Даже в относительно простых игровых задачах 1.1 с линейными конфликтно управляемыми системами малой размерности не удается получить аналитическое описание множества W0. Тем более не удается получить аналитическое описание множеств W0 в задаче 1.1, в которой участвуют нелинейные конфликтно управляемые системы вида (1.1). В связи с этим на передний план в проблеме выделения множеств W0 выступают вопросы, связанные с разработкой схем и алгоритмов приближенного вычисления множеств W0 в [t0,$] х Rm.
§2. Минимаксная u-стабильность в задаче 1.1: унификационные разрешающие конструкции
В этом параграфе, применяя разрешающие конструкции к дифференциальным играм, основывающиеся на унификационном подходе Н.Н. Красовского [5,6] к дифференциаль-
ным играм, опишем свойство минимаксной u-стабильности, минимаксные u-стабильные мосты и тракты.
Принимая во внимание условия A, B и определение множества W0, заключаем, что можно погрузить W0 в достаточно большую ограниченную и замкнутую область П С С [t0,$] х Rm; при этом все математические объекты, возникающие в наших рассуждениях и построениях, также будут содержаться в П. Таким образом, считаем, что и все множества в пространстве [t0,$] х Rm позиций игры, возникающие в процессе конструирования аппроксимаций множества разрешимости W0, содержатся в П.
Эту область П С [t0, $] х Rm мы имеем в виду в последующих рассуждениях.
Перейдем к описанию минимаксных u-стабильных мостов и трактов, для чего привлечем унификационные конструкции из [7-9].
Минимаксная u-стабильность непустого замкнутого множества W С П означает слабую инвариантность этого множества относительно некоторого набора дифференциальных включений (д. в.), индуцированных на [t0,$] системой (1.1) при помощи некоторого набора L многозначных отображений.
Для описания набора L введем функцию-гамильтониан системы (1.1)
H(t,x,l) = maxmin/l, f (t,x,u,v)), (t, x, l) £ П х Rm,
«eP veQ
спецификация которой связана с формулировкой задачи 1.1; здесь (l, f) — скалярное произведение векторов l и f в Rm.
Введем на [t0,$] д. в.
dx
— £ F(t,x) = со {f(t,x,u,v): и £ Р, v eQ}. (2.1)
Согласно сделанным замечаниям, все возникающие в ходе рассуждений решения x(t), t £ [t0, $], д. в. (2.1) удовлетворяют (t,x(t)) £ П, t £ [t0,$].
В Rm зафиксируем шар B* = B(0; K) = {b £ Rm: ||b|| ^ K}, K £ (0, то), такой, что F(t,x) С B*, (t,x) £ П.
В Rm выделим единичную сферу S = {l £ Rm: 1111 = 1}, и в последующих рассуждениях смотрим на векторы I £ S как на некоторые обобщенные управления второго игрока, а на сферу S, — как на множество в Rm — как на ограничение на эти управления.
Можно трактовать обобщенные управления l £ S, как подменяющие в соответствующих рассуждениях и оценках вектор-функции v(-) = {v(u): u £ P} — контр-управления второго игрока.
Полагаем при (t, x, l) £ П х S
ni(t,x) = {f £ Rm: (l,f) ^ H(t,x,l)}, Fi(t, x) = ^(t,x) П F(t,x).
Справедливо вложение F^(t,x) С B*, (t,x,l) £ П х S.
Введем в рассмотрение L-набор многозначных отображений (t,x) м- F(t,x), l £ S, определенных на П.
Наложим на L-набор не слишком ограниченное условие.
C. Справедливо равенство
H*(t, x, l) < H(t, x, l) < H*(t, x, l), (t, x, l) £ П х S; здесь H*(t, x,l)= min (l, f), H*(t,x, l)= max (l, f).
f eF (t,x) f eF (t,x)x
При выполнении условия C отображение (t,x) м- F^(t,x) непрерывно на П х S в ха-усдорфовой метрике и, значит, равномерно непрерывно на П х S. Тогда найдется функция и* (8) i 0, 8 i 0, удовлетворяющая
d(Fi(t*,x*),Fi(t*,x*)) ^ и*(|t* - t*| + ||x* - x*||), l £ S, (t*,x*), (t*,x*) £ S;
здесь d(F*,F*) = max(h(F*,F*),h(F*,F*)) — хаусдорфово расстояние между компактами F* и F* в Rm, h(F*, F*) = max min II f* — f*|| — хаусдорфово отклонение FL от F*.
( /*eF* /*eF*
Полагаем ш(8) = 8 • ш*((1 + K)8), 8 > 0, где K — радиус шара B*.
Определим оператор минимаксного u-стабильного поглощения в задаче 1.1 в терминах отображений, для чего введем следующие обозначения.
Пусть x* G Rm, X* и X* — множества в Rm, (t*,t*) G А = {(n*,n*) G [t0,§] х [t0,§]: to ^ П* < П* ^ §}, l G S.
Полагаем
Xi(t*, t*, x*) — множество достижимости (м. д.) в момент t* д. в.
dx
— eFifax), х{и) = х*, te[u,t*\- (2.2)
dt
Xl(t*,t*,X*) = U Xl(t*,t*,x*) — м. д. в момент t* д. в. (2.2) с исходным множе-
ex*
ством X*, отвечающим моменту t*;
X-1(t*,t*,X*) = {x* G Rm: Xi(t*,t*,x*) П X* = 0}.
Определение 2.1. Оператором минимаксного u-стабильного поглощения п в задаче 1.1 назовем отображение
(t*, x*, X*) ^ п (t*, t*, X*) = f| X-1 (t*, t*, X*) С Rm,
les
_______ _. .. х 2R .
Определение 2.2. Непустое замкнутое множество W С П, удовлетворяющее вложениям
W(§) С M; W(t*) С n(t*,t*,W(t*)), (t*,t*) G А, t* G T, назовем минимаксным u-стабильным мостом в задаче 1.1.
Здесь W(t) = {x G Rm: (t,x) G W} при t G T, где T = {t G [t0,§]: W(t) = 0}.
Определение 2.3. Символом W0 обозначим максимальный (по включению) минимаксный u-стабильный мост в задаче 1.1.
Определения 2.2, 2.3 минимаксных u-стабильных мостов в задаче 1.1 есть унификаци-онные определения, основанные на привлечении L-набора отображений (t,x) ^ Fl(t,x), l G S. Эти определения эквиваленты первоначальным определениям минимаксных «-стабильных мостов, введенным в [2,3]. Эквивалентность понимаем в том смысле, что первоначальные и унификационные определения выделяют в пространстве позиций (t,x) игры те же самые множества W и W0. При этом унификационное определение обладает рядом преимуществ. Одно из наиболее важных преимуществ состоит в том, что конструкции теории позиционных дифференциальных игр оно смыкает непосредственно с формализмом Гамильтона-Якоби в теории динамических систем.
Однако при попытках приспособить унификационные определения для решения конкретных игровых задач 1.1 (с конкретными системами (1.1) и целевыми множествами M) возникают трудности. Эти трудности связаны в первую очередь с тем, что при выделении (то есть в процессе выделения) моста в W0 в конкретных задачах 1.1 мы вынуждены «пятиться» глобально во времени t на промежутке [t0, §], отправляясь в момент § от целевого множества M, применяя при этом свойство минимаксной «-стабильности множества W0,
выраженное локально в терминах «прямого» времени ¿. Такая рассогласованность глобальных процедур выделения множества Ш0 и определения минимаксной и-стабильности множества Ш0 подводит нас к необходимости корректировки определения минимаксных и-ста-бильных множеств Ш в задаче 1.1.
Резюмируя приведенное замечание, можем утверждать, что при решении конкретных игровых задач 1.1 возникает необходимость в создании конструкций минимаксной и-ста-бильности, соответствующих обращенному времени то есть, — в переходе от «прямого» времени £ к «обратному» времени т = £0 + $ — т, £ € [¿0, $], и вместе с тем в представлении минимаксных и-стабильных мостов Ш в задачах 1.1 в терминах «обратного» времени т. Ниже убираем кавычки из терминов «прямого» и «обратного» времени. Обратное время т определим равенством т = ¿0 + $ — ¿, £ € [£0 ,$]. Систему (1.1) представим в обратном времени т
— = к(т, 2, и, V) = -/(¿о + ^ - г, г, и, у),
ат (2.3)
т € [¿0,$], 2 € и € Р^ € Q.
а2
— € Яг(т, = + ^ - г, г),
т € [¿0,$], 2 € 1 € 5,
и связанные с этим д. в. обозначения.
Пусть 2* и Z* — точка и множество в (т*, т*) € А* = {((*,(*) € [¿0,$] х [¿0,$]:
¿0 ^ С* ^ С * ^ $}, 1 € 5.
Полагаем
Z1(т*, т*, 2*) — м. д. в момент т* д. в. (2.4) с начальной точкой 2*, отвечающей моменту т*; Z1(т*, т*, = и (т*, т*, 2*) — м. д. в момент т* д. в. (2.4) с начальным множеством Z*,
отвечающим моменту т*;
Введем также д. в.
Z(т*,т*,Z*) = f| Zi(т*,т*,Z*). (2.5)
les
Мы интерпретируем Z(т*, т*, Z*) С Rm как множество совместной (по всем l G S) достижимости для д. в. (2.4), отвечающих всевозможным l G S и с начальным множеством Z*, отвечающим моменту т*.
Многозначные отображения (t*, t*,X*) м n(t*,t*,X*) и (т*,т*^*) м Z(т*,т*,Z*) тесно связаны между собой: свойство минимаксной и-стабильности может быть выражено посредством отображения (т*, ^,Z*) м- Z(т*,т*^*): в терминах этого отображения минимаксный u-стабильный мост W С П есть замкнутое множество Z С П с временными сечениями Z(т) = W(t), t + т = t0 + tf, т G [t0, tf], удовлетворяющими
Z(to) = W(tf) С M и Z(т*) С Z(т*, т*, Z(т*)), (т*,т*) G А*; (2.6)
здесь обозначено Z(т) = {z G Rm : (т, z) G Z}, t G [t0,tf] и т* в (2.6) удовлетворяет
т * G T * = {т G [to,tf]: Z (т ) = 0}.
Определение 2.4. Непустое замкнутое множество Z С П, удовлетворяющее (2.6), назовем минимаксным u-стабильным трактом конфликтно управляемой системы (2.3).
Определение 2.5. Непустое множество Z0 С П, где Z0^ ) = W0(t), т +1 = t0 + tf, т G [t0,tf], назовем максимальным минимаксным u-стабильным трактом системы (2.3).
§3. Приближенное вычисление множеств Z0 и W0 в задаче 1.1
Множество введенное в § 2, более приемлемо для выделения в [¿0, х чем Ш0. Однако точное выделение (то есть аналитическое описание) множества Z0, как и множества Ш0, возможно лишь в некоторых достаточно простых конкретных задачах 1.1. В связи с этим актуальна проблема приближенных вычислений множества Z0 в конкретных игровых задачах 1.1.
В этом параграфе рассмотрим в рамках общей постановки задачи 1.1 вопросы приближенного вычисления множества Z0. Приближенное вычисление Z0 предполагает проводимую в той или иной форме дискретизацию пространства [¿0, $] х Мт (множества П) позиций игры в задаче 1.1. При этом не исключена определенная дискретизация ограничений Р, Q на управления игроков. Схема дискретизации множеств Р, Q может зависеть от конкретной задачи 1.1.
Один из подходов к дискретизации [¿0, $] х Мт и Р, Q заключается в том, что эта дискретизация осуществляется раздельно: сначала осуществляется дискретизация промежутка [¿0, -$], а затем — дискретизация пространства и ограничений Р, Q.
В этой работе мы придерживаемся именно такого подхода. В этом параграфе подробно обсудим первый основной этап дискретизации, связанный с дискретизацией промежутка [¿0, $], — с дискретизацией обратного времени т.
Эту дискретизацию начнем с того, что введем двоичное разбиение Г = {т0 = ¿0, Т1,..., т, •••,тм = промежутка [¿0, $] с диаметром А = Д(Г) = N-1($ — ¿0), N = 2Г, г = N.
Разбиению Г ниже сопоставим А-систему {¿^Г(т): т € Г} множеств ^(т^) С , аппроксимирующую Z0. А-система {^(т^): т € Г}, как математическое понятие, составляет теоретический фундамент формирования методов и алгоритмов приближенного вычисления множеств Z0 в задачах 1.1.
При формировании аппроксимационной схемы подменим множества достижимости Z1(т*,т*,г*), (т*, г*) € П, т* и т* из Г, I € 5, — основные ее элементарные составляющие, более приемлемыми для вычислений выпуклыми множествами г* + (т* — т*)Н(т*, г*). Множества Z1(т*, т*, Z*) и Z(т*, т*, Z*) = П Z1(т*, т*, Z*) соответствующим образом трансформируются в рамках этих подмен в множества и определение, более приемлемые для применения в дискретных аппроксимационных схемах, отвечающих разбиению Г.
Каждому промежутку [т, т^+1] разбиения Г сопоставим д. в.
п г
— € Щ(тг, г«) + ¿Ы) = бМт, I е (3.1)
пт
здесь ^(¿)= ш*((1 + К)8), ¿> 0, А = А(Г), В1 = {Ь € Ет: ||Ь|| ^ 1}.
Пусть (т, г(г)) и (т, Z(г)) — точка и множество в П, I € 5.
Полагаем
г[(п+1,тг,гЩ = г« + - м.д. д. в. ^ е Яг(гг,г«), г(тг) = ^ в мо-
ат
мент т*+ь
г[(п+1,п,г®) = и - м.д. в момент тт д. в. ^ е Щ(п}г{г)),
(О
г« € Z«;
пт
^Г(тт,тг^«) = П ^Г(тт , Z«);
^Г(т*+Ьт*,г(г)) = ^Г(тт, т,г(г)) + ш(А)В1 — м.д. в момент т*+1 д.в. (3.1);
Zr(Ti+1, т., Z(j)) = U Z/^tî+^t., z(j)) — м. д. в момент Ti+1 д. в. (3.1) с начальным
?.Г(т. T. Z (i)) = U Z.r(Tj,1 T. z(
zWezW
множеством Z(j), отвечающим моменту Ti+1;
т^, Z«)= П ^Г(тт , Z(i)); les
здесь обозначено w (5) = 5 • <^(5), 5 > 0.
Введем в рассмотрение аппроксимирующую систему — А-систему {¿^Г(т): т G Г} в Rm.
Определение 3.1. А-системой {¿?Г(т ) : т G Г}, отвечающей разбиению Г промежутка [t0,tf], назовем систему множеств
zr(r0) = M, Zr(n) = г = T~N.
Сравним по включению системы {¿^Г(т) : т G Г} и {Z^r^) : т G Г}. Принимая во внимание ^Г(т0) = Z(т0) = M и включение Z(ri+1, т, Z^ri)) С С Zr(ri+i, п, Zr(n)), г = 0, N - 1, получаем включение Zr(n) С Zr(n), г = 0, N.
Вместе с тем установлено, что Z°(tî), Zf(tî), Zf(tî), Tî G Г, г = 0, N, стеснены включениями
Z°(n) С Zr(n) С гГ(тг), г = мг. (3.2)
Из (3.2) следует, что А-система {¿^(rj): т G Г} мажорирует систему {Z0^): т G Г} — набор сечений Z0^) максимального минимаксного u-стабильного тракта Z0 системы (2.3).
Введем двоичные разбиения Г(п) = {т0п) = t0, т^,..., т(га),..., т^П) = "$}, n G N, промежутка [t0, $].
Упростим запись, полагая Z(п)(т*) = Zr(n)(т*), ^(га)(т*) = Zr(n)(т*), т* G Г(п), n G N. Тогда
{Z(п)(т*): т* G Г(п)} = {Zr(n) (т*): т* G Г(п)},
{^(га)(т*): т* G Г(п)} = {F(n) (т*): т* G Г(п)}, n G N.
Определение 3.2. Символом П0 обозначим множество всех (т*,г*) G П вида (т*,г*) = lim (¿п(т*), zn), где {(¿п(т*), zn)} — некоторая последовательность точек
(¿п(т*),г„) G (tra(т*),^(га)(ат*))), n G N.
Множество П0 удовлетворяет П0(т0п)) = П0(£0) = M и
Z(n) (т*) С Z(n) (т*), т* G Г(п), n G N. (3.3)
Из определения множеств Z0, П0 и включений (3.3) следует
Z0 С П0. (3.4)
Кроме того, из определения П0 следует, что П0 — минимаксный u-стабильный тракт системы (2.3) и, значит,
П0 С Z0. (3.5)
Из (3.4) и (3.5) следует утверждение Теорема3.1. Множества П0 и Z0 совпадают.
В теореме 3.1 содержится теоретическое обоснование возможности применения А-сис-темы {Z(n)(7i(n)): т(п) € Г(п)} для приближенного вычисления максимального минимаксного u-стабильного тракта Z0 системы (2.3).
Замечание 1. Введение А-системы {Z(n) (r(n)): т^ € Г(п)} в схему приближенного вычисления решения задачи 1.1, связанное с дискретизацией промежутка [to, еще не дает окончательного решения задачи приближенного вычисления тракта Z0. Эта дискретизация может рассматриваться как первый основной этап в схеме приближенного вычисления Z0; ее необходимо дополнить схемами дискретизации фазового пространства Rm системы (2.3) и ограничений P, Q. Об этих двух последних дискретизациях в настоящей работе речь не идет.
§ 4. О приближенном вычислении минимаксных u-стабильных трактов Z0 в конкретных задачах 1.1 в пространстве R2
Рассмотрим конфликтно управляемую систему
dx
— = <p\x)+u + v, <р\х) = -Г(х); (4.1)
на промежутке времени [t0, $], t0 = 0, $ € (0, то); здесь x = (xi, x2) — фазовый вектор системы; u € P и v € Q — векторы управлений первого и второго игроков; P = [(0, -1), (0,1)], Q =[(-1,0), (1,0)].
Полагаем f*(x) = f*(x1 ,x2) = (x1 , f(x2)), где f (x2) — возрастающая на (-то, +то) функция переменной x2, удовлетворяющая условию Липшица с константой L € (0, то); M — односвязный компакт в R2 с непустой внутренностью int M, представимый в виде M = {(z1;z2): z1 € [a0,60],z2 € [^(z1 ),h(z1)]}, где ^(z1) и h(z1) — липшицевы на [a0,b0] функции с константой L, —то < а0 < b0 < то.
Мы изучаем задачу 1.1 о сближении системы (4.1) с целевым множеством M в момент времени
В этой задаче, как и в рассмотренных выше задачах 1.1, нас интересует максимальный u-стабильный мост W0.
Для этого мы изучаем максимальный u-стабильный тракт Z0 системы
d z
— = -f*(z)+u + v, (4.2)
двойственной к системе (4.1); здесь т = $ — t, t € [t0, $], z = (z1, z2) € R2.
Для изучения Z0 введем двоичное разбиение Г = {т0 = t0 = 0, т1;..., тк,..., tn = $},
{} _
N = 2п, п Е N, промежутка [t0, Щ, где А = А (Г) = тк+1 - тк = — ,к = 1, N - 1, N = 2п.
Алгоритм конструирования А-системы {¿7Г(тк): тк € Г}, аппроксимирующей множество Z0, описывается, как известно, рекуррентными соотношениями
Zr(T0) = F(t0) = M,
Zr{rk+1) = Zr(rk+1,Tk,Zr{rk)) = p| Zf(rk+1,rk,Zr(rk)), к = 0,N-1.
i=1,2
Акцентируем внимание на начальном промежутке [т0,71 ] разбиения Г и конструировании множества ^г(т1) = Zr(71 , т0,^г(т0)), отвечающего этому промежутку. Справедливы равенства
Zr(T1) = Zr(T1 ,T0,F(T0)) = (^г(т0) + Af *(F(T0 ))) + AF1, Zr(T1) = Z2r(T1 ,T0,F(T0)) = (F(T0) + Af *(Zr(70))) + AF2;
здесь ^г(то) + Д/*(^г(то)) = и (* + Д/*(*)) = (* + А/* (г) = (¿ь^ + Д/Ч^) =
•гС^Г(то)
= (¿1 + Д^1 ,¿2 + Д/(22)) : ¿1 е [ао,Ьо], ¿2 е [^(¿1), ^(¿1)]}.
Учитывая, что /(¿2) возрастает на (-то, +то), получаем /(^(¿а)) ^ /(¿2) ^ )),
¿1 е [ао ,Ьо].
Вместе с тем справедливо представление
^г(то) + Д/ *(^г(го)) =
= ((¿1,^2)+Д(^1,/(¿2)): ¿1 е [ао, Ьо], ¿2+Д/(¿2) е [^1 )+Д/(^(¿1)), Л^^+Д/(ад)]}.
На [ао, Ьо] введем функции
^(¿1) = <ад + Д/(ад), ад) = ) + Д/(ад),
^1(^1) = ) - Д, л1 (¿1) = ад ) + д
и множество
Z(п) = ((¿1,^2): ¿1 е [ао, Ьо], ¿2 е [^ад,^^)]}.
Применим к множеству Z(т1) операции сдвига по горизонтали вправо и влево на величину Д = Д(Г) и получим множества в М2
^(П) = Z (Т1) + Д" = (^г(го) + Д/* (^г(го))) + Д^1,
^Т(т1) = Z (п) + Д1— = (^г(то) + Д/* (^г(го))) +
здесь " = (1, 0), V = (-1, 0).
Изучим задачу 1.1 при условии {} = ——у—, и после изучения этой задачи прокоммен-
11 0 Ьо — ао
тируем задачу 1.1 при условии ъ> > —-—.
Согласно равенству
^г(п) = (Z(Т1) + Д") П (Z(п) + Д1—), (4.3)
справедливо ¿^(71) С [а1, Ь1], где а1 = ао + Д, Ь1 = Ьо — Д. Введем функции
"}(*!) = — Д), " 1(^1) = ^1(^1 — Д),¿1 е [а1 ,Ьо + Д],
+ Д), V1 (¿1) = ^1(^1 + Д),¿1 е [ао — ДА],
а также функции
^1(^1) = шах("" 1(^1), 1—1(^1)), й1 (¿1) = шт^^), V^О), ¿1 е [а1,Ь1]. (4.4)
Для нас представляет интерес топологическая структура множества ^(т!), которая явно зависит от соотношения между функциями и ЛК^) на [а1, Ь1].
В связи с этим изучим сначала функции и Л1^), определяющие множество
Z(п) С ММ2. В силу наложенных на функции ), Л(^1) и /(¿2) ограничений функции Л1 (¿1) липшицевы на [ао,Ьо]. Уточним их константы Липшица.
Выберем произвольные точки ~2 = (г 1,^2) и г = (^1,^2) в К2, где £1 и £1 из [ао, &о]• Оценим сверху величину — <р\{2})\:
Ис*1) - 'А(гг)\ = \(фг) + Л/(<(^)) ~ А) - (Фг) + А/(ф1)) - А) ^
^ |фг) - фг)| + Д|/(^1)) " /№))| ^ Фг - 1х| + АЬ^фг) - фг)\ ^ ^ ф1 — 1 + АЬ^Ь\г1 — Иг] ^ Ьеь/А(21 — 21), 21, 21 из [а0, &о]-
Вместе с тем доказаны неравенства
-/4(^)1 (4-5)
из [а0, Ьо]-
Из неравенств (4.5) следует, что функции ^*(г1) и ^*(г1) — липшицевы с константой А на [а1; Ь1].
Уточним, какие свойства множества ^(т^ мы бы желали видеть. Это — односвязность компакта ^(т!), дополненная определенной структурой его границы Наличие этих свойств в множестве ^(т^ упростило бы нам конструирование следующего множества ^Г(т2) из А-системы {^Г(тк): тк € Г} с привлечением имеющегося алгоритма.
В связи с этим зафиксируем некоторое П0 € (0, то) и также будем считать, что множество ^Г(т0) = М удовлетворяет условию
<£(21) + П0 < ^1), 21 € [й0, ^0]. (4.6)
Нас интересует, при каких Ь, , А = Д(Г) выполняется неравенство
п
+ у < кы), zle[al,bl]. (4.7)
Выполнение неравенства (4.7) обеспечит наличие в множестве ^(т^ желательных для нас свойств.
Выясним, при каких Ь, , А = А(Г) выполняется (4.7).
Для этого рассмотрим функцию "^(г1), сравним ее сначала с функцией Л ^(г1), а затем — с функцией Л 1(21). Справедливо представление
1(21) = <(21 — А) + А<(21 — А) — А,
из которого следует
"1(21) + П0 = <(21 — А) + П0 + А/(<(21 — А)) — А < Л(21 — А) + А/(Л^ — А)) — А, то есть
"1 (21) + П0 < (Л(21 — А) + А/(Л(21 — А))) + А — 2А,
то есть
"1(21)+ (¿0 + 2А) < " 1 (21). (4.8)
Теперь сравним " 1(21) с Л 1(21). Для сравнения используем вытекающее из (4.5) неравенство
" 1(21) — ^1(21) = Л1(21 — А) — (21 + А) ^ а2а.
1
Итак, сравнивая функции " 1(21) и Л 1(21), имеем
1(21) + (¿0 + (1 — А)2А) < V 1(21). (4.9)
Принимая во внимание неравенства (4.8), (4.9) и Ао + (1 — л)2Д < Ао + 2Д, получаем
"1 (¿1) + (¿о + (1 — л)2Д) < " 1 (¿1). (4.10)
Из (4.9), (4.10) следует при е [а1, Ь1]
" 1(^1) + (¿о + (1 — Л)2Д) < шт(" 1(^1),V1(^1)). Аналогично, при любых Ь, , Д = Д(Г) выполняется
1—1(^1 ) + (Ао + (1 — Л)2Д) < шт(" 1 (¿1), 1г1(zl)), ¿1 е К А ].
Из последних двух неравенств следует
шах("1—1 (¿1)) + (Ао + (1 — Л)2Д) < шт(" 1 (¿1), 1гг1(zl)), ¿1 е ^А ], то есть при любых Ь, , Д = Д(Г) выполняется
^*(^1) + (^о + (1 — Л)2Д) <Л*(^1), ¿1 е [а1,Ь1]. (4.11)
Проведем анализ неравенства (4.11). Для выполнения желательного для нас неравенства (4.7) достаточно, чтобы величина ¿1(Д) = Ао + (1 — Л)2Д удовлетворяла неравенству
^ ^(А), (4.12)
¿о
2
то есть достаточно, чтобы Ь, , Д = Д(Г) были достаточно малы:
(Ьеь'А - 1)2А ^ (4.13)
Итак, если Ь, , Д = Д(Г) удовлетворяют (4.13), то справедливо (4.7). Если же Ь, , Д = Д(Г) так велики, что
(Ьеь'А- 1)2А>^, (4.14)
то выполняется откуда следует
А
й(Д) < (4.15)
Таким образом, при Ь, , Д = Д(Г), удовлетворяющих (4.14), мы не можем гарантировать выполнение (4.7). В таком случае (в случае выполнения (4.14)) мы должны для конфликтно управляемой системы (4.1) с заданными константами Липшица Ь, и § е (0, то), Д = Д(Г) е (0,§] скорректировать требования к множеству ^(71) — в желательном для нас неравенстве (4.7) изменить выбранное ранее Ао е (0, то), увеличив его. Увеличение должно быть настолько большим, чтобы по меньшей мере удовлетворилось (4.7). При этом увеличение ¿о должно быть таким, чтобы выполнились неравенства, аналогичные неравенству (4.7), для последующих за ^(71) множеств ), к = 2,Ж(п), из А-системы ): тк е Г}. Ниже мы конкретизируем наши пожелания к множествам ), тк е Г. Продолжая изучение этих множеств, рассмотрим следующий промежуток [т1, т2] разбиения Г, считая, что односвязный компакт -£г(т1) = и [(з^,^*^)), (^АК^))] в М2
вычислен, и функции ЛЦА) удовлетворяют неравенству (4.7).
По нему формируем следующее множество ^г(т2) из А-системы ): тк е Г}.
Компакт ¿^г(т2) вычисляем, привлекая алгоритм, который применяли при вычислении множества ¿г(т1) по ^г(то).
Полагаем а2 = а1 + Д, Ь2 = Ь1 — Д. Справедливо неравенство а2 < Ь2. Введем на промежутке [а1, Ь1] функции
^(¿1) = ад) + Д/(ад)), Л2(¿1) = ад) + д/(ад)),
^¡(¿1) = ^2(^1) — Д, ^(¿1) = ^2(^1) + Д,
а также функции
= ^(zi - А), h 2(zi) = h|(zi - А), zi G [а2,61 + A], 1-2(zi) = ^2(zi + A), V|(zi) = h|(zi + A), zi G [ai - A^].
Из последних четырех функций формируем функции
^2(zi) = max( ~ф 2(zi), 12(zi)), h2 (zi) = min (h¡(zi), h2(zi^, zi G [a2,62]. (4.16)
Изучим соотношение между ^2(zi) и h2(zi) на [a2,62]. Для этого сначала изучим ^¡(zi) и h|(zi) на [ai,6i].
Функции ад) и h2(zi) — липшицевы на [ai,6i], что обусловлено липшицевостью функций (^i(zi), h\{zi), f{z2).
Выберем произвольные точки ~z = (z1; z2), z = (z1;z2) в R2, где Z\, z 1 из [ai, b\}. Оценим сверху величину —
ад) - = кад) + д/(ад)) - А) - (ад) + А/(ад)) - д)| ^ ^ 1ад) - ад)| + д|/(ад)) - /(ад))| ^
^ (1 + ALOl^^i) - ^ eL/ALeL/A|z! ^ LeL/2A|z! - Щ.
Аналогичная оценка справедлива для \h\(z\) — h\(z\)\. В результате справедливы неравенства
(4.17)
Неравенство (4.11), справедливое для любых Ь, , Д = Д(Г), запишем в виде
) + ¿1(Д) < ад), ¿1 е [а1,Ь1]. (4.18)
Учитывая (4.17), получаем, что функции ), Л»^) — липшицевы на [а2, Ь2] с константой 2Л.
Оценим, насколько при этом велико рассогласование Л»^) — ^2(^1) на [а2, Ь2] между Л»^) и ^2(¿1). Для этого сначала сравним функции ""¡¡¡(¿О с функцией Л 1(^1), а затем — с функцией Л 1(^1).
Справедливо представление
^2(zi) = ^2(zi - А) = ад - А) + А/(ад - А)) - а,
из которого следует
^2(zi)+di(A) = ад-А)+di(A)+A/(ад-А))-А < h2(zi-А)+А/(h2(zi-А))-А,
+ ¿1(А) < (Л1(21 — А) + А/(Л* (21 — А)) + А) — 2А
и, следовательно,
<2(21) + (¿1(А) + 2А) < "2(21). (4.19)
Сравним также функцию <2(21) с —2(21). Справедливо неравенство
<2(21) + (¿1(А) + 2А) < —(21) + ("1(21) — <—1(21^ . Из неравенства (4.17) следует
"1(21) — V2(21) = л2(21 — А) — Л2 (21 + А) = = (Л2(21 — А) + А) — (Л2(21 + А) + А) ^ 2А2А.
Получаем неравенство
<2(21) + (¿1(А) + 2А) < "1(21) + 2А,
то есть
^ 1(21) + (¿1(А) + (1 — 2А)2А) < ^2(21). (4.20)
Из неравенств (4.19), (4.20), учитывая (1 — 2А)2А < 2А, получаем
<2(21) + (¿1(А) + (1 — 2А)2А) < ш1п("1 (21), ^2(21)),
то есть
"1(21) + (¿1(А) + (1 — 2А)2А) < Л*(21).
Аналогично выполняются
"1(21) + (¿1(А) + (1 — 2А)2А) < Л*(22). Следовательно, справедливо
<2(21) + (¿1(А) + (1 — 2А)2А) < Л*(21), 21 € [«2,Ь2]. (4.21)
Так же, как и при изучении структуры множества ^(т^ (анализ неравенства (4.11)), проведем анализ неравенства (4.21).
Введем величину П2(А) = П1(А) + (1 — А)2А.
Нас интересует, при каких Ь, , А = А(Г) выполняется неравенство
п
+ у < К^г), € [а2,Ъ2]. (4.22)
Можно охарактеризовать (4.22) как желательное для нас неравенство. Для выполнения неравенства (4.21) достаточно, чтобы величина П2(А) удовлетворяла неравенству
п
| ^ <¿2(А), (4.23)
то есть достаточно, чтобы Ь, , А = А(Г) были достаточно малы:
^ (¿1(А) + (1 — 2А)2А),
^ / ! \\ , (л т„Ь*2А\ 2
(2-Ь(еь/А + еь/2А))2Д,
то есть
(Ь(еь/А + еь/2А) - 2)2д ^ (4.24)
Получаем, что если Ь, , А = А(Г) удовлетворяют (4.24), то справедливо (4.22). Далее, продолжая изучение множеств ^Г(тк), тк € Г, мы приходим к промежутку [¿к-1,тк] разбиения Г, считая, что предыдущий компакт
^Г(тк_1)= и [(21,<к-1(21)), (21 ,Лк-1(21))] С К2
вычислен, где функции <к-1(21), Л^-1(21) — липшицевы на [ак-1,&к-1] с константой Липшица
Ьеи (к-1)А
и выполняется неравенство
п0
'А-х^х) + у < К-Л^г), 21 Е [ак_ 1, Ьк-г];
здесь ай-1 = а0 — (к — 1)А, &к-1 = &0 — (к — 1)А.
По компакту ¿7Г(тк-1) конструируем следующее множество ^Г(тк) из А-системы {^Г(тк): тк € Г}. Компакт ^Г(тк) вычисляем, применяя используемый ранее алгоритм. Полагаем ак = ак-1 + А, Ьк = Ьк-1 — А. Вводим на [ак-1,&к-1] функции
<к(21) = <^-1(21) + А/ (<к-1(21)), Лк(21) = ^^-1(21) + А/(^^-1(21)),
<1 (21) = <к (21) — А, (21) = Лк (21) + А,
а также функции
"к(21) = <к(21 — А), "к(21) = Лк(21 — А), 21 € [а*А-1 + А], V1(21 ) = <1 (21 + А), —(21 ) = Л1 (21 + А), 21 € [ак-1 — А А].
Из последних четырех функций формируем функции
<к(21) = шах("<к(2l),V1 (21)), ы^ц"к^—(2l)), 21€ КА]. (4.25)
Изучим соотношение между <к (21) и Лк (21) на [акА].
Выкладки, аналогичные проведенным ранее для функций <1(21), Л1 (21) на [а1,Ь1 ] и <2(21), Л2(21) на [а2,Ь2], показывают, что справедливо
<к(21) + Пк(А) < Лк(21), 21 € [акА], (4.26)
где Пк(А) = ¿0 + Е(1 — Ьеь/гА)2А.
г=1
Для выполнения желательного для нас неравенства
П
^(21) + у<^(21), 21еКА] (4.27)
достаточно, чтобы выполнилось
а
(4.28)
то есть, чтобы
кп
^ (4.29)
г=1
Для выполнения (4.29) достаточно, в свою очередь, чтобы
п
к(Ье^кА - 1)2Д ^ у. (4.30)
Поскольку в наших рассуждениях имеется в виду произвольное к ^ N(п), то, имея это в виду, приведем неравенство, достаточное для выполнения (4.30):
(ЬеЫЩп)а _ 1)2Н{п)Ь ^ у,
то есть
п
(ЬеьГ{> - 1)20 ^ у. (4.31)
В результате, заменив неравенство (4.29) на более грубое неравенство (4.31), получили достаточное условие, обеспечивающее неравенство (4.27), и, вместе с тем, обеспечивающее односвязность компактов ^Г(тк) в А-системе {^Г(тк): тк € Г}, а также лип-шицевость функций <к (21) и Лк(21), участвующих в формировании компактов ^Г(тк) =
к)
и [(21 ,<к(21Й ,(21,Лк(21))].
А ]
Заметим, что если по условиям задачи 1.1, константы Ь, Ь-, § настолько велики, что (4.31) не выполняется, то, очевидно, для выполнения неравенства (4.27) следует изменить выбранную ранее константу п0, увеличив ее. Например, в качестве новой п0 можно взять
¿0 = 4(Ьеь/* — 1)§.
к
1 ^ ОЛ П0П,1,„1Т,Т , V1 С Г «Ь^Д
Дополним верхнюю оценку (Ьеь * — 1)2§ величины Е(Ьеь — 1)2А, к = 1, N(п). Эта
г=1
оценка весьма грубая, поскольку величины еь/гА, г = 1 ,к заменяются достаточно большой величиной еь/м(п)А = еь/*. Достоинство этой оценки в ее простоте.
к / •
Выпишем здесь более тонкую оценку сверху величины Е(Ьеь/— 1)2А. Точнее, оце-
г=1
N (п) /
ним сверху ее мажоранту Е (Ьеь/— 1)2А. Справедливо соотношение
г=1
N (п) N (п) — 1
гА — 1)2А = {(Ьеь/N(n)А — 1)+ (Ьеь/гА — 1)}2А =
г=1 г=1
N (п) — 1
= (Ьеь/* — 1)2А + {Ь ^ еь/гА — (N(п) — 1)}2А =
г=1
N(п)А _ 1
- 1)2Д + Г/Л 1 ' - ЛГ(п) + 1}2Д
* _ 1 *
= Ьеь/,?2Д + {Ь—у---2Д - 2Щ < Ьеь^2Д + {£—- • 2Д - 2Щ.
е А — 1 Ь-' А
Учитывая, что А = А(Г) ^ можем продолжить оценку сверху
N (п) 2 т
^(Ьеь'гА - 1)2Д < Ьеь^21) + - 2д = (Ьеь^ - 1)2?? +
г=1
§ 5. Приближенное вычисление множеств Z0 в задачах о сближении нелинейных конфликтно управляемых систем в М2
В этом параграфе представлены конкретные задачи о сближении нелинейных конфликтно управляемых систем в М2 (задача 5.1, варианты а, Ь, с), не удовлетворяющих, вообще говоря, условию существования седловой точки в так называемой маленькой игре (см. [2, с. 56]).
Для рассматриваемых в задаче 5.1 вариантов а, Ь, с представлены результаты вычислений аппроксимирующей максимальный минимаксный и-стабильный тракт А-системы {-^г (т): т е Г}, отвечающей разбиению Г промежутка [¿о, §] = [0, 2], на котором рассматривается задача 5.1 о сближении.
В вариантах а, Ь задачи 5.1 вектор-функция <£*(я) = ^*(ж1,ж2) = (^*(ж1 ),^»(ж2)) удовлетворяет условиям, наложенным на функцию /*(х) = <^*(я) в системе (4.1) из §4. При этом конфликтно управляемая система (варианты а, Ь) несколько отличается от системы (4.1). Однако схема вычисления А-системы {^(т): т е Г} сводится к схеме вычисления, описанной в § 4, — во второе уравнение конфликтно управляемой системы введена в качестве слагаемого нелинейная скалярная функция вт(й • у) управлений й, V игроков. В связи с этим в этой схеме из § 4 претерпевают изменения лишь множества и входящие в формулы
Замечание 2. Вторые координаты крайних точек из отрезков и вычислены приближенно с точностью до 6 знака после запятой.
Задача 5.1 (варианты а, Ь) рассматривается с различными конфликтно управляемыми системами и целевыми множествами М в М2.
Задача 5.1 (вариант а). Конфликтно управляемая система на промежутке времени [¿0,$] = = [0, 2] имеет вид
^г(то) = М, ^г(7к+1) = ^г(тк+1) П ^2г(тк+1),
(5.1)
г = 1, 2, тк,7к+1 из Г;
а именно, в вариантах а, Ь
¿1 = [(—1, —0.00403), (—1,1.96390)], = [(1, —0.00403), (1,1.96390)].
(5.2)
здесь иеР,ьед,Р = д = [-1,1 ];й е Р,и е
Целевое множество М представимо в виде
М = \ (хъх2): X! е [~л/а2Тс2 + 0.01, л/а2 + с2 - 0.01
Ж €
I4 + 4с2— с2 — ж? л / Л / а4 + 4с2х1 — с2 —
, а = 5.5, с = 5.0.
Разбиение Г = {т0 = £0, т1,..., т,..., т^ = §} промежутка [£0, §], где т+1 — т = А = § ^ 1
= А (Г) =-=--диаметр разбиения Г.
v ; 200 100 ^
На рис. 1 представлено графическое изображение А-системы {^Г(т): т € Г} на промежутке времени [0, 2] в варианте а.
2
Рис. 1. А-система в варианте а
Задача 5.1 (вариант Ь). Конфликтно управляемая система на промежутке времени =
= [0,2] имеет вид (5.2), где ограничения Р, ), Р, на управления игроков те же, что и в варианте а;
<1(Х1) = Х1, <2Ы = |1п(П(—Х2)приХ2 11:
1п(ж2) при ж2 € (1; т).
Целевое множество М представимо в виде
М = <[ (ж1, ж2): ж1 € 87
7 7 '
4Г' 4Г
ж е
— л/т2 — (Х\ + й)2, л/т^^^х/^/^)2] и д/г2 — (^1 — й)2, л/г2 ~ (Х\ — з)
г = 4, Й = -г.
4
Разбиение Г — то же, что и в варианте а.
На рис. 2 представлено графическое изображение А-системы {^г(т): т е Г} на промежутке времени [0, 2] в варианте Ь.
2
Рис. 2. А-система в варианте Ь
Задача 5.1 (вариант с). Конфликтно управляемая система на промежутке [¿о, = [0, 2] имеет вид
—¡Г = ~Х2 + <И
(1X2 1 /_ _ч9
—— = XI + и + - (и - УГ] (И 4К '
здесь и ер,иед,р = д= [-М], ъ еР,у е~Я,Р = Я = [-1,1].
В этом варианте А-система {^г(т): т е Г} вычисляется также по формулам (5.1); при этом вектор-функция (ж) не удовлетворяет, вообще говоря, условиям, наложенным на эту функцию (точнее, на функцию /*(ж) = —(ж)) в §4. В связи с этим алгоритм вычисления множеств ), т е Г, несколько отличается от алгоритма, примененного при вычислении этих множеств в вариантах а, Ь задачи 5.1. Здесь множества , в (5.1) имеют вид
Л = [(1, —1), (1, 2)], = [(—1, —1), (—1,2)].
Целевое множество М в варианте с представимо в виде
М ={ (ж1 ,ж2): ж1 € [—0.6, 0.6]
Ж2 €
■Ь\ 1 — — —,Ь\ 1 (:Г1 + 5);
и
(Ж1 —
а = 0.3, Ь = 0.15, 5 = 0.3.
Разбиение Г — то же, что и в предыдущих вариантах.
На рис. 3-9 представлено графическое изображение А-системы {^Г(тг): тг € Г}. Вместе с тем представлено графическое изображение А-системы {ЖГ(^-): ^ € Г*}, ЖГ(¿7) = (тг), ^ + тг = ¿0 + § = 2, ^ € Г*, аппроксимирующей максимальный минимаксный и-стабильный мост Ж0 — множество разрешимости в задаче 1.1; здесь
1
г* = {¿о, ...Л-,..., ¿200 = 2}, А = А(Г*) = —.
а
а
Рис. 3. А-система на промежутке [0.01, 0.24]
Финансирование. Исследования третьего автора выполнены в рамках научных разработок, проводимых в Уральском математическом центре при финансовой поддержке Министерства науки и высшего образования Российской Федерации (номер соглашения 075-02-20241377).
Рис. 4. А-система на промежутке [0.32,0.56]
z2
г
1.2 zi
-1.2 0 1.2 "
И.2
Рис. 5. А-система на промежутке [0.64,0.88]
Рис. 6. А-система на промежутке [0.96,1.20]
Рис. 7. А-система на промежутке [1.28,1.52]
СПИСОК ЛИТЕРАТУРЫ
1. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. https://zbmath.org/0246.90060
2. Красовский Н.Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974. https://zbmath.org/0298.90067
3. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. https://zbmath.org/0542.90106
4. Красовский Н. Н., Субботин А. И., Ушаков В. Н. Минимаксная дифференциальная игра // Докл. АН СССР. 1972. Т. 206. № 2. С. 277-280. https://www.mathnet.ru/rus/dan37117
5. Красовский Н.Н. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226. № 6. С. 1260-1263. https://www.mathnet.ru/rus/dan39789
6. Красовский Н. Н. Унификация дифференциальных игр // Труды Института математики и механики. Свердловск: УНЦ АН СССР, 1977. Вып. 24: Игровые задачи управления. С. 32-45.
7. Тарасьев А. М., Ушаков В. Н., Хрипунов А. П. Об одном вычислительном алгоритме решения игровых задач управления // Прикладная математика и механика. 1987. Т. 51. Вып. 2. С. 216-222. https://www.elibrary.ru/item.asp?id=32817654
8. Тарасьев А. М. Конструкции и методы негладкого анализа в задачах оптимального гарантированного управления: автореф. дис. ... д-ра физ.-матем. наук. Екатеринбург, 1996. 32 с.
9. Григорьева С. В., Пахотинских В. Ю., Успенский А. А., Ушаков В. Н. Конструирование решений в некоторых дифференциальных играх с фазовыми ограничениями // Математический сборник. 2005. Т. 196. № 4. С. 51-78. https://doi.org/10.4213/sm1284
10. Субботин А. И. Минимаксные неравенства и уравнения Гамильтона-Якоби. M.: Наука, 1991. https://zbmath.org/0733.70014
11. Fleming W. H. The convergence problem for differential games // Journal of Mathematical Analysis and Applications. 1961. Vol. 3. Issue 1. P. 102-116. https://doi.org/10.1016/0022-247X(61)90009-9
12. Понтрягин Л. С. О линейных дифференциальных играх. 1 // Докл. АН СССР. 1967. Т. 174. № 6. C. 1278-1280. https://www.mathnet.ru/rus/dan33165
13. Понтрягин Л. С. О линейных дифференциальных играх. 2 // Докл. АН СССР. 1967. Т. 175. № 4. С. 764-766. https://www.mathnet.ru/rus/dan33242
14. Никольский М. С. Об альтернированном интеграле Л. С. Потрягина // Математический сборник (новая серия). 1981. Т. 116 (158). № 1 (9). С. 136-144. https://www.mathnet.ru/rus/sm2447
15. Никольский М. С. О нижнем альтернированном интеграле Понтрягина в линейных дифференциальных играх преследования // Математический сборник (новая серия). 1985. Т. 128 (170). № 1 (9). С. 35-49. https://www.mathnet.ru/rus/sm2016
16. Половинкин Е. С., Иванов Г. Е., Балашов М. В., Константинов Р. В., Хорев А. В. Об одном алгоритме численного решения линейных дифференциальных игр // Математический сборник. 2001. Т. 192. № 10. С. 95-122. https://doi.org/10.4213/sm604
17. Азамов А. Полуустойчивость и двойственность в теории альтернированного интеграла Понтря-гина//Докл. АН СССР. 1988. Т. 299. № 2. С. 265-268. https://www.mathnet.ru/rus/dan7722
18. Пшеничный Б. Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 184. № 2. С. 285-287. https://www.mathnet.ru/rus/dan34373
19. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978.
20. Grinikh A. L., Petrosyan L.A. An effective punishment for an n-person prisoner's dilemma on a network // Труды Института математики и механики УрО РАН. 2021. Т. 27. № 3. С. 256-262. https://doi.org/10.21538/0134-4889-2021-27-3-256-262
21. Пацко В. С. Задача качества в линейных дифференциальных играх второго порядка // Дифференциальные игры и задачи управления. Сб. статей. Свердловск: УНЦ АН СССР, 1975. С. 167-227.
22. Гомоюнов М. И., Лукоянов Н. Ю. К вопросу численного решения дифференциальных игр для линейных систем нейтрального типа // Труды Института математики и механики УрО РАН. 2017. Т. 23. № 1. С. 75-87. https://doi.org/10.21538/0134-4889-2017-23-1-75-87
23. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Pursuit differential games with state constraints // SIAM Journal on Control and Optimization. 2000. Vol. 39. Issue 5. P. 1615-1632. https://doi.org/10.1137/S0363012998349327
Поступила в редакцию 30.07.2024
Принята к публикации 27.10.2024
Ушаков Владимир Николаевич, д. ф.-м. н., главный научный сотрудник, отдел динамических систем, Институт математики и механики УрО РАН, 620219, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. ORCID: https://orcid.org/0000-0002-0527-5375 E-mail: [email protected]
Ушаков Андрей Владимирович, младший научный сотрудник, отдел динамических систем, Институт математики и механики УрО РАН, 620219, Россия, г. Екатеринбург, ул. С. Ковалевской, 16; научный сотрудник, лаборатория математической теории управления, Удмуртский государственный университет, 426034, Россия, г. Ижевск, ул. Университетская, 1. ORCID: https://orcid.org/0000-0002-3004-4245 E-mail: [email protected]
Кувшинов Олег Александрович, математик 1 категории, отдел динамических систем, Институт математики и механики УрО РАН, 620219, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. ORCID: https://orcid.org/0000-0001-6827-1809 E-mail: [email protected]
Цитирование: В. Н. Ушаков, А. В. Ушаков, О. А. Кувшинов. Сближение конфликтно управляемых систем на конечном промежутке времени // Известия Института математики и информатики Удмуртского государственного университета. 2024. Т. 64. С. 70-96.
V. N. Ushakov, A. V. Ushakov, O. A. Kuvshinov
Convergence of conflict-controlled systems over a finite period of time
Keywords: control, conflict-controlled system, target set, differential inclusion, saddle point in a small game, convergence problem, solvability set of the convergence problem, maximum minimax u-stable bridge, maximum minimax u-stable path, A-system.
MSC2020: 93C15, 49N30
DOI: 10.35634/2226-3594-2024-64-06
A nonlinear conflict-controlled system is considered over a finite period of time and in a finite-dimensional Euclidean space. The problem of convergence with a compact target set at a fixed point in time is studied. Within the framework of the convergence problem, one of the key issues is investigated — the approximate construction of sets of solvability of the problem. An approach to approximate construction is discussed, the basis of which is a model that complements N. N. Krasovsky's unification method in the theory of differential games.
Funding. The study of the third author was performed as part of research conducted in the Ural Mathematical Center with the financial support of the Ministry of Science and Higher Education of the Russian Federation (Agreement number 075-02-2024-1377).
REFERENCES
1. Krasovskii N.N. Igrovye zadachi o vstreche dvizhenii (Game problems on the encounter of motions), Moscow: Nauka, 1970. https://zbmath.org/0246.90060
2. Krasovskii N.N., Subbotin A.I. Pozitsionnye differentsial'nye igry (Positional-differential games), Moscow: Nauka, 1974. https://zbmath.org/0298.90067
3. Subbotin A. I., Chentsov A. G. Optimizatsiya garantii v zadachakh upravleniya (Guarantee optimization in control problems), Moscow: Nauka, 1981. https://zbmath.org/0542.90106
4. Krasovskii N.N., Subbotin A.I., Ushakov V.N. A minimax differential game, Soviet Mathematics. Doklady, 1972, vol. 13, pp. 1200-1204. https://zbmath.org/0284.90097
5. Krasovskii N.N. On the problem of unifying differential games, Soviet Mathematics. Doklady, 1976, vol. 17, pp. 269-273. https://zbmath.org/0367.90133
6. Krasovskii N. N. Unification of differential games, Trudy Instituta Matematiki i Mekhaniki, Sverdlovsk: Ural Scientific Center of the USSR Academy of Sciences, 1977, issue 24: Game control tasks, pp. 32-45 (in Russian).
7. Taras'yev A. M., Ushakov V. N., Khripunov A. P. On a computational algorithm for solving game control problems, Journal of Applied Mathematics and Mechanics, 1987, vol. 51, issue 2, pp. 167-172. https://doi.org/10.1016/0021-8928(87)90059-1
8. Taras'ev A.M. Constructions and methods of nonsmooth analysis in optimal guaranteed control problems, Abstract of Dr. Sci. (Phys.-Math.) Dissertation, Yekaterinburg, 1996, 32 p. (In Russian).
9. Grigor'eva S.V., Pakhotinskikh V. Yu., Uspenskii A. A., Ushakov V.N. Construction of solutions in certain differential games with phase constraints, Sbornik: Mathematics, 2005, vol. 196, issue 4, pp. 513-539. https://doi.org/10.1070/SM2005v196n04ABEH000890
10. Subbotin A.I. Minimaksnye neravensta i uravneniya Gamil'tona-Yakobi (Minimax inequalities and Hamilton-Jacobi equations), Moscow: Nauka, 1991. https://zbmath.org/0733.70014
11. Fleming W. H. The convergence problem for differential games, Journal of Mathematical Analysis and Applications, 1961, vol. 3, issue 1, pp. 102-116. https://doi.org/10.1016/0022-247X(61)90009-9
12. Pontryagin L. S. Linear differential games. I, Soviet Mathematics. Doklady, 1967, vol. 8, pp. 769-771. https://zbmath.org/0157.16304
13. Pontryagin L. S. Linear differential games. II, Soviet Mathematics. Doklady, 1967, vol. 8, pp. 910-912. https://zbmath.org/0157.16401
14. Nikol'skii M.S. On the alternating integral of Pontryagin, Mathematics of the USSR-Sbornik, 1983, vol. 44, issue 1, pp. 125-132. https://doi.org/10.1070/SM1983v044n01ABEH000956
15. Nikol'skii M. S. On the lower alternating integral of Pontryagin in linear differential games of pursuit, Mathematics of the USSR-Sbornik, 1987, vol. 56, issue 1, pp. 33-47. https://doi.org/10.1070/SM1987v056n01ABEH003022
16. Polovinkin E. S., Ivanov G. E., Balashov M. V., Konstantinov R. V., Khorev A. V. An algorithm for the numerical solution of linear differential games, Sbornik: Mathematics, 2001, vol. 192, issue 10, pp. 1515-1542. https://doi.org/10.1070/SM2001v192n10ABEH000604
17. Azamov A. Semistability and duality in the theory of the Pontryagin alternating integral, Soviet Mathematics. Doklady, 1988, vol. 37, no. 2, pp. 355-359. https://zbmath.org/0683.90108
18. Pshenichnyj B.N. The structure of differential games, Soviet Mathematics. Doklady, 1969, vol. 10, pp. 70-72. https://zbmath.org/0227.90062
19. Chernous'ko F. L., Melikyan A. A. Igrovye zadachi upravleniya i poiska (Game-theoretical control and search problems), Moscow: Nauka, 1978. https://zbmath.org/0443.90113
20. Grinikh A. L., Petrosyan L.A. An effective punishment for an n-person prisoner's dilemma on a network, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2021, vol. 27, no. 3, pp. 256-262. https://doi.org/10.21538/0134-4889-2021-27-3-256-262
21. Patsko V. S. The quality problem in second-order linear differential games, Differentsial'nye igry i zadachi upravleniya, Sverdlovsk: Ural Scientific Center of the USSR Academy of Sciences, 1975, pp. 167-227.
22. Gomoyunov M. I., Lukoyanov N.Yu. On the numerial solution of differential games for neutraltype linear systems, Proceedings of the Steklov Institute of Mathematics, 2018, vol. 301, suppl. 1, pp. 44-56. https://doi.org/10.1134/S0081543818050048
23. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Pursuit differential games with state constraints, SIAM Journal on Control and Optimization, 2000, vol. 39, issue 5, pp. 1615-1632. https://doi.org/10.1137/S0363012998349327
Received 30.07.2024 Accepted 27.10.2024
Vladimir Nikolaevich Ushakov, Doctor of Physics and Mathematics, Principal Researcher, Department of Dynamical Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620219, Russia. ORCID: https://orcid.org/0000-0002-0527-5375 E-mail: [email protected]
Andrei Vladimirovich Ushakov, Junior Researcher, Department of Dynamical Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620219, Russia;
Researcher, Laboratory of Mathematical Control Theory, Udmurt State University, ul. Universitetskaya, 1,
Izhevsk, 426034, Russia.
ORCID: https://orcid.org/0000-0002-3004-4245
E-mail: [email protected]
Oleg Alexandrovich Kuvshinov, Mathematician, Department of Dynamical Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620219, Russia. ORCID: https://orcid.org/0000-0001 -6827-1809 E-mail: [email protected]
Citation: V. N. Ushakov, A. V. Ushakov, O. A. Kuvshinov. Convergence of conflict-controlled systems over a finite period of time, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2024, vol. 64, pp. 70-96.