Челябинский физико-математический журнал. 2022. Т. 7, вып. 1. С. 54-79.
УДК 517.977.8 БОТ: 10.47475/2500-0101-2022-17105
УНИФИКАЦИЯ В ИГРОВОЙ ЗАДАЧЕ О СБЛИЖЕНИИ И СВОЙСТВО СТАБИЛЬНОСТИ
В. Н. Ушаков
Институт математики и механики им. Н. Н. Красовского УрО РАН,
Екатеринбург, Россия
В работе изучается игровая задача о сближении конфликтно управляемой системы с целевым множеством в фазовом пространстве системы в фиксированный момент времени — момент окончания игры. Исследуется ключевое в этой задаче свойство и-стабильности, введённое во второй половине XX в. Н. Н. Красовским и А. И. Субботиным. Основу исследования составляют индуцированные конфликтно управляемой системой унификационные конструкции, которые вводятся в игровую задачу о сближении в рамках формализма Гамильтона — Якоби. В работе вводятся понятия и-стабильного и максимального и-стабильного трактов, двойственные к понятиям и-стабильного и максимального и-стабильного мостов, введённым Н. Н. Красовским и А. И. Субботиным. Определяются также понятия аппроксимирующих систем (А-систем) — систем множеств в фазовом пространстве, аппроксимирующих максимальный и-стабильный мост и максимальный и-стабильный тракт в игровой задаче о сближении. При этом понятие максимального и-стабильного тракта есть очевидный аналог понятия траектории в теории обыкновенных дифференциальных уравнений, а понятие А-системы для этого тракта есть аналог понятия ломаной Эйлера. Эти новые понятия обладают и особенностями, которые привнесены им наличием помехи (т. е. второго игрока) в динамике конфликтно управляемой системы.
Ключевые слова: конфликтно управляемая система, управление, игровая задача о сближении, дифференциальное включение, гамильтониан, унификация, свойство стабильности, множество.
Введение
В работе рассматривается игровая задача о сближении конфликтно управляемой системы в конечномерном евклидовом пространстве в фиксированный момент времени — момент окончания игры. В рамках этой задачи исследуется ключевое в позиционных дифференциальных играх свойство стабильности, введённое в работах [1-3]. Это свойство, подробно изученное в [1-3] и ряде других работ, выделяет в пространстве позиций игры стабильные мосты, являющиеся основными элементами разрешающих конструкций в игровых задачах.
Существующие в настоящее время различные формулировки свойства стабильности и определения стабильных мостов эквивалентны по существу, то есть выделяют в пространстве позиций игровой задачи одни и те же множества. При рассмотрении многочисленных вопросов теории и при решении конкретных игровых задач часто оказывается важным, какая из формулировок стабильности берётся
Исследование выполнено за счет средств гранта Российского научного фонда (проект № 1911-00105).
за основу. Так, например, при рассмотрении ряда теоретических вопросов очень удобна инфинитезимальная формулировка свойства стабильности, в то время как при рассмотрении конкретных игровых задач она не эффективна. Эффективной с точки зрения как теории, так и приложений оказалась предложенная в работах Н. Н. Красовского [4; 5] формулировка свойства стабильности, основанная на концепции унификации конфликтно управляемых систем. В эту формулировку вводится гамильтониан конфликтно управляемой системы, что, в свою очередь, включает теорию игровых позиционных задач управления в рамки формализма Гамильтона — Якоби.
Настоящая работа дополняет исследования свойства стабильности и основывается на унификационных конструкциях Н. Н. Красовского [3-5], а также работах [6-10], развивающих эти конструкции. В дополнение к понятиям и-стабильных и максимальных (по включению) и-стабильных мостов вводятся на основе унификации конфликтно управляемой системы двойственные понятия и-стабильного и максимального и-стабильного трактов в игровой задаче о сближении в общей постановке, а также важное понятие аппроксимирующей системы (А-системы) множеств. Эта система множеств в фазовом пространстве, отвечающая конечному разбиению промежутка времени, на котором рассматривается игровая задача, мажорирует максимальный и-стабильный тракт и при измельчении разбиения стягивается к нему сверху.
Важность А-системы в теории дифференциальных игр состоит в том, что она представляет собой первую надёжную ступень теоретического фундамента, на базе которого можно будет реализовать разрешающие конструкции в конкретных игровых задачах о сближении. Следует также надеяться на то, что она составит основу для формирования других аппроксимирующих систем множеств в фазовом пространстве, не обязательно мажорирующих максимальный и-стабильный тракт или мост.
Настоящая работа примыкает к [1-11].
1. Игровая задача о сближении (постановка)
Задана конфликтно управляемая система на конечном промежутке времени [¿о,$], ¿о < 0 < го, описываемая дифференциальным уравнением
— = /(¿,т,и,г), г € [¿0,0], т € Кт, и € Р, г € ф; (1.1)
здесь т — т-мерный фазовый вектор системы, и и г — управления первого и второго игроков соответственно, Р и ф — элементы из пространств сошр(Кр) и сошр(К) компактов в евклидовых пространствах и К9 с хаусдорфовой метрикой. Предполагаем, что система (1.1) удовлетворяет следующим условиям. Условие А. Функция /(г, т,и, г) определена и непрерывна на [¿о,0] х х
Р
х ф и для любой ограниченной и замкнутой области С С [¿о, 0] х найдётся постоянная Ь = Ь(С) € (0, го), при которой
||/(¿,т*,и, г) — /(г, т*, и, г)|| ^ Ь||т* — т*||, (г,т*,и, г), (¿,т*,и, г) € С х Р х ф,
где ||/1| — норма вектора / в евклидовом пространстве.
Условие В. Найдётся такая постоянная ^ € (0, го), что выполняется
||/(¿,т,и,г)|| ^ ^(1 + ||т||), (г,т,и,г) € [¿о,0] х Кт х Р х ф.
Сформулируем для системы (1.1) задачу о сближении, стоящую перед первым игроком.
Пусть заданы точка х(0) € и множество М € еошр(Мт).
Задача 1. Первому игроку требуется обеспечить с помощью некоторой позиционной стратегии и* (¿, х), (¿, х) € [¿0, $] х попадание в момент времени $ движения х[Ь], Ь € [¿о, $], х[Ь0] = ж(0) системы (1.1) на целевое множество М, какова бы ни была при этом контрстратегия г>(Ь,х,и), (¿,х,и) € [¿0,$] х Ет х Р второго игрока.
Замечание 1. В формулировке задачи 1 присутствует движение х[Ь], х[Ь0] = ж(0), Ь € [¿0,$], порождённое позиционной стратегией и*(Ь,х) первого игрока и контрстратегией и*(Ь,х) второго игрока. Таким образом, задача 1 приведена здесь в так называемой минимаксной постановке, которая в информационном плане даёт преимущество второму игроку: при конструировании своих управлений он знает выбор управления и первым игроком. Строгая математически формулировка минимаксной задачи о сближении и связанных с ней понятий дана в работах [3; 11]. Поскольку в этой работе упор сделан на изучение свойства и-стабильности, и-стабильных трактов и и-стабильных мостов, то здесь мы уделяем меньше внимания (см. §4) подробному описанию позиционных стратегий первого игрока, контрстратегий второго игрока и порождённых ими движений х[Ь], ж[Ь0] = ж(0) конфликтно управляемой системы (1.1). Это описание приведено в [3; 11].
Замечание 2. Согласно работам [1-3; 11], позиционная стратегия и*(Ь,х) первого игрока, разрешающая задачу 1, может быть реализована для любой исходной позиции (¿*,х*) системы (1.1), удовлетворяющей включению (¿*,х*) € Ж0, где Ж0 — множество позиционного поглощения (см. [1-3; 11]); в силу сказанного Ж0 называют ещё и множеством разрешимости задачи 1. Основная трудность в решении задачи 1 приходится, как известно, на выделение множества Ж0 в пространстве [¿0,$] х Мт. Выделение Ж0 в [¿0,$] х представляет серьёзную математическую проблему (здесь имеется в виду точное выделение). В общем случае формулировки задачи 1 эта проблема неразрешима из-за сложности игровой задачи о сближении. Эффективное аналитическое описание Ж0 возможно лишь в относительно простых конкретных игровых задачах.
Невозможность дать такое аналитическое описание множества Ж0 в большинстве конкретных игровых задач приводит к тому, что на передний план при их решении выдвигаются вопросы и задачи, связанные с приближённым конструированием множества Ж0. При этом, стремясь выделить множество Ж0 в пространстве [¿0,$] х Мт позиций (¿*,х*), используют очень важное свойство множества Ж0: Ж0 есть максимальный и-стабильный мост в задаче 1 [3]. Обсуждению этого свойства посвящён следующий параграф.
2. Свойство и-стабильности в задаче 1 (унификационные конструкции)
В этом параграфе, опираясь на унификационные конструкции [3-7], опишем свойства и-стабильности и связанные с ним и-стабильные множества в [¿0,$] х Кт.
Предваряя это описание, а также принимая во внимание условия А, В и определение множества Ж0, заключаем, что можно (по компонентам задачи 1) указать достаточно большую ограниченную и замкнутую область О в [¿0, $] х , включающую в себя Ж0 и все упомянутые в формулировке задачи 1 движения х[Ь], Ь € [¿0,$] системы (1.1), приходящие на множество М в момент $.
Более того, мы укажем область G С [t0,0] х Rm, в которой содержатся все движения x[t], t G [t0,0] системы (1.1), приходящие в е-окрестность M£, целевого множества M в момент времени 0; здесь е — некоторое фиксированное положительное число.
Приступим к описанию области G. Для этого множеству M£ в Rm, отвечающему конечному моменту 0 из промежутка [t0,0], сопоставим множество x£0) = M£ в пространстве Rm (здесь X(0) = M), которое считаем отвечающим начальному моменту to промежутка [t0, 0].
Полагаем y = max ||x(0)|| g (0, oo), так что max ||x(0)|| = y + е.
x(°)ex (o) x(0)eXf)
При выделении области G воспользуемся следующим утверждением. Лемма Гронуолла — Беллмана (см. [12, стр. 104]). Пусть скалярные непрерывные функции z(t) и g(t) на [t0,0] неотрицательны и
t
z(t) ^ a + Jg(s)z(s)ds, t G [t0,0],
to
где a G (0, го). Тогда
f g(s)ds
z(t) ^ ae4o , t G [t0,0].
Выберем произвольные точку т(о) € Хг(о) и и(з), г(з) — допустимые управления игроков на [¿о,0], т.е. и(з) € Р, г(з) € ф, 5 € [¿о,0], измеримые по Лебегу на [¿о,0].
Тогда решение т[г] дифференциального уравнения (1.1) с начальным условием т[го] = т(о), отвечающее управлениям и(г) и г [г] на [¿о,0], удовлетворяет соотношению
г
тМ = т<о> + / / (.,*[.],„(.),*.))<«., г € [¿о,0].
го
Учитывая наложенное на систему (1.1) условие В, получаем
г
МП < 1|т(о,И + ,/<1 + М)*, г € [¿о,0]
го
и, следовательно, справедливо неравенство
г
||тМ|| ^ а + У #(5)||т[з]г € [¿о,0], го
где а = ||т(о)|| + ^(0 — ¿о), #(£) = ^ при г € [¿о, 0].
На основании леммы Гронуолла — Беллмана получаем
11т[¿] | ^ 7е* при г € [¿о, 0]; (2.1)
здесь 7* = (7 + е + ^ ■ (0 — ¿о))в^-го) € (0, го).
Введём множество У(¿о,Хг(о)) = с1 {(г,т[г]) : г € [¿о,0]}, здесь т[г], г € [¿о,0] — всевозможные решения (движения) системы (1.1), т^о] = т(о) € Х^, порождённые всевозможными допустимыми управлениями и^), v(г), г € [¿о,0] игроков.
Принимая во внимание (2.1), получаем, что У(¿0,Хе0)) содержится в цилиндре П(е) = [¿0,$] х В(0; 7е*) в пространстве [¿0,$] х Ет; 0 — нуль в Ет.
Очевидно, что аналогичные рассуждения и оценки, непосредственно относящиеся к множеству Ж0, приводят к включению
Ж0 С П(0) С П(е); (2.2)
здесь обозначено П(0) = [¿0, $] х В(0; 70*); т0 = (т + М$ - ¿0))е^-4о) € (0, то).
Замечание 3. Согласно включениям (2.2), множество Ж0 разрешимости задачи 1 содержится внутри цилиндра П(е) и отделено от его границы [¿0, $] х{х € : ||х|| = 7е*} е-слоем {(¿,х): 70 ^ ||х|| ^ 7*}. Введение е-слоя над множеством Ж0 обусловлено тем, что в следующих параграфах этой работы будут рассматриваться, наряду с Ж0, множества в [¿0,$] х Кт, мажорирующие Ж0. Наличие множества П(е) и примыкающего к его границе е-слоя {(¿, х): 70 ^ ||х|| ^ 7*,Ь € [¿0,$]} обеспечат корректность приводимых ниже оценок. В заключение этого замечания полагаем
О = П(е) С [¿0,$] х Ет. (2.3)
Не нарушая общности рассуждений, можем считать, что область О (2.3) — та ограниченная и замкнутая область в [¿0,$] х Кт, в которой происходит игра и что все конструкции (множества и движения системы (1.1)) содержатся в О.
В результате мы трактуем область О (2.3) как сцену, на которой разворачивается игра на промежутке времени [¿0, $].
Очевидно при этом, что область О (2.3) представляет собой в конкретных игровых задачах сильное загрубление (т. е. расширение) сцены. Тем не менее именно эту область О мы имеем в виду в последующих рассуждениях и оценках.
Перейдём к описанию свойства и-стабильности. В этом параграфе, опираясь на унификационные конструкции [4-7], опишем свойство и-стабильных замкнутых множеств в О.
Стабильность непустого замкнутого множества Ш С О означает слабую инвариантность этого множества относительно некоторого набора дифференциальных включений (д. в.), индуцированных на промежутке [¿0, $] системой (1.1) при помощи некоторого семейства ^ многозначных отображений.
Уточним, что мы имеем в виду.
Для описания семейства ^ введём скалярную функцию — гамильтониан конфликтно управляемой системы (1.1)
Н(¿,х,/) = шахшт(/,/(¿, х,и, V)), (¿, х,/) € О х Ет;
пеР уея
здесь (/, /) — скалярное произведение векторов / и / из .
Полагаем ^(¿, х) = со{/(¿, х, и, V): и € Р, V € ф}, (¿, х) € О.
^х
Заметим, что все рассмотренные ниже решения х[£], ^ € [¿0,$] д. в. — € ^(¿, х)
удовлетворяют включению (¿,х[ф € О при £ € [¿0,$].
Зафиксируем в Ет замкнутый шар В* = В(0; К) = {х € : ||х|| ^ К}, К € (0, то), содержащий все ^(¿,х), (¿, х) € О.
Выделим в пространстве единичную сферу Б = {/ € : ||/|| = 1}, и в последующих рассуждениях используем векторы / € Б, трактуя их как некоторые обобщённые управления второго игрока, подменяющие в определённом смысле контруправления v(u) € ф, и € Р второго игрока.
Векторы l G S удобны тем, что являются элементами сферы S — множества в Rm, имеющего чрезвычайно простую геометрию. Кроме того, они входят в набор аргументов гамильтониана H(t, x, l) — функции, определяющей динамику конфликтно управляемой системы (1.1). Полагаем при (t,x,l) G G х S
ni(t,x) = {/ G Rm: (l,/> ^ H(t,x,l)}, F(t,x) = ni(t,x) П F(t,x).
Справедливо включение Fj(t,x) С B*, (t,x,l) G G х S. Введём в рассмотрение семейство L многозначных отображений (t,x) М F^(t,x), l G S, определённых на G.
Наложим не слишком ограничительное условие на L. Условие C. Справедливо неравенство
H*(t,x,l) < H(t,x,l) < H*(t, x, l), (t, x, l) G G х S;
здесь H*(t,x,l)= min (l,/>, H*(t,x,l)= max (l,/>.
/ (t,x) / (t,x) При выполнении условия C многозначное отображение (t,x,l) М- F^(t,x) непрерывно на компакте Gx S в хаусдорфовой метрике и, значит, равномерно непрерывно на G х S. Следовательно, существует такая скалярная функция w*(8) ^ 0, 8 ^ 0, что
d(Fi(t*,x*),Fi(t*,x*)) ^ w*(|t* - t*| + ||x* - x*||), (t*,x*), (t*,x*) G G, l G S;
здесь d(F*,F*) = max(h(F*,F*),h(F*,F*)) — хаусдорфово расстояние между компактами F* и F* в Rm, h(F*,F*) = max min ||f* — /*|| — хаусдорфово отклонение
F* от F*. * *
Введём функцию = iw* ((1 + K)$), # G (0, го), где K — радиус шара B*. Функцию применим при доказательстве утверждений в § 3.
Дадим определение оператора u-стабильного поглощения в задаче 1 в терминах отображений из семейства L. Для этого введём обозначения. Пусть x* G Rm, X* С Rm; t* и t* — моменты в [t0, 0], to ^ t* ^ t* ^ l G S. Полагаем X^t*, t*, x*) —
dx
множество достижимости в момент t* д. в. — G Fl(t,x), x(t*) = x*; Xl(t*,t*,X*) =
dt
dx
(J Xi(t*,t*,x*) — множество достижимости в момент t* д. в. — G Fi(t,x) с на-ж»ех» dt
чальным множеством X*; Xl-1(t *,t *,X *) = {x * G Rm: Xl(t *,t *,x *) P|X * = 0}, где
X * с Rm.
Определение 1. [8]. Оператором и-стабильного поглощения п в задаче 1 назовём многозначное отображение ^ *,Х *) м- п^ *,г*,Х *), определённое на А * х 2К™ соотношением
n(t*,t*,X*) = р| X-1 (t*,t*,X *);
les
здесь А * = {(t*,t*) G [to,0] x [to,0]: to ^ t* ^ t* ^ 0}.
Определение 2. [8]. Замкнутое множество W С G назовём и-стабильным мостом в задаче 1, если при любых (t *,t *) G А *
W (0) С M, W (t* ) С n(t*,t*,W (t* ));
здесь W (t) = {x G Rm : (t,x) G W}, t G [to,0].
Определение 3. [8]. Обозначим символом W0 максимальный (по включению) u-стабильный мост.
По определению W0 имеем W0 С G, W0($) = M.
Замечание 4. Определения 2, 3 u-стабильного и максимального u-стабильного мостов есть унификационные определения u-стабильных мостов в задаче 1, основанные на использовании семейства L отображений (t,x) M Fi(t,x), l G S. Эти определения u-стабильных мостов эквивалентны первоначальным определениям ад-стабильных мостов, введённым в работах [1-3]. Эквивалентность мы понимаем в том смысле, что те и другие определения выделяют в пространстве [t0,$] х Rm позиций игры одни и те же множества W и W°. Они важны для теории в том смысле, что, привлекая их, можно доказать ряд важных утверждений, составляющих основу теории дифференциальных игр. Например, можно показать, что множества W и W0 представляют собой множества исходных позиций (t*,x*) G [t0,$] х Rm системы (1.1), для которых разрешима задача 1.
Однако тогда, когда мы пытаемся приспособить эти определения для решения конкретных игровых задач 1 (с конкретными системами (1.1) и целевыми множествами M), возникают трудности. Эти трудности обусловлены тем обстоятельством, что при выделении, скажем, моста W0 мы вынуждены «пятиться» во времени t, отправляясь в момент $ из целевого множества M, используя при этом свойство u-стабильности моста W0, выраженное в терминах «прямого» времени t.
Итак, при решении конкретных игровых задач 1 возникает необходимость в обращении времени t, т. е. в переходе от «прямого» к «обратному» времени т = t0 + $ — t, t G [t0, $], и вместе с тем в представлении u-стабильных мостов W и W0 в терминах «обратного» времени т. Ниже убираем кавычки из терминов «прямого» и «обратного» времени.
Обратное время определяем соотношением т = t0 + $ — t, t G [t0,$]. Конфликтно управляемую систему (1.1) представим в виде
dz
— = h(r,z,u,v) = — f (t0 + $ — T,z,u,v), т G [t0,$], z G Rm, u G P, v G Q. (2.4) ат
Введём также д. в. dz
— G #г(т, z) = — F(t0 + $ — т, z), т G [t0,$], z G Rm, l G S (2.5) ат
и обозначения, с ним связанные. Пусть z* G Rm, Z* С Rm; (т*,т*) G A*; l G S. Полагаем Z(т*, т*, z*) — множество достижимости в момент т* д. в. (2.5) c начальной точкой z*; Zi(т*, т*, Z*) = У Zi^*, т*, z*) — множество достижимости в момент т*
д. в. (2.5) с начальным множеством Z*, отвечающим моменту т*;
Z(т*, т*, Z*) = f Zi(т*, т*, Z*). (2.6)
les
Множество Z(т*,т*, Z*) С Rm мы интерпретируем как множество совместной (по всем l G S) достижимости для д. в. (2.5), отвечающих всевозможным l G S и с начальным множеством Z*, отвечающим моменту т*.
Между многозначными отображениями (t*, t*, X*) м- n(t*, t*, X*) и (т*, т*, Z*) м Z(т*, т*, Z*) имеет место очевидная связь: свойство u-стабильности можно выразить в терминах второго отображения. А именно, в терминах обратного времени т и
отображения (т*,т*, 2*) м- Z(т*, т*,2*) и-стабильный мост Ж С О представляет собой замкнутое множество 2 С О с временными сечениями 2(т) = Ж(¿), ^ + т = ¿0 + $, т € [¿0,$], удовлетворяющими включениям
2(¿0) = Ж($) С М, 2(т*) С 2(т*,т*,2(т*)), (т*,т*) € А*; (2.7)
здесь обозначено 2(т) = {г € Ет: (т, г) € 2}, т € [¿0,$].
Определение 4. Замкнутое множество 2 С О, удовлетворяющее включениям (2.7), назовём и-стабильным трактом конфликтно управляемой системы (2.4).
Определение 5. Множество 20 С О, где 20(т) = Ж0^), т + * = ¿0 + $, т € [¿0,$], назовём максимальным и-стабильным трактом конфликтно управляемой системы (2.4).
3. Аппроксимирующая система множеств (А-система)
{^г(тг): т € Г} в
Введённое в § 2 множество 20 более приемлемо для выделения в пространстве [¿0,$] х Кт, чем Ж0. В самом деле, направление его выделения (во времени) согласуется с направлением (во времени) эволюции множеств 2(т*,т*,2(т*)) (2.6). Однако (точное) выделение множества 20, как и множества Ж0, возможно лишь в определённых конкретных игровых задачах 1. В связи с этим неизбежно возникает проблема приближённых вычислений множества 20 в конкретных игровых задачах 1.
В этом параграфе обсуждаем в рамках общей постановки задачи 1 вопросы приближённого вычисления множества 20. Приближённое вычисление 20 связано так или иначе с дискретизацией пространства [¿0,$] х позиций задачи 1 и, следовательно, с дискретизацией промежутка [¿0,$] и фазового пространства Кт. Эта дискретизация может быть воплощена в различных схемах.
В этом параграфе мы обсудим подробно первый этап дискретизации, связанный с дискретизацией временного промежутка [¿0,$], т.е. связанный с дискретизацией времени т.
Итак, введём Г = {т0 = ¿0, т1,... , т^,... , т^ € $} — двоичное разбиение промежутка [¿0,$] с диаметром А = А(Г) = N-1 ■ ($ - ¿0), N = 2Г, г € N.
Этому разбиению будет сопоставлена система {^г(т.^): т € Г} множеств ) в (А-система), аппроксимирующая множество 20. Понятие А-системы {^7Г(т^): т € Г} составляет теоретическую основу для создания методов и алгоритмов приближённого вычисления множества 20 в игровой задаче 1.
При этом основные кирпичики аппроксимационной схемы — множества достижимости ^(т*, т*, г*), / € Б, т* и т* из Г подменяются более простыми и удобными для вычислений множествами г* + (т* — т*)НДт*, г*). Затем, в рамках таких подмен, множества ^(т*,т*,2*) и 2(т*,т*,2*) = П ^(т*,т*,2*), 2* С Кт, т* и т* из
Г и определение тракта 20 трансформируются в множества и определения, более приемлемые для применения в дискретной схеме, отвечающей разбиению Г.
Определению А-системы {^г(т^): т € Г} предпошлём введение некоторых «промежуточных» систем множеств в Кт, отвечающих разбиению Г. Эти «промежуточные» системы играют исключительно вспомогательную, второстепенную роль в схеме определения системы {¿7Г(т^): т € Г}: не предполагается их конструирование в конкретных игровых задачах 1.
Итак, сопоставим разбиению Г систему {Z0^): т G Г} множеств Z0^) = {z G Rm: (т, z) G Z0} — временных сечений множества Z0, отвечающих моментам т G Г.
Наряду с системой {Z0(r^): т G Г} рассмотрим систему {Zr(ri): т G Г} множеств Zr(ri) в Rm, определяемых рекуррентными соотношениями
Zr(T0 ) = M, Zr(Tj) = Z (Tj,Tj-i ,Zr(Tj-i)), i = 1, 2,...,N.
По определению множества Z0, его временные сечения Z0(Ti), Tj G Г удовлетворяют соотношениям Z0(t0) = M, Z0^) С Z(t, Ti-1, Z0(Ti-1^, i = 1, 2,...,N вида (2.7), и, значит, Z°(тг) С Zrfa), i = 0,1,..., N.
Введём последовательность двоичных разбиений промежутка [t0,0]
Г(п) = {т(п) = i0,Tln),...,Tt(n),...,TN()ra) = 0} , N(n) = 2n-1, n G N.
В последовательности {Г(п)} каждое последующее разбиение содержит все предыдущие разбиения.
Каждому разбиению Г(п), так же, как и разбиению Г, сопоставим систему |zН^): т^ G Г(п)} множеств Z(n) (Vf^ = Zг(п) (т(га)), определяемую соотношениями
Z(n) (т0п)) = M, Z(n) (т.(га)) = Z (т(га), , Z(га)(тй)) , i = 1, 2,..., N(n).
Для любого момента т* G Г(п), n G N справедливы включения
Z (т*) CZ(n) (T ), Z(k)(T*) С Z(n) (т*) при k,n G N и n < k. (3.1)
Пусть т* — двоичный момент из [¿0,0]. Учитывая (3.1), заключаем, что после*
довательность {Z(п)(т*)} сходится в хаусдорфовой метрике к компакту Z(т*) =
*
Р| Z^^*). Это означает, что для любой точки z* G Z(т*) найдётся последова-
raGN
тельность {z(n)} (z(n) G Z(п)(т*), n G N), сходящаяся к точке z*, а также любая
сходящаяся последовательность {z(n)} (z(n) G Z(п)(т*), n G N) имеет пределом точ-
*
ку z* G Z(т*).
*
Распространим определение множества Z(т*) c двоичных моментов т* G [t0,0]
на другие моменты т* G [¿0,0]. Для этого полагаем = тах{т(га) G Г(п): т(п) ^ т*}.
*
Пусть т* недвоичный момент из [¿0,0]. Определим для него множество Z(т*) как множество всех точек z * G Rm, для каждой из которых найдётся последовательность {(¿„(т*), z(n))} (¿„(т*) G Г(п), z(n) G Z(n)(¿„(т*))), сходящаяся к (^,z *) при n ^ го. Вместе с тем определено множество
Z = у (V*,Z(т*)).
*
Множество Z есть компакт в [t0,0] xRm, порождённый последовательностью систем {Z(п)(т(п)): т(п) G Г(п)},п G N при помощи предельных переходов в соответствующих последовательностях точек, и поэтому будем писать
Z = lim {z(п)(т(п)): т(п) G Г(п)} .
n^ro L J
Справедливо следующее утверждение:
*
Лемма 1. Множества 2 и 20 совпадают,.
*
Доказательство. Сначала докажем включение 2 С 20. Для этого покажем, что
* *
2 удовлетворяет включениям вида (2.7). Действительно, справедливо 2(т0) = = М.
Теперь докажем включение
2(т*) С 2(т*,т*,2(т*)), (т*,т*) € А*. (3.2)
Для этого зафиксируем произвольные т*,т*, (т*,т*) € А* — двоичные моменты из
*
„* г-
[¿0,$] и точку г * € 2 (т *).
Так как г* € 2(п)(т*) = 2(т*,т*,2(п)(т*)), п € Н, то г* € 2г(т*,т*,2(п)(т*)) при любых I € Б и достаточно больших п € N. Следовательно, найдётся точка г* € 2(п)(т*), являющаяся начальной для некоторого решения г(п)(т) д. в.
— € Нг(т,г), г*П)(т*) = г*, т € [т*,т*]
^т
Полагаем, не нарушая общности рассуждений, что последовательность {г*п)(т)} равномерно сходится на промежутке [т*, т*] к некоторой функции (т). Функция гг(т), т € [т*,т*] есть решение д. в. (2.5), удовлетворяющее краевым условиям
( \ *
гг(т*) = г* = Иш гг( (т*) € 2(т*), (т*) = г
Отсюда следует включение
г* € 2(т*,т*,2(т*)). (3.3)
*
Так как точка г* выбрана произвольно в 2(т*), то из (3.3) следует (3.2) при двоич-
I *
Пусть т* и т* — произвольные моменты из [¿0,$]. Выберем произвольную точку
' *
*
(т*,г*) € 2, и пусть {(¿п(т*),г")} — последовательность в 2, сходящаяся к (т*,г*), где € 2(т*)), п м то.
Рассмотрим последовательность {¿"(т*)}, сходящуюся к т* слева. Так ¿п(т*) и ¿п(т*) — двоичные моменты, входящие в Г(п), то 2^(¿"(т*)) С 2 (¿га(т*)^"(т*),2(")(¿"(т*))) , п € N и, значит, при любом I € Б
2(п)(ат*)) С 2г (¿"(т^^^Мт*))) , п € N.
1,кая точка г
[¿"(т*)
, ¿га (т*)] д. в.
Тогда найдётся такая точка € 2^(¿"(т*)), что некоторое решение гг(п)(т) на
¿га ( ' * ) , ¿га (
^ € Нг(т,г), г^ЫН ^
^т
удовлетворяет равенству zг(")(í"(т*)) = г".
Выделим такое решение гг(п)(т), т € [¿п(т*),^"^*)] при каждом п € N. Доопределим каждую такую функцию гг(")(т) с промежутка [¿"(т*),^^*)] на промежуток [¿п(т*),т*], положив гг(га)(т) = г" на [¿„(т*),т*].
Не нарушая общности рассуждений, считаем, что последовательность {г(га) (т)} непрерывных функций (т) равномерно сходится на [т*, т* ] к некоторой функции (т), т € [т*,т *]. Вектор-функция (т),т € [т*,т*] есть решение д. в. (2.5), удовлетворяющее краевым условиям
* *
zi(т*) = z* = lim z(n) G Z(т*), zг(т*) = z * = lim z„ G Z(т *).
га^-те га^-те
* *
Отсюда следует, что z * G Z^ *,^,Z(т*)) и, поскольку 1 G S и z * G Z(т *) выбраны произвольно, то
Z(т *) С Z(т V*,Z(т*)) (3.4)
для недвоичных моментов т* и т *, (т*,т *) G А *.
Аналогично доказывается (3.4) в случае, когда один из моментов т*,т * двоичный, а другой — нет. В итоге, для всевозможных пар (т*, т *) G А * установлено (3.2),
*
что означает Z С Z0.
*
Докажем обратное включение Z0 С Z. В самом деле, для любого двоичного
*
момента т* G [t0,0] Z0(^) С Z(т*).
Пусть теперь т* G [t0,0] — недвоичный момент и (^,z *) G Z0. Рассмотрим последовательность {¿„(т*)} двоичных моментов ¿„(т*) G Г(п), где А(п) = А(Г(п)) | 0, n ^ го. Так как Z0(^) С Z (т*,*„(т*)^0(;£„(т*))) , n G N, то z* G Z(т*,£„(т*)^0(£„(т*))), n G N. Выберем произвольное / G S. Справедливо включение z* G Z^ (т*,£„(т*),Z0(£„(т*))) , n G N. Значит, существует последовательность ^(¿„(т*))} точек z(¿„(т*)) G Z0(i„(т*)) С Z(¿„(т*)) С Z^^*)), n G N, такая, что найдётся решение zi"""^), т G [¿„(т*),т*] д.в.
^ G И(т, z), z(„)(¿„(т*)) = z^*)), ат
удовлетворяющее условию z^^*) = z*, n G N.
Из равенств z(i„(^)) = zi"™^^^)), n G N, вытекает, что справедливо предельное соотношение lim ^(¿„(т*)) - z*|| = 0, и, значит, (^,z*) = lim (¿„(т*),z(¿„(т*))), где
га^те га^те
* *
(¿„(т*),z(i„(^))) G Z, n G N. Следовательно, согласно определению множества Z,
*
выполняется включение (т , z ) G Z.
Так как недвоичный момент т* G [¿0,0] и точка (т*, z *) G Z0 выбраны произвольна
но, то Z0(^) С Z(т*) при недвоичных моментах т* G [¿0,0]. Принимая во внимание,
*
что это включение имеет место и при двоичных т* G [¿0,0], получаем Z0 С Z. Из
* * *
включений Z С Z0 и Z0 С Z следует, что Z0 = Z. Лемма 1 доказана. □
В лемме 1 утверждается, что максимальный u-стабильный тракт Z0 есть предел
Z = lim {z(га) (т(„)): т(га) G Г(га)}
га^те 1 J
«промежуточных» систем |z(га)(т(га)): т(га) G Г(га)| , т.е. множество Z0 можно в принципе приближённо вычислять как системы |z(га)(т(га)): т(га) G Г(га)| множеств Z („)(т(га) ) в фазовом пространстве Rm.
Однако для приближённого вычисления множества 2° в конкретных игровых задачах 1 с привлечением систем 12(п)(т(п)): т^ Е Г(п) | необходимо умение точного вычисления множеств 2(га)(т("')) в соответствии с рекуррентными соотношениями
2(п)(т°(п)) = М, 2(га)(т^:') = 2 (т(п), тЦ,2(га)(тй)) , г = 1, 2,..., N(п).
Поскольку мы не умеем точно вычислять множества достижимости 2(т*, т*, 2*), С даже в относительно простых конкретных задачах 1, то, стало быть, мы не можем вычислить точно и множества ), г = 1, 2,..., N (п). Это обстоя-
тельство вынуждает нас трансформировать (при рассмотрении задачи 1 в общей
постановке) множества 2 ^т(га), т]-!, 2(п)(т(-'1 в достаточно близкие к ним множества в и в то же время более приемлемые для вычислений.
Наша цель — определить такие множества. В качестве первого шага к достижению этой цели введём аппроксимирующую систему (А-систему) {2Г(т): т Е Г} множеств 2Г(т) в Мт.
Пусть Г = {т° = ¿°, т1,... , т,... , т^ = $} — двоичное разбиение отрезка [¿°, $]. Каждому промежутку [т,т+1] разбиения Г сопоставим д. в.
^ Е Иг(г)) + <^(А)Б*, г(т) = г« Е I Е Б, т Е [тг,тт]; (3.5)
ат
здесь <^(8) = ш*((1 + К)8), 8 Е (0, то) (ш*(8) см. на с. 59); К определено на с. 58; А = А(Г) = Аг = тг+1 -т = N_1($—¿°), г = 0,1,... , N-1;Б* = {Ь* Е Ет: ||Ь*|| ^ 1}. Пусть (т, г(г)) и (т, 2(г)) — точка и множество в С и I Е Б. Введём обозначения
2гГ(т+1, т, г(г)) = г(г) + АНг(т, г(г)) — множество достижимости д. в. ^ Е И^(т,г(г)), ) = г(г) в момент т+1;
2гГ(т+1, т, 2(г)) = У 2гГ(т+1, т, г(г)) — множество достижимости в момент
т+1 д. в. Е Нг(т,г(г)), г(г) Е 2(г) с начальным множеством 2(г), отвечающим моменту т;
2Г(тт,тг, 2^) = П 21г(тг+1,тг, 2^); ~ .А
2гГ(т+1, т, г(г)) = 2гГ(т+1, т, г(г))+ш(А)Б* — множество достижимости в момент т+1 д. в. (3.5);
2гГ(т+1,т, 2(г)) = и +1,т,г(г)) — множество достижимости в момент
(О
т+1 с начальным множеством 2(г), отвечающим моменту т; 2Г(тт,тг, 2»)= П +1,т, 2^);
здесь обозначено ш(8) = 8 ■ <^(8), 8 Е (0, то).
При т, т+1 Е Г, (т, г(г)) Е С, I Е Б справедлива оценка
а (2г(тт, т, г«), 2гГ(тг+1,тг, г«)) ^ ш(А),
из которой следует, что
(тг+1,тг,г(г)) С Г (тт,тг,,г«) + ш(А)и = 2гГ (тт,тг,,г«) . (3.6)
Из (3.6) следует при (тг, Z(j)) G G, тг и тг+1 из Г, / G S
Zi (тг +1, тг, Z(j)) С Zf (тг+1, тг, Z(j)) , (3.7)
а из (3.7) при тг и тг+1 из Г, (тг, Z(j)) G G получим
Z (т+1, тг, Z(j)) С F (тг+1, тг, Z(j)) . (3.8)
Введём в рассмотрение аппроксимирующую систему множеств {^г(тг): тг G Г} в Rm. Сокращая название системы, назовём её А-системой в Rm.
Определение 6. А-системой множеств |^г(тг): тг G г| в Rm, отвечающей разбиению Г = {т0 = ¿0, т1,..., тг,... , т^ = 0}, назовём систему множеств
F^) = м, ) = F(^, т-1, F(^-1)), i = 1,2,..., n.
Сравним (по включению) системы ^г(тг): тг G Г} и {^г(тг): тг G Г}, отвечающие разбиению Г. Учитывая краевое условие ^г(т0) = Zг(т0) = M и включения (3.8), получаем Zг(тг) С ^г(тг), тг G Г. Вместе с тем установлено, что множества Z0^), Z^^), ^г(тг) связаны цепочкой включений Z0^) С Z^^) С ^г(тг), i = 0,1,... , N, из которых следует, что А-система |^г(тг): тг G Г | мажорирует систему {Z0^): тг G Г} — набор сечений Z0^) максимального u-стабильного тракта Z 0.
Вернёмся к рассмотрению двоичных разбиений
Г(га) = {т0(„) = ¿0, т1„),..., т<я),..., т^) = 0}, n G N.
Упрощая запись, полагаем ^7(га)(т*) = }г(п) (т*), т* G Г(га), n G N; при этом А-система запишется в виде jz'(")(тj("')): тг(га) G г| .
Определение 7. Обозначим символом П0 множество всех точек (т , z ) G G, которые представимы в виде (т*, z *) = lim (¿„(т*), z„), где {(¿„(т*), z„)} — некоторая
„-— те
последовательность точек (¿„(т*),z„) G (т*), ^^(¿„(т*))j , n G N.
Множество П0 удовлетворяет соотношениям П0(т0(га)) = П0(^) = M. Так как выполняются включения
Z(га)(т*) С Z(ra)( т*), т* G Г, n G N, (3.9)
то из определения множества Z0 = lim \ Z(га)(тг(га)): тг(га) G Г(„Н и (3.9) вытекает
„-те
Z0(^) С П0(т*) при любом недвоичном моменте т* G [¿0,0] и, следовательно,
Z0 С П0. (3.10)
Кроме того, используя схему рассуждений, аналогичную той, которая применялась к Z0, получаем
П0(т *) С Z(т *,т*, П0(т*)) (3.11)
при любых т , т , (т , т ) G А .
Из равенства П°(£°) = П°(т°) = М и (3.11) вытекает, что замкнутое множество
есть и-стабильный тракт системы (2.4) и, значит,
С 2°. (3.12)
Из (3.10), (3.12) получаем лемму. Лемма 2. Множества и 2° совпадают.
Объединяя леммы 1 и 2, получаем, что справедливо следующее утверждение.
*
Теорема 1. Множества 2, 2°, совпадают.
В теореме 1 дано теоретическое обоснование возможности использования А-систем |^^(га)(т(га)): т(п) Е Г(га)| для приближённого вычисления максимального ад-стабильного тракта 2°.
Мы интерпретируем А-систему |^^(га)(т(га)): т(п) Е Г(га)| как обобщение на дифференциальные игры понятия ломаной Эйлера из теории обыкновенных дифференциальных уравнений. При этом максимальный и-стабильный тракт 2° мы рассматриваем как аналог траекторий из теории дифференциальных уравнений. Точнее, многозначную функцию 2°(т) = {г Е : (т, г) Е 2°}, т Е [¿°,$] мы рассматриваем как траекторию системы (2.4) в задаче 1. Начальной «точкой» траектории 2°(т), т Е [¿°,$] является компакт 2°(г°) = М в пространстве Кт.
Несмотря на наличие очевидных аналогий между А-системами |^(га)(т(га)): т^га) Е Г(га)} , п Е N и ломаными Эйлера ^га)(г), г Е [г°,0], п Е N из теории обыкновенных дифференциальных уравнений, этим двум схемам аппроксимации соответствуют и весьма существенные различия, обусловленные спецификой порождающих их динамических систем.
Эти различия проявляются на этапах получения в том и другом случаях оценок рассогласования между идеальными «траекториями» и их аппроксимациями. Так, если в теории обыкновенных дифференциальных уравнений или теории управляемых систем (при отсутствии неопределённого фактора) такие верхние оценки имеются и хорошо известны, то в теории антагонистических дифференциальных игр получение оценок осложнено наличием неопределённой помехи. Наличие такой помехи в управляемой системе привносит в алгоритмы конструирования аппроксимирующих систем множеств операцию пересечения множеств, неудобную для получения конструктивных оценок рассогласования между идеальными «траекториями» и их аппроксимациями.
Замечание 5. Введение в разрешающие схемы А-системы 12(га)(т,;("')): т(п) Е Г(га)| , связанное с дискретизацией времени т, ещё не даёт окончательного решения приближённого вычисления 2°. Эту дискретизацию необходимо дополнить дискретизацией, связанной с фазовым пространством системы (2.4). Это может быть дискретизация самого пространства Кт, например, пиксельное представление пространства Кт, а может быть и дискретизация множеств |2(га)(т,("')): т(п) Е Г(га)| в
, осуществляемая через дискретизацию динамики управляемой системы (2.4) или д. в. (2.5).
4. О конструировании разрешающей стратегии
первого игрока в минимаксной задаче о сближении
В теории дифференциальных игр существенную роль играют условия информационного характера, налагаемые в начале игры на поведение игроков. От того, какими информационными возможностями обладают игроки во время игры, явно зависит её исход.
В этой работе мы изучаем игровую задачу о сближении в минимаксной постановке (см. [3, стр. 353-357]), не предполагая, что система (1.1) удовлетворяет условию седловой точки в маленькой игре [3].
При этом мы рассматриваем следующую минимаксную постановку задачи 1. А именно, имея своей целью обеспечить достижение движения x[t] в конечный момент времени 0, первый игрок рассуждает с позиций крайней осторожности. Он не исключает, что во время игры второй игрок выбирает в каждый момент t Е [to, 0] свои управления v не только по принципу обратной связи, зависящими от реализующейся в каждый момент t Е [to,0] позиции (t,x), но и учитывает управление u, выбранное первым игроком в этот момент t.
Таким образом, подходя с самого начала (момента t0) к ведению игры осмотрительно, первый игрок не исключает худший для себя (в информационном плане) вариант, а именно, что в каждый момент t Е [to,0] второй игрок может сформировать своё управление как функцию v(t,x,u), как бы будучи информированным о выборе управления u в позиции (t,x) системы (1.1). Иными словами, решая задачу 1, первый игрок заранее дискриминирует себя в информационном плане. Сам же он формирует своё управление в моменты t Е [t0,0] по принципу обратной связи как функцию u(t,x).
Для задачи 1 в такой минимаксной постановке в работах [3; 11] определены классы позиционных стратегий u(t,x) первого игрока и контрстратегий v(t,x,u) второго игрока.
При этом под позиционными (чистыми) стратегиями первого игрока понимаются функции u(t,x) Е P, (t,x) Е [t0, 0] х Rm, а под контрстратегиями второго игрока понимаются функции v(t,x,u) Е Q, (t,x,u) Е [to,0] х Rm х P.
Дадим определения движений (конструктивных) x[t], t Е [to,0], порождённых парами (u(t,x), v(t,x,u)) позиционных стратегий и контрстратегий игроков. Для этого сначала определим ломаные Эйлера хг [t], t Е [to, 0], порождённые парами (u(t,x), v(t,x,u)).
Рассмотрим произвольное разбиение Г = {to, ti,... , tj,... , tN = 0} с диаметром
A = Д(Г) = max (tj+1 — tj), где обозначено A, = t,+1 — t > 0. i=o,1,...,N —1
Пусть хг Е Rm и (u(t,x), v(t,x,u)) — упомянутая выше пара стратегий.
Ломаную Эйлера xr[t], t Е [to,0], xr[to] = хг, порождённую позиционной стратегией u(t, x) и контрстратегией v(t, x, u), определим соотношениями при t Е [tj, tj+1), j = 0,1,... ,N - 1
xr[t] = xr[tj] + (t - tj)f (tj,xr[tj],u(tj,хг[tj]), v(tj,xr[tj],u(tj,xr[tj])).
Определение 8. Конструктивным движением x[t] системы (1.1), порождённым парой (u(t,x), v(t,x,u)), назовём функцию x[t] = lim хг(п)[t], t Е [to,0],
«,^-те
где {хг(п)[t]} — некоторая последовательность ломаных Эйлера хг(п)[t], t Е [to,0] (lim хг(п) [to] = lim хг(п) = x[to] = x(o)).
«,^-те «,^-те
Здесь имеется в виду равномерный предел lim хг(п) [t] на промежутке [t0, "$], где
{Г(п)} — последовательность разбиений промежутка [t0,$] с диаметрами Д(п) = Д(Г(п)) | 0 при n ^то.
Замечание 6. В формулировке задачи 1 о сближении речь идёт о конструктивных движениях x[t] системы (1.1) (определение 8).
Опишем подробнее разрешающую позиционную стратегию u*(t,x) первого игрока в задаче 1 как экстремальную стратегию ue(t,x) к максимальному ад-стабильному мосту W0. Эта стратегия введена в работах [1-3] Н. Н. Красовского и А. И. Субботина. К описанию стратегии ue(t, x) в этой работе мы привлечём уни-фикационные множества F](t,x), (t,x,l) Е G х S.
Итак, считаем, что мост W0 уже выделен в области G, так что нам (первому игроку) известны его сечения W0(t) С Rm, t Е [t0,$]. Пусть t* Е [t0,$], x* Е W0(t*). Рассмотрим ближайшую в W0(t*) точку у* к x*. Определим векторы s* = у* — x* и l* = s*/||s*|| Е S.
Вектор l* Е S, связанный с точками x* и у*, мы интерпретируем как направление прицеливания конструктивного движения x[t] системы (1.1) в точке x[t*] = x* на мост W0. В зависимости от точек x* и у* векторы l* Е S могут быть различными и даже заполнять всю сферу S С Rm.
Находясь в позиции (t*,x*), первый игрок воображает для себя следующую локальную игровую ситуацию (маленькую игру): он стремится выбором управления u Е P сдвинуть систему (1.1) (т.е. движение x[t] системы (1.1)) из точки x* максимально в направлении на мост W0, в то же время второй игрок выбором контруправления v(u) Е Q стремится максимально сдвинуть систему (1.1) (т.е. движение x(t) системы (1.1)) из точки x* в направлении, противоположном направлению на W0. Формально эту игровую ситуацию представим двумя условиями.
1. Второй игрок, находясь в позиции (t*,x*) Е G, формирует контруправление v^(u) Е Q, u Е P, экстремальное (в его понимании) в направлении вектора l*:
(l,/(t*,x*,u, v^(u))) = min (l,/(t*,x*,u,v(u))).
2. Первый игрок, находясь в позиции (t*,x*) Е G, формирует управление ult Е P, экстремальное (в его понимании) в направлении вектора l*:
(l*, / (t*,x*,u^,vZt(u^))) = maxmin(l*, /(t*, x*, u, v(u))) =
«€P v
= maxmin(l*, (t*,x*,u,v)) = H(t*,x*,l*). «eP »e^
Чтобы отразить тот факт, что управление u t и контруправление v t (u) сформированы по позиции (t*,x*) Е W0, будем писать u„(t*,x*), v„(t*,x*,u).
Замечание 7. Если множество W0(t*) невыпукло, то для точки x* Е W0(t*) может быть не одна ближайшая точка у* в W0(t*). В этом случае вектор l*
— s*/||s*||, s* —
у* — x* определяется неоднозначно, и тогда u„(t*,x*) определяется неоднозначно.
Таким образом, мы определяем, согласно [3], как, вообще говоря, многозначную функцию ue(t*,x*) = u„(t*,x*) Е P от позиции (t*,x*) при (t*,x*) Е W0. В случае, когда (t*,x*) Е W0, определяем ue(t*,x*) как множество P.
Замечание 8. Из приведённых в условиях 1, 2 соотношений ясно, что важную роль при определении позиционной экстремальной стратегии играют векторы l* Е S
как направления экстремального сдвига движения х[£] на Ж0. В этих соотношениях появляется гамильтониан Н(£*,х *,/ *) конфликтно управляемой системы (1.1) (он был введён в § 2, с. 58). Из условий 1, 2 следует, что первый игрок в позиции (£*,х*) Е Ж0 может выбрать управление и Е Р, обеспечивающее проекцию вектора скоростей /(£ *,х*,и,^(и)) системы (1.1) в направлении на Ж0 (т.е. в направлении / * = У* — х *), не меньшую, чем Н(£*,х*,/ *). Это влечёт за собой достаточно хорошую сдвижку движения х[£] системы (1.1) из точки х[£*] = х* в направлении на Ж0. Следуя такому принципу выбора управления (и6(£ *, х *) Е Р) в каждой позиции (£*,х*) Е Ж0, первый игрок обеспечивает достаточно хорошую близость движения х[£],£ Е [¿0,0] системы (1.1) к мосту Ж0 в случае, когда начальная точка х[£0] = х(0) движения х[£],£ Е [¿0,0] близка к начальному сечению Ж0(£0) моста Ж0.
В замечании 5 мы отметили, что, поскольку в большинстве конкретных игровых задач 1 мост Ж0 вычислить (точно) невозможно, мы переходим к приближённому вычислению и на пути к этому приближённому вычислению (на первом шаге процесса приближённых вычислений) подменяем мост Ж0 А-системой множеств, отвечающих разбиению Г, где А = Д(Г) ^ 0. Эта система {Ж): Е Г} определена в §3 (см. определение 6).
Учитывая эту замену моста Ж0 А-системой {Жг): Е Г}, мы приспосабливаем и позиционную экстремальную стратегию и6(£,х) к этой ситуации подмены. Именно, мы рассматриваем и6(£, х) как позиционную экстремальную стратегию первого игрока к системе {Жг(^-): Е Г} множеств Жг(^-) в Мт. Экстремальная позиционная стратегия первого игрока есть теперь функция , х), (^, х) Е Г х Кт, определённая по тому же принципу экстремального прицеливания, что и ранее, но в её определении множества Ж0(£),£ Е [¿0,0] замещены множествами Ж): ^ Е Г.
Теперь мы, привлекая унификационные отображения (¿, х) М- Р(¿, х),/ Е Б, покажем, насколько эффективна экстремальная стратегия первого игрока при решении задачи 1.
Считаем при этом, что множества Жг(^), Е Г вычислены (точно). Также предполагаем, что семейство (¿, х) М р(¿,х),/ Е Б удовлетворяет следующему условию.
Условие Ю. Найдётся такое Л Е (0, го), что
^(¿,х*),*}(*, х*)) ^ Л||х* — х *||, / Е Б; (¿,х*), (¿,х*) Е С.
Условие В вполне естественно при тех условиях на систему (1.1) (условие А), которые изложены в §1.
Покажем, что позиционная экстремальная к А-системе {Жг(^): Е Г} стратегия первого игрока удерживает ломаную Эйлера хг [¿], £ Е [¿0, 0] вблизи этой А-системы при условии, что начальная точка ломаной Эйлера близка к начальному множеству Жг(£0) А-системы. При этом мы выведем локальные оценки отклонения ломаной хг [¿] от множеств Жг (£^) в моменты £^ Е Г и затем воспользуемся ими при выводе оценки отклонения ломаной Эйлера хг[£] в конечный момент ¿^ = 0 от целевого множества Жг(0) = М. Эти оценки проводим по схеме из работы [3], привлекая унификационные конструкции. Во избежание громоздких оценок дополним условие В ещё одним условием на систему (1.1), т. е. немного упростим систему (1.1).
Условие Е. Конфликтно управляемая система (1.1) стационарна, т.е. правая часть системы (1.1) имеет вид /(х,и, V), (х,и,^) Е х Р х ф.
В связи с условием Е будем вместо гамильтониана Н(¿, ж,/) и множеств Р(г, ж), Пг(4,ж), Р(г, ж) иметь Н(ж, /), Р(ж), П(ж), Р(ж).
Замечание 9. Принимая во внимание условие Е, выявим некоторые важные особенности, связывающие А-системы {2Г(т): т € Г} и (Ж): ^ € Г}.
Для этого рассмотрим произвольный промежуток [т*,т*] разбиения Г, где ¿0 ^ т* < т* ^ г* и т* — соседние моменты разбиения Г (т. е. т* = т* + А). Справедливо представление множества 2Г(т*):
2г(т*) = ^(т*,т*,^г(т*)) = П ^г(т*,т*,^г(т*));
les
здесь
?(т *,т*,^г(т*)) = U Дг(т*,т*^*), z * ezr(r* )
Zf(rV*,z*) = z* + AH(z*) + w(A)B*,z* G Zr(т*).
Обратимся теперь к разбиению Г, выраженному в терминах прямого времени t: обозначим через t*,t* моменты из Г, удовлетворяющие равенствам t* = ¿0 + ê — т*, t* = t0 + ê — т* (так что t0 ^ т* < т* ^ ê).
Согласно определению А-системы {Wr(tj): tj G Г}, имеем Wr(t*) = ^г(т*) и Wг^*) = ^г(т*), откуда следует равенство
Wг(^) = П ^(¿о + ê — t*,to + ê — t*,Wг(t*)), les
где ^(to + ê — t*,to + ê — t*,Wг(t*)) = U (w* — AF(w*) + w(A)B*); здесь учтено
w * ew r(t » )
равенство Нг(z*) = — F(w*) при z* = w*.
Возьмём произвольную точку w* G Wг^*); для неё справедливо включение
w* Gn U (w* — AFi(w*)+ w(A)B*).
1eS w * ew r(t* )
Это означает, что для любого l G S найдётся точка w* G Wг^*), такая, что
w* Gw* — A Fi (w*)+ w(A)B*. (4.1)
По условию D справедливо неравенство для w* и w*:
d(F(w*),F(w*)) ^ A||w* — w*||, l G S.
Кроме того, справедливо представление w* = w* — Af* + w(A)b*, где f* G F(w*) и b* G B*.
Учитывая, что F(w*) С B* = B(0; K) и ||b*|| ^ 1, получаем ||f*|| ^ K и ||b*|| ^ 1, и, значит, справедливо неравенство ||w* — w*|| ^ K A + w(A), где G (0, то)
определено на c. 59. Отсюда получаем
d(Fi(w*),Fi(w*)) ^ A(KA + w(A)). (4.2)
Из (4.1), (4.2) следует
w* G w* + A Fi (w*) + w(A)B* С (w* + A Fi (w*)) + AA(K A + w(A))B* + w(A)B*.
Положив Хгг(£ V *,т*) = т* + АР}(ш *) + а(А)Б*, / Е Б, где а(А) = ЛКА2 + (1 + ЛА)ш(А), получаем
т* Е Х^V*,т *), / Е Б. (4.3)
Из включения (4.3), учитывая т* Е Ж*), получаем
ХХг(£ V *,т *) р| Ж*) = 0, / Е Б.
Теперь переносим наши рассуждения на промежуток [£ *,£ *] разбиения Г. Пусть х * Е Ж*); полагаем в * = у* — х * = 0, / * = ||в * ||-1в * Е Б, где у* — ближайшая точка в Ж*) к точке х *.
Рассмотрим звено ломаной Эйлера жг[£] на промежутке [£ *, £ * ], удовлетворяющей условию Хг^*] = х * и порождённой позиционной экстремальной стратегией и^^х) и какой-либо контрстратегией ^(¿,х,и) второго игрока. Это звено Хг^], Ь Е ^ *] удовлетворяет в момент í * соотношению
Хг [* * ] = Хг [* * ] + (* * — * *) / (V [* * ], и6 (* *, Хг [* * ]), V *, Хг [í * ], и6 (* *, Хг [* * ]))),
т.е. соотношению Хг^ *] = х * + А/^х*,и6^*,х*), v(t*,х *,и6^*,х *))^.
Оценим сверху в момент времени ¿* сдвиг ломаной Эйлера в направлении на множество Жг^*), т.е. в направлении вектора / *:
(/ *,Хг^*] — х*) = А ^/*,/(х^и6^*^*),х*,и6^*,х*.
Как отмечено на с. 69, первый игрок, находясь в позиции ^ *,х *) и применяя экстремальную стратегию и6^, х) (вектор и6^ *, х *) в позиции ^ *, х *)), обеспечивает при любой контрстратегии ^(¿,х, и) второго игрока выполнение неравенства
Н(х*,/*) ^ (/*,/(х *,и6^ *,х *), v(í*, х*, и6^*, х*)))),
из которого следует, что (/ *,Хг^ *]) ^ (/ *,х *) + АН(х *,/ *).
Также для некоторой точки у * Е Ж*) Р| ХС^Т ^ *,т *) справедливо представление у* = т* + А/ + а(А)Ь*, где / Е Р(т*), Ь* Е Б *. Из этого равенства следует, что
(/*,у*) = (/ *,т*) + А(/ *,/) + а(А) ^ (/ *,т*) + АН(т*,/*) + а(А).
Оценим сверху величину ||у* — Хг^ *]||2. Обозначив для простоты /6 =
/ (х *, и6^*, х *), V ^ *, х *, и6^*, х *))), имеем
||у* — Хг[Г]||2 = ||(т* — х*) + А(/ — /6) + а(А)Ь*||2 ^
^ ||(т* — х*) + А(/ — /6)||2 + ||а(А)Ь*||2 ^
^ ||в*||2 + 2А(в *, / — /6) + А2||/ — /6||2 + а(А)2. (4.4)
Из неравенств (/ *,/) ^ Н(т*,/ *), (/ *,/) ^ Н(х *,/ *) и липшицевости гамильтониана Н(х, /) системы (1.1) по переменной х с константой липшицевости Ь следует
(в *,/ — /6) = ||в * ||(/ *, / — /6) ^ || в * || (Н (т*,/*) — Н (х*,/*)) ^ Ь||в * ||2. (4.5)
Из (4.4), (4.5) и неравенств ||/1| ^ К, ||/6|| ^ К следует оценка
||у* — Хг^ *]||2 ^ ||в*||2 + 2ЬА|в*||2 + £(А);
здесь обозначено £(А) = 4К2А2 + а(А)2.
Из последнего неравенства следует, что ||у* — Хг^ *]||2 ^ е2ьл||з *||2 + е(А), и, значит,
р(Хг[г *],Жг(Г)) ^ е2ЬЛ||з *||2 + е(А). (4.6)
Считаем теперь, что у * — ближайшая в Ж*) точка к х * = Хг ^ *]. Не нарушая общности рассуждений, считаем, что х * Е Ж*) и, следовательно, в * = у * — х * = 0. Оценку (4.6) запишем в виде
||в*||2 ^ е2ьл||в *||2 + е(А). (4.7)
Далее рассмотрим следующий промежуток ^ **], ^ * * = ¿* + А) разбиения Г и отвечающее ему звено Хг^] ломаной Эйлера. Обозначим через у * * ближайшую к Жг(Г) точку к х * * = Хг^ * *]. Также считаем, что х * * Е Жг(Г *) и, значит, в * * = у — х = 0. По аналогии с оценкой (4.7) выполняется
||в **||2 ^ е2^л|в *||2 + е(А). (4.8)
Из (4.7), (4.8) получаем
||в**||2 ^ е2ьл (е2ьл|5 *ц2+е(А)) + е(А) ^ е2ь(л+л)|5 *ц2 + в2ьле(А)+е(А). (4.9)
Рассмотрев далее вслед за промежутком ^ * *] промежуток ^ * * * * ], ^ * * * = t * * + А Е Г) и обозначив через у * * * ближайшую точку в Ж* * *) к точке х * * * = Хг^ * * * ] звена ломаной Эйлера Хг [¿], t Е [¿0, 0], получаем оценку
||в* **|2 ^ ^^ **||2 + ^(А) ^ е2ьл (е2Ь(л+л)||з *||2 + в2ьле(А) + £(А)) + е(А) ^
^ е2ь(л+л+л)|в *||2 + е2ь(л+л)е(А) + е2ьле(А) + е(А). (4.10)
Здесь ^ * * * = у * * * — х * * *.
Оценки (4.7), (4.9), (4.10) однозначно подсказывают нам, какова будет оценка сверху квадрата отклонения р (Хг[^], М) = р ], Жг(^ конечной точки
Хг^] ломаной Эйлера Хг^], t Е [¿0,0] от Ж) = М. Действительно, пусть t* = ¿0 и Хг^0] = Х^ — начальная точка ломаной Эйлера Хг [¿], порождённой экстремальной стратегией и6^,х) первого игрока и какой-либо контрстратегией v(t, х,и) второго игрока, и пусть у^ — ближайшая в Ж^¿0) точка к Х^, и в(0) = у^ — Х^. Обозначив через у(м) ближайшую к Х(м) = Хг[^] точку в Жг(íN) и ) = у(м) — Х(м), получаем
N—1 N (2Ьл) 1
)|2 ^ е2Ь^ л |в(0)|2 + ^ вк2ьле(А) = е2Ь(^—||в(0)||2 + е 2£л 1 ■ е(А) <
к=0 е
< е2^-) ||в(0)||2 + е ^ ■ е(А). (4.11)
Введём для упрощения оценок следующее условие.
Условие Е. Диаметр А = А(Г) удовлетворяет неравенству ЬА < 1.
Учитывая условие Г на диаметр А = А(Г), а также соотношение
е (А) = 4К2 А2 + а(А)2 = 4К2 А2 + (ЛК А2 + (1 + ЛА)^(А))2 =
= 4К2А2 + (ЛКА2 + (1 + ЛА)Аш*((1 + К)А))2,
получаем из (4.11)
||s(N)||2 ^ e2L(^io) (||s(0)||2 + е*(Д}) , (4.12)
где £*(Д) = ¿ ^4К2Д2 + (1 + ЛД)Д2w*((1 + K)Д))2 . Величина £*(Д), входящая в
(4.12), удовлетворяет предельному соотношению £*(Д) ^ 0 при Д ^ 0. Запишем оценку (4.12) в виде
р (жг[Ы Wr(tN))2 ^ e2L(l?-ío) (р (xr[to],Wr(to))2 + f(Д)) . (4.13)
Рассмотрим теперь произвольное конструктивное движение xr[t], t Е [t0,tf], xr[t0] = ж(0) Е W0(t0), порождённое экстремальной стратегией ue(t, x) первого игрока и контрстратегией v(t,x,u) второго игрока. Согласно определению 8, функция x[t],
t Е [t0,tf] представима в виде равномерного предела lim жг(п) [t], где \ жг(п) [t] > —
n^-те L J
некоторая последовательность ломаных Эйлера жг(п) [t], t Е [t0, tf], удовлетворяющих lim жг(п) [t0] = x[t0] = ж(0). Здесь {Г(п)} — последовательность разбиений
Г(п) = {t0n) = t0, t(n),... , tjn),... , t^ = tf } с диаметрами Д(п) = Д(Г(п)) | 0 при n ^ то.
Так как lim жг(п) [t0] = arfo] Е W0(t0) С Wг(п) (t0), n Е N, то
lim р (жг(п) [t0], Wг(п) (t0)) = 0. (4.14)
n^-те V /
Для ломаных Эйлера жг(п) [t], t Е [t0,tf], n Е N справедливы оценки вида (4.13)
р (£г(П)[tSU^О) ^ e2L(^-ío)p (^г(п)^0],жг(п)(t0))2 + е*(Д(п)). (4.15) Учитывая предельные соотношения (4.14),
= W0[tf], lim £*(Д(П)) = 0,
n^-те
из неравенства (4.15), переходя к пределу при n ^ то, получаем р (x[tf], W0[tf]) = 0. Принимая во внимание, что W0(tf) — замкнутое множество в Rm, получаем Е W 0[tf] = M.
В итоге мы получили, что для любой начальной позиции (t0, x(0)) Е W0 системы (1.1) любое конструктивное движение x[t], x[t0] = x(0), t Е [t0,tf], порождённое позиционной экстремальной к мосту W0 стратегией первого игрока в паре с любой контрстратегией второго игрока, удовлетворяет включению Е M. Таким образом, справедливо следующее утверждение:
Теорема 2. Пусть конфликтно управляемая система (1.1) на промежутке времени [t0,tf] удовлетворяет условиям A-E. Тогда для любой начальной позиции (t0,x(0)) системы (1.1), удовлетворяющей включению (t0,x(0)) Е W0, разрешима задача 1 о сближении системы (1.1) с компактом M в фазовом пространстве Rm. А именно, любое конструктивное движение x[t], t Е [t0,tf], x[t0] = x(0) системы (1.1), порождённое позиционной экстремальной к мосту W0 стратегией первого игрока ue(t,x) и любой контрстратегией v(t,x,u) второго игрока, удовлетворяет, включению Е M.
lim жг("
t(n)
(n)
= xrl
lim W
п—>оо
г(п)
t(n)
(n)
Заключение
В работе исследована игровая задача о сближении конфликтно управляемой системы с целевым множеством M (задача 1) в фазовом пространстве Rm в конечный момент времени 0 из промежутка [t0, 0] • Мы не предполагали для конфликтно управляемой системы выполнения так называемого условия седловой точки в маленькой игре (см. [3]). Для тех конфликтно управляемых систем, для которых это условие выполняется, игровая задача о сближении с M формулируется в классах (чистых) позиционных стратегий игроков [3]. Для таких систем Н. Н. Красовским и А. И. Субботиным был сформулирован и доказан один из центральных результатов теории позиционных дифференциальных игр — теорема об альтернативе.
В настоящей работе задача 1 сформулирована как минимаксная игровая задача о сближении, в которой первый игрок применяет позиционные стратегии, а второй игрок — контрстратегии. Минимаксная постановка игровых задач была введена в теорию позиционных дифференциальных игр в работах [3; 11] в первой половине 70-х гг. XX в. Концепция унификации, введённая Н. Н. Красовским в теорию позиционных дифференциальных игр в работах [4; 5] в середине 70-х гг. XX в., неразрывно связана с рассмотрением игровых задач в минимаксной постановке. В этих задачах условие седловой точки в маленькой игре выполнялось не в классах управлений игроков, а в классах управлений одного из игроков и контруправлений другого игрока. Минимаксный подход в дифференциальных играх существенно расширил круг исследуемых задач; так, в этот круг вошли задачи, в которых конфликтное управление системы зависит нелинейно от своих аргументов. В [3] для игровых задач в минимаксной постановке была сформулирована и доказана теорема об альтернативе, при этом было установлено, что решения задач сближения и уклонения доставляют соответствующие стратегии игроков, экстремальные к стабильным мостам.
В § 1 этой работы мы сформулировали игровую задачу 1 о сближении нелинейной конфликтно управляемой системы с компактом в фазовом пространстве Rm. В § 2 мы описали свойство и-стабильности в задаче 1 в терминах семейства уни-фикационных многозначных отображений (t,x) М- Fl(t,x), l Е S. Мы отметили, что векторы l из единичной сферы S в пространстве Rm в задаче 1 можно интерпретировать как обобщённые управления второго игрока. Такая интерпретация вводит теорию позиционных дифференциальных игр в русло гамильтонова формализма в теории динамических систем, что привело А. И. Субботина в 80-е гг. XX в. к распространению этого подхода на теорию уравнений Гамильтона — Якоби. Были введены с привлечением семейства (t,x) М F (t,x), l Е S понятия и-стабильных трактов (в терминах обратного времени) и и-стабильных мостов (в терминах прямого времени) из [3]. При решении конкретных игровых задач 1 на передний план выступает задача выделения в пространстве [t0,0] х Rm позиций конфликтно управляемой системы максимального (по включению) и-стабильного тракта Z0, дуального в определённом смысле к максимальному (по включению) и-стабильному мосту W0. Осознавая невозможность в большинстве конкретных игровых задач (точного) вычисления множества Z0 или же его эффективного описания с помощью аналитических соотношений, мы ввели в параграфе 3 А-систему ): т Е Г} множеств ) в пространстве Rm, отвечающую двоичному разбиению Г промежутка [t0,0] и аппроксимирующую сверху максимальный и-стабильный тракт Z0. Один из основных результатов этой работы составляет доказательство того факта, что А-система {^г(т): т Е Г} множеств Zr (т) С Rm в пределе при диаметре А = Д(Г) ^ 0 даёт множество Z0 (теорема 1). Таким образом, теорема 1 содержит в себе теоретическое
обоснование возможности использования А-систем {^(т): т Е Г} при разработке методов и алгоритмов приближённого вычисления множества в конкретных игровых задачах 1 или в некоторых классах игровых задач 1. Фактически разработка таких методов и алгоритмов приближённого вычисления означает разработку методов и алгоритмов приближённого вычисления максимального и-стабильного моста Ж0. В § 4, следуя работам [3-5] и привлекая унификационные схемы, мы показали, что для всех начальных позиций (¿0,х(0)) конфликтно управляемой системы, удовлетворяющих включению (¿0, х(0)) Е Ж0, первый игрок обеспечивает решение задачи 1 с помощью позиционной экстремальной стратегии и6(¿,х) к мосту Ж0, какова бы ни была при этом контрстратегия v(¿,x,u) второго игрока.
Подводя итоги этой работы, отметим, что введение А-систем {Х(т): т Е Г} и {Ж): Е Г} в схемы приближённого решения игровой задачи 1 есть первый шаг на пути к разработке методов и алгоритмов приближённого вычисления решений задачи 1 для конкретных конфликтно управляемых систем и классов таких систем. Этот шаг связан с дискретизацией промежутка [¿0,0]. Следующим важным шагом должна стать дискретизация фазового пространства конфликтно управляемой системы.
Считаем, однако, что вопросы, связанные с дискретизацией пространства и увязыванием этой дискретизации с динамикой конкретных конфликтно управляемых систем, многочисленны и нетривиальны. Эти вопросы так же, как и вопросы, связанные с разработкой алгоритмов конструирования позиционной экстремальной стратегии и6^^) первого игрока, составляют предмет отдельного обсуждения.
Список литературы
1. Красовский Н. Н. Игровые задачи динамики. I // Изв. АН СССР. Техн. кибернетика. 1969. № 5. С. 3-12.
2. Красовский Н. Н., Субботин А. И. О структуре дифференциальных игр // Докл. АН СССР. 1970. Т. 190, № 3. С. 523-526.
3. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М : Наука, 1974.
4. Красовский Н. Н. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226, № 6. С. 1260-1263.
5. Красовский Н. Н. Унификация дифференциальных игр // Тр. Ин-та математики и механики. 1977. Вып. 24: Игровые задачи управления. С. 32-45.
6. Ушаков В. Н. Минимакскное поглощение в дифференциальных играх // Эктре-мальные стратегии в позиционных дифференциальных играх: сб. ст. Свердловск, 1974. С. 252-272.
7. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. кибернетика. 1980. № 4. С. 29-36.
8. Тарасьев А. М., Ушаков В. Н., Хрипунов А. П. Об одном вычислительном алгоритме решения игровых задач управления // Приклад. математика и механика. 1987. Т. 51, № 2. С. 216-222.
9. Субботин А. И., Тарасьев А. М., Ушаков В. Н. Обобщённые характеристики уравнений Гамильтона — Якоби // Изв. РАН. Техн. кибернетика. 1993. № 1. С. 190197.
10. Тарасьев А. М., Успенский А. А., Ушаков В. Н. Аппроксимационные схемы и конечно-разностные операторы для построения обобщённых решений уравнений Гамильтона — Якоби // Изв. РАН. Техн. кибернетика. 1994. № 3. С. 173-185.
11. Красовский Н. Н., Субботин А. И., Ушаков В. Н. Минимаксная дифференциальная игра // Докл. АН СССР. 1972. Т. 206, № 2. С. 277-280.
12. Егоров А. И. Основы теории управления. М. : Физматлит, 2004.
Поступила в 'редакцию 10.11.2021. После переработки 13.12.2021.
Сведения об авторе
Ушаков Владимир Николаевич, член-корреспондент РАН, доктор физико-математических наук, профессор, главный научный сотрудник отдела динамических систем, Институт математики и механики им. Н. Н. Красовского УрО РАН, Екатеринбург, Россия; e-mail: [email protected].
Chelyabinsk Physical and Mathematical Journal. 2022. Vol. 7, iss. 1. P. 54-79.
DOI: 10.47475/2500-0101-2022-17105
UNIFICATION IN THE GAME PROBLEM OF CONVERGENCE AND THE PROPERTY OF STABILITY
V.N. Ushakov
N.N. Krasovskii Institute of Mathematics and Mechanics
of the Ural Branch of the Russian Academy of Sciences, Yekaterinburg, Russia
The paper studies the game problem of the convergence of a conflict-controlled system with a target set in the phase space of the system at a fixed time moment, the moment the game ends. The key property of u-stability, introduced in the second half of the 20th century by N.N. Krasovsky and A.I. Subbotin, is investigated in the paper. The study is based on conflict-induced controlled system unification constructions, which are introduced into the game problem of convergence within the framework of the Hamilton — Jacobi formalism. The paper introduces the concepts of u-stable and maximal u-stable paths, which are dual to the concepts of u-stable and maximal u-stable bridges introduced by N.N. Krasovsky and A.I. Subbotin. The concepts of approximating systems (A-systems), i.e. systems of sets in phase space, approximating maximum u-stable bridge and maximum u-stable path in gaming the problem of convergence, are defined. In this case, the concept of the maximal u-stable path is an obvious analogue of the notion of a trajectory in the theory of ordinary differential equations, and the concept of an A-system for this path is an analogue of the concept of an Euler broken line. These new concepts also have features that are introduced by the presence interference (i.e., the second player) in the dynamics of a conflict-controlled system.
Keywords: conflict-controlled system, control, game approach problem, differential inclusion, Hamiltonian, unification, stability property, set.
References
1. Krasovskiy N.N. Igrovye zadachi dinamiki [Game dynamics problems]. Izvestiya AN SSSR. Tekhnicheskaya kibernetika [News of the USSR Academy of Science. Technical Cybernetics], 1969, no. 5, pp. 3-12. (In Russ.).
2. Krasovskiy N.N., Subbotin A.I. O strukture differentsial'nykh igr [The structure of differential games]. Doklady AN SSSR [Reports of the USSR Academy of Sciences], 1970, vol. 190, no. 3, pp. 523—526. (In Russ.).
3. Krasovskiy N.N., Subbotin A.I. Positsionnye differentsial'nye igry. [Positional differential games]. Moscow, Nauka, 1974. (In Russ.).
4. Krasovskiy N.N. K zadache unifikatsii differentsial'nykh igr [On the problem of unification of differential games]. Doklady AN SSSR [Reports of the USSR Academy of Sciences], 1976, vol. 226, no. 6, pp. 1260-1263. (In Russ.).
5. Krasovskiy N.N. Unifikatsiya differentsial'nykh igr [Unification of differential games]. Trudy Instituta matematiki i mekhaniki [Proceedings of the Institute of Mathematics and Mechanics], 1977, no. 24, pp. 32-45. (In Russ.).
6. Ushakov V.N. Minimaksknoye pogloshcheniye v differentsial'nykh igrakh [Minimax absorption in differential games]. Ektremal'nyye strategii v pozitsionnykh differentsial'nykh igrakh [Extreme strategies in positional differential games]. Sverdlovsk, 1974. Pp. 252-272. (In Russ.).
The study was carried out at the expense of the grant of the Russian Science Foundation, project no. 19-11-00105.
7. UshakovV.N. K zadache postroyeniya stabil'nykh mostov v differentsial'noy igre sblizheniya-ukloneniya [On the problem of building stable bridges in a differential approach-evasion game]. Izvestiya AN SSSR. Tekhnicheskaya kibernetika [News of the USSR Academy of Sciences. Technical cybernetics], 1980, no. 4, pp. 29-36. (In Russ.).
8. Taras'yev A.M., Ushakov V.N., Khripunov A.P. On a computational algorithm for solving game control problems. Journal of Applied Mathematics and Mechanics, 1987, vol. 51, no. 2, pp. 167-172.
9. Subbotin A.I., Taras'yev A.M., UshakovV.N. Obobshchyonnye kharakteristiki uravneniy Gamil'tona — Yakobi [Generalized characteristics of the Hamilton — Jacobi equations]. Izvestiya AN SSSR. Tekhnicheskaya kibernetika [News of the USSR Academy of Sciences. Technical cybernetics], 1993, no. 1, pp. 190-197. (In Russ.).
10. Тарасьев А.М., Успенский А.А., Ушаков В.Н. Approksimatsionnye skhemy i konechno-raznostnye operatory dlya postroyeniya obobshchyonnykh resheniy uravneniy Gamil'tona — Yakobi [Approximation schemes and finite-difference operators for constructing generalized solutions of the Hamilton — Jacobi equations]. Izvestiya AN SSSR. Tekhnicheskaya kibernetika [News of the USSR Academy of Sciences. Technical cybernetics], 1994, no. 3, pp. 173-185. (In Russ.).
11. KrasovskiyN.N., SubbotinA.I., UshakovV.N. Minimaksnaya differentsial'naya igra. [Minimax differential game]. Doklady AN SSSR [Reports of the USSR Academy of Sciences], 1972, vol. 206, no. 2, pp. 277-280. (In Russ.).
12. EgorovA.I. Osnovy teorii upravleniya [Fundamentals of control theory]. Moscow, Fizmatlit Publ., 2004. (In Russ.).
Article received 10.11.2021.
Corrections received 13.12.2021.