Известия Института математики и информатики Удмуртского государственного университета
2022. Том 60. С. 111-154
УДК 517.958, 530.145.6 © В. Н. Ушаков, А. В. Ушаков
О СБЛИЖЕНИИ УПРАВЛЯЕМОЙ СИСТЕМЫ НА КОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ
Рассматривается конфликтно управляемая система в конечномерном евклидовом пространстве. Изучается игровая задача о сближении системы с целевым множеством в фазовом пространстве на конечном промежутке времени. Основу изучения задачи составляют методы, развиваемые в теории позиционных дифференциальных игр. В рамках этой теории представлен подход к конструированию приближенных решений задачи о сближении.
Ключевые слова: управление, целевое множество, конфликтно управляемая система, дифференциальное включение, задача о сближении, множество разрешимости, минимаксный u-стабильный мост.
DOI: 10.35634/2226-3594-2022-60-07 Введение
Настоящая работа посвящена одной из основных задач теории дифференциальных игр. Теория дифференциальных игр формировалась и активно развивалась во второй половине XX века. Развитие теории во много стимулировали исследования Л. С. Понтрягина, его сотрудников и коллег (см. [1-6]), относящиеся к линейным дифференциальным играм. В этих исследованиях теоретическую базу для решения рассматриваемых задач составили конструкции первого прямого метода Л. С. Понтрягина и метода, основанного на понятиях альтернированного интеграла и альтернированных сумм.
Параллельно с исследованиями Л. С. Понтрягина и его коллег Н. Н. Красовским и его сотрудниками создавалась теория позиционных дифференциальных игр (см. [7-16]). Эта теория охватила широкий круг задач, в который вошли и многочисленные задачи с нелинейной динамикой (см. [17-24]). Основные понятия этой теории — позиционные стратегии игроков, гарантированный в рамках этой стратегии результат, стабильные мосты (см. [7-9]), о которых подробнее говорится ниже.
Изучается игровая задача о сближении конфликтно управляемой системы в конечномерном пространстве и на конечном промежутке времени. Считается, что момент завершения игры — момент попадания движения системы на целевое множество в фазовом пространстве — не фиксирован. Не предполагается, что для конфликтно управляемой системы выполняется условие седловой точки в маленькой игре, и поэтому задача о сближении рассматривается как минимаксная дифференциальная игра [9-11]. В основе ее изучения лежат методы, развиваемые в теории позиционных дифференциальных игр с 1960-х годов, базирующиеся на позиционном подходе к описанию конкретных игровых ситуаций в динамических системах, предложенном Н. Н. Красовским. Исследуется ключевое в этой теории свойство стабильности, введенное Н. Н. Красовским и А. И. Субботиным [7-9]. Это свойство тесно связано с введенным Н. Н. Красовским центральным в теории позиционных дифференциальных игр понятием — множеством позиционного поглощения, которое представляет собой множество разрешимости игровой задачи (например, — игровой задачи о сближении). Как известно [7-9], множества разрешимости представляют собой стабильные мосты, и этот важный факт указывает на ряд методологических подходов, которые можно брать за основу при разработке методов построения множеств позиционного поглощения в игровых задачах динамики и, в частности, в игровых задачах сближения-уклонения.
В процессе формирования теории позиционных дифференциальных игр возникло несколько формулировок свойства стабильности и, соответственно, несколько определений стабильных мостов. Эти определения эквивалентны по существу в том смысле, что выделяют в пространстве позиций конфликтно управляемой системы одни и те же множества — стабильные мосты. В связи с этим часто возникает вопрос, какую из формулировок свойства стабильности взять за основу определения стабильного моста при изучении того или иного теоретического вопроса или конкретной игровой задачи. Удобной при изучении теории и различных конкретных игровых задач оказалась предложенная Н. Н. Красов-ским в середине 1970-х годов формулировка свойства стабильности [15], основывающаяся на унификационной модели конфликтно управляемой системы, в которую входит гамильтониан системы. Вхождение гамильтониана в унификационную модель вводит теорию позиционных дифференциальных игр в рамки формализма Гамильтона-Якоби. Важно отметить также, что унификационный подход Н. Н. Красовского к описанию игровых ситуаций в динамических системах привел в 1980-е-1990-е годы А. И. Субботина к созданию теории минимаксных решений уравнений в частных производных Гамильтона-Якоби [25].
В настоящей работе используется идеология унификационного подхода Н. Н. Красов-ского [15] при исследовании и конструировании решений игровой задачи о сближении конфликтно управляемой системы с компактом в фазовом пространстве на конечном промежутке времени. В дополнение к понятиям минимаксных u-стабильных мостов в работе вводятся на базе унификационных конструкций двойственные к этим понятиям понятия минимаксных u-стабильных трактов и примыкающее к ним важное понятие аппроксимирующей системы множеств (A-системы) в фазовом пространстве конфликтно управляемой системы. A-система определена на конечном промежутке времени, на котором развивается игра. A-система мажорирует максимальный u-стабильный тракт — множество в пространстве позиций, определенное в терминах обратного времени, дуальное к множеству разрешимости (множеству позиционного погощения) игровой задачи о сближении. Важной особенностью A-системы является тот факт, что она стягивается к этому тракту при неограниченном измельчении разбиения. Другая важная особенность A-системы заключается в том, что она ориентирована на разработку схем и методов приближенного вычисления максимальных минимаксных u-стабильных трактов в игровых задачах о сближении и, в конечном итоге, — на разработку схем и методов приближенного вычисления максимальных минимаксных u-стабильных мостов — множеств разрешимости игровых задач о сближении на конечном промежутке времени. В работе показано, что при определенных условиях на конфликтно управляемую систему и целевое множество задачи о сближении можно локально (на промежутках разбиения) сводить конструирование A-систем для задач о сближении с нефиксированным моментом окончания к конструированию A-систем для задач о сближении с фиксированным (на промежутке разбиения) моментом окончания.
В работе также определена с привлечением унификационных конструкций разрешающая позиционная стратегия первого игрока как экстремальная к максимальному минимаксному u-стабильному мосту [9]: эта стратегия решает задачу о сближении для начальных позиций конфликтно управляемой системы, содержащихся в множестве разрешимости задачи.
В последнем параграфе работы рассматривается конкретная задача о сближении конфликтно управляемой системы в пространстве R2. В этой задаче множества из A-систем, аппроксимирующих множества разрешимости, подменены конечными множествами в фазовом пространстве — конечными аппроксимациями. Естественно, что эта подмена множеств из A-систем их конечными аппроксимациями может сказаться на эффективности применения экстремальной стратегии первого игрока, а именно, на точности приведения движений конфликтно управляемой системы на целевое множество. Тем не менее анализ решений, полученных в упомянутой задаче в результате привлечения дискретных конечных аппрок-
симаций A-систем, показывает их эффективность.
Работа также тесно примыкает по тематике к работам, посвященным игровым задачам управления и дифференциальным играм преследования [26-31].
§ 1. Постановка игровой задачи о сближении на конечном промежутке времени
На промежутке времени [t0,$], t0 < $ < то, задана конфликтно управляемая система, описываемая уравнением
— = f(t,x,u,v); (1.1)
здесь t Е [t0, $] — время, x Е Rm — фазовый вектор системы (1.1),
u Е P Е comp (Rp), v Е Q Е comp (Rq),
где u, v — управления первого и второго игроков; здесь comp (Rn) — пространство компактов в евклидовом пространстве Rn с хаусдорфовой метрикой.
Система (1.1) удовлетворяет следующим условиям:
A) функция f (t,x,u,v) определена, непрерывна на [t0,$] х Rm х P х Q, и для любой ограниченной и замкнутой области G С [t0, $] х Rm найдется постоянная L = L(G) Е Е (0, то) такая, что
llf (t,x*,u, v) — f (t,x*,u,v)|| ^ L||x*—x*II; (t,x*), (t,x*) Е G, (u,v) Е PxQ; (1.2)
B) найдется такая постоянная y Е (0, то), что
llf(t,x,u,v)|| ^ y(1 + ||x||), (t,x,u,v) Е [to,$] x Rm x P x Q; здесь l fl — норма вектора f в евклидовом пространстве.
При этих условиях на систему (1.1) сформулируем задачу о сближении для первого игрока.
Пусть заданы x(0) Е Rm и множество M Е comp (Rm).
Задача 1. Первому игроку требуется обеспечить выбором некоторой позиционной стратегии u*(t,x), (t,x) Е [t0, $] х Rm, приведение движения x(t), x(t0) = x(0), t Е [t0, $], системы (1.1) на множество M на промежутке [t0, $] (т.е. x(t*) Е M в некоторый момент t* Е [t0, $]), какова бы ни была контрстратегия v(t, x, u), (t, x, u) Е [t0, $] х Rm х P, второго игрока.
Замечание 1. Задача 1, сформулированная в рамках позиционных дифференциальных игр [9-11] в так называемой минимаксной постановке (см. [9-11]), будет уточнена несколько позже. Отметим, что в этой постановке упомянуто движение x(t), x(t0) = x(0), системы (1.1) на промежутке [¿0, $], порожденное позиционной стратегией первого игрока и контрстратегией второго игрока (см. [9-11]). Такая постановка обусловлена тем, что система (1.1) не предполагается удовлетворяющей условию седловой точки в маленькой игре (см. [9]). При постановке задачи 1, в связи с тем, что в маленькой игре не выполняется условие седловой точки, дается информационное преимущество второму игроку: при конструировании своих управлений v в моменты t Е [¿0, $] он знает, какие управления u выбраны в эти моменты первым игроком. В такой игровой ситуации первый игрок, решая задачу о сближении, ставит себя в неблагоприятные информационные условия. Строгая формулировка минимаксной игровой задачи о сближении дана в [9,11].
Замечание 2. Задача 1 сформулирована для начальных позиций (t0,x(0)) конфликтно управляемой системы (1.1). Аналогичная формулировка имеет место и для любых позиций (t*, x*) € [to,$] х Rm, трактуемых нами как исходные позиции для системы (1.1) на промежутке [t*,$], содержащемся в [t0,$]. В связи с задачей 1 возникает вопрос о выделении в [t0, $] х Rm всех исходных позиций (t*,x*) системы (1.1), для которых разрешима задача о сближении с M на [t0, $].
Полагаем W0 — множество разрешимости задачи 1, то есть множество всех таких позиций (t*,x*). Выделение множества W0 в [t0х Rm (его точное вычисление или аналитическое описание) представляет серьезную математическую проблему и является наиболее трудным моментом в процессе конструирования решения задачи 1.
Аналитическое описание множества W0 возможно лишь в немногих конкретных игровых задачах: это приводит к тому, что на передний план при конструировании решений игровых задач типа задачи 1 выступают вопросы и задачи, связанные с приближенным вычислением множеств W0.
Актуальность тематики, связанной с приближенными вычислениями множеств разрешимости в игровых задачах динамики и, в частности, рассматриваемой здесь задачи 1, стимулирует создание общих схем и алгоритмов приближенного вычисления этих множеств, а также обоснование их корректности.
В настоящей статье обсуждаются вопросы, связанные с разработкой общих схем и алгоритмов приближенного вычисления множества разрешимости W0 в задаче 1. Эта разработка, в свою очередь, основывается на теории, связанной с описанием решений задачи 1. Отметим, что исследования, представленные здесь, основаны на том фундаментальном факте, что W0 есть максимальный минимаксный u-стабильный мост в задаче 1 (см. [9,11]).
§ 2. Минимаксная u-стабильность в задаче 1
В этом параграфе при определении свойства минимаксной u-стабильности и минимаксных u-стабильных мостов будут привлечены унификационные конструкции [15,17].
Учитывая условия A, B и включение M € comp (Rm), можно указать достаточно большую ограниченную замкнутую область G С [t0, $] х B(0; R) (где B(0; R) — основание цилиндра) в пространстве [t0,$] х Rm, которая заведомо будет содержать W0 и все упомянутые в разрешающей конструкции задачи 1 движения (t, x(t)), t € [t0,$], системы (1.1), заканчивающиеся на [t0 ,-$] х M.
Здесь B(a; r) = {x € Rm: ||x - а|| ^ r}, а € Rm, r € (0, то), 0 — нуль в Rm
Область G трактуется нами как область, в которой реализуется игровая конфликтная ситуация. Везде ниже упоминается именно эта область.
Опишем свойство минимаксной u-стабильности замкнутых множеств в области G. Для замкнутого множества W С G его минимаксная u-стабильность означает слабую инвариантность множества относительно набора дифференциальных включений (д. в.), ассоциированных с системой (1.1) на промежутке [t0,$] при помощи некоторого семейства L многозначных отображений.
Для описания свойства минимаксной u-стабильности и минимаксных u-стабильных мостов введем скалярную функцию — гамильтониан системы (1.1):
H(t,x,Z) = max min(Z,/(t,x,u,v)), (t, x, Z) € G х Rm;
«eP veQ
здесь (Z, /) — скалярное произведение векторов Z и / из Rm.
Полагаем F(t,x) = co {/(t,x,u,v): u € P, v € Q}, (t, x) € G; здесь co {/} — выпуклая оболочка множества {/} в Rm.
Полагая также K = max(||/(t, x, u, v)||: (t, x, u, v) € G х P х Q) < то, зафиксируем в Rm шар BG = {b € Rm: ||b|| ^ K}.
Выполняется включение F(t,x, ) С BG, (t, x) G G.
В фазовом пространстве Rm системы (1.1) выделим сферу S = {l G Rm: ||l|| = 1}, и в последующих рассуждениях будем использовать векторы l G S, рассматривая их как некоторые обобщенные управления второго игрока: векторы l G S при формировании разрешающих позиционных стратегий управления первого игрока подменяют как бы контруправления второго игрока — вектор-функции v(u) G Q, u G P (более точно, — они подменяют вектор-функции vj(u) G Q, u G P (определение см. ниже)).
Векторы l G S удобны тем, что являются элементами сферы S С Rm — множества, имеющего простую геометрию. Они также входят в набор аргументов гамильтониана H(t, x, l) системы (1.1).
Полагаем при (t, x, l) G G x S
П (t, x) = {f G Rm : (l, f ) ^ H (t, x, l)}, F (t, x) = F (t, x) p| П (t, x).
Справедливо включение F(t,x) С BG, (t,x,l) G G x S.
Введем семейство L многозначных отображений (t,x) м- F(t,x), l G S, определенных на G, и наложим на эти отображения следующее условие:
C) при (t, x, l) G G x S справедливо неравенство
H*(t, x, l) < H (t, x, l) < H *(t, x, l); здесь H*(t,x,l) = min (l, f), H*(t,x,l)= max (l, f).
Это условие на семействе L, не является слишком строгим; оно делает отображения (t,x) м Fj (t, x) удовлетворяющими соотношению int F (t, x) = 0, (t,x,l) G G x S, что влечет за собой (с учетом условий A, B) равномерную непрерывность многозначного отображения (t,x,l) м F^(t, x) на компакте G x S в хаусдорфовой метрике; здесь хаусдор-фово рассогласование между F* и F * из comp (Rm) определяется равенством d(F*,F *) = = max(h(F*,F*), h(F*,F*)), h(F*,F*) = max min ||f* - f*||.
f*eF» f *eF*
Из равномерной непрерывности функции f (t,x,u,v) на компакте G x P x Q и равномерной непрерывности многозначного отображения (t,x,l) м F(t,x) на компакте G x S следует, что положительные функции
шf (а) = max(||f (t*, x*, u, v) — f (t*, x*, u, v) || : (t*, x*), (t*, x* ) G G, |t* — t*| + ||x* — x*|| ^ а, (u, v) G P x Q), а > 0, шF(а) = max(d(F(t*,x*),F(t*,x*)): (t*,x*), (t*,x*) G G, |t* — t*| + ||x* — x*|| ^ а, l G S), а > 0,
удовлетворяют предельным соотношениям (а) ^ 0, шF (а) ^ 0 при а ^ 0.
Полагаем также, что наряду с условием C выполняется условие
D) существует такое конечное Л = A(L), что
d(F(t,x*),F(t,x*)) ^ A||x* — x*||, l G S; (t,x*), (t,x*) G G.
Введем функции ш*(p) = max(wf(р),шF(p)), p > 0, и ш(p) = p ■ ш*((1 + K)p), p > 0 (K определено на с. 115)
Определим в терминах семейства L оператор минимаксного u-стабильного поглощения в задаче 1. Для этого введем на промежутке [to, дифференциальные включения
dx
— GF(i,x), les. (2.1)
dt
Введем обозначения.
Пусть ** и ** — моменты из [¿о,^]» (**,**) е А*; х* и X* — точка и множество в Дт, отвечающие моменту **; I е Б; здесь А* = {(V*, V*) е [¿0,$] х [¿0, §]: V* ^ V*}.
Полагаем:
, х*) — множество достижимости (м. д.) в момент ¿* д.в. (2.1) на [¿*,] с начальной точкой х(**) = х*;
Х1(4*, ¿*, X*) = Хг (¿*, ¿*, х*) — м. д. в момент ¿* д. в. (2.1) с начальным множе-
ех*
ством X*;
Х-1(**,**,Х*) = {х* е Ят: ЗД*,¿*,х*) ПX* = 0}, X* с Ят;
фп (X *) =/ М если * е [** ,**),
И ; [М^*, если * = **.
Определение 1. Оператором Л(и) минимаксного и-стабильного поглощения в задаче 1 назовем многозначное отображение (**,**, X*) м Л(и)(¿*,¿*,X*), определенное
А* рт
* х 2Л соотношением
Л(и)(г*,**^*) = ^ у x-1(t*фП^*)).
Определение 2. Замкнутое множество Ж с С назовем минимаксным и-стабиль-ным мостом в задаче 1, если
Ж(§) с М; Ж(**) с Л(и)(г*,**, Ж(**)), (г*,**) е А*; здесь Ж(*) = {х е Ят: (*,х) е Ж}, * е [*0,§].
Определение 3. . Символом Ж0 обозначим максимальный (по включению) минимаксный и-стабильный мост.
Максимальный минимаксный и-стабильный мост в задаче 1 существует, содержит в себе [*0 , §] х М, и Ж0 = и Ж, где Ж — всевозможные минимаксные и-стабильные мосты в задаче 1. Кроме того, Ж0 с С и Ж0(§) = М.
Определения 2 и 3 представляют собой унификационные определения минимаксных и-стабильных мостов в задаче 1, поскольку основаны на привлечении семейства С унифи-кационных отображений (*,х) м Рг(*,х), I е Б. Эти определения эквивалентны первоначальным определениям минимаксных и-стабильных мостов в задаче 1, поскольку задают в пространстве позиций (**,х*) системы (1.1) одни и те же множества Ж и Ж0 (то есть мосты). Так, можно показать, что Ж0 есть множество разрешимости задачи 1.
Вычисление множества Ж0 в конкретных игровых задачах теории позиционных дифференциальных игр и, в частности, вычисление множества Ж0 в задачах типа задачи 1 (с конкретными системами (1.1) и целевыми множествами М) есть наиболее трудная проблема при конструировании решений. Трудности обусловлены, во-первых, сложностью геометрии самого множества Ж0, которая возникает даже в конфликтно управляемых системах (1.1) с достаточно простой динамикой и при наличии целевого множества М с простой геометрией (например, М — точка или замкнутый шар в Дт). Во-вторых, при выделении моста Ж0 в области С мы вынуждены, отправляясь от целевого множества М — краевого условия Ж0(§) = М, отвечающего последнему моменту § промежутка [*0,^], двигаться в направлении убывания времени восстанавливая сечения Ж0(*) с Дт множества Ж0. В связи с этим в конкретных задачах 1 мы сталкиваемся с необходимостью вычислять множества
Х-1(£*,£*,Ш°(£*)) = (х* е Ят: Хг(0*,ж*)р| Ш°(£*) = 0}, (£*,£*) е А*, I е
Это означает, что мы сталкиваемся с необходимостью вычисления многозначных решений весьма специфических уравнений, в которых задействованы множества достижимости X(ГЛ,ж*) д. в. (2.1).
В этой ситуации возникает идея избежать процедуры вычисления указанных многозначных решений типа X—£*, Ш°(£*)). Так возникает необходимость в обращении времени £ — необходимость в переходе от «прямого» времени £ е [£°, $] к «обратному» времени т = + $ — £ и связанному с этим переходом представлением системы (1.1) и минимаксных и-стабильных мостов Ш и в терминах «обратного» времени т.
Ниже убираем кавычки из терминов прямого и обратного времени.
Определим обратное время т = + $ — £ е [£°, $].
Конфликтно управляемую систему (1.1) представим в терминах обратного времени т :
— = к(т,г,и,ь) = -/(г0 + '&-т,г,и,ь), те[г0,Щ, гег, иеР, УвС}. (2.2) ат
Определим также в терминах обратного времени д. в.
— € Щ{т,г) = + ге[<0)1?], геГ, 1е5. (2.3)
ат
Введем связанные с д. в. (2.3) обозначения. Пусть I е 5; [т*, т*] С [£°, $]; г* и 2* — точка и множество в Ят, отвечающие моменту т*; гт и 2т — точка и множество в Ят, отвечающие моменту т е [т*, т* ]. Полагаем
^(т*, т*, г*) — м. д. в момент т* д. в. (2.3) на [т*, т*] с начальной точкой г*; ^(т*, т*, 2*) = и ^(т*, т*, г*) — м. д. в момент т* д. в. (2.3) на [т*, т*] с начальным
множеством 2*;
^ (т*, т, гт) — м. д. в момент т* д. в.
, ??е[т,т*], (2.4)
ап
с начальной точкой г(т) = гт;
^ (т*, т, 2т) — м. д. в момент т* д. в. (2.4) с начальным множеством 2т;
*, т*, 2*) = ^(т*, т, Фт(2*)) — м. д. в момент т* набора дифференциальных
те[т*,т *]
включений (2.4) с начальными множествами 2т = Фт(2*), т = [т*, т*], где
Му^*, если т = т*,
Фт (2*)
т * М, если т е (т*, т*];
*
*
2(т*,т*,2*) = ^(т*,т*,2*) — множество совместной (по всем I е 5) достижимости в момент т* набора дифференциальных включений (2.4) с начальными множествами Фт(2*), т е [т*, т*].
Определение 4. Замкнутое множество 2 с С, удовлетворяющее
2(Т0) = М, X(т*) с X(т*,т*,2(т*)), (т*,т*) е А*, назовем минимаксным и-стабильным трактом системы (2.2); здесь
2 (т) = {г е : (т, г) е 2}, т е [*0 ,§], А* = {((*,( *) е [*0,§] х [*0 ,§]: С* ^ С *}.
Определение 5. Символом 20 обозначим максимальный (по включению) минимаксный и-стабильный тракт системы (2.2).
Максимальный минимаксный и-стабильный тракт 20 = 0 представим в виде объединения У 2 всевозможных минимаксных и-стабильных трактов 2 системы (2.2), и 20 с С,
20(т0) = 20 (*0) = М.
Также максимальный минимаксный и-стабильный тракт 20 и максимальный минимаксный и-стабильный мост Ж0 связаны соотношением
20(т) = Ж0(*), т + * = *0 + где * и т из [*0,§].
Переход от моста Ж0 к тракту 20 обусловлен необходимостью разработки схем и алгоритмов приближенного вычисления множеств разрешимости Ж0 в конкретных задачах 1.
Ориентируясь на разработку таких схем и алгоритмов, введем конечное разбиение Г = {т0, т1,..., т,..., т^ = §} промежутка [*0, §]. Сначала сопоставим разбиению Г систему {20(т): т е Г} временных сечений 20(т) = {г е Дт: (т,г) е 20} тракта 20.
Затем введем систему {2г(т): т е Г} множеств в Дт, заданную рекурентными соотношениями
гг(т0) = М, /(г^^г.гмД'Ы), Из определения системы {2г(т): т е Г} следует
20(т) с 2г(т), т е Г.
Введем последовательность двоичных разбиений
Г(п) = {т0п) = ^т^,...,^,...,^) = §}, N(п) = 2;-1, п е X,
промежутка [*0, §].
В последовательности {Г(; )} каждое последующее разбиение содержит все предыдущие разбиения. Каждому Г(;) сопоставим систему {2(п)(т(;)): т(;) е Г(;)} множеств 2(;) (т^) = 2г(п) (т(;)):
(т0(га)) = м, г^{т^п)) = 1, , ^(т£1)), г = 1,Щп).
Для любого момента т* е Г(;) справедливы включения
2 (т*) (т*), (т*) при к > п. (2.5)
Пусть т* — двоичный момент в [*0,§]. Учитывая (2.5), заключаем, что последовательность {2(;)(т*)} сходится в хаусдорфовой метрике к компакту 2у(т*) = Р| 2(;)(т*) в Дт.
гаем
Эта сходимость означает, что для любой точки г* е 2у(т*) найдется последовательность {г(п)}, е 2(;)(т*), п е М, сходящаяся к г*, а также любая сходящаяся последователь-
!г* '}, г* е 2 у(т*), п
ность {г(;)}, е 2(;)(т*), п е М, имеет пределом некоторую точку г* е (т*).
Распространим определение множества Zv(r*) с двоичных моментов т* £ [¿0,$] на другие моменты т* £ [¿0, $], для чего полагаем ¿п(т*) = max (т^ £ Г(п): т(га) ^ т*).
Пусть т* — произвольный момент из [¿0,$]. Определим множество Zv(t*) всех точек z* £ Rm, для каждой из которых найдется последовательность {(¿п(т*), )}, ¿n(т*) £ Г(п), £ Z(га)(£га(т*)), n £ N, сходящаяся к (т*,г*).
Вместе с тем мы определили множество
Zv = U (т*^v (т*)).
т* e[io,^j
Множество Zv представляет собой компакт в G, порожденный предельным переходом от последовательности систем {Z(п)(т(п)): т(п) £ Г(п)}, n £ N.
В связи с этим пишем Zv = lim {Z(га)(т^га)) : £ Г(п)}.
Справедливо следующее утверждение.
Лемма 1. Множества Z0 и Zv совпадают.
Доказательство этого утверждения аналогично доказательству соответствующей леммы из [23, § 3, лемма А].
В лемме 1 утверждается, что максимальный минимаксный u-стабильный тракт Z0
есть предел Zv = lim {Z(n) (rfn)): т(п) £ Г(п)} последовательности «промежуточных» сигаете
стем {Z(n)(т^(п)): т(п) £ Г(п)} С Rm, отвечающих разбиениям Г(п) с диаметрами А(п) = = А(Г(п)) I 0 при n ^то.
Это означает, что множество Z0 можно в принципе (т. е. согласно теории) приближенно вычислять в виде систем {Z(n) (т(п)): т(п) £ Г(п)} в пространстве Rm, отвечающих разбиениям Г(п) промежутка [¿0,$].
Однако, в конкретных игровых задачах 1 для приближенного вычисления Z0 в виде систем {Z(га)(т(га)): т(п) £ Г(п)} необходимо обладать умением точного вычисления множеств Z(n) (т(п)) в соответствии с рекуррентными соотношениями Z(п)(т0п)) = M, Z(n)(T(n)) = Z^irtl)), г = Щп).
Поскольку мы не обладаем возможностью точного вычисления множеств
) даже
в достаточно простых конкретных задачах 1, то при изучении задачи 1 в общей постановке мы вынуждены создавать методы, трансформирующие множества
) в множества,
более пригодные для вычислений, ориентируясь на то, что эти множества должны быть достаточно хорошими аппроксимациями (в хаусдорфовой метрике) множеств Z(n) (т(п)).
Наша цель состоит в разработке методов, которые составят основу для алгоритмов вычисления именно таких множеств в Rm. Очевидно, что в нетривиальных (конкретных) задачах 1 эти множества должны быть конечными. Условие конечности множеств мы можем обеспечить, проведя дискретизацию пространства [t0, $] х Rm позиций системы (1.1). Таким образом, вслед за дискретизацией промежутка [t0, $] (введение конечного разбиения Г), нам предстоит провести в том или ином виде дискретизацию фазового пространства Rm. В основу дискретизации могут быть положены различные схемы. Некоторые из них могут быть связаны с дискретизацией векторограммы скоростей управляемой системы (1.1), точнее, правой части дифференциального включения (2.1), ассоциированного с системой (1.1).
Однако, мы не сразу перейдем от множеств Z(га)(т(га)), т(п) £ Г(п), к вопросам конструирования множеств в Rm, отвечающих разбиениям Г(п) и являющихся в то же время конечными.
Перед этим мы подменим множества Z(п)(т(п)), т(п) £ Г(п), отвечающими тем же разбиениям Г(п), но более просто устроенными (имеющими более простую геометрию) множествами. По своему определению, эти множества близки к конструкциям ломаных Эйлера
из теории дифференциальных уравнений (они есть своеобразные узлы ломаных Эйлера). Однако эти множества не являются конечными.
§3. Промежуточная система {Yr(т^) : т G Г} в пространстве Rm
Система {Yг(т,): т G Г} С Rm, которая будет введена в этом параграфе, является промежуточной системой и выполняет вспомогательную роль в наших рассуждениях.
Для упрощения обозначений вместо двоичных разбиений Г(п), n G N, сначала рассмотрим двоичное разбиение Г = {то = ¿о, т\,..., ъ,..., tn = — Ti = Ai = А = Д(Г), г = 0,N - 1, N = 2к, А = {ß - t0)N~l.
В определении системы {^г(т^): т G Г} на каждом очередном шаге [т^, Ti+i] разбиения Г участвуют семейства дифференциальных включений
dz
— ен^т^т), г] с [г, Ti+i], les, (3.1)
dn
отвечающих всевозможным промежуткам [т, Ti+1] С [т,, Ti+1] и начальным точкам z(t) =
= zT G Rm.
Из определения следует, что дифференциальные включения (3.1) имеют на промежутках [т, тт] постоянную правую часть — множество H (т, zT).
Пусть т, т^+1 G Г; т G [т,, т^+1]; zT и ZT — точка и множество в Rm, где (т, zT) и (т, ZT) из G; z(,) и Z(,) — точка и множества в Rm, где (т,, z(,) ) и (т,, Z(,) ) из G; l G S. Введем обозначения:
У"гг(тг+1, т, zT) = zT + (тт — т)Яг(т, zT) — м. д. в момент т,+1 д. в. (3.1) с начальной точкой zT ;
У"1г(т,+1, т, ZT) = ^J Y^(т,+1, т, zT) — м. д. в момент т,+1 д. в. (3.1) с начальным мно-
zT eZ Т
жеством ZT. Согласно этим обозначениям имеем
У1г(т,+1,т, Фт(Z(i))) = У У1г(т,+1,т, zt) — м.д. в момент т,+1 д. в. (3.1) с на-
zt еФт (Z« )
чальным множеством Фт (Z(i)), отвечающим моменту т G [т,, т,+1];
!/1г(т,+1, т,, Z(i) ) = У ^1г(т,+1, т, Фт (Z(i) )) — м.д. в момент т,+1 семейства диф-
т e[Ti,Ti+i]
ференциальных включений (3.1) с начальными множествами Фт(Z(i)), т G [т,,т,+1];
Yг(т,+1, т,, Z(,) ) = /г (т,+1, т,, Z(,)) — множество совместной (по всем l G S) дости-
les
жимости в момент т,+1 семейства дифференциальных включений (3.1) с начальными множествами Фт(Z(,)), т G [т,,т,+1].
Справедлива следующая оценка:
d^r^^zT), У1г(т,+1,т, zt)) ^ ш(т,+1 — т) ^ ш(Д),
и, значит,
^(т,+ьт, zt ) С Угг(т,+1,т, zt )цд), l G S ; т,,т,+1 G Г; т G [т,,т,+1]; (т, zt ) G G; (3.2) здесь Yw — замкнутая ^-окрестность множества Y G comp (Rm).
Из (3.2) получаем
Zi(Ti+i,T, Фт(Z(i))) С U Yir(Ti+i,T,zr}Ш(Д) = Yir(Ti+i,T, Фт(Z(i)))Цд), (3.3)
zt еФт (Z(i))
l G S ; G Г; т G [т, T+i].
Из (3.3) следует включение
Z(Ti+1,T,Z«)= U Zi(Ti+i,т, Фт(Z(i))) С U ^Г(т+1,т, Фт(Z(i)))^) =
ге[г4 ,ri+i] ге[г4 ,ri+i] (3.4)
= yir(T+i,Ti,Z(i))ЦД), l G S; Ti,Ti+i G Г; (^Z«) G G.
Полагаем YГ(тт(i)) = р|(/Г(t+i,t,Z«)цд)).
les
Из определения множества YГ(т+1, т, Z(i) ) следует
Z(Ti+i,Ti,Z(i)) С YГ(т+i, т, Z(i)); тг,тг+1 G Г, (T,Z(i)) G Г. (3.5)
Введем Y-систему {YГ (т) : т G Г} в Rm, отвечающую разбиению Г.
Определение 6. Y-системой {Y Г(т^) : т G Г} множеств Y Г(т ) С Rm, отвечающей двоичному разбиению Г = {то = to, т1,..., т^..., tn = $} промежутка [t0, назовем набор множеств
Уг(т0) = М, ¥г(тг+1) = ¥Г(тг+1,тг,¥Г(тг)), г = 0,N-1.
Из определения систем {ZГ(тi) : Ti G Г}, {YГ(т) : Ti G Г} и включения (3.5) следует
ZГ(т) С Y^Ti), Ti G Г.
Из определения системы {YГ(т): Ti G Г} следует, что точно вычислить множества YГ(т^), т G Г, невозможно хотя бы потому, что в ее определении присутствует операция объединения множеств в Rm по бесконечному числу моментов т G [Ti,Ti+1]; кроме того, сами множества YГ(т) имеют геометрию, не поддающуюся в большинстве конкретных задач 1 аналитическому описанию.
В следующем параграфе перейдем от вспомогательной системы {YГ(т^) : т G Г} к более приспособленной для вычислений системе {¿?Г(т): т G Г}.
Для этого, не имея возможности вычислять объединение бесконечного набора множеств достижимости У^Г(т^+1, т, Фт(Z(i))), т G [т^,т^+1 ], приведем вспомогательные выкладки, относящиеся к множествам 1Л1Г(т^+1, т, Z(i)).
§4. Переход от системы {Yr(т^) : т G Г} к {Zr(т^) : т G Г}
Начнем осуществлять переход от {YГ(т) : т G Г} к {¿?Г(т) : т G Г} с конструирования одной оценки сверху (т. е. верхней аппроксимации) в Rm множества 1/^Г(т^+1, т^ Z(i) ), более приемлемой для вычислений, чем это множество.
При этом предполагаем, что, в дополнение к условиям A, B, C, D выполнено следующее условие на целевое множество M :
E) множество M есть объединение замкнутых шаров в Rm, радиусы которых ограничены снизу некоторым Rc G (0, œ).
Оценку множества Угг(тг+1, т, 2(г)) начнем с получения оценки сверху множеств
Уг(тт ,т, Фт(2«)), т € [тг,тт],
составляющих это множество.
Выберем произвольные т € [т, т»+1 ] и гт € Фт(2(г)).
Относительно т могут быть три возможности: 1) т = т^+1; 2) т € (т^, т^+1); 3) т = т. Допустим, реализовалась возможность 1. В этом случае т^+1 — т = 0 и, значит,
^г(т*+1,т, Фт(Я«)) = ^г(тг+1 ,тт, Фтг+1 (2«)) = Фтг+1 (Я«) = М.
Допустим, реализовалась возможность 2. В этом случае 0 < т^+1 — т < Д^ = Д, Фт (2Ф) = М и, значит, ¿т € М.
Возьмем произвольную точку ^(т^+1) € ^(т^, т, гт). Эта точка представима в виде
¿(^+1) = ¿т + (т^+1 — т(т, ¿т), ГДе ^(т, ¿т) € Н(т, ¿т). (4.1)
Относительно Н(т, ¿т) рассмотрим два взаимоисключающих варианта: а) 0 € Н(т, ¿т); б) 0 € Н(т, ¿т).
Допустим, реализовался вариант а). Тогда в (4.1) возможно равенство ^(т, ¿т) = 0, и в этом случае имеем г(т^+1) = ¿т € Фт(2(г)) = М. Если же ^(т, ¿т) = 0, то выкладки будут такие же, как и в случае рассматриваемого ниже варианта б).
Допустим, реализовался вариант б). В этом случае ^(т, ¿т) = 0 и, значит, г(т^+1) = = ¿т + (т*+1 — т)йг (т, ¿т) = ¿т.
Справедливо равенство ¿т = ¿(т^+1) — (т^+1 — т(т, ¿т) (см. рис. 1).
Рис. 1
Введем точку = ¿т — (т — т)^(т, ¿т). Так как ¿т € М, то ¿т € В(т*; Д) — одному из шаров, составляющих, согласно условию E, множество М, так что Д ^ Дс.
Обозначим через Мс пересечение шара В(т*; Д) с двумерной гиперплоскостью П * в Дт, содержащей центр т* шара В(т*; Д) и точки г(т»+1), ¿т, . Из определения точки гТ1 получаем
г(т^+1) = ^ + (т^+1 — т)йг(т, ¿т). Наряду с точкой г(т^+1) рассмотрим точку
(т^+1) = ^ + (т^+1 — ъ )йг (т^);
здесь вектор h(t*, zTi) — ближайший в Щ(т, zTi) к вектору h(т, zT). (см. рис. 1) Точки z(Tj+i) и z *(Tj+i) стеснены неравенством
||z(Tj+i) - Z* (Ti+i)| = (Ti+1 - Ti )||h (т, Zt ) - h (t*, ZTi )|| ^
^ (Ti+1 - Ti) ■ w*((t - Ti) + ||Zt - zTi ||) = (Ti+1 - Ti V *((t - Ti) + (t - Ti)||h(t,Zt)||).
Учитывая, что для т G [т, Ti+1] и (т, zT) G G имеет место ||h(т, zT)|| ^ K (см. с. 115), получаем
||z(Ti+1) - z *(Ti+1|| ^ AiW *((1 + K)Ai) = w(Ai). (4.2)
Из z *(Ti+1) G Yr(Ti+1, Ti; zTi) и неравенства 4.2 получаем
z(Ti+1) G Yr(Ti+1 , zTi) + w(A)B*;
(4.3)
здесь B*
; 1) С
Выясним, какой окрестности множества ФТ4 (г)) = М{_) Z(г) принадлежит zri. Для этого выясним, какой окрестности множества Мс принадлежит zri.
Введем точки q *, р*, у *, принадлежащее гиперплоскости П* (см. рис. 2). Точку д * определим как точку пересечения границы дМс круга Мс (в гиперплоскости П *) с прямой, выходящей из и* под прямым углом к отрезку ]. Отрезок [д*,р*] получен из от-
резка ] параллельным переносом до совпадения его левой точки (точки z(тi+1))
с д* (см. рис. 2).
z(Ti+1)
p*
p(zTi ,Mc)
Рис. 2
Введем также обозначения
ад = ||д * - р* II = - z(Ti+l)|| = А||йг (т,^ )|| ^ К А, рд = ||р* - у * ||,
так что имеет место ||р* — го*|| = \\'Р* — у*\\ + \\у* — «>*|| = Я + Рд (см. рис. 2).
Из равенства Я + рд = \/1'2 I с>\ в прямоугольном треугольнике А«>*д*р* следует 11 К
Я + Рд < Я + ТГБ^А и' значит- Ра < ТГБ*7а ^ гДе обозначено е(<т) = ——а2, а > 0.
2Я 2Я 2ЯС
Из построения Аи *д * р * следует, что точка zri принадлежит этому треугольнику (как
фигуре в плоскости П *) и поэтому Я + р^, Мс) ^ Я + рд, а, значит, р^, Мс) ^ рд < < е(А); здесь , Мс) — расстояние от zri до Мс. Отсюда следует включение
^ С М£с(д) С В(т *; Д)£(Д) С Фт,)£(Д). Учитывая это включение и (4.3), получаем
¿(^+1) € У[(т*+ьт*, Фп(2(^))£(д))ш(Д), I € Б; т, т*+1 € Г.
Так как точка ¿(т^+1) взята произвольно в множестве У^т^, т, Фт(2(г))), т € (т^, т^+1), I € Б, то
Уг(тт ,т, Фт(2«)) С Уг(тт,тг, Фт,(2«) ^Д^ЦД^ 1 € Б; тг, тг+1 € Г; т € (тг,тг+1)- (4.4) Рассмотрим теперь множество У^г(т^+1, т^, Фт, (2(г))£(Д))) и представим его в виде
Уг(тт,тг, Фт,(2(г))£(Д)) = {¿*(тт) = ¿(тг) + Д^т*,^)): ¿(тг) € Фт,(2«)£(д)}.
Каждая точка г * (т^+1) этого множества представима в виде
г * (тт) = * * (т) + Л« + ДЛг(тг ^ * (т) + Л(г)), где * * (т) € Фт, (2«), ||Л(г)|| ^ е(Д).
Введем в рассмотрение вектор Лг(т, (т)) — ближайший в Нг(т, (т)) к вектору Лг(т, ¿(т)) и запишем последнее равенство в виде
я * (тт) = (я * (т) + ДЛг (т ^ * (т))) + (Л(г) + Д^т^ * (т) + Л«) — Л (т ^ * (т))). Принимая во внимание условие D, получаем
||Лг(т^ *(т) + Л«) — ^ *(т))|| ^ ВД^*(т) + Л«^(т^*(т))) ^
^ Л||Л(г)|| ^ Лг(Д).
Отсюда следует, что ^ *(тш) = (¿*(т) + ДЛ(т, ¿*(т))) + где (т) € Фт,(2«), Лг(т, ^*(т)) € Нг(т, ^*(т)), вектор з(г) удовлетворяет неравенству ||з(г)|| ^ ||Л(г)|| + + Д|Мтг^ *(тг) + Л«) — Лг(т^ *(т))|| ^ е(Д) + ДЛе(Д) < вЛДе(Д). Отсюда следует включение
(т^+1) € Угг(тг+1,т^, Фт,))елде(Д), I € Б, т, т*+1 € Г,
и, значит,
Уг(тт,тг, Фт,(2«)£(Д)) С Угг(тг+1,тг, Фт,(2«)) елле(Д), 1 € ^ тг, тг+1 € Г- (4.5) Учитывая (4.4) и (4.5), получаем
уг(тг+1,т, Фт)) С уг(тг+1 , Фт,(2(г))?(Д); I € Б, тг,тт € Г, т € (т,тт); (4.6)
здесь £(р) = ш(р) + еЛре(р), р € (0, то).
Таким образом, установлено, что множество У5г(т^+1,тг, Фт,(2(г)))^(Д) в правой части включения (4.6) мажорирует все множества Угг(т^+1, т, Фт(2(г))), т € [т, т^+1]. Это означает, что на каждом интервале (т^,т^+1) мы избавляемся от необходимости вычислять бесконечное число множеств Уг(т^+1, т, Фт(2(г))), т € (т, т^+1) (что мы в принципе сделать не в состоянии), а подменяем их вычисление вычислением множества Угг(тг+1, т^, Фт,(2(г))) и его £ (Д)-окрестности.
К 2
Поскольку функция £(р) = р • (а;*((1 + К)р) + еХр——р), р > 0, имеет порядок по
2Я
р ^ 0 более высокий, чем первый, то мажоранта У1г(т^+1,т^ Фп(Z(^))£(д) незначительно отличается при малых А > 0 от множеств достижимости УГ(т^+ь т, Фт(Z(^)), т € [т^ ]. Вместе с тем мы закончили анализ возможности 2.
Допустим, реализовалась возможность 3. В этом случае из т = т следует — т = = Дi = А и, значит,
УГ(Ti+l,т, Фт^(i))) С УГ(Ti+l,Ti, Фтг(Z(i)))?(Д), I € т,п+1 € Г. Подводя итог анализа всех трех возможностей относительно т € [т, т^+1], получаем
УГ(т^+1 ,т, Фт(Z(i))) С МиуГ(т+1 , Фтг(Z(0))?(д), (4.7)
I € 5, т, т^+1 € Г, т € [т,^+1].
Из (4.7) следует
) = и уГ(^+1 ,т, Фт(^)) С М иУг(Ti+l,Ti, Фтг^(%(д), (4.8)
Т е[Тг,Тг+1]
I € 5, т, т^+1 € Г. Учитывая (3.4) и (4.8), получаем
Zх(т^+1 ,Ti, Z(i)) С уГ(^+ьт^«)и(д) = (М^Г(Ti+l,Ti, Фп(Z(i)))С(д))и(д). (4.9) Введем обозначения
Z(i)) = Мцд) У УГ(тi+l, Ti, М ^ Z(i))^(д), , Ti, Z(i)) = р| ^+1, т^ Z(i));
(4.10)
хез
здесь обозначено ^(р) = £(р) + ш(р), р > 0.
Включение (4.9) принимает вид
^(тi+l,Ti,Z(i)) С ^Г(Ti+l,Ti,Z(i)), I € Ti,Ti+l € Г.
Учитывая определения множеств Z(^+1; т, Z(i)) и ¿^(т^, т^ Z), получаем
Z(Ti+l,Ti,Z«) С (i)), т,Ti+l € Г, (тi, Z(i)) С С.
Определение 7. Аппроксимирующей системой (А-системой) {¿^Г(т): т € Г} С С Ят, отвечающей разбиению Г = {¿0 = то,..., т*,..., т^ = $}, назовем набор множеств
гг(т0) = м, гг(тг+1) = г(тг+1,тг,гг(тг)), г = о,м-1. (4.11)
Замечание 3. Множество .^(тг+1, тi, Z (i)) определено при достаточно общих предположениях относительно Z(i): (тi,Z(i)) С С. Такое определение не предполагает наличия какой-либо взаимосвязи между Z (О и М. Однако, если г® = гГ(п), г = о, ж, то связь между Z (i) иМ имеется.
В самом деле, согласно определению 7, справедливо Му ^Г(т0) = (т0), а также из (4.10) следует Мш{А) С гГ(п), г = Т^У, и, значит, М[]гт{п) = гГ(п), г = В результате справедливо М У = % = 0, N.
Следовательно, выражение для Zf {ji+i,Ti, Z^), г = 0,N — 1, в (4.10) можем в случае = Zr(ri), i = 0, N — 1, скорректировать, т. е. представить в виде
Zr(Ti+i,Ti,Z^r(ri)) = МцД) U Y1r(ri+i,Ti,Z^r(ri))^(A). Сравним по включению системы множеств
{Z(Ti): Ti G Г}, {Zr(Ti): т G Г}, {Yг(тг): т G Г}, {F(t): т G Г} :
z0(t) С Zr(Ti) С Yr(Ti) С Zr(Ti), Ti G Г. '
Согласно (4.12), A-система {¿г(т): Ti G Г} мажорирует систему {Z0(t): Ti G Г}. Теперь покажем, что A-система {^г(т): Ti G Г} аппроксимирует тракт Z0, а именно, при разбиениях Г промежутка [t0, $] с диаметром А = А(Г) ^ 0 система {¿^(т*) : Ti G Г} дает в пределе Z0.
Для этого вернемся к рассмотрению двоичных разбиений Г(п) = {т0(п) = t0, т1п),..., т(п), ..., т^(П) = $}, n G N, промежутка [t0,
Пусть т* G Г(п); полагаем для простоты z(n)(T*) = Zv{n) (т*). Тогда A-система запишется в виде {Z(n)(^п)): т^ G Г(п)}.
Определение 8. Обозначим символом П0 множество всех точек
(t*,z*) = lim (tn(т*),Zn),
где {(tn(т*),zn)} — некоторая последовательность точек (tn(т*),zn) G (¿п(т*), ^(п)(£га(т*))), n G N'
Множество П0 удовлетворяет соотношениям
П0 С G, П0(т0(п)) = П0(^) = M. (4.13)
Пусть т* G [t0, $] — двоичный момент. Так как т* G Г(п) при достаточно больших n G N, то, согласно (4.12), при этих n справедливы включения
Z(n)(т*) С Z(n)(T*). (4.14)
Из определения множеств Z0, П0 и включений (4.14), имеющих место для двоичных
т* С [¿0, $], следует
Z0 С П0. (4.15)
Справедливо также обратное включение
П0 С Z0. (4.16)
Для этого доказывается, что для любой пары (т*,т *) G А* справедливо вложение П0(т*) С Z(т*,т*, П0(т*)). Это включение означает, с учетом равенства (4.13), что множество П0 есть минимаксный u-стабильный мост и, следовательно, оно удовлетворяет включению (4.16).
Из включений (4.15) и (4.16) следует, что справедливо следующее утверждение. Теорема 1. Множества Z0 и П0 совпадают.
Замечание 4. Множество Q0 представимо в виде Q0 = lim {Z(n)(т,(п)): т,(п) € Г(п)},
п^те ' '
lim Д(п) = 0; здесь lim {Я(п)(т/п)): т/п) € Г(п)} = lim Z(n) — предел в хаусдорфовой мет-
n^-те n^-те п^-те
рике последовательности {Z(n)} множеств Z(n) = (т^п), Z(n) (т^п))), n € N, содержащихся
0<i<N (n)
в G.
Принимая во внимание теорему 1 и замечание 4, получаем, что максимальный минимаксный u-стаб ильный тракт Z0 представим в виде Z0 = lim {iz(n)(ri(n)): т(п) € Г(п)}.
п^-те
Заметим, что мы трактуем A-систему {¿7(п)(т(п)): т(п) € Г(п)} как некоторое обобщение на дифференциальные игры понятия ломаной Эйлера из теории дифференциальных уравнений. А именно, многозначное отображение т м Z0(т), т € [t0 , $], мы рассматриваем как траекторию дифференциального включения (2.3), ассоциированного с дифференциальным уравнением (2.2) (управляемой системой (2.2), подверженной воздействию помехи); при этом начальной «точкой» траектории является множество Z(0) (t0) = M € comp (Rm).
При наличии очевидных аналогий между A-системами {¿?(п)(т(п)): т(п) € Г(п)} и ломаными Эйлера Z(n) (т), т € [¿0,$] (точнее — узлами ломаных Эйлера), эти две схемы аппроксимации обладают, что вполне естественно, и существенным различиями. Эти различия обусловлены особенностями динамики рассматриваемых схем и задач.
Различия проявляются на этапах получения в том и другом случаях оценок рассогласования между идеальными «траекториями» и их аппроксимациями на промежутке [t0 ,-$]. Так, если в теории обыкновенных дифференциальных уравнений и теории управляемых динамических систем, не отягощенных наличием помех, такие верхние оценки хорошо известны, то в теории антагонистических дифференциальных игр получение таких оценок осложнено наличием помех, не контролируемых игроком, решающим задачу управления (в частности, задачу о сближении). Наличие таких помех в управляемой системе привносит в схемы и алгоритмы конструирования A-систем операцию пересечения множеств, крайне неудобную с точки зрения получения оценок рассогласования между идеальными «траекториями» т м Z0(т), т € [¿0,$], и их аппроксимациями — A-системами {^(п)(т(п)): т^п) € Г(п)}.
Напомним также, что введение в схемы формирования разрешающих конструкций и алгоритмов A-систем {¿7(п)(т(п)): т(п) € Г(п)}, основанных лишь на дискретизации времени т € [¿0,$], еще не означает окончательного решения вопроса о приближенном вычислении максимального минимаксного u-стабильного тракта Z0. Временную дискретизацию необходимо дополнить пространственной дискретизацией, связанной с фазовым пространством Rm системы (2.1). Эта дискретизация может быть проведена по-разному. Например, это может быть дискретизация самого пространства Rm (в частности, пиксельное представление пространства Rm), а может быть и дискретизация множеств Z(n) (т(п)), т(п) € Г(п) в пространстве Rm, осуществляемая путем дискретизации динамики (вектограмм скоростей) управляемой системы (1.1) или соответствующего д. в. Обсуждение вопросов, касающихся пространственной дискретизации множеств ^7(п)(т(п)), т(п) € Г(п), и связанной с ними проблематики, представляет отдельную серьезную тему, составляющую предмет и содержание отдельной статьи; в настоящей работе мы не будем на этом останавливаться.
Замечание 5. Выше установлено, что
Z0 = lim {Z(n)(^n)): т(п) € Г(п)}, (4.17)
где Г(п), п € N — двоичные разбиения промежутка [¿о,
Представление (4.17) справедливо и в более общем случае разбиений Г(п) = {т0п) = ¿0, ,т?\...,т§п) = 0}, Д-га) = 7$ - г = 0,Щп)-1, Д(») = Д(Г(»))
= max Д^ промежутка |/(), г?], не являющихся двоичными разбиениями промежутка
i=0,N(n) — l
[t0,tf]; здесь lim в (4.17) определяется точно так же, как в случае последовательности двоичных разбиений Г(п).
Учитывая замечание 5, мы утверждаем, что
Z0 = lim {F(Ti), Ti G Г}.
Д=Д(Г)40
Определив в задаче 1 (в рамках общей постановки) A-систему {zr(T): т G Г}, отвечающую какому-либо разбиению Г промежутка [t0, tf ], мы тем самым определяем и аппроксимирующую систему (A-систему) {Wr(tj): tj G Г} для максимального минимаксного u-стабильного моста W0 в задаче 1 :
Wr(tj) = Zr(Ti), tj + Ti = ¿0 + tf, tj и Ti G Г.
Конструирование A-системы {Wr(tj): tj G Г} в конкретных задачах 1 составляет наиболее трудный этап (первый этап) в процедуре конструирования решений. На втором этапе (в рамках общей постановки) решения задачи 1 формируется позиционная стратегия u* (t, x) первого игрока как экстремальная стратегия к A-системе {Wr(tj): tj G Г}. Эта стратегия формируется по тому же принципу, что и позиционная стратегия первого игрока, экстремальная к мосту W0 (см. [9]). Поскольку и в конкретных задачах 1 разрешающая стратегия u*(t,x) формируется как экстремальная к A-системе {Wr(tj): tj G Г}, а не к самому мосту W0, то она обеспечивает для начальных точек x(0) G Wr(t0) приближенное решение задачи 1, т.е. обеспечивает сближение движений x[t], x[t0] = x(0), системы (1.1) на промежутке [t0,tf] с достаточно малой окрестностью целевого множества M.
§ 5. О разрешающей стратегии первого игрока в задаче 1
В этом параграфе вернемся к разрешающим конструкциям задачи 1, представленным в прямом времени t G [t0, tf].
Будем рассматривать разбиения {t0, t1,..., tj ,...,tN = tf} промежутка [t0,tf] (не обязательно двоичное), дуальные к разбиениям Г = {т0 = t0, т1;..., Ti;..., tn = tf}, то есть удовлетворяющие /:/ I тг = /0 I iJ, г \ j = N, г = 0. Лг. Для простоты будем обозначать разбиение {¿о, ¿ъ • • •, tj,..., t^ = тем же символом Г, где Aj = tj+\ — tj, j = 0,N, и А = А(Г) = max А,-.
j=0,N-l
Разбиениям Г = {t0, t1,..., tj ,...,tN = tf} отвечают множества W r(tj) = Zr(Tj), ti + n = t0 + i = 0, N. Очевидно, что = lim \Wr(ti): ti G Г}; здесь lim no-
J Д=Д(Г)|0 J J
нимается так же, как и lim в (4.13).
Как отмечалось в §2, мы изучаем задачу 1 в минимаксной постановке (см. [9-11]), т.е. в классах чистых позиционных стратегий u(t, x) первого игрока и контрстратегий v(t, x, u) второго игрока. Здесь под позиционными (чистыми) стратегиями первого игрока понимаем однозначные функции v(t,x,u) G Q, (t,x,u) G [t0,tf] x Rm x P. Обозначим (следуя [9]) для удобства стратегии и контрстратегии как U—u(t, x), V—v(t, x, u), имея в виду функции, где v(t,x,u) измерима по Борелю по переменной u.
Определим движения xUV[t], t G [t0,tf], конфликтно управляемой системы (1.1), порожденные парой (U, V). Для этого определим сначала аппроксимационные движения системы (1.1), отвечающие разбиению Г и порожденные позиционной стратегией U первого игрока и каким-либо допустимым программным управлением v(t) второго игрока — измеримой по Лебегу функцией v(t) G Q, t G [t0,tf].
Пусть заданы точка Жд € Дт и позиционная стратегия и—и(£,ж) первого игрока. Ап-проксимационным движением [¿], t € [¿0,$]» Жг[£0] = Жд, порожденным стратегией и и допустимым программным управлением V (¿), £ € [¿0, $] второго игрока, назовем вектор-функцию, удовлетворяющую равенству
= «(ijj^fij]),^^)), xu[t0] = x0 п. в. на [tj,tj+1), j = О, N — 1.
Пусть заданы точка Жд С Rm и контрстратегия V—v(t,x,u) второго игрока. Аппрок-симационным движением Жг[t], t G [t0,$], Жу[to] = Жц, порожденным контрстратегией V и допустимым программным управлением u(t) G P, t G [t0,$], первого игрока, назовем, следуя [9], вектор-функцию, удовлетворяющую равенству
Жу[t] = /(t,Xy[t],u(t),v(tj,ЖГ [tj],u(t))
Введем разбиения промежутка [t0,$], рассматриваемые в прямом времени t:
r(u) = {t0u) = to,tlu),... ,tku),... = r(v) = {t0v) = to,t ,... ,tsv),... ,tN(v) =
Считаем, что аппроксимационные движения игроков отвечают соответственно разбиениям Г(и) и r(v), которые выбираются независимо друг от друга.
Определим разбиение Г = Г(и) U r(v) = {t0, ti,..., tj ,...,tN = $} как совокупность моментов tk , tS .
Определим аппроксимационное движение ЖЦу [t], t G [t0, $], порожденное парой (U, V) и отвечающее разбиению Г. Для этого под ближайшим слева к моменту t G [t0, $] моментом разбиения r(u)(r(v)) мы понимаем момент i|u) = t(u)(t) = max{tku) G Г(и) : t^ ^ t} (¿Sv) = = t(v) (t) = max{tSv) G r(v) : tSV ^ t}).
Аппроксимационным движением ЖЦу[t], t G [t0,$], ЖЦу[t0] = Жд, порожденным парой (U, V) (позиционная стратегия, контрстратегия), назовем вектор-функцию, удовлетворяющую равенству
xи,у [t] = /(t,XU;y[t],u(t), v(t)), ЖЦу[t0] = Ж0Г п. в. на [tj,tj+i), (5.1)
где u(t) = (t),(t)]), v(t) = v{t^{t), xTuy[t^{t)],u{t)), t3 G Г, j = 0,N-1.
Из определения аппроксимационных движений ЖЦ у [t], t G [t0, $], отвечающих разбиению Г = Г(и) U r(v), следует, что каждое такое движение есть в то же время аппроксимационное движение ЖЦ[t] и Жу [t] на [t0,$] с начальной точкой xr[t0] = Жд.
Обозначим символами (t0, ), Xy(v) (t0, Жд), ХЦ у(t0, Ж0Г) пучки (то есть совокупности всевозможных аппроксимационных движений ЖЦ(и)[t], ЖУМ[t], ЖЦ у[t] на [t0,$] с начальной точкой Жг [t0] = Жд (см. [9])).
Справедливо включение
ХЦV(¿с,ЖГ) С Х^^Ж^р) XT(¿0,Ж0Г). (5.2)
Определим конструктивное движение xu,V[t], t G [t0,$], системы (1.1), порожденное парой (U, V) — позиционная стратегия, контрстратегия.
Определение 9 (см. [9]). Конструктивным движением [t], t G [t0, $], системы (1.1) с начальной точкой x(0) G Rm, порожденным парой (U, V) (позиционная стратегия, контрстратегия) назовем вектор-функцию [t], t G [t0,$], представимую в виде xU)V[t] = lim ЖЦУ [t], где |Жи(у [t]} — некоторая последовательность аппроксимационных
движений ЖЦ(у [t], t G [t0,$], удовлетворяющих lim ЖцУ [t0] = lim Жд(п) = x(0); здесь
Г(п) = riu) U riv), гПи) и riv) — разбиения промежутка [t0, $] с диаметрами дПи) | 0, Д^ | 0 при n ^ то.
Отметим, что в определении движения [t], t € [t0,$], имеется в виду равномерный предел.
В определении 9 не должно вводить в заблуждение название «конструктивное движение» [t], введенное Н. Н. Красовским и А. И. Субботиным в [9]. Это есть некоторая идеализация понятия движения управляемой системы. Функция [t], t € [t0 ,-$], не удовлетворяет, вообще говоря, какому-либо дифференциальному уравнению или дифференциальному включению, описывающему поведение системы (1.1), обусловленное стратегиями U, V игроков. Однако эта идеализация движения системы (1.1) удобна, так как позволяет в достаточно простом виде формулировать утверждения относительно разрешающих конструкций в задачах дифференциальных игр. В частности, в простом виде формулируется известная в теории дифференциальных игр альтернатива (см. [9]). Название функции [t], t € [t0,$], обусловлено тем, что она есть равномерный предел аппроксимационных движений системы (1.1), перспективных для конструирования, особенно при кусочно постоянных управлениях u(t), v(t) в соотношениях (5.1).
Аналогично определяются конструктивные движения жи[t], [t] системы (1.1) на [t0,$] как равномерные пределы последовательностей аппроксимационных движений системы (1.1), порожденных соответственно стратегиями U и V игроков.
Обозначим символами Xu(t0,x(0)), XV(t0,x(0)), (t0, ж(0)) пучки (то есть совокупности) всевозможных конструктивных движений жи[t], [t], V[t] на [t0,$].
Справедливо включение
Xu,v(t0,ж(0)) С Xu(t0,x(0)) f| Xy(^,ж(0)), (5.3)
вытекающее из (5.2) и определений пучков Xu(t0,x(0)), XV(t0, ж(0)), XU;V(t0,x(0)).
Опишем разрешающую в задаче 1 позиционную стратегию U * — u* (t, ж) первого игрока как экстремальную стратегию Ue—ue (t, ж) к максимальному минимаксному u-стабильному мосту W0. Стратегия Ue введена в работах [8,9] Н. Н. Красовского и А. И. Субботина. В этой работе мы привлекаем к описанию стратегии Ue унификационные множества F(t, ж), (t, ж, l) € G х S из работ [15,17].
Считаем, что мост W0 выделен в области G и нам (первому игроку, решающему задачу 1) известны его временные сечения W0(t) = {ж € Rm: (t,ж) € W0}, t € [t0,$].
Пусть t * € [t0,tf] и ж * / W0(t *).
Введем в рассмотрение точку w*, ближайшую к ж * в W0(t *), и векторы s * = w* — ж *,
1 * ||S|| S * € S.
Вектор l* € S мы трактуем как направление прицеливания на мост W0 (на W0(t *)) конструктивного движения ж^] системы (1.1), находящейся в точке ж^ *] = ж*.
В ситуации, когда система (1.1) находится в позиции (t *,ж *), первый игрок воображает для себя следующую локальную игровую ситуацию, отвечающую достаточно маленькому промежутку времени [t *,t *] — так называемую маленькую игру (см. [9]): он стремится выбором управления u € P сдвинуть движение ж^] на промежутке [t *, t *] из точки ж * максимально в направлении на мост W0, и в то же время второй игрок выбором контруправления (как функции) v(u) € Q, u € P, стремится обеспечить максимальный сдвиг движения ж^] на промежутке [t , t ] из точки ж в противоположном направлении.
Формально эта локальная игровая ситуация, возникшая, когда система (1.1) находится в позиции (t *,ж *), представима следующими условиями:
1) второй игрок в позиции (t , ж ), имея информационное преимущество (информацию о выборе управления u € P), формирует функцию (u) € Q, u € P, — контруправление, экстремальное в направлении вектора l * € S:
(l *,/(t*, ж*, u, v^(u))) = min (l *,/(£*,ж *,u,v(u))), u€P;
2) первый игрок в позиции (t*, x*), не исключая (и даже предусматривая) наихудшие для себя действия второго игрока, формирует управление (вектор) u1t G P, экстремальное (наилучшее для него) в направлении вектора l * G S:
(l *,f(t*,x *,u^(u^))) = max min (l *,f(t*,x *,u,v(u))) =
«eP v(«)eQ
= max min (l *,f (t *,x *,u,v)) = H (t *,x *,l *). «eP veQ
Учитывая, что управление u1t и контруправление (u), u G P, сформированы по позиции (t *,x *) / W0, будем писать u^(t *,x *), vtt(t *,x *,u).
Замечание 6. Если W0(t *) невыпукло, то для точки x* G W0(t *) может быть не одна ближайшая точка y* в W0(t *). В этом случае вектор l* — ||s * У s*, s* — y* x *, определен неоднозначно, и тогда неоднозначно определен вектор u^(t *,x *).
Принимая это во внимание, мы определяем, согласно [9], стратегию Ue—ue(t *,x *), (t *,x*) G G, как многозначную, вообще говоря, функцию ue(t *,x *) = u1t(t *,x *) G P при (t *, x*) / W0, ue(t *, x*) = P при (t *, x*) G W0.
Замечание 7. Из условий 1, 2 ясно, что важную роль при формировании экстремальной стратегии Ue первого игрока играют векторы l * G S, являющиеся направлениями экстремального сдвига движения x[t] системы (1.1). В соотношениях, входящих в условия 1, 2, присутствует гамильтониан H(t *, x *, l *) системы (1.1), введенный в § 2, с. 115. Из условий 1, 2 следует, что первый игрок в ситуации, когда система (1.1) находится в позиции (t *,x *) / W0, может выбирать управление u G P, обеспечивающее проекцию вектора f (t *,x *,u, v(u)) скоростей системы (1.1) в направлении на W0 (т.е. в направлении на l *), не меньшую, чем H(t *,x *,l *). Как покажем ниже, это влечет за собой достаточно хороший сдвиг движения x[t] системы (1.1) из x[t *] — x * в направлении на W0. Такой способ формирования управления ue(t *,x *) в каждой позиции (t *,x *) / W0 обеспечивает первому игроку достаточно хорошую близость движения x[t] системы (1.1) к мосту W0 (то есть, к его сечениям W0(t)) в случаях, когда начальная точка x[t0] — x(0) движения x[t], t G [t0,$], близка к начальному сечению W0(t0) моста W0. В большинстве конкретных игровых задач 1 точное вычисление (аналитическое описание) моста W0 невозможно из-за сложности разрешающих конструкций в этих задачах. В связи с этим мы уделяем повышенное внимание вопросам приближенного вычисления моста W0 и на первом шаге приближенных вычислений подменяем мост W0 A-системой {Wг(tj): tj G Г}, отвечающей разбиению Г промежутка [t0, $] с диаметром А — Д(Г) ^ 0.
Подменив мост W0 A-системой {Wr(tj): tj G Г}, мы приспосабливаем и позиционную экстремальную стратегию Ue первого игрока к этой ситуации подмены. Именно, мы рассматриваем теперь функцию ue(t, x) как позиционную экстремальную стратегию к системе {Wr(tj): tj G Г} множеств в Rm. Теперь экстремальная стратегия первого игрока есть функция ue(tj ,x), (tj ,x) Gr x Rm, определенная по тому же принципу экстремального прицеливания [9], что и ранее, с учетом того, что множества W0(t), t G [t0,$], замещены множествами Wr(tj), tj G Г.
Далее, привлекая унификационные отображения (t,x) м- F](t,x), l G S, покажем эффективность экстремальной стратегии Ue первого игрока при решении задачи 1.
Считаем, что множества Wr(tj) = Zy (тг), 1, It, I i) — тг,г O.N, вычислены по известным рекуррентным соотношениям (с. 125).
Покажем, что экстремальная к A-системе {Wr(tj),tj G Г} позиционная стратегия Ue первого игрока удерживает любое движение xrJUe [t] G ХЦ^(t0, жг), t G [t0, $], вблизи A-систе-мы {Wr(tj): tj G Г} при условии, что начальная точка этого движения близка к начальному множеству Xr(t0) этой A-системы. При этом выведем пошаговые (по шагам [tj, tj+1], j = 0, N — 1) локальные оценки отклонения движения в моменты tj G Г, j = 1, N,
от множеств Wr(tj) и воспользуемся ими при выводе оценки отклонения движения xJUe [t],
хЦе [t0] = ;Tq от множеств Wr(tj) в моменты tj. Эти оценки проведем по схеме из монографии [9, § 57, с. 248-254], с той особенностью, что привлечем унификационные отображения (t,x) ^ F(t,x), l G S.
Выписанное выше включение ЖЦе[t] G ХЦ'е(t0,Жг), t G [t0,$], означает, что функция ЖЦе[t], t G [t0,$], принадлежит пучку ХЦе(t0,Xg).
Начнем вывод пошаговых локальных оценок с рассмотрения промежутка [т*,т *] разбиения Г (т* и т* — соседние моменты из Г, записанного в обратном времени т, где t0 ^ т* ^ т * ^ 0, А * = т * — т* ^ А = Д(Г)).
Справедливы соотношения
^г(т*) = ^(т*, т*, Жг(т*)) = П Ж(т*, т*, ^г(т*)),
les
^г(т *, т*, ^г(т*)) = Мцд)Ц(Уг(т *, т*, ^ Жг(т*))„(Д.)).
Следовательно, справедливо равенство
Y Г(т *,т*,^и^Жг(т* ))^(Дф ) = уг(т *,т*,^г(т* ))^(Дф ) = g (Уг(т *,т*,г*
где
Угг(т*, т*, z* )^(Д,) = z* + А * H (т*, z* ) + ^(Д *)B *, B * = B(0,1) G Rm.
Снова вернемся к разбиению Г, записанному в прямом времени t. Обозначим через t * = t0 + $ — т * и t * = t0 + $ — т* соседние моменты разбиения Г, для которых t * — t * = = т — т = А .
Согласно определению A-системы {Wr(tj): tj G Г}, справедливо Wr(t *) = ¿г(т*) и, значит,
w r(t * ) = р| zr(t0+#—t *,t0+#—t *,w r(t * )) =
les
= П i Мцд, ^ U (w * — А * F (t *, w * ) + ^(Д *)B * Л = Мцд,) U i p| Г U (w * — А * F (t *, w * ) + ^(Д *)B * Л j ;
здесь обозначено w = z .
Пусть w * — произвольная точка из Wr(t * ). Для нее справедливо
w* G Мцд,) или w* gQÎ U (w * — А * F (t *,w* )+ ^(А *)B * )j .
1eS ™,ewr(t*)
Первое из этих двух включений указывает на ясную связь точки w и множества М: точка w близка к М.
Установим, какие следствия можно извлечь для точки w * из второго включения. Это включение означает, что для любого l G S найдется точка w * G Wr(t * ), удовлетворяющая
w * G w * — А * F (t *, w * )+ ^(А *)B *. (5.4)
Справедливо неравенство
ВД(г*,ад* ),Я(г *,ш *)) ^ ш * ((г * - г *) + ||ш * - ш* II),
вытекающее из равномерной непрерывности отображения (г,ад,/) м- ^(г,ад) на компакте С х 5 и определения функции ш* (р), р > 0 (с. 116).
Кроме того, из (5.3) следует ад * = ад * - А */ + ^(Д*)Ь *, где / € ^(г*, ад *), Ь* € В *. Учитывая также включение ^г(г*, ад *) С В(0, К), получаем ||/г|| ^ К, ||Ь* || ^ 1 и, значит, ||ад* — ад *|| ^ КА * + ^(А *), где К определено на с. 115. Отсюда следует оценка
ад (г *, ад * ),^(г *, ад *)) ^ ш * ((1 + К )А *+ ^(А *)). (5.5)
Из оценок (5.4), (5.5) следует включение
ад * С ад * + А * Я (г *, ад *)+ ^(А *)В * С (ад * + А * ^(г *,ад *)) + + А * ш * ((1 + К )А * + ^(А *))В * + ^(А *)В*.
Введем в рассмотрение положительную функцию а(р) = рш *((1 + К)р + ^(р)) + ^(р), р > 0. Согласно определению, р-1 ■ а(р) ^ 0 при р ^ 0.
Обозначив Хгг(г *,г*,ад *) = (ад * + А *^(г *,ад *)) + а(А *)В *, получаем
ад * € ХГ(г *,г *, ад *).
Учитывая также ад * € ЖГ(г *), получаем, что из включения
ш *€р|( У (ш * - А * Я (г *, ад *)+ ^(А *)В *))
следует неравенство
Хг(г *,г *,ш * )р| ж Г(г * ) = 0. (5.6)
Неравенство (5.6) верно при любом / € 5.
В итоге рассмотрения второго включения для точки ад * получаем, что для любой точки ад * € Шг(г*) справедливо
ш* € Мцд.) или ЖГ(г*)р|ХГ(г*,г*,ш*) = 0, / € 5.
Принимая во внимание это утверждение, продолжим рассуждения, относящиеся к промежутку [г *, г *] разбиения Г. Рассмотрим подробнее движения жЩе[г] € ХЦ^(го, х£), г € [г0, $], порожденные экстремальной стратегией [7е первого игрока: сначала изучим их на промежутке [г , г ].
Пусть [г *] = х* / ЖГ(г *). Полагаем ^ * = ад* - х* = 0, / * = ||з *||-1з * € 5, где ад* — ближайшая в Жг(г *) точка к х *. Обозначим для простоты жГ[г] = жЦе[г], г € [г *,г*].
Считаем, что движение жГ[г], г € [г *, г *], порождено, наряду со стратегией [7е, некоторым допустимым управлением ■и(г), г € [г *,г*], второго игрока. Справедливо представление
г **
жг[г*] = х* + / /(г,жГ[г],ме(г*,х*),^(г))^г. (5.7)
Л*
(5.8)
Учитывая определение функции ш (р), р > 0, при г [г , г ] имеем
||/(г,жг[г],ие(г *,х * ),^(г)) - / (г *,х *,ие(г *,х * ),а(г))|| ^ ш * ((г - г *) + ||жГ[г] - х * ||) ^
г ^
^ ш * (А * + / ||/(г,жГ[г],ие(г *,х * ),^(г))|| ¿г) ^ ш * ((1 + К )А *). Л*
Из (5.7), (5.8) следует включение
Г t*
жГ[г*] € х * +/ /(г*,х*,ие(г*,х*),^(г))¿г + ш(А*)в*, (5.9)
Л*
где функция ш(р), р > 0, определена на с. 116.
Относительно точки ш * возможны два варианта:
1) точка ш * — ближайшая в Мш(д*) к х *;
2) точка ш * — ближайшая в ^^ (ш* - А *^¿(г *,ш*) + ^(А *)В *к х *.
В случае реализации варианта 1 имеет место включение жг[г *] = х * € М + ш(А *)В *,
т. е.
р(жГ[г *],М) ^ ш(А*). (5.10)
В случае реализации варианта 2 справедливо, как установлено выше, соотношение (5.6). Итак, пусть относительно ш* реализовался вариант 2. В этом случае для упрощения
1 Г
выкладок введем вектор /е = —— / /(¿*, ж*, г/.е(£*, ж*), г>(£)) сИ.
А * Л*
Включение (5.9) примет вид жГ[г *] € х * + А */е + ш(А *)В * и, значит, жГ[г *] = х * + А */е + + ш(А *)Ь*, где Ь* € В *.
Выберем некоторую точку ш* € Х^(г *,г*,ш*) П ЖГ(г *). Так как ш* € ХС^(г *,г*,ш*), то ш* = ш* + А */* + а(А *)д*, где /* € (г *,ш*), д* € В *. Справедливо равенство
||ш* - С [г *]||2 = ||(ш* + А */* + а(А *)д*) - (х * + А */е + ш(А *)Ь*)||2 = = ||(ш* - х *) + А *(/* - /е) + (а(А *)д* - ш(А *)Ь *)||2 = = ||ш* - х*||2 + 2(ш* - х *, /* - /е) + 7(А *),
где введена функция 7(р) = ||/* - /е||2р2 + 2(ш* - х*, а(р)д* - ш(р)Ь*) + 2(/* - /е, а(р)д* -- ш(р)Ь *) + ||а(р)д* - ш(р)Ь* ||2, р > 0.
Функция 7(р) не обязательно положительна на (0, то). Введем неотрицательную функцию 7(р) = |7(р)1, р > 0. Имеет место оценка
||ш* - Жг[г*]||2 ^ ||ш* - х*||2 + 2А*(ш* - х*,/* - /е) + 7(А *).
Рассмотрим подробнее величину 7(р), р > 0. Из определения входящих в эту величину компонентов (т.е. точек ш*, х *, векторов /*, /е, д*, Ь * и величин а(р), ш(р), р > 0) следует, что существует положительная функция £(р), р > 0 (£(р) ■ р-1 ^ 0 при р ^ 0), не зависящая от выбора моментов г *, г * разбиения Г и ш*, х *, /*, /е, д*, Ь*, удовлетворяющая неравенству 7(р) ^ £(р), р > 0.
Тогда справедлива оценка
||ш * - ЖГ [г * ]||2 ^ ||ш* - х * ||2 + 2А * (ш* - х *,/* - /е) + £ (А *). (5.11)
Векторы /* и /е, входящие в правую часть оценки (5.11), удовлетворяют неравенствам
1 Г*
(I*, /*) ^ Н(и, ж*, /*), (¿*,/е) = -г- / (I*,/(¿*, ж*, ж*), ^
Д * Л*
1 Г*
Д * Л*
Учитывая эти неравенства, запишем (5.11) в виде
||и* - 5Г[£*]||2 ^ ||**||2 + 2Д *(**, /* - Л + £(Д *) ^ ^ ||в*||2 + 2Д *||в*||(н(¿*,ш*,/*) - н(¿*,х*,/*)) + £(Д*).
Поскольку, согласно условию A, правая часть системы (1.1) — вектор-функция /(¿,х, м^) липшицева по переменной х с константой Ь = Ь(С) € (0, то), то
Н(¿*,и*,/*) — Н(¿*,х*,/*) ^ Ь||
и * х * 11.
Принимая во внимание это неравенство, получаем
||и* - 5Г[£*]||2 ^ ||**||2 + 2Д *Ь||* *||2 + £(Д *)
и, значит,
||и* - *]||2 ^ е2ЬА* ||**||2 + £(Д *). (5.12)
Из оценки (5.12) следует
р(5Г[£*],ШГ(£*))2 ^ е2ЬА* ||**||2 + £(Д*); (5.13)
здесь р(х, Ш) — расстояние от точки х до Ш, так что
||* * || = р(х *,ШГ(£*)) = р(5Г[£* ],ШГ(£*)).
Считаем теперь, что и * — ближайшая в ШГ(£ *) точка к х * = жГ[£ * ]. Не нарушая общности рассуждений, считаем также, что х* / Ш Г(£*) и, следовательно, 5 * = и * - х * = 0. Оценку (5.12) запишем в виде
||5* ||2 ^ е2ЬА* ||5* ||2 + £(Д *). (5.14)
Далее, рассмотрим промежуток [£ *,£ * * ] разбиения Г, следующий за промежутком [£ *,£ * ], и отвечающий ему участок хсГ[£], £ € [£ *,£ * * ], движения жЦ- е [¿] € ХЦе (¿0,5^). Обозначим через и * * ближайшую в Ш Г(£ * *) точку к х * * = жГ [£ * * ].
Также считаем, что х * * / Ш Г(£ * *) и, значит, 5 * * = и * * - х * * = 0. По аналогии с (5.14) выполняется
||5**||2 ^ е2ЬА* ||в*||2 + £(Д *), где Д * = ¿**- £ *. (5.15)
Из (5.14), (5.15) получаем
I***||2 ^ е2ЬА*(е2ЬА*||* *||2 + £(Д *)) + £(Д *) = е2Ь(А*+А*)||* *||2 + е2ЬА*£(Д *) + £(Д *).
Рассмотрев промежуток [£ * *,£ * * * ] разбиения Г(£ * * * - £ * * = Д * *), следующий за промежутком [£ *,£ * *], и обозначив через и * * * ближайшую в Ш Г(£ * * *) точку к точке х * * * = жГ[£ * * *] — движения 5Г[£] = жЦ-е [¿] € X Г(£0,жГ), а также полагая * * * * = и * * * - х * * *, получаем
||s * * *||2 ^ e2LA» ||s * *||2 + £ (Д * *) ^ e2LA» (e2L(A» +A)||s * ||2 +
+ e2LA* £ (Д *) + £ (Д *)) + £ (Д * *) = e2L(A*+A*+A" )|s * ||2 + + e2L(A*+Att)£(Д*) + e2LA"£(Д*) + £(Д* *) ^
^ e2L(A* +A»)(|s* ||2 + (£(Д*) + £(Д*) + £(Д* *)).
Предыдущие оценки сверху величин ||s*||, ||s**||, ||s**||2 легко обобщаются на оценку сверху величины p(xr[tk], Wr(tk))2 — квадрата отклонения точки xr[tk], к = 1, N, движения Хг[t] G ХЦе(t0,X,°), t G [¿о, $], от множества Wr(tk).
Действительно, примем теперь, что промежуток [t *,t *] разбиения Г, упомянутый выше, это — начальный промежуток [t0,ti] разбиения Г, так что t * = t0 и x* = Xr[t0] = Х°° — начальная точка движения Xr[t] G ХЦе(t0,X,°), порожденного на [t0, $] стратегией Ue и каким-либо допустимым управлением v(t), t G [t0,$], второго игрока.
Введем обозначения: к = 0,N, — ближайшая в Wr(tk) точка к X^ = xr[tk],
s(k) = w(k) - X(k), Д(й-1) = tk - tk-1.
При таких обозначениях имеем Х(0) = x *, w(0) = w*, s(0) = s *; X1 = x *, w(1) = w*, s(1) = s *; X2 = X**, w(2) = w **, s(2) = s **; X3 = x * **, w(3) = w * **, s(3) = s * **.
Принимая во внимание эти равенства и обобщая предыдущие оценки сверху величин ||s*||2, ||s**||2, ||s***||2, получаем при к = 1, N оценку
k-1
||s(k) ||2 ^ e2L(tk —to) (||s(0) ||2 + £(Д(^)) ^ e2L(tk-to)(||s(0) ||2 + (tfc - t0)£*(Д(Г))); (5.16)
j=0
здесь функция £ * (р) = р-1£(р) | 0 при р | 0.
В частности, справедлива оценка
||s(N)||2 ^ e2L(^-i0)(|s(0)||2 + - t0))£*(Д(Г)). (5.17)
Отметим, что оценки (5.16), (5.17) справедливы не только в случае s(0) = w(0) - Х(0) = = w(0) - Хг[t0] = 0, но и в случае s(0) = 0.
Рассмотрим теперь произвольное движение хЦе[t] G ХЦе(t0,x(0)) на промежутке [t0, $], так что имеет место x^e[t0] = x(0). Согласно определению, функция x^е[t], t G [t0, $], представима в виде равномерного предела lim Xo(n) [t], Xo(n) [t] = Xj^ [t] G ХЦе (t0 ,X°(n));
здесь {Г(п)} — некоторая последовательность разбиений Г(п) = {t(n) = t0,t1n),... ,tjn),..., t(NL = с диаметрами Д(п) = Д(Г(п)) | 0, n ^ то; lim Xo(n) [t0] = lim ХГ(п) = x(0).
( (n) га^те га^те
Учитывая lim
ХГ(П) G W0(t0) = lim Wo(n) (t0), получаем
га^те га^те
lim р(ХГ(п) ,Wo(n) (t0)) = 0.
движение x [t] G ХЦе™ (t0,xr), t G [t0, $], удовлетворяет на каждом промежутке [t *,t *]
Выше установлено, что каждое движение хг [¿] = хЦе[¿] Е ХЦе(¿0,Хд) и, в том числе, Хг(п) [¿] Е Х^П)1 разбиения Г(Г(п)) хотя бы одной из оценок (5.10), (5.13).
Наличие этих двух оценок обуславливает для последовательности {Хг(п) [¿]}, £ Е [¿0, $], возможность ограничиться рассмотрением лишь двух вариантов:
Вариант! В {хг{п)Щ}, I Е \1ц. >)\, найдется такая подпоследовательность {.г1"'''|/|}, что
для каждого движения Хг(к) [¿], [¿0, $], найдется момент ¿к = ¿¿(к) Е Г(к) и удовлетворяющий
р(Хг(к)[¿к],м) ^ *(Д$)) ^ ^(Д(к)); (5.18)
здесь Д^ = - ^ = 0, М(к) - 1.
Вариант II. В {хт{п)\Ь}}, I Е |/(). найдется такая подпоследовательность {.7''' ' |/|},
£ Е [¿о,0], чт0 Ддя каждого хг{п)Щ, £ Е [¿о,0], и каждого Е \,Ы(к) справедлива оценка вида (5.16):
р(5Г(к) [¿<к) ], Ш^))2 ^ е2^к)^(р^Г), Ш(к)(£о))2 + (¿Г - ¿о)£(Д(к)) и, в частности, оценка
р(5Г(к)[0], М)2 = р(5Г(к)[0], ШГ(к)(0))2 ^ 5Г(к) Г(к)(¿о)2 + (0 - ¿0
Таким образом, можем утверждать, не ограничивая общности рассуждений, что
^ е2^-^) (р(х'Г^', (¿о)2 + (0 - ¿о)£*(Д(к))). (5.19)
а) в случае реализации варианта I в |жГ(п)}, £ € [¿о,0], найдется подпоследовательность
¿к} (¿к ^ ся (5.18) и, следовательно, хЦе[¿] = Иш хГ(к) [¿к] € М;
к^-те
б) в случае реализации варианта II в |ж(Г(к)[¿]}, ¿ € [¿о,0], найдется такая подпоследо-
"л ( к ) --^-т1 ( к )
вательность {хГ [¿], что для каждого хГ [¿], ^ € [¿о,0], справедлива оценка (5.19), из которой, учитывая Иш р(5Г(к), ШГ(к)(¿о)) = р(х(о), Ш^(¿о)) = 0 и Иш £ *(Д(к)) =
к^-те к^-те
= 0, получаем хЦе [0] € М.
Вместе с тем мы установили, что для любой начальной позиции (¿о,х(о)) € Шо системы (1.1) любое движение хЦе[¿] € ХЦе(¿о,х(о)), ^ € [¿о,0], удовлетворяет включению хЦе[^ *] € М при некотором ^ * € [¿о,0].
Согласно включению (5.3), для любой контрстратегии V второго игрока справедливо
Хц е,у (¿о,х(о) ) С Хц е (¿о,х(о) ).
В итоге, справедливо следующее утверждение.
Теорема 2. Пусть конфликтно управляемая система (1.1) удовлетворяет условиям А, В, С, Б. Тогда для любой начальной позиции (¿о ,х(о)) € Шо системы (1.1) разрешима задача 1 о сближении системы (1.1) с множеством М € сошр (Дт), удовлетворяющим условию Е. А именно, любое конструктивное движение х^] = хЦе у [¿], (¿о,х[^о]) = (¿о,х(о)) € Шо, системы (1.1), порожденное экстремальной к мосту Шо позиционной стратегией ие-^^х) первого игрока и любой контрстратегией V-(¿,х, и) второго игрока, удовлетворяет включению х^ *] € М при некотором ^ * € [¿о ,0].
§ 6. Разрешающая процедура управления с поводырем в задаче 1
В предыдущем пункте рассмотрен вопрос применения позиционной стратегии [7е первого игрока для решения задачи 1. Установлен принципиальный факт, состоящий в том, что при определенных неограничительных условиях на конфликтно управляемую систему (1.1) и целевое множество М любое конструктивное движение х[^] = хЦе у [¿], (¿о,х[^о]) = (¿о,х(о)) € Шо, системы (1.1) удовлетворяет включению х^*] € М в некоторый момент ^ * € [¿о, 0].
При обосновании этого факта сначала были введены и изучались аппроксимационные движения (А-движения) 5Г[¿] = жЦе у [¿], ^ € [¿о,0], системы (1.1) с начальными точками ^[¿с)] = близкими к начальному множеству ШГ(^о) А-системы {Ш): € Г} в Дт, отвечающей некоторому разбиению Г = {¿о, ¿ь ..., ,..., ¿^ = 0} промежутка [¿о, 0].
{¿к} (¿к € Г(к), к € М), сходящаяся к некоторому £ € [¿о,0], для которой выполняет-
Были получены оценки сверху отклонения A-движения [t] = жиe V [t] от целевого множества M, объединенного с A-системой {Wr(tj): tj £ Г}, в зависимости от отклонения начальной точки :rr[to] от начального множества Wr[to] A-системы {Wr(tj): tj £ Г} и диаметра Д(Г) разбиения Г.
При выводе этих оценок предполагалось, что экстремальные управления ue(tj,xr[tj]), tj £ Г, — реализации экстремальной позиционной стратегии ue первого игрока в моменты tj £ Г в дискретных (по времени) схемах управления, порождающих движение ;r[t] на [to,0], вычислялись на основе точной информации о реализующихся в моменты tj £ Г состояниях xr[tj] системы (1.1).
Заметим, однако, что в конкретных задачах конфликтного управления типа задачи 1 информация о реализующихся состояниях xr[tj] может доставляться первому игроку не точно, а с некоторой погрешностью в виде точки yr[tj] = жг [tj] + [tj], где погрешность &rr[tj] может быть невелика. Тем не менее, наличие этой погрешности, накапливающейся в процессе управления системой (1.1) на всем промежутке [to,0], может существенно сказаться на результате управления: может значительно увеличиться отклонение A-движения ;rr[t] от объединения множества M и A-системы {Wr(tj): tj £ Г}. Это свойство позиционного управления Ue связано с определенной неустойчивостью функции Ue(tj ,xr[tj]) по отношению к неточности текущего состояния [tj], tj £ Г, а именно, функция Ue(tj, жг [tj]) разрывна по переменной жг [tj].
Факт неустойчивого экстремального управления Ue(tj ,xr[tj]) по отношению к неточности поступающей информации от жг[tj]) был отмечен ранее в монографии [9] Н.Н. Красов-ского и А. И. Субботина. В связи с этим, в дополнение к методу экстремального прицеливания движения системы (1.1), они предложили позиционный метод управления с поводырем первого игрока.
Основу метода управления с поводырем первого игрока составляет тот факт, что наряду с управляемой системой (1.1) имеется вспомогательная динамическая система-поводырь — виртуальная система, динамика которой копирует динамику системы (1.1). Эта модельная система находится полностью в распоряжении первого игрока: ее движение формируется первым игроком в параллель с движением системы (1.1) и привлекается для конструирования разрешающего управления первого игрока в системе (1.1) на [to,0].
Дадим здесь описание процедуры управления с поводырем первого игрока в задаче 1.
Замечание 8. В определении движения гЖг [t], t £ [to, поводыря участвуют бесконечно малые положительные величины-функции а(р) ^ 0, ш(р) 0 при р ^ 0, а также несколько ниже для вывода некоторых оценок привлечена функция p* (р) ^ 0 при р ^ 0.
Считаем, что движение wr[t], t £ [to , 0], поводыря, отвечающее разбиению Г, описывается на каждом полуинтервале [tj, tj+1) разбиения Г дифференциальным включением
wr[t] £F}n(tj>r[tj])CT(Aj) (6.1)
с постоянной правой частью и начальным значением wr[tj]; здесь вектор /[tj] £ S мы конкретизируем ниже.
Движение wr[t] на каждом промежутке [tj, tj+1] мы определяем как аффинную функцию времени t, отвечающую некоторому вектору из F}[tj] (tj ,wr[tj])ст(д). В связи с этим будем фактически представлять движение wr[t] на [to, 0] конечным набором узловых точек wr[tj],
tj £ г.
Опишем правило формирования движения u>r[tj] поводыря на [to,0].
Точки wr[tj], tj £ Г, поводыря определяются рекуррентно по шагам [tj ,tj+1] разбиения Г.
Полагаем wr[to] = Wq — начальная точка движения wr[t], t £ [to,0], удовлетворяющая Чг £ Wr(to).
Пусть теперь ¿з- — произвольный момент из Г, где ] < N и уже определена точка ) € ).
Для ] выполняется
^] € Мцд.) или Ж^+О р|,]) = 0. (6.2)
В случае, если гуг[^] € Мцд.), считаем, что поводырь иг[£] приблизился в момент ¿з- € Г достаточно близко к М. В этом случае продолжаем конструирование точек йг[¿^+1], иг[¿3+2] и т. д. в соответствии с дифференциальным включением (6.1).
В случае, если и>г [¿3] удовлетворяет второму из соотношений (6.2), определяем следующую точку иг [¿3+1] поводыря из условия
здесь ](¿3+1Л-]) = ] + Д3](¿3]) + а(Д3)В*.
Вместе с тем считаем, что так, пользуясь рекуррентными соотношениями, мы определим точки иг[£3], ¿3 € Г, — «узлы» движения гуг[£], £ € [¿0,$], поводыря.
Определив правило конструирования точек гуг[£3], ¿3 € Г, поводыря, приступим к описанию самой процедуры управления с поводырем первого игрока. Эта процедура вплетена фактически в определение А-движения системы (1.1), которое приведено ниже.
Введем некоторые обозначения.
Пусть (¿,х) € С. Полагаем
Я(¿, х, и) = со {/(¿, х, и, V): V € ф}, и € Р;
Ц]^](*,ж) = {и^.] € Р: ]'/(¿>ж>«г[*,-]>^)> = Н(¿,х,])}.
Пусть задана начальная точка хг[£0] = ж0 системы (1.1) и вычислена А-система
з): ¿з
{Жг(^): ¿з € Г}.
Определение 10. Аппроксимационным движением (А-движением) системы (1.1), порожденным позиционной процедурой управления с поводырем первого игрока, выходящим в момент ¿0 из точки хг [¿0] = хг, назовем абсолютно-непрерывную вектор-функцию жг[£], Ь € [¿0,$], удовлетворяющую на каждом полуинтервале [¿3, ¿3+1) разбиения Г почти всюду дифференциальному включению
х € Я(^х,^.])
с начальным значением хг[£3]; здесь
] € ](3,жг[з]);
¿[¿з ]
^зГ1^], если ^] = 0,
произвольный I € если зг[£3] = 0;
з1 [¿з ] = [¿з ] - X1 [¿з ];
и? [¿з ], ¿з € Г, — точка поводыря гуг[£], вычисленная на предыдущем промежутке [¿з] разбиения Г, где гуг[£0] = иг — ближайшая в Шг(£0) к хг[£0] = хг, такая, что ||вг[^0]N = 1|Хо - «О = Р(Хгг(^)).
Следует отметить, что процедура управления с поводырем, представленная в определении 10 и отвечающая разбиению Г, решает задачу 1 приближенно, т.е. приводит А-дви-жения Х5г[£], £ € [£0,0], системы (1.1) на множество М на промежутке [£0,0] с некоторой погрешностью. Эта погрешность зависит от расстояния р(жг[£0], Шг(£0)) = ||зг[£0]|| и диаметра Д(Г) разбиения Г.
Учитывая эту особенность А-движений жг[£], зафиксируем некоторое е > 0, имеющее смысл погрешности, упомянутой выше, и рассмотрим вместо задачи 1 о сближении системы (1.1) с М задачу об е-сближении А-движений жг[£], £ € [£0,0], системы (1.1) с М на промежутке [£0,0]: применяя к системе (1.1) процедуру управления с поводырем первого игрока, обеспечить для А-движений 5г[£], 5г[£0] = выполнение неравенства в некоторые моменты £ * € [£0, 0].
В случае, если в процессе реализации процедуры управления с поводырем первого игрока оказалось при некотором j ^ N — 1, что точки /г1'|/.,,|, </ £ 0. у, удовлетворяют второму из соотношений (6.2), а точка +1] удовлетворяет первому из соотношений (6.2), то
р(55г[^+1], М) ^ ||5г[£^+1] - +1]|| + р(^г[£^-+1], М) ^ (б з)
^ е^-4о(||вг[<ь] Г + (0 " *>ЫД(Г)))*+ и(А3).
Если же в процессе реализации процедуры управления с поводырем первого игрока оказалось, что точки ъй{1д], д € 0, N — 1, удовлетворяют второму из соотношений (6.2), то
р(5г[^],М) = р(^], )) ^
1 (6.4)
поскольку Ш) = М.
Допустим теперь, что начальная точка 5г[£0] = А-движения 5г[£], £ € [£0,0], поводыря и диаметр Д(Г) разбиения Г удовлетворяют неравенству
еь(^о)(ЦзГМ|2 + (0 - *ьЫД(Г)))* + с(Д(Г)) ^ е.
Тогда из (6.3), (6.4) следует, что любое такое А-движение 5г[£], £ € [£0,0], системы (1.1) удовлетворяет в некоторый момент ¿* = д € 0, X, включению
5г[£ * ] € Ме.
Таким образом, неравенство
(р(4, Жг(^о))2 + (0 - ¿о)^(Д(Г)))^ + а;(Д(Г)) ^ е~ь^е (6.5)
есть достаточное условие, при котором из начальных точек 5г [£0] = позиционная процедура управления с поводырем первого игрока обеспечивает для А-движений 5г[£], £ € [£0,0], решение задачи об е-сближении с М на промежутке [£0, 0].
Выше мы для конфликтно управляемой системы (1.1) общего вида описали позиционную процедуру управления с поводырем первого игрока в задаче 1, обеспечивающую при выполнении неравенства (6.5) решение задачи об е-сближении А-движений Х5г[£], £ € [£0,0], с целевым множеством М на промежутке [£0,0].
Теперь мы рассмотрим конфликтно управляемую систему (1.1) более частного вида с правой частью, распадающейся по управлениям и и V игроков:
^ = ¡{1)(1,х,и) + (6.6)
г € [¿0,0], х € Ят, и € Р, V € ф.
Для этой системы игровая задача 1 о сближении в минимаксной постановке вырождается в игровую задачу о сближении с М в классе чистых позиционных стратегий и—х), V—^(¿,х) игроков. Для нее мы конкретизируем определение А-движения х°[г], г € [¿0,0], порожденного позиционной процедурой управления с поводырем первого игрока.
Для этого для системы (1.1) уточним некоторые обозначения, введеные ранее для определения А-движения х° [¿], г € [¿0,0].
Итак, пусть (¿,х) € С. Полагаем:
, х) = со {/(2) (¿, х, V): V € ф};
Я(¿, х, и) = /(1)(Ь, х, и) + Я(2)(г, х), и € Р;
Н(1)(г
, х, ¿) = тах (¿,/(1)(¿,х,и)>, I € 5;
Н(2)(г
, х, ¿) = тт(/, /(2)(¿, х, v)>;
Н(¿,х,1) = Н(1)(¿, х, ¿) + Н(2)(г,х,1);
Н(¿,х) = {и] € Р: (¿,/(1)(г,х,иг)> = Н«(¿,х,/)}.
Считаем, что уже вычислена А-система {Жг(гз-): € Г} С Ят, отвечающая разбиению Г = {¿0, ¿1,..., ¿з,..., ¿м = 0} промежутка [¿0,0], где Жг(0) = М.
Для системы (6.6) так же, как и для более общей системы (1.1), мы рассматриваем задачу об е-сближении А-движения хг[¿], хг[¿0] = жг, с множеством М на промежутке [¿0,0].
Итак, считая, что задана начальная точка жг[г0] = х° А-движения х°[г], определяем начальную точку гХГ[Ь0] движения г«г[г] поводыря как ближайшую в ШГ(Ь0) к хг [¿0]:
р^]^ г(^0)) = 11 хгг [¿0 ] — ^[¿0 ]||.
Определяем векторы
вг[*0] = ^[¿0 ] — £г[г0 ];
¿[¿0] Г ||*ГМ1-1^0], если ^[¿0] = 0,
1 произвольный I € $, если зг[г0] = 0;
игы е и1Ы{и,хт[и]) = {йЕР: [1[и],!Ц0,хт[и],и)) = Н^Цо^илт.
В качестве управления первого игрока на промежутке [¿0, ¿1) разбиения Г получаем постоянную вектор-функцию и(0)(Ь) = и(0) = иад.
Пусть второй игрок выбрал произвольное допустимое управление v(0)(¿) € ф на [¿^¿а). Будем считать, что v(0)(í) также есть постоянная вектор-функция на [Ь^^): v(0)(í) = v(0).
Начальная точка хг[г0] = жг А-движения жг[г] системы (6.6) и пара управлений (и(0)(г)У0)(г)) определяют А-движение хг[г] системы (6.6) на начальном промежутке [¿0, ¿1) разбиения Г, удовлетворяющее
[г] = /(1)(г,хГ[г],и(0)) + /(2)(г,£Г[г]У0)) € я(г,хг[г],и(0)). (6.7)
Считая, что диаметр Д(Г) разбиения Г мал, и, следовательно, мала величина Д0 = = ¿1 — Ь0, мы получаем, что значения /(1)(г,хГ[г],и(0)) и /(2)(г, х°[г], v(0)) на [¿0,г1) близки к /(1)(Ь0,хг[г0],и(0)) и /(2)(Ь,хг[г],v(0)). Учитывая это, мы подменяем дифференциальное уравнение (6.7) близким ему дифференциальным уравнением
[г] = /(1)(¿0,хГ,и(0)) + /(2)(г0,£ГУ0)), г € МО, (6.8)
с постоянной правой частью.
В результате этой подмены получаем решение уравнения (6.8)
5г[£] = 4 + (£ - *,)(/(1)(£0,5г,и(0)) + /(2)(£0,5г, v(0)))
— аффинную вектор-функцию, представляющую А-движение системы (6.6) на [£0,£1 ] с конечной точкой 5г[£1] = + Д0(/(1)(£0, ^о, и(0)) + /(2)(£0, v(0))). Для точки г5г[£0] поводыря выполняется
[¿0] € МцДо) или Шг(^) р| Х^^Л^о]) = 0- (6.9)
Учитывая (6.9), мы вычисляем, в соответствии с определением 10 А-движения 5г[£], точку г5г[£1] поводыря. Далее, зная точки Х5г[£1], г5г[£1], вычисляем в соответствии с определением 10 последовательно пары {хг\Ьд}, д € 2, X; при этом участки хгЩ, Ь € ¿5+1], д € 1, X — 1, определяются дифференциальными уравнениями вида (6.8) с постоянной правой частью
55г[£] = /(1)(^,55г[^],и(^)) + /(2)(^ДЧУУ^), £ € [^Л+1];
здесь векторы и(?) € Р и v(q) € ^ — управления игроков на [^ ,£д+1) выбираются в Р и ^ в соответствии с определением 10.
Конечные точки 5г [£д+1] участков Х5г[£], £ € ,£д+1], определяются равенством
5г[£д+1] = + Дд (/(1)(£д ,5г[£д ],и(9)) + / (2)(^ ,5г[У, v(q))). (6.10)
В результате имеем, что А-движения 5г[£] на [£0,0] являются ломаными Эйлера, узловые точки 5г[£д] которых описывается рекуррентными соотношениями (6.10).
Предположим теперь, что начальные точки 5:г[£0] = А-движений 5г[£], £ € [£0,0], управляемой системы (6.6) настолько близки к Шг(£0) и диаметр Д(Г) настолько мал, что выполняется (6.5), то тогда для таких А-движений имеет место попадание на М£ в некоторый момент £ * = € Г.
Замечание 9. В замечании 7 были упомянуты бесконечно малые величины — функции а(р), ш(р) и р(р), р > 0, участвующие в определении движения гог[£], £ € [£0,$], поводыря и оценках отклонения А-движений Х5г[£], £ € [£о,$], от объединения целевого множества М и А-системы (Шг(tj): tj € Г} на промежутке [£о, $]• Однако, эти функции можно выписать лишь в простейших конкретных задачах 1 (т. е. в задачах 1, в которых системы (1.1) имеет простую динамику, а множество М — простую геометрическую структуру). В связи с этим, в конкретных задачах 1, в которых управляемая система (1.1) имеет непростую динамику, а множество М — непростую геометрию, мы вынуждены или подменять малые величины a(Aj) и w(Aj), tj € Г, малыми константами, или пренебрегать этими величинами. Так, например, в конкретных задачах 1 при определении движения гог[£], £ € [£о, #], поводыря мы подменяем дифференциальное включение (6.1) дифференциальным вклю-
„г
константа.
чением w [t] € F^ ](tj, йт [tj])ст, где а ^ 0 — малая
В связи с этим, для успешного решения задачи об е-сближении управляемой системы (1.1) мы вынуждены несколько увеличить возможности первого игрока в управлении системой (1.1), например — расширить множество P до некоторого множества Pg, где £ — малая константа.
В качестве примера ниже рассмотрим задачу 1 для конкретной конфликтно управляемой системы вида (6.6) на плоскости R2, основу которой составляет динамическая система — сферический маятник массы m =1 с длиной нити l = 1, вращающийся вокруг вертикальной оси с постоянной угловой скоростью
¿ 1 = x2,
¿2 = —g sin x1 + 2 sin 2x1;
здесь х1 — угол отклонения маятника от вертикальной оси, х2 — скорость изменения угла х1, д = 9.8 — гравитационная константа.
Пример 1. Пусть динамика конфликтно управляемой системы на отрезке [¿0, 0] = [0, 2] описывается векторным дифференциальным уравнением
здесь и € [—2, 2] — управление первого игрока, V € [—1,1] — управление второго игрока.
Заданы целевое множество М — объединение двух замкнутых кругов в Я2 радиуса г = 0.5 с центрами в точках (—2, 0) и (0, 0) и разбиение Г = {¿0 = 0, ¿1,..., ¿з,..., = 0}, Дз = з+1 — з = Д = Д(Г) = 0.005, N = 400.
Рассматривается задача об е-сближении системы (6.11) на промежутке [¿0,0] с М как задача об е-сближении А-движений системы (6.11) хсг[г] с М на промежутке [¿0,0], где е = 0.01. Для этого в рассматриваемой задаче вычислена А-система {Жг(гз): € Г}, Жг(0) = М как удовлетворяющая равенствам Жг(гз-) = ), ¿з + т = ¿0 + 0 = 2.
Здесь {^г(т): т € Г}, ^(т0) = М, — А-система в Я2 для максимального и-стабильного тракта в задаче 1 о сближении системы (6.11) с М.
В задаче рассмотрены два варианта выбора управления второго игрока на промежутке [0, 2] (в варианте 1 управление второго игрока выбрано как программное управление, в варианте 2 управление второго игрока выбрано как функция, зависящая от времени и позиции системы).
Вариант 1: V = в1п(4г).
Каждый из двух вариантов рассматривался со своей начальной точкой: вариант 1 с точкой (—4, 0), вариант 2 с точкой (5, —4).
Ниже приведены графические результаты математического моделирования задачи 1 для указанных выше параметров задачи. Эти результаты представлены на рис. 3-10.
х1 = —х2,
х2 = (—д + и) вт х1 + 2v вт 2х1;
(6.11)
Вариант 2: v(t, х)
при г € [0, 1),
при г € [1, 2].
Рис. 3. Сечения Шг(гз) множества разрешимости Шг системы (6.11) для некоторых моментов ¿з разбиения Г
Ь = 1.1
Ь = 0.9
5 -
2
Н 0 -
-5 -
-10
10
5 -
2
Н 0 -
-5 -
-10
х1
0
х1
10
Ь = 0.7
Ь = 0.5
5 -
2
Н 0 -
-5 -
-10
0
х1
10
5 -
2
Н 0 -
-5 -
-10
0
х1
10
Ь = 0.25
Ь = 0
5 -
2
Н 0 -
-5 -
-10
0
х1
10
5
2
х0
-5
-15 -10 -5 0 5 10 15
х1
Рис. 4. Сечения Жг(гз) множества разрешимости Жг системы (6.11) для некоторых моментов ¿з разбиения Г
5
0
5
5
5
5
5
5
5
5
5
Рис. 5. Вариант 1. А-движение 5г [£] системы (6.11) на цель М
2 Г1П г|тш1 [шпигап п -- "
1.5 -
1 -
0.5 -
3 0 -
-0.5 -
-1 -
-1.5 -
-2 _I_I_I_I_I_I_I_I_I_
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
£
Рис. 6. Вариант 1. График и * управлений первого игрока
г
Рис. 7. Вариант 1. График v(t) = в1п(4г) управлений второго игрока
г = 1.35
х1
Рис. 8. Вариант 2. А-движение жг[г] системы (6.11) на цель М
1
3 0
-1
-2 _ЧШ__щм_Щ_I_I_ I I —ч
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
г
Рис. 9. Вариант 2. График и * (г) управлений первого игрока
г
Рис. 10. Вариант 2. График ■и(г) управлений второго игрока
Заключение
Настоящая работа посвящена одной из базовых задач теории антагонистических дифференциальных игр — задаче о сближении конфликтно управляемой системы на конечном промежутке времени. Эта задача является более сложной, чем другая базовая задача теории антагонистических дифференциальных игр — задача о сближении конфликтно управляемой системы в фиксированный момент времени. Задача сформулирована для конфликтно управляемой системы при достаточно общих предположениях на нее как позиционная дифференциальная игра. Поскольку при этом не предполагается выполнения для системы условия седловой точки в маленькой игре, то задача рассматривается как минимаксная дифференциальная игра, в которой уклоняющемуся от целевого множества игроку отдается предпочтение в информационном плане. Разрешающие конструкции задачи о сближении (множество разрешимости, позиционная стратегия первого игрока) формируются с использованием унификационных схем или близких к ним схем, предложенных в середине 1970-х годов Н. Н. Красовским. Основным компонентом этих схем является гамильтониан конфликтно управляемой системы, который в этой работе, в соответствии с условиями, наложенными на систему, не является, вообще говоря, дифференцируемой функцией аргументов. Это позволяет включить в сферу исследования рассматриваемой задачи о сближении широкий набор конкретных задач динамики.
К сожалению, из-за сложности задачи о сближении (точнее — разрешающих конструкций задачи) не удается получить даже в относительно простых конкретных задачах точного описания одного из основных компонентов разрешающей конструкции — множества разрешимости W0 задачи о сближении. Поэтому настоящая работа посвящена, в основном, описанию схемы приближенного решения задачи: вводятся максимальные минимаксные u-стабильные тракты Z0 конфликтно управляемой системы, записанной в обратном времени, и приближающие их сверху A-системы множеств в фазовом пространстве конфликтно управляемой системы, индуцируя вместе с тем A-системы множеств в фазовом пространстве, приближающие сверху множество разрешимости W0 задачи о сближении. Описана позиционная экстремальная стратегия Ue первого игрока и обосновано (теорема 22), что эта стратегия обеспечивает решение задачи 1 для любых начальных позиций (t0 , x(0)) конфликтно управляемой системы, содержащихся в W0. Приведено описание стратегии Ue с использованием унификационных схем, основу которых составляет концепция Н. Н. Кра-совского унификации дифференциальных игр.
Финансирование. Работа выполнена при поддержке Министерства науки и высшего образования РФ в рамках государственного задания № 075-01265-22-00, проект FEWS-2020-0010. При выполнении исследований были использованы вычислительные ресурсы центра коллективного пользования ИММ УрО РАН «Суперкомпьютерный центр ИММ УрО РАН».
СПИСОК ЛИТЕРАТУРЫ
1. Понтрягин Л. С. О линейных дифференциальных играх. 1 // Докл. АН СССР. 1967. Т. 174. № 6. С. 1278-1280. http://mi.mathnet.ru/dan33165
2. Понтрягин Л. С. О линейных дифференциальных играх. 2 // Докл. АН СССР. 1967. Т. 175. № 4. С. 764-766. http://mi.mathnet.ru/dan33242
3. Никольский М. С. Об альтернированном интеграле Л. С. Понтрягина // Матем. сб. 1981. Т. 116 (158). № 1 (9). С. 136-144. http://mi.mathnet.ru/msb2447
4. Никольский М. С. О нижнем альтернированном интеграле Понтрягина в линейных дифференциальных играх преследования // Матем. сб. 1985. Т. 128 (170). № 1 (9). С. 35-49.
http ://mi. mathnet. ru/msb2016
5. Половинкин Е. С. Стабильность терминального множества и оптимальность времени преследования в дифференциальных играх // Дифференц. уравнения. 1984. Т. 20. № 3. С. 433-446. http://mi.mathnet.ru/de5120
6. Азамов А. Полуустойчивость и двойственность в теории альтернированного интеграла Понтрягина // Докл. АН СССР. 1988. Т. 299. № 2. С. 265-268. http://mi.mathnet.ru/dan7722
7. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970.
8. Красовский Н. Н., Субботин А. И. О структуре дифференциальных игр // Докл. АН СССР. 1970. Т. 190. № 3. С. 523-526. http://mi.mathnet.ru/dan35165
9. Красовский Н.Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.
10. Осипов Ю. С. Минимаксное поглощение в дифференциально-разностных играх // Докл. АН СССР. 1972. Т. 203. № 1. С. 32-35. http://mi.mathnet.ru/dan36689
11. Красовский Н. Н., Субботин А. И., Ушаков В. Н. Минимаксная дифференциальная игра // Докл. АН СССР. 1972. Т. 206. № 2. С. 277-280. http://mi.mathnet.ru/dan37117
12. Куржанский А. Б. Альтернированный интеграл Понтрягина в теории синтеза управлений // Алгебра. Топология. Дифференциальные уравнения и их приложения. Сборник статей. К 90-летию со дня рождения академика Льва Семеновича Понтрягина. Труды МИАН. Т. 224. М.: Наука,
1999. С. 234-248. http://mi.mathnet.ru/tm702
13. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
14. Кряжимский А. В., Осипов Ю. С. Об одном алгоритмическом критерии разрешимости игровых задач для линейных управляемых систем // Труды Института математики и механики УрО РАН.
2000. Т. 6. № 1. С. 131-140. http://mi.mathnet.ru/timm497
15. Красовский Н.Н. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226. № 6. С. 1260-1263. http://mi.mathnet.ru/dan39789
16. Субботин А. И., Субботина Н. Н. Необходимые и достаточные условия для кусочно-гладкой цены дифференциальной игры // Докл. АН СССР. 1978. Т. 243. № 4. С. 862-865. http://mi.mathnet.ru/dan42174
17. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. кибернетика. 1980. № 4. С. 29-36. https://www.elibrary.ru/item.asp?id=32805568
18. Тарасьев А. М., Ушаков В.Н., Хрипунов А. П. Об одном вычислительном алгоритме решения игровых задач управления // ПММ. 1987. Т. 51. Вып. 2. С. 216-222.
19. Боткин Н. Д., Пацко В. С. Универсальная стратегия в дифференциальной игре с фиксированным моментом окончания // Пробл. упр. и теория информ. 1982. Т. 11. № 6. С. 419-432. https://www.elibrary.ru/item.asp?id=42404697
20. Пацко В. С., Турова В. Л. Игра шофер-убийца: история и современные исследования. Екатеринбург: ИММ УрО РАН, 2009. https://www.elibrary.ru/item.asp?id=19461566
21. Lukoyanov N. Yu., Gomoyunov M. I. Differential games on minmax of the positional quality index // Dynamic Games and Applications. 2019. Vol. 9. No. 3. P. 780-799. https://doi.org/10.1007/s13235-018-0281-7
22. Григорьева С. В., Пахотинских В. Ю., Успенский А. А., Ушаков В. Н. Конструирование решений в некоторых дифференциальных играх с фазовыми ограничениями // Матем. сб. 2005. Т. 196. № 4. С. 51-78. https://doi.org/10.4213/sm1284
23. Ушаков В.Н., Ухоботов В. И., Липин А. Е. Об одном дополнении к определению стабильного моста и аппроксимирующей системы множеств в дифференциальных играх // Труды МИАН. 2019. Т. 304. С. 285-297. https://doi.org/10.4213/tm3976
24. Ершов А. А., Ушаков А. В., Ушаков В.Н. О двух игровых задачах о сближении // Матем. сб. 2021. Т. 212. № 9. С. 40-74. https://doi.org/10.4213/sm9496
25. Субботин А. И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.: Наука, 1991.
26. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978. https://www.elibrary.ru/item.asp?id=23449498
27. Черноусько Ф. Л. Эллипсоидальная аппроксимация множеств достижимости линейной системы с неопределенной матрицей // ПММ. 1996. Т. 60. Вып. 6. С. 940-950. https://www.elibrary.ru/item.asp?id=26016239
28. Петросян Л. А. Дифференциальные игры с неполной информацией // Докл. АН СССР. 1970. Т. 195. № 3. С. 558-561. http://mi.mathnet.ru/dan35806
29. Петросян Л. А., Зенкевич Н. А. Принципы устойчивой кооперации // Управление большими системами. 2009. № 26-1. С. 100-120. http://mi.mathnet.ru/ubs341
30. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Pursuit differential games with state constraints // SIAM Journal on Control and Optimization. 2000. Vol. 39. Issue 5. P. 1615-1632. https://doi.org/10.1137/S0363012998349327
31. Bardi M., Falcone M., Soravia P. Numerical methods for pursuit-evasion games via viscosity solutions // Stochastic and differential games. Boston: Birkhauser, 1999. Vol. 4. P. 105-175. https://doi.org/10.1007/978-1-4612-1592-9_3
Поступила в редакцию 31.10.2022 Принята в печать 10.11.2022
Ушаков Владимир Николаевич, д. ф.-м. н., главный научный сотрудник, отдел динамических систем, Институт математики и механики УрО РАН, 620219, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. ORCID: https://orcid.org/0000-0002-0527-5375 E-mail: [email protected]
Ушаков Андрей Владимирович, научный сотрудник, отдел динамических систем, Институт математики и механики УрО РАН, 620219, Россия, г. Екатеринбург, ул. С. Ковалевской, 16; научный сотрудник, лаборатория математической теории управления, Удмуртский государственный университет, 426034, Россия, г. Ижевск, ул. Университетская, 1. ORCID: https://orcid.org/0000-0002-3004-4245 E-mail: [email protected]
Цитирование: В. Н. Ушаков, А. В. Ушаков. О сближении управляемой системы на конечном промежутке времени // Известия Института математики и информатики Удмуртского государственного университета. 2022. Т. 60. С. 111-154.
V.N. Ushakov, A. V. Ushakov
On the approach problem for a control system on a finite time interval
Keywords: control, target set, conflict-controlled system, differential inclusion, approach problem, solution set, minimax u-stable bridge.
MSC2020: 93C15, 49N30, 49N35
DOI: 10.35634/2226-3594-2022-60-07
A conflict-controlled system in a finite-dimensional Euclidean space is considered. We study the game problem of approaching the system to the goal set in the phase space over a finite time interval. The study of the problem is based on methods developed in the theory of positional differential games. Within the framework of this theory, an approach to constructing approximate solutions to the approach problem is presented.
Funding. This research was funded by the Ministry of Science and Higher Education of the Russian Federation in the framework of state assignment No. 075-01265-22-00, project FEWS-2020-0010. The research was performed using computing resources of the collective use center of IMM UB RAS "Supercomputer center of IMM UB RAS".
REFERENCES
1. Pontryagin L. S. Linear differential games. I, Sov. Math., Dokl., 1967, vol. 8, pp. 769-771. https ://zbmath. org/?q=an: 0157.16304
2. Pontryagin L.S. Linear differential games. II, Sov. Math., Dokl., 1967, vol. 8, pp. 910-912. https ://zbmath. org/?q=an: 0157.16401
3. Nikol'skii M. S. On the alternating integral of Pontrjagin, Mathematics of the USSR — Sbornik, 1983, vol. 44, no. 1, pp. 125-132. https://doi.org/10.1070/SM1983v044n01ABEH000956
4. Nikol'skii M. S. On the lower alternating integral of Pontryagin in linear differential games of pursuit, Mathematics of the USSR — Sbornik, 1987, vol. 56, no. 1, pp. 33-47. https://doi.org/10.1070/SM1987v056n01ABEH003022
5. Polovinkin E. S. Stability of a terminal set and optimality of pursuit time in differential games, Differ. Uravn., 1984, vol. 20, no. 3, pp. 433-446 (in Russian). http://mi.mathnet.ru/eng/de5120
6. Azamov A. Semistability and duality in the theory of the Pontryagin alternating integral, Sov. Math., Dokl., 1988, vol. 37, no. 2, pp. 355-359. https://zbmath.org/?q=an:0683.90108
7. Krasovskii N. N. Igrovye zadachi o vstreche dvizhenii (Game problems on the encounter of motions), Moscow: Nauka, 1970.
8. Krasovskii N.N., Subbotin A.I. On the structure of differential games, Sov. Math., Dokl., 1970, vol. 11, pp. 143-147. https://zbmath.org/?q=an:0213.15901
9. Krasovskii N. N., Subbotin A. I. Pozitsionnye differentsial'nye igry (Positional differential games), Moscow: Nauka, 1974.
10. Osipov Yu. S. Minimax absorption in difference-differential games, Sov. Math., Dokl., 1972, vol. 13, pp. 337-341. https://zbmath.org/?q=an:0265.90070
11. Krasovskii N.N., Subbotin A.I., Ushakov V.N. A minimax differential game, Sov. Math., Dokl., 1972, vol. 13, pp. 1200-1204. https://zbmath.org/?q=an:0284.90097
12. Kurzhanskij A. B. Pontryagin's alternated integral in the theory of control synthesis, Proc. Steklov Inst. Math., vol. 224, 1999, pp. 212-225. https://zbmath.org/?q=an:0958.93034
13. Subbotin A. I., Chentsov A. G. Optimizatsiya garantii v zadachakh upravleniya (Optimization of the guarantee in control problems), Moscow: Nauka, 1981.
14. Kryazhimskii A. V., Osipov Yu. S. On an algorithmic criterion of the solvability of game problems for linear controlled systems, Proceedings of the Steklov Institute of Mathematics, 2000, suppl. 1, pp. 154-162. https://zbmath.org/?q=an:1116.49325
15. Krasovskij N.N. On the problem of unifying differential games, Sov. Math., Dokl1976, vol. 17, pp. 269-273. https://zbmath.org/?q=an:0367.90133
16. Subbotin A. I., Subbotina N.N. Necessary and sufficient conditions for a piecewise smooth value of a differential game, Sov. Math., Dokl., 1978, vol. 19, pp. 1447-1451. https://zbmath.org/?q=an:0431.90101
17. Ushakov V.N. On the problem of constructing stable bridges in a differential game of approach and avoidance, Eng. Cybernetics, 1980, vol. 18, no. 4, pp. 16-23.
18. Taras'yev A. M., Ushakov V. N., Khripunov A. P. On a computational algorithm for solving game control problems, Journal of Applied Mathematics and Mechanics, 1987, vol. 51, issue 2, pp. 167-172. https://doi.org/10.1016/0021-8928(87)90059-1
19. Botkin N. D., Patsko V. S. A universal strategy in a differential game with a fixed ending moment, Problemy Upravleniya i Teorii Informatsii, 1982, vol. 11, no. 6, pp. 419-432 (in Russian). https://www.elibrary.ru/item.asp?id=42404697
20. Patsko V. S., Turova V. L. Igra shofer-ubiitsa: istoriya i sovremennye issledovaniya (The killer-driver game: History and modern research), Yekaterinburg: Institute of Mathematics and Mechanics of the Ural Branch of the Russian Academy of Sciences, 2009.
https ://www. elibrary.ru/item.asp?id= 19461566
21. Lukoyanov N.Yu., Gomoyunov M.I. Differential games on minmax of the positional quality index, Dynamic Games and Applications, 2019, vol. 9, no. 3, pp. 780-799. https://doi.org/10.1007/s13235-018-0281-7
22. Grigor'eva S.V., Pakhotinskikh V.Yu., Uspenskii A.A., Ushakov V.N. Construction of solutions in certain differential games with phase constraints, Sbornik: Mathematics, 2005, vol. 196, no. 4, pp. 513-539. https://doi.org/10.1070/SM2005v196n04ABEH000890
23. Ushakov V. N., Ukhobotov V. I., Lipin A. E. An addition to the definition of a stable bridge and an approximating system of sets in differential games, Proceedings of the Steklov Institute of Mathematics, 2019, vol. 304, pp. 268-280. https://doi.org/10.1134/S0081543819010206
24. Ershov A. A., Ushakov A. V., Ushakov V.N. Two game-theoretic problems of approach, Sbornik: Mathematics, 2021, vol. 212, no. 9, pp. 1228-1260. https://doi.org/10.1070/SM9496
25. Subbotin A.I. Minimaksnye neravenstva i uravneniya Gamil'tona-Yakobi (Minimax inequalities and Hamilton-Jacobi equations), Moscow: Nauka, 1991.
26. Chernous'ko F. L., Melikyan A. A. Igrovye zadachi upravleniya i poiska (Game problems of control and search), Moscow: Nauka, 1978. https://www.elibrary.ru/item.asp?id=23449498
27. Chernous'ko F. L. Ellipsoidal approximation of attainability sets of a linear system with indeterminate matrix, Journal of Applied Mathematics and Mechanics, 1996, vol. 60, issue 6, pp. 921-931. https://doi.org/10.1016/S0021-8928(96)00114-1
28. Petrosyan L.A. Differential games with incomplete information, Sov. Math., Dokl., 1970, vol. 11, pp. 1524-1527. https://zbmath.org/?q=an:0226.90059
29. Petrosyan L.A., Zenkevich N.A. Principles of dynamic stability, Upravlenie Bol'shimi Sistemami, 2009, issue 26-1, pp. 100-120 (in Russian). http://mi.mathnet.ru/eng/ubs341
30. Cardaliaguet P., Quincampoix M., Saint-Pierre P. Pursuit differential games with state constraints, SIAM Journal on Control and Optimization, 2000, vol. 39, issue 5, pp. 1615-1632. https://doi.org/10.1137/S0363012998349327
31. Bardi M., Falcone M., Soravia P. Numerical methods for pursuit-evasion games via viscosity solutions, Stochastic and differential games, Boston: Birkhauser, 1999, vol. 4, pp. 105-175. https://doi.org/10.1007/978-1-4612-1592-9_3
Received 31.10.2022 Accepted 10.11.2022
Vladimir Nikolaevich Ushakov, Doctor of Physics and Mathematics, Professor, Department of Dynamic Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620219, Russia. ORCID: https://orcid.org/0000-0002-0527-5375 E-mail: [email protected]
Andrei Vladimirovich Ushakov, Researcher, Department of Dynamical Systems, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620219, Russia;
Researcher, Laboratory of Mathematical Control Theory, Udmurt State University, ul. Universitetskaya, 1,
Izhevsk, 426034, Russia.
ORCID: https://orcid.org/0000-0002-3004-4245
E-mail: [email protected]
Citation: V. N. Ushakov, A. V. Ushakov. On the approach problem for a control system on a finite time interval, Izvestiya Instituta Matematiki i Informatik Udmurtskogo Gosudarstvennogo Universiteta, 2022, vol. 60, pp. 111-154.