УДК 517.977.8
П. Е. Двуреченский, Г. Е. Иванов
Московский физико-технический институт (государственный университет)
Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с нефиксированным временем окончания
Разработан метод вычисления квазиоптимальных стратегий в нелинейной дифференциальной игре на нефиксированном отрезке времени с целевым множеством. В двумерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольников. Проведены детальные оценки погрешностей алгоритма.
Ключевые слова: дифференциальная игра, оптимальная стратегия.
Основы теории дифференциальных игр с нулевой суммой заложены в работах Р. Айзекса [1], Л.С. Понтрягина [2], Н.Н. Красовского [3] и др. В настоящее время разработаны различные алгоритмы, вычисляющие цену игры и оптимальные стратегии управления [4] - [6]. Для линейных дифференциальных игр с выпуклым целевым множеством современные методы используют алгоритмы вычисления игровых множеств достижимости через опорные функции этих множеств. Если дифференциальная игра нелинейна, то игровые множества достижимости становятся невыпуклыми и аппарат опорных функций неприменим.
В настоящей работе предлагается алгоритм построения квазиоптимальной (или е-оптимальной) стратегии управления для нелинейной дифференциальной игры на нефиксированном отрезке времени с целевым множеством. Алгоритм использует конструкцию игровых множеств достижимости, похожую на конструкцию, используемую в [7]. В двумерном случае эти множества могут быть построены с помощью алгоритма, близкого к алгоритму построения суммы Минковского двух многоугольников с использованием конволюты [9] - [10]. Настоящая работа продолжает работу [8], в которой этот подход применяется для построения в-оптимальной стратегии управления для игры на фиксированном интервале времени.
Чрезвычайно высокая вычислительная сложность алгоритмов, используемых в теории дифференциальных игр, делает актуальной задачу анализа эффективности этих алгоритмов. Для анализа эффективности алгоритмов важно оценить их погрешности. В настоящей работе получены оценки параметра е, определяющего близость в-оптимальной стратегии к оптимальной в зависимости от параметров дискретизации.
1. Постановка задачи
Рассмотрим динамическую систему, описываемую дифференциальным уравнением
где Ь € [0, $] - время, чиело $ определяет максимальную продолжительность игры, х(Ь) € М” - фазовый вектор системы, управление первого игрока и(Ь) и второго игрока у(Ь) подчинены ограничениям
Предполагается, что заданы компактные множества Р С Мр, Q С М9 и непрерывные функции а : М” хР ^ М” и Ь : М” хQ ^ М”. Кроме того, вектограммы а(х, Р) = {а(х, и) : и € Р},
х(1) = а(х(£),и(£)) + Ь(х(£),у(£)),
(1)
и(1) € Р, У^) € Q.
(2)
Ь(х, О) = {Ь(х, V) : V € ^} выпуклы при всех х € М”. Пусть также задано компактное множество М С М”, которое будем называть целевым, или терминальным.
Пусть задан отрезок [£0,^1] С [0,$] и пусть для какой-то начальной позиции х(Ьо) = Хо € М” и каких-то измеримых управлений и : [£0,^1] ^ Р, V : [£0,^1] ^ Я абсолютно непрерывная функция х : [£0,^1] ^ М” почти всюду на отрезке [£0,^1] удовлетворяет уравнению (1). Если существует момент времени £ € [£0^1] такой, что х(Ь) € М, то будем говорить, что на отрезке [£0, £1] имеет место поимка. Иначе, то есть если х(Ь) € М при всех I € [£0,^1]) то будем говорить, что на отрезке [£0,^1] имеет место уклонение. Цель первого игрока состоит в минимизации числа §0 € [0, $] такого, что на отрезке [0, $0] обеспечена поимка. Цель второго игрока — обеспечить уклонение на отрезке [0, $] или, если это невозможно, максимизировать время §0 € [0, $] такое, что на отрезке [0, $0] обеспечено уклонение.
Расстоянием, от точки х € М” до множества К С М” называется величина
д(х,У) = т£ Уж - у\\. (3)
Будем говорить, что на отрезке [£0,^1] С [0, $] имеет место е-поимка, если существует такой момент времени £ € [£0,^1], что д(х(£),М) < е.
Будем предполагать, что функции а : М” х Р ^ М” и Ь : М” х ^ ^ М” удовлетворяют следующим условиям Липшица:
||а(жь«1) - а(х2,и2)\\ ^ ^\\х1 - х2\\ + ЩЦт - и2\
V х1,х2 € М”,
||Ь(Ж1,^1) - Ь(Х2,Ь2)\\ ^ Щ\х1 - Х2\\ + Ь'ъ\\Ы - Ь2\\
V Х1,Х2 € М”,
||а(ж,и)\ ^ Са V х € М”, и € Р;
||Ь(ж,^)\| ^ Сь V х € М”, V € Я.
Обозначим
С = Са + Сь, ь = Ьха + Ц.
2. Стратегии и законы управления
Пусть задан отрезок [£0, £1] С [0, $]. Множеством Ы[^0, ^1] допустимых реализаций управления первого игрока называется множество всех измеримых функций и : [£0^1] ^ Р. Множеством V[£0,^1] допустимых реализаций управления второго игрока называется множество всех измеримых функций V : [£0, £1] ^ ф-
Позиционной стратегией первого игрока называется произвольная
функция : М” ^ Р. Пусть Т = {тг}^=0 """"" разбиение отрезка
[£0,'£1] С [0,$] : £0 = г0 < т1 < ■■■ < т/ = Пар а (и^г,Т), составленная из позици-
онной стратегии первого игрока ивЬг и разбиения Т отрезка [^0, ^1] ? называется законом управления первого игрока на отрезке [£0,'£1]. Движением, соответствующим начальному состоянию ж(^) = Х0: закону управления (и^г,Т) и допустимой реализации управления V € V[£0,^1]) будем называть абсолютно непрерывную функцию ж : [£0^1] ^ М”, определяемую из пошагового уравнения
х(1) = a(ж(^),ustr (х(тг))) + Ь(х(Ь),у(Ь)), (9)
которое должно выполняться при почти всех £ € [тг,Гг+1 ] и всех г € 0,1 - 1. При этом начальная позиция для отрезка [т0,Т1] равна Ж0, а начальная позиция х(тг) для отрезка [т”г, Тг+1.] Совпадает С конечной позицией х(Тг) отрезка [Тг_1,Тг].
и1 ,и2 € Р; У1,У2 € Я;
К'*)
(5)
(6)
(7)
(8)
В силу принятых предположений при заданных начальной позиции ж(^) = Ж0, разбиении Т, позиционной стратегии первого игрока -и^г и допустимой реализации управления
V € V[£0^1] движение х(^) существует и единственно. Обозначим его следующим образом:
хт°\^0,х0,Т,и^,у)= х(£) V £ € [£0,£1]. (10)
Аналогично определяются позиционная стратегия второго игрока и движение
С°Ч*, *0, Х0,Т, и, О, соответствующее начальной позиции ж(^) = Х0, разбиению Т, допустимой реализации управления первого игрока и € и[£0, £1] и стратегии второго игрока и81*.
Будем говорить, что закон управления (-и^г, Т) гарантирует на отрезке [£0, £1]
для начального состояния Х0, если для любой реализации управления V € V[£0,^1] существует момент времени £ € [£0,^1] такой, что выполняется
в {хт°Ь(1,10,х0,Т,изЬг,у), М) < е. (11)
Закон управления (у^Д) гарантирует, уклонение на отрезке [£0,'£1] для начального состояния Ж0, если для любой реализации управления и € и[£0,^1] выполняется
жГЧМ0,®0,Т,и,0 /М V £ € [£0,^]. (12)
Пусть задано число е > 0 и законы управления (ustr,Ти), (vstr,ТУ) первого и второго игроков на отрезке [0, $]. Пара законов ((и^г,Ти), (у^Дъ)) называется е-оптимальной, если для любого начального положения Ж0 € М” такого, что д(х0,М) > е, выполняется альтернатива:
1) существует момент времени §0 € [0, $] такой, что закон управления (ь^ ,Ти) гарантирует е-поимку на отр езке [0, $0] 5 а закон управления (ь^Дъ) гарантирует уклонение на отрезке [0, $0], либо
2) закон управления (ь^Дъ) гарантирует уклонение на отрезке [0,$]
3. Алгоритм вычисления стратегии управления
Зафиксируем натуральное число I и рассмотрим равномерное разбиение Т = {тг}^=0 отрезка [0, $], где т% = гт, г € 0,1. Шаг т = $/1 разбиения Т будем также называть параметром дискретизации по времени.
Для любого множества 5 С М” определим множества
= {х € М” : 3 и € Р : ж + та(х, и) € 5}, (13)
Вв = {х € М” : V V € Я : ж + тЪ(х,у) € в}. (14)
Таким образом, определены операторы А и В, которые будем называть одношаговым,и операторам,и, достижимости.
Суммой и разностью Минковского множеств X С М” и У С М” называются соответственно множества
X + ¥ = {х + у : ж € X, у € ¥}, X- ¥ = {х € М” : ж + ¥ С X}. (15)
Для любого числа К > 0 через Вд обозначим замкнутый шар с центром в нуле и
радиусом Д: = {х € М” : ||ж|| ^ Я}.
Пусть £ - класс аппроксимирующих множеств, то есть подмножеств М”, с которыми работают алгоритмы и которые с достаточной точностью аппроксимируют игровые множества достижимости (о них речь пойдет ниже). Примером класса £ может служить класс М2
Предположим, что построены алгоритмы, которые для каждого множества 5 € £ с некоторыми погрешностями вычисляют множества АБ, Вв. Учитывая эти погрешности,
будем предполагать, что реально для каждого множества 5 € £ вычисляются множества АБ, В Б класс а £, удовлетворяющие условиям
А(Б - В£А) С Ав С А(Б + В£Л), (16)
В (Б - В£в) С В Б С В (Б + В£в), (17)
где числа £а, £в определяют погрешности этих алгоритмов. В случае, если класс £ состоит
из многоугольников в М2 с длиной сторон, не превосходящей И, в качестве алгоритмов вычисления множеств АБ, ВБ для 5 € £ могут быть использованы алгоритмы, построенные
в [8]. При этом оценки их погрешностей £а = 4И + Ь^Сат2, ев = 4И + Ь^С^т2 останутся справедливыми для рассматриваемой здесь задачи.
Предположим, что построен алгоритм, который для любых множества 5 С £ и вектора х € АБ позволяет определить вектор и = й(х, Б) € Р такой, что
х + та(х,й) € Б + В£и. (18)
Также предположим, что построен алгоритм, который для любых множества 5 С £ и вектора х € М” \ (ВБ) позволяет определить вектор V = ь(х, Б) € ф такой, что
х + тЬ(х,у) € (М” \ 5)+ В£г1. (19)
Здесь числа еи и еь определяют погрешности соответствующих алгоритмов. Для класса £, состоящего из многоугольников в М2 с длиной сторон, не превосходящей И, такие алгоритмы также построены в [8].
Зафиксируем некоторые векторы и* € Р, V* € ф и положим й(х, Б) = и* при х € АБ, ь(х, Б) = V* при х € В Б. Тем самым определены функции
и : М” х £ ^ Р, V : М” х £ ^ д. (20)
Обозначим
Д° = г2 (ЬС + ЦСа), Д0 = г2(^ , (21)
Ди = Д°и + £в + (1 + тЬ%)еи, Д = Д° + £а + (1 + тЬта)е,и. (22)
Пусть имеются алгоритмы, которые для любого множества 5 € £ вычисляют множества ОиБ € £, В,иБ € £ такие, что
^ - Вди+£л С БиБ С Б - Вди, 5 + В д С ОьБ С Б + В д +£л, (23)
где число ев определяет погрешность этих алгоритмов. Будем также предполагать монотонность по включению операторов Ии и Иу, то есть
ОиБ1 С ОиБ2, ^Б1 С Б2 V Б1,Б2 € £ : ^ С ^ (24)
Зафиксируем положительное число е.
Определим множества € £, Мд € £ так, что
М + В£-£м С С М + В£, (25)
М + ВтС С М0 С М + ВтС+£м. (26)
Здесь число ем € (0, е) определяет погрешность начальной аппроксимации.
Двигаясь в сторону увеличения индекса г и используя описанные выше алгоритмы, вычислим наборы игровых множеств достижимости {М“}^=0, {М? }^=0:
М“+1 = (АВОиМ?) иМ?, г € 0,1 - 1, (27)
М?+1 = (ВАО,иМ.У) и М?, г € 0,1 - 1. (28)
Отметим, что из этих определений следуют включения
С М“+1, М? С М?+1 V г € 0,1 - 1. (29)
Используя функции (20) и игровые множества достижимости, определим позиционные стратегии управления. Для любого вектора х € М” \ положим
і(х) = шах{г є 0,1 — 1 : х^ М?}, (30)
а для любого х є М™ \ М^ обозначим
І(х) = шах{і є 0,1 — 1 : хЄ М]+1}. (31)
Теперь для любого х Є М™ определим
{и*, х є М?,
и8*г(ж) = ^ ( ~ \ (32)
\й[х,В£„М“х)] , х Є М™ \ М?,
,.*г^ _ )У*, Х Є М1 ,
;(ж, АИъМ?(х)) , х є М™ \ М1
ьвгг(х) = 1 і ~ \ 1 (33)
4 ' I ~ I _ Л Л /Гї) \ ~ ТГЪП \ Ъ /Г1) ' '
Определим числа
До = Д? + Д + 2(єа + є в + є о), (34)
єо = т(С + Сь) + 2єм + Д? + + (тСь + До(! — 1))є(^ т)^. (35)
Теорема 3.1. Пусть і є 0,1, Хо є М?, стратегия ивЬг определена соотношением (32).
Тогда, закон управления (иБІГ,Т) гарантирует є-поимку на отрезке [0,Ті] для, начального
состояния х(0) = х0.
Теорема 3.2. Пусть г є 0,1 — 1, х0 є М?, стратег ия увЬг определена соотношением (33). Тогда, закон управления (уБІГ,Т) гарантирует уклонение на отрезке [0,ті+1] для, начального состояния х(0) = х0.
Теорема 3.3. Пусть є ^ є0, число т выбрано так, что тПХ < 2- Тогда,
М? С М? V г € 0,1 - 1. (36)
Теорема 3.4. Пусть стратегии определены соотношениями (32), (33). Пусть
число е ^ тС + 2ем вы,бра,но так, что выполняется условие (36). Тогда, пара законов управления ((-и^г,Ти), (^^,Т0)) является £-оптимальной.
4. Доказательство теорем 3.1^3.4
Лемма 4.1. Для любых множества Б С М” и числа, 8 > 0 операторы (13), (14) удовлетворяют соотношениям
АБ + Вг С А(Б + В(1+Т^)г), (37)
ВБ + Вг С В(Б + В(1+тЬ,)й). (38)
Доказательство. Пусть х € АБ + В<$. Тогда существует вектор у € АБ такой, что Цу - хЦ ^ £. В силу равенства (13) существует вектор и € Р такой, что у + та(у,и) € Б.
Отсюда в силу соотношения (4) получаем включение х + та(х,и) € Б + В(1+г^^)^.
Следовательно, х € А(в + В(1+т^^)^), что доказывает включение (37). Включение (38) доказывается аналогично. □
Лемма 4.2. Пусть тЩ < 1. Тогда для любых множества Б С М” и числа, 5 > 0 оператор (14) удовлетворяет включению
ВБ - Вг/(1-г^) С В(Б - Вё).
Доказательство. Пусть х € ВБ - В§/(1-Ть^у Тогда для любых V € <^, г € В§/(1-ть^) имеем х + г + тЪ(х + г, V) € Б. Зафиксируем произвольные V € д,у € В<$. Рассмотрим отображение Р(г) = тЬ(х, ь)+у-тЬ(х+г, V). Так как тЬ% < 1, то это отображение является сжимающим. Следовательно, существует его неподвижная точка 20 = тЬ(х,ь)+ у - тЬ(х + 20, ь). При этом ||20|| = ЦтЬ(х,у) + у - тЬ(х + 20,^)|| < 5 + тЩ ||г0|, откуда получаем, что х0 € Вг/(1-Г££). Тжим образом, получаем, что х + тЬ(х, у) + у = х + г0 + тЬ(х + г0,у) € Б. Отсюда, в силу произвольности выбора V € ф и у € В<$, следует, что х € В(Б - В$). □
Для любых £0 € [0, $], ^ € [£0, '&],х0 € М”, и € и[£0, ^], ^ € V[£0, ^] обозначим
х(Ъ,10,х0 ,и, V) = х(Ъ) V t € [£0,^],
где х : [^0, ^1] ^ М” - решение задачи Коши:
ж(£) = а(ж(£), «(£)) + Ъ(х(Ъ), v(^)),
с начальным условием ж(^) = Ж0.
Проводя рассуждения, близкие к доказательству леммы 5.1 из [7], получаем следующую лемму.
Лемма 4.3. Пусть заданы числа, т € (0,$),'£0 € [0, $ - т], вектор х0 € М” и функции и € и[£0,£0 + т],у € V[£0,£0 + т]. Пусть
Хи — Ж0 +
-*0+т
a(x0,u(t))dt, (39)
%1 = Х(^0 + т,Ь0,Х0,и,у). (40)
Тогда, существует вектор и0 € ф такой, что вектор
х™ = хи + тЬ(хи, У0) (41)
удовлетворяет неравенству
Цх^ - Ж1| < Д°, (42)
где число Д°и определено равенством (21).
Аналогичная лемма верна для векторов хь,хуи, определенных аналогично.
Лемма 4.4. Пусть Жо € М+ \ М™, стратег ия определяется соотношением (32), г € 0,1 - 1, V € V[0,т], Ж1 = х^(т,0,х0,Т,и^,у). Тогда Х1 € М?.
Доказательство. Определим функцию и € Ы[0, т] формулой
и(Ъ) = «^(жо) V t € [0,т]. (43)
Тогда справедливо равенство (40), где £о = 0. Из включения жо € М+1 \ М“ и равенства (27) получаем жо € АВОиМ?. В силу равенства (30) и включений (29) имеем г(хо) = г. Отсюда и из соотношений (18), (32) следует включение Жо + та(хо, и^г(хо)) € ВОиМ?+В£и. Поэтому согласно равенству (43) получаем, что вектор хи, определяемый формулой (39), удовлетворяет включению
Хи € ВБиМ11 + В£и. (44)
В силу леммы 4.3 существует вектор Ьо € ф такой, что для вектора
— %и + тЬ(хи,Ьо) справедливо неравенство (42). Согласно включениям (17) и (38) имеем В ИиМи + С В (Ии Ми + В£в) + В£и С Б(£иМ“ + В£в + В£и (1+гь*))-
Отсюда, из определения (14) оператора В и (41), (44) получаем
+ тЬ(Хи,Уо) € ОиМи + Вев + В£и(1+гЬ*).
Далее, учитывая (42), (22), (23), получаем
Ж1 е ОиМ11 + Вев + В£и(1+тЬ*) + ВД° С ми — Вев +е„(1+тЬр+Д° + Вев +еи(1+тЬ*)+Д0 С Ми
□
Проводя рассуждения, аналогичные доказательству леммы 4.4, получаем следующую лемму.
Лемма 4.5. Пусть х0 € М?+2 \ М?+1, ] € 0,1 — 2 или ] — I — 1, х0 € М™ \ М}1. Пусть стратегия определяется соотношением (33), и € Ы[0,т], ж1 — хгт°ь(т, 0,хо,Т,и,увЬг). Тогда х1 € М?.
Лемма 4.6. Пусть х0 € Мг?+1 \ М“, стратегия определяется соотношением
(32), г € 0,1 — 1, V € V[0,Тг+1]. Тогда, существует индекс ] € 0, г + 1 такой, что х™1^, 0, жо, Т, и81г, V) € М0и.
Доказательство. Будем доказывать утверждение по индукции. При г — 0 утверждение верно по лемме 4.4. Зафиксируем т € 0,1 — 1. По предположению индукции утверждение
верно для всех г € 0,т — 1. Нужно доказать, что оно будет верным и для г — т. Пусть
ж0 € М'ии++1 \ М“, V € V[0,тт+1]. Требуется доказать, что
3 ] € 0,т + 1 : xrm°Ь(тj, 0, ж0, Т, и^г, у) € М^. (45)
Обозначим ^[о,г] сужение функции V : [0, гт+1] ^ ^ на отрезок [0,г]. Тогда по лемме 4.4 ж1 — хт°ь(т, 0, жо, Т, и^г, ^[о, г]) € М“. Если ж1 € Ми, то соотношение (45) выполнено при ] — 1. Если Ж1 € Мои, то из включений (29) следует, что существует такой номер в € 0,т — 1, что Ж1 € М]+1 \ М’ии. Тогда по предположению индукции утверждение леммы выполнено для жо — Х1,г — в. То есть существует такой номер к € 0, 8 + 1 С 0, т, что
ж™^, 0, Х1,Т, и^г, й) € Мои,
где г>(£) — + т) для £ € [0, ]• Отсюда в силу отсутствия явной зависимости от времени
в уравнении динамики (1) и равенства Ж1 — хгт°^(т, 0,хо,Т,ивЬг,и^о,т]) получаем, что
С°Ч^+1, 0,хо,Т,ивЬг,у) € Мои, и соотношение (45) выполнено при ] — к + 1 □
Лемма 4.7. Пусть г € 0,1 — 1, хо € М?+1. Пусть стратегия определяется соотношением (33). Тогда для, любой функции и € Ы[0,т] выполнено соотношение х™*(т, 0,Хо,Т,и,у^) € М?
Доказательство. Из условия жо € Мг+ и включений (29) следует, что либо существует такой номер ] € г,1 — 2, что Жо € М?+2 \ М?+1, либо Жо € М? (в этом случае положим ] — I — 1). Тогда по лемме 4.5 получаем, что
жГ(т, 0, хо,Т, и, у^г) € М^ V и € и[0, т].
□
Лемма 4.8. Для, любого Б С М™ выполнены включения
Б С В(Б + ВтСь), ВБ С Б + Втсь.
(46)
(47)
Доказательство. Докажем включение (46). Пусть у € Б. Из соотношения (7) следует, что для любого V € ф справедливо включение у + тЬ(у, ь) € Б + Втсь- Отсюда по определению (14) оператора В следует, что у € В(Б + В тСъ).
Докажем включение (47). Пусть у € ВБ. По определению (14) оператора В это означает, что для любого V € ф выполнено включение у + тЬ(у, V) € Б. Отсюда и из соотношения (7) получаем у € Б + Втсь- □
Проводя рассуждения, близкие к доказательству леммы 5.9 из [7], получаем следующую лемму.
Лемма 4.9. Для любого Б С М™ выполнено включение
М? + Ве-тс-2ем С М + ВтС'+ем + В-тс-2ем — М + В£-£м С Мои. Отсюда, используя соотношения (23), получим включения
Из равенств (35) и (48) следует, что го + т(С + Сь) + 2ем + Ди + — £о ^ £■ Отсюда и из
включения (50) получаем, что доказываемое включение (49) справедливо при ] — 0.
Пусть теперь включение (49) справедливо при ] — г € 0,1 — 2, то есть
Требуется доказать, что включение (49) выполняется и при ] — г + 1. Используя (51), с учетом леммы 4.2 и включения (17) получаем
ВБиБ — Втсь С Б.
Для любого индекса г € 0,1 — 1 определим число
П — (тСь + (1 — г — 1)До)е(/-г-1)тЬ.
(48)
Лемма 4.10. Пусть выполнены неравенства тЬ% < е > ео, где ео определено равен-
ством (35). Тогда для, любого ] € 0,1 — 1 выполнено включение
М] + В. С ВИиМи.
(49)
Доказательство. Будем доказывать утверждение по индукции. Из включений (25), (26) получаем следующую цепочку включений:
М? + Вг. С ВБиМОи.
(51)
Отсюда с учетом (23) имеем
то есть И?МО? + В Р1 С ВОиМги, где
рг — гг — Д? — — /(1 — ).
(52)
Учитывая включение (16), получаем
А(Б?М" + В*^) С А(ВОиМ? — Я£А) С АВОиМ?. (53)
Из включений (16) и (37) следует, что
АВ?М." + в(р._2еа)/(1+ть%) с А(В?М." + Ва) + в(р{_2еА)/(1+тЬ£) С А(В?М." + В№_^).
Из включений (53), (27) получаем АВ?М" + В(р._2еа)/(1+ть^) С АЁВиМи С М"+1. Введя обозначение
г. = г.е т^а — А? — £в — 2£а — /(1 — 'тLfr), (54)
из равенства (52) получаем неравенство г. < (р. — 2еа)/(1 + тЩ). Следовательно,
АВ?М" + В^ С М"+1. Используя соотношения (23), из последнего включения получаем
АО?М" + Вгг_^_£в С М+1 — Вди+£о С В.аМ и+1. (55)
Введем обозначение
Г" = (Г" — Аи — — £в )/(1 + ТЩ). (56)
Используя соотношения (17), (38) и (55), получаем включения
ВАВ?М" + В = С В(АВ?М" + В£в) + В{^_ди_£о_в)/(1+^) С ВВиМ^. (57)
Так как г" < г., то из включений (24), (29), (51) получаем
М" + В = С М" + Вг, С ВВиМи С ВВиМ+1. (58)
Из соотношений (27), (57) и (58) имеем
М"+1 + В = = ((ВАВ?М") и М?) + В = = (ЁАВ?М" + В =) и ( М.? + В =) С ВВиМ+1. (59)
Из (48) следует неравенство г.+1 < — А0. В силу равенств (34), (54), (56) и неравен-
ства тЩ < 2 справедливо неравенство r"e_тL — А0 < г.. Поэтому г.+1 < г.. Отсюда и из соотношений (59) получаем, что включение (49) выполнено для ] = г + 1 □
Доказательство теоремы 3.1. Если х0 € М^, то утверждение теоремы следует из соотношений (25). Если хо € М^, то в силу включения хо € Ми получаем неравенство г > 0 и существование такого номера т € 0, г — 1, что х0 € М^+1 \ М^- Пусть задана функция V € V[0,тт+1]. Тогда по лемме 4.6 (где положим г = т) существует такой номер j € 0, т + 1, что
х.Т\тэ, 0, хо,Т, и8Ьт, V) € М0и. (60)
Это означает, что гарантируется е-поимка на отрезке [0,тт+1] С [0,г.^ □
Доказательство теоремы 3.2. Зафиксируем произвольную функцию и € Ы[0,T"+1]. Обозначим х(Ъ) = ж.^(£, 0,хо,Т,и,увЬг), £ € [0,т"+l]. Применяя лемму 4.7, по индукции получаем, что х(^) € М"_ ^ при ] € 0, г. Отсюда и из включений (29) следует, что х(^) € М" для любого ] € 0, г. Предположим, что утверждение теоремы неверно. Тогда существует такой момент времени £ € [0,т.+1^ что ж(£) € М. Выберем индекс ] € 0, г из условия ^ ^I < т. Тогда в силу (1), (6), (7) справедливо неравенство \\x(тj) — ж(£)|| < тС. Отсюда
и из включений (26) следует, что х(^) € М + Вгс С М". Противоречие. □
Доказательство теоремы 3.3. Пусть выполнено неравенство е > е0. Зафиксируем произвольное г € 0,1 — 1. По лемме ^^^0 выполнено включение М" + ВГ1 С ВВиМУ. Из равенств (48) следует неравенство г. > тСъ- Поэтому М" + Втсъ С ВВиМУ. Отсюда получаем, что М. С ВВиМи — Вгсъ, и с учетом леммы 4.9 справедливо включение М. С Ми.
□
Доказательство теоремы 3.4. Пусть задан вектор х0 € М™ такой, что д(х0,М) > е.
{и_
Тогда в силу (25) имеем х0 € М0*. Если х0 € М^ 17 то существует номер г €0,1 — 2 такой,
что х0 € М+ \ М™. Так как х0 € М"^, то то теореме 3.1 закон управления (и^,Т) гарантирует е-поимку на отрезке [0,т^ 1] для начального состояния ж(0) = Ж0- Так как ж0 € Ми и, согласно соотношению (36), М" С М“, то ж0 € М" и по теореме 3.2 закон
управления (увкт,Т) гарантирует уклонение на отрезке [0,т^ 1] для начального состояния ж(0) = Ж0- Таким образом, выполняется первый пункт альтерната вы в определении е-оптимальной пары стратегий.
Пусть теперь ж0 € М'и_Г Тогда согласно (36) имеем ж0 € М"_ 1. Отсюда по теореме 3.2 закон управления (у31*, Т) гарантирует уклонение на отрезке [0, $] для начального состояния ж(0) = Ж0, то есть реализуется второй пункт альтернативы. □
5. Примеры классов аппроксимирующих множеств
Покажем, что теоремы 3.1-3.4 могут быть использованы для получения оценок погрешностей алгоритма, изложенного в работе [7]. Поскольку при доказательстве теорем 3.1-3.4 не использовался конкретный вид нормы, то, в частности, так же как и в работе [7], в качестве нормы в М™ можно рассмотреть шах-норму: ||ж|| = шах.1х.1- При этом шаром Вд будет куб с центром в нуле и с ребрами длиной 2Д. Пусть С - кубическая сетка в М™ с шагом к. Каждому сеточному множеству 5 С С сопоставим телесное множество £ (Б) С М™, равное объединению к убов в М™ с ребрами дл ины к и центрами в точках множества Б. Будем рассматривать класс аппроксимирующих множеств £ = {£(Б) : 5 - ограниченное подмножество С}. Используя обозначения [7], введем для любого 5 € £ множества
15 = £(Ги(Б П С)), ВБ = £(^?(5 П С)).
Легко получить (в обозначениях [7]), что 8а = тКи5 + (1 + тЬи)к/2,
ев = тК?5 + (1 + тЬ?)к/2. Для погрешностей расчета управлений выполняются оценки еи = (1 + тЬи)к/2,е? = (1 + тЬ?)к/2. При ев = 3к/2 выполненяются включения (23) для операторов
БиБ = £(5 П С — ВДи+£л ), Б?Б = £(5 П С + ВД^+л).
Для ем = к выполняются включения (25), (26) для множеств Ми,М", определенных следующим образом:
М0и = £((М + В£_К/2) П С), М" = £((М + Втс+н/2) П С).
Подставляя эти оценки в формулу (35), получим, что при стремлении т,к,ё к нулю погрешность £0 по порядку величины совпадает с результатом работы [7]. Из полученной оценки, так же как ив [7], следует, что для получения достаточно малой погрешности необходимо выбирать достаточно малыми параметры к, т, £, причем так, чтобы отношение к/т было достаточно малым.
Для класса аппроксимирующих множеств £ состоящего из многоугольников в М2 с длиной сторон, не превосходящей к, при реализации операторов А, В можно исплользо-вать алгоритмы, построенные в [8]. При этом в случае евклидовой нормы для погрешностей £м,£о,£и,£?,£а,£в вспомогательных алгоритмов, использующих конволюту, будут справедливы следующие оценки:
( к2 к2
ем = к, еи = тах|8А, 8А / , ^ = 4к + т2ЬхаСа, ев = 4к + т2ЦСъ,
£и = л/(£а + к/2)2 + к2/4, е? = у/(ев + к/2)2 + к2/4.
Работа выполнена при поддержке РФФИ, грант 10-01-00139 и ФЦП «Научные и научнопедагогические кадры инновационной России».
Литература
1. Айзекс Р. Дифференциальные игры. - М.: Мир, 1967.
2. Понтрягин Л. С. Линейные дифференциальные игры преследования // Матем. сборник. - 1980. - Т. 112, № 3. - С. 307-330.
3. Красовский Н.Н. Управление динамической системой. - М.: Наука, 1985.
4. Алгоритмы и программы решения линейных дифференциальных игр / ред. А.И. Субботин, B.C. Пацко. - Свердловск: УНЦ АН СССР, 1984.
5. Patsko V.S., Botkin N.D., Kein V.M., Turova V.L., Zarkh M.A. Control of an aircraft landing in windshear // Journal of Optimization Theory and Applications. — 1994. - V. 83, N 2. - P. 237-267.
6. Patsko V.S., Turova V.L. Numerical solution of two-dimensional differential games: Preprint / IMM UrO RAN. Ekaterinburg, 1995. - 78 p.
7. Ива,нов Г.Е. Алгоритм решения нелинейной игровой задачи быстродействия // Фундаментальные и задачи проблемы современной математики: сб. науч. трудов / М.: МфТИ. _ 2011. - С. 49-76.
8. Двуреченский П.Е., Ива,нов Г.Е. Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с использованием конволюты // Труды МФТИ. - 2011.
- Т. 3, № 1. - С. 61-67.
9. Wein R. Exact and efficient construction of planar Minkowski sums using the convolution method // Proc. 14th European Symposium on Algorithms (ESA), LNCS. - 2006. - V. 4186.
- P. 829-840.
10. Flato E. Robust and efficient construction of planar Minkowski sums // Master’s thesis. School of Computer Science. Tel-Aviv University. — 2000.
Поступим в редакцию 30.01.2012.