Научная статья на тему 'Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания'

Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания Текст научной статьи по специальности «Математика»

CC BY
41
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ОПТИМАЛЬНАЯ СТРАТЕГИЯ / DIFFERENTIAL GAME / OPTIMAL STRATEGY

Аннотация научной статьи по математике, автор научной работы — Двуреченский Павел Евгеньевич, Иванов Григорий Евгеньевич

Разработан метод вычисления квазиоптимальных стратегий в нелинейной дифференциальной игре на нефиксированном отрезке времени с целевым множеством. В двумерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольников. Проведены детальные оценки погрешностей алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An algorithm for constructing of optimal strategy in a nonlinear differential game with a non-fixed completion time

We develop a method to compute quasioptimal strategies in a nonlinear differential game on a non-fixed time interval with a goal set. In two-dimensional case the play-attainable sets are calculated by an algorithm, similar to one for convolution of Minkowskis sum of two polyhedra. We provide detail error estimations of the algorithm.

Текст научной работы на тему «Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре c нефиксированным временем окончания»

УДК 517.977.8

П. Е. Двуреченский, Г. Е. Иванов

Московский физико-технический институт (государственный университет)

Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с нефиксированным временем окончания

Разработан метод вычисления квазиоптимальных стратегий в нелинейной дифференциальной игре на нефиксированном отрезке времени с целевым множеством. В двумерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольников. Проведены детальные оценки погрешностей алгоритма.

Ключевые слова: дифференциальная игра, оптимальная стратегия.

Основы теории дифференциальных игр с нулевой суммой заложены в работах Р. Айзекса [1], Л.С. Понтрягина [2], Н.Н. Красовского [3] и др. В настоящее время разработаны различные алгоритмы, вычисляющие цену игры и оптимальные стратегии управления [4] - [6]. Для линейных дифференциальных игр с выпуклым целевым множеством современные методы используют алгоритмы вычисления игровых множеств достижимости через опорные функции этих множеств. Если дифференциальная игра нелинейна, то игровые множества достижимости становятся невыпуклыми и аппарат опорных функций неприменим.

В настоящей работе предлагается алгоритм построения квазиоптимальной (или е-оптимальной) стратегии управления для нелинейной дифференциальной игры на нефиксированном отрезке времени с целевым множеством. Алгоритм использует конструкцию игровых множеств достижимости, похожую на конструкцию, используемую в [7]. В двумерном случае эти множества могут быть построены с помощью алгоритма, близкого к алгоритму построения суммы Минковского двух многоугольников с использованием конволюты [9] - [10]. Настоящая работа продолжает работу [8], в которой этот подход применяется для построения в-оптимальной стратегии управления для игры на фиксированном интервале времени.

Чрезвычайно высокая вычислительная сложность алгоритмов, используемых в теории дифференциальных игр, делает актуальной задачу анализа эффективности этих алгоритмов. Для анализа эффективности алгоритмов важно оценить их погрешности. В настоящей работе получены оценки параметра е, определяющего близость в-оптимальной стратегии к оптимальной в зависимости от параметров дискретизации.

1. Постановка задачи

Рассмотрим динамическую систему, описываемую дифференциальным уравнением

где Ь € [0, $] - время, чиело $ определяет максимальную продолжительность игры, х(Ь) € М” - фазовый вектор системы, управление первого игрока и(Ь) и второго игрока у(Ь) подчинены ограничениям

Предполагается, что заданы компактные множества Р С Мр, Q С М9 и непрерывные функции а : М” хР ^ М” и Ь : М” хQ ^ М”. Кроме того, вектограммы а(х, Р) = {а(х, и) : и € Р},

х(1) = а(х(£),и(£)) + Ь(х(£),у(£)),

(1)

и(1) € Р, У^) € Q.

(2)

Ь(х, О) = {Ь(х, V) : V € ^} выпуклы при всех х € М”. Пусть также задано компактное множество М С М”, которое будем называть целевым, или терминальным.

Пусть задан отрезок [£0,^1] С [0,$] и пусть для какой-то начальной позиции х(Ьо) = Хо € М” и каких-то измеримых управлений и : [£0,^1] ^ Р, V : [£0,^1] ^ Я абсолютно непрерывная функция х : [£0,^1] ^ М” почти всюду на отрезке [£0,^1] удовлетворяет уравнению (1). Если существует момент времени £ € [£0^1] такой, что х(Ь) € М, то будем говорить, что на отрезке [£0, £1] имеет место поимка. Иначе, то есть если х(Ь) € М при всех I € [£0,^1]) то будем говорить, что на отрезке [£0,^1] имеет место уклонение. Цель первого игрока состоит в минимизации числа §0 € [0, $] такого, что на отрезке [0, $0] обеспечена поимка. Цель второго игрока — обеспечить уклонение на отрезке [0, $] или, если это невозможно, максимизировать время §0 € [0, $] такое, что на отрезке [0, $0] обеспечено уклонение.

Расстоянием, от точки х € М” до множества К С М” называется величина

д(х,У) = т£ Уж - у\\. (3)

Будем говорить, что на отрезке [£0,^1] С [0, $] имеет место е-поимка, если существует такой момент времени £ € [£0,^1], что д(х(£),М) < е.

Будем предполагать, что функции а : М” х Р ^ М” и Ь : М” х ^ ^ М” удовлетворяют следующим условиям Липшица:

||а(жь«1) - а(х2,и2)\\ ^ ^\\х1 - х2\\ + ЩЦт - и2\

V х1,х2 € М”,

||Ь(Ж1,^1) - Ь(Х2,Ь2)\\ ^ Щ\х1 - Х2\\ + Ь'ъ\\Ы - Ь2\\

V Х1,Х2 € М”,

||а(ж,и)\ ^ Са V х € М”, и € Р;

||Ь(ж,^)\| ^ Сь V х € М”, V € Я.

Обозначим

С = Са + Сь, ь = Ьха + Ц.

2. Стратегии и законы управления

Пусть задан отрезок [£0, £1] С [0, $]. Множеством Ы[^0, ^1] допустимых реализаций управления первого игрока называется множество всех измеримых функций и : [£0^1] ^ Р. Множеством V[£0,^1] допустимых реализаций управления второго игрока называется множество всех измеримых функций V : [£0, £1] ^ ф-

Позиционной стратегией первого игрока называется произвольная

функция : М” ^ Р. Пусть Т = {тг}^=0 """"" разбиение отрезка

[£0,'£1] С [0,$] : £0 = г0 < т1 < ■■■ < т/ = Пар а (и^г,Т), составленная из позици-

онной стратегии первого игрока ивЬг и разбиения Т отрезка [^0, ^1] ? называется законом управления первого игрока на отрезке [£0,'£1]. Движением, соответствующим начальному состоянию ж(^) = Х0: закону управления (и^г,Т) и допустимой реализации управления V € V[£0,^1]) будем называть абсолютно непрерывную функцию ж : [£0^1] ^ М”, определяемую из пошагового уравнения

х(1) = a(ж(^),ustr (х(тг))) + Ь(х(Ь),у(Ь)), (9)

которое должно выполняться при почти всех £ € [тг,Гг+1 ] и всех г € 0,1 - 1. При этом начальная позиция для отрезка [т0,Т1] равна Ж0, а начальная позиция х(тг) для отрезка [т”г, Тг+1.] Совпадает С конечной позицией х(Тг) отрезка [Тг_1,Тг].

и1 ,и2 € Р; У1,У2 € Я;

К'*)

(5)

(6)

(7)

(8)

В силу принятых предположений при заданных начальной позиции ж(^) = Ж0, разбиении Т, позиционной стратегии первого игрока -и^г и допустимой реализации управления

V € V[£0^1] движение х(^) существует и единственно. Обозначим его следующим образом:

хт°\^0,х0,Т,и^,у)= х(£) V £ € [£0,£1]. (10)

Аналогично определяются позиционная стратегия второго игрока и движение

С°Ч*, *0, Х0,Т, и, О, соответствующее начальной позиции ж(^) = Х0, разбиению Т, допустимой реализации управления первого игрока и € и[£0, £1] и стратегии второго игрока и81*.

Будем говорить, что закон управления (-и^г, Т) гарантирует на отрезке [£0, £1]

для начального состояния Х0, если для любой реализации управления V € V[£0,^1] существует момент времени £ € [£0,^1] такой, что выполняется

в {хт°Ь(1,10,х0,Т,изЬг,у), М) < е. (11)

Закон управления (у^Д) гарантирует, уклонение на отрезке [£0,'£1] для начального состояния Ж0, если для любой реализации управления и € и[£0,^1] выполняется

жГЧМ0,®0,Т,и,0 /М V £ € [£0,^]. (12)

Пусть задано число е > 0 и законы управления (ustr,Ти), (vstr,ТУ) первого и второго игроков на отрезке [0, $]. Пара законов ((и^г,Ти), (у^Дъ)) называется е-оптимальной, если для любого начального положения Ж0 € М” такого, что д(х0,М) > е, выполняется альтернатива:

1) существует момент времени §0 € [0, $] такой, что закон управления (ь^ ,Ти) гарантирует е-поимку на отр езке [0, $0] 5 а закон управления (ь^Дъ) гарантирует уклонение на отрезке [0, $0], либо

2) закон управления (ь^Дъ) гарантирует уклонение на отрезке [0,$]

3. Алгоритм вычисления стратегии управления

Зафиксируем натуральное число I и рассмотрим равномерное разбиение Т = {тг}^=0 отрезка [0, $], где т% = гт, г € 0,1. Шаг т = $/1 разбиения Т будем также называть параметром дискретизации по времени.

Для любого множества 5 С М” определим множества

= {х € М” : 3 и € Р : ж + та(х, и) € 5}, (13)

Вв = {х € М” : V V € Я : ж + тЪ(х,у) € в}. (14)

Таким образом, определены операторы А и В, которые будем называть одношаговым,и операторам,и, достижимости.

Суммой и разностью Минковского множеств X С М” и У С М” называются соответственно множества

X + ¥ = {х + у : ж € X, у € ¥}, X- ¥ = {х € М” : ж + ¥ С X}. (15)

Для любого числа К > 0 через Вд обозначим замкнутый шар с центром в нуле и

радиусом Д: = {х € М” : ||ж|| ^ Я}.

Пусть £ - класс аппроксимирующих множеств, то есть подмножеств М”, с которыми работают алгоритмы и которые с достаточной точностью аппроксимируют игровые множества достижимости (о них речь пойдет ниже). Примером класса £ может служить класс М2

Предположим, что построены алгоритмы, которые для каждого множества 5 € £ с некоторыми погрешностями вычисляют множества АБ, Вв. Учитывая эти погрешности,

будем предполагать, что реально для каждого множества 5 € £ вычисляются множества АБ, В Б класс а £, удовлетворяющие условиям

А(Б - В£А) С Ав С А(Б + В£Л), (16)

В (Б - В£в) С В Б С В (Б + В£в), (17)

где числа £а, £в определяют погрешности этих алгоритмов. В случае, если класс £ состоит

из многоугольников в М2 с длиной сторон, не превосходящей И, в качестве алгоритмов вычисления множеств АБ, ВБ для 5 € £ могут быть использованы алгоритмы, построенные

в [8]. При этом оценки их погрешностей £а = 4И + Ь^Сат2, ев = 4И + Ь^С^т2 останутся справедливыми для рассматриваемой здесь задачи.

Предположим, что построен алгоритм, который для любых множества 5 С £ и вектора х € АБ позволяет определить вектор и = й(х, Б) € Р такой, что

х + та(х,й) € Б + В£и. (18)

Также предположим, что построен алгоритм, который для любых множества 5 С £ и вектора х € М” \ (ВБ) позволяет определить вектор V = ь(х, Б) € ф такой, что

х + тЬ(х,у) € (М” \ 5)+ В£г1. (19)

Здесь числа еи и еь определяют погрешности соответствующих алгоритмов. Для класса £, состоящего из многоугольников в М2 с длиной сторон, не превосходящей И, такие алгоритмы также построены в [8].

Зафиксируем некоторые векторы и* € Р, V* € ф и положим й(х, Б) = и* при х € АБ, ь(х, Б) = V* при х € В Б. Тем самым определены функции

и : М” х £ ^ Р, V : М” х £ ^ д. (20)

Обозначим

Д° = г2 (ЬС + ЦСа), Д0 = г2(^ , (21)

Ди = Д°и + £в + (1 + тЬ%)еи, Д = Д° + £а + (1 + тЬта)е,и. (22)

Пусть имеются алгоритмы, которые для любого множества 5 € £ вычисляют множества ОиБ € £, В,иБ € £ такие, что

^ - Вди+£л С БиБ С Б - Вди, 5 + В д С ОьБ С Б + В д +£л, (23)

где число ев определяет погрешность этих алгоритмов. Будем также предполагать монотонность по включению операторов Ии и Иу, то есть

ОиБ1 С ОиБ2, ^Б1 С Б2 V Б1,Б2 € £ : ^ С ^ (24)

Зафиксируем положительное число е.

Определим множества € £, Мд € £ так, что

М + В£-£м С С М + В£, (25)

М + ВтС С М0 С М + ВтС+£м. (26)

Здесь число ем € (0, е) определяет погрешность начальной аппроксимации.

Двигаясь в сторону увеличения индекса г и используя описанные выше алгоритмы, вычислим наборы игровых множеств достижимости {М“}^=0, {М? }^=0:

М“+1 = (АВОиМ?) иМ?, г € 0,1 - 1, (27)

М?+1 = (ВАО,иМ.У) и М?, г € 0,1 - 1. (28)

Отметим, что из этих определений следуют включения

С М“+1, М? С М?+1 V г € 0,1 - 1. (29)

Используя функции (20) и игровые множества достижимости, определим позиционные стратегии управления. Для любого вектора х € М” \ положим

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

і(х) = шах{г є 0,1 — 1 : х^ М?}, (30)

а для любого х є М™ \ М^ обозначим

І(х) = шах{і є 0,1 — 1 : хЄ М]+1}. (31)

Теперь для любого х Є М™ определим

{и*, х є М?,

и8*г(ж) = ^ ( ~ \ (32)

\й[х,В£„М“х)] , х Є М™ \ М?,

,.*г^ _ )У*, Х Є М1 ,

;(ж, АИъМ?(х)) , х є М™ \ М1

ьвгг(х) = 1 і ~ \ 1 (33)

4 ' I ~ I _ Л Л /Гї) \ ~ ТГЪП \ Ъ /Г1) ' '

Определим числа

До = Д? + Д + 2(єа + є в + є о), (34)

єо = т(С + Сь) + 2єм + Д? + + (тСь + До(! — 1))є(^ т)^. (35)

Теорема 3.1. Пусть і є 0,1, Хо є М?, стратегия ивЬг определена соотношением (32).

Тогда, закон управления (иБІГ,Т) гарантирует є-поимку на отрезке [0,Ті] для, начального

состояния х(0) = х0.

Теорема 3.2. Пусть г є 0,1 — 1, х0 є М?, стратег ия увЬг определена соотношением (33). Тогда, закон управления (уБІГ,Т) гарантирует уклонение на отрезке [0,ті+1] для, начального состояния х(0) = х0.

Теорема 3.3. Пусть є ^ є0, число т выбрано так, что тПХ < 2- Тогда,

М? С М? V г € 0,1 - 1. (36)

Теорема 3.4. Пусть стратегии определены соотношениями (32), (33). Пусть

число е ^ тС + 2ем вы,бра,но так, что выполняется условие (36). Тогда, пара законов управления ((-и^г,Ти), (^^,Т0)) является £-оптимальной.

4. Доказательство теорем 3.1^3.4

Лемма 4.1. Для любых множества Б С М” и числа, 8 > 0 операторы (13), (14) удовлетворяют соотношениям

АБ + Вг С А(Б + В(1+Т^)г), (37)

ВБ + Вг С В(Б + В(1+тЬ,)й). (38)

Доказательство. Пусть х € АБ + В<$. Тогда существует вектор у € АБ такой, что Цу - хЦ ^ £. В силу равенства (13) существует вектор и € Р такой, что у + та(у,и) € Б.

Отсюда в силу соотношения (4) получаем включение х + та(х,и) € Б + В(1+г^^)^.

Следовательно, х € А(в + В(1+т^^)^), что доказывает включение (37). Включение (38) доказывается аналогично. □

Лемма 4.2. Пусть тЩ < 1. Тогда для любых множества Б С М” и числа, 5 > 0 оператор (14) удовлетворяет включению

ВБ - Вг/(1-г^) С В(Б - Вё).

Доказательство. Пусть х € ВБ - В§/(1-Ть^у Тогда для любых V € <^, г € В§/(1-ть^) имеем х + г + тЪ(х + г, V) € Б. Зафиксируем произвольные V € д,у € В<$. Рассмотрим отображение Р(г) = тЬ(х, ь)+у-тЬ(х+г, V). Так как тЬ% < 1, то это отображение является сжимающим. Следовательно, существует его неподвижная точка 20 = тЬ(х,ь)+ у - тЬ(х + 20, ь). При этом ||20|| = ЦтЬ(х,у) + у - тЬ(х + 20,^)|| < 5 + тЩ ||г0|, откуда получаем, что х0 € Вг/(1-Г££). Тжим образом, получаем, что х + тЬ(х, у) + у = х + г0 + тЬ(х + г0,у) € Б. Отсюда, в силу произвольности выбора V € ф и у € В<$, следует, что х € В(Б - В$). □

Для любых £0 € [0, $], ^ € [£0, '&],х0 € М”, и € и[£0, ^], ^ € V[£0, ^] обозначим

х(Ъ,10,х0 ,и, V) = х(Ъ) V t € [£0,^],

где х : [^0, ^1] ^ М” - решение задачи Коши:

ж(£) = а(ж(£), «(£)) + Ъ(х(Ъ), v(^)),

с начальным условием ж(^) = Ж0.

Проводя рассуждения, близкие к доказательству леммы 5.1 из [7], получаем следующую лемму.

Лемма 4.3. Пусть заданы числа, т € (0,$),'£0 € [0, $ - т], вектор х0 € М” и функции и € и[£0,£0 + т],у € V[£0,£0 + т]. Пусть

Хи — Ж0 +

-*0+т

a(x0,u(t))dt, (39)

%1 = Х(^0 + т,Ь0,Х0,и,у). (40)

Тогда, существует вектор и0 € ф такой, что вектор

х™ = хи + тЬ(хи, У0) (41)

удовлетворяет неравенству

Цх^ - Ж1| < Д°, (42)

где число Д°и определено равенством (21).

Аналогичная лемма верна для векторов хь,хуи, определенных аналогично.

Лемма 4.4. Пусть Жо € М+ \ М™, стратег ия определяется соотношением (32), г € 0,1 - 1, V € V[0,т], Ж1 = х^(т,0,х0,Т,и^,у). Тогда Х1 € М?.

Доказательство. Определим функцию и € Ы[0, т] формулой

и(Ъ) = «^(жо) V t € [0,т]. (43)

Тогда справедливо равенство (40), где £о = 0. Из включения жо € М+1 \ М“ и равенства (27) получаем жо € АВОиМ?. В силу равенства (30) и включений (29) имеем г(хо) = г. Отсюда и из соотношений (18), (32) следует включение Жо + та(хо, и^г(хо)) € ВОиМ?+В£и. Поэтому согласно равенству (43) получаем, что вектор хи, определяемый формулой (39), удовлетворяет включению

Хи € ВБиМ11 + В£и. (44)

В силу леммы 4.3 существует вектор Ьо € ф такой, что для вектора

— %и + тЬ(хи,Ьо) справедливо неравенство (42). Согласно включениям (17) и (38) имеем В ИиМи + С В (Ии Ми + В£в) + В£и С Б(£иМ“ + В£в + В£и (1+гь*))-

Отсюда, из определения (14) оператора В и (41), (44) получаем

+ тЬ(Хи,Уо) € ОиМи + Вев + В£и(1+гЬ*).

Далее, учитывая (42), (22), (23), получаем

Ж1 е ОиМ11 + Вев + В£и(1+тЬ*) + ВД° С ми — Вев +е„(1+тЬр+Д° + Вев +еи(1+тЬ*)+Д0 С Ми

Проводя рассуждения, аналогичные доказательству леммы 4.4, получаем следующую лемму.

Лемма 4.5. Пусть х0 € М?+2 \ М?+1, ] € 0,1 — 2 или ] — I — 1, х0 € М™ \ М}1. Пусть стратегия определяется соотношением (33), и € Ы[0,т], ж1 — хгт°ь(т, 0,хо,Т,и,увЬг). Тогда х1 € М?.

Лемма 4.6. Пусть х0 € Мг?+1 \ М“, стратегия определяется соотношением

(32), г € 0,1 — 1, V € V[0,Тг+1]. Тогда, существует индекс ] € 0, г + 1 такой, что х™1^, 0, жо, Т, и81г, V) € М0и.

Доказательство. Будем доказывать утверждение по индукции. При г — 0 утверждение верно по лемме 4.4. Зафиксируем т € 0,1 — 1. По предположению индукции утверждение

верно для всех г € 0,т — 1. Нужно доказать, что оно будет верным и для г — т. Пусть

ж0 € М'ии++1 \ М“, V € V[0,тт+1]. Требуется доказать, что

3 ] € 0,т + 1 : xrm°Ь(тj, 0, ж0, Т, и^г, у) € М^. (45)

Обозначим ^[о,г] сужение функции V : [0, гт+1] ^ ^ на отрезок [0,г]. Тогда по лемме 4.4 ж1 — хт°ь(т, 0, жо, Т, и^г, ^[о, г]) € М“. Если ж1 € Ми, то соотношение (45) выполнено при ] — 1. Если Ж1 € Мои, то из включений (29) следует, что существует такой номер в € 0,т — 1, что Ж1 € М]+1 \ М’ии. Тогда по предположению индукции утверждение леммы выполнено для жо — Х1,г — в. То есть существует такой номер к € 0, 8 + 1 С 0, т, что

ж™^, 0, Х1,Т, и^г, й) € Мои,

где г>(£) — + т) для £ € [0, ]• Отсюда в силу отсутствия явной зависимости от времени

в уравнении динамики (1) и равенства Ж1 — хгт°^(т, 0,хо,Т,ивЬг,и^о,т]) получаем, что

С°Ч^+1, 0,хо,Т,ивЬг,у) € Мои, и соотношение (45) выполнено при ] — к + 1 □

Лемма 4.7. Пусть г € 0,1 — 1, хо € М?+1. Пусть стратегия определяется соотношением (33). Тогда для, любой функции и € Ы[0,т] выполнено соотношение х™*(т, 0,Хо,Т,и,у^) € М?

Доказательство. Из условия жо € Мг+ и включений (29) следует, что либо существует такой номер ] € г,1 — 2, что Жо € М?+2 \ М?+1, либо Жо € М? (в этом случае положим ] — I — 1). Тогда по лемме 4.5 получаем, что

жГ(т, 0, хо,Т, и, у^г) € М^ V и € и[0, т].

Лемма 4.8. Для, любого Б С М™ выполнены включения

Б С В(Б + ВтСь), ВБ С Б + Втсь.

(46)

(47)

Доказательство. Докажем включение (46). Пусть у € Б. Из соотношения (7) следует, что для любого V € ф справедливо включение у + тЬ(у, ь) € Б + Втсь- Отсюда по определению (14) оператора В следует, что у € В(Б + В тСъ).

Докажем включение (47). Пусть у € ВБ. По определению (14) оператора В это означает, что для любого V € ф выполнено включение у + тЬ(у, V) € Б. Отсюда и из соотношения (7) получаем у € Б + Втсь- □

Проводя рассуждения, близкие к доказательству леммы 5.9 из [7], получаем следующую лемму.

Лемма 4.9. Для любого Б С М™ выполнено включение

М? + Ве-тс-2ем С М + ВтС'+ем + В-тс-2ем — М + В£-£м С Мои. Отсюда, используя соотношения (23), получим включения

Из равенств (35) и (48) следует, что го + т(С + Сь) + 2ем + Ди + — £о ^ £■ Отсюда и из

включения (50) получаем, что доказываемое включение (49) справедливо при ] — 0.

Пусть теперь включение (49) справедливо при ] — г € 0,1 — 2, то есть

Требуется доказать, что включение (49) выполняется и при ] — г + 1. Используя (51), с учетом леммы 4.2 и включения (17) получаем

ВБиБ — Втсь С Б.

Для любого индекса г € 0,1 — 1 определим число

П — (тСь + (1 — г — 1)До)е(/-г-1)тЬ.

(48)

Лемма 4.10. Пусть выполнены неравенства тЬ% < е > ео, где ео определено равен-

ством (35). Тогда для, любого ] € 0,1 — 1 выполнено включение

М] + В. С ВИиМи.

(49)

Доказательство. Будем доказывать утверждение по индукции. Из включений (25), (26) получаем следующую цепочку включений:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М? + Вг. С ВБиМОи.

(51)

Отсюда с учетом (23) имеем

то есть И?МО? + В Р1 С ВОиМги, где

рг — гг — Д? — — /(1 — ).

(52)

Учитывая включение (16), получаем

А(Б?М" + В*^) С А(ВОиМ? — Я£А) С АВОиМ?. (53)

Из включений (16) и (37) следует, что

АВ?М." + в(р._2еа)/(1+ть%) с А(В?М." + Ва) + в(р{_2еА)/(1+тЬ£) С А(В?М." + В№_^).

Из включений (53), (27) получаем АВ?М" + В(р._2еа)/(1+ть^) С АЁВиМи С М"+1. Введя обозначение

г. = г.е т^а — А? — £в — 2£а — /(1 — 'тLfr), (54)

из равенства (52) получаем неравенство г. < (р. — 2еа)/(1 + тЩ). Следовательно,

АВ?М" + В^ С М"+1. Используя соотношения (23), из последнего включения получаем

АО?М" + Вгг_^_£в С М+1 — Вди+£о С В.аМ и+1. (55)

Введем обозначение

Г" = (Г" — Аи — — £в )/(1 + ТЩ). (56)

Используя соотношения (17), (38) и (55), получаем включения

ВАВ?М" + В = С В(АВ?М" + В£в) + В{^_ди_£о_в)/(1+^) С ВВиМ^. (57)

Так как г" < г., то из включений (24), (29), (51) получаем

М" + В = С М" + Вг, С ВВиМи С ВВиМ+1. (58)

Из соотношений (27), (57) и (58) имеем

М"+1 + В = = ((ВАВ?М") и М?) + В = = (ЁАВ?М" + В =) и ( М.? + В =) С ВВиМ+1. (59)

Из (48) следует неравенство г.+1 < — А0. В силу равенств (34), (54), (56) и неравен-

ства тЩ < 2 справедливо неравенство r"e_тL — А0 < г.. Поэтому г.+1 < г.. Отсюда и из соотношений (59) получаем, что включение (49) выполнено для ] = г + 1 □

Доказательство теоремы 3.1. Если х0 € М^, то утверждение теоремы следует из соотношений (25). Если хо € М^, то в силу включения хо € Ми получаем неравенство г > 0 и существование такого номера т € 0, г — 1, что х0 € М^+1 \ М^- Пусть задана функция V € V[0,тт+1]. Тогда по лемме 4.6 (где положим г = т) существует такой номер j € 0, т + 1, что

х.Т\тэ, 0, хо,Т, и8Ьт, V) € М0и. (60)

Это означает, что гарантируется е-поимка на отрезке [0,тт+1] С [0,г.^ □

Доказательство теоремы 3.2. Зафиксируем произвольную функцию и € Ы[0,T"+1]. Обозначим х(Ъ) = ж.^(£, 0,хо,Т,и,увЬг), £ € [0,т"+l]. Применяя лемму 4.7, по индукции получаем, что х(^) € М"_ ^ при ] € 0, г. Отсюда и из включений (29) следует, что х(^) € М" для любого ] € 0, г. Предположим, что утверждение теоремы неверно. Тогда существует такой момент времени £ € [0,т.+1^ что ж(£) € М. Выберем индекс ] € 0, г из условия ^ ^I < т. Тогда в силу (1), (6), (7) справедливо неравенство \\x(тj) — ж(£)|| < тС. Отсюда

и из включений (26) следует, что х(^) € М + Вгс С М". Противоречие. □

Доказательство теоремы 3.3. Пусть выполнено неравенство е > е0. Зафиксируем произвольное г € 0,1 — 1. По лемме ^^^0 выполнено включение М" + ВГ1 С ВВиМУ. Из равенств (48) следует неравенство г. > тСъ- Поэтому М" + Втсъ С ВВиМУ. Отсюда получаем, что М. С ВВиМи — Вгсъ, и с учетом леммы 4.9 справедливо включение М. С Ми.

Доказательство теоремы 3.4. Пусть задан вектор х0 € М™ такой, что д(х0,М) > е.

{и_

Тогда в силу (25) имеем х0 € М0*. Если х0 € М^ 17 то существует номер г €0,1 — 2 такой,

что х0 € М+ \ М™. Так как х0 € М"^, то то теореме 3.1 закон управления (и^,Т) гарантирует е-поимку на отрезке [0,т^ 1] для начального состояния ж(0) = Ж0- Так как ж0 € Ми и, согласно соотношению (36), М" С М“, то ж0 € М" и по теореме 3.2 закон

управления (увкт,Т) гарантирует уклонение на отрезке [0,т^ 1] для начального состояния ж(0) = Ж0- Таким образом, выполняется первый пункт альтерната вы в определении е-оптимальной пары стратегий.

Пусть теперь ж0 € М'и_Г Тогда согласно (36) имеем ж0 € М"_ 1. Отсюда по теореме 3.2 закон управления (у31*, Т) гарантирует уклонение на отрезке [0, $] для начального состояния ж(0) = Ж0, то есть реализуется второй пункт альтернативы. □

5. Примеры классов аппроксимирующих множеств

Покажем, что теоремы 3.1-3.4 могут быть использованы для получения оценок погрешностей алгоритма, изложенного в работе [7]. Поскольку при доказательстве теорем 3.1-3.4 не использовался конкретный вид нормы, то, в частности, так же как и в работе [7], в качестве нормы в М™ можно рассмотреть шах-норму: ||ж|| = шах.1х.1- При этом шаром Вд будет куб с центром в нуле и с ребрами длиной 2Д. Пусть С - кубическая сетка в М™ с шагом к. Каждому сеточному множеству 5 С С сопоставим телесное множество £ (Б) С М™, равное объединению к убов в М™ с ребрами дл ины к и центрами в точках множества Б. Будем рассматривать класс аппроксимирующих множеств £ = {£(Б) : 5 - ограниченное подмножество С}. Используя обозначения [7], введем для любого 5 € £ множества

15 = £(Ги(Б П С)), ВБ = £(^?(5 П С)).

Легко получить (в обозначениях [7]), что 8а = тКи5 + (1 + тЬи)к/2,

ев = тК?5 + (1 + тЬ?)к/2. Для погрешностей расчета управлений выполняются оценки еи = (1 + тЬи)к/2,е? = (1 + тЬ?)к/2. При ев = 3к/2 выполненяются включения (23) для операторов

БиБ = £(5 П С — ВДи+£л ), Б?Б = £(5 П С + ВД^+л).

Для ем = к выполняются включения (25), (26) для множеств Ми,М", определенных следующим образом:

М0и = £((М + В£_К/2) П С), М" = £((М + Втс+н/2) П С).

Подставляя эти оценки в формулу (35), получим, что при стремлении т,к,ё к нулю погрешность £0 по порядку величины совпадает с результатом работы [7]. Из полученной оценки, так же как ив [7], следует, что для получения достаточно малой погрешности необходимо выбирать достаточно малыми параметры к, т, £, причем так, чтобы отношение к/т было достаточно малым.

Для класса аппроксимирующих множеств £ состоящего из многоугольников в М2 с длиной сторон, не превосходящей к, при реализации операторов А, В можно исплользо-вать алгоритмы, построенные в [8]. При этом в случае евклидовой нормы для погрешностей £м,£о,£и,£?,£а,£в вспомогательных алгоритмов, использующих конволюту, будут справедливы следующие оценки:

( к2 к2

ем = к, еи = тах|8А, 8А / , ^ = 4к + т2ЬхаСа, ев = 4к + т2ЦСъ,

£и = л/(£а + к/2)2 + к2/4, е? = у/(ев + к/2)2 + к2/4.

Работа выполнена при поддержке РФФИ, грант 10-01-00139 и ФЦП «Научные и научнопедагогические кадры инновационной России».

Литература

1. Айзекс Р. Дифференциальные игры. - М.: Мир, 1967.

2. Понтрягин Л. С. Линейные дифференциальные игры преследования // Матем. сборник. - 1980. - Т. 112, № 3. - С. 307-330.

3. Красовский Н.Н. Управление динамической системой. - М.: Наука, 1985.

4. Алгоритмы и программы решения линейных дифференциальных игр / ред. А.И. Субботин, B.C. Пацко. - Свердловск: УНЦ АН СССР, 1984.

5. Patsko V.S., Botkin N.D., Kein V.M., Turova V.L., Zarkh M.A. Control of an aircraft landing in windshear // Journal of Optimization Theory and Applications. — 1994. - V. 83, N 2. - P. 237-267.

6. Patsko V.S., Turova V.L. Numerical solution of two-dimensional differential games: Preprint / IMM UrO RAN. Ekaterinburg, 1995. - 78 p.

7. Ива,нов Г.Е. Алгоритм решения нелинейной игровой задачи быстродействия // Фундаментальные и задачи проблемы современной математики: сб. науч. трудов / М.: МфТИ. _ 2011. - С. 49-76.

8. Двуреченский П.Е., Ива,нов Г.Е. Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с использованием конволюты // Труды МФТИ. - 2011.

- Т. 3, № 1. - С. 61-67.

9. Wein R. Exact and efficient construction of planar Minkowski sums using the convolution method // Proc. 14th European Symposium on Algorithms (ESA), LNCS. - 2006. - V. 4186.

- P. 829-840.

10. Flato E. Robust and efficient construction of planar Minkowski sums // Master’s thesis. School of Computer Science. Tel-Aviv University. — 2000.

Поступим в редакцию 30.01.2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.