УДК 517.977.8
П.Е. Двуреченский, Г.Е. Иванов
Московский физико-технический институт (государственный университет)
Алгоритм построения оптимальной стратегии в нелинейной дифференциальной игре с использованием конволюты
Разработан метод вычисления квазиоптимальных стратегий в нелинейной дифференциальной игре на фиксированном отрезке времени с целевым множеством. В двумерном случае игровые множества достижимости вычисляются с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольников. Проведены детальные оценки погрешностей алгоритма.
Ключевые слова: дифференциальная игра, оптимальная стратегия.
Основы теории дифференциальных игр с нулевой суммой заложены в работах Р. Айзекса [1], Л.С. Понтрягина [2], Н.Н. Красовского [3] и др. В настоящее время разработаны различные алгоритмы, вычисляющие цену игры, и оптимальные стратегии управления [4-6]. Для линейных дифференциальных игр с выпуклым целевым множеством современные методы используют алгоритмы вычисления игровых множеств достижимости через опорные функции этих множеств. Если дифференциальная игра нелинейна, то игровые множества достижимости становятся невыпуклыми, аппарат опорных функций становится неприменимым. В работе [7] для нелинейной дифференциальной игры с липшицевой функцией платы предложен алгоритм построения ква-зиоптимальной стратегии управления с помощью пошагового минимакса.
В настоящей работе предлагается алгоритм построения квазиоптимальной (или е-оптимальной) стратегии управления для нелинейной дифференциальной игры на фиксированном отрезке времени с целевым множеством. Алгоритм использует попятную конструкцию построения игровых множеств достижимости. В двумерном случае эти множества могут быть построены с помощью алгоритма, близкого к алгоритму построения конволюты суммы Минковского двух многоугольников [10,11].
В силу чрезвычайно высокой вычислительной сложности алгоритмов, используемых в теории дифференциальных игр, и для анализа эффективности этих алгоритмов важно оценить погрешности алгоритмов. Оценкам погрешностей алгоритмов в теории дифференциальных игр посвящены работы [12, 14]. В настоящей работе по-
е
е
зависимости от параметров дискретизации алгоритма.
I. Постановка задачи
Рассмотрим динамическую систему, описываемую дифференциальным уравнением
x(t) = a(t, x(t), u(t)) + b(t, x(t),v(t)), t G [0, 0], (1.1)
на фиксированном отрезке времени [0,0], где t
— время, x(t) G Rn — фазовый вектор системы, управление первого игрока u(t) и второго игрока v(t) подчинены ограничениям
u(t) G P, v(t) G Q У t G [0, 0]. (1.2)
Предполагается, что заданы компактные множества P, Q и непрерывные функции a : [0,0] х х Мп х P ^ М" и b : [0,0] х Мп х Q ^ М". Кроме того, вектограммы a(t,x,P) = {a(t,x,u) : u G P}, b(t, x, Q) = {b(t, x,v) : v G Q} выпуклы при всех t G G [0,0], x G М". Пусть также задано компактное множество M с М", которое будем называть целевым, или терминальным.
Пусть для какой-то начальной позиции x(t0) = = x0 G М" и каких-то измеримых управлений u: [0,0] ^ P, v: [0,0] ^ Q абсолютно непрерывная функция x : [0,0] ^ М" почти всюду на отрезке [0,0] удовлетворяет уравнению (1.1). Если в конечный момент времени выполняется x(0) G G M, то будем говорить, что в игре имеет место поимка. Если в конечный момент времени выполняется x(0) G M, то будем говорить, что в игре имеет место уклонение. Цель первого игрока состоит в поимке, цель второго игрока — в уклонении.
Расстоянием от точки x G М" до множества
Y с М" называется величина
g(x,Y) = inf ||x - y|| . (1.3)
y£Y
Будем говорить, что в конечный момент времени имеет место е-поимка, если g(x(0),M) ^ е.
Работа выполнена при поддержке РФФИ, грант 10-01-00139а, ФЦП «Научные и научно-педагогические кадры инновационной России» и АВЦП «Развитие научного потенциала высшей школы».
Будем предполагать, что функции а : [0, 0] х х М" х Р ^ М" и Ь : [0,0] х М" х Q ^ М" удовлетворяют следующим условиям Липшица:
^а(11,х1,п1) — а(12,Х2,П2)\\ <
^ ^а1^1 - ^2 | + Щ\\х1 — х2 \| + Р'и\\и\ — и2 \|
VЬ1,Ь2 € [0,0], х1 ,х2 € М", и1,и2 € Р; (1-4)
\\Ь(tl,Хl,Vl) - Ь(Ь2,х2,У2)\\ <
^ Ь^1 — t2| + Щ\\х1 — х2 \| + Щ Ц-У1 — ^\|
Vtl^2 € [0,0], х1,х2 € М", «1,«2 € Q; (1-5)
\\а(г, х, и)\| ^ Са Vг € [0,0], х € М", и € Р; (1-6)
\\Ь(г,х,'и)\\ < Сь Vг € [0,0], х € М", V € Q- (1-7)
Обозначим
C = Ca + Cb, L = LX + LX.
(1.8)
II. Стратегии и законы управления
Пусть задано число t0 G [0,0]. Множеством U[to,0] допустимых реализаций управления первого игрока называется множество всех измеримых функций u : [to,0] ^ P. Множеств ом V [to,0] допустимых реализаций управления второго игрока называется множество всех измеримых функций v : [t0,0] ^ Q.
Пусть заданы число t0 G [0,0) и начальное состояние x(t0) = x0. Пусть T = {ri}Ii=0 — разбиение отрезка [t0,0] : t0 = т0 < т1 < ■ ■ ■ < rj = =0
T
зывать набор функций uT1 = {ufr : М" ^ P}J=o. Движением, соответствующим начальному состо-x(t0) = x0 T
игрока uT и допустимой реализации управления v G V[t0,0^, будем называть функцию x : [t0,0] ^ ^ М", определяемую из пошагового уравнения
x(t) = a(t, x(t), usTI(x(ri))) + b(t, x(t), v(t)), (2.9)
tG
G [ri, ri+i] и всех i G 0,1 — 1. При этом начальная позиция для отрезка [тз, т1] равнa x0, а начальная позиция x^) для отрезка [т.1,т.1+1] совпадает с конечной позицией x(т-i) отрезка [т,/-1,т,\.
В силу принятых предположений при заданных начальной позиции x(t0) = x0, разбиении T, стратегии первого игрока uTT и допустимой реализации управления v G V[t0, 0] движение x(^) существует и единственно. Обозначим его следующим образом:
xrm°t(t,t0,x0,T,uTr,v) = x(t) Уt G [t0,0]. (2.10)
Аналогично
определяются кусочно-постоянная
str
стратегия второго игрока ^ , соответствующая разбиению Т, и движение x'mot(t,t0,x0,T,u,v?|^r), соответствующее начальной позиции х(г0) = х0,
разбиению Т, допустимой реализации управления первого игрока и € Ы[го,0] и кусочно-постоянной стратегии второго игрока v;S^г.
Будем говорить, что кусочно-постоянная стратегия и^1 гарант,ирует е-поимку для начального хо
ления V € V[0,0] выполняется
в (xrm°t(d, O, x0, T, v), M) ^ є.
(2.11)
Будем говорить, что кусочно-постоянная стратегия vs^г гарантирует уклонение для начального
хо
ления и €Ы[0, 0] выполняется
xmot(&, o, x0, t, u, vf) е M.
(2.12)
Пара кусочно-постоянных стратегий (и?£Тг) нае
ного состояния х0 € М" выполняется хотя бы одно из условий:
1) стратегия и^г гарантирует е-поимку или
2) стратегия vS^г гарантирует уклонение.
III. Алгоритм вычисления стратегии управления
Зафиксируем натуральное число I и рассмотрим равномерное разбиение Т = {т1}\=0 отрезка [0,0], где т = гт, г € 0,1. Шаг т = 0/1 разбиения Т
ции по времени.
Для любого множества Б С М" и любого индекса г € 0,1 — 1 определим множества
Л^Б = {х € М" : 3 и € Р : х+та(т\, х, и) € Б}, (3-13)
БіБ = {х Є К" : V V Є Q : х + тЬ(ті, х, V) Є Б}.(3.14)
Таким образом, определены операторы Бі, которые будем называть одношаговыми операторами достижимости.
Суммой и разностью Минковского множеств X с К" и У С К" называются соответственно множества
X + Y = {x + у і x е X, у е Y}, X - Y = {x е М" і x + Y С X}.
(3.15)
Заметим, что если функции а(Ь,х,п) и Ь(і,х^)
х
говые операторы достижимости выражаются через операции Минковского. Действительно, пусть а(Ь,х,п) = а(Ь,п), Ь(Ь,х^) = Ь(Ь^). Тогда согласно равенствам (3.13), (3.14) имеем
ЛіБ = Б + (-га(п, Р)), БіБ = Б - тЬ(П, Q).
(3.16)
Для любого числа Е > 0 через обозначим замкнутый шар с центром в нуле и радиусом Е:
Вп = {х Є К" : ||х|| < К}.
(3.17)
Пусть £ — класс множеств вМ", с которым
работают алгоритмы. Примером класса £ может
М2
В параграфе V будут рассмотрены алгоритмы, которые для каждого множества Б € £ и для каждого индекса г € 0,1 — 1с некоторыми погрешностями вычисляют множества АгБ, БгБ. Учитывая эти погрешности, будем предполагать, что реально
Б€£
жества АгБ, 13гБ класса £, удовлетворяющие условиям
А(Б — ВЕА) С АБ С А.(Б + ВЕА), (3.18)
Б.(Б — Вев) С Б Б С Б.(Б + Вев), (3.19)
где числа ед, ев определяют погрешности этих алгоритмов.
Опишем метод, который для любых множества Б С £, индекса г € 0,1 — 1 и вектора х € АгБ позволяет определить вектор щ = щ(х, Б) € Р такой, что
х + та(тг,х,й) € Б + ВЕи - (3.20)
Зафиксируем номер г € 0,1 — 1 и точку х € АгБ. Тогда в силу соотношения (3.18) имеем х € Аг(Б + + ВЕА). Поэтому согласно равенству (3.13) существует такой вектор и € Р, что х + та(тг, х, и) € € Б + ВЕА. Это означает, что
(Б + ВЕА — х) П (та(т., х, Р)) = 0-
Аппроксимируем множество та(тг,х,Р) многогранником Р таким, что Р С та(тг,х,Р) С Р + + №$р. Приблизим шар ВЕ,а вписанным в него многогранником ВЕи. Задача нахождения управления при этом сведется к поиску пересечения двух многогранников Б + ВЕи — х и Р, что легко осуществить алгоритмически. Число еи > ед подберем таким образом, чтобы пересечение этих двух многогранников было заведомо непусто. Это возможно, так как реальные множества Б + В£А —
— х и та(тг,х,Р) имеют непустое пересечение, а погрешность, вносимую приближениями шара и вектограммы, мы компенсируем увеличением радиуса шара В£и, прибавляемого к множеству Б.
Аналогичным методом для любых множества Б С £, индекса г € 0,1 — 1 и векторах € М"\(БгБ) найдем вектор 'дг = V^(x, Б) € Q такой, что
х + тЬ(ті, х, VI) Є (К" \ Б) + В
(3.21)
Здесь числа еи и еу определяют погрешности соответствующих алгоритмов.
Зафиксируем некоторые векторы и* € Р, v* € € ^ ^ можим щ(х,Б) = и* при х € АгБ,
'дг(х,Б) = v* при х € БгБ. Тем самым при всех г € 0,1 — 1 определены функции
щ : М" х £ ^ Р, гдг : М" х £ ^ Q- (3.22)
Обозначим
2
2
д0 2 I РС . т х ^а
= т I ~^ + Ьа СЬ + ~2
(3.23)
Ди = Д-и + ев + (1 + тLъ)еu, (3 24)
+ еД + (1 + тРХ)еь -
Пусть имеются алгоритмы, которые для любого множества Б € £ вычисляют множества ВиБ € £, ВуБ € £ такие, что
б - Вд„+ад С ВиБ с б - Вд„ б + Вд„ с вуб С б + Bдv+ео,
(3.25)
где число ер определяет погрешность этих алгоритмов.
е
Определим множества Ми € £, Му € £ так,
что
М + ВЕ-ЕМ С Ми С М + ВЕ, (3.26)
М С МУ С М + ВЕМ - (3.27)
Здесь число ем € (0,е) определяет погрешность начальной аппроксимации.
г
и используя алгоритмы параграфа V, вычислим наборы игровых множеств достижимости {Ми}1.-!, {МУ}£!:
ми = АВіВиШи
му = БіАіВу шу+1.
(3.28)
(3.29)
Для любых і Є 0,1 — 1и х Є К", используя функции (3.22) и игровые множества достижимости Ши, му, вычисленные алгоритмами параграфа V, определим
щ(х) = щ(х, ВіВиШи+1), (3.30)
і(х) = ~оі(х, АіВуШ+).
(3.31)
Теорема 3.1. Пусть х0 Є Ш^, стратегия и^г = = {иі}і=-о определена соотношением (3.30). Тогда стратегия и|$г гарантирует є-поимку на отрезке [0,0] для начального состояния х(0) = х0. □
Теорема 3.2. Пусть хо Є К" \ Ш%, стратегия vT'r = {и}- определена соотношением (3.31). Тогда стратегия и^г гарантирует уклонение на отрезке [0,0] для начального сост ояния х(0) = х0. □ Определим числа
С\ = 2СЬ +
и
+ 0 (^С + ЬХаСЬ + ЩЬСа + ^ ^ ЩЬ^ , (3-32)
ео = (С 1т + 2ем +
+ (3ед + 3ев +2ер + 2еи + 2еу )1)- (3-33)
Теорема 3.3. Пусть е > е0. Тогда пара кусочно-постоянных стратегий (и^^^) является е-оптимадьной. □
IV. Доказательство теорем 3.1-3.3
БС
С М", индекса г € 0,1 — 1 и числа 3 > 0 операторы (3.13), (3.14) удовлетворяют соотношениям
А.Б + В С А.(Б + Я^+тьяв), (4.34)
Б.Б + В С Б.(Б + В{1+тЬ*ь)6)- (4.35)
□
Доказательство. Пусть х € А. Б + Тогда существует вектор у € А. Б такой, что \\у — х\\ ^ ^ 3. В силу равенства (3.13) существует вектор и € Р такой, что у + та(тг,у,и) € Б. Отсюда в силу соотношения (1.4) получаем включение х + + та(тг,х,и) € Б + В(1+тьх)з. Следовательно,
х € А. (Б + В(1+Т£я)$), что доказывает включение (4.34). Включение (4.35) доказывается аналогично. ■
Для любых г0 € [0,0], г1 € [г0,0],хо € М",и € € Ы€ V[г0,г1] обозначим
х(г,г0,х0,и^) = х(г) Vг € [г0,г 1], (4.36)
где х : [г0,г1] ^ М" — решение задачи Коши х(г) = а(г,х(г), и(г))+ь(г,х(г), v(г)), г € [0,0], (4-37)
х( г0 ) = х0
Проводя рассуждения, близкие к доказательству леммы 5.1 из [8], получаем следующую лемму.
Лемма 4.2. Пусть заданы числа т € (0,0), г0 € [0,0 — т], вектор х0 € М" и функции и € € Ы[г0,г0 + т]^ €V[г0,г0 + т]. Пусть
*0+Т
хи = х0 + ! а(г0,х0,и(г)) А, (4.38)
to
х1 = х(г0 + т,г0,х0,и^)- (4.39)
Тогда существует вектор v0 € Q такой, что вектор
хиу = хи + тЬ(г0,хи^0) (4.40)
удовлетворяет неравенству
\\хиу — х1\\ < Аи, (4-41)
где число Аи определено равенством (3.23). □
Лемма 4.3. Пусть стратегия первого игрока и^г = {и.}1-1 определяется соотношением (3.30), г € 0,1 — 1, х0 € Ми, v € V[^,^+1], х1 = = xтmot(тi,Ti+1,x0,T,ustт,v). Тогда х1 € Ми+1. □
Доказательство. Определим функцию и € € Ы[тг,тг+1] формулой
и(г) = и.(х0) Vг € [п,п+1]- (4.42)
г0 = т.
Из включения х0 € Ми и равенства (3.28) получаем х0 € А. БгВиМи+1. Отсюда и из соотношений (3.20), (3.30) следует включение х0 + + та(тг,х0,иг(х0)) € Б.ВиМи+1 + В£и. Поэтому согласно равенству (4.42) получаем, что вектор
хи
включению
хи € БгВиМи+1 + В£и - (4.43)
Так как согласно включениям (3.25) имеем ВиМи+1 С Ми+1 — ВДи, то В г В и Ми+1 с
С Вг(Ми+1 — ВДи) и в силу включений (3.19) получаем В.ВиМи+1 с Б.(Ми+1 — Вди + В£в)■ Используя соотношение (4.35), (4.43), получаем
хи € В.ВиМи+1 + В£и С
С Бг(Ми+1 — Вди + В£в) + С БгБ, (4-44)
где
Б = Ми+1 — Вд„ + Ввв + В{1+ты)£и - (4.45)
В силу леммы 4.2 существует вектор v0 € Q такой, что для вектора хиу = хи + тЬ(т^,xu,vо) справедливо неравенство (4.41). Из соотношений (3.14), (4.44) следует включение хиу € €Б
венства (4.45) получаем включение х1 € Б+Вдои =
= Ми+1 — ВДи + В£в+(1+тЬ%)£и+до. Поэтому согласно равенству (3.24) справедливо включение х1 € Ми+1. ■
Проводя рассуждения, аналогичные доказательству леммы 4.3, получаем следующую лемму.
Лемма 4.4. Пусть стратегия второго игрока vsTI = {vi}1-1 определяется соотношением (3.31), г € 0,1 — 1, х0 € Му, и € Ы[т.,т. + 1 ], хл = = хт°\п,п+l,Х0,T,u,vsTr)■^oтfl,^%Хl € Му+1. □
Доказательство теоремы 3.1. Используя лемму 4.3, индукцией по индексу г € 0,1 — 1 получаем включения x'm'ot(г0,Ti,x0,T,uTtI ,v) €
€ М и
хтоЬ(г0,0,х0€ М + В£. Следовательно, выполнено неравенство (2.11). ■
Доказательство теоремы 3.2. Используя лемму 4.4, индукцией по индексу г € 0,1 — 1 получаем включения хгт°ь(г0, т.,х0, T, и, vT:т) € М"\Му. Отсюда в силу соотношения (3.27) приходим к соотношению (2.12). ■
Доказательство теоремы 3.3. Используя неравенство е ^ е0 и повторяя с некоторыми изменениями доказательство теоремы 3 из [8], получаем включение Му С Ми, которое вместе с тео-
е
стратегий (ит1^’^1).
V. Алгоритм вычисления одношаговых операторов достижимости в двумерном случае
Для любых г € 0,1 — 1, Б С М" определим множество
А.Б = |^| (х — та(т.,х,Р))- (5.46)
а£Б
Лемма 5.5. Пусть выполнено неравенство тЬа < 1. Тогда для любого множества Б С М" и любого индекса г € 0,1 — 1 справедливы включения
АБ с МБ + Вьа с*т2), (5.47)
А.Б С А.(Б + Вь*сат2)- (5.48)
□
Доказательство. Зафиксируем множество Б С М" и индекс г € 0,1 — 1. Пусть х € А. Б. Тогда у € Б и € Р х =
= у — та(т.,у, и). Следовательно, \\у — х\\ ^ Сат, \\х + та(т., х, и) — у\\ = т\\а(п,х,и) — а(т.,у,и)\ <
< Ь1Сат2,т.е. х € А.(Б + ВЬхС*т2), что доказывает включение (5.47).
Докажем включение (5.48). Пусть х € А.Б. Тогда согласно равенству (3.13) существует вектор и € Р такой, что х + та(т\, х, и) € Б. В силу неравенства тЬа < 1 отображение Р(у) = х+та(т.,у,и) является сжимающим и, значит, имеет неподвижную точку У0 € М": У0 = Р У), т. е. У0 = х + + та(т., у0, и). Следовательно, ||у0 — х\\ ^ Сат, \\х + та(т., х, и) — у0\\ = т\\а(п,х,и) — а(т.,у0,и)\ <
< ЬааСат2. Поэтому У0 € Б + ВьхСат2, х = У0 —
— та(т.,у0,и) € А.(Б + Вьхс*т2)• ■
Далее будем предполагать, что размерность фазового вектора п = 2 и для любых г € [0,0],
х € М2 вектограммы а(г,х,Р) и Ь(г,х^) являются выпуклыми многоугольниками или отрезками. Будем также предполагать, что игровые множества достижимости и дополнения к ним
£
рым работают алгоритмы, будем рассматривать множество многоугольников с длинами сторон, не превосходящими заданного числа Н, которое будем называть параметром дискретизации по пространству.
Напомним определения. Пусть задан набор точек а^ € М2, к = 1, т, причем а^+1 = а^ для любого к € 1,т — 1. Упорядоченный набор отрезков {[а1, а2], [а2, аз], - - -, [ат-1, ат]} называется
ломаной r(a1,..., am), точки ak называются вершинами, а отрезки [ak, ak+1 ] — звеньями этой ломаной. Для одной точки a G М2 положим r(a) = = {a}. Ломаная r(a1,..., am) называется замкнутой, если am = a1. Ломаная r(a1,..., am) называется прост,ой замкнутой, если m > 1, am = a1 и из того, что z G [aj,aj+1] П [ak,ak+1], 1 ^ j < k < m следует, что k = j + 1 и z = ak. Многоугольником называется ограниченное замкнутое связное множество S С М2 такое, что его границей dS является простая замкнутая ломаная. Вершинами S
dS.
Заметим, что для любой замкнутой ломаной
Y С М2 ее дополнение М2 \ Y состоит из конечного числа непересекающихся областей, одна из которых неограничена. Дополнение к этой неограниченной области называется доменом y и обозначается domain y- Легко видеть, что домен любой замкнутой ломаной y С М2 является замкнутым ограниченным связным множеством, причем y С С domain y и d(domain y) С Y- Граница домена замкнутой ломаной y называется внешним контуром y и обозначается ext y ext y = d(domain y).
Алгоритм вычисления внешнего контура
замкнутой ломаной y = r(x1,... ,xk,x1) состоит из следующих шагов.
Шаг 1. Найдем вершину xi0 (1 ^ i0 ^ k), наименьшую в смысле лексикографического порядка;
i = i0
Шаг 2. Если на отрезке [xi,xi+1] нет точек пересечения с другими звеньями ломаной y (кроме соответствующих концов соседних звеньев), то добавляем отрезок [xi, xi+1] в контур ext Y и увеличи-i 1 k z
— точку самопересечения y, лежащую на [xi, xi+1],
xi [xi, z]
в контур ext y Находим V — множество концов всех звеньев ломаной Y-, проходящих через точку z xj G V \ {xi, z}
xi — z xj —
—z
нимален. Добавляем отрезок [z,xj] в контур ext y-Полагаем i = j.
i = i0
шагу 2.
x G М2
зывается единичный вектор —щ- Правым перпен-
x G М2
вается единичный вектор x^, полученный путем поворота по часовой стрелке направления вектора x на угол ПП. Для любых двух ненулевых векторов a G М2 и b G М2 через angle(a, b) обозначим множество всех ненулевых векторов, направления которых получаются путем вращения единичного вектора против часовой стрелки от направления a до направления b. Через (a, b) будем обозначать
скалярное произведение векторов a = (a1, a2) и b = = (b1, b2): (a, b) = a1b1 + a2b2. Нормальным конусом выпуклого множества X С М2 в точке x0 G дХ называется множество
N(x0, X) = {p G М2 : (p,x) ^ (p,x0) У x G X}.
В силу леммы 5.5 для вычисления одношаговых операторов достижимости Ai достаточно с заданной точностью вычислять множества AiS, определяемые формулами (5.46). Рассмотрим алгоритм приближенного вычисления множеств AiS, использующий конволюту.
Понятие конволюты многоугольников введено в [9] и состоит в следующем. Пусть имеются два многоугольника: X с вершинами xi и Ус вершинами yj, пронумерованными против часо-
X
У
[xi + yj,xi+1 + yj], где xi+1 — xi G &ng\e((yj —
— yj-1), (yj+1 — yj))> a также отрезков вида [xi + + yj,xi + yj+1], где вектop yj+1 — yj G angle((xi —
— xi-1), (xi+1 — xi)). В [10], [11] описан алгоритм, позволяющий построить конволюту двух многоугольников и извлечь из нее сумму Минков-ского этих многоугольников. Заметим, что если функция a(t, x, и) не зависит от x, то согласно формуле (5.46) множество AiS является суммой Минковского (см. (3.16)). Адаптируем алгоритм из [10] к задаче приближенного вычисления множеств AiS в предположении связности рассматриваемых множеств и их дополнений.
Зафиксируем произвольный индекс i G 0,1 — 1. Для любого x G М2 обозначим G(x) =
= —ra(ri,x,P). Пусть многоугольник S с длинами сторон ^ h задан набором вершин x1,... ,xs, пронумерованных против часовой стрелки. Грани-S
ломаная dS = r(x1,... ,xs,xs+1), где xs+1 = x1,
max \\xj+1 — xj|| < h. Для любого j G 1, s обозна-
j^1,s
чим nj = (xj+1 — xj )^ — правый перпендикуляр к j-му звену ломаной dS, положим n0 = ns. Для каждого j G 1, s рассмотрим g\,..., g3mj — пронумерованные против часовой стрелки все вершины многоугольника G(xj) такие, что
N(g3m, G(xj)) П angle(nj-1,nj) = 0, m G 1, mj.
Конволютой для задачи (5.46) будем называть замкнутую ломаную
C(S, G) = r(x1 + g1,... ,x1 +
1 2 2 + gmi ,x2 + g1, . . . ,x2 + gm2 ,...,xs +
+ gS, . . . ,xs + gSm s ,x1 + g1).
Определим многоугольник AS как домен конволюты C (S,G):
AS = domain(C(S, G)).
Используя описанный выше алгоритм вычисления внешнего контура, найдем границу многоугольника А.Б: д(А.Б) = ехЬ(€(Б,0)). Тем самым мы определим вершины многоугольника А.Б.
Лемма 5.6. Пусть выполнено неравенство тЬа < 1. Тогда для любого г € 0,1 — 1 справедливы включения
д(АБ) С АБ + В2н, д(АБ) С АБ + В>2н- □
Доказательство. Зафиксируем произвольные г € 0,1 — 1 и у € д(А.Б). Пусть отрезок [у0, у1 ] является звеном конволюты, содержащим точку у у0 у1
х0
х1
гоугольника Б такие, что у^ € х^ + С(х^), ] =0,1. Так как О(х) = —та(т.,х,Р), то существуют векторы и0,и1 € Р такие, что у^ = х^ — та(т.,х^,и^), ] = 0,1. Поскольку ||х0 —х^Ц < Н, то согласно соотношению (1.4) вектор у2 = х0 — та(т., х0, и1) удовлетворяет неравенствам \у1 — у2\\ ^ Н(1 + тЬ'Х) <
< 2Н у0 у2
пуклом множестве х0 + С(х0), то в этом множестве содержится весь отрезок [у0,у2]. Отсюда из включения у € [у0, у{] и неравенства \у1 — у2\\ < 2Н следует, что у € х0 + С(х0) + В2ь С А.Б + В2ь- Таким образом, получено первое из доказываемых включений. Доказательство второго включения опускаем в силу его громоздкости. ■
М"
множества Б1 и Б2, дБ1 С Б2 + Вй, пусть число
3 > 0 таково, что множество М" \ (Б2 + Вй) связно. Тогда Б1 С Б2 + Вй. □
Б1 Б2
ограничены, то существует точка г € М": г € (Б1 и иБ2)+Вй. Предположим, что доказываемое вклю-
х€
€ Б1 \ (Б2 + Вй). Поскольку множество М" \ (Б2 + + Вй) связно и содержит точки х € Б1 и г € Бь то существует точка у € (дБ1) \ (Б2 + Вй), что противоречит условию дБ1 С Б2 + Вй- ■
Замечание. Условие связности множества
М" \ (Б2 + Вй) в лемме 5.7 существенно. Действи-М2
Б1 = {(х, у) : х2 + у2 < 1},
Б2 = {(соя у, яшу): у € [0;2п — 3]}-
Тогда при 3 € (0; 1) все условия леммы 5.7 кроме связности множества М" \ (Б2 + Вй) выполнены, но включение Б1 С Б2 + Вй не справедливо.
Б
Н
г € 0,1 — 1, множества М2 \ (А.Б + В2н) и М2\(А.(Б — В4ь)+В2ь) связны и пусть выполнено неравенство тЬ'Х < 1. Тогда справедливы включения (3.18) при еА = 4Н + ЬХСат2. □
Доказательство. В силу лемм 5.6, 5.7 справедливы включения
МБ С А.Б + В2н, (5.49)
МБ — В4Н) С МБ — В4Н) + В2н- (5.50)
Используя включения (4.34), (5.49) и лемму 5.5, получаем
А б С А.(Б + ВКсат 2)+ В2Н С С А.(Б + Вьхс*т2 +2к(1+тьа)) С А.(Б + В£л )- (5-51)
Аналогично включению (4.34) для любого множества Б С М2 и любого чиела 3 > 0 имеем
А.Б + Вй С А.(Б + В(1+тьа)й)-Следовательно, А (Б — В4Н) + В2Н С С МБ — В4к + В2Н(1+тЬц)) С А.Б-
Отсюда, используя включение (5.50) и лемму 5.5, приходим к соотношениям
А.(Б — В£А) = МБ — В4н+ь*асат2) С С А. (Б — В4К+Ь% с*т2 + ВЬ*с*т2 ) С С МБ — В4н) С А.Б- (5-52)
Включения (5.51), (5.52) дают (3.18). ■
Алгоритм, аналогичный описанному выше, позволяет вычислить множества В.Б, приближающие множества В. Б. Повторяя с некоторыми изменениями рассуждения, проведенные при доказательстве леммы 5.8, получаем, что в предположении связности соответствующих множеств справедливы включения (3.19) при ев = 4Н + + Ь'ХСьт2. Подставляя эти выражения для еА, ев в формулу (3.33), находим теоретическую оценку общей погрешности алгоритма. Полученная оценка показывает, что параметр дискретиза-Н
щественно меньше параметра дискретизации по т
Литература
1. Айзекс Р. Дифференциальные игры. - М.: Мир, 1967.
2. Красовский П.П. Управление динамической системой. - М.: Наука, 1985.
3. Понтрягин Л. С. Линейные дифференциальные игры преследования // Матем. сборник. -1980. - Т. 112, N 3.- 0. 307-330.
4. Алгоритмы и программы решения линейных дифференциальных игр / под ред. А.И. Субботин,
B.C. Пацко. - Свердловск: УНЦ АН СССР, 1984.
5. Patsko V.S., Botkin N.D., Kein V.M., Turova V.L., Zarkh M.A. Control of an aircraft landing in windshear // Journal of Optimization Theory and Applications. - 1994. - V. 83, N 2. - P. 237-267.
6. Patsko V.S., Turova V.L. Numerical solution of two-dimensional differential games. - Preprint. Ekaterinburg. - IMM UrO RAN, 1995. - 78 p.
7. Иванов Г.Е., Казеев В. А. Минимаксный алгоритм построения оптимальной стратегии управления в дифференциальной игре с липшицевой платой // Журнал вычислительной математики и математической физики. - 2011. - Т. 51, Ш 4. -
C. 594-619.
8. Иванов Г.Е. Алгоритм решения нелинейной игровой задачи быстродействия // Фундаментальные и прикладные задачи современной математики: сб. науч. трудов. - М.: МФТИ, 2011. - С. 4976.
9. L.J. Guibas, L. Ramshaw, J. Stolfi. A kinetic framework for computational geometry // Proc. of the 24th Annual IEEE Symposium on Foundations of Computer Science (FOCS’83). Tucson, Arizona. -1983. - P. 100-111.
10. R. Wein. Exact and efficient construction of planar Minkowski sums using the convolution method // Proc. 14th European Symposium on Algorithms (ESA), LNCS. - 2006. - V. 4186. - P. 829-840.
11. /;. Flato. Robust and efficient construction of planar Minkowski sums // Master’s thesis. School of Computer Science. - Tel-Aviv University, 2000.
12. Пономарев А.П. Оценка погрешности численного метода построения альтернированного интеграла Понтрягина // Вестн. МГУ. Сер. 15. Вы-числ. матем., кибернетика. - 1978. - Ш 4. - С. 3743.
13. Botkin N.D. Evaluation of numerical construction error in differential game with fixed terminal time // Problems of Control and Information Theory. - 1982. - V. 11, N 4. - P. 283-295.
14. Половинкин E.G., Иванов Г.Е., Балашов М.В., Константинов Р.В., Хорее А.В. Об одном алгоритме численного решения линейных дифференциальных игр // Матем. сборник. - 2001. -Т. 192, № 10. - С. 95-122.
Поступила в редакцию 21.01.2011