УДК 519.837
ЛИНЕЙНАЯ ИГРА ИМПУЛЬСНОЙ ВСТРЕЧИ ЗАДАННОЙ ПРОДОЛЖИТЕЛЬНОСТИ С ИНТЕГРАЛЬНЫМ ОГРАНИЧЕНИЕМ
В. И. Ухоботов
1. Линейная дифференциальная игра с фиксированным моментом окончания р с помощью линейной замены переменных может быть сведена [1] к игре с простым движением. Рассмотрим такую игру при наличии импульсного управления первого игрока [2 — 5]. Уравнения движения запишем в виде
dz = N(t)du + M(t)vdt; zeR", ueE1; veE2. (1.1)
Здесь линейные конечномерные нормированные пространства, N(t) и M(t)—матрицы соответствующих размерностей, элементы которых являются непрерывными при t < р функциями.
На каждом отрезке [I, т] допустимым программным управлением и(-) первого игрока является функция с ограниченным изменением. Расходы ресурсов, затраченные на формирование этого управления, задаются формулой
{|| <1и(г) || = вир И || и(г, + 1)- и(г,) ||.
Здесь || ||—норма в Е1; а верхняя грань берется по всем разбиениям г, отрезка [1, т].
Допустимое программное управление у:[1:, т]->Е2 второго игрока является измеримым с конечным интегралом от |у(г)|*. Здесь | • | — норма в Е2, а число к> 1.
Позицией игры является точка г, ц, V, где числа 0 и V > О характеризуют запасы ресурсов игроков. При выбранных на отрезке [г, т] управлениях правило перехода позиции задается следующими формулами:
У(Т) = У-}|у(Г)|*<1Г (1.2)
г
/ф) = /г-|||*1(г)Ц (1.3)
г
г (т) = г + ] М (г) у(г) ёг + } N (г)ёи(г). (1.4)
» г
Последний интеграл в (1.4) понимается в смысле Рима-на-Стилтьеса. Условия не перерасхода запасов имеющихся ресурсов записываются в виде неравенств
у(т)>0, ц(т)>0. (1.5)
С помощью заданного подмножества ЬсК" определено терминальное множество
X = {{г, ц, v):геЬ, М > О, v ^ 0} (1.6)
Цель первого игрока заключается в выводе позиции в момент времени р на терминальное множество (1.6), второй игрок этому препятстствует. Наличие импульсного управления приводит к мгновенному изменению позиции, что требует специального определения условия окончания игры [4, 5]. С этой целью рассмотрим вектограммы игроков
Щ) = {х = М(0и:||и|| ^ 1}
(1.7)
У(1) = {х = М(1)у:М^ 1}.
Позиция, откуда первый игрок сможет в момент времени р мгновенно перевести ее на терминальное множество (1.6), удовлетворяет включению
zeL + /xU(p). (1.8)
Игра считается оконченной, если реализовывавшая-ся в момент времени р позиция удовлетворяет включению (1.8).
Введем в рассмотрение множества достижимости
U] = {zеR":z = JN(r) clu(r), } ||du(r)|| = 1},
t t
z z
V] = {zeR": z = J"M(r)v(r)dr, J|v(r)|*dr=l}, (1.9)
t t
uj = u(t), v{ = o.
Можно показать (см. [7]), что эти множества являются выпуклыми компактами и
UJ = couU(r), t ^ г ^ т (1.10)
Г
Vt = и j <р(т) V(r)dr, j q>k (г) dr = 1. (1.11)
<p(-)t t
Здесь со А —выпуклая оболочка множества А. Из этих формул следует, что при любых t < т < р выполнены равенства
U?= и (1U; + (1-1)U?) (1.12)
1
V?= и {Xilk\zt + (1 —A)1/k V?). (1.13)
0SE.U1
Из формул (1.9) вытекает, что при любом числе у ^ 0
{J N (г) du (г): J || du (г) || =7} = у Uf, t t Т t
{J M (г) v(r) dr: J |v(r)lk dr = y} = y1/kVzt. (1.14) t t
2. Воспользуемся понятием стабильного моста [1, 3] и построим его в следующем виде:
v), (2.1)
zeGi-g(t, v))U? + W(t, v). (2.2)
Здесь неотрицательная скалярная функция g(t, v) и многозначная функция W (t, v) с R" при t < р, v > 0 удовлетворяют условиям
g(p, v) = 0, W(p, v)cL, (2.3)
g(t, v)^g(x, v-y); Oi£y<v, t<x<p. (2.4)
Условие (2.3) означает, что если при t = p выполнены неравенство (2.1) и включение (2.2), то точка z и функции fi, v удовлетворяют включению (1.8).
Зафиксируем два момента времени t<i и позицию z, ц, v, удовлетворяющую (2.1) и (2.2). Условия (2.1), (2.2) задают стабильный мост [1, 3]'тогда, когда для любого допустимого управления v : [t, т] -»■ Е2 существует допустимое управление u : [t, т] -* Ej, при которых реализовавшаяся позиция (1.2) —(1.4) удовлетворяет условиям (2.1), (2.2) при t = r.
С учетом формул (1.4) и (1.14) предыдущее условие существования управления u : [t, г] -> Ех принимает следующий вид: для любого 0<y<v существует число g(x, v — у) такое, что
Z + yUkyr с (fl_r]_g(Xi v_y))U? + ^Ui + W(T5 v_yy
Вычисляя объединение по ц от правой части последнего включения и учитывая формулу (1.12), получим условие
z + y^VÏ с (ц-g(T, v — у))U? + W(т, v-y).
Из (2.2) следует, что последнее включение будет выполнено, если для любого O^y^v будет выполнено условие
Gi-g(t, v)) U? + W (t, v) + y1/k VJ с
(2.5)
с О-g(T, v — y))U? + W(т, v-y).
В частности, при /¿ = g(t, v) должно выполняться при всех О < у < v следующее включение:
W (t, v) + v; с (g(t, v) - g(t, v - y)) и? + W (т, v - y). (2.6)
Наоборот, пусть выполнено включение (2.6). Прибавляя к обеим частям этого включения множество (д—g(t, v))Uf, получим включение (2.5)
Используем понятие геометрической разности [9] двух множеств А и В из R"
A —B = n (A—b), be В.
Тогда включение (2.6) выполнено при всех t < т ^ р, v^O, если W(t, v) с n([g(t, v)-g(t, v-y)U? + W(t, v-y)]-îy1/4V?. (2.7)
Здесь пересечение берется по всем t < т < р, 0 ^ у v. Для построения многозначной функции W(t, v), удовлетворяющей включениям (2.3) и (2.7), используем следующий итерационный процесс:
W0(t, v) = (L + g(t, v) U? ) V?, (2.8)
W4+1(t, v)= n([(g(t, v)-g(x, v-y))u? +
+ Wt(T, v-y)]-i/'*Vi. " (2.9)
Здесь t^x^p, Используя равенство (2.3) и-= 0, из
" (2.8) и (2.9) получим
Wfc(p, v) = L, k^O, v^O, (2.10)
Wt+1(t, v)cWt(t, v). (2.11)
Теорема 2.1. Пусть множество L является замкнутым. Тогда включению (2.7) удовлетворяет следующая многозначная функция:
W(t, v)= n W4(t, v). (2.12)
Доказательство. Прежде отметим, что из замкнутости L и из формул (2.8), (2.9) следует замкнутость множеств Wt (t, v).
Согласно (2.11) и (2.12)
W(t, v)=nWt+1(t).
Рассмотрим пересечение по всем к>1 правых частей равенства (2.9)
Будем использовать следующее утверждение: если множества Ак, В из R" являются замкнутыми и ограниченными (k= 1, 2,...) и A*+i с At, то
п (Ак + В) = пАк + В.
Тогда переставляя знаки пересечений, получим, что пересечение по к правой части (2.9) равняется правой части (2.7) с W (t, v), определяемой формулой (2.12).
3. Условие стабильности (2.6) позволяет построить управление первого игрока, обеспечивающее окончание (1.8). Представляет интерес алгоритм формирования управления первого игрока, в котором не используется информация об оставшемся запасе ресурсов противника.
Будем предполагать, что на выбор управления второго игрока наложено более сильное условие. Считаем, что при любых
t < т ^ p, v ^ О определено число 0 ^ a (t, т, v) ^ v такое, что выбор управления v : [t, т] -»■ Е2 стеснен ограничением
v(T) = V -} [ V (г) I* dr > a(t, т, V). (3.1)
t
Пример 3.1. Пусть на выбор управления v(r) накладывается дополнительное ограничение | v(r) \к ^ а (г), где а (г)—суммируемая на каждом отрезке функция. Тогда
т
a(t, т, v) = max(0; v-fa(r)dr). (3.2)
i
Относительно функций а (3.1) и g (2.4) сделаем следующие предположения.
Предположение 3.1. Для любых последовательностей t, ^ тг ^ р, ц1 < v,-, t,- -> г, тг -» г и t]( v выполнено
g(t,, v,) — g (т£, ?7() -> 0; a(t(, т„ v;)->v. (3.3)
Предположение 3.2. Семейство множеств W(t, v) удовлетворяют включению (2.6) при всех 0 < у ^ v — a(t, т, v).
Предположение 3.3. Множества W(t, v) удовлетворяют следующему условию замкнутости:
t; < Г < Р, t; -> г; V; ^ V ^ 0, V; —» VJ
(3.4)
х>е W (tf, V;), х; х => х e W (t, v).
Запишем опорную функцию множества (1.13). С ном целью обозначим через <.,.) скалярное произведение в R" и рассмотрим опорную функцию вектограммы U(t) (1.7)
a(t, ф) = тах(\¡/, N(t)u), ||u|| = 1, ^eR". (3.5)
Из непрерывности матрицы N(t) следует, что функция у непрерывна по t.
Опорная функция множества (1.13) имеет вид
m(t, i/0 = max а (т, ф), t ^ т < р. (3.6)
Предположение 3.4. При всех t<p и любых xj/eR"
m(t, ф)>0. (3.7)
Зафиксируем любой отрезок [р1; р2] с (— оо, р] и число v0 > 0.
Лемма 3.1. Пусть матрица N(t) в (1.1) удовлетворяет локальному условию Липшица. Тогда для любого е > 0 существует ¿>0 такое, что для всех p1<t<T<t + «5, т<р2 и a(t, т, v,) < г] < v ^ v0 выполнено включение
(g(t, v) - g(t, ri)) U? cr (g£ (t, v) - g£(i, r,)) (3.8)
gg(t, v) = g(t, v) + (p — t)e.
Доказательство. Допустим противное. Тогда существуют последовательности t;, т;, v;, для которых включение (3.8) не выполнено. Следовательно, существует последовательность единичных векторов для которых
I и \ ! , »А,) —»А,)
(g(t;, v,.)-g(r,., ->ет(т„ ф(). (3.9)
t.-t.
Переходя к подпоследовательностям и учитывая второе условие (3.3), можно считать, что t; ->■ г, тг->г, v;->v, ^-»v, ^¡-^ф.
По условию леммы в окрестности точки г матрица N удовлетворяет условию Липшица. Отсюда и из формул (3.5) и (3.6) можно получить, что функция ш (t, ф) удовлетворяет в окрестности точки г условию Липшица. Поэтому, учитывая первое условие (3.3), получим, что выражение, стоящее в левой части неравенства (3.9), стремится к нулю. Правая часть неравенства (3.9) стремится к £т(т,ф) > 0.
Полученное противоречие доказывает включение (3.8).
Определение 3.1. Стратегией первого игрока назовем последовательность точек tjg с^ < ... <t; ->■ р и правило, ставящее каждой тройке z, /л, t, в соответствие функцию u:[tl+1) tj Е1, вариация которой не превосходит числа ц.
Пусть начальный запас ресурсов v0 второго игрока известен первому игроку. Обозначим при zеR", ц^О, t seр, £>0
b(z, t, ju, e) = max{b ^ 0:g(t, b) < b ^ v0,
(3.10)
ze(^-gg(t,b))U? + W(t,b)}.
Если при любом 0 ^ b ^ v0 нарушаются неравенство или включение в (3.10), то полагаем b(z, t, ц, в)= — оо.
Отметим, что из предположений 3.1 и 3.3 следует, что тах в (3.10) достигается.
Теорема 3.1. Пусть начальное состояние z0, v0, t0 таково, что для некоторого числа е > 0 выполнено неравенство
v0sSb(z0, t о, ju0, £)• - (3-Й)
Тогда существует стратегия первого игрока, гарантирующая окончание (1.8).
Доказательство. Используя лемму 3.1, построим последовательность чисел t0 < tj < ... <t,. р такую, что для всех a(t;,
ti+1, выполнено включение (3.8) при t = t;, x = ti + 1.
Отсюда и из условия стабильности (2.6) следует, что
W(t;, v) + (v —»7)1/*Vti+1 с:
(3.12)
с (g,(t„ v)-g (ti+1, r,))Wt +W(ti+1, rj) s >•+1
при всех
a(t„ 11+1, (3.13)
Опишем правило, по которому строится управление u: [t;, ti+1]->Ex. Если b = b(z, t, 'fi, e)= —oo, то берем любое допустимое управление.
Пусть Ь^О. Тогда из (3.10) следует, что
z = х + у, х е Ou - g6 (t„ b)) Щ, y e W (t., b). (3.14)
Рассмотрим проблему моментов [6] p p
J II du (r) Il min, x + J N(r) du (r) = 0. (3.15)
4 4
Пусть u0 —решение задачи (3.15). Тогда из (3.14) следует, что
j Ildu0(r)|] ^ M-g£(ti5 b),
ч+i " (ЗЛ6)
x+'j N(r)du0(r)g(/i — g£(tf, b)-'{ ||du0(r)||)U("+.
t■ t• 1 'i 'J
Допустим, что реализовавшиеся в момент времени t; позиции z;, fit, Vi удовлетворяют неравенству
v;^b(z;, t;, ßi £) = ь;. (3.17)
Тогда при z = z;, ц = b = b, выполнены условия (3.14). Пусть второй игрок выбрал управление v: [t;, ti+1] -* Е2 такое, что оста. вшийся запас ресурсов v1 + 1 удовлетворяет условию a(t;, ti+i> vi) ^ vi+i ^ vi- Тогда из соотношений (1.14), (3.12), (3.14) следует, что
'¡+1
у+ J M(r) dv (r) e W (t,-, Ьг) + (Ь,. —vi+1)1/fcVJ|+i с Ч
с (g£(t;, Ьг) —g£(t1 + 1, vi+1))U*+1 + WO^, vi+1).
Сложим это включение с включением (3.16), в котором положим м=М;> b = b;. Получим
zf+1eOxi+1-g,(ti+1, vl+1))Ufi+l + W(ti + 1, vi+1) (3.18)
ft+i > g.(tf+i» v;+i)-
Следовательно, для-реализовавшейся в момент времени ti+1 позиции выполнено неравенство (3.17) bi+1 ^ vi+1.
Таким образом, стратегия (3.15) гарантирует выполнение включения (3.18). Можно показать, что последовательность позиций (z;, fxh v;) имеет предел. Перейдем в (3.18) к пределу. Тогда, используя предположения 3.1, 3.3, а так же условия (2.3), получим, что предельная точка удовлетворяет включению (1.8).
4. Рассмотрим вопрос о построении функции g. В основу ее определения положим следующее условие: если в момент времени t оставшийся запас ресурсов /г первого игрока не удовлетворяет неравенству (2.1), то второй игрок имеет возможность не допустить в момент времени р окончание игры.
Предположение 4.1. Множество L является выпуклым компактом, симметрическим относительно начала координат.
Из этого предположения следует, что опорная функция множества L
с(ф) = тах < ф, х>, xeL (4.1)
удовлетворяет следующему условию:
с(-ф) = с(ф), феR". (4.2)
С помощью теоремы отделимости, используя симметричность выпуклых компактов L и U(p), доказывается, что если при некотором феИ"
КФ, 2)\>с(ф) + рт(р, ф), v (4.3)
то включение (1.8) не выполнено.
Введем в рассмотрение опорную функцию вектограммы (1.7) второго игрока
£ (t, ф) = шах (ф, M(t) v>, |v| = l. (4.4)
Предположение 4.2. При любом векторе феR" функция Р (t, ф) может обращаться в нуль только на множестве меры нуль.
Обозначим
l(t, = Ф) dr)1/s, s=~. (4.5)
Положим
T(v, ф) = р; с(ф)=0, v > О,
T(v, ф)=-оо; с(ф)-у1/к1(и ф)^0, Vt<P, (4.6) T(v, ф) = Т; с(ф)-у1'к\(Т, ф) = 0. Обозначим при t < р, v ^ 0, ф е R",
g(t, v ф)= -(cO/O-v^Kt, ф^ш-Ч^ ф), T(v, ф) < t<p (4.7) и при t < Т (v, ф)
g(t, V, ф) — sup
Л
(4.8)
Здесь в = Т(л, ф), а верхняя грань берется по всем
(с(ф)1Щ, (4.9)
Теорема 4.1. Пусть начальное состояние z0еR, ju0 ^ v0 ^ 0, t0 < р таково, что существует вектор ф е R", для которого
l<z0, ФУ\ >m(t0, ф)(ц0-ё(10, v0, ф)). (4.10)
Тогда второй игрок сможет так построить свою стратегию, что при любом допустимом поведении первого игрока реализовавшиеся значения z (р)и ¡1 (р) не удовлетворяют включению (18).
Доказательство. Из определения функции /? (4.4), применяя лемму о выборе измеримой однозначной ветви [10], получим измеримую при t ^ р функцию v.(t)eE2 такую, что
{ф, M(t) v. (t)> = р (t, ф), |v. (t) | = 1. (4.11)
Стратегия второго игрока будет состоять из конечного числа моментов коррекций t0 < < ... <t-+1=p, программного изменения запасов ресурсов v; = v(t;), v0 ^ vt ^ ... = v(p) = 0 и программного на отрезке [t;, ti+1](i = 0, l,...,j) управления ,
v, (t) = (sig n {ф, z (t,)> Ь;/?1/(* - (t, Ф) v, (t), (4.12)
b,= (vf-vi+1)(^ I Д5(г, Ф)drj
Как видно из формулы (4.12) второй игрок должен замерять реализовавшееся в момент времени t; значение фазового вектора z(t¡). Отметим еще, что в формуле (4.12) понимается, что sign 0 = 0.
Из формул (4,. 11) и (4.12) следует, что
]\ф, М (t) v.- (t)) dt = (4.13)
Ч
5ь
Ч
Как вытекает из формул (3.5) и (3.6), при любом допустимом управлении и;: [1:,, + -> Е1 выполнено неравенство
']\ф, N(t)du,.(t)> t,
= (№-/ii + 1)m(t;, ф), (4.14)
Ч + l
J II du;(t)!|. t
Из правила перехода (1.4) и из равенств (4.13), (4.14) следует, что при управлении (4.12) и при любом допустимом управлении первого игрока выполнено неравенство
КФ, z(ti+1)>| ^\<.ф, Z(t;)> I - (Л1,- - +!) m (t;, ф) +
(4.15)
4 + 1 \l/s
ч
Пусть начальное состояние удовлетворяет условию ф) ^ V Тогда из формул (4.7) и (4.10) имеем, что
|<70, ФУ|>Ш(10, ф)(10 + с(ф)-уУк(]рЧг, №т)1" (4.16)
Ч 7
Второй игрок берет 10<11 = р, () = у1 < у0 и управление у0 : [Ч0, определяемое формулами (4.12) с г(10) = 20. Тогда из неравенств (4.15) и (4.16) следует, что |<(/г, г (р)>| > с(ф) + /и (р)т (1:0, ф). Стало быть выполнено неравенство
(4.3).
Пусть теперь 1:0 < Т(у0, ф). Тогда, как вытекает из (4.8), (4.10), существует число (с(ф)/1(10, ф))к такое, что
Кто, ф> \>та0ф)&0-^0-Х)11КЪ11&). (4.17)
о
Здесь обозначено
Зафиксируем j ^ 1 и рассмотрим набор чисел
д_^
Обозначим
Ач= (Ц^'Аг, ^)с!г)/т5(1ф ф^. (4.18)
МоЯшо показать, что
J-l
1Ач^В а-оо).
ч=о
Поэтому, согласно (4.17), при достаточно большом номере ] будет выполнено неравенство
I < 2 ц0, Ф> | > т а0, ф) (ц0 - (у0 - я),/к( V А,) 1/8
Второй игрок берет моменты коррекций <:0 с^ <... = = 0<у1 = ри программу изменения запасов
= (У0-А) у, = Я, У,.+ 1 = 0.
Тогда
^-У|+1 = (у0-Я) , (4.19)
Отметим, что при ¿ = 0 выполнено неравенство
|<г(у, ^>1>ш(1;,^)(Л-(у-Я)1/"(А;+-+А;._1)1/5). (4.20)
Пусть это неравенство выполнено при О^г^ — 2. Тогда, используя формулы (4.15), (4.18) и (4.19), получим, что
| < 2 (1;), ф > | > т(1„ ф) (ц, - (V, - А)1" (А, + • • ■ + А,._ 1)1/') -
1 /к А^"1
- т (1г, ф) (н -ц,+1) + (у0 - Я) ' -ш(1г, ф) АГ5 =
Отсюда и из монотонности m(t; ф) ^ m(t;+ 1,ф) следует, что при i +1 неравенство (4.20) будет выполнено, если
Если же последнее условие не выполнено, то неравенство (4.20) при i +1 очевидно. Таким образом,
| < 2 (t,_ Д ф > | > m (t., ф) , -(Vj_t - lyi'Aj^). Следовательно, из формулы (4.15) получим |<z(t,.), ф>|>т(1Л1) ф)ц}-х-m(t7._l5 Mv^-A)1'^-—m(ti-1' Ф) (/i^1-/iJ) + (vj-1-;.)1/Km(t^i, Ф) AjL\ = = m(tJ-_1, ф)[1^т(1р ф)цу Отсюда, учитывая, что t,- = 0 и
C((A) = A1/K(|i9s(r, ^)dr)1/S
получим, что для реализовавшегося состояния выполнено неравенство (4.16) с заменой в нем z0=z(t,), t0 = t;-, ¡и0 = цр v0 = А. Следствие. Пусть fi0<g(t0, v0) где
g(t, v) = SU$ max (0; g(t, v, tfr)), феR". (4.21)
Тогда из любого положения z0eR" возможно уклонение. В самом деле, тогда для некоторого феК" выполняется неравенство (4.10).
Рассмотрим случай, когда множество L = 0. Тогда, полагая в формулах (4.6) с(|/У) = 0, получим, что T(v, i//)=p при v>0. Функция (4.8) в этом случае примет вид
Стало быть функция (4.21) равняется
5. Рассмотрим случай, когда терминальное множество Ь = 0. Считаем, что область достижимости первого игрока имеет вид многогранника
ег, (т)>|^а;(0, 1=1,..., п}. (5.1)
Здесь векторы еДО образуют базис в й", а функции а£(0 — неотрицательные.
Ищем множество V) в виде (5.1)
у) = {2е11":|<7, еД^^у1^), 1=1,...,п} (5.2)
Запишем включение (3.12), которое используется при доказательстве теоремы 3.1, положив в нем 1^ = 1:, 11+1 = т. Тогда, учитывая вид функции ё (см. (4.22)), правую часть этого включения запишем в виде
КО?) = {г:|<2, е,(т)>|у,(т) + (у^§(1)-т)) + + е(т-1)а;(т), ¡ = 1,...,п}.
Согласно лемме из работы [11] ВД1(у-^'сУ; = {2:|< 2,е;(т)>|^В;0/),1 = 1,...,п} (5.3) В; (Л) = г111кУ1 (т) + у1^ (I) -*111кё(т) +
Поэтому пересечение множества (5.3) по всем задает-
ся формулой
{г:! <2,е;(т)>Ку1/,£с1ат) + в(г-1)аг(т),1 = 1,...,п}. (5.4)
Здесь у1,к с,- (1, т) + £ (т — 0 аг (т) = В; (г}). Вычисляя минимум, получим
С,.(1, т) = §(1) + 0™1?,[Я1/4(уг(т)-ё(т))-
(1-А)1'* (£/?'('> е;(т))с1г)1/5].
Этот минимум равен
С,.(1, т) = §(0-[(тах(0; в(т)-уДт)))Ч£Г(г,еДт))ёг]^ (5.5)
Запишем условие, при котором множество (5.2) принадлежит множеству (5.4). Из линейной независимости векторов е,(1),
i = l,...,n следует, что et. (T) = ba(t, т) e, (t) + ... + bin(t, т) e„ (t). Поэтому точка z принадлежит множеству (5.4), если выполнено неравенство
L |ЬМ- (t, т)| • | < z, е,- (t) Ж v1/k с,- (t, т) + е (т -1) а,- (т).
j= 1
Для точки z, принадлежащей множеству (5.2), последнее включение будет выполнено, если
¿|by(t, T)|yj(t)<Ci(t, т), i=l,...,n. (5.6)
]= i
Условие (2.3) W(p, v) = 0 задает для функций y, (t) (5.2) граничное условие
yt.(p) = 0,i = l,...,n. (5.7)
Задача свелась к нахождению функций у; (t) ^О, удовлетворяющих неравенствам (5.6) и граничному условию (5.7).
6. Рассмотрим случай, когда L = 0, а опорные функции (3.5) и (4.4) имеют вид
a (t, ф) = а (t) F (ф), Р (t, ф) = р (t) F (ф). (6.1)
Здесь аир неотрицательные непрерывные при t^p функции, a F — выпуклая однородная функция, удовлетворяющая условию
F(-i/0 = F(i/0>0, УфеЯ", ффО.
Тогда опорная функция (3.6) равняется
m (t, ф) = т (t) F (ф); m (t) = maxa (т), t < t ^ p.
Расписывая формулы (4. 6) и (4.8), получим
g(t, v, t/') = v1/fcg(t); g(t) = (if(^|)dr)1/S (6.2)
Считаем, что g(t)<+oo при t<p.B противном случае из любого начального положения с запасом v0 > 0 возможно уклонение от цели (1.8).
Неравенство, противоположное (4.10), примет вид
|<z0, ф>\^т(t0)(ц0 — v01/kg(t0))F(ф), Уф.
Если ввести функцию
f(z) = max(|<z, ф>\¥-1(ф)),
Ф
то предыдущее неравенство можно записать в следующей форме: f (z0) + m (t0)v04kg (t0) (to) /V (6.3)
Опишем стратегию первого игрока, которая обеспечивает окончание (1.8).
Будем предполагать, что в процессе ее формирования первый игрок знает |v(t)|. Считаем так же, что отрезок [t0, р] можно разбить конечным набором точек t0<t1<...<tfc = p так, что
m(t) = a(t), Vte[t„ tI+1], (6.4)
либо
xn(t) = a(gVte[tI,tI + 1]. (6.5)
Из определения функции f(z) следует, что при любых t^p, zeR", z^O существует вектор u(t, z)eE1 такой , что
N(t)u(t, z)= — ос(t)(z/f(z)), ||u(t,z)|| = 1. (6.6)
Пусть начальная позиция удовлетворяет неравенству (6.3) и при to^t^ti выполнено условие (6.5). Первый игрок берет при t0 ^ t < tA нулевое управление. Тогда m(t1)/i(t1) = m(t0)/x0. Покажем, что для любого допустимого управления V:[t0, tx]-+E2 второго игрока выполнено неравенство
f (z (tj) + m (t^v1'*^) g (tx) < m (tt) (i (tx). (6.7)
Из определения функции f и из условия (6.1) можно получить, что
f(z(tx)) f(z0) + (v0 -V (t,))1" (r) dry>°. (6.8)
Из формулы (6.2) и из равенства m(t) = a(t0) при t0 следует, что
(v0 - v(h))1!k (í!í fís (Г) dr)1/5 + m^y/" (tl)g (t,) ^ vf m (t0) g (t0)
Отсюда и из неравенства (6.3) и (6.8) получим (6.7).
Рассмотрим случай, когда при t0выполнено условие (6.4). Первый игрок мгновенно выбрасывает количество e = m~1 (t0)f(z0) импульса по направлению вектора u0 = u(t0; z0). Тогда из (6.3) и (6.6) следует, что
z(t0) = z0 + eN(t0)u0 = 0; ¡i(t0) = ц0-е>v¿'kg(t0) (6.9)
Далее стратегия первого игрока выбирается по следующему правилу:
^ е<р (t) u (t, z); <р (t) = (|v (t)W (t)) / a (t);
u(t,0) = {ueE2:||uKl} (6.10)
При любом допустимом управлении v: [t0, t1]->E2 под движением понимаем решение с начальными условиями (6.9) следующего дифференциального включения:
z° (t)ecp (t) N (t) u (t, z) + M (t) v (t); nXt) = - q>(t), z (t) # 0; ix{t)e [ - q> (t),0], z (t) = 0 (6.11)
Пусть абсолютно непрерывная функция z(t) является решением включения (6.11) с начальным условием (6.9). Так как функция f(z) удовлетворяет условию Липшица, то 'сложная функция f(t) = f(z(t) является абсолютно непрерывной. Поэтому производная f (^существует почти всюду и
f(t)' = hmh~^f(z(t) + hz'(t)) — f(z(t))), h^O, h>0. (6.12)
Пусть в точке t функция f(t)>0. Тогда z(t)-/0. Если в этой точке существуют производные z'(t), f (t), то из (6.6), (6.11) и (6.12) следует неравенство
f(tK-<Kt)a(t) + |v(tMt) = 0.
Множество точек t: t0где f(t) = 0 и f (t) # 0 не более чем счетно. Следовательно, почти всюду f(t)^0. Отсюда, используя условия f(t)^0 и f(to) = 0, получим равенство f(t) = 0.
Из второгр включения в (6.11) вытекает неравенство fi'(t)^ —<p(t). Интегрируя его, получим
/x(tj>/i(t0)-f;v(t)dt=Mt0)-i;;!~—
^ Vo/feg(t0) - (v0 - vitj)1-(^Jdt)/S > ^V^itMh)-
Стало быть, в момент времени tx выполнено неравенство (6.7).
ЛИТЕРАТУРА
1 Красовский Н Н , Субботин А И Позиционные дифференциальные игры М Наука, 1974, 456 с
2. Красовский Н. Н., Третьяков В. Е. К задаче о преследовании в случае ограничений на импульсы управляющих сил.— Дифференц. уравн. 1966, т. 2, № 5, с. 587-599.
3. Субботина Н. Н., Субботин А. И. Альтернатива для дифференциальной игры сближения-уклонения при ограничениях- на импульсы управлений игроков,- ПММ, 1975, т. 39, вып. 3, с. 397-406.
4.Пожарицкий Г. К. Импульсная погоня за противником с ограниченной энергетикой.— Изв. АН СССР, Мех. твердого тела, 1975, № 1, с. 3 — 5.
5. Ухоботов В.-И. Об одном классе линейных дифференциальных игр с импульсными управлениями.— ПММ, 1974, т. 38, вып. 4, с. 590 — 598.
6 Красовский Н. Н. Теория управления движением. М.: Наука, 1968, 476 с.
7 Ухоботов В. И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограниченной энергетикой. М., 1987. Рукопись деп. в ВИНИТИ № 3254 - ,В 87. '
8. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980, 320 с.
9. Понтрягин Л. С. О линейных дифференциальных играх. 2.—Докл. АН СССР, 1967, т. 175, № 4, с. 764-766.
10. Филиппов А. Ф.О некоторых вопросах теории оптимального регулирования,— Вестник МГУ, сер., матем., мех., 1959, № 2, с. 25—32.
11. Ухоботов В. И. К построению стабильных мостов.— ПММ, 1980, т. 44, с. 934-938.