УДК 517.977.80
ИГРОВАЯ ЗАДАЧА ИМПУЛЬСНОЙ ВСТРЕЧИ СО СМЕШАННЫМ ОГРАНИЧЕНИЕМ НА УПРАВЛЕНИЕ ВТОРОГО ИГРОКА
В.И. Ухоботов, О.В. Зайцева
Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.
1. ВВЕДЕНИЕ
Рассматривается линейная дифференциальная игра
с1х = А{$)хск + + С(?)убй (1)
с импульсным управлением [1] первого игрока и и с фиксированным моментом окончания р. Здесь х е Я8, и е ге Я4, С(^) - непрерывные при ? < р матрицы соответствующих
размерностей. Задано линейное отображение л: Я8 -> Яп. Цель первого игрока заключается в том, чтобы в момент времени р осуществить равенство
лх(р)~ 0. (2)
Второй игрок, выбирая управление V , стремится не допустить выполнение равенства (2).
На каждом отрезке [/, г] допустимым программным управлением первого игрока является
Г
функция и:[/,г]—с ограниченной вариацией |||Л/(г)|| = 8ир^|и(г,+1)-м(г, )||. Допустимое
I
программное управление второго игрока является измеримым и ограниченным
Д(у(г))<1, г<г<х. (3)
Здесь посредством || • || и /.(•) обозначены нормы в Л5 и Яя соответственно.
Считается, что игроки обладают запасами // >0 и ;/ > 0 ресурсов, которые тратятся на формирование управлений по следующему правилу:
Г Г
м(т) = м(0- 114и(г)|, г(т) = у(()- |Я(у(г))с1г. (4)
I (
При выбранных программных управлениях вектор х из состояния х (/) перемещается в состояние, определяемое обобщенной формулой Коши [1].
Обозначим через ф(/) фундаментальную матрицу системы (1) и перейдем к новой переменной
г(/) = ж(/)дг(/), тг(/) = л:ф(/?)ф~!(/). (5)
Тогда получим,что
Г Т
г(г) = г(/)+|ТУ(г)й?м(г)+ |м(/-)у(/-)й?г. (6)
/ I
Здесь = м(г) = л-(/)с(?) - непрерывные матрицы, а первый интеграл понимается в
смысле Римана-Стилтьеса.
В новых переменных условие встречи (2) принимает вид
г(р) = 0. (7)
В 1963 году Н.Н. Красовский [2] предложил метод решения дифференциальных игр, основанный на принципе поглощения областей достижимости. В этой работе рассмотрены игры с геометрическими, интегральными и импульсными ограничениями. Применение метода поглощения областей достижимости для игр с импульсными управлениями усложняется тем, что области достижимости, зависящие от запасов ресурсов, могут меняться разрывно. В работе [3] приведен Серия «Математика, физика, химия», выпуск 9 55
пример импульсной встречи двух точек, в котором первый игрок не сможет поддержать требуемого в методе включения областей достижимости.
В данной работе используется метод одномерного проектирования [4-6], который применительно к задачам импульсной встречи позволяет получить условие возможности поимки (7).
Наличие импульсного управления, приводящего к мгновенному изменению позиции, требует конкретизации понятия встречи (7).
Введем в рассмотрение вектограмму первого игрока
Если выполнено это включение, то первый игрок путем мгновенного выбора части оставшегося запаса ресурсов может осуществить равенство (7).
2. ЗАДАЧА УКЛОНЕНИЯ
Обозначим через {,) скалярное произведение векторов в 7?". При каждых г<р и (реЯп обозначим
Функция (11) является опорной функцией области достижимости и] первого игрока [5, 6],
где
Теорема 1. Пусть начальное состояние 10,г0, /л0,у0 таково, что существует вектор (р е Я". для которого
Тогда возможно уклонение от встречи (9).
Доказательство. Из (14) и (15) следует, что существует функция (г), удовлетворяющая ограничениям (14) с у = /0,1 = /0 такая, что
(8)
Считаем, что встреча произошла, если
2
{р)& р{р)и{р).
(9)
Функция ах^,(р) является опорной функцией вектограммы (8), а функция ог2(/,<р) является опорной функцией вектограммы второго игрока К(/)=|ге7?” :г = М(()у, Д (у) = 1}- Из непрерыв-
(П)
1<г<р
Верна оценка [1]
Т
Т
(12)
(13)
Предположение 1. При любых / < р, <р ф 0 выполнено неравенство т (/ ,<р)> О . Обозначим при К р, у > О
(14)
{<р,г0 )|>1и(*0,р)(^0 - Р{10,у0,<р)).
(15)
(16)
Возьмем набор точек
t0<tl<...<tk=p (17)
и обозначим
k-1 | '/+1
А ='Е~Т--------1 [a2(r>‘p)w(r)dr, 1 = 0,1,...Д-1. (18)
Тогда [5] верхняя грань числа А0 по всем наборам (17) равняется интегралу, стоящему в правой части формулы (16). Следовательно, при некотором наборе чисел (17) выполняется
\(<p,z0)\>m(t0,<p)(p0 -А0). (19)
Из определения функции а2 (10), применяя лемму о выборе А.Ф. Филиппова [8], найдем измеримую по t функцию v(t,cp)eRq такую, что
A(v(t,p)) = 1, (<p,M(t)v(t,ip)) = a2{t,<p). (20)
Второй игрок строит свою стратегию следующим образом: берет найденные моменты времени (17) в качестве моментов коррекций и при t, <t< /)+1 строит управление с помощью функ-
ции (20)
v,(t) = w(t)v(t,<p)sign(<p,z{t,)). (21)
Здесь принято, что sign 0 = 1. Покажем, что при любом допустимом поведении первого игрока реализовавшиеся в моменты времени положения zt = z (/,) и запасы р1 = ц(f,) удовлетворяют неравенствам
>ф)(м, -4)- (22)
При i = 0 это неравенство выполнено. Пусть оно выполнено в момент времени (,. Тогда из правила перехода (6) и из формул (20) и (21) получим, что
>
j((p,N(r)du{r))
' (p,zt) + sign{<p,z,) jw(r)a2(r,<p)dr h
Отсюда, используя неравенства (12), (22) и правило изменения ресурсов (4), получим, что
^ + 1
\{^,zl+x)\>m{t, ,(p){/il - А,)+ jw{r)oc2(r ,cp)dr - m{t, - juM )•
Подставим сюда формулу (18). Получим, что
\(<p,zl+])\> т^ ,<р){м,+\ - А1+]).
Отсюда и из условия монотонности m(t, ,<р)> m(tl+],<p) следует неравенство (22) при /41, если
/jl+l > Al+l. Если же /и1+] < А1+], то неравенство (22) при / +1 очевидно.
Полагая в неравенстве (22) / = к , получим, что
\{<P,z(j>))\>m{p,<p)p{p) = ax{p,<p)(i(p).
Следовательно, включение (9) не выполнено.
Следствие 1. Для того чтобы первый игрок смог осуществить встречу (9), необходимо, чтобы начальные запасы ресурсов удовлетворяли неравенству
>supF(/0,/o>^)> = (23)
3. ЗАДАЧА О ВСТРЕЧЕ Обозначим
a(t) = max-^--j, (<р,<р) = 1. (24)
Как максимум непрерывных функций эта функция непрерывна при / < р [7].
lr < 00 .
Предположение 2. При любом I <р интеграл |а (г)с1г
I
При любых г <х <р,у > О, рей" обозначим
Г
Р((,г,г) = эир |аг(г)н’(г)й/г, (25)
p(t,r,y, <p) = sup Ja2(r> 0>)w(r)<afr. (26)
t
Здесь sup берется по всем измеримым функциям w: [г,r]—> [ОД], удовлетворяющим неравенству
Т
^w{r)dr < у. (27)
(
Из определения функции (25) следует, что
p(t,p,y)> p(t,r,y*)+ р{т,р,у~у*), t<T<p, О <у*<у. (28)
Из монотонности функции и из формул (24) - (27) получим неравенство
f3(t,T,y,(p)<m(t,(p)p(t,T,y). (29)
Из этого неравенства и из формулы (25) следует, что
Рк •£?.■?) < р(,, Г ,7) + m ('■■Ч’У-■*) )а {r)dr. (30)
т{т,(р) тут ,<р) J
Теорема 2. Пусть начальное состояние таково, что
\{(p,z0)\<m(t0,(p)(p0-p{tQ,p,y0)), У(реЯп. (31)
Тогда первый игрок сможет осуществить встречу (9).
Доказательство. Обозначим
В(( ,z) = max ■■■■- --J , (<р,<р) = 1. (32)
<? m{t,(p)
Тогда из (31) следует, что существует число е > 0 такое, что
B(t0,z0) + P{t0,p,y0) + £(p~t0)<^0. (33)
Используя непрерывность функций m{t,ср) и а(/) можно показать, что для любого отрезка Т с (-да,р) существует число S > 0 такое, что для любого вектора ере Rn выполнено m\t ,<р)- т\т,ф) Тг 1 \ , / \
-------т---г-----\a\r)dr < s{t -/); t,reT, t<r<t + S. (34)
m(r,<p)
Отсюда следует, что можно построить последовательность чисел tQ < ?, < t2 <...<?, —» р, для которых выполнено неравенство (34) при t = tn т- tl+]. Учитывая неравенство (30), получим, что при любых y>0,(peRn выполнено
t (35)
т\г,+\’<Р)
Эти числа t, первый игрок берет в качестве моментов коррекции своего управления. Построим на отрезке [t,,tl+i] управление первого игрока.
Пусть в момент времени t, реализовавшееся состояние удовлетворяет неравенству
(36)
Тогда, используя обозначение (32), получим, что проблема моментов [1]
р р 11 du (г) I —» min, zl + |N(r)du (г) = О
Ухоботов В.И., Зайцева О.В.
имеет решение и, (г), причем
И
IIIdu,{r)\<M,
(37)
Первый игрок в качестве управления берет сужение функции и, (г) на отрезке [ґ,,/м1 ]. Тогда из правила перехода (6) получим, что для любого вектора (рєКп выполнено неравенство
<P,Z'+ jN(r)du,(r)
+
*/+1
(р, JM(r)v(r)dr і,
<р,- JN(r)dut{r)
t + i И
+ \a2{r,<p)X(v{r))dr<m{t^x,(p) \\duXr)\ + -Y,+\,<p).
Отсюда, используя неравенства (35) и (37), будем иметь
|(p,zI+1)|<w(fI+1,p)(//l+1 -p{tt,p,y,)-s{p-t,)+ p{t„tl+x,Y, -Г1+1)+ «•(f.+i -0).
Применив неравенство (28), получим неравенство (36) при i + 1. Переходя в неравенстве (36) к пределу при t' -> р , получим, что | {ср, z {р)) | < ах (р, <р)р (р) для любого вектора ере Rn. Стало быть, условие поимки (9) выполнено.
4. ОДНОТИПНЫЕ ИГРЫ
Пусть m(t,<p) = m a2(t, <р) = fi(t)c(<p). Тогда функции (14) и (25) будут равны и при-
мут вид
Р п( \ Р
F{t,y) = sup [—j4w(r)dr, \w{r)dr<y, 0<w(r)<l. (38)
tmV) ,
Обозначим с» (z) = max( <p, z), с (<p) = 1. Tогда условия (15) и (31) примут вид ct{z0)>m(t0)(nQ-F(tQ,y0% c*{zQ)<m{tQ){pQ- F{t0,yQ)).
Можно показать, что если в последнем неравенстве поставить знак равенства, то первый игрок сможет осуществить встречу (9).
Таким образом, найденное условие является необходимым и достаточным для осуществления встречи (9).
Пример. Рассмотрим игровую задачу о встрече в заданный момент времени р двух точек переменного состава с разнотипными законами выброса топлива [1,5]
xx=yx,dyx=du\ x2=y2,y2=-v; x,,y,eRn.
Условие встречи означает совпадение геометрических координат хх (р) = х2 (р). Сделаем замену (5) и перейдем к новой переменной z — хх -х2 +(р-1)(уj - у2) • Тогда уравнение движения (6) и условие встречи (7) принимают вид
Г Г
z(r)= z(t)+ j(p - r)du(r)+ J(p - r)v(r)dr, z(p) = Q.
t t
Считаем, что нормы ||• || и Я0 совпадают и являются евклидовыми. Тогда из формул (10) и (11) получим, что т {t,<p) = {p-t)\<p\, a2(t,<p) = (p-t)j) (р I. Поэтому функция (38) равна min(/ ;p-t). Условие возможной поимки примет вид
I zo IN С«о - min</\P-tо))(р - h)■
Литература
1. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. - М.: Наука, 1970. -420 с..
2. Красовский, Н.Н. Об одной задаче преследования / Н.Н. Красовский // Прикл. мат. и мех. - 1963.-Т'. 27.-Вып. 2.-С. 244-254.
3. Красовский, Н.Н. К задаче о преследовании в случае ограничений на импульсы управляющих сил / Н.Н. Красовский, В.Е. Третьяков // Дифференц. уравнения. - 1966. - Т.2, № 5. -С. 587-599.
4. Ухоботов, В.И. Метод одномерного проектирования в линейной игре с интегральным ограничением и однотипные игры / В.И. Ухоботов // Изв. АН. Техн. кибернетика. - 1994. - № 3. -С. 192-199.
5. Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие / В.И. Ухоботов. - Челябинск: Челяб. гос. ун-т, 2005. - 124 с.
6. Ухоботов, В.И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограничением на энергетику / В.И. Ухоботов // Рукопись деп. в ВИНИТИ № 3254 - В 87. - Челябинск: Челяб. гос. ун-т. - 1987. - 20 с.
7. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный. - М.: Наука, 1980.-320 с.
8. Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования / А.Ф. Филиппов // Вестник МГУ. Серия «Математика, механика». - 1959. - № 2. - С. 25-32.
9. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский,
А.И. Субботин. - М.: Наука, 1974. - 456 с.
Поступила в редакцию 9 июня 2007 г.