Научная статья на тему 'Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока'

Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока Текст научной статьи по специальности «Математика»

CC BY
86
25
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ухоботов В. И., Зайцева О. В.

Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Игровая задача импульсной встречи со смешанным ограничением на управление второго игрока»

УДК 517.977.80

ИГРОВАЯ ЗАДАЧА ИМПУЛЬСНОЙ ВСТРЕЧИ СО СМЕШАННЫМ ОГРАНИЧЕНИЕМ НА УПРАВЛЕНИЕ ВТОРОГО ИГРОКА

В.И. Ухоботов, О.В. Зайцева

Рассмотрена игровая задача о встрече в заданный момент времени. На выбор управления первого игрока накладывается импульсное ограничение. Управление второго игрока стеснено геометрическими и интегральными ограничениями. Найдены как условия уклонения, так и условия, обеспечивающие встречу. Построены соответствующие управления игроков.

1. ВВЕДЕНИЕ

Рассматривается линейная дифференциальная игра

с1х = А{$)хск + + С(?)убй (1)

с импульсным управлением [1] первого игрока и и с фиксированным моментом окончания р. Здесь х е Я8, и е ге Я4, С(^) - непрерывные при ? < р матрицы соответствующих

размерностей. Задано линейное отображение л: Я8 -> Яп. Цель первого игрока заключается в том, чтобы в момент времени р осуществить равенство

лх(р)~ 0. (2)

Второй игрок, выбирая управление V , стремится не допустить выполнение равенства (2).

На каждом отрезке [/, г] допустимым программным управлением первого игрока является

Г

функция и:[/,г]—с ограниченной вариацией |||Л/(г)|| = 8ир^|и(г,+1)-м(г, )||. Допустимое

I

программное управление второго игрока является измеримым и ограниченным

Д(у(г))<1, г<г<х. (3)

Здесь посредством || • || и /.(•) обозначены нормы в Л5 и Яя соответственно.

Считается, что игроки обладают запасами // >0 и ;/ > 0 ресурсов, которые тратятся на формирование управлений по следующему правилу:

Г Г

м(т) = м(0- 114и(г)|, г(т) = у(()- |Я(у(г))с1г. (4)

I (

При выбранных программных управлениях вектор х из состояния х (/) перемещается в состояние, определяемое обобщенной формулой Коши [1].

Обозначим через ф(/) фундаментальную матрицу системы (1) и перейдем к новой переменной

г(/) = ж(/)дг(/), тг(/) = л:ф(/?)ф~!(/). (5)

Тогда получим,что

Г Т

г(г) = г(/)+|ТУ(г)й?м(г)+ |м(/-)у(/-)й?г. (6)

/ I

Здесь = м(г) = л-(/)с(?) - непрерывные матрицы, а первый интеграл понимается в

смысле Римана-Стилтьеса.

В новых переменных условие встречи (2) принимает вид

г(р) = 0. (7)

В 1963 году Н.Н. Красовский [2] предложил метод решения дифференциальных игр, основанный на принципе поглощения областей достижимости. В этой работе рассмотрены игры с геометрическими, интегральными и импульсными ограничениями. Применение метода поглощения областей достижимости для игр с импульсными управлениями усложняется тем, что области достижимости, зависящие от запасов ресурсов, могут меняться разрывно. В работе [3] приведен Серия «Математика, физика, химия», выпуск 9 55

пример импульсной встречи двух точек, в котором первый игрок не сможет поддержать требуемого в методе включения областей достижимости.

В данной работе используется метод одномерного проектирования [4-6], который применительно к задачам импульсной встречи позволяет получить условие возможности поимки (7).

Наличие импульсного управления, приводящего к мгновенному изменению позиции, требует конкретизации понятия встречи (7).

Введем в рассмотрение вектограмму первого игрока

Если выполнено это включение, то первый игрок путем мгновенного выбора части оставшегося запаса ресурсов может осуществить равенство (7).

2. ЗАДАЧА УКЛОНЕНИЯ

Обозначим через {,) скалярное произведение векторов в 7?". При каждых г<р и (реЯп обозначим

Функция (11) является опорной функцией области достижимости и] первого игрока [5, 6],

где

Теорема 1. Пусть начальное состояние 10,г0, /л0,у0 таково, что существует вектор (р е Я". для которого

Тогда возможно уклонение от встречи (9).

Доказательство. Из (14) и (15) следует, что существует функция (г), удовлетворяющая ограничениям (14) с у = /0,1 = /0 такая, что

(8)

Считаем, что встреча произошла, если

2

{р)& р{р)и{р).

(9)

Функция ах^,(р) является опорной функцией вектограммы (8), а функция ог2(/,<р) является опорной функцией вектограммы второго игрока К(/)=|ге7?” :г = М(()у, Д (у) = 1}- Из непрерыв-

(П)

1<г<р

Верна оценка [1]

Т

Т

(12)

(13)

Предположение 1. При любых / < р, <р ф 0 выполнено неравенство т (/ ,<р)> О . Обозначим при К р, у > О

(14)

{<р,г0 )|>1и(*0,р)(^0 - Р{10,у0,<р)).

(15)

(16)

Возьмем набор точек

t0<tl<...<tk=p (17)

и обозначим

k-1 | '/+1

А ='Е~Т--------1 [a2(r>‘p)w(r)dr, 1 = 0,1,...Д-1. (18)

Тогда [5] верхняя грань числа А0 по всем наборам (17) равняется интегралу, стоящему в правой части формулы (16). Следовательно, при некотором наборе чисел (17) выполняется

\(<p,z0)\>m(t0,<p)(p0 -А0). (19)

Из определения функции а2 (10), применяя лемму о выборе А.Ф. Филиппова [8], найдем измеримую по t функцию v(t,cp)eRq такую, что

A(v(t,p)) = 1, (<p,M(t)v(t,ip)) = a2{t,<p). (20)

Второй игрок строит свою стратегию следующим образом: берет найденные моменты времени (17) в качестве моментов коррекций и при t, <t< /)+1 строит управление с помощью функ-

ции (20)

v,(t) = w(t)v(t,<p)sign(<p,z{t,)). (21)

Здесь принято, что sign 0 = 1. Покажем, что при любом допустимом поведении первого игрока реализовавшиеся в моменты времени положения zt = z (/,) и запасы р1 = ц(f,) удовлетворяют неравенствам

>ф)(м, -4)- (22)

При i = 0 это неравенство выполнено. Пусть оно выполнено в момент времени (,. Тогда из правила перехода (6) и из формул (20) и (21) получим, что

>

j((p,N(r)du{r))

' (p,zt) + sign{<p,z,) jw(r)a2(r,<p)dr h

Отсюда, используя неравенства (12), (22) и правило изменения ресурсов (4), получим, что

^ + 1

\{^,zl+x)\>m{t, ,(p){/il - А,)+ jw{r)oc2(r ,cp)dr - m{t, - juM )•

Подставим сюда формулу (18). Получим, что

\(<p,zl+])\> т^ ,<р){м,+\ - А1+]).

Отсюда и из условия монотонности m(t, ,<р)> m(tl+],<p) следует неравенство (22) при /41, если

/jl+l > Al+l. Если же /и1+] < А1+], то неравенство (22) при / +1 очевидно.

Полагая в неравенстве (22) / = к , получим, что

\{<P,z(j>))\>m{p,<p)p{p) = ax{p,<p)(i(p).

Следовательно, включение (9) не выполнено.

Следствие 1. Для того чтобы первый игрок смог осуществить встречу (9), необходимо, чтобы начальные запасы ресурсов удовлетворяли неравенству

>supF(/0,/o>^)> = (23)

3. ЗАДАЧА О ВСТРЕЧЕ Обозначим

a(t) = max-^--j, (<р,<р) = 1. (24)

Как максимум непрерывных функций эта функция непрерывна при / < р [7].

lr < 00 .

Предположение 2. При любом I <р интеграл |а (г)с1г

I

При любых г <х <р,у > О, рей" обозначим

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г

Р((,г,г) = эир |аг(г)н’(г)й/г, (25)

p(t,r,y, <p) = sup Ja2(r> 0>)w(r)<afr. (26)

t

Здесь sup берется по всем измеримым функциям w: [г,r]—> [ОД], удовлетворяющим неравенству

Т

^w{r)dr < у. (27)

(

Из определения функции (25) следует, что

p(t,p,y)> p(t,r,y*)+ р{т,р,у~у*), t<T<p, О <у*<у. (28)

Из монотонности функции и из формул (24) - (27) получим неравенство

f3(t,T,y,(p)<m(t,(p)p(t,T,y). (29)

Из этого неравенства и из формулы (25) следует, что

Рк •£?.■?) < р(,, Г ,7) + m ('■■Ч’У-■*) )а {r)dr. (30)

т{т,(р) тут ,<р) J

Теорема 2. Пусть начальное состояние таково, что

\{(p,z0)\<m(t0,(p)(p0-p{tQ,p,y0)), У(реЯп. (31)

Тогда первый игрок сможет осуществить встречу (9).

Доказательство. Обозначим

В(( ,z) = max ■■■■- --J , (<р,<р) = 1. (32)

<? m{t,(p)

Тогда из (31) следует, что существует число е > 0 такое, что

B(t0,z0) + P{t0,p,y0) + £(p~t0)<^0. (33)

Используя непрерывность функций m{t,ср) и а(/) можно показать, что для любого отрезка Т с (-да,р) существует число S > 0 такое, что для любого вектора ере Rn выполнено m\t ,<р)- т\т,ф) Тг 1 \ , / \

-------т---г-----\a\r)dr < s{t -/); t,reT, t<r<t + S. (34)

m(r,<p)

Отсюда следует, что можно построить последовательность чисел tQ < ?, < t2 <...<?, —» р, для которых выполнено неравенство (34) при t = tn т- tl+]. Учитывая неравенство (30), получим, что при любых y>0,(peRn выполнено

t (35)

т\г,+\’<Р)

Эти числа t, первый игрок берет в качестве моментов коррекции своего управления. Построим на отрезке [t,,tl+i] управление первого игрока.

Пусть в момент времени t, реализовавшееся состояние удовлетворяет неравенству

(36)

Тогда, используя обозначение (32), получим, что проблема моментов [1]

р р 11 du (г) I —» min, zl + |N(r)du (г) = О

Ухоботов В.И., Зайцева О.В.

имеет решение и, (г), причем

И

IIIdu,{r)\<M,

(37)

Первый игрок в качестве управления берет сужение функции и, (г) на отрезке [ґ,,/м1 ]. Тогда из правила перехода (6) получим, что для любого вектора (рєКп выполнено неравенство

<P,Z'+ jN(r)du,(r)

+

*/+1

(р, JM(r)v(r)dr і,

<р,- JN(r)dut{r)

t + i И

+ \a2{r,<p)X(v{r))dr<m{t^x,(p) \\duXr)\ + -Y,+\,<p).

Отсюда, используя неравенства (35) и (37), будем иметь

|(p,zI+1)|<w(fI+1,p)(//l+1 -p{tt,p,y,)-s{p-t,)+ p{t„tl+x,Y, -Г1+1)+ «•(f.+i -0).

Применив неравенство (28), получим неравенство (36) при i + 1. Переходя в неравенстве (36) к пределу при t' -> р , получим, что | {ср, z {р)) | < ах (р, <р)р (р) для любого вектора ере Rn. Стало быть, условие поимки (9) выполнено.

4. ОДНОТИПНЫЕ ИГРЫ

Пусть m(t,<p) = m a2(t, <р) = fi(t)c(<p). Тогда функции (14) и (25) будут равны и при-

мут вид

Р п( \ Р

F{t,y) = sup [—j4w(r)dr, \w{r)dr<y, 0<w(r)<l. (38)

tmV) ,

Обозначим с» (z) = max( <p, z), с (<p) = 1. Tогда условия (15) и (31) примут вид ct{z0)>m(t0)(nQ-F(tQ,y0% c*{zQ)<m{tQ){pQ- F{t0,yQ)).

Можно показать, что если в последнем неравенстве поставить знак равенства, то первый игрок сможет осуществить встречу (9).

Таким образом, найденное условие является необходимым и достаточным для осуществления встречи (9).

Пример. Рассмотрим игровую задачу о встрече в заданный момент времени р двух точек переменного состава с разнотипными законами выброса топлива [1,5]

xx=yx,dyx=du\ x2=y2,y2=-v; x,,y,eRn.

Условие встречи означает совпадение геометрических координат хх (р) = х2 (р). Сделаем замену (5) и перейдем к новой переменной z — хх -х2 +(р-1)(уj - у2) • Тогда уравнение движения (6) и условие встречи (7) принимают вид

Г Г

z(r)= z(t)+ j(p - r)du(r)+ J(p - r)v(r)dr, z(p) = Q.

t t

Считаем, что нормы ||• || и Я0 совпадают и являются евклидовыми. Тогда из формул (10) и (11) получим, что т {t,<p) = {p-t)\<p\, a2(t,<p) = (p-t)j) (р I. Поэтому функция (38) равна min(/ ;p-t). Условие возможной поимки примет вид

I zo IN С«о - min</\P-tо))(р - h)■

Литература

1. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. - М.: Наука, 1970. -420 с..

2. Красовский, Н.Н. Об одной задаче преследования / Н.Н. Красовский // Прикл. мат. и мех. - 1963.-Т'. 27.-Вып. 2.-С. 244-254.

3. Красовский, Н.Н. К задаче о преследовании в случае ограничений на импульсы управляющих сил / Н.Н. Красовский, В.Е. Третьяков // Дифференц. уравнения. - 1966. - Т.2, № 5. -С. 587-599.

4. Ухоботов, В.И. Метод одномерного проектирования в линейной игре с интегральным ограничением и однотипные игры / В.И. Ухоботов // Изв. АН. Техн. кибернетика. - 1994. - № 3. -С. 192-199.

5. Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учеб. пособие / В.И. Ухоботов. - Челябинск: Челяб. гос. ун-т, 2005. - 124 с.

6. Ухоботов, В.И. Гарантированный стабильный мост в линейной игре импульсной встречи с ограничением на энергетику / В.И. Ухоботов // Рукопись деп. в ВИНИТИ № 3254 - В 87. - Челябинск: Челяб. гос. ун-т. - 1987. - 20 с.

7. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный. - М.: Наука, 1980.-320 с.

8. Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования / А.Ф. Филиппов // Вестник МГУ. Серия «Математика, механика». - 1959. - № 2. - С. 25-32.

9. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский,

А.И. Субботин. - М.: Наука, 1974. - 456 с.

Поступила в редакцию 9 июня 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.