Научная статья на тему 'К теории дифференциальных игр преследования управляемых стационарными уравнениями второго порядка'

К теории дифференциальных игр преследования управляемых стационарными уравнениями второго порядка Текст научной статьи по специальности «Математика»

CC BY
39
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕСЛЕДОВАНИЯ / ПРЕСЛЕДУЮЩИЙ / УБЕГАЮЩИЙ / УПРАВЛЕНИЯ ПРЕСЛЕДОВАНИЯ / УПРАВЛЕНИЯ УБЕГАНИЯ / PURSUIT / PURSUER / EVADER / PURSUIT CONTROL / EVASION CONTROL

Аннотация научной статьи по математике, автор научной работы — Маматов М. Ш.

Статья посвящена изучению игровой задачи преследования описываемых уравнениями Пуассона для задачи Дирихле. Поставленная задача с помощью метода конечных разностей приведена дискретную игру второго порядка, и оно решается методом матричной прогонки. Разработанные методы можно применять для решения задач преследования, описываемых уравнениями эллиптического типа второго порядка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К теории дифференциальных игр преследования управляемых стационарными уравнениями второго порядка»

Маматов М.Ш.

Доктор физико-математических наук, Национальный университет Узбекистана им. М.

Улугбека, Ташкент, Узбекистан

К ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР ПРЕСЛЕДОВАНИЯ УПРАВЛЯЕМЫХ СТАЦИОНАРНЫМИ УРАВНЕНИЯМИ ВТОРОГО ПОРЯДКА

Аннотация

Статья посвящена изучению игровой задачи преследования описываемых уравнениями Пуассона для задачи Дирихле. Поставленная задача с помощью метода конечных разностей приведена дискретную игру второго порядка, и оно решается методом матричной прогонки. Разработанные методы можно применять для решения задач преследования, описываемых уравнениями эллиптического типа второго порядка.

Ключевые слова: преследования, преследующий, убегающий, управления преследования, управления убегания.

Keywords: pursuit, pursuer, evader, pursuit control, evasion control.

Рассматривается игровой аналог задачи Дирихле для уравнения Пуассона [1,186]

а2 2 а2 2

u(х, у) + V (X, у),

ах2 ау2

(х, у) е й , (1) 2(х,у) = ф (х,у), (х,у)е Г , й = {(х, у) : 0 < х < 1,0 < у < 1} - квадрат со сторонами, параллельными осям координат, а Г - его граница, и = и(х,у), V = V (х,у) - управляющие функции из класса ^(й )• Функцией и(х, у) распоряжается первый (преследующий) игрок, функцией V (х, у) второй (преследуемый или убегающий) игрок, и е Р , V е Q , р и Q - непустые компакты в р1. Выделено терминальное множество С Р1 .

Пусть W2k (й ) - пространство функций из ), имеющие все обобщенные

о

производные до порядка к включительно, wk (й ) - подпространство пространства

к 0 к W2 (й ), в котором плотным является множество ск (й ) - функций из С (й ), каждая

из которой обращается в нуль в некоторой полоске границы а й = Г области й .

В работах [2,5], [3,123] рассмотрены задачи преследования описываемые уравнениями параболического типа.

Определение 1. В задаче (1) возможно £ - завершение (£ > 0) преследования из

граничного положения ф (•, • ), если существуют функция и (V , х, у) е Р , V е Q ,

(х, у) е й , такие, что для произвольной функции V 0 (х, у) е Q , (х, у) е й , решение

20(х, у) задачи (4.1), где и = и^ 0(х, у), х, у),

V = V 0 (х, у), попадает на множество £ I + М1, при некотором (у ,У ),

(у,у)е й : 20(~,у)е £I + Мь где I = (- 1,1).

линий X = X = гК, h = -, г = 0,1, ..., г, у = Уу = jl, I = -, j = 0,1,...,0 , г,0 -

В области 0 выберем сеть узловых точек (X, уу) на пересечении координатных

г = 0,1,.,г, у = у,- = -I, I = -г 1 0

некоторые натуральные числа. Точки (X, уу), которые принадлежат множеству 0 ,

образуют сетку 0 ^ , являясь ее узлами. В качестве аппроксимации уравнения (1), примем следующее сеточную задачу Дирихле для уравнения Пуассона 2« + ^ =- и(ХУ) (x,У), (X,у)€ 0 ы, (2)

2(X,у) = ф (X,у), (X,у)€ Г ,

где

К

1

2 XX = ,2 [ 2г +1, - 2 2г, - + 2г - 1, - ]

[, +1 - 22-, + 2,,-1], 2г,- = 2(X,у-).

2_ = -

уу 1I,- + 1 г,- ' ,-

2

Преобразуем схему (2). Для этого умножим (2) на (- R ) и распишем по точкам разностную производную 2уу . При 1 £ ] £ 0 - 1 будем иметь

для 2 £ г £ г - 2

- 2 , - - 1 ' ^г, - 1 ^xx\^?J.>^ ^г, - + 1" 1 , - "1, -

22 2г, /-1 + [22г, - - 1 2XX (г, -)] - 2г, - +1 = 1 (и, / - и г, -);

для г = 1

12 2 - -2г,>-1 + [22г,> - (2г +1,- - 22г,- )] - 2г,- +1 = 1 (иг,- - и «,> ^

12 2 - -2г, - - 1 + [2 2г, - " 72 ( 2г - 1, - - 2 2г, - )] - 2г, - + 1 = 1 (иг, - - и г, - ),

для г = г -1

- 2г ; ! + [22г . -

К

где

_ _ 1

иг,- г,- = иг,- "« г,- + * 0,-

и (г - 1, - ) = иг - 1, - - и г - 1, - + "у * г, - .

К2

Кроме того, для - = 0,0 имеем 2г,0 = * г,0, 2г,0 = * г,0 , 1 £ г £ г - 1.

Обозначим теперь через ^ вектор размерности г - 1, компонентами которого являются значения сеточной функции 21,- во внутренних узлах сетки 0 ^ на - -й строке: 2- = (21,-,22,-2г-1,-), 0 £ - £ 0 , а через

и- = (и1, -, и2, >иг - 2, >, иг - 1, > ),

и У = (ии,и 2,-г- 2, У ,и г- 1, У ), 1 £ - £0-1,

20 = *3 = 1,0,Ф 2,0,.,ф г- 1,0 ) ,

20 = 1,0 * 2,0 г - 1,0 ).

Определим также квадратную матрицу С размером, (г - 1) X (г - 1) следующим образом

CF = (Л/(1), Л / (2),..., Л / (г - 1)), F = (/ (1), / (2),..., / (г - 1)), где разностный оператор Л есть

Л/(0 = 2/(/) - 12/х,(I), 1 < / < г - 1, / (0) = / (г) = 0.

Легко видеть, что С есть трехдиагональная матрица (г - 1) X (г - 1) вида

С =

' 2(1 + а ) -а 0 0 0 0 ^

- а 2(1 + а ) - а 0 0 0

0 -а 2(1 + а ) . 0 0 0

0 0 0 2(1 + а ) -а 0

0 0 0 -а 2(1 + а ) - а

0 V 0 0 0 -а 2(1 + а ) ^

(3)

где а =

= I2

2 , причем С является матрицей с диагональным преобладанием, так как

|1 + а |> | а |, а > 0, и следовательно, не вырождена.

Используя введенные обозначения, полученные выше соотношения можно записать в виде следующей системы трехточечных векторных уравнений

- 2, - 1 + С2}. - 2, +1 = 12(и] -V ] ), 1 < ] <0- 1,

20 = ф0, 2о =фо . (4)

Пусть в рг-1 выделено терминальное множество М .

Определение 2. Будем говорить, что в игре (4) из «граничного» положения (ф 0, фо ) можно завершить преследования за N < 0 шагов, если по любой последовательности V 0^1,...^ N -1 управления убегания можно построить такую последовательность ^, ..., UN _ 1 управления преследования, что решение

{20, 21,22,., 2N -1,2N } уравнения - 2, -1 + С2,

2]+1

12(й, -Г,), 1 < ] < г - 1,

20 = Ф 0, 2о = Фо , при некотором й < N попадает на М : 2^ е М.

Пусть дискретная игра описывается уравнениями (4). Через ип (х) обозначим полином Чебышева второго рода степени п : sin(n + 1) arccos х

ип (х) =

sinarccos х 1

I х |< 1

2Vх2 - 1

х

г^—У+М г^—V (п +1)

+ V х - 1 - (х + V х - 1|

, I х |> 1

(5)

Без доказательства приведем следующую лемму.

Лемма. Пусть и - и (-) - и-, V - V (-) - V -, 1 £ - £ N - заданные конкретные

управления. Тогда решения уравнения (4) с граничными условиями 20 - ф 0, 20 - * 0 определяются формулой [см. 6]

п -1 (л \

20 + X ик - 1 к - 1

2п = и~-\

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

-С 2

\ у

и0

0- п - 1

1

-С 2

\ у

2

V У

(- 12ик + 12м к )

+ и0-_11

/ 1 \ /1 \

ип - 1

1С 2

V У

1С 2

V У

2

1 (1 V 2 2 \

+ X и0-к-1 - С (-1Ч + 12и к)

к - п

-С 2

V у

(6)

лг - 1 •

Предположение 1. М - М0 + М1, где М - линейное подпространство Rr М1 - подмножество подпространства L - ортогонального дополнения М0 в Rг-1.

Через П обозначим операцию ортогонального проектирования из Rг-1 на L.

М11 + М12 = М1

п - 1

-1

Пусть М 1,1 + М12 - М1 и

WlЛ(n) - X П и0--11

к -1

0 -1 ( 1 Wla(n) - X П и~-\

1

-С 2

V у

и

0 - п -1

1

-С 2

V у

ик -1

/ 1 \

здесь ип

к- п 1

-С 2

V у

-С 2

/ 1 \

1С 2

V У V У

ип - 1

и

0 - к - 1

1

-С 2

V У 1

-С 2

V У

(12 Р * I ^)- М1,1; (12 Р * I ^)-М1,2, (7)

- матричный полином Чебышева.

- П -П

Предположение 2. Пусть существует такое п - п0, что

/ 1 \ / 1 \

иД

и--1!

1С 2

V У 1

-С 2

V У

и

0- п0 - 1

2

V У

2,

€ ^1,1 (п0 )

и

ип0 -1

1

-С 2

V У

2

€ (п0 ) . (8)

Теорема1. Если выполнены предположения 1, 2, то в игре (4) из «граничного» положения (20, 20 ) возможно завершение преследования за N(20, 20 ) £ п0 шагов. Доказательство. Из (7) и (8) следует существования таких

11

~ ик -1

а(к) €

П П и0--11

и (к )€ е

1С 2

V У

и

0 - п0 - 1

-С 2

V у

-С 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V У

(12Р - 12и (к)), 1 £ к £ п0 - 1,

П п и0-_11

и (к)е е

1

-С 2

V У

ип0 -1

1

-С 2

V У

и

0- к -1

1

-С 2

V У

(12Р - 12и (к)), п0 £ к £ 0 - 1,

¿1 € М11, ¿2 € М1, 2 , что

/ 1 \ / 1 \

П П

и0--11

иД

1С 2

V У

/1 х -С 2

V у

и0

0 - п0 - 1

и„„ -1

1С 2

V У 1

-С 2

V У

2

п0 - 1

2,

X а(к) - ¿1,

к -1

-1

X а(к) " ¿2 . (9)

к - пп

Пусть V = V (к), 1 < к <0 - 1 - произвольное допустимое управление убегающего игрока; управление преследующего игрока и = и (к) построим как решение

следующего уравнения

п ц-.1/1 '

а(к):

IС 2

V У

ц

0- п0 - 1

1

-С 2

\ у

ик -1

1

-С 2

V у

(12й(к) - I

п и;-1!

1

-С 2

V у

Цп0 -1

1

-С 2

V у

1 < к < п0 - 1;

(10)

ц

0- к -1

1

-С 2

V у

(12и(к) - I

V

Ясно, что эти уравнения имеют решения по выбору а(к), так как V (к) е Q и и (к) е Р . Подставляя V = V к = V (к) и и = ик = и (к) в (4.4) и применяя формулу (7), получим

2 (п0) = и0 -11

1

-С 2

V у

ц

0 - п0 - 1

1

-С 2

V У

п0 - 1

20 + X ^ -1 к = 1

1

-С 2

V У

(-1 \ +12v к)

+ и-0\

1

-С 2

\ у

цп0-1 п -1

1

-С 2

\ у

-1

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ X ц0-к-1

к = пп

1

-С 2

V у

(- 1 \ + 1 ^ к)

Отсюда, применяя, к обеим частям равенства оператор проектирования п и из равенства (9), (10), имеем

/1\ /1\ п0 -1 /1\ /1\

и0"-11

1

-С 2

V У -1

+ п

п 2(п0)= п •Цк -1

+ X- и;-1

=п

цп0-1

1С 2

V У

и0

- п0 - 1

2

V У

20 + X и0_-1

(- 1 \ + 1 "V к)

+ п

ц0--11

к = 1 1

п0 - 1

г- 1 1 С 2

V У

ц

0- п0-1

2

V У

-С 2

к = пп

1

-С 2

V у

и0"-11

ип 1

п0 - 1

/ 1 \

1

-С 2

\ у

ц

0 - к - 1

V У 1

-С 2

V У

1

-С 2

V У

2

V У

ц

ц0--11

1

-С 2

V У

1

-С 2

V У

2

0 - п0 - 1

-1

1

-С 2

V У

2

цп0-1 п0 - 1

(12"к +12^к) п0 -1

+ X а(к)+

20 +

+ X а(к) = п

к = п0

ц0--11

п

ц0--11

1

-С 2

V у

ц

0- п0 -1

-п

ц0--11

1

-С 2

цп0-1 п -1

1

-С 2

V У 1

-С 2

2

+ ь1 + п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ц0--11

к = 1 1

-С 2

V у 1

-С 2

V у

ц0

0 - п0 -1

1

-С 2

V У

2

цп0-1

1

-С 2

\ У

2

2

+ Ь2 = Ь1 + Ь2 е М11 + М12 = М1.

V _ У V _ У -

Из этого включения получим, что п 2(п0 ) е М1 и, значит, 2(п0 ) е М . Что и требовалось доказать.

Пусть 1 < п < 0 - 1, ^ц(0) = - М1Д , W2,2 = - М1>2,

W2Л(n)= п

V (к )е д

1 < к < п - 1,

W2a(n) = п

V (к )е д

Жм(п - 1) + п Uо--1l

1

-С 2

V У

ц

0 - п - 1

1

-С 2

V У

^ -1

1

-С 2

V У

(12 р -

^^2,2 (п - 1) + п Uо--1l

1

-С 2

V У

цп - 1

1

-С 2

V у

ц0

0- к -1

1

-С 2

V у

(12Р -V (к))

п < к < 0 - 1.

Предположение 3. Пусть существует такое п = п0, что

-п -п

ц-.1!

1

-С 2

V У 1

-С 2

V У

ц

0 - п0 -1

1

-С 2

V У

2

е ^^2,1(п0)

и

цп 1 п0 - 1

1

-С 2

V у

2

е ^^2,2 (п0 ) .

Теорема 2. Если выполнены предположения 3, то в игре (4) из «граничного» положения (20,20 ) возможно завершение преследования за N(20,20 ) < п0 шагов. Теорема 2 доказывается точно также как теорема 1.

п -1

Пусть ап(•) = {а 1,а2,.,ап-1 :ак >- 0, X а (к) = 1},

к = 1

0 -1

Ьп(•) = {Ьп,Ьп +1,.,?0-1: Ьк * 0, XV (к) = 1} и

к = п

Щ(а п (•)) =X

п - 1

X

к = 1

а кМ1,1 + п ц0"-11

/ 1 \

- п -1

*п ц,-1

1

-С 2

V у

ц

0- п -1

I-1

W2(b п О) = X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к = п

1 V

* п ц-1!

ь кМ 12 + п Uо--1l цп - 1

'1 ^ -С ц0 2

V у 1

-С 2

V у V у

/ 1 \ /1 \

2

ц -1

цп - 1

1С 2

V у 1

-С 2

2

V У V У / 1 \ / 1 \

2

V У

1 С

2

ц

0- к -1

V У

1

-С 2

V У

^ -1 12д

ц0 - к - 1 12д

' 1 ^ -С 12Р 2

V У у

' 1 ^ -С 12Р 2

V У У

Положим

Жн(0) = М11 ^3,1(п) = Ц^ Wl(а к(•)) 1 < к < п - 1

' ' а к(0 ' '

Wз,2(0) = М12, ^^3,2(п) = ^ к()), 1 < к < 0 - 1,

Предположение 4. Пусть существует какое п = п, что

-п -п

ц0--11

ц0--11

1

-С 2

V у 1

-С 2

V У

0 - п0 -1

ц цп0-1

1

-С 2

V У

2

1

-С 2

V У

2

е WзД(ио),

е ^5,1 (п0).

V

*

*

Теорема 3. Если выполнены предположения 4, то в игре (4) из «граничного»

положения (20,20 ) возможно завершение преследования за N(20,20 ) £ п шагов.

Теорема 3 доказывается точно также как теорема 1.

Нетрудно убедиться [4,407], [5,376], что решение 2г,- разностной задачи (2)

сходится к решению 2 исходной задачи (1), и имеет место следующая оценка скорости сходимости

||( 2) ы - 2г, -Уф ы £ КХЫ2 + К 4 2, (11) где (2)ы1 - значения точного решения задача (1) в узлах сетки, Ф ы - пространство

сеточных функций, 11 ' ||ф ы - норма этого пространства, К, К2 - константы.

22

Теорема 4. Пусть в неравенство (11) К1Ы + К21 < £ , и в игре (4) из точки 20 - * 0 , 20 - *0 возможно завершение преследования в смысле определения 2. Тогда в игре (1) из начального положения 2(X,у) - * (X,у), (X,у)€ Г можно завершить преследования в смысле определения 1.

Доказательство. Пусть в игре (4) из точки 20 - * 0, 20 - * 0 можно завершить преследования за N £ 0 шагов. Тогда из определения следует, что по любой последовательности V 0^1,.. N-1, V к € е, 0 £ к £ N - 1 управления убегания можно построить такую последовательность и0, и1,..., UN -1, ик € Р , 0 £ к £ N - 1 управления преследования, что решение (20,21,.,zN) уравнения - 2--1 + С2- - 2- +1 - 12и- - I^ -, 1 £ - £ 0 - 1, при некотором d £ N попадает на М : 2^ € М. Пусть теперь в игре (1)

V - V (X, у) € е , (X, у) € 0 произвольное управление убегающего игрока из класса L2(W ). Зная управления убегающего V - V (X,у), мы можем определить V г,- как значение этой функции в узловых точках сетки 0 ы, т.е.

V- --V]- оч-,1Г2,-—л--2,-д;-1,-).

Отсюда, в силу условия теоремы, можем строить управление преследователя в игре (4), обеспечивающее завершение преследования

и- - U] - (и1, -, и2, - иг - 2, -, иг - 1, - ).

Теперь в игре (1) управление преследующего игрока и - и (X, у) построим следующим образом:

и (X, у) - [ии] : гы £ X £ (г + 1)Ы, г - 0,1,..., г - 1, -1 £ у £ (- + 1)1, - - 0,1,. ,0 - 1}. Ясно, что и € Р и и (X, у) € L2(W ). Подставляя V -V (X, у), и - и (X, у) в (4.1) получим дифференциальное уравнение, точно также подставляя V - - V г,-, иг,- - иг,- в (2) получим сеточное уравнение, аппроксимирующее уравнения (1).

Пусть (2) ы1 - значение точного решения, соответствующее управлением

V - V(X,у), и - и(X,у) задачи (1) в узлах сетки 0 ы, 2г,- - решение, соответствующее

управлениям V - - V г,-, иг,- - иг,- разностной задачи (2), тогда из (20) , и из условия теоремы имеем

||(2)ы - 2- - ||ф ы £ КЫ2 + К212 < £.

Отсюда, и из того, что zi, j e M1 получим

(z)ы - je e 1, (z)hie eI + Z', j, (z)hi e e I + M1,

что и требовалось доказать.

Литература

1. Авдонин С.А., Иванов С.В. Управляемость систем распределенными параметрами и семейства экспонент. Учеб. пособие для Вузов. - Киев: УМКВО, 1989. - 244 с.

2. Маматов М.Ш. К теории дифференциальных игр преследования в системах с распределенными параметрами // Автоматика и вычислительная техника. - Рига. 2009. -№ 1. - С. 5-14.

3. Маматов М.Ш. О применении метода конечных разностей к решению задача преследования в системах с распределенными параметрами // Автоматика и телемеханика. - Москва. 2009. - № 8. - С.123-132.

4. Марчук Г.И. Методы вычислительной математики - М.: Наука, 1989. - 608 с.

5. Самарский А.А., Николаев Е.С. Методы решения сеточных уравнений. - М.: Наука, 1978. - 570 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.