Научная статья на тему 'Игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла'

Игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла Текст научной статьи по специальности «Математика»

CC BY
116
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИГРОВАЯ ЗАДАЧА / СТРАТЕГИЯ / ДВИЖЕНИЕ / ПОЗИЦИЯ ИГРЫ / ПРОГРАММНЫЙ МАКСИМИН / УПРАВЛЯЮЩЕЕ ВОЗДЕЙСТВИЕ / GAME TASK / STRATEGY / MOTION / GAME POSITION / POLICY MAXIMIN / CONTROL ACTION

Аннотация научной статьи по математике, автор научной работы — Пасиков Владимир Леонидович

Рассматриваются игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла и игровая задача m лиц для положения равновесия системы функционалов (типа расстояния) в смысле Нэша. При решении этих задач используется известная экстремальная конструкция академика Н. Н. Красовского, модифицированная к рассматриваемым ситуациям.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Игровые задачи наведения для линейных интегродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла»

УДК 517.977

В. Л. Пасиков

ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ ЛИНЕЙНЫХ ИНТЕГРОДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРА С УПРАВЛЯЮЩИМИ ВОЗДЕЙСТВИЯМИ ПОД ЗНАКОМ ИНТЕГРАЛА

Аннотация. Рассматриваются игровые задачи наведения для линейных инте-гродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла и игровая задача m лиц для положения равновесия системы функционалов (типа расстояния) в смысле Нэша. При решении этих задач используется известная экстремальная конструкция академика Н. Н. Красовско-го, модифицированная к рассматриваемым ситуациям.

Ключевые слова: игровая задача, стратегия, движение, позиция игры, программный максимин, управляющее воздействие.

Abstract. The article considers aiming game tasks for linear integro-differential Volterre's system with control action under the integral sign. The author studies the task of aiming to the point of origin and the m distinction game task for equilibrium position of the functional system (distance type) in Nashe's implication. To solve such problems the researcher suggests some modifications to the well-known extreme construction by prof. N. Krasovskiy.

Key words: game task, strategy, motion, game position, policy maximin, control action.

Статья продолжает исследование [1], а также нумерацию разделов, формул, определений и теорем в [1].

Так как эволюция систем описывается линейными векторными инте-гродифференциальными уравнениями Вольтерра с управляющими воздействиями под знаком интеграла, то применение методов решения подобных задач для дифференциальных систем, развитых в [2-10] значительно усложняется.

2. Игровая задача наведения для линейных интегродифференциальных систем Вольтерра

Рассматривается конфликтно-управляемая система линейных интегро-дифференциальных уравнений Вольтерра

t t t

x (t ) = f (t) + A (t)x (t) + ! к (t. s)x(s)ds +!B1 (t,s)u(s)ds -!B2 (t,s)v(s)ds ,

0 0 0

x(0) = x0 .

Здесь x - «-мерный фазовый вектор; u - Г1 -мерный, v - Г2 -мерный векторы управляющих воздействий, остальные ограничения аналогичны разд. 1 [1].

Игра рассматривается на заданном отрезке [0,0] и плата изображается равенством

7(9)= {г (0)}

, т < п .

(24)

Состояние системы (23) описывается соотношением согласно (8)

г (ґ) = X (ґ,0 )г0 +1X (ґ, 5 )^(^,0 ) А^ф(0 ) +1

| X (ґ, т)¥(т, 5 )ё т

ф(5 ) +

+1

((5)<& -|

)<& .

Здесь X (ґ, 5) - матрица Коши системы а = А (ґ )а,

ґ ґ

Ф(ґ,5) = IК(ґ,т)X(т,5)т, ф(ґ) = /(ґ) + Ф(ґ,0^, ¥(ґ,5) = Е +1Я(ґ,т)/т,

5 5

Я(ґ,т) - резольвента матрицы Ф(ґ,т);

,, / \/ \^ / \ ЭВ (т, 5)

Хі (ґ, 5 ) = ¥(ґ, 5 )Ві (5,5 ) + | ¥(ґ, т) ^ V т,

5

Х2 (ґ,5) = ^(ґ,5)В2 (5,5) + |¥(ґ,т)^^^т.

5

Будем теперь предполагать, что до момента ґ0, 0 < ґ0 <0, применялись некоторые допустимые управления Ю; [ґ], а после момента ґ0 полагаем Ю; [ґ], тогда состояние системы (23) в момент ґ определяется формулой (9)

г (0, ґ ) = г (0, ґ0) +1

((5)<&

-I

)<& .

(25)

Задача 3. Первый игрок распоряжается выбором управления и (t )е иг и стремится минимизировать величину (24), второй игрок распоряжается выбором управления V(7)е^£ и стремится максимизировать величину (24).

Здесь позиция игры определяется как пара р = {{:,х(0,t)] .

Программный максимин для рассматриваемого случая определяется следующим образом:

Є0 (г(0,ґ0 )) = тах

I тах

; Ч5)=^

)<&

0

0

0

-I max

u(s)=ueUs

f0

! V'x(0, т)) (т s)dT

u(s)ds — (x(0,t0))

(26)

Исходя из (18), введем в рассмотрение функцию

t 0

e(t. x (в, t ))=!![ 10 X (в, Т)Х2 (т, s )d t]v [s ]ds

+

t0 s

0

+1 max

t v(s)=veVs

! l0 X l0, T)X2 (T s )d т

t 0

v (s )ds — ! !R X (0, т)%1 (t, s )d t] u [s ]ds —

t0 s

-I max

^ u(s)=ueUs

! l0 X l0, t)X1 (т, s )d т

u (s )ds — (/0 x (0, t0)),

(27)

где /0 - вектор-строка - решение задачи (26); {/0X(0,t)} = a(t) - решение

дифференциальной системы a = —A'(t )a; далее вводим обозначения:

0 0 xe (t) = ! a(t )X1 (t, t )d т, ye (t) = ! а(т)х2 (т, t )d т.

tt

Производная (27) записывается аналогично (19): d 0 0

“Т = |[/0 X (0, т)х2 (т, t )d t] v (t) — max |[/0 X (0, t)x2 (t, t )d t] v —

dt vgV*

—|[/0X(0,t)x1 (t,t)dt]u(t) + max|[/0X(0,t)x1 (t,t)dt]u ,

J veUt J

или

~r = ye (t)v(t) — maxye (t)v — xe (t)u(t) + maxxe (t)u ,

dt veVt ueUt

экстремальное управление вычисляется согласно определению 4.

Теорема 4. В регулярном случае при выборе первым (вторым) игроком

стратегии Ue = Ue (t, x (0, t)), (Vе = Vе (t, x (0, t)), t0 < t <0, 0 < t0 <0, описываемой определением 2.3, ему будет гарантирован результат игры

{x(0)m} <е0(t0,xI0,t0)) ({x(0)m} ^e0(t0,xI0,t0))) при любом допустимом способе управления второго (первого) игрока.

Доказательства аналогичны доказательствам теорем 1 и 2.

Теорема 5. В регулярном случае при выборе игроками своих экстремальных стратегий ие, Vе, описываемых определением 2.3, им будет гарантирован результат игры {х(0)т] = £о ((,х(0,^)).

Пример. Пусть движение управляемого объекта описывается системой двух скалярных уравнений:

# t t t х() = еt +1х(^)ds +1и (^)ds -1V(^)ds,

здесь / (ґ) — еґ, К (ґ, 5) = 1, А (ґ) = 0, В (ґ, 5) = 1.

Соответствующее дифференциальное уравнение имеет вид а(ґ) = 0, тогда полагаем, что фундаментальная матрица X (ґ, 5 ) = 1, матрица Коши X(ґ,5) = X(ґ)X-1 (5) = 1. Далее, как и в [10], Ф(ґ, 5) = ґ - 5 , резольвента этой матрицы Я (ґ, 5 ) = (ґ - 5), тогда у(ґ, 5 ) = еЬ (ґ - 5); х(ґ, 5 ) —у(ґ, 5 ),

ф(ґ) = еґ + ґ, ф(0 ) = 1.

Слагаемые в (8) определяются формулами

ґ ґ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

IX (ґ, 5 )/(5,0)<І5ф(0) = бЬґ, IX (ґ,т)/(т, 5 )dт = (ґ - 5 ),

dф() = ґ(-2еґ -1^ + ~2^лґ;

получаем для начального условия г(0) = 10:

ґ

г(ґ) = 10 + ^23Ьґ + ґІ -2еґ -11 +1еЬ(ґ - 5) (5)ds -1еЬ(ґ + 5)(5)ds.

0

Определяем начальную позицию игры:

3 (1 ^

(0,ґ0 ) — 1 + -^0 + 0( — е0 - 1 1 + 1(ґ0 - 5) [5]ds - 1(ґ0 - 5) [5^5;

0

тогда в начальный момент управления имеем

0

Є0 (ґo, г І0, ґ0 )) = Пі ах

"I тах /^Ь (0-5 )и (5 )ds -/ 'г (0, ґ0)

и (5)—иє ^5

0

0

г

0

Будем теперь считать, как и в [10], что игрок, распоряжающийся управлением и, выбирает его значения из отрезка [2,5], а игрок, распоряжающийся управлением V, выбирает его из отрезка [3,4]. Так как решения исходной системы - кривые на плоскости, то заключаем, что экстремальный вектор I имеет постоянное направление по прямой у = х в направлении убывания (по модулю) переменных х и у . При таком использовании ресурсов управления

решение будет приведено в начало координат, так как ие =(5,5), а

Vе =(4,4).

4. Одна игровая задача для нескольких лиц

Рассматривается интегродифференциальная система

t т t

х ( ) = f ( ) + А ( )х ( ) + I * (. 5 ) х (я )ds +21В ^,5)и (я^ , х(0) = хо, (28)

0 г=1 0

ее решение по аналогии со случаем двух игроков можно записать в виде

IХ (t, Т)%/ (Т 5 )d т

IX (t, т)'Р(т, 5 )d т

d ф() +

(29)

иI ()^и\, 1 = 1, т ; и\ - выпуклые компакты в Яг ; X (, 5) - матрица Коши

системы а = А ()а;

t t Ф(t, 5 ) = I * (, т)X(т,5)dт, ф(t) = f () + Ф(t,0)xо, 5) = Е +1Я(t,т)dт,

Е - единичная матрица, Я (, 5) - резольвента матрицы Ф(, 5);

х (,5)=у(5)В (55)+1,Т)дВ1( 5)^.

Далее обозначаем

х (0, tо) = X (0,0 )х0 +1X (0,)у(5,0)5ф(0) +1

^ т

+1X

0 1=1

IX (0, t )у(т, 5 )d т

,■[5 ]ds,

d ф() +

тогда состояние системы (28) в момент tо < t <0 определяется формулой

"0

: (0, ґ ) = X (0, ґ0) + 2

і—1

иі [5]ds.

Пусть также задана система функционалов

^ = {Л |7; (ul,...,ит ) = Ф| (х[]), 1 = 1,т]. (30)

Задача 4. Найти такие стратегии и!,...,ит, для которых выполняются соотношения

фг- (хе []<фг- ( []), 1 = 1,т . (31)

Здесь хе () - реализовавшаяся траектория х^], 0 < t <0, системы (28), которая отвечает стратегиям и(,...,ит ; хк () - реализовавшаяся траектория х[t] системы (28), соответствующая управлениям и{ [t],..., 4-1 ^ ], ч ^ ],

4+1 ^ ^..^ ит ^ ], где и1 ^ ], 1 * к, 1 = 1, т , формируется на основе стратегии и!; ч ^ ] - реализация суммируемого по Лебегу управления, стесненного условием ик ()е и .

Если задача 4 разрешима, то набор стратегий ие ={и{ ,...,и<т ] называется равновесным по Нэшу. Как и при исследовании аналогичной задачи в [9], будем рассматривать случай, когда Ц (,...,ит ) = ||Сг- - х(0), где Сг- -

заданные точки в Яп , 1 = 1, т .

Определение 5. Тройка р = {^х(0,t),Сг-] называется позицией 1-го игрока, 1 = 1, т, в момент t, tо < t <0, 0 < tо <0; позиция р0 ={tо, х (0, ^), С1 ] называется начальной.

Определение 6. Стратегией и^ 1-го игрока, 1 = 1, т, называется многозначное отображение, которое каждой реализовавшейся позиции

р ={^ х (0, t), С1 ] ставит в соответствие некоторое непустое множество [1]

иг (х(0t),Ск )) (,х(0,t),Ск ) и\;

такие стратегии и соответствующие им управления называются допустимыми. Движения системы (28) определяются аналогично [3]. Будем теперь решать задачу за к-го игрока, к = 1, т , для чего запишем к-й функционал в виде программного максимина

||Ск - х (0)|| = е к ( х I0, t0 ), Ск )= т ах [/'(Ск - х I0, tо ))-

1г1 Г1

-1

тах

ик (5 )=ик eUtk

IIX (0, т)Хк (т, s)dтuk (s)ds-

(0

тт

если

=1 и1 (5 )=uгeUt ’ I *к

часть этого

,■ (s)ds

(32)

правая часть этого равенства положительна, иначе £ к (о, х (0, tо), Ск ) = 0; вектор, решающий задачу (32), называется экстремальным, обозначим его символом 1§, вектор-строка /к/X (0, t) является ре-

шением системы

сти

ак = -А'()ак с краевым условием ак (0) = /о ; для кратко-0

обозначим х! (о ) = Iа'к (т)Хк (т,t)dт.

t0

Предполагается, что при любом ^, 0 < tо <0, максимум в правой части (32) достигается на единственном векторе /д, т.е. рассматривается регулярный случай, причем вектор /д = /д (, х (0, ^), Ск) непрерывно зависит от позиции игры как и в [2].

Определение 7. Пусть вектор /§, 1 < к < т, в каждый момент tо,

0 < tо <0, доставляет максимум правой части (32), тогда, если позиция р = {^, х (0, ^), Ск ] такова, что £к (, х (0, tо), Ск )> 0, то с этой позицией будем сопоставлять множество ик( (, х (0, tо), Ск ) ,1 < к < т, всех векторов и! с и^ , которые удовлетворяют условию

хк (о )ик []= тах ,хк ()ик.

ик (о )=ик =Ut

(33)

Аналогично [2] можно показать, что экстремальные стратегии, построенные по формуле (33), допустимы.

Теорема 6. В регулярном случае экстремальные стратегии ик,

1 < к < т, уравновешивают в смысле Нэша систему функционалов (30). Доказательство. Рассмотрим функцию

£к (, х (0, t), Ск ) = /0 '(Ск - х (0, ^))-I

ик (5)ds -

-I тах

ик(5 )=ик еик

ик (5)ds -

Ш1П

Г т

Г і=1 иі (5)=иієи5 0 • і іфк

Мі (5)—' -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

-1 2

Г 1=1 іфк

0

’ (5)—' .

(34)

Таким образом, предполагается, что в (32), (34) все игроки, за исключение £-го, на соответствующих промежутках выбрали управление наихудшим для себя образом, т.е. желают максимизировать (32). При ^ ^ все игроки

применяют в (34) свои экстремальные стратегии. Обозначим эту величину символом е(,х(0,!()), ). Далее вычислим производную:

-г (Г) 0 9

-І = _Т/к'х(0,т)хк (тГ)Мк (Г)+ Шах 11о'х(0,т)Хк (тГ)ик

- J Мк (г )=Мк еик\

+

т ^ т ^

+^11ккх(0,т)%і (т,Г)-тмЄ ()-2 тій 114'х(0,т)х (т,Г)-ти . (35)

і=1 Г і фк

і=1 Мі (г )=иієи1

і фк

Будем теперь в (34), а следовательно, и в (35), заменять при Г є [г0, 0] управление к-го игрока на произвольное допустимое, а управления остальных игроков на экстремальные, тогда в правой части (35) У Г є(о, 0) суммы первого и второго слагаемых, суммы третьего и четвертого слагаемых положи- г(г)

тельны, следовательно, на (г , 0)

>

0 , функция г(г) не убывает на (о,0)

и, таким образом, вк (о,х(0,Го),Ск )^є(0,х(0,0),Ск), где вк (0,((0,0),Ск) -

значение (34) для случая, когда к-й игрок применяет произвольное допустимое управление, а остальные игроки применяют свои экстремальные управления.

Список литературы

1. Пассиков, В. Л. Задача сближения-уклонения для линейных интегродиффе-ренциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пассиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2о11. - № 2. - С. 58-7о.

2. Красовский, Н. Н. Игровые задачи о встрече движений / Н. Н. Красовский. -М. : Наука, 197о. - 42о с.

3. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин - М. : Наука, 1974. - 456 с.

4. Субботин, А. И. Оптимизация гарантии в задачах управления / А. И. Субботин, А. Г. Ченцов - М. : Наука, 1981. - 288 с.

5. Красовский, Н. Н. Управление динамической системой / Н. Н. Красовский -М. : Наука, 1985. - 518 с.

6. Осипов, Ю. С. Дифференциальные игры систем с последействием / Ю. С. Осипов // ДАН СССР. - 1971. - Т. 196, № 4. - С. 779-782.

7. Осипов, Ю. С. Альтернатива в дифференциально-разностной игре / Ю. С. Осипов // ДАН СССР. - 1971. - Т. 197, № 5. - С. Ю25-Ю25.

8. Субботин, А. И. Экстремальные стратегии в дифференциальных играх с полной памятью / А. И Субботин // ДАН СССР. - 1972. - Т. 2об, № 3. - С. 552-555.

9. Субботин, А. И. Дифференциальные игры с полной памятью. Экстремальные стратегии в позиционных дифференциальных играх / А. И. Субботин. - Свердловск, 1974. - С. 211-233.

10. Гороховик, В. В. О линейных дифференциальных играх нескольких лиц /

B. В. Гороховик, Ф. М. Кириллова // Управляемые системы. - 1971. - № 1о. -

C. 3-9.

Пасиков Владимир Леонидович

кандидат физико-математических наук, доцент, кафедра математического анализа и информатики, Орский гуманитарно-технологический институт (филиал) Оренбургского государственного университета

E-mail: [email protected]

Pasikov Vladimir Leonidovich Candidate of physical and mathematical sciences, associate professor, sub-department of mathematical analysis and informatics, Orsk Humanitarian Technological Institute, branch of Orenburg State University

УДК 517.977 Пасиков, В. Л.

Игровые задачи наведения для линейных интегродифференциа-льных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2012. - № 2 (22). - С. 50-58.

i Надоели баннеры? Вы всегда можете отключить рекламу.