УДК 517.977
В. Л. Пасиков
ИГРОВЫЕ ЗАДАЧИ НАВЕДЕНИЯ ДЛЯ ЛИНЕЙНЫХ ИНТЕГРОДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ ВОЛЬТЕРРА С УПРАВЛЯЮЩИМИ ВОЗДЕЙСТВИЯМИ ПОД ЗНАКОМ ИНТЕГРАЛА
Аннотация. Рассматриваются игровые задачи наведения для линейных инте-гродифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла и игровая задача m лиц для положения равновесия системы функционалов (типа расстояния) в смысле Нэша. При решении этих задач используется известная экстремальная конструкция академика Н. Н. Красовско-го, модифицированная к рассматриваемым ситуациям.
Ключевые слова: игровая задача, стратегия, движение, позиция игры, программный максимин, управляющее воздействие.
Abstract. The article considers aiming game tasks for linear integro-differential Volterre's system with control action under the integral sign. The author studies the task of aiming to the point of origin and the m distinction game task for equilibrium position of the functional system (distance type) in Nashe's implication. To solve such problems the researcher suggests some modifications to the well-known extreme construction by prof. N. Krasovskiy.
Key words: game task, strategy, motion, game position, policy maximin, control action.
Статья продолжает исследование [1], а также нумерацию разделов, формул, определений и теорем в [1].
Так как эволюция систем описывается линейными векторными инте-гродифференциальными уравнениями Вольтерра с управляющими воздействиями под знаком интеграла, то применение методов решения подобных задач для дифференциальных систем, развитых в [2-10] значительно усложняется.
2. Игровая задача наведения для линейных интегродифференциальных систем Вольтерра
Рассматривается конфликтно-управляемая система линейных интегро-дифференциальных уравнений Вольтерра
t t t
x (t ) = f (t) + A (t)x (t) + ! к (t. s)x(s)ds +!B1 (t,s)u(s)ds -!B2 (t,s)v(s)ds ,
0 0 0
x(0) = x0 .
Здесь x - «-мерный фазовый вектор; u - Г1 -мерный, v - Г2 -мерный векторы управляющих воздействий, остальные ограничения аналогичны разд. 1 [1].
Игра рассматривается на заданном отрезке [0,0] и плата изображается равенством
7(9)= {г (0)}
, т < п .
(24)
Состояние системы (23) описывается соотношением согласно (8)
г (ґ) = X (ґ,0 )г0 +1X (ґ, 5 )^(^,0 ) А^ф(0 ) +1
| X (ґ, т)¥(т, 5 )ё т
ф(5 ) +
+1
((5)<& -|
)<& .
Здесь X (ґ, 5) - матрица Коши системы а = А (ґ )а,
ґ ґ
Ф(ґ,5) = IК(ґ,т)X(т,5)т, ф(ґ) = /(ґ) + Ф(ґ,0^, ¥(ґ,5) = Е +1Я(ґ,т)/т,
5 5
Я(ґ,т) - резольвента матрицы Ф(ґ,т);
,, / \/ \^ / \ ЭВ (т, 5)
Хі (ґ, 5 ) = ¥(ґ, 5 )Ві (5,5 ) + | ¥(ґ, т) ^ V т,
5
Х2 (ґ,5) = ^(ґ,5)В2 (5,5) + |¥(ґ,т)^^^т.
5
Будем теперь предполагать, что до момента ґ0, 0 < ґ0 <0, применялись некоторые допустимые управления Ю; [ґ], а после момента ґ0 полагаем Ю; [ґ], тогда состояние системы (23) в момент ґ определяется формулой (9)
г (0, ґ ) = г (0, ґ0) +1
((5)<&
-I
)<& .
(25)
Задача 3. Первый игрок распоряжается выбором управления и (t )е иг и стремится минимизировать величину (24), второй игрок распоряжается выбором управления V(7)е^£ и стремится максимизировать величину (24).
Здесь позиция игры определяется как пара р = {{:,х(0,t)] .
Программный максимин для рассматриваемого случая определяется следующим образом:
Є0 (г(0,ґ0 )) = тах
I тах
; Ч5)=^
)<&
0
0
0
-I max
u(s)=ueUs
f0
! V'x(0, т)) (т s)dT
u(s)ds — (x(0,t0))
(26)
Исходя из (18), введем в рассмотрение функцию
t 0
e(t. x (в, t ))=!![ 10 X (в, Т)Х2 (т, s )d t]v [s ]ds
+
t0 s
0
+1 max
t v(s)=veVs
! l0 X l0, T)X2 (T s )d т
t 0
v (s )ds — ! !R X (0, т)%1 (t, s )d t] u [s ]ds —
t0 s
-I max
^ u(s)=ueUs
! l0 X l0, t)X1 (т, s )d т
u (s )ds — (/0 x (0, t0)),
(27)
где /0 - вектор-строка - решение задачи (26); {/0X(0,t)} = a(t) - решение
дифференциальной системы a = —A'(t )a; далее вводим обозначения:
0 0 xe (t) = ! a(t )X1 (t, t )d т, ye (t) = ! а(т)х2 (т, t )d т.
tt
Производная (27) записывается аналогично (19): d 0 0
“Т = |[/0 X (0, т)х2 (т, t )d t] v (t) — max |[/0 X (0, t)x2 (t, t )d t] v —
dt vgV*
—|[/0X(0,t)x1 (t,t)dt]u(t) + max|[/0X(0,t)x1 (t,t)dt]u ,
J veUt J
или
~r = ye (t)v(t) — maxye (t)v — xe (t)u(t) + maxxe (t)u ,
dt veVt ueUt
экстремальное управление вычисляется согласно определению 4.
Теорема 4. В регулярном случае при выборе первым (вторым) игроком
стратегии Ue = Ue (t, x (0, t)), (Vе = Vе (t, x (0, t)), t0 < t <0, 0 < t0 <0, описываемой определением 2.3, ему будет гарантирован результат игры
{x(0)m} <е0(t0,xI0,t0)) ({x(0)m} ^e0(t0,xI0,t0))) при любом допустимом способе управления второго (первого) игрока.
Доказательства аналогичны доказательствам теорем 1 и 2.
Теорема 5. В регулярном случае при выборе игроками своих экстремальных стратегий ие, Vе, описываемых определением 2.3, им будет гарантирован результат игры {х(0)т] = £о ((,х(0,^)).
Пример. Пусть движение управляемого объекта описывается системой двух скалярных уравнений:
# t t t х() = еt +1х(^)ds +1и (^)ds -1V(^)ds,
здесь / (ґ) — еґ, К (ґ, 5) = 1, А (ґ) = 0, В (ґ, 5) = 1.
Соответствующее дифференциальное уравнение имеет вид а(ґ) = 0, тогда полагаем, что фундаментальная матрица X (ґ, 5 ) = 1, матрица Коши X(ґ,5) = X(ґ)X-1 (5) = 1. Далее, как и в [10], Ф(ґ, 5) = ґ - 5 , резольвента этой матрицы Я (ґ, 5 ) = (ґ - 5), тогда у(ґ, 5 ) = еЬ (ґ - 5); х(ґ, 5 ) —у(ґ, 5 ),
ф(ґ) = еґ + ґ, ф(0 ) = 1.
Слагаемые в (8) определяются формулами
ґ ґ
IX (ґ, 5 )/(5,0)<І5ф(0) = бЬґ, IX (ґ,т)/(т, 5 )dт = (ґ - 5 ),
dф() = ґ(-2еґ -1^ + ~2^лґ;
получаем для начального условия г(0) = 10:
ґ
г(ґ) = 10 + ^23Ьґ + ґІ -2еґ -11 +1еЬ(ґ - 5) (5)ds -1еЬ(ґ + 5)(5)ds.
0
Определяем начальную позицию игры:
3 (1 ^
(0,ґ0 ) — 1 + -^0 + 0( — е0 - 1 1 + 1(ґ0 - 5) [5]ds - 1(ґ0 - 5) [5^5;
0
тогда в начальный момент управления имеем
0
Є0 (ґo, г І0, ґ0 )) = Пі ах
"I тах /^Ь (0-5 )и (5 )ds -/ 'г (0, ґ0)
и (5)—иє ^5
0
0
г
0
Будем теперь считать, как и в [10], что игрок, распоряжающийся управлением и, выбирает его значения из отрезка [2,5], а игрок, распоряжающийся управлением V, выбирает его из отрезка [3,4]. Так как решения исходной системы - кривые на плоскости, то заключаем, что экстремальный вектор I имеет постоянное направление по прямой у = х в направлении убывания (по модулю) переменных х и у . При таком использовании ресурсов управления
решение будет приведено в начало координат, так как ие =(5,5), а
Vе =(4,4).
4. Одна игровая задача для нескольких лиц
Рассматривается интегродифференциальная система
t т t
х ( ) = f ( ) + А ( )х ( ) + I * (. 5 ) х (я )ds +21В ^,5)и (я^ , х(0) = хо, (28)
0 г=1 0
ее решение по аналогии со случаем двух игроков можно записать в виде
IХ (t, Т)%/ (Т 5 )d т
IX (t, т)'Р(т, 5 )d т
d ф() +
(29)
иI ()^и\, 1 = 1, т ; и\ - выпуклые компакты в Яг ; X (, 5) - матрица Коши
системы а = А ()а;
t t Ф(t, 5 ) = I * (, т)X(т,5)dт, ф(t) = f () + Ф(t,0)xо, 5) = Е +1Я(t,т)dт,
Е - единичная матрица, Я (, 5) - резольвента матрицы Ф(, 5);
х (,5)=у(5)В (55)+1,Т)дВ1( 5)^.
Далее обозначаем
х (0, tо) = X (0,0 )х0 +1X (0,)у(5,0)5ф(0) +1
^ т
+1X
0 1=1
IX (0, t )у(т, 5 )d т
,■[5 ]ds,
d ф() +
тогда состояние системы (28) в момент tо < t <0 определяется формулой
"0
: (0, ґ ) = X (0, ґ0) + 2
і—1
иі [5]ds.
Пусть также задана система функционалов
^ = {Л |7; (ul,...,ит ) = Ф| (х[]), 1 = 1,т]. (30)
Задача 4. Найти такие стратегии и!,...,ит, для которых выполняются соотношения
фг- (хе []<фг- ( []), 1 = 1,т . (31)
Здесь хе () - реализовавшаяся траектория х^], 0 < t <0, системы (28), которая отвечает стратегиям и(,...,ит ; хк () - реализовавшаяся траектория х[t] системы (28), соответствующая управлениям и{ [t],..., 4-1 ^ ], ч ^ ],
4+1 ^ ^..^ ит ^ ], где и1 ^ ], 1 * к, 1 = 1, т , формируется на основе стратегии и!; ч ^ ] - реализация суммируемого по Лебегу управления, стесненного условием ик ()е и .
Если задача 4 разрешима, то набор стратегий ие ={и{ ,...,и<т ] называется равновесным по Нэшу. Как и при исследовании аналогичной задачи в [9], будем рассматривать случай, когда Ц (,...,ит ) = ||Сг- - х(0), где Сг- -
заданные точки в Яп , 1 = 1, т .
Определение 5. Тройка р = {^х(0,t),Сг-] называется позицией 1-го игрока, 1 = 1, т, в момент t, tо < t <0, 0 < tо <0; позиция р0 ={tо, х (0, ^), С1 ] называется начальной.
Определение 6. Стратегией и^ 1-го игрока, 1 = 1, т, называется многозначное отображение, которое каждой реализовавшейся позиции
р ={^ х (0, t), С1 ] ставит в соответствие некоторое непустое множество [1]
иг (х(0t),Ск )) (,х(0,t),Ск ) и\;
такие стратегии и соответствующие им управления называются допустимыми. Движения системы (28) определяются аналогично [3]. Будем теперь решать задачу за к-го игрока, к = 1, т , для чего запишем к-й функционал в виде программного максимина
||Ск - х (0)|| = е к ( х I0, t0 ), Ск )= т ах [/'(Ск - х I0, tо ))-
1г1 Г1
-1
тах
ик (5 )=ик eUtk
IIX (0, т)Хк (т, s)dтuk (s)ds-
(0
тт
если
=1 и1 (5 )=uгeUt ’ I *к
часть этого
,■ (s)ds
(32)
правая часть этого равенства положительна, иначе £ к (о, х (0, tо), Ск ) = 0; вектор, решающий задачу (32), называется экстремальным, обозначим его символом 1§, вектор-строка /к/X (0, t) является ре-
шением системы
сти
ак = -А'()ак с краевым условием ак (0) = /о ; для кратко-0
обозначим х! (о ) = Iа'к (т)Хк (т,t)dт.
t0
Предполагается, что при любом ^, 0 < tо <0, максимум в правой части (32) достигается на единственном векторе /д, т.е. рассматривается регулярный случай, причем вектор /д = /д (, х (0, ^), Ск) непрерывно зависит от позиции игры как и в [2].
Определение 7. Пусть вектор /§, 1 < к < т, в каждый момент tо,
0 < tо <0, доставляет максимум правой части (32), тогда, если позиция р = {^, х (0, ^), Ск ] такова, что £к (, х (0, tо), Ск )> 0, то с этой позицией будем сопоставлять множество ик( (, х (0, tо), Ск ) ,1 < к < т, всех векторов и! с и^ , которые удовлетворяют условию
хк (о )ик []= тах ,хк ()ик.
ик (о )=ик =Ut
(33)
Аналогично [2] можно показать, что экстремальные стратегии, построенные по формуле (33), допустимы.
Теорема 6. В регулярном случае экстремальные стратегии ик,
1 < к < т, уравновешивают в смысле Нэша систему функционалов (30). Доказательство. Рассмотрим функцию
£к (, х (0, t), Ск ) = /0 '(Ск - х (0, ^))-I
ик (5)ds -
-I тах
ик(5 )=ик еик
ик (5)ds -
Ш1П
Г т
Г і=1 иі (5)=иієи5 0 • і іфк
Мі (5)—' -
0
-1 2
Г 1=1 іфк
0
’ (5)—' .
(34)
Таким образом, предполагается, что в (32), (34) все игроки, за исключение £-го, на соответствующих промежутках выбрали управление наихудшим для себя образом, т.е. желают максимизировать (32). При ^ ^ все игроки
применяют в (34) свои экстремальные стратегии. Обозначим эту величину символом е(,х(0,!()), ). Далее вычислим производную:
-г (Г) 0 9
-І = _Т/к'х(0,т)хк (тГ)Мк (Г)+ Шах 11о'х(0,т)Хк (тГ)ик
- J Мк (г )=Мк еик\
+
т ^ т ^
+^11ккх(0,т)%і (т,Г)-тмЄ ()-2 тій 114'х(0,т)х (т,Г)-ти . (35)
і=1 Г і фк
і=1 Мі (г )=иієи1
і фк
Будем теперь в (34), а следовательно, и в (35), заменять при Г є [г0, 0] управление к-го игрока на произвольное допустимое, а управления остальных игроков на экстремальные, тогда в правой части (35) У Г є(о, 0) суммы первого и второго слагаемых, суммы третьего и четвертого слагаемых положи- г(г)
тельны, следовательно, на (г , 0)
—
>
0 , функция г(г) не убывает на (о,0)
и, таким образом, вк (о,х(0,Го),Ск )^є(0,х(0,0),Ск), где вк (0,((0,0),Ск) -
значение (34) для случая, когда к-й игрок применяет произвольное допустимое управление, а остальные игроки применяют свои экстремальные управления.
Список литературы
1. Пассиков, В. Л. Задача сближения-уклонения для линейных интегродиффе-ренциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пассиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2о11. - № 2. - С. 58-7о.
2. Красовский, Н. Н. Игровые задачи о встрече движений / Н. Н. Красовский. -М. : Наука, 197о. - 42о с.
3. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин - М. : Наука, 1974. - 456 с.
4. Субботин, А. И. Оптимизация гарантии в задачах управления / А. И. Субботин, А. Г. Ченцов - М. : Наука, 1981. - 288 с.
5. Красовский, Н. Н. Управление динамической системой / Н. Н. Красовский -М. : Наука, 1985. - 518 с.
6. Осипов, Ю. С. Дифференциальные игры систем с последействием / Ю. С. Осипов // ДАН СССР. - 1971. - Т. 196, № 4. - С. 779-782.
7. Осипов, Ю. С. Альтернатива в дифференциально-разностной игре / Ю. С. Осипов // ДАН СССР. - 1971. - Т. 197, № 5. - С. Ю25-Ю25.
8. Субботин, А. И. Экстремальные стратегии в дифференциальных играх с полной памятью / А. И Субботин // ДАН СССР. - 1972. - Т. 2об, № 3. - С. 552-555.
9. Субботин, А. И. Дифференциальные игры с полной памятью. Экстремальные стратегии в позиционных дифференциальных играх / А. И. Субботин. - Свердловск, 1974. - С. 211-233.
10. Гороховик, В. В. О линейных дифференциальных играх нескольких лиц /
B. В. Гороховик, Ф. М. Кириллова // Управляемые системы. - 1971. - № 1о. -
C. 3-9.
Пасиков Владимир Леонидович
кандидат физико-математических наук, доцент, кафедра математического анализа и информатики, Орский гуманитарно-технологический институт (филиал) Оренбургского государственного университета
E-mail: [email protected]
Pasikov Vladimir Leonidovich Candidate of physical and mathematical sciences, associate professor, sub-department of mathematical analysis and informatics, Orsk Humanitarian Technological Institute, branch of Orenburg State University
УДК 517.977 Пасиков, В. Л.
Игровые задачи наведения для линейных интегродифференциа-льных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2012. - № 2 (22). - С. 50-58.