2011
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА________________
Математика. Механика. Информатика Вып.2(6)
МЕХАНИКА. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 519.6
Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения” нескольких лиц в классе "контр"-стратегий
С. В. Лутманов
Пермский государственный университет, Россия, 614990, Пермь, ул. Букерева, 15 [email protected]; (342)239-63-09
Рассматривается позиционная дифференциальная игра "наведения-уклонения" нескольких лиц. Игра формализована в классе "контр"-стратегий. В предположении, что целевые множества игроков попарно не пересекаются, доказывается альтернативное утверждение относительно исходов игры. Смысл утверждения состоит в следующем. Для каждой начальной позиции либо существует единственный игрок, разрешающий задачу наведения на свое целевое множество в классе "контр''-стратегий ("чистых" стратегий), либо найдется такой способ управления всех игроков в классе "чистых" стратегий ("контр"-стратегий), что ни один из игроков-"уклонистов" не сможет привести фазовый вектор игры на свое целевое множество при условии, что остальные игроки придерживаются указанного способа управления. Данная статья является непосредственным продолжением работы [3].
Ключевые слова: "чистые" стратегии; "контр"-стратегии; стабильный мост; теорема об альтернативе.
1. Постановка дифференциальной игры "наведения-уклонения" нескольких лиц в классе "контр"-стратегий
Динамика конфликтно-управляемого объекта описывается обыкновенным векторным дифференциальным уравнением
X = f (/, X, и1,..., uk), (1.1)
где t е ^ 0, Т ] С R1 - текущее время,
х = (х1,..., хп) е Rn - фазовый вектор объекта,
© С. В. Лутманов, 2011
и1 е р С Кп - вектор управляющих пара-
-С ■ п1+п+п+...+гк . ип
метров 1-го игрока, / . К 1 к ^ К -вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем предполагать, что множества Р1, 1 е к{1,...,к} компактны, а функция f непрерывна по совокупности переменных t,X,^,...,ик .
Относительно правых частей дифференциальных уравнений (1.1) принимаются стандартные в теории дифференциальных игр предположения.
1) локальные условия Липшица
VR > 0 З к > 0 :
,0)
f (t, xw , uj,...u ) - f(t, x[2),ul ,...Uk )|| < к x(1) - x(2) 11 < R,t e[t0,$],ut e p,i e K .
V
,(1)
< R,
,(2)
2) условия продолжимости решения
ЗА > 0:
|/(',х,и1,...,ик)| <Л(1+||х|Ме[^5,Т],хеК,ц еР,1еК
В пространстве Кп 1-му игроку ставится в соответствие компактное множество М1,1 е К, которое будем называть целевым
множеством этого игрока. Неформальная цель игрока состоит в приведении фазового вектора игры в конечный момент времени на свое целевое множество. В случае если в конечный момент времени фазовый вектор игры не принадлежит ни одному из целевых множеств, то считается, что в игре достигнут компромисс. Описанную дифференциальную игру назовем игрой "наведения-уклонения" нескольких лиц.
Принимается, что в любой момент времени игроки имеют точную информацию о
реализовавшейся позиции {', х| игры. Однако осведомленность игроков о действиях друг друга зависит от того, является ли данный игрок игроком-уклонистом или нет. Дифференциальная игра в этом случае формализуется в классе позиционных "контр"-стратегий.
2. Формализация игры в классе "контр"- стратегий
Формализуем дифференциальную игру нескольких лиц в классе контр-стратегий.
Определение 1. Позиционной "контр"-
стратегией Ц ¡-го игрока называется произвольная функция
■€,*, : П Р *['0.Т]*Кп ^Р,
>еХN
где X, : ['0,Т]хКп ^ 2К .
Физический смысл "контр"-стратегии игрока состоит в том, что в каждой позиции
{', х} он назначает вектор своих управляющих воздействий, основываясь не только на информации о реализовавшейся позиции
{ ' , х} , но и на информации о выбранных в этой позиции управляющих параметрах игроками с индексами ] е X (', х) .
Соответствие между позиционной "контр"-стратегией U и реализующей ее паРой X [], U [] будем обозначать символом
$,* u ,х [], i e K . Очевидно, что набор позиционных "контр"-стратегий всех игроков должен быть согласованным относительно использования информации игроками о выборе ими векторов управляющих параметров других игроков.
Определение 2. Будем говорить, что
набор Uj,—, Uk "контр"-стратегии всех игроков является согласованным, если для всех позиций jt, x| e [t0, T] x Rn и последовательности попарно различных индексов i1, i2, —, im e K нельзя построить цепочку включений
i1 eX [t,x], i2 eX3 [t,x] ," —irm-j eXm [t,x] ,im eXj [UX] .
Для согласованных "контр"-стратегий исключена ситуация "порочного круга", когда в одной и той же позиции некоторый игрок при выборе своего управляющего вектора использует информацию о выбранном управляющем векторе другого игрока. Тот, в свою очередь, использует информацию о выбранном управляющем векторе следующего игрока и т. д., а некоторый игрок в этой цепочке использует информацию о выбранном управляющем векторе первого игрока.
Пусть U ^ Ui,Xi [ ] , i e K - согласованный набор позиционных "контр"-стратегий и А - конечное разбиение отрезка времени [t-Г], t.e[t0,T) точками
T , s=0,1,—,r0 = t..
Определение 3. Ломаной Эйлера xA (•,t.,x., Uj, • • •, Uk), выходящей из позиции
jt., x. I и порожденной набором позиционных ”контр”-стратегией Uj, —, U€k, назовем всякую абсолютно непрерывную функцию хА (•), удовлетворяющую дифференциальному уравнению
Ха( t )= f ( U ХА (t) , UA1 (t) , —, UA (t),—, UAk (t)) , Ха( t») = x., Xa(Ts ) = tlim0 Ха( t) ,
4 ' 4 ' t^Ts-0 4 '
€ (t) = U,X [Ts, XA (Ts ), jUj (T, XA (Ts ))| j e Xi [Ts, XA (Ts ) J =
const, i e K, t e[rs,Ts+1), s = 0,1,... (2.1)
Определение 4. Движением, выходящим из позиции |ґ„, х„| и порожденным набором позиционных "контр"-стратегией Црі, і є К, назовем всякую функцию £(•), для которой найдется последовательность ломаных Эйлера
л( р)
(•, t., xр) ,Ui,-,и), р=1,2,-
равномерно сходящаяся к ней на отрезке ft,, T1 при условии lim sup и|р]-г|р 0.
s
Совокупность всех движений, выходящих из позиции jt,, x,} и порожденных набором позиционных "кошр"-стратегией U, i е K, будем обозначать символом X t,, X,,$!,...,$£ и называть пучком конструктивных движений. Можно показать [1], что для любой позиции jt,, X, | и любого согласованного набора позиционных "контр"-стратегий Ui.-Л пучок движений
ляющих воздействий ] -го игрока, ] е К (1),
определяется не в виде кусочно-постоянной функции (2.1), а в виде произвольного программного управления и . : ['., Т ] ^ Р^ . Пучок конструктивных движений, получающийся в результате перебора всех возможных действий со стороны игроков К(1), обозначим символом X '.,х., Ц
В общем случае множество номеров К поделим на множества L С К и К \ L . При построении ломаной Эйлера принимаем, что игроки с номерами из множества L формируют свои управляющие воздействия по формуле (2.1), а остальные игроки формируют их в виде произвольного программного управления и : ['., Т ] ^ р . Пучок конструктивных движений в этом случае обозначим символом
X
t., x. ,Uj|j є L
Очевидно, что
tn,x* ■
j єГ
t. , x.
\j є L
X
t. , x. , содержит хотя бы одно 3. Стабильные мосты
движение.
Уклонение 1 -го, 1 е К игрока от стратегии, предписываемой ему набором согласованных "контр"-стратегий
будем моделировать тем, что в определении ломаной Эйлера реализация вектора управляющих воздействий 1 -го игрока определяется не в виде кусочно-постоянной функции
=€
Ъ,Ха(Ъ ) ,\fj Ь,ХаЫ)| .ЄХ [WTs )J
=anst,
t ЄК Д,+1 ) , s = °A... ,
а в виде произвольного программного управления и1 : ['., Т ] ^ р . Пучок конструктивных
движений, получающийся в результате перебора всех возможных уклонений 1 -го игрока, обозначим символом
X
t., x.,Uj|j є K (i)
Игрок под номером 1, принимая решение уклониться от стратегии, предписываемой ему каким-либо набором стратегий, должен учитывать возможность любых действий со стороны остальных игроков. Эту возможность будем моделировать тем, что в определении ломаной Эйлера реализация вектора управ-
В дальнейшем на базе сформулированной игры "наведения-уклонения" нескольких лиц будет рассматриваться вспомогательная антагонистическая дифференциальная игра "наведения-уклонения" двух лиц [1]. В этой игре первый игрок отождествляется с подмножеством игроков L С К , а второй игрок - с подмножеством К \ L . Первый игрок решает задачу наведения на множество М с Кп, а второй - задачу уклонения от этого множества.
В зависимости от классов стратегий, в которых игра формализована, будем применять следующие обозначения:
G ((Д К \ L, М))- первый игрок применяет "контр"-стратегии;
G (L, й \ L, М ) - второй игрок применяет "контр"-стратегии.
Определение 5. Множество
W с['0,Т]хКп будем называть р-ста-бильным мостом, обрывающимся на множестве Мг, если оно является стабильным мостом первого игрока [3], в антагонистиче-
x
ской
игре G ({і } ■ К (і ), Мі) и при этом вы- р, = Ж, П(Ж5) *0, п = 1,2,— ■
полняется вложение где (Ж5 ) = (|^0, Т | х
Ж (Т ) = {х є Rn\{Т, х}єЖ }с Мг, і є К.
где (Ж5) = ([/0,Т]хRn)\Ж5 . Каждое из
множеств Ре , п = 1,2, • замкнуто и огра-
Дадим расшифровку приведенного оп- ничено, так как оно образовано пересечением
ределения. двух замкнутых множеств, одно из которых
Множество Ж будет ^--стабильным °граничен°.
мостом, 1 е К , если для любых позиций Из монотонного убывания последова-{'., х.}еЖ, отображений иЩ : р ^ П Р , тельности положительных чисел К} следу-
УеК(г) ет, что для любых номеров п. > п1 выполнено
ставящих каждому вектору и. е Р в соответ- Т7 ^ 17 т
■’ вложение Ре з ге . Отсюда в силу [2] вы-
ствие набор векторов 4 п
водим, что
ад
П р,=р *0.
("іМ^ ",-1 (",) ^ (",) «, (",))є П Р
}єК(і)
и моментов времени t* є (4, Т ], найдется такое решение дифференциального уравнения в Пусть и х }єР Тогда {t х } £ Ж
контингенциях
Из того факта, что множество Ж является х є со {!(/,х, "і ("і "і-і ("і ^ "і, "і+і ("і )3--- максимальным ^--стабильным (і -стабильным)
"к ("і ))|" є Р }, х(^) = х, мостом, обрывающимся на множестве Мг,
для которого {t*,х(^)}єЖ . следует, Что для начальной позиции К,х*}
не разрешима задача наведения в антагони-Из определения стабильности следует, стической дифференциальной игре
что если два множества являются стабильны- G ({і}, К (і),М ) (игре G (&•}, К (і),М ) ).
ми мостами, то и их объединение также будет ч/ ) \1 ' ч/ )
стабильным мостом. Тогда существует мак-
¿г - По теореме об альтернативе [і] в игре
симальный стабильный мост, содержащий в ^ і- .і г
себе любой другой стабильный мост. В работе G ({і}, К (і),Мг ) (игре G ({і}, К (і),Мг ))
[і] показано, что максимальный стабильный ' ' ' '
мост замкнут. в позиции {£,, х,} разрешима задача об укло-
Лемма 1. Пусть Ж - максимальный €- нении от некоторой открытой к -окрестности
стабильный (і -стабильный [3]) мост, обры- множества Мі. Следовательно^ позиция
вающийся на множестве Мі, і є К . Тогда для {^, х,} не может принадлежать ни одному из
любого 5 > 0 найдется є > 0 такое, что бу- мостов Жє , для которых єп < к,. Последнее
дет выполнено п
\ утверждение невозможно, т. к. из включения
Жє сЖ =({t■ х},х-^1 <5,^єЖ(t),tє[70,Т]}. і, і т?
є 11 ’ )’|Н II ’ V /’ І °’ 1) {£,, х,}є Р должно следовать включение
Здесь Жє - максимальный €- {^, х,} є ЖЄп при всех п = і,2, — . Получен-
стабильный (і -стабильный) мост, обрываю- ное противоречие доказывает лемму.
щийся на множестве М, . Множество М, Определение 6. Множество Ж будем
представляет собой замкнутую є-окрестность называть К() -стабильным мостом в диффе-
множества Мі, і є К . ренциальной игре "наведения-уклонения"
_ _ нескольких лиц, если оно является стабиль-
Доказательство. Допустим, что утвер-
ным мостом второго игрока [3] в антагони-
ждение леммы неверно. Тогда найдутся число 5 > 0 и последовательность монотонно убы- стической игре
вающих чисел {є, } ^ 0 , таких, что
g im, к
(i ) , Мг ) , i
є к.
Дадим расшифровку приведенного определения.
ставящих каждому набору векторов
(U,uг+l,-,uk)є П P
.єК (і)
в соответствие вектор и1 е Р1, и моментов
Множество Ж будет Кч1) -стабильным ,»
■’ 4' времени t е (, 1 ] найдется такое решение
дифференциального уравнения в контин-генциях
мостом, і є К, если для любых позиций jt.,х.]єЖ, отображений U : П Pj ^P
jєК (О і
хє со(t,хUl,■■■,u-l,u (Ul,■■■,uг-l,U,.+1, —,Uk),U,.+1,—,Uk)|(Ul,■■■,uг-l,u+1,—,uk)є П P
І ієЩ
..
' (t.) = x., для которого jt *, x (' ')IeW .
G
i|, к (і), M,).
Определение 7. Систему множеств является экстремальной стратегий первого
Ж1, — ,Жк с['0,Т]х^п будем называть Ё- игрока кмножеству Ж в игре
стабильной, если для всех 1 е К множество
(['0, Т] х Rn) \ Жг является К"(/) -стабильным
мостом в дифференциальной игре "наведения-уклонения" нескольких лиц.
4. Экстремальное прицеливание
Пусть Ж С['0 , Т ] х Rn — замкнутое
множество.
Определение 8. "Контр"-стратегия
и [ К (1 )]+ €. КИ['] 1 -го игрока называется
экстремальной к множеству Ж, если она
Дадим расшифровку приведенного определения. Полагаем
s = x - w,, llx - w J = min llx - wll. (4.1)
'' ^ we^ (t ''
В случае когда точек w eW (t), доставляющих min в (4.1), более одной, берется любая из них.
"Контр"-стратегия U* ■¥ Щк^ f], i е K будет экстремальной к множеству W, если
max
(U1,-Ui-1,Ui+1-,Uk )є П Pj
jeK(i)
max min s
(U1,'"Ui-1,Ui+r",Uk)є П Pj иієРі
jeK(i)
f (t, x, U^ • • •, U, -1, % (і) [Ч x, [U\j є K (і )|], U+1, -, Uk ) =
•f (t, x, U^ U, Ui+l, —, Uk)
для
тех позиций jt, х|, в которых W (t) ^ 0 .
В остальных позициях
К (,)
t, x,jUj j є к (. )|]-
произвольный вектор из множества Р .
Лемма 2. Пусть Ж с['0, Т]х Rn —
замкнутый 1 -стабильный (€-стабильный) мост в дифференциальной игре ''наведения-уклонения" нескольких лиц, "контр"-
стратегия ие - и [] ('чистая" стратегия
Щ - " [•] [3]) является экстремальной к множеству Ж и {^,х,}єЖ. Тогда для всякого движения х(•) є X |^0, х0, и** ] , (х(•) є X |^0, х0,и/] ) будет выполнено включение х(t*) є Ж(t*) для всех t* є ['., Т ] , если Ж (‘) * 0 при всех t є , t*] .
Справедливость данной леммы следует непосредственно из лемм 82.і, 82.2 книги [і].
s
Пусть Wj,---,Wk 3ft0,T]xRn - система по- множеств W1,---,Wk з ft0, T ]x Rn , если при
всех i e K и позиций jt, xjeWi, для которых
к0
парно непересекающихся открытых множеств.
Определение 9. Набор "контр"- (['0, Т1Х Rn \ Ж )(, ),0 , имеют место ра-
стратегий и1 + ^ [.].■■■.и°í + ^ [] бу- венст^а
дем называть экстремальным к системе
[', х] = {/'}, 7 е К (1),
: я• / (', x, ^ [', x, и ], ■, /£—!,{.} [', x, и ], и, и0+1,и [', x, и ], ■, и°,и [', x, и ]) =
max;
U, єР,
= max
min
Uі єРі (ul,--Ui-l,Ui+l--,Uk )є П Pj
jeK(i)
• f (t,
, u¡-l, U, u¡+l,
:) .
где
s = x - w,, llx - w, II = min ||x - w\\ .(4.2)
we(fto,T ]xRn\W )(t)"
В случае когда точек
w, e(ft0,T]xRn \Wi)(t), доставляющих
min в (4.2), более одной, берется любая из них. Для остальных позиций управляющие воздействия игроков принимаются произвольными допустимыми воздействиями.
Заметим, что в силу условия Wi П Wj = 0, i j, i, j e K набор "контр"-стратегий игроков, экстремальный к системе множеств W1,...,Wk з fto,T ] x Rn, является
согласованным.
Лемма
система
3. Пусть
Ж„-,Жк с[<0,Т]хRn - попарно непересе-кающихся открытых множеств является К-стабильной [3] (К -стабильной). Набор "контр"-стратегий и”,— , и- ("чистых"
стратегий Ц0,---,Ц-0 [3]) всех игроков экстремален к системе множеств
Щ,-,Жк з[^, Т ]х Rn, и
К,х,}еЖ = ([(„,Т]хК')\I уЖ1
V ]еК
Тогда для любого номера 1 е К и всякого движения х (•) е X Г',, х,, Ц 17 е К (1)
(движения х(•) е X Г',, х,, и017 е К (1)])
будет выполнено
х('>Ж(/•) и Ж ('').
УеК(!)
для всех ' * е ['., т ] , если
включение
Ж (') и Ж}- (') * 0 при всех ' е Г',,'*].
}еК (¿)
Справедливость данной леммы следует непосредственно из лемм 82.1, 82.2 книги [1].
5. Теорема об альтернативе
Предположим, что целевые множества игроков попарно не пересекаются. Дадим определения возможных исходов дифференциальной игры "наведения-уклонения" нескольких лиц.
Определение 10. Будем говорить, что в начальной позиции {',, х,} "чистая" стратегия
и. ("контр"-стратегия и) 1 -го игрока 1 е К,
решает задачу наведения на целевое множество этого игрока, если для всех
х(.)е X [',, х,,Ц ] (для всех х(.)е X
выполнено включение х (Т) е М1^.
Определение 11. Будем говорить, что в начальной позиции {',, х,} набор "чистых"
стратегий всех игроков и1, — ,ик (согласованный набор "контр"-стратегий всех игроков и»-А) является компромиссным, если существует г > 0, что для всех 1 е К и х (.)е X [',, х^П^ е К (/)] (х(.)е X [',, х,А |у е К (/)]) выполняется условие х(Т) £Мг = {х еRn|||x — т|| <г, т е} .
Лемма 4. Пусть выполнено условие Мг П М} =0, 1 * 7,1,7 е К.
Тогда Ж П Ж: = 0, 1 * 7,1,7 е К, где
4, х.,и
)
Ws, S є j/, j| - максимальный s -стабильный
s
U
мост (^-стабильный мост), обрывающийся на множестве М5, 5 е К .
Доказательство. От противного приходим к паре индексов 1,7 е К , для которых
Ж П Ж} * 0 . Пусть , х,} е Ж П Ж}. Тогда в силу леммы 2 стратегия А/— и [•] а — чН), экстремальная к множеству Ж,
и стратегия и;—и 7 НА; — и7 []) , экстремальная к множеству Ж}-, игроков 1 и 7 соответственно обеспечат включения
х(т)ем1, Ух(•)еX ,х,,А;
(Ух(•) е X[',,х,,А;]),
х} (т)ем7, Ух(.)еX ,х,,и;
(Ух (•) е X[',, х, ,и; ]).
С другой стороны, справедливо вложение X ',,х,,Ц 5е{1,_/'} ^ ',,х,,и П№ ',,хА *0
(X ',,х,, А 5 е{1,7}] 0X4, х,,Ц]ПX[t,, х,, Ц] *0). Для любого
найдется число 8 > 0, что {',, х,}£ и Ж5г ,
5еК
х (•) е X , х, ,Ц; 5 е{1, 7}
(х(•) е X , х,,и;|5 е{1,7}
)
должно выполняться
х(Т) е Мг ПМ} =0 .
Последнее невозможно, что и доказывает справедливость леммы.
Из доказанной леммы следует, что для
начальной позиции {',, х,} е ['0,Т]хRn справедливо одно и только одно из следующих двух утверждений:
1) существует номер 1 е К , что
{',,х,} еЖг;
2) (г,, х,} е(['0, Т ]х К' )\|и Ж
Л
ч,еК У
где Ж — максимальный 5 -стабильный (€ стабильный мост), обрывающийся на множестве М,, 5 е К .
В первом случае очевидно разрешима задача наведения 1 -го игрока в классе "контр"-стратегий ("чистых" стратегий). Пусть имеет место второй случай. Тогда по лемме 1
где Жг — максимальный 5 -стабильный (€ стабильный) мост, обрывающийся на множестве мг . Для всех номеров 5 е К множество и Ж5* является открытым. Оно представляет
а<г
собой совокупность тех и только тех начальных позиций, для которых не разрешима задача уклонения второго игрока в антагонистической дифференциальной игре
G ( к (5) ,{5}, к' \ мг) (G (К (5 ),{5}, к' \ мг)).
Тогда множество {(['0, Т ] х Кп ) \ Жг является
максимальным стабильным мостом первого игрока в игре
G (К (5) ,{5}, Кп \М1)
(в игре G (К (5), {5}, Кп \Мг )) и, следовательно, К (5 ) -стабильным (К"(5 ) -стабиль-
ным) мостом. Отсюда следует, что система открытых множеств Ж1г,- ,Жкг является К -
стабильной (К -стабильной.). Тогда по лемме 3 для всякой начальной позиции
{г,,х,} е(['0,Т]хК)\1 и Ж
Л
ч5еК у
набор "контр"-стратегий ("чистых" стратегий) всех игроков, экстремальный к системе множеств Ж1г,-,Жкг , будет компромиссным.
Таким образом, доказано следующее альтернативное утверждение относительно исходов дифференциальной игры "наведения-уклонения" нескольких лиц.
Теорема 1. Пусть в дифференциальной игре "наведения-уклонения" нескольких лиц целевые множества игроков попарно не пересекаются. Тогда для любой начальной позиции либо существует игрок, решающий задачу наведения на свое целевое множество в классе "контр"-стратегий ("чистых" стратегий), либо существует компромиссный набор "чистых" стратегий ("контр"-стратегий) всех игроков.
Список литература
1. Красовский Н.Н., Субботин А.И. Позици- 3. Лутманов С.В. Об одном альтернативном
онные дифференциальные игры. М.: Нау- утверждении относительно исхода диффе-
ка, 1974. 456 с. ренциальной игры "наведения-уклонения"
2. Колмогоров А.Н., Фомин С.В. Элементы нескольких лиц в классе "чистых" и "сме-
теории функций и функционального ана- шанных" стратегий // Вестн. Перм. ун-та.
лиза. М.: Наука, 1976. 544 с. Сер. Математика. Механика. Информати-
ка. 2011. Вып. 1(5). С.53-61.
On one alternative statement relative to an outcome of the differential "training-evading” game of several persons in the class of ”counter”-strategies
S. V. Lutmanov
Perm State University, Russia, 614990, Perm, Bukirev st., 15 [email protected]; (342)239-63-09
The positional differential "training-evading" game of several persons is discussed. The game is formalized in the class of "t counter"-strategies. On the assumption that players’ target sets do not intersect in pairs, the alternative statement relative to outcomes of the game is proved.
Key words: "pure" strategies; "counter"-strategies; stable bridge; theorem on an alternative.