Научная статья на тему 'Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц'

Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц Текст научной статьи по специальности «Математика»

CC BY
43
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / УПРАВЛЕНИЕ С ПОВОДЫРЕМ / СТАБИЛЬНЫЙ МОСТ / ТЕОРЕМА ОБ АЛЬТЕРНАТИВЕ

Аннотация научной статьи по математике, автор научной работы — Лутманов Сергей Викторович

Известно, что в дифференциальных играх позиционное управление, осуществляемое в форме прицеливания на стабильный мост, не является устойчивым относительно погрешностей в измерении фазового вектора. В связи с этим в книге [1] была разработана процедура управления с поводырем для антагонистических дифференциальных игр двух лиц, которая свободна от этого недостатка. В данной работе произведено обобщение указанной процедуры на случай игр нескольких лиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц»

2011

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика Вып. 3(7)

УДК 519.6

Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц

С. В. Лутманов

Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букирева, 15 [email protected].; (342)239-63-09

Известно, что в дифференциальных играх позиционное управление, осуществляемое в форме прицеливания на стабильный мост, не является устойчивым относительно погрешностей в измерении фазового вектора. В связи с этим в книге [1] была разработана процедура управления с поводырем для антагонистических дифференциальных игр двух лиц, которая свободна от этого недостатка. В данной работе произведено обобщение указанной процедуры на случай игр нескольких лиц.

Ключевые слова: дифференциальная игра; управление с поводырем; стабильный мост; теорема об альтернативе.

Введение

Результаты, полученные в данной статье, позволили в условиях отсутствия у игроков полной информации о реализующемся фазовом векторе доказать альтернативное утверждение относительно исхода дифференциальной игры нескольких лиц, аналогичное тому, что было доказано в работе [2].

Доказательство альтернативного утверждения основывается на сведении дифференциальной игры k лиц к k вспомогательным антагонистическим дифференциальным играм двух лиц, происходящим на попарно непере-секающихся областях пространства исходной игры.

В рассматриваемых антагонистических играх применяется процедура управления движением, являющаяся модификацией процедуры управления с поводырем [1].

© С. В. Лутманов, 2011

1. Постановка дифференциальной игры "наведения-уклонения" нескольких лиц

Динамика конфликтно-управляемого объекта описывается обыкновенным векторным дифференциальным уравнением

X = f (?, X, М1,..., Ык ), (1.1)

где I е V о, Т ] С R1 - текущее время,

X = (x1,...,хп) еКп - фазовый вектор объекта, и1 е р С В - вектор управляющих пара-

-С ■ Г)1+п+П+...+П . пп

метров 1-го игрока, / . К 1 ^ К -

вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем предполагать, что множества р,' е К = {1,-- -,к} компактны, а функция f непрерывна по совокупности переменных ?,X,их,...,Ык .

Относительно правых частей дифференциальных уравнений (1.1) принимаются стандартные в теории дифференциальных игр предположения.

1) локальные условия Липшица

У 0, х1^ ..., ик ) - У (t, щ^.^ ик )| <

VR > 0 З к > 0 :

.(2)

< К х(1) - х(2)

V

,0)

< R,

Д2)

< R,t є[ґ0,$]иі є р,і є К

2) условия продолжимости решения ЗА > 0: || f (г, х, и1,..., и)|| <

< А(1 + ||Х|)Vt е [г0,Т], х е Кп,и' е Р,' е К .

3) выполнено условие существования седловой точки в "маленькой игре" нескольких лиц, т. е. для всех номеров ' е К и векторов 5 е Кп выполняется равенство

шш

и ,---,Щл ,иі,

• У (ґ, х, и1

)єП р

ієк (і)

•, и

шах

и є рр

= шах

иі є р (

ШІП

и ,---,Щл ,щ.

, ик ) =

) єП р

jєЩ

(1.2)

5 • У (ґ, х, и^---, иі,•••, ик) ,

V {ґ, х}є R”+1, sєRn, где К (і) = К \ {і}, і є К .

Условие (1.2), в частности, имеет место для функций вида

у ( t, х u1,•••, щ ,•, ик ) =

= у (1) ( ґ, х, и1) + — + у (к) ( ґ, х ик ) .

В пространстве Rn і -му игроку ставится в соответствие компактное множество Мі, і є К, которое будем называть целевым

множеством этого игрока. Неформальная цель игрока состоит в приведении фазового вектора игры в конечный момент времени на свое целевое множество. В случае если в конечный момент времени фазовый вектор игры не принадлежит ни одному из целевых множеств, то считается, что в игре достигнут компромисс.

В предположении, что целевые множества игроков попарно не пересекаются, в работе [2] было доказано альтернативное утверждение относительно исходов игры. Аналогичное утверждение доказывается и в данной статье. Однако в отличие от работы [2] здесь игроки не располагают полной информацией о реализующемся фазовом векторе. При этом предполагается, что результат измерения фазового вектора один и тот же для всех игроков и погрешность измерения не превышает величину 5 > 0 .

Таким образом, имеет место неравенство

I *11 ^ С ~ *

х — х < о, где х — действительное, ах — измеренное значение фазового вектора игры.

2. Управление с поводырем в антагонистической дифференциальной игре двух лиц

Рассмотрим антагонистическую дифференциальную игру двух лиц наведения-

уклонения G ({1], {2],М), где М С Кп — некоторое компактное множество. Пусть Ж С [г0 , Т ] — стабильный мост первого игрока. Символом

Ж(0 = {х е Кп|{г,х] е ж], г е [г0,Т] обозначим сечение множества

Ж е[г0,Т]хКп в момент времени г е кТ ].

Опишем модифицированную процедуру управления с поводырем первого игрока.

Рассмотрим отображение

и(е): [*0,Т] х Кп х Кп ^ Р, ставящее каждой тройке {г,х,^] е [г0,Т]хКп хКп в соответст-

(е)

вие вектор и ’ по следующему правилу:

если х£Жи (г) и жи (г) ^ 0, то вектор

(е)

и 7 удовлетворяет равенству

( х - w)• У (ґ, х, и^, у) =

шах (х - w

vєQ

= шіпшах(х-w)• У(ґ,х,и,у) ; (2.1)

и є р vєQ 4 ' 4 '

или х(ґ),

но

произвольный

если хе Жи (г)

ж (‘) = 0, то вектор и

элемент множества Р .

Пусть А— разбиение промежутка времени ['«. Т ] на полуинтервалы

К, ^+1), 5 = 0Д-, Т0 = г0.

Символом ( Жи, и (е), а) обозначим

процедуру управления первого игрока, предписывающую ему выбирать свои управляющие воздействия ип (•) из условия и П( г ) = и( ^ , х* , ^ ) , г е ^5 ^5+1 ) , 5 = 0Д- ,

где х* — наблюдаемое значение фазового вектора игры в момент времени Т5.

ч

5

Векторы W5, 5 = 0,1, • • • определяются

по следующему правилу (построение производится только в те моменты времени Т5 для

которых Жи (т5 )^0). В начальный момент

времени т0 вектор w0 находится из равенства

: : I

w — x = min w — xn

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

II 0 °H wєWu (то )H 0II

находим из равенства

||ws+l — xs*+J| = min J|w — x:+J

11 11 ^>^ат!+і )" 1

w(t) є co(f (t,w(t),u,v*)|йє p},

t є К ^s+l ] , w (тs ) = ws ,

(2.2)

причем если вектор w0 определяется из равенства (2.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

Пусть вектора w0,w1,•••,ws уже построены. Если х*+1 є Жи (т5+1) , то полагается w5+1 = х*+1. В противном случае вектор w5+1 определяется в зависимости от значения х*. Когда х* є Жи (т5) , вектор ws+1

(2.3)

где вектор V удовлетворяет равенству тт (w5 — <)•;[ (t, х u, /) =

= шахш1п(V, — х*Ь /(г,х,и,V) .

vеQ иеР V '

Относительно интегральной кривой требуется, чтобы выполнялось включение

w (т5+1) е Жи (т5+1) . Существование такой интегральной кривой гарантируется свойством стабильности множества Жи .

Рассмотрим функцию w : [г0, Т] ^ Кп, кусочно-непрерывную, допускающую разрывы лишь в точках Т5, 5 = 0,1,2,••• и непре-

рывную слева в точках разрыва. На полуин-она отождествляется со ( 5),

тервале [^ т+1 )

вспомогательным движением w'

'(•).

если

причем если вектор ws+1 определяется из равенства (2.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

оно существует на этом полуинтервале.

В противном случае полагается, что

функция w(•) на полуинтервале [т5,т5+1)

xa( т

!а0

t

Когда х* £ Жи (т5) , строится вспомогательное движение w('5) (•), определенное на полуинтервале (т5 ,Т5+1 ]. Оно отождествляется на

нем с интегральной кривой дифференциального уравнения в контингенциях

совпадает с таким решением дифференциального уравнения в контингенциях

V (г) е со {f (г, w (г), и, V) и е Р, V е Q],

w (Т5 ) = W5 ,

для которого выполняется w5 е Жи (т5) .

Определение 1. Процедуру управления (Ж, и(е), А) будем называть модифицированной детерминированной процедурой управления с поводырем первого игрока в игре (} ({1], {2], М).

Определение 2. Движением

I., х,, (к ,и<'>, а)

выходящим из позиции {I,, х,} и порожден-

ным процедурой управления

3. Управление с поводырем в дифференциальной игре нескольких лиц

Пусть Г — разбиение пространства [г0, Т ]х Кп позиций дифференциальной игры

нескольких лиц на множества Ж, Ж1,---,Жк . При этом

1) множества Ж1, — ,Жк открыты и попарно не пересекаются;

2) множество Ж — замкнуто и

(Жи, и(е), а) ж п Ж' =0,г е К ;

первого игрока, будем называть решение дифференциального уравнения

ха( г ) = У ( t, ха( г), и (е)(т5, х*, ^W5), v (г)),

г е[Т5 ,Т5+1 ) , ха(Т5 ) = х5 , х5+1 = 11шп ха(г), 5 = 0,1,2,‘-- .

ґ^т,+. -0

Здесь V (•) — произвольная интегрируемая функция со значениями в множестве Q .

На рисунке приводится графическая иллюстрация модифицированной детерминированной процедуры управления с поводырем.

Можно показать [3], что модифицированная процедура управления с поводырем, как и исходная, удерживает порожденное ею движение в малой окрестности стабильного моста. Другими словами, справедливо следующее утверждение.

Теорема 1. Для любых {г0, х0 ]еЖи и

£ > 0 найдутся числа 0 (а) > 0 и С (£) > 0, такие, что для движения

.(•) =

х

, (Жи ,им, А)_

будет выполнено включение

хА (г) е Жи£ (г) = {х IIх — Ц < £, w е Жи (г)], г е[^ Т ], если Т5+1 —Т5 < 0(£) и

||хА (Т5 )||< С (£) , 5 = 0,1,2,‘" .

В частности, если Жи (Т)с М, то из

теоремы 1 следует включение хА (Т) е М£ ,

т.е. первый игрок решает задачу наведения на £ — окрестность своего целевого множества.

3) для всех г е К множество ( \

Ж(г)= Ж и и Ж}

V ■>еК (О У

является К (г) — стабильным мостом [2]. Рассмотрим отображение иК(е) : [г0,Т]хКп хКп Рг ,

ієК

ставящее

каждой

тройке

{ґ,х,w} є [ґ0,Т]хRn хRn в соответствие на-

,(е)

по следующему

бор векторов и1 правилу:

- если х е Жг (г) при некотором номере г е К и Ж (г )*0 , то набор векторов

(е) (е) (е) (е)

и; , • и>_{, и;+{, •, щ! удовлетворяет равенству

шах (х - w

и єРі

ґ, х, и

(е)

шіп шах,

(и,---,Иі_1,Иі+1,---,Ик)є П Рі иієРі

ієЩ

( х - W)• У ( ґ, X,

,-, ик ), (3.1)

вектор иі полагается произвольным вектором из р;

- если х є К (ґ), то набор векторов

(е) (е) (е) (е)

и] , • иі-1, и]+\, •, ик полагается произвольным набором векторов из множества П р.-

ієК

Пусть А- разбиение промежутка времени ['0.Т ] на полуинтервалы

[Т, ,Т,+1) , 5 = 0,1,-,Т0 = ґ0.

Символом (г, иК(е), а) обозначим процедуру управления игроков, которая предпи-

х

и

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

сывает им выбирать свои управляющие воздействия Щ;П (•) из условия

щп (ґ) = щ е) (т, , х*, V), ґ є К, Т+1),

5 = 0,1,-,

где х* - наблюдаемое значение фазового вектора игры в момент времени Т,. Векторы ws, 5 = 0,1,- определяются по следующему правилу (построение производится только в те моменты времени Т5, для которых

К, (т )*0).

В начальный момент времени Т0 вектор

где со — символ замкнутой выпуклой обо*

лочки, а вектор и{ удовлетворяет равенству ш1п

)єП р

ієОі)

(^+1 - х,,+1 )•У (t, X и1

= шах шт

и єр (и,■■■,ui_l,ui+l,■■■,uk )є П Рі

)• У (

ґ , х, и

Ші)

:).

Относительно интегральной кривой требуется, чтобы выполнялось включение ( \

w0 находится из равенства

w

(г„1 )е^ = к и и К

V ■>єК(і) )

Существо-

^ - х = шіп V - хп

II 0 °Н wєWp(тo )Н 011

(3.2)

причем если вектор w0 определяется из равенства (3.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

Пусть вектора w0,w1,•••,ws уже построены.

Если {т5+1, х,+1} є К, то полагается

вание такой интегральной кривой гарантируется свойством 4) разбиения Г . В рассматриваемом случае полагаем w5+1 = w('5) (т5+1 ) .

Определение 4. Процедуру управления (г, иК(е), А) будем называть детерминированной процедурой управления с поводырем всех игроков в дифференциальной игре нескольких лиц.

Определение 5. Движением

г*, х*, (г,иК (е), а)

х

, выходящим из позиции {г*, х*] и порожденным процедурой управления (Кр,иК(е), а) , будем называть

Если {Т5+1 , х*+1 ] ^ Ж (т.е. (Т5+1 , х5+1 } е Жг

для некоторого номера ' е К), то вектор ws+1

*

определяется в зависимости от значения х5. В случае хх &Ж' (Т5) вектор W5+1 находится из решение дифференциального уравнения равенства -ха(г) = У (г, ха (г), 4%, х*, w5)

•, ^е) (Т 5 , х* , V )) , г е[Т5 ,Т5+1 ) , хА(Т5 ) = х5 ,

х5+1 = 11ш хА(г), 5 = 0,1,2,—

1 г—0 4 '

,,

№+1 - М = шіП , W - х5+1 II И (т^ )И I

(3.3)

причем если вектор ws+1 определяется из равенства (3.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству. В

случае х* є К (т5 ) строится вспомогательное движение w('(•), определенное на полуинтервале (т5 ,Т5+1 ]. Оно отождествляется на

нем с интегральной кривой дифференциального уравнения в контингенциях

V7 (ґ )є со {У ( t, w (ґ), щl,•, иі,--, щ )|

(3.4)

(и1, , и1-1, и1+1, • , ик ) є Р]

ІєК (і)

ґ є[Т5 ,Т5+1 ] , W (Т ) =

: w„

Уклонение какого-либо игрока от процедуры управления с поводырем (г, иК (е), а)

будем моделировать тем, что в правой части дифференциального уравнения (3.4) постоянный на каждом промежутке времени [т5 ,Т5+1)

(е)( * \

вектор и\1 Т, х&,, следует заменить про-

извольной интегрируемой реализацией иг (•)

вектора управляющих параметров соответствующего игрока, подчиненной ограничению

*

и

*

и

*

и (ґ) є р, ґ є [т5 , т5+1 ) . Пучок движений, получающийся в результате такого уклонения, обозначим символом

х

ґ,, х,, (г,иК (і)(е), а)

Теорема 2. Пусть Г- разбиение пространства [ґ0, Т]х Rn позиций дифференциальной игры нескольких лиц со свойствами 1)-3). Тогда для любых {ґ0, х0} є К и достаточно малого числа є > 0 найдутся числа 5(є)> 0 и £ (є) > 0, такие, что для всех і є К и всякого движения

ха(-) = х ґ,, х,,(г,иК(і)(е),а)

будет выполнено хА (Т) є (к(Т)) .

Доказательство. От противного приходим к существованию начальной позиции

{ґ0, х0} є К и числа є > 0, таких, что для любых чисел 5 > 0 и £ > 0 найдется номер і є К и движение хА(-)= х ґ0,х0,(г,иК(і)(е), А) , для которых выполняется условие ха(Т )є(к Й(Т ))є.

Процедура управления (г, иК (е), а) в

рассматриваемой области фазового пространства представляет собой модифицированную процедуру управления с поводырем первого игрока в антагонистической дифференциальной игре G (К (і) ,{і},МС ) . В силу теоремы 1 она обеспечивает включение

(О,

ха(Т )Є(К«(Т))

для достаточно малых величин 0 > 0, С > 0 . Получили противоречие, которое доказывает утверждение теоремы.

Из доказанной теоремы 2, в частности,

следует, что если Жг)(Т)с с(М£)с, ге К, то для всех движений

ха(0 = х ^ Xo, (Г, иК(')(е), А) будет выполнено хА(Т)£ М £ . Таким образом, с точностью до величины £ > 0 в дифференциальной игре "наведения-уклонения" нескольких лиц имеет место компромисс.

4. Альтернативное утверждение относительно исходов игры

Пусть в дифференциальной игре, описанной в п. 1, целевые множества игроков попарно не пересекаются. Тогда справедливо следующее альтернативное утверждение.

Теорема 3. Для всякой начальной позиции {г0, х0 ] либо существует номер ' е К, что для любого числа £ > 0 найдутся числа 0(а) > 0 и С (а) > 0 , такие, что всякое движение хА(-) = х г*, х*, (Жи ,и(е), а) , порожденное модифицированной процедурой управления первого игрока в антагонистической дифференциальной игре

G ({'], К (г),Мг) [2], будет удовлетворять

включению хА (Т) е М£ .

Либо для достаточно малого числа £ > 0 найдутся числа 0 (а) > 0 и С (£) > 0, такие, что процедура управления с поводырем

ТК (')(е)

всех игроков (Кр,иК (г)( е), а) для всех ге К

и всякого движения хА(-)= х г*, х*,(Кд,ЦК(е), а) обеспечивает выполнение условия

ха(Т)й М£.

Доказательство. Пусть для некоторого номера ' е К позиция {г0, х0 ] принадлежит

максимальному -стабильному мосту. Тогда в силу теоремы 1 имеет место первая возможность доказываемой альтернативы.

По условию теоремы целевые множества игроков попарно не пересекаются. Тогда попарно не пересекаться и максимальные -стабильные мосты игроков. Из работы [2] следует, что для любого £ > 0 существует разбиение Г пространства позиций игры на множества Ж£,Ж1£, —,Ж£ , удовлетворяющее свойствам 1)—3). В случае когда величина £ > 0 достаточно мала, разбиение Г будет дополнительно удовлетворять условию

К|,)(Т )с( М•)

і є К .

Тогда в силу теоремы 2 реализуется вторая возможность альтернативы.

Теорема доказана.

с

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.

2. Лутманов С.В. Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения"

нескольких лиц в классе "чистых" и "смешанных" стратегий // Вестн. Перм. ун-та. Математика. Механика. Информатика. 2011. Вып. 1(5). С.53-61.

3. Лутманов С.В. Управление с поводырем в дифференциальных играх нескольких лиц // Деп. ВИНИТИ № 2773-81, 08.06.81. 47 с.

Deterministic sighted-point control procedures in differential games of several persons

S. V. Lutmanov

Perm State National Research University, Russia, 614990, Perm, Bukireva st., 15 [email protected]; (342)239-63-09

Under conditions of limited information about an occurring phase vector the alternative statement relative to an outcome of a differential “directing-evading” game of several persons is proved. The sense of the statement lies in the fact that in each initial position either one of the players resolves the problem of directing to his target set using an appropriate sighted-point control procedure or a sighted-point control procedure for all players that provides a compromise on the game is available.

Key words: differential game; sighted-point control; stable bridge; theorem on an alternative.

i Надоели баннеры? Вы всегда можете отключить рекламу.