Научная статья на тему 'Математическая модель компромиссного управления динамическими системами'

Математическая модель компромиссного управления динамическими системами Текст научной статьи по специальности «Математика»

CC BY
52
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / СТАБИЛЬНЫЙ МОСТ / ЦЕНА ИГРЫ / ЭКСТРЕМАЛЬНОЕ ПРИЦЕЛИВАНИЕ / A COMPROMISE SET OF STRATEGY / BALANCE ON NASH / DIFFERENTIAL GAME / THE STABLE BRIDGE / AN EXTREME AIMING

Аннотация научной статьи по математике, автор научной работы — Лутманов Сергей Викторович

Вводится понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обосновывается способ его построения в классе позиционных стратегий. Рассмотрен модельный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical model of compromise control dynamic systems

The concept of a compromise set of strategy for differential game of several persons is entered. The way of its construction in a class of item strategy is proved. The modeling example is considered.

Текст научной работы на тему «Математическая модель компромиссного управления динамическими системами»

2012

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика Вып. 1(9)

УДК 519.6

Математическая модель компромиссного управления динамическими системами

С. В. Лутманов

Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букирева, 15 [email protected]; (342) 239-63-09

Вводится понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обосновывается способ его построения в классе позиционных стратегий. Рассмотрен модельный пример.

Ключевые слова: дифференциальная игра; стабильный мост; цена игры; экстремальное прицеливание.

Введение

Одна из основных проблем в исследовании неантагонистической игры состоит в выборе адекватного содержанию задачи понятия решения. Наиболее распространен подход, основанный на принципе равновесия по Нэшу. Равновесный набор обладает свойством устойчивости по отношению к игроку-уклонисту: единоличное уклонение игрока от равновесного набора стратегий приводит к ухудшению (увеличению) его платы. Недостаток равновесных по Нэшу ситуаций состоит в том, что величины платы игроков для таких ситуаций могут оказаться существенно хуже (больше) потенциально возможных. Естественно, такие ситуации уже не будут обладать свойством устойчивости по отношению к иг-року-уклонисту.

В работе вводится понятие компромиссного набора стратегий, сохраняющего свойство устойчивости по отношению к игро-ку-уклонисту (в ослабленном варианте). При этом на примере конкретной дифференциальной игры показано, что для компромиссного набора стратегий выполняются неравенства

I ( иК°мп иК°мп иК°мп иК°мп иК°мп ) <

, \ 1 ^ ^ , 1 ^ ^ ^ 1 ^ ^ к /

I ( цНэш цНэш цНэш цНэш цНэш )

, \ 1 ^ ^ , 1 ^ ^ ,+1 ^ ^ к /

V, е К.

© Лутманов С. В., 2012

В отличие от равновесных по Нэшу наборов стратегий единоличное уклонение какого-либо игрока от стратегии, предписываемой ему компромиссным набором, может привести к увеличению его выигрыша. Фактором, обеспечивающим устойчивость компромиссного набора стратегий, является потребность игроков не допустить значительный выигрыш какого-либо одного игрока.

1. Игра в нормальной форме

Под игрой (необязательно дифференциальной), записанной в нормальной форме, будем понимать тройку

(К, {{ц }|, е К,}, {/,||, е К,}). где К = {1,...,к} - множество номеров игроков, {ц} - множество всех стратегий, а /, : {ц,}х...хЩк} ^ R1 - функция платы ь

го, , е К , игрока. Игра состоит в том, что каждый игрок выбирает независимо от других какую-либо стратегию из своего множества стратегий. В результате складывается ситуация Ж = (ц1,^,цк), на которой вычисляется плата /1 {01,---,Пк ),, е К , каждого из игроков. Игрок заинтересован в минимизации своей платы. В этом пункте для простоты будем предполагать, что все встречающиеся по ходу изложения шт и тах функций платы существуют.

Определение 1.1. Наб°р стратегий ц0,...,^0 называется равн°весным п° Нэшу. если

/г (ц0,...,^,^, ц01,...,ц0) <

/г (ц0,...,^, ,ц0+1,...,цк0)

Уц е{ц},,1 е К . (1.1)

Из определения 1.1 следует, что для равновесных наборов характерно следущее:

1. Сообщество игроков не позволяет любому своему члену получить плату меньше (лучше), чем некоторая величина

5, = ПИП /,{и°,-,и°_1,и1 Щ,-;^),

ц е{ц} 4 '

1 е К.

2. Имеет место совпадение этих величин с соответствующими значениями плат, которые получают игроки при применении равновесного набора стратегий

5,= ф lV■•,U^U^U^,■•■,U10).

Отказ от выполнения условия 2 приводит к следующему определению.

Пусть

5,=( 5„,-, 5,.,), 5 -=( 5;,-, 5,*),

5,, 5*е Rk, 5,< 5*.

Определение 1.2. Будем г°в°рить. чт° ситуация Жк°м е {Ж} является к°мпр°мис-сн°й п° °тн°шению к вект°рам 5,, 5 *. если для всех 1 е К справедливы неравенства

5;<

> шт I ( , -, цт, ц., цКТ, -, Щ°мп) <

} 1 ' 1 1 + '

и. е р С Кг - вектор управляющих пара-

-С ■ п1+и+г1+...+гк ^ ип метров i-го игрока, / : К 1 к ^ К -

вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов.

Будем предполагать, что множества

Р, 1 е К компактны. Функция / непрерывна по совокупности переменных t, х, и1.. ик .

Относительно правых частей дифференциальных уравнений (2.1) принимаются стандартные в теории дифференциальных игр предположения [1].

1. Локальные условия Липшица УК > 0 З к > 0 :

\f(t, X1-\их,...,uk)- f(t,X \Щ,...,uk)| <

< k\\X(1) - X(2)|, v||X(1)|| < R, ||X(2)|| < R, t e [t0, T], ut G P, i G K.

2. Условия продолжимости решения

ЗА > 0:

||f (t,x,Uj,...,uk)|| < А(1 + ||x||)Vt g [t0,T], ut G P, i G K .

3. Существование седловой точки в "маленькой i -игре" для всех i e K :

min maxs • f (t, x, u1,—, u,—, uk ) =

(u,—,ui-11ui+1,—,uk)e ПР uiePi

jeK (i)

= max min s • f (t, x, u1,- 4

uiePi (u,—,u-iiu+i,—,uk)G П P

jeK(i)

, u,.

, u,.

У x є Rn+1, t є[t0, T], ^ є Rn.

^ I І UKOMп UKOMп UKOмn UK0Mn UKOмn ) S *

i \ і 5 5 i І ^ i ^ І+І ^ ^ k J І

Плата i-го игрока определяется форму-

лой

УІ є K.

(І2)

Принцип компромисса обобщает равновесие по Нэшу в том смысле, что при 5, = 5* определение 1.2 переходит в определение 1.1.

2. Дифференциальная игра нескольких лиц

Динамика системы описывается обыкновенным векторным дифференциальным уравнением

X = / (^ X, и1,..., и, ), (2.1)

где t е ^ 0, Т ] С К1 - текущее время,

х = (х1,..., хп) е Кп - фазовый вектор объекта,

Іг = ^ ( х(Т)) , (2 2)

где аі : Rn ^ R1, і є ^ - некоторая заданная непрерывная функция, х(-) - реализация фазового вектора объекта, а Т - момент окончания игры.

Свои управляющие параметры игрок формирует, основываясь на информации о текущем времени и реализовавшемся фазовом векторе объекта, при этом он не осведомлен о выборе управляющих параметров остальных игроков в этот момент времени. Понятия позиционной стратегии игрока и движения объекта, отвечающего набору позиционных стратегий, определяются аналогично [1].

Определение 2.1. Позиционной стратегией игр°ка 1 е К называется пр°изв°ль-ная функция ц. : [г,,Т]хКп ^Рг.

Пусть ц. [•] , г е К - пр°изв°льная п°-зици°нная стратегия и А - к°нечн°е разбиение °трезка времени [г,, Т ] т°чками

Т*, * = 0,1, — , т, = г,.

Определение 2.2. Л°ман°й Эйлера ХА (• t0, Х0,цг []). вых°дящей из п°зиции {г0, х0 } и порожденной позиционной стратегией ц. [•]. наз°вем всякую абс°лютн° непрерывную функцию хА(-). уд°влетв°ряющую дифференциальн°му уравнению

ХА () = /(^ ХА (t), и1 (t), - , иг (), - , ик (t)) .

Определение 2.4. Мн°жеств°

ха(г0) = x0, ха(т*) = ,Иш0ха( г),

4 ' 4 ' г^т.-0 4 '

и (г )=и \т*, ха(т )], г еК,т*+1), 5 = 0,1,‘--

Здесь реализация вект°ра управляющих пара-метр°в и^ (•) для всех ] е К (г) = К \ {г}

представляет с°б°й пр°изв°льную интегрируемую п° Лебегу функцию с° значениями в мн°жестве Р-.

Определение 2.3. Движением. вых°дя-щим из п°зиции {г0, х0 } и п°р°жденным п°-

зици°нн°й стратегией ц. г -г°. г е К. игр°-

ка. наз°вем всякую функцию х(-). для к°т°-р°й найдется п°след°вательн°сть л°маных Эйлера хА(р) (•, г0, х0, и. [•]), р = 1,2, —. равн°-

мерн° сх°дящаяся к ней на [г 0, Т ] при усл°вии

Нш БирТ^ - т*р))= 0.

р^ад *

С°в°купн°сть всех движений. вых°дя-щих из п°зиции {г,, х0} и п°р°жденных п°зи-

ци°нн°й стратегией ц. [•]. i-го. г еК. игр°-ка. будем °б°значать симв°л°м

X [г., х.ДН]

и называть пучк°м к°нструктивных движений.

Пусть L С К и каждый игрок с номером г е L выбрал некоторую позиционную стратегию.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X

г‘, х0,{и1 [•] | . е £}]= П Х\г,, х0,цг [•]

,? 0 ’ ^ ^^^^1 ) I || \ , ’ 0

iеL

наз°вем пучк°м к°нструктивных движений. вых°дящих из начальн°й п°зиции {г0, х0} и п°р°жденных наб°р°м п°зици°нных стратегий ц. [ ] I г е L} мн°жества игр°к°в

L с К.

Известно [1], что

X

,, ^ [иг [•] | . е ^]^0 для всех L С К . При этом X

с X если L с L'.

г,, x0, {иг [•] I г е L'}

г,, Xo, {иг [•] | г е ^

3. Построение компромиссных наборов стратегий

Пусть

5,=( 5;,—, 5,,), 5 -=( 5.,—, 5;),

Определение 3.1. Будем г°в°рить. чт° наб°р п°зици°нных стратегий

ттк°мп ттк°мп

и 1 , — ,и, всех игр°к°в к°мпр°миссен

°тн°сительн° вект°р°в 5,, 5*. для началь-н°й п°зиции {г,, х,}. г, е[г0, Т]. если

/г \х (•)]< 5 Ух 0 е

е X [г,, х,, ^к°мп,—, ,—, цк°мп ] (3.1)

и /г\х(•)]> «г,

Ух (•) е X \г,, х,, огп,—, ц-Г,

г+1

л:

(3.2)

Рассмотрим множества

Мг = {х е КП | а. (х) < 5г,} , г е К.

Будем предполагать, что

Мг ПМ1 = 0, г,] е К.

Пусть ЖКС [с Т ] х Кп — максимальный стабильный мост первого игрока [1] в игре, в которой множество игроков К (г ) решает за-

дачу наведения на множество МС против игрока с номером г в момент времени Т. Для

всех г е К полагаем Wi = (ЖК^)) .

Лемма 1. Множества Wi, г е К попарно не пересекаются.

Доказательство. Допустим противное. Тогда найдутся номера г, j е К , такие, что

W П W] ^ 0 . Пусть {Г., х,} е W П W] и, следовательно, (г,,х,} £ ЖК{-г^, (г,,х.} £ 1). По

теореме об альтернативе [1] для начальной позиции (г,, х,} разрешимы задачи уклонения в момент Т игроков г и j от множеств МС и МС соответственно. Пусть и*,и.

* 1 г 1 стратегии игроков г и j, решающие указанные задачи. Тогда для всех х (•) е X г,, х,, и., и* ] должно выполняться

х(Т) е М1 ПМ^. Последнее невозможно, так

как X [г,, х. и, ,и. ]*0, а Мг П М} =0 .

Лемма доказана.

Предположим, что

М ^ (х е Rn | аг (х) < S*, г е К} и существует множество W ^ [г0, Т] х Rn, для которого

1) W « ^ 0, г е [г0 , Т] - замкнутое множество;

2) W(г)ПW1 (г) = 0, г е[г0,Т], г е к;

3) W (Т)= М ;

4) для любой позиции {г,, х,} е W и момента времени г * е [г,, Т ] существует набор программных управлений

и1, (•) , —, ик, (•) , и, (^) е Р1 , г е [г,, г *] г е К всех игроков, такой, что для решения х(•) дифференциального уравнения

х = / ( г, x, Щ1,( г ), —, щ,( г ), —, ик,( г )),

х„

выполняется включение

X(t*)е^(t*) .

Заметим, что из условий 2) и 3) следует, что Мг ПМ = 0, г е К.

Набор компромиссных стратегий

т т ком т т ком

и 1 ,'",и к определим соотношениями

щом [•]=

х ^ и Ж (t ).

1єк

Ж (t )*0.

еК (])

(t, х).

X є

Ж (').

І є К (').

любой вектор в остальных из р. позициях.

г е[г0,Т], х е Rn, г е К. (3.3)

Здесь набор векторов и*К (г, х), г е К удовлетворяет условию

5 (г, х )• • / (г, х, ЩК (г, х), ■ ■ ■, и^К (г, х), ■ ■ ■, иекК (г, х)) = = тт 5 (г, х )•

■■Щк )еП Р1

1еК

•/ (г, х, их, —, и*, , ик ), (3.4)

5 (г, х) = х - х,,

х - X = тіп х - х

(3.5)

а набор векторов и<ёК(1 ^ (г, х), г е К (j), j е К условию

тах І * (t. х)•

и

1+1

і. х. и1К ( х).— ■. иІ .—

І)е (t. X) . —. иК1 (і.х))

тіп •••.«і-і.«і+і.-".иі)є ^ рі ІєК( І) тах s иієРі

f (^ х. и1. —. и ,• —. ик )

s( І ^ ^ х) = х - хіІ ^.

х - х{1І = тіп хє(Жі (і ))с х і «і

(t.х у.

(3.6)

Теорема 1. Набор стратегий всех игроком ком

ков и 1 ,•••,ик , определенный соотноше-

ниями (3.3), является компромиссным относительно векторов S,, S* для любой начальной позиции (г,, х,}е W.

Доказательство. Прежде всего, заметим, что в силу определения множества Ж и леммы 1 выполнены условия

Ж (г) П Ж! (г) = 0, г е[<„, Т] г, 1 е К,

Ж (г) П Ж (г) = 0, г е[г„, Т], г е К.

Следовательно, набор стратегий

ком ком

и 1 , ■, ик определен корректно.

Для всех начальных позиций (г,, х,}е Ж установим справедливость неравенств (3.1). Действительно, множество Ж будем трактовать как стабильный мост, обрывающийся в момент времени Т на множестве М , в некоторой вспомогательной игре. В этой игре объединение всех игроков решает задачу наведения на множество М в момент времени Т. Компромиссный набор стратегий в малой окрестности множества Ж представляет собой стратегию экстремального прицеливания объединения всех игроков на множество Ж .

Тогда для любого движения

х ( • ) е X [г,, х,, иком , • • -Ц-Т иом , ЦТ, ■, иК°м ] выполнено включение х ( г ) е Ж (г).

г е[г,,Т]. В частности, х(Т)еЖ(Т)= М ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

что и означает выполнение неравенства (3.1).

Неравенство (3.2) докажем от противного. Пусть оно нарушается для некоторой начальной позиции (г,, х,}е Ж и номера г е К . Тогда найдется движение

х ( • ) е х [г,, х, ,иком ■■и™: ик::, ■ иг ],

для которого х (Т) е М1^. Это невозможно, так как для всех номеров г е К в позициях (г, х}еЖ набор стратегий

(иг [•] ,-и;7 [•] ,и"7 [• ] ,-,иг [• ])

является стратегией экстремального прицеливания на множество ЖК ^) объединения игроков К (г) на стабильный мост ЖК^), для которого выполнено равенство ЖК^ (Т)= .

Теорема доказана.

4. Модельная игра

Постановка игры. На двумерной плоскости находится точка, управляемая k-игроками (k > 2). Каждый игрок имеет возможность независимо от других назначать точке вектор скорости, произвольный по направлению и ограниченный по длине числом ai, i є K . Игра начинается в момент времени t0 из некоторого начального положения управляемой точки и заканчивается в момент времени T .

На плоскости заданы фиксированные точки M*, имеющие соответственно радиус-векторы r, i є K относительно начала координат. Платой i -го, i є K , игрока служит r lT)-rll - расстояние от финального положения управляемой точки в момент времени T до целевого множества этого игрока.

Рис. 1

Неформальная цель каждого из игроков состоит в минимизации своей платы.

Рассмотрим случай (см. рис. 1), когда к = 3, а = а = а = 1,

2 ^3

r = (-1,л/з )

ГЗ =

(Ді) ,

L = 0, T = 1,.

г = u =l ul, u2 ) , u2 = V =l V2 )

и = и

и3 = ^ = (и,1, ), Цщ. || < 1, г = 1,2,3 .

Дифференциальные уравнения движения управляемой точки имеют вид

х1 = и1 + v1 + н1. х 2 = и 2 + V 2 + н2.(4.1) d^]

В качестве компромиссных оценок возьмем вектора

S. = (0.13, 0.9,1.4), S* = (0.57,1.131,1.71). Полагаем

dt

(і. х. у.

х. у.и1.и2. v1. v2.н1.н2

2. Н1. Н2 ) =

у) ^х2 +(у - 2)2 < 0.1з|.

М2 = |(х. у) д/(х +1)2 + (у л/3)2 < 0.9|

Мз = |(х. у) д/(х л/3)2 +(у -1)

--1)2 < 1.41

М = {(ГМх. ГМу )|

где

Гм =(М,М) = (0.09147721, 1.442277962).

Непосредственно проверяется, что

мг П м = 0, мг П м} = 0, г, 1 = 1,2,3,

||г -Гм|| = 0.565174 < 0.57 = ^,

||г2 -Гм|| = 1.12929 < 1.131 = S2,,

||Г - ГМ || = 1.69914 < 1.71 = ^. Полагаем

Ж(2,3} =((г, х У)| 91 (г, x, У) =

+(у - 2) +(1 - і)

- і)-0.13 > 0.

і є[0.1]|.

Ж{1.3| ={(і. х. у)| ^2 (і. х. у )

х +1)2 +(у ->/3 )2 +(1 - і)-0.9 > 0 і є[ °.1]|.

Ж1 1.2} ={ (І. х. у )| ?3 (І. х. у ) =

= -1 +

\іх2 +(у - 2)

г( и1 + v1 + н) +

+

у - 2

-\/х2 +(у - 2)

dty2

(и2 + v2 + Н2 ) .

dt

= -1 + +

(і. х. у. и1. и2. М1. v2. Н1. Ж, ) =

х + 1

^(х +1) +(у --\/з)

г(и1 + V + ^ ) +

у

^л/3

х +1)2 + (у-л/э )

г(и2 + V + Н2 ) .

dtyъ dt

= -1 +

(і. х. у. и1. и2. V!. v2. Н1. Ж, ) =

х - л/3

(и1 + V + ^1) +

у -1

х —

л/3) +(у -1)

,(и2 + v2 + Н2 ) .

Легко видеть, что dm,

тт тах 1

• dm,

= тах тт —L > 0.

II-1 IV! И.|| НІ - dt М И.|| НІ - IIй I И1 dt

тт тах

dm2 . dm2

• = тах тт—- > 0.

І-1 ||и 1^1.1 НІ -1 dt ІМІ-М НІ-1 И-1 dt

тт тах

dm3 . dm3

3 = тах тіп—3 > 0.

х-Л)2 +(у -1)2 +(1 - і)-1.4 > 0. і є[0.1]|.

Очевидно, что

Ж м0)=(М.) • Ж ,з| (1)=(М 2 У ■

Ж,,г|(1) = (М3 )С.

Вычислим производную функций 9, г = 1,2,3 в силу системы дифференциальных уравнений (4.1). Имеем

'К1 IIй <1,1 И <1 dг 11“ 11<1,| И И н И1 dг

Тогда множества Ж(2 3}, Ж( 13}, Ж12} являются

соответствующими максимальными стабильными мостами.

Полагаем

Ж1 =( ( ^ x, У )| 91 ( ^ x, У ) =

= >/ х2 +(У - 2 )2 :(1 - г)-0.13 < 0, г е[0,1]},

Ж2 =( (г, x, У )| 92 (г, x, У ) =

х +1)2 +(У ->/э )2 :(1 - г)-0.9 < 0,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

і є

[0.1]}.

х

2

2

2

W3 = { (t, X, у )| ^3 (t, X, у ) =

J(х-л/э)2 +(у -1)2 +(1 -1)-1.4 < 0, t e[0,1]},

W = { (t, X У)| X = M ■ t, У = rMy • t, t G t0,1]} •

В силу леммы 1 имеет место W П W: = 0, i, j = 1,2,3 . Условие

W (t)П W(t) = 0, t e[0,1], i = 1,2,3

проверяется путем доказательства неравенств

F (t,a) = Рг (t, X, У)x=M t, > 0,

y=rMy-t

t e [0,1], i = 1,2,3.

Справедливость указанных неравенств устанавливается в результате численных расчетов, проведенных с применением пакета "Mathematica". Выполнение условия 4) для множества W обеспечивают постоянные стратегии игроков, удовлетворяющие условию

п„ (t) + v„ (t) + w„ (t) = rM = const, t e[t„, t*] •

Таким образом, множества

M, Mj, M2, M3 W обладают всеми свойствами, перечисленными в разделе 3. Тогда набор стратегий всех игроков, определенный формулой (3.3), в силу теоремы 1 является компромиссным относительно векторов

Из табл. 1 видно, что значения плат игроков в ситуации А) укладываются в верхние и нижние компромиссные оценки. Однако уклонисты (кроме первого) могут получить лучшее значение платы, чем соответствующие нижние компромиссные оценки.

S. = (0.13, 0.9,1.4), S* = (0.57,1.131,1.71) для любой начальной позиции, принадлежащей множеству Ж .

Набор стратегий всех игроков, назначающий векторы управляющих параметров из условия (3.4), (3.5) для начальных позиций, принадлежащих множеству Ж , обеспечивает каждому из игроков выполнение оценки сверху для его платы. Однако этот набор стратегий может оказаться неустойчивым по отношению к игроку-уклонисту. Это означает, что игрок-уклонист может выбрать такое позиционное управление, которое позволит ему получить значение платы лучше (меньше) соответствующей нижней компромиссной оценки.

Действительно, пусть игроки назначают свои управляющие воздействия из условия (3.4), (3.5). Выберем начальную позицию (0,0,0) е Ж. Рассмотрим последовательно следующие ситуации:

A) среди игроков нет уклонистов;

Б) первый игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;

B) второй игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;

Г) третий игрок уклоняется от этого правила, прицеливаясь на свое целевое множество.

Такой результат невозможен в случае компромиссного набора стратегий. Пусть, например, игроки-уклонисты в качестве стратегии уклонения выбирают прицеливание на свое терминальное множество. В табл. 2 приведены значения плат игроков для таких ситуаций.

Таблица 1

Компромиссная оценка снизу Величина платы в ситуации А) Компромиссная оценка сверху Величина платы при уклонении

Первый игрок 0.13 0.566152 0.57 0.456535

Второй игрок 0.9 1.12948 1.131 0.672874

Третий игрок 1.4 1.69855 1.71 0.875904

Таблица 2

Компромиссная оценка снизу Величина платы для компромиссной ситуации Компромиссная оценка сверху Величина платы при уклонении

Первый игрок 0.13 0.566152 0.57 0.456535

Второй игрок 0.9 1.12948 1.131 0.908814

Третий игрок 1.4 1.69855 1.71 1.40733

Для сравнения построим ситуацию равновесия по Нэшу в данной игре. Необходимые и достаточные условия равновесия по Нэшу в классе постоянных управлений для начального положения г0 = 0, х0 = 0, У0 = 0 имеют вид [2]

u0 =

max (1,

(г [т. -(v 0 + w° )||}

r-(v0+ w0)

rr -(v0 + w0)

V 0 =

max (l, r2 -1w0 + u0) }

r2 -(w° + u 0 )

w0 =

r2 -(w° + u 0 ) max (l, r3 -(u0 + v0 )||}

I u0 + v0)

r3 - I u0 + v0

r3 -(u0 + v0)

(4.2)

Решение системы (4.2) получено чис-

ленно:

u0 =

v0 =

w0 =

Х-

(l) = u20 + v20 + w20 = 1.26141.

ства

Выпишем финальное положение управляемой точки в случае равновесных по Нэшу управлений:

х1 (1) = щ0 ::н0 = 0.03329,

Расстояния от управляемой точки в конечном положении до целевых множеств игроков следующие:

1Нэш =|\rx -r (T)|| = 0.7393,

IНэш =|r -r (T)|| = 1.1354,

13Нэш =||rj -r (T)|| = 1.7192.

Таким образом, справедливы неравен-

1Нэш = 0.7393 > 1;омп = 0.5661,

1Нэш = 1.1354 > 12комп = 1.1294,

1Нэш = 1.7192 > Цомп = 1.69855.

На рис. 1 дана геометрическая иллюстрация приведенных ниже численных результатов.

Заключение

В работе введено понятие компромиссного управления в играх нескольких лиц, в некотором смысле обобщающее равновесие по Нэшу. Сформулирована и доказана теорема существования компромиссных ситуаций в позиционных дифференциальных играх. Конструктивный характер условий теоремы позволил построить компромиссный набор стратегий в модельной дифференциальной игре и провести сравнительный анализ этого набора с набором, равновесным по Нэшу.

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 455 с.

2. Лутманов С.В. Необходимые и достаточные условия равновесия по Нэшу в игре в перемещениях // Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2002. С. 4-10.

Mathematical model of compromise control dynamic systems

S. V. Lutmanov

Perm State National Research University, Russia, 614990, Perm, Bukireva st., 15 [email protected]; (342) 239-63-09

The concept of a compromise set of strategy for differential game of several persons is entered. The way of its construction in a class of item strategy is proved. The modeling example is considered.

Key words: a compromise set of strategy; balance on Nash; differential game; the stable bridge; an extreme aiming.

i Надоели баннеры? Вы всегда можете отключить рекламу.