Научная статья на тему 'Компромиссное управление в дифференциальных играх нескольких лиц'

Компромиссное управление в дифференциальных играх нескольких лиц Текст научной статьи по специальности «Математика»

CC BY
118
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПРОМИССНЫЙ НАБОР СТРАТЕГИЙ / РАВНОВЕСИЕ ПО НЭШУ / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / СТАБИЛЬНЫЙ МОСТ / ЭКСТРЕМАЛЬНОЕ ПРИЦЕЛИВАНИЕ

Аннотация научной статьи по математике, автор научной работы — Лутманов Сергей Викторович

Вводится понятие компромиссного набора стратегий игроков. Обосновывается способ его построения в классе позиционных стратегий для дифференциальных игр нескольких лиц. Рассмотрен модельный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Trade of control in differential games of many players

A compromise set of positional strategies in a differential game of several persons is constructed.

Текст научной работы на тему «Компромиссное управление в дифференциальных играх нескольких лиц»

УДК 917.934

© С. В. Лутманов

mpu@perm.ru

КОМПРОМИССНОЕ УПРАВЛЕНИЕ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НЕСКОЛЬКИХ ЛИЦ

Ключевые слова: компромиссный набор стратегий, равновесие по Нэшу, дифференциальная игра, стабильный мост, экстремальное прицеливание.

Abstract. A compromise set of positional strategies in a differential game of several persons is constructed.

1. Игра в нормальной форме

Под игрой (необязательно дифференциальной), записанной в нормальной форме, будем понимать тройку

(k, {[иг] | i € K}, {1г | i € K}),

где K = {1,... , к} — множество номеров игроков, {иг} — множество всех стратегий, а

1г-. {U} X ... X {Uk} ^ R

— функция платы i-го, i € K, игрока. Игра состоит в том, что каждый игрок выбирает независимо от других какую-либо стратегию из своего множества стратегий. В результате складывается ситуация W = (Ub...,Uk), на которой вычисляется плата /г(U,..., Uk), i € K каждого из игроков. Игрок заинтересован в минимизации своей платы. В этом разделе для простоты будем предполагать, что все встречающиеся по ходу изложения и функций платы существуют.

1.1. Оптимальность по Нэшу

Одна из основных проблем в неантагонистической игре состоит в выборе адекватного содержанию задачи понятия решения. Наиболее распространен подход, основанный на принципе равновесия по Нэшу.

Определение 1.1. Набор стратегий ,..., называется равновесным по Нэшу, если для всех Ц € {Ц}, г € К справедливо неравенство

Тг(,и?+1 ,...,Ц0) <

< Тг( ,...,Ц0).

Равновесный набор обладает свойством устойчивости по отношению к игроку-уклонисту: единоличное уклонение игрока от равновесного набора стратегий приводит к ухудшению (увеличению) его платы.

Недостаток определения равновесных по Нэшу ситуаций состоит в том, что величины платы игроков для таких ситуаций могут оказаться существенно хуже (больше) потенциально возможных. В частности, может существовать набор стратегий Ц**,..., Ц*, Для которою при всех г € К справедливо неравенство

Тг(Ц*,Ц\...,Ц*,...,Ц*) < !*(Ц0,Ц0,...,и°,...,Ц0).

Естественно, этот набор не будет обладать свойством устойчивости по отношению к игроку-уклонисту, выраженному условием (1.1).

1.2. Принцип компромисса

Из определения 1.1 следует, что для равновесных наборов

1) сообщество игроков не позволяет любому своему члену получить плату меньше (лучше), чем некоторая величина

й = тт } Тг(Ц0, ...,Ц-, Ц*, и°+1 ,...,Ц0), г € К

иг^{иг }

2) имеет место совпадение этих величин с соответствующими значениями плат, которые получают игроки при применении равновесного набора стратегий

$ = 1г(и0,..., Ц-, и!, иР+1,..., Ц?), г € К.

Отказ от выполнения условия 2 приводит к следующему определению.

Пусть

^ _ /п О \ С* _ /С* о*\ о О* т?к О с'' О*

о* — \Б1 * > • • • > ^к*;, Б — 1Б1 > • • • > Бк/ , Б* > Б € Л > Б* ^ Б •

Определение 1.2. Будем говорить, что ситуация ^комп € } является компромиссной по отношению к векто-

рам О*, О *, если для всех г € К справедливы неравенства

С << Т !ТТКомп ггкомп гг ггкомп ггкомпч ^

Б* ^ тт ^г\и , • • • иг-1 , иг, иг+1 , • • •, ик

и^[ил ^

*

^ 1г\и , • • • иг— , иг , иг+1 , • • •, ик Бг •

Компромиссный набор стратегий сохраняет свойство устойчивости по отношению к игроку-уклонисту (в ослабленном варианте). При этом можно ожидать существование компромиссных наборов стратегий, для которых

г /ггкомп ггкомп ггкомп\ ^ г /ггО ггО ггО тт0\

1г\и ,..., иг ,..., ик ; < 1г\и1, ^2 , • • •, иг , • • •, ик/,

где Ц5, Ц1,..., иг,..., ик — набор стратегий, удовлетворяющий определению 1.1.

Принцип компромисса обобщает равновесие по Нэшу в том смысле, что при О* = Б * определение 1.2 переходит в определение 1.1.

В отличие от равновесных по Нэшу наборов стратегий единоличное отклонение какого-либо игрока от стратегии, предписываемой ему компромиссным набором, может привести к улучшению его выигрыша. Фактором, обеспечивающим устойчивость компромиссного набора стратегий, является потребность игроков

не допустить значительный выигрыш, какого-либо одного игрока. Такая ситуация складывается, например, на выборах в Думу, когда каждая политическая партия, стремясь получить максимальное количество мест, более всего опасается, что какая-либо другая партия получит более 51% голосов, обеспечив себе абсолютное большинство в Думе.

2. Дифференциальная игра нескольких лиц

2.1. Уравнения движения

Динамика системы описывается обыкновенным векторным дифференциальным уравнением

ж = /(£,х,иь • • • ,«к), (2-1)

где £ — текущее время, х = (жх, • • •, Жк) € Кк — фазовый вектор объекта, иг € Рг С Кг1 — вектор управляющих параметров г-го игрока, /: К1+п+г^ ^Гк ^ Кп — вектор-функция, описываю-

щая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем считать, что множества Рг, г € К /

ременных ж, и, • • •, ик•

2.2. Условия на правую часть дифференциального уравнения

Относительно правых частей дифференциальных уравнений (2.1) принимаются стандартные в теории дифференциальных игр предположения [1; 2]:

1) локальные условия Липшица:

для всякого К > 0 существует к > О такое, что для всех |х^| ^ К, |х^2)| ^ К, £ € [£,$], иг € Рг, г € К справедливо неравенство

|/(£,х(1),иь ... ,ик) - /(£,х(2),иь ... ,ик)| ^ к|х(1) - х(2)|;

2) условия продолжимости решения:

существует Л > 0 такое, что для всех t € [0, To], u € Pi, i € K, справедливо неравенство

|f t,x, u, • • • ,«k)| ^ Л(1 + |x|);

i

всех i € K :

min max sf t, x, u, • • •, ui, •••,uk) =

v\ui&Pi Ui&Pi

= max min sft, x, u, • • •, ui, • • •, Wk),

ui€pi u\ui^Pi

для всех {t, x} € Rn+1, s € Rn, где

Pi = P X ■ ■ ■ X Pi— X Pi+1 X ■ ■ ■ X Pk,

u \ ui --- (ul , • • • , ui-l, ui+l, • • • , uk) •

2.3. Плата игрока

i

Ii = x(T), (2.2)

где Oi'. Rn ^ R1, i € K — некоторая заданная непрерывная

функция, x( •) — реализация фазового вектора объекта, a T — момент окончания игры.

2.4. Позиционные стратегии

Свои управляющие параметры игрок формирует, основываясь на информации о текущем времени и реализовавшемся фазовом векторе объекта, при этом он не осведомлен о выборе управляющих параметров остальных игроков в этот момент времени. Понятия позиционной стратегии игрока и движения объекта, отвечающего набору позиционных стратегий, определяются аналогично [1; 2].

Определение 2.1. Позиционной стратегией г€К

Цг: [£о,Т х Лп ^ Рг.

Пусть и г [•], г € К — произвольная позиционная стратегия и А —конечное разбиение отрезка времени [£о,Т точками т8, 5 ОД,..., т0 £0.

Определение 2.2. Ломаной Эйлера хд(-,^,^,иг[•]), выходящей из позиции {£о,хо} и порожденной позиционной стратегией Цг [•], назовем всякую абсолютно непрерывную функцию хд (•), удовлетворяющую дифференциальному уравнению

хд(£) = /(£,хд(£),и1(£),... ,ик(£)), хд(£о) = хо, хд(т8) = Ит хд(£),

Ь^та -О

иг(£) = иг[т8,хд(т8)], £ € [т8,т8+1 ),5 = ОД,...

Здесь реализация вектора управляющих параметров иД •) для всех ] € К(г) = К \ {г} представляет собой произвольную интегрируемую ПО Лебегу функцию СО значениями В множестве Р].

Определение 2.3. Движением, выходящим из позиции {£о,хо} и порожденным позиционной с тратегией и г г-го, г € К, игрока, назовем всякую функцию х( •), для которой найдется последовательность ломаных Эйлера

хд (р (", £о, хо, иг [']), р 1,2,..., равномерно сходящаяся к ней на [£о, Т при условии Нт зир(т^ф1 — Др) = 0.

р^<х 3 "г

Совокупность всех движений, ВЫХОДЯЩИХ ИЗ ПОЗИЦИИ {£(), хо } и порожденных позиционной стратегией Цг [•], г-го, г € К, игрока, будем обозначать символом Х[£о, хо, иг[•]] и называть пучком конструктивных движений.

Пусть Ь С К и каждый игрок с номером г € Ь выбрал некоторую позиционную стратегию.

Определение 2.4. Множество

Х[г0,Ж0, (Ц[■], г € Ь}] = [•]]

г€Ь

назовем пучком конструктивных движений, выходящих из начальной ПОЗИЦИИ {£(), Жо } и порожденных набором позиционных стратегий (Ц [■], г € Ь} множества игр оков Ь.

Известно [1], что Х[£о,Жо, (Ц[■], г € Ь}] ^ 0 доя всех Ь С К. При этом

Х[*0, ж0, (Ц[■], г € Ь'}] С Х[*0, ж0, (Ц[■], г € Ь}],

если Ь С Ь'.

3. Построение компромиссных наборов стратегий

Пусть

с (с с \ с* (с* С*\ С С* а Т?к

О* *,♦♦♦, Ок* у, О чО1, . . . , , О*,О € Л

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и Ог* ^ О* для всех г € К.

Определение 3.1. Будем говорить, что набор позиционных стратегий Ц^о™,..., цкомп всех игроков компромиссен относительно векторов О*, О* для начальной позиции

(£*,ж*}, ■£* € [*0,Г], если I [Ж ■)] < О* V Ж о € X [**, ж*, ЦГМП,..., и?омп, ■ЦК0М п] (3.1)

и

°г* < /г[ж(0], П2)

V ж о € х[г*, ж*, иГмп,..., Ц__Г, ... цкомп ]• '

Рассмотрим множества

Мг = {ж Є Лга, а(X < 5*}, і Є К, М = {ж Є Яга,а(X < 5*, і Є К}.

Будем считать, что

Мф 0, Мг П М,= 0, і, ^ Є К.

Для всех г € К построим множества С [£о,Т х Л”" > Для которых выполнено:

2) ^гС — максимальный стабильный мост [1] в игре наведения-уклонения в момент Т, в которой множество игроков К(г) решают задачу наведения на множество МгС про-г.

Лемма 3.1. Множества ^, г € К попарно не пересекаются.

Доказательство. Допустим противное. Тогда найдутся номера г,^ € К такие, что ^ П ф 0. Пусть (£*,ж*} € ^ПЖ,- и, следовательно, (£*,ж*} € ^гС, (£*,ж*} € ^С. В силу свойства 2 множеств ^, г € К и теоремы об альтернативе [1] для начальной позиции {£*,ж*} разрешимы задачи уклонения в момент $ игроков г и ] от множеств МгС и М.1 соответственно. Пусть Ц*, Ц* — стратегии игроков г и _/, решающие указанные задачи. Тогда для всех ж0 € Х[£*, ж*, Ц*, Ц*] должно выполняться ж(Т) € МгП, так как Х[£*, ж*, Ц*, Ц* ф 0, а Мг П М. = 0. Лемма доказана.

Для всех номеров г € К определим набор стратегий (Ц|е,..., Ц—, Ц—,..., Цке) множества игроков Кг) из условия

1) ^(Т) = {ж Є Яга|{^,ж}Є ТІЇі} = Мг,

Здесь набор векторов

«(*, ж,..., и*— (£, ж, и*— (*, ж,..., 4е (*, ж)) удовлетворяет условию

тах 8(£, ж)/(£, ж, иге(£,ж)||иг,) =

Иг€Рг

= тт тах з(£, ж)/(£, ж, и,..., и,...,«;),

м\м;€Рг «г€Рг

з(£,ж) = ж — ж*, |ж — ж* | = тт |ж — у|,

уе^)'

где

иге(£,ж) | |и = (ие(£,ж), . . . ,иг-1 (^,ж,иг,иг^(£,ж), . . . ,ике(^,ж).

Заметим, что набор стратегий (Ц{е,..., Ц— , ,..., Ц6) яв-

ляется экстремальным [1] к множеству Ш*с, поэтому он решает задачу наведения на множество МгС для игроков Кг) из любой начальной позиции {£*,ж*} € Ш*с в момент времени Т.

Дополнительно предположим, что существует множество Ш С Дга+1, для которого

1) Ш(*) П Ш#) = 0, £ € [£0,Т], г € К;

2) Ш(£), £ € [£о,Т] —открытое множество;

3) Ш($) = М;

4) для любой позиции {£*,ж*} € Ш существует набор

и1 * (^ жК . . . , ик* (^, ж)

управляющих параметров всех игроков и*(£,ж) € Р, г € К, такой, что для решения ж*(•) дифференциального уравнения

ж = /(£, ж, и4£, ж,..., ик*(£, ж), ж(£*) = ж*

в любой момент времени £* € [£*,Т] выполнено включение ж(£*) € И^(£*). Очевидно, что для любого движения

ж(0 € Х[£о,жо, Ц*,..., Ц;*],

где

{£о,жо }€ Ш, и** [•]

{Г, х} € Ш,

любой вектор ИзРг, {Г, х} € Ш,

имеет место включение ж(Г) £ ^(^,4 £ [Госструктура компромиссного набора стратегий определяется следующей теоремой.

Теорема 3.1. Набор стратегий всех игроков икомп,..., Ц™мп, определенный соотношениями

является компромиссным относительно векторов Б*, Б * для любой начальной позиции {Ь*,х*} € Ш.

Заметим, что в силу определения множества Ш и леммы 1 выполнены условия

Следовательно, набор стратегий определен корректно.

3.1. Доказательство теоремы

Для доказательства теоремы требуется установить справедливость неравенств (3.1) и (3.2) для всех начальных позиций {Г*,х*} € Ш. Неравенство (3.1) следует из того обстоятельства, что по свойству 4 множества Ш и определения компромиссного набора стратегий для всех начальных позиций {£* ,х*} € Ш справедливо равенство

любой вектор из Рг иначе,

{Г, х} € Ш,

{Ь,х} € , 2 € К(г), г € К,

Шг(Г) П *) = 0,1 € [Г0, Т\,г,з € К, Ш(Г) П ш*(г) = 0,г € [г0,т\,г € к.

ГКОМП

г

• • I и^*]

ц-комп'

Тогда для любого движения

„г 1 г- ™ ггкомп Г7К0МП Г7К0МП Г7К0МП Г7К0МП1

X и € 1 иг-1 1 иг 1 иг+1 ,---,ик J

выполнено условие ж(Г) € И^(Г),Г € [ГоС- В частности, имеет место включение ж (Т) € М, которое и означает выполнение неравенства (3.1).

Неравенство (3.2) докажем от противного. Пусть неравенство нарушается для некоторой начальной позиции {Г*,х*} € Ш и номера г € К. Тогда найдется движение

\ г- VI4- ™ ГГКОМП гтКОМП гтКОМП гтКОМП]

х Ч€ х|.Г*!Х*!и1 ! иг-1 I иг+1 ,---,ик Ь

для которого х($) € Мг. Этого не может быть, так как для

всех номеров г € К в позициях {Г,х} € набор страте-

гий (Цкомп[•],... , Ц-“п[•], п[-],... , икомп[•]) определяет те же управляющие параметры, что и набор стратегий

(Ц“ Н [ ■] ,и‘и [.] ,...,ик'[ ■])

для каждого игрока г € К(г). Выше отмечалось, что этот на-

бор стратегий является уклоняющим от множества Мг в момент времени Т для любой начальной позиции из множества Для завершения доказательства заметим, что условие {Г*,х*} € Ш влечет за собой включение {Г*,х*} € Шгс при всех номерах г € К.

4. Модельная игра

4.1. Постановка задачи

На двумерной плоскости находится точка, управляемая к игроками (к ^2). Каждый игрок имеет возможность независимо от других назначать точке вектор скорости, произвольный по направлению и ограниченный по величине. Игра начинается в Г

вляемой точки. На плоскости заданы фиксированные точки М*,

имеющие соответственно радиус-векторы ¥1, г € К относительно начала координат. Эти точки в дальнейшем будем называть целевыми множествами игроков. Платой г-го, г € К, игрока служит расстояние от финального положения управляемой точки в момент времени § до целевого множества этого игрока. Неформальная цель каждого из игроков состоит в минимизации своей

ПЛЕТЫ.

Рис. 1. Модельный пример.

Рассматривается случай (см. рис. 1), когда Го = О, Т = 1, & = 3, ах = а2 = а3 = 1, тх = (0,2), ¥ = — , у'З), ¥3 = (л/ЗД), щ=й=(щ,щ), й2 = у = (у1,у2), Щ=Щ=(щ,щ), Ы ^ 1.

Дифференциальные уравнения движения управляемой точки имеют вид

Х1 = Щ+ У\+ Щ, Х2 = Щ + У2 + Щ.

имеющие соответственно радиус-векторы г", г € К относительно начала координат. Эти точки в дальнейшем будем называть целевыми множествами игроков. Платой г-го, г € К, игрока служит расстояние от финального положения управляемой точки в момент впемени ?? ло целевого множества этого игпока. НесЪоп-

Рис. 1. Модельный пример.

Рассматривается случай (см. рис. 1), когда Го = О, Т = 1, к = 3, «1 = а2 = а3 = 1, = (0,2), г2 = (-1, л/3), г3 = (\/3,1),

^1 = й = (щ,и2), й2 = V = (г>ьг>2), й3 = т = («п, т2), \щ\ ^ 1.

Дифференциальные уравнения движения управляемой точки имеют вид

XI = «1 + + ^1, Х2 = и2 + у2 + ад2.

4.2. Равновесные по Нэшу управления

Построим ситуацию равновесия по Нэшу в классе постоянных стратегий. В случае, когда игроки назначают управляемой точке постоянные по величине и направлению скорости й, V, Ш, положение управляемой точки в момент времени § = 1 определяется по формуле

г(1) = Го + й + V + гП.

Необходимые и достаточные условия равновесия по Нэшу в классе постоянных управлений для начального положения имеют вид [3,4]

тах{1,\гг - (й° - ги°)|} • -р-^= й°,

\т 1 — {V — ьг) I

тах{1, |г2 - (ьР - й°)|} • = й°, (4.1)

\Г2 — («г — Тг)\

Г1 I- /—о —о \ 11 ¥з-(й°-#) —о

тах{1, |г3 - (и - V )|} • |_з_(_0__0)| = V, .

Решение системы (4.1) получено численно:

й° = (-0,045029; 0,998986), й° = (-0,910045; 0,414509), йР = (0,988367;-0,15209).

Выпишем финальное положение управляемой точки в случае равновесных по Нэшу управлений

Х!(1) = и? + V? + ад? = 0,033292,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Хг(1) = и\+ V® + '^2 = 1,2614.

Расстояния от управляемой точки в конечном положении до целевых множеств игроков следующие: (/г = |Гг — г(Т)|)

Д = 0, 7398; /2 = 1,1354; /3 = 1, 7186.

На рис. 1 дана геометрическая иллюстрация приведенных ниже численных результатов (табл.1).

В силу динамики исследуемой системы игрок-уклонист не может улучшить свой результат, даже если он будет применять позиционные стратегии. В частности, пусть игрок-уклонист использует минимаксную (против остальных игроков) позиционную стратегию наведения на свое целевое множество.

„г . Г\ — Г и) нг . Г2 — Г и)

йв[г,т) = * ув[і,т) =

\гі-ту і,хп \т2-т\'

(4.2)

N - г(г)|'

Результаты такого уклонения приведены в таблице 1.

Таблица 1

Игрок Равновесие Уклонение

Первый 0,7393 0,7398

Второй 1,1354 1,2123

Третий 1,7186 1,7928

Таким образом, единоличное уклонение игрока от равновесного набора стратегий не привело к улучшению его платы.

4.3. Компромиссный набор стратегий

В качестве компромиссных оценок возьмем векторы

5* = (0,13; 0,9; 1,4), 5* = (0,57; 1,131; 1,71).

Заметим, что верхние оценки (вектор 5* ) плат для каждого из игроков лучше (меньше), чем тот результат, который этот игрок получает в случае равновесия.

Построим терминальные множества. Полагаем

Mi = |(ж,у)|^/ж2 + (у - 2)2 <0,131 ,

М2 = |(ж,2/)|^/(ж + I)2 + (у - \/3)2 < 0,9 j ,

М3 = |(ж,2/)|\/(ж - \/3)2 + (у - I)2 < 1,4 ,

М4 = |(ж, у)|^/(ж - гСх)2 + (у - гс,/)2 < 0,00l| ,

где гс = (гсх, Г Су) = 0,09147721; 1,442277962). Заметим, что

p(Ti,rc) = 0,565174, р(г2,гс) = 1,12929, р(г3,гс) = 1,69914.

Непосредственно проверяется, что Mi П Mj = 0, i,j = l,2,3. Покажем, что стДж, у) ^ S*, г € {1,2,3} для всех (ж, у) € M. Действительно,

<71 (ж,2/) = р((ж,2/),п) < р((х,у),гс) + р(п,гс) = = 0,001 + 0,565174 < 0,57.

Аналогично проверяются два остальных неравенства.

Таким образом, множества V, Vi, Vj, V3 обладают всеми свойствами, перечисленными в разделе 3. В пространстве позиций построим множества (г = 1, 2, 3)

Wi{£,ж,у) = {(£,ж,у)|<^(£,ж,у) < 0, t € [0,1]},

где

X, у) = \Jx2 + {у - 2)2 + (1 - t) - 0,13,

X, у = \J{x + I)2 + (у - \/3)2 + (1 - t) - 0,9,

<P3(t, X, у) = \/{х- \/3)2 + (у - I)2 + (1 - t) - 1,4.

Очевидно, что Шг(1) = М^, г = 1, 2, 3.

Для всех в € Я, |в| = 1 справедливы равенства

дрх

= тах тт в ■ (и + V + т) =

«|^1 |ч7|^1,|гй|^1

тіп тах^ • (й + V + ъо) = —1, тТ|^1,|го|^1 |й|<1

= тах тіп « • (й + V + Ш) =

'г)|^1 |гб|^1,|го|^1

тіп тах « • (й + V + Ш) = — 1,

гМ

тах тт з ■ (и + V + IV) =

й>|^1 |г)|^1,|«|^1

тіп тах И ■ (й + V + Ш) = — 1,

Тогда множества Щр, г = 1, 2, 3 являются соответствующими максимальными стабильными мостами.

Полагаем (£ € [0,1])

IV = |(£,ж,у) | ]/(х- гСх)2 + (у ~ г су)2 — 1,5(1—£) —0,001 < о|.

Непосредственно проверяется, ЧТО Ш(1) = М, Ш(£) П Ш(£) = 0, £ € [0,1], г = 1,2,3, а также что набор управляющих параметров всех игроков, обеспечивающий свойство 4 множества Ш для всех позиций (£*,ж*,у*) € Ш, <1, следует выбирать из условия

«*(£*, ж*, у*) + ¥*(£*, ж*, у*) + Ш*(£*, ж*, у*) =

>С-П|-0,00014^-^ ,|>#ш (4.3)

1 - г* / кс -о, |гс-г*| <0,001,

где г* = (ж*,у*). Полагаем

й*(£,ж ,у), {і, ж ,у}ЄЇ7,

^°мо[.] = < йй^ж.у), {і, ж, у} Є і = 1,2,3,

любой вектор |й| <1, иначе;

любой вектор |г>| < 1, ад*(£,ж,у),

( £,ж,у),

у*( *,ж,у), ¥-е( £,ж,у),

иначе;

{£,х,у} € Ш,

{£,х,у} € Ш, .?' = 1,2,3,

Шкошг;

{£,х,у} € ^

{£,х,у} € Ш, .?' = 1,2,3,

^ любой вектор |гу| < 1, иначе.

В силу леммы 3.1 набор стратегий (^к°™, укомп, ^имп) оп_ ределен корректно. По теореме 3.1 он является компромиссным относительно векторов

для любой начальной позиции, принадлежащей множеству Ш. Набор стратегий всех игроков, определяющий векторы управляющих параметров из условия (4.3) для позиций, принадлежащих множеству Ш, и произвольным образом для остальных позиций, обеспечивает для каждого из игроков выполнение оценки сверху для его платы. Однако этот набор стратегий может оказаться неустойчивым по отношению к игроку-уклонисту. Это означает, что игрок-уклонист может выбрать такое позиционное управление, которое позволит ему получить значение платы лучше (меньше) соответствующей нижней компромиссной оценки.

Действительно, пусть для всех позиций из множества Ш игроки назначают свои управляющие воздействия из условия (4.3). Вне этого множества принимается, что и = V = ад = 0. Выберем начальную позицию (0; 0; 0) € Ш.

Рассмотрим последовательно следующие ситуации:

а) среди игроков нет уклонистов;

б) первый игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;

в) второй игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;

г) третий игрок уклоняется от этого правила, прицеливаясь на свое целевое множество.

5* = {0,13; ОД 1,4), 5 * = {0,57; 1,131; 1,71)

Значения плат для таких ситуаций приведены в табл. 2, а траектории движения точки для всех перечисленных ситуаций — на рис. 2.

Рис. 2. Траектории точки в ситуациях а-г

Таблица 2

Оценка Игроки

Первый Второй Третий

Компромиссная оценка снизу 0,13 0,9 1,4

Величина платы в ситуации а) 0,566152 1,12948 1,69855

Компромиссная оценка сверху 0,57 1,131 1,71

Величина платы при уклонении 0,456535 0,672874 0,875904

Оценка Игроки

Первый Второй Третий

Компромиссная оценка снизу 0,13 0,9 1,4

Величина платы для компромиссной ситуации 0,566152 1,12948 1,69855

Компромиссная оценка сверху 0,57 1,131 1,71

Величина платы при уклонении 0,456535 0,9088014 1,40733

Рис. 3. Траектории точки при компромиссном наборе стратегий

Таким образом, результаты игроков в ситуации а) укладываются в верхние и нижние компромиссные оценки. Однако уклонисты (кроме первого) могут получить лучшее значение платы, чем соответствующие нижние компромиссные оценки.

Такой результат невозможен в случае компромиссного набора стратегий. Пусть, например, игроки-уклонисты в качестве стратегии уклонения выбирают прицеливание на свое терминальное множество. В табл. 3 приведены значения плат игроков для таких ситуаций, а траектории движения точки показаны на рис. 3 Заметим, что компромиссный набор стратегий является универсальным для всех начальных позиций из множества Ш. В случае, когда этот набор строится для конкретной начальной позиции, компромиссные оценки, как нижние, так и верхние, могут быть реализованы более жестко.

Список литературы

1. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1973. 455 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. 286 с.

3. Лутманов С. В. Курс лекций по методам оптимизации: Учебное пособие. Ижевск: Изд-во РХД, 2001. 367 с.

4. Лутманов С. В. Компромиссное управление в конфликтно-управляемых динамических системах // Проблемы механики и управления: Межвуз. сб. науч. трудов. Пермь, 2001. С. 48-59.

5. Лутманов С. В. Необходимые и достаточные условия равновесия по Нэшу в игре в перемещениях // Проблемы мех. и управления: Межвуз. сб. науч. трудов. Пермь, 2002. С. 4-10.

i Надоели баннеры? Вы всегда можете отключить рекламу.