Научная статья на тему 'Построение сильного равновесия в дифференциальной игре многих лиц'

Построение сильного равновесия в дифференциальной игре многих лиц Текст научной статьи по специальности «Математика»

CC BY
325
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / РАВНОВЕСИЕ ПО НЭШУ / СИЛЬНОЕ РАВНОВЕСИЕ / DIFFERENTIAL GAME / NASH EQUILIBRIUM / STRONG EQUILIBRIUM
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Зенкевич Николай Анатольевич, Зятчин Андрей Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Построение сильного равновесия в дифференциальной игре многих лиц»

УДК 518.9 + 517.9 ББК 65.050.2

ПОСТРОЕНИЕ СИЛЬНОГО РАВНОВЕСИЯ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ МНОГИХ ЛИЦ1

Зенкевич Н.А.2, Зятчин А.В.3

(Высшая школа менеджмента Санкт-Петербургского государственного университета, Санкт-Петербург)

В статье предложена техника нахождения ситуации сильного равновесия в дифференциальной игре с помощью специальной ска-ляризации векторного критерия. Сформулированы достаточные условия существования сильного равновесия. Приведен пример несимметричной игры двух лиц, в котором ситуация сильного равновесия найдена в явном виде.

Ключевые слова: дифференциальная игра, равновесие по Нэшу, сильное равновесие.

Введение

В настоящее время известно несколько концепций сильного равновесия [3, 7, 9]. При этом в каждом случае под сильным равновесием понимается ситуация, в определенном смысле устойчивая относительно коалиционных отклонений игроков. Этот принцип оптимальности исследован в широких классах игр в нормальной и развернутой формах (см. например [3, 4, 9]). Основным недостатком концепции сильного равновесия является то, что оно существует достаточно редко.

1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. -2010. - Т. 2. № 2. - С. 42-65».

2 Николай Анатольевич Зенкевич, кандидат физико-математических наук, доцент (zenkevich@gsom.pu.ru).

3 Зятчин Андрей Васильевич, кандидат физико-математических наук, ассистент (zyatchin@gsom.pu.ru).

При исследовании дифференциальных игр часто используется принцип оптимальности Беллмана [1, 2, 5, 6, 9]. В этом случае задача определения оптимального значения интегрального функционала сводится к решению экстремального уравнения в частных производных. С помощью такой техники в ряде случаев удается найти равновесие по Нэшу и парето-оптимальное решение [2, 10]. При этом в исследуемой модели необходимо дополнительно учитывать условия существования и единственности решения системы дифференциальных уравнений, описывающей динамику игры, гладкость функции Беллмана, а также функций мгновенного и терминального выигрышей игроков.

В данной работе предлагается следующая техника нахождения сильного равновесия в дифференциальной игре. Для каждой коалиции с помощью специальной свертки осуществляется переход к экстремальной задаче со скалярным критерием, зависящим от набора параметров. Формулируются достаточные условия существования сильного равновесия в дифференциальной игре в виде условий на параметры свертки. Использование теоремы продемонстрировано на примере линейно-квадратичной несимметричной игры двух лиц. Для этой игры сильное равновесие удалось построить в явном виде на основе решения уравнения в частных производных первого порядка специального вида.

1. Определение сильного равновесия

Определим дифференциальную игру Г(х0, Т — ¿0) из начального состояния Хо и конечной продолжительности Т — ¿0. Здесь ¿о ^ 0, Т ^ ¿о — моменты начала и окончания игры соответственно [2, 5, 8]. Множество игроков в игре Г(х0,Т — ¿0) обозначим через N = {1,... ,г,... п}.

Предположим, что динамика изменения состояния игры Г(х0, Т — ¿0) имеет вид:

(1) Х(£) = f [£,х(£),«1 (£),..., «п(^)] , х(^ )= Х0,

где х(Ь) € Е, х0 — известное начальное состояние игры, щ(Ь) —

управление игрока г € N в момент времени ¿. Здесь щ(1) €

Ц С Л, П Ц = иN С Лп. Предположим, что функция

f [£, ж(£), ^(¿),..., ип(£)] — непрерывно дифференцируемая на [¿о,Т] х Л х иN.

Для каждого игрока г € N рассмотрим интегральный функционал с терминальным выигрышем вида:

где иг() представляет собой непрерывную функцию иг(£), £ € [£0,Т ]. Будем предполагать, что функции

дг [£, ж(£), и1(£),..., ип(£)] и дг [ж(Т)] являются дифференцируемыми в области определения. Предполагается, что игрок г € N стремится максимизировать значение функционала 3г (жо,И1(-), . . . ,Иг(-), . . . ,и„(-)) по иг (■).

Пусть 5 С N — произвольная коалиция в игре Г(жо). Обозначим через us( ) = |и%( )}%е5 стратегию коалиции Б. Стратегию дополнительной коалиции N\5 будем обозначать через UN\s ( ) или U-s(■).

Определение 1. Ситуация uN (0 = (и^(-),и|(-),...,иП(-)) называется сильным равновесием в широком смысле в игре Г(ж0,Т — £0), если УМ С N. Уим(■) не выполнено:

г€М

3%(жо, и1 (■), и2('), . . . ,и„(-)) =

т

У дг [£,ж(£),и1(£),и2(£),... ,и„(£)] ^ + % [ж(Т)] ,

Уг € М

т

3г(ж0, иМ(), и—М(,))

/

дг £,ж[м](£),им(£),и—м(£)

т

+дг ж[м](Т) ^ / дг [¿,ж*(£),иМ(£),и

/

(£)] ^ + дг [ж*(Т)]

3г(ж0,им (£),и—м (£))

и Зіо Є М, такой что:

т

Ло (Хо,им ( ■ ),и_М ( '))= I (Ло ¿,Ж1М|(£),им (¿),И- м (і)

*0

т

где

х[м](Т) > / дго [¿,х*(і),иМ(і),и-м(і)] ^+5го [Х(Т)] =

*0

= Зго (х0, им( ' ), и-М( ' )),

X[м] (і) = f кж[м](і),им(і), и-м(і)! , х[м](іо) =

Хо,

ж*(£) = / [¿, ж*(£), и1(£),..., и^(£)] , ж*(£0) = ж0.

Множество всех ситуаций сильного равновесия в смысле определения 1 в игре Г(ж0,Т — ¿0) будем обозначать БМЕ (Г(ж0,Т — £0)).

Рассмотрим векторы

[п,%]

Лм = (лї1’г1,...,ліга’г1,...,л|гп’г^ Є Е

л [п,%] ' / ' \ |П,г| -|

где =0 при ] = г и Аг =1.

Лемма 1. Для того чтобы ситуация

[п,г]

uN( ■ ) = (и1(■ ), и2(■ ),..., <(■ )) € БМЕ (Г(ж0,Т — ¿0)),

т. е. была сильным равновесием в смысле определения 1 достаточно, чтобы для любой коалиций Б С N существовал такой номер € Б, что для любой стратегии ^ ( ■ ) = ^ ( ■ ) этой коалиции выполнялось неравенство:

(2) ^Л1га’г°]^(жо,и5( ■ ),и-5( ■ )) >^ЛГ’г°^(хо,и^( ■ ),и-5( ■ )).

Кг°]

г=1

г=1

Доказательство. Предположим противное, т. е. условия леммы 1 выполнены, но ситуация uN( ■ ) = (и1(■ ), и2(■ ),... , иП(■ )) не является сильным равновесием в смысле БМЕ (Г(ж0, Т — ¿0)). Тогда существует коалиция М и стратегия им ( ■ ), для которых выполнено:

(3) Г3г(ж0, им( ■ ),и—м( ■ )) ^ 3г(ж0,им( • ),и—м( • )),Уг €М;

\3г0 € М: 3%о(ж0,им( • ),и—м( • )) >3%о(ж0,им( • ),и—м( •)).

Согласно условиям леммы, неравенство (2) выполнено для любой коалиции, в том числе и для коалиции М. Следовательно, существует такой номер ¿м € М, для которого справедливо неравенство для Уим ( ■ ) = им ( ■ ):

П

(4) £ Агга,гМ]3г(ж0,им( ■ ),и—м( ■ )) >

г=1

п

> Е Агп,г° ]3г(ж0,им( ■ ),и—м( ■)).

г=1

По определению вектора А[п,г°] из неравенства (4) следует:

(5) 3г°(ж0,им( ' ),и—м( ' )) > 3г°(ж0,им( 0,и—м( ' )). Поскольку ¿м € М, то неравенства (3) и (5) несовместны. Следовательно, предположение неверно, что доказывает утверждение леммы.

Замечание 1. Число игроков п — конечное. Поэтому существование номера из леммы 1 можно установить простым перебором векторов А[п,%], г = 1, 2,..., п для каждой коалиции Б С N. При этом строгое неравенство будет иметь место, если удастся показать, что набор стратегий uN( ■ ) = (и1(■ ), и2(■ ),..., иП(■ )) является единственным, доставляющим максимум функционалу

3г% (ж0^( ' ^ гС? € Б.

Введем следующие обозначения: дс [¿, ж(£),им(¿)] =

^2 дг [¿,ж(£),им(¿)] , дс [ж(£)] = ^ дг [ж(£)] . Используя концеп-

гес гес

цию решения, предложенную Л.А. Петросяном [9], сформулируем другое определение сильного равновесия для дифференциальной игры.

Определение 2. Ситуацию и^ ( ■ ) = (и1( ■ ),и2( ■ ),...,ип( ■ )) будем называть сильным равновесием в узком смысле в дифференциальной игре Г(ж0, Т — ¿0), если следующие неравенства выполнены для всех коалиций Б С N и стратегий ис ( ■ ):

т

Зе(жо,и^( ■ )) = !де [і, ж-(і), и! (і),... ,и-(і),.. .,<(£)] ^+

^£ +

*0 т

+?Є [ж-(Т)] де г,ж[е] (і),«1 (і),... ,иг(і),... ,<(£)

*0

+?5 Ж[S](T) = Зе (жо,ие ( ■ ),и-е ( ■ )),

где Б = {і}, і Є N;

Зе (жо,и^ ( ■ )) = т

= J [і, Ж- (і), -1 (і), . . . , и- (і), . . . , и- (і), . . . , -га(і)] ^+

+55 [ж-(Т)] ^

*0

т

» ¡де

*0

і, ж^і), и1(і), ..., -иг(і),..., — (і),..., иП(і)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^£+

Ж[е](Т) = Зе (жо,и5 ( ■ ),и-е ( ■ )),

где Б = {і,і}, і = і, і,; Є N;

т

35(жо,и^( ■ )) = У де [¿,ж*(і),и!(і),и2(і),... ,иП(і)] ^+

*0

т

qs [x*(T )] gs ^,xis|(i),ui(i),u2(t),. ..,un(t)

to

x[s](T) = Js [xo,us( ■ ),u-s( ■ )] ,

dt+

+qs

где S = N,

x[s](t) = f t,x[s](t),us(t),u-s(t) , x[s](to) = xo,

x*(t) = f [t, x*(t), u1(t),..., u^(t)], x*(to) = x0.

Далее для неравенств из определения 2 будем использовать

более короткую запись:

Js [xo, u*(■ )] ^ Js [xo, us( ■ ),u-s( ■ )] ,

x[s](t) = f t,x[s](t),us(t),u-s(t) , x[s](to) = xo,

x*(t) = f [t, x*(t),u*(t)], x*(to) = xo,

V S C N, S = 0, Vus( ■ ).

Множество всех ситуаций сильного равновесия в смысле определения 2 в игре r(xo,T — to) будем обозначать

SPE (r(xo,T — to)).

Лемма 2. Для каждой игры r(xo, T — to) имеет место следующее включение:

SPE (r(xo,T — to)) C SME (r(xo,T — to)).

Доказательство. Проведем доказательство от противного. Предположим, что ситуация uN( ■ ) = (u1(■ ), u2(■ ),..., u£(■ )) в игре r(xo,T — to) является сильным равновесием в смысле определения 2, но эта ситуация не является сильным равновесием в смысле определения 1. Тогда существует коалиция M С N и такая стратегия uM( ■ ) коалиции M, для которых выполняется:

,[s].

Ji(xo,uM ( ■ ),u-M ( ■ )) ^ Ji(xo,uM ( ■ ),u-M ( ■ )), Vi G M ;

3io G M : Jio(xo,uM( ■ ),ulm( ■ )) > Jio(xo,uM( • ),ulm( • )).

Рассмотрим сумму выигрышей игроков коалиции М:

£ 3г(ж0,иМ(' ),и-М(' )) < £ ^(ж0,иМ(' ),и-М(' )).

ІЄМ

іЄМ

Поэтому ситуация ( ■ ) = (и1(■ ),и2(■ ),..., «П( ■ )) не является сильным равновесием в игре Г(ж0,Т — ¿0) в смысле определения 2. Противоречие и доказывает справедливость утверждения леммы.

Докажем следующую теорему, используя технику динамического программирования.

Теорема 1. Если в игре Г(ж0,Т — ¿0) для каждой коалиции Б С N. Б = 0, существует номер е Б и непрерывнодифференцируемое на [0, Т] х К решение системы экстремальных дифференциальных уравнений в частных производных

где для всех Б С N максимум в левой части (6) достигается на единственном наборе

где ф*(£, ж) е Цг, г е N — непрерывные на [¿0,Т] х К функции, тогда набор {м*(£) = ф*(^ ж) е Цг, г е N £ е [¿0,Т]} является сильным равновесием в игре Г(ж0, Т — ¿0).

= + / [*,ж,ф&(*,ж),ф-5(^,ж)] У№,ж) +

п

+ Е ЛГ’г°[^ ж ф&ж) & ж)] = 0,

і=1

п

V^(Т,жИ (Т)) = Е Л!п,і°|жИ(Т)

і=1

(¿,ж) = (ф*(¿,ж) є Ці, і Є Б} , фМ (¿,ж) = (ф& (*,ж),ф-5 (і,ж))

Доказательство. а) Предположим, что условия теоремы 1 выполнены для максимальной коалиции N. Тогда существует номер ім Є N и единственный вектор фМ(¿, ж) такие, что:

ФМ (¿,ж) =

ащшах <| / [¿,ж,им(¿)] ](і,ж) + £ ^1П’г° [¿,ж,им(¿)] [> .

Предположим, что коалиция N выбрала отличную от ФМ (¿, ж) произвольную стратегию им( ■ ) е Цм, реализующую траекторию ж(£). Поскольку вектор фМ(¿,ж) — единственный, имеет место строгое неравенство:

(7) Vм'(¿,ж) + / [¿,ж,им(¿)] '(¿,ж) +

П

Е Л1”’г0 ]дг [¿, ж, им(¿)] < 0, г=1 ^¿(¿) = / [¿,ж(£),иМ(¿)] , ж(^) = ж0.

При этом:

(8) Vім1 (¿,ж) + / [¿,ж,фМ(і, ж)] ^ ^жН

Лм 1,

^, ж) п

Лп,і°° К

+ Е Сг° & [¿, ж, Фм(¿, ж)] = 0, і=1

ж *(£) = / [¿,ж *,ФМ (¿,ж *)] , ж * (¿о) = жо Рассмотрим интегралы выражений (7)-(8):

т

п

I , [п.г° 1 г.

, ^ і - 1

*0 1

[м1(Т,ж(Т)) - V[м 1(іо,ж(іо)) < 0, т / п лт \

/ ( Е Л1п,г° ^ [¿, ж, Фм(¿, ж)П

/ Ліп,і° 1^г [¿, ж, им(¿)] ^

*0 Чі=1

[м 1 (Т, ж * (Т)) - V [м1(іо,ж * (¿о)) = 0,

следовательно,

Т ( п N \

/ (Е ліп,і° ^ [¿,ж,Фм(¿,ж)п *0 ^=1 '

+V[м1 (Т, ж * (Т)) - V [м1(£о,ж * (¿о)) >

т / п лт \

> / (Е ліп,і° 15і [¿,ж,им(¿)] I *0 ^=1 '

+V[м 1(Т,ж(Т)) - V[м 1(іо,ж(іо)).

Поскольку

V[м1(Т,ж *(Т)) = Е Л!п.г° ^ [ж * (Т)],

п

°

*=1

п

V[м1(Т,ж(Т)) = Е л!п,г° ^ [ж(Т)],

V[м 1 (¿о, ж(іо)) = V[м1(іо,ж * (¿о)) = V[м 1 (¿о, жо),

і=1

¿о,ж-(Ьо)) = Vі '(¿о,ж (¿о)) = Vі '(¿о

имеем:

. т

[п.г°1

Е ^Л- | у & [¿,ж, ФМ(¿, ж)] ^ + д* [ж *(Т)]| >

т

> Е 1 |У 4* [¿,ж,им(¿)] ^ + д* [ж(Т)]

Окончательно получаем:

п

(9) Е Л*п.*°13* [жо,и*( ■ )] > Е Л*п.*°13* [жо,им( ■ )]. і=1 і=1

п

б) Предположим, что условия теоремы 1 выполнены для произвольной коалиции Б С N Б = N. Тогда существует номер ¿о е Б и единственный вектор ф*(¿,ж) такие, что:

ф4((,ж) = а^шах{/ [¿,ж,ио(¿),ф 1 4(¿,ж)! V.141(¿, ж)+

«в I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г=1

где вид функций, входящих в стратегию ф 1 о(¿, ж), установлен в п. а).

Предположим, что коалиция Б выбрала отличную от ф* (¿, ж) произвольную стратегию и* ( ■ ) е Ц*, реализующую траекторию

ж[О] (¿):

ж|41(() = / ¿,ж|41((),ио(¿),ф-й(¿,ж) , ж|41((0) = ж0.

Поскольку вектор фО(¿, ж) — единственный, то имеет место строгое неравенство:

(10) у(|,?|(г,ж|01) + / кжи,1«(¡),ф14-(¡,ж)1 уХ°'|(г,ж|4'|)+

+ Е Л:

(, ж|4], и*((),ф 14(¿,ж)

< 0.

г=1

При этом: (11)

V141 ((,ж 1) + / [(,ж *,фМ((, ж)] к|41((,ж 1) +

п

, Кг°1

+ £ ЛгП,г0 дг [(, ж *, фМ((, ж)] = 0,

г=1

ж*(() = / [(, ж*,фМ((, ж)], ж 1 (¿0) = ж0 Рассмотрим интегралы выражений (10)-(11):

Т - \

£л5п,г01дг (,ж|41,ио (¿),ф-4 (¿,ж)

чг=1

+У|41(Т,ж|41 (Т)) — V[41((0,ж[41 (¿0)) < 0, п\

Ел!п,г01 дг [(,ж *,фМ((,ж)П

Т

чг=1

+У|41 (Т, ж * (Т)) — V|41 (¿0, ж * (¿0)) = 0. Следовательно,

Т / п .3 \

/ Е л!п’г0 1 дг [¿,ж*,фМ (¿, ж)] 1

+У|41 (Т, ж * (Т)) — V|41 (¿0, ж * (¿0)) >

Т

^Ел'п’!01 дг ¿,ж|41 ,ио(¿),ф-4(¿,ж)

чг=1

+У |41(Т,ж|41(Т)) — V ^С^ж141^)).

Поскольку

V|41(Т,ж *(Т)) = £ л'п’г° ^ [ж *(Т)]

г=1

п

V|41(Т,ж|41 (Т)) = Е л'п’г° ]qí ж|41(Т)

г=1

V ^(^ж^о)) = V ^ж * (¿0)) = V|41 (¿о,жо),

имеем:

Т

Е|л;

|п,г01

дг [¿,ж *,фМ(¿, ж)] ^ + % [ж *(Т)] > ) >

г=1

Т

£|л

г=1 62

|п>г01

¿,ж|41 ,ио (¿),ф * 4 (¿,ж)

ж|41 (Т)

<¿0

д

Окончательно получаем:

П П

(12) Е Л1П’г° ^ [Ж°’и *( ^ )] > Е Л1П’г°^ [ж°,и5(• ),ф-5(^,ж)] .

г=1 г=1

Из неравенств (9) и (12) следует, что для любой коалиций 5 С N,

Б = 0, существует номер ¿¡^ е 5 такой, что для любой стратегии

( • ) = ( • ) коалиции Б выполняется неравенство:

П П

Е Л!га’г° ]Зг(х°> ( • ),и-5( • )) > Е Л!га’г°'^(ж°,и®( • ),и-£( • )).

г=1 г=1

Следовательно, по лемме 1 ситуация ( • ) является сильным рав-

новесием из 5РЕ (Г(ж°, Т — ¿°)).

2. Пример

Проиллюстрируем применение теоремы на примере, предварительно исследовав свойства уравнения в частных производных следующего вида:

(.3) =2 + .рм)’ +

дУ (¿,ж) дУ (¿, ж)

+ П2 —тт^ж + ае —+ гф = 0 дж дж

V (Т, ж) = Пзж,

где а, Ь, п1, П’, П3 — заданные параметры, Ь = п2, г(£) —

непрерывно-дифференцируемая функция на отрезке [¿°,Т].

Лемма 3. Уравнение (13) имеет на отрезке [¿°,Т] единственное решение V(¿, ж), причем не зависит от а, Ь,

П1, г(£) и имеет вид:

дУ &ж) = ПзеП2 (Т-*)

дж

Доказательство. Введем следующие обозначения:

ду (¿,ж) = р дУ (^,ж) = а

( ) д£ р дж ^

Запишем уравнение (13) с учетом (14) в виде:

(15) р + пі?2 + П2жд + ае6*д + г(і) = Е (і, ж, р, д) = 0, где

Ер + Е2 = 1 + (2пі? + П2Ж + ае6*)2 = 0.

Зададим граничное условие V(Т, ж) = пзж в параметрическом виде:

(16) ¿о(т )= т, жо(т )= т, Мо(т ) = пзт, Ро(т ), до(т).

В результате определена задача Коши (15)-(16), где р0(т) и до(т) связаны условиями:

Е [¿о(т ),жо (т ),ро(т ),до(т)] =0,

(17) ^

¿Уо __р ¿¿о + „ ¿хо

¿г — р° ¿т "Г" У° ¿г .

Из (17) имеем:

р° (т) + П1<7о(т) + П2 т^°(т) + ае6Т д°(т) + г(Т) = 0,

Пз = 9°(т),

следовательно, д°(т) = пз, р°(т) = —ае6Тпз — г(Т) — пщ2 — П’Пзт.

Задача с граничными условиями (15)-(17) имеет единственное решение, если из данных граничных условий следует:

(18) ^ е |=°-

Проверим выполнение условий (18):

1 — ^2п1^° + П’Т + ае6Т) 0 = 1 = 0.

Условие (18) выполнено, следовательно, задача (15)-(17) имеет единственное решение.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассмотрим теперь систему характеристических уравнений:

- = Е =1 ^ Е = 1,

(19) = 2пі? + П2Ж + ае6*

аі

¿V

(20) — = рЕ„ + = р + 2пі?2 + П2?ж + ае6*д

аі

(21) = -(Р^У + Я) = -аЬе% - г'(*)

^ = -(<?ЕУ + Еж) = -П24

с условиями:

¿о(т) = Т, Хо (т) = т, Ро(т) = Пзт,

Ро(т) = -ае6ТПз - г(т) - П1П2 - П2Пзт, 4о(т) = пз. Тогда,

(22) 4 = пзеП2(Т-4).

Подставляя (22) в (19), получим обыкновенное дифференциальное уравнение:

= П2Х + 2п1ПзеП2(т 4) + ае6*, Хо(т) = т,

которое имеет единственное решение:

(23) х = е-П2(т-*)т + ^ (е-П2(т-*) - еП2(т-*Л +

П2 ^ '

+ ("е6* - е6Те-П2(т-*Л .

Ь - П2 V У

Подставив (22) в (21), получим обыкновенное дифференциальное уравнение:

^ = -аЬе%еП2(т-4) - г'(*) = -г'(*) - аЬпзе6*еП2(т-4),

Ро(т) = -ае6Тпз - г(Т) - П1Пз - П2Пзт, которое имеет единственное решение:

(24) р = -г(£) - аПз (Ье6*еП2(т-4) - П2е6Т) - П1 Пз - П2Пзт.

Ь - П2 ' '

Подставляя (22), (23), (24) в (20) и приведя подобные члены,

имеем следующее уравнение:

^ = -г(г) + П1П2е2п2(Т-4), И)(т) = пзт.

Откуда,

¿V = (п1Пзе2п2(Т-ь) - г(£)) ^, Уо(т) = пзт,

*

V = пзт ^ У (^П1Пзе2п2(Т-?) - г(£)) ^.

т

Поскольку £ £ [¿о,Т], имеем:

т

V = пзт - У (п1П2е2п2(Т-?) - г(£)) ¿£,

/2 ^ V = пзт - -^е2П2(т-*)

2п2

т

+ У

і

т

(25) V = пзт - ^ (е2п2(т-4) - 1^ + I г(£)^.

*

Рассмотрим систему, составленную из уравнений (23) и (25):

^ х = е—П2(Т—*)т + П1П3 (е-п2(т-4) ___ еп2(т—*)) +

+5-^ (е6* - е6Те-П2(т-4)) ,

V = пзт - (е2п2(т-4) - 1) + / г(£К.

*

Исключим из системы параметр т. Для этого выразим т из первого уравнения:

т = еП2(Т-*)х-П1Пз (1 - е2П2(т--^ (е6^^ - еьт)

П2 V У Ь - П2 V /

Полученное выражение подставим во второе уравнение системы, получим

(26) V = пзеП2(т-4)х + ^ (е2п2(Т-4) - 1) -

2п2 ^ /

т

-^^ (е6*еП2(т-*) - е6Т) + / г(^.

Ь - п2 ' у 7

*

Подстановкой (26) в (13) непосредственно проверяем, что (13) превращается в тождество.

Из (26) следует, что

V* = пзеП2(т-4).

Пример 1. Рассмотрим игру Г(хо,Т - ¿о), где N = {1, 2}, п = 2, динамика (13) имеет вид:

(27) х(£) = ах + Ь1и1 + Ь2и2, х(£о) = хо.

Пусть целью игрока 1 является максимизация функционала:

(28) 7{1} [жо,и1,И2] =

т

*0

ж2

—и2 - и2 + и1х + и2х —— + г[1](£)

а целью игрока 2 — максимизация функционала:

(29) 3{2} [жо,иь«2] =

т

*0

3

-2и1 - и2 + 2и1х + и2х - - х2 + г[2](£)

где г[1](£), г[2](£) — непрерывные функции.

Покажем, что в игре (28)-(29) существует сильное равновесие в смысле определения 1. Согласно теореме 1, для этого достаточно для каждой коалиции Б С N, Б = 0, найти номер г4 £ 5 и непрерывно-дифференцируемую функцию V[4] (¿, х) такие, чтобы максимальное значение левой части уравнения (6) достигалось на единственном наборе (¿,х).

Рассмотрим коалицию Б = {1, 2} = N и вектор

Уравнение (6) принимает вид:

(30) К[М](£, х) + шах {(ах + Ь1и1 + Ь2и2) ](£, х) +

^1^2 I

+ дК»° ] ^-^2 - и2 + М1 х + и2х - + Г[1](£)^ +

+л2га’г° ] ^-2и2 - и2 + 2и1х + и2х - 3х2 + г[2](£)^ | = 0,

П

V[м](Т,ж[м](Т)) = Е А^]х[М](Т),

г=1

или

К[М] (¿, ж) + ша^ (аж + Ь1и1 + Ь2и2) РХ[М1 (¿, ж) — ^1^2 I

— (Л^] + 2А2га’^]) п\ — (Л^] + Л2п’г^]) и2+ + (А^] + 2л2п’г^]) жиі + (А^] + Л2га’^]) жи2-

— ( у А^1 + 3Ж- А^1 ) +

+ (г[1](£)л1га’г°] + г[2](£)л2п’г° ])} =0, V[м](Т,х[м](Т)) = (л^] + л2"М°]) х[м](Т).

Определим максимум функции в фигурных скобках. Значения управлений, на которых достигается максимум в левой части уравнения (30), получаем из условий первого порядка:

Ь^^х) - 2 (л^] +2л2тМ°]) ф1 (¿,х)+

+ (а^1 +2А2га’г^]) ж = 0, Ь2^(£,ж) — 2 (л^1 + А2га’^]) Ф2(і,ж) +

+ (А^1 +2А2га’г^Г) ж = 0.

Откуда,

(31)

Ф1 (¿, х) =

Ф2(£,х) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 Л

[п,4° ]+2Л!,п’4° ]

I [п,г° ] [п,г° ]

2( л[ ’0 ]+л2 ’0 ]

^[М ](£,х) + §

Условия второго порядка зависят только от параметров свертки:

-2 ( л1п,‘0

[п,*°] + 2л[га’*°]

< 0

(32)

-2 л1

‘[га’*°] + 2л[га’*°]

-2 л1

‘К*°] + л[га,*°]

= 4 ( л'га’г°] + 2л2га’г°]) (л^] + л2га’г°]

> 0.

Следовательно, при выполнении условий (32), набор функций (31) будет единственным, на котором достигается максимум левой части уравнения (30).

Подставляя (31) в (30), имеем:

(33) ^[М](£,х) + {ах + Ьтг + ^

,х) +

+

Ь21

+

ь2

2 л1п’*0 ] + л2п,‘°

- (л1га’г°] +2л2п’г°Г

2 (л^Ч 2лГ’‘°') 7§"'((’х) + х 1 -

- (л[п’*°] + л[п’*°]Ч

Ь2

2 (л1»’-?1 + дК^П V§N|(І^Х) + 2 I +

+ л

Лп’*°] + 2л[п’*°]'

Ь1

^[м](£,х) + х | х+

2 (л[га’г°] +2л2п’г°]

и

0

0

2

2

+ (л^ 1 + А.['*’‘0

г

2

Ь2

1 + л1П’‘о

1

_^1 (і,ж) + ж І ж—

/ ж2 А[™’^ 1 + Зж2 А[™’і^ Г| +

+ Гг[11(^)л1п’'^1 + г[21 (і) А

,к^1

V [м1(Т,ж[м1(Т)) = (л^1 + АК^1

ж

[м 1(Т).

Раскрывая скобки в (33) и упрощая, имеем:

(34) іЛж) + {а + І + |} ж^,ж) +

ЬЇ

+

4 ( А^1 +2А2га’г^1

+

+-

ь2

4 (А^1 + Л2га’г^1

+ (г[і1(і)АІга’^1 + г[21 (і) А

+

1

V [м1(т,ж[м 1(т)) = (л^ 1 + л2га’^

ж

[м 1(Т).

По лемме 3 уравнение (34) имеет единственное решение, причем

к^с^ж) = (а!^ 1 + л2га^^ Л°*ь**^}(т 4).

(35)

С учетом (35) из (31) следует, что

(36) ,1 м = ^ї^еі" »* 2 >(Т-),

(36) 2{ л[п

[п^і [п,г^ ]

' ’ 0 ]*2Л2 ’ 0 ]

Ф2 (¿,ж)

= Ьі ^“* 21 * 2 }(Т 4) + X

При этом динамика (27) принимает вид: (37)

70

ж№ = ( а + у + у ) ж+

0

2

2

0

2X

+

ь2 (л!га’г°] + л2га’г°]

Ь22

+ _2 Ч е\- 1 2 1 2

2 (л1-°]+2л2п’г°])

2

}(т-*)

х(^) = хо.

Рассмотрим коалицию Б = {1} и вектор

л[”’*о] = (л[га’*°],л|Т’*°]) ,

при условии, что игрок 2 выбрал стратегию ф2(^ х). Уравнение

(6) принимает вид:

(38)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ шах <

«1 [

Л,х) +

ах

+ Ь,и, + | е( “+ ’ + V(т -1) + Ь|х

^№,х)+

+л1

Ц -и2 -(Ь2е(а+ "2 + £) (т-*) + х

+ 2 1 +

. . /Ь2 (а+ "21 + Ь2) (т-*) , х\ х2

+и1х + ( —^ 2 2/ 2/ х —2~ + Г +

Ь е(а+£+¥) (т-) + ?Ух- 3

2

+2и1х + ( 2еХ 2 2

+ 2 ] х - 4 х + г

V[4](Т, х(Т)) = (л1га’г°] + л2га’г°]) х(Т).

Из определения вектора л[га’г°] следует, что л2п’г°] уравнение (38) принимает вид:

(39) Л,х) +

0. Поэтому

+ шах

«1

Яах + Ь1«1 + | е( “+ *+-)(т-) + ^

2

^№,х) +

2

2

0

+л[п’‘°] -(|е(“+$+*)(т-1) + х)2 +

+ и1х + (уе(°+^^)(т-4) + х) х - х2 + г[%))} =0,

V[4] (Т,х(Т)) = л1п’*° ]х(Т)

Условие первого порядка для функции в фигурных скобках принимает вид:

Ь^/^х) - 2л!М°]ф!*(^, х) + л1п’*°]х = 0.

Откуда,

(40) ф1*(^,х) = ^] К№,х) + х.

2л[П’*0] 2

Условие второго порядка зависит только от параметров свертки:

(41) -2л1п’*°] < 0,

поэтому при выполнении условия (41) стратегия (40) будет единственной, на которой достигается максимум левой части уравнения (39).

Подставив (40) в (39) и упростив, получим:

(42) ^](,х) +

+ ^ (к^ж)) + (а+у+у) ж)+

4А10

М е(°* I1 * £ )(т-4)рХ41(^, ж) —

+те

^ 1ь2 е2(“* ^ ^ )(т-4) + А^ 1г[і1(і) = 0,

V и(Т,х(Т)) = л1га’г° ]х(Т).

По лемме 3 уравнение (42) имеет единственное решение, причем

(43) vJS](í,x) = л1га’г° ]е{“+^+^ }(т-4).

“++

2

}(т-*) + х

С учетом (43) из (40) следует:

(44) ФГ(*,х) = у ^ 2

При этом динамика (27) принимает следующий вид:

(45) х(г) = (о +у + у) х + а § + Ь2) е(“+^+* }(т _,).

х^о) = хо.

Рассмотрим коалицию 5 = {2} и вектор

л[п

«¿Я] = ^л[га’*я] л[п’*я]^

при условии, что игрок 1 выбрал стратегию ф?(£, х). Повторяя рассуждения, проведенные при рассмотрении случая Б = {1}, имеем:

(46)

= Ь2 е{ а+11+^2} (т-*) + х

При этом динамика (27) пр(инимает вид:)

(47) х(£) = (а + + ^2 ) х+

+

ь? (лх

[п’*°] + л1П’10

[п’*°] 2

Ь2

2 (л?га’г°] +2л2п’г°^ + 2

а+ ‘т + -г2

2

}(т-*)

х(^) = хо.

В результате получаем:

Для 5 = N, согласно (36), (37):

Ф*(*,х) =

ь? л

2 (л1;

[«¿°° ]

+ 2л

ф2(^,х) = 72е

х№ = ( а + у +12 ) х+

2

е

е

ь2 (\[га’*°1 + \[га’*^А 2 I в ,

Ьі ІАі +А2 ) + Ь2 і >* ”2 * "і2 }(Т-*)

+ 2 (л1га’г^1 +2А2га’г^1) + ~ е

х^о) = хо.

Для 5 = {1}, согласно (44), (45):

ФГ(*,х) = Ь? е{“+^^ }(т-4) + х,

*м = (о + £ + Ь2 )х+(§ +|) е(“+‘+*}(т-‘),

х(^о) = хо.

Для 5 = {2}, согласно (46), (47):

Ф2’«,х) = | е<“+^^ }(т-<) + х,

х(г) = (а + т; + Ь22) х+

„•N1 и ^

Ь2 \[п’^0 1 + \[п^0 А 2 і в }

Ьі ІАі +А2 ) + ь2 I еВа* "21 * ”2 }(т-*)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 (а^0 1 +2а2п’і0 1) 2

х(^) = хо.

В игре возможны три коалиции (п = 2). Поэтому возможны 23 = 8 векторов л[”’г°]. Перебирая все варианты, находим следующий ответ.

Для 5 = N значение 4?’2} = 1, л[га,го ’ }] = (1, 0), для 5 = {1} значение г{1} = 1, л[га,го }] = (1, 0), для 5 = {2} значение

42} = 2, л[п’*{2}] = (0,1). Тогда:

а) для всех экстремальных уравнений выполняются условия второго порядка,

б)

а*(+ \ а**(+ Ьі Iа*"2 *”2^1(Т—^) і ж

фі(^,ж) = фі (^,ж) = —е 2 2 і +2,

А* (+ \ \ Ь2 {а+ ~2 + ~22\(т-*) | х

ф2(^,х)= ф2(^,х) = 2" ^ 2 2/ +2,

в) выполняются условия существования и единственности уравнений (37), (45), (47). При этом указанные уравнения принимают одинаковый вид:

ь?+ь2 ) х+а72+72) е(“++* }(т-<>

(48) ж(і) = + - + -) ж + (д + -) е

ж(^о) = жо.

Следовательно, для каждой коалиции 5 С N нашлись такие но-

•{1,2} 1 •{-} 1 -{2} о

мера игроков *0 =1, *о = 1, *0 =2, что максимальное

значение левой части уравнений (30), (39), а также экстремального уравнения, составленного для случая Б = {2}, достигается на единственном наборе непрерывных функций:

(*,ж) = (ф-(£,ж),ф2 (¿,ж)) =

= ( bi Л °+ъ2+(T-t) + х h Л °+"21+Ч (т-*) + x

2 2 ’ 2 2

Тогда по теореме 1 набор ф^ (tх) Є SME в игре (27)-(29), что и требовалось найти. •

Литература

1. ВАЙСБОРД Э.М., ЖУКОВСКИЙ В.И. Введение в дифференциальные игры нескольких лиц и их приложения. - М.: Советское радио, 1980. - 304 с.

2. ЗЕНКЕВИЧ Н.А., ПЕТРОСЯН Л.А., ЯНГ Д.В.К. Динамические игры и их приложения в менеджменте. - Санкт-Петербург: Высшая школа менеджмента, 2009. - 415 с.

3. МУЛЕН Э. Теория игр с примерами из математической экономики. / Пер. с франц. О.Р. Меньшиковой, И.С. Меньшикова. - М.: Мир, 1985. - 200 с.

4. ПЕТРОСЯН Л.А., ЗЕНКЕВИЧ Н.А., СЕМИНА Е.А. Теория игр. - М.: Высш. шк., Книжный дом «Университет», 1998. - 304 с.

5. ФЛЕМИНГ У., РИШЕЛ Р. Оптимальное управление детерминированными и стохастическими системами. / пер. с англ. М. Г. Бутрим, П. К. Катышева; под ред. А. Н. Ширяева. - М.: Мир, 1978. - 320 с.

6. ЧИСТЯКОВ С.В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестник Санкт-Петербургского государственного университета. - 1992. - Сер.1: Математика, механика, астрономия. Вып. 1. - C. 57-69.

7. AUMANN R.J. Acceptable Points in General Cooperative n

- Person Games. // Contributions to the Theory of Games IV. Annals of Mathematics Study 40, ed. by A.W. Tucker. -Princeton NJ: Princeton University Press, 1959. - P. 287-324.

8. ISAACS R. Differential games. - New York, London, Sydney: John Wiley and sons Inc, 1965.

9. PETROSYAN L.A., GRAUER L.V. Strong Nash Equilibrium in Multistage Games// International Game Theory Review. -2002. - Vol. 4, № 3. - P. 255-264.

10. YEUNG D.W.K., PETROSYAN L.A. Cooperative stochastic differential games. - New York: Springer Verlag, 2006.

STRONG EQUILIBRIUM CONSTRUCTION IN A NONCOOPERATIVE DIFFERENTIAL GAME

Nikolay Zenkevich, Graduate School of Management, Saint-Petersburg, Cand.Sc., assistant professor (zenkevich@gsom.pu.ru).

Andrey Zyatchin, Graduate School of Management, Saint-Petersburg, Cand.Sc., assistant (zyatchin@gsom.pu.ru).

Abstract: In this paper a special technique based on scalarization of a vector criterion is used to construct a strong equilibrium in a differential game. Sufficient conditions for the existence of strong equilibrium are proved. This approach is tested on an example of an asymmetrical differential game of two players, where the strong equilibrium was found in the explicit form.

Keywords: differential game, Nash equilibrium, strong equilibrium.

Статья представлена к публикации членом редакционной коллегии Д. А. Новиковым

i Надоели баннеры? Вы всегда можете отключить рекламу.