2008 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА.
Сер. 10.
Вып. 1
ПРИКЛАДНАЯ МАТЕМАТИКА
УДК 517.977.8
А. А. Адрианов, С. В. Чистяков
К ТЕОРИИ КООПЕРАТИВНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР
1. Введение. Известно несколько различных подходов к построению теории кооперативных дифференциальных игр [1-4]. В данной статье обосновывается возможность использования инструментов кооперативной теории для решения проблемы выбора одной из равновесных траекторий, выделяемых на основе принципа равновесия в смысле Нэша. При этом ключевым результатом является доказываемая ниже теорема об описании множества всех стабильно равновесных траекторий в терминах решений определенного дифференциального включения. С использованием этой теоремы, по аналогии с [4], осуществляется построение кооперативной теории рассматриваемых дифференциальных игр.
2. Постановка задачи и основные предположения. Рассмотрим бескоалиционную дифференциальную игру Г(^,£о) с неограниченной продолжительностью [5]. Пусть процесс, управляемый игроками г = 1,т (т ^ 2), описывается уравнением
с1х
— = /(г>х,и1,и2,...,ит) (1)
(г е я, X е Дп, Щ е рге СотР11Ш), г = м*) с начальным условием
хЦ0)=х0, (2)
а функционал качества г-го игрока имеет вид
+оо
щ(щ(-),... ,ит(-)\г0,х0) = У ... ,ит{ь))(И, (з)
¡0
где х(£) = (■),... ,ит(-)) - решение задачи Коши (1)-(2) на интервале
[¿о,+оо), соответствующее измеримому по Лебегу набору программных управлений — & Рг, г = 1 ,т (такие управления далее будем называть допустимыми). Сделаем следующие предположения относительно правой части системы (1) и функций /¿¿(•), г = 1, т:
1°. Функция /(■) непрерывна по совокупности переменных (£, х, ,..., ит) и локально липшицева по х.
2°. Существует такое А > 0, что
У(г,х,и1,и2,...,ит)\\ ^ А(1 + ||ж||)
для всех Ь £ Д, х & Ип и гц £ Р;, г = 1,то.
© А. А. Адрианов, С. В. Чистяков, 2008
3°. Для всех ( 6 й и х £ Л" множество
ат) = {(/,/ц,..., /1т) € Ип+т |/ = Ж ^,..., «га), Л; = . . . ,ит), Щ 6 Р;, ! = 1,771}
является выпуклым.
4°. Каждая из функций /1г(-)> г = 1,?/г непрерывна на декартовом произведении Л х Я" х Рг х Р2 х ... х /V
5°. Для каждого г = 1,т существует интегрируемая на [¿о, +оо) функция Сг(-) такая, что выполнено неравенство
«1 (0. «а(0. ■ - ■ »Мт(*))| ^
для любого í 6 [¿о, +оо) и всех допустимых программных управлений щ(-), г = 1 ,ш.
Пусть / = {1,2,..., ш} - множество всех игроков; ^.(¿о,^о) ~ множество траекторий (решений) системы (1) на полуинтервале [¿о,+оо), которые соответствуют всевозможным, допустимым управлениям и удовлетворяют начальному условию (2);
и = {{г,х)\г е [г0,+оо), ж = х{г), х(-) е
- интегральная воронка, исходящая из начальной позиции (¿о,£о)-Далее наряду с игрой Г(£о,£о) будем рассматривать семейство игр
Пусть Х*^о,хо) - множество тех траекторий системы (1) с начальным условием (2), о которых идет речь в теореме, доказанной в [5]. Такие траектории далее будем называть стабильно равновесными.
3. Идентификация стабильно равновесных траекторий в терминах решений дифференциального включения. Рассмотрим многозначное отображение
Р{ь,х) = .,ит)\щ € Рг, г е 1} .
Используя исходные предположения и компактность множеств Рг, г € /, нетрудно показать, что это многозначное отображение непрерывно и имеет компактные и выпуклые значения [6]. При тех же предположениях множество Л(£о,£о) всех траекторий управляемой системы (1) с начальным условием (2) совпадает с множеством всех абсолютно непрерывных на полуоси [¿о, +оо) решений задачи Коши для дифференциального включения
®ег(<,®) (4)
с теми же начальными данными [7].
Наряду с отображением Р рассмотрим многозначное отображение
^Я : («,х) РН(г,х),
где FЯ(í,a;) - множества, определенные в п. 2. Оно также является непрерывным и компактнозначным [6].
Для каждого г £ / обозначим через «¿(-) функцию максиминного выигрыша или потенциал игрока г в классе рекурсивных стратегий [5]. Если функции Vi(■), г £ /, дифференцируемы в точке (£,х) £ -О по направлению (1,/) = (1,/1,...,/„) £ /?п+1, то их производные в этой точке по такому направлению обозначим соответственно <¿¿(£,2:,/). Положим далее
если соответствующие производные существуют. Сделаем следующее
Предположение 1. В каждой точке (Ь,х) £ И функции дифференцируемы по любому направлению (1,/) £ Яп+1, / £ Р{Ь,х) и множество
ФН(4,г) = {(/,/1) £ |сг(«,1, Л + Л ^ О}
(Л = (/гь...,/?,,„))
непусто.
Если выполнено это предположение, то определены многозначные отображения ФН : (¿,х) ФН(М) С йп+т, (*,а:) £ £>,
Ф:((,з:)иФ({,1)сД", (*,х)€1>,
Ф(«,х) = {/ £ Г(«,я;)|ЭЛ £ Ят : (/,/1) £ ФН(г,х)} ,
являющиеся соответственно селекторами многозначных отображений /7/ и Р на множестве И, и при (¿,х) £ -О можно рассматривать дифференциальное включение
х£ф(£,х). (5)
Теорема 1. Если выполнено предположение. 1 и функции «;(•), г £ I, удовлетворяют в некоторой окрестности множества В локальному условию Липшица, то каковы бы ни были начальные данные (¿о,Хо) £ Яп+1 множество Лг*(£о,®о) совпадает со множеством всех абсолютно непрерывных на полуоси [¿о,+оо) решений дифференциального включения (5), удовлетворяющих начальному условию х(<о) = х^.
Доказательство. Пусть Х(^,Хо) - множество всех абсолютно непрерывных решений дифференциального включения (5) на полуоси [¿о,+оо), которые удовлетворяют соответствующему начальному условию. Выберем произвольный набор допустимых управлений и(-) = (щ(-),... ,ит(-)), порождающий траекторию х(-) £ Положим для каждого г £ /
г
?/;(£) = / Ы{ТМт)МТ))<*Г У££[£0,+Оо).
¿0
Заметим, что каждая из функций ¡¡/¿(-) почти всюду дифференцируема на [¿о,+оо) [8] и в точках ее дифференцируемое™ имеют место равенства
Уг(г) = Л¿(£,х(£),Цг)), г £ I.
Выберем произвольную точку t £ [¿о, +оо), в которой одновременно дифференцируемы функции х(-) и г £ 7, и справедливо включение
Покажем, что при любом г € I выполнено неравенство
<Ь(4,а:(*),®(0) + («),!*(*)) ^ 0, (6)
и тем самым будет доказано включение
СХ(«о,ю), (7)
а значит, и существование решения дифференциального включения (5).
Выберем произвольное г € I. По условию теоремы найдется окрестность точки дг(£)), в которой функция «{(•) удовлетворяет условию Липшица. Пусть С - та постоянная, с которой она удовлетворяет этому условию в соответствующей окрестности точки (£,аг(£)). Тогда для всех достаточно малых а > 0 будет справедливо неравенство
и,(£ + а,х{Ь) +ах{Ь)) - + а,хЦ + а)) ^ —С ||а:(£ + а) — аг(*) -а±(*)||. (8)
Поскольку х(-) £ Х*(1о,хо), то по теореме 1 имеем
+ а,х(г + а)) + ?/;(£ + а) ^ аг(£)) +
Тогда из (8) следует неравенство
+ +ах(£)) — «¿(£,ж(£)) +?/,(« +а) - ^ —С ||зг(£ + а) - х(£) -а±(£)||,
также справедливое при всех достаточно малых а > 0. Поделим обе части последнего неравенства на а > 0 и перейдем в полученном неравенстве к пределу при а —> +0, что возможно в силу предположения 1 и дифференцируемости функций х(-) и ¿/¿(-) в точке В итоге получим неравенство (6), а следовательно, и включение (7). Докажем теперь обратное включение
Х(г0,х0) с х*ц0,х0).
С этой целью выберем произвольную функцию х(-) £ Х(^,Хо). Тогда существует такой набор допустимых управлений и(-) = (щ(-),... ,ит(-)), что при почти всех £ £ [£о, +оо) и г £ I справедливы неравенства (6), где = ,«(•)). Покажем, что каждая
из функций
I
= г>г(£,ж(£)) + J 1ц(т,х(т),и(т))с1т, г £ I,
1о
не убывает на интервале [¿о, +оо). Для этого достаточно показать, что каждая из этих функций не убывает на любом конечном отрезке [£о,Г]. Выберем произвольное Т > ¿о. Так как функции г £ I, в силу локальной липшицевости функций гч(')> г £ I,
и абсолютной непрерывности функции х(-) также являются абсолютно непрерывными и удовлетворяют условию Липшица на отрезке [¿о, Т], то для доказательства их монотонности достаточно показать [8], что каждая из них при почти всех £ £ (¿о ,Т) имеет неотрицательную производную.
Выберем произвольное ¿6/. Пусть Д - совокупность всех точек интервала (¿0>Г), в которых одновременно дифференцируемы функции х(-) и <¿7; (•), а также имеет место включение
х(£) € Ф(£,х(£)).
Тогда (¿о, Т) \ А - множество меры нуль [8]. Пусть £ £ Д. Очевидно, что при всех а > О справедливо равенство
+ а) - <£>,(£) = \viit + а, х(£ + а)) - г>г(£ + а, х(£) + ах(£))] +
+ \viit + а, х(£) + ах(£)) - «¿(£,х(£))] + [?/;(£ + а) - у<(4)],
где Уг{в) = Ы(т, х(т), и(т))йт. Из него, с учетом неравенства (8) (справедливого при достаточно малых а > 0), получим неравенство
х(£ + а) — х(£) — ах(£)
<^(£ + а) - <^(£) с
>
+ а, х(£) + ах(£)) - ^¿(£, х(£)) + а) -
^ +
а а
Переходя в нем к пределу при а —> +0, что возможно в силу предположения 1 и дифференцируемое™ функций х(-) и </>г(-) в точке £ £ Д, имеем
^ с^(£,х(£),х(£)) + *(£),«(£)).
Из этой формулы, с учетом неравенства (6), справедливого в данной точке £ € Д в силу выбора функции х(-) £ Х(£о,х0), следует, что <£>•(£) ^ 0. Теорема доказана.
Если функция Уг(-) является непрерывно дифференцируемой в некоторой окрестности множества И, то будем писать У((-) € С1 (Л).
Лемма 1. Пусть Уг(-) £ С1 (О), г £ I. Тогда предположение 1 выполнено. Доказательство. Требуется лишь доказать, что множество ФН(£,х) непусто при всех (£,х) £ Б. Предположим противное. Пусть ФН(£«,х») = 0 в некоторой точке (£»,х„) £ £>. Тогда по определению множества ФН(£«,ж»)
ШШ{<Ц(г,х,/) + Ы} < 0 У(/,/г) £ ^Я(£,,х»).
гб I
Так как отображение .РЯ непрерывно и компактнозначно и в силу условия леммы каждая из функций
(£,х,/) ^(£,х,/), (£,ж) € £>, / € Я", г £ /, непрерывна, то найдется такая окрестность 0(£*, ж,) точки (£*,х»), что
тт{с?г(£,х, /) 4- /ц} < 0
для всех (£,х) £ 0(£,,х,) и (/,/г) £
Выберем произвольную траекторию х(-) £ Х*(£*, ж*). В силу ее непрерывности, найдется такое £' £ [£»,+оо), при котором (£,х(£)) £ 0(£*,х„) для всех £ £ (£,,£'). Тогда, с одной стороны, учитывая, что функция х(-) при почти всех £ £ (£»,£') удовлетворяет включению (5), при тех же £ £ (£*,£') будем иметь
тш{^(£,х(£),х(£)) + ^(£,х(£),и(£))} <0, (9)
¿6/
где ы(-) = (uj (■),..., ы,„(-)) - некоторый набор допустимых управлений, порождающий траекторию х(-). Но, с другой стороны, по аналогии с доказательством теоремы 1 (поскольку выполнены ее условия), можно показать, что при всех i £ I и тех же t £ (£*,£') для выбранной функции х(-) справедливо неравенство (6), а следовательно, и неравенство
min{di(t,x(t),x(t)) + hi(t,x(t),u(t))} > О, iei
которое противоречит (9). Лемма доказана.
Лемма 2. Если V{(-) £ C1(D), i £ I, то многозначное отображение ФН полунепрерывно сверху и имеет компактные и выпуклые значения.
Доказательство. Поскольку v¡(-) £ С1 (D), г € /, то каждая из функций
(■t,x,f,h) i-> di(t,x,f) + hi, (£, х) £ D, / £ Rn, he Rm, i £ I,
непрерывна по совокупности переменных и афинна по / и по h. Поэтому, очевидно, многозначное отображение
ФН : (t,x) м- ФН(£,ж) С R'l+m, {t,x) £ D,
ФН(£, х) = {(/, h) £ Rn+m\d(t, x,f)+h> О} замкнуто и имеет замкнутые и выпуклые значения [9, с. 116], а так как
ФН(г,х) = FH(t,x) ПШЦ,х), (t,x) £ £>,
и многозначное отображение FH непрерывно и имеет компактные и выпуклые значения, то это и доказывает лемму.
Рассмотрим многозначное отображение
ФН : (í,x) н-» ФН(г,ж), (:t,x) £ D, ФН(г,ж) = {(f,h) € FH(t,x)\d(t,x,f) + h > О}.
Пусть
БотФН = {(t,x) £ £>|ФН(г,ж) ф 0}.
Лемма 3. ЕслиУ{(•) £ C1(D), г £ I, и БотФН ф 0, то многозначное отображение ФН непрерывно на множестве БотФН.
Доказательство. С учетом леммы 2 достаточно показать, что отображение ФН полунепрерывно снизу на множестве БотФН. Выберем произвольную точку (г»,ж„) £ БотФН. Тогда найдется такая пара (f*,h*) £ FH(t*,x*), что
с:/(£»,£*,/*) + h* > О.
Положим a¿ = di(t*, ж*, /*) + h* >0, i £ а = (аь ..., ат), ¡3 = mina,; > 0.
iei
В силу непрерывности отображения d и в силу определения вектора а найдутся такие окрестности Oi(t*,x,) С БотФН и B(f*,h") С Rn+m соответственно точек (£*,£*) и (f*,h*), что
d(t,x,f) + h>^a> О (10)
для всех (t,x) £ Oi(£»,x») и (/,/г) £ B(f*,h*).
Так как отображение FH непрерывно, а следовательно, и полунепрерывно снизу, то найдется такая окрестность 02(t*,x,), что
FH(t,x)nB(f\h')ï& (11)
для всех (t,x) G 02{t*,xr) [9]. Пусть
0(t„x,) = 0i(i.,®.)n02(i.,x.).
Тогда, в частности, условие (11) выполнено для всех точек (t,x) G 0(£*,ж»), а условие (10) выполнено для всех (t,x) G 0(t*,x,) и всех (/, h) G FH(t,i)nB(/*,/i*)/0.
Теперь заметим, что так как отображение d непрерывно по совокупности переменных и афинно по /, а многозначное отображение FH непрерывно и имеет компактные и выпуклые значения, то для доказательства полунепрерывности снизу многозначного отображения ФН в окрестности 0(i»,x») достаточно убедиться (по теореме 16 из [9] на с. 121), что выполнено следующее
Условие А. Существует 7 > 0 такое, что V(i,.r) G 0(t,,x„), Vz G Rm : ||z|| < 7, 3{f, h) G FH(t, x) : d(t, xj) + h + z^ O.
Далее удобно считать, что норма в Rm введена следующим образом:
||z|| = max\zi\ (z = (zi,...,zm)). iç.1
Положим 7 = /3/2. Тогда с учетом доказанного выше имеем V(i,x) G 0(f„,x»), Vz G Rm : |И| < 7, V(/,h) G FH(t,x)nB(f*,h*)
d(t, x, /) + h + z > ^q + z ^ O,
т. е. условие A выполнено. Поскольку точка (¿,,.1;,) G БотФН выше была выбрана произвольно, то это означает, что отображение ФН полунепрерывно снизу па всем множестве БотФН. Лемма доказана.
Из этой и предыдущей лемм, очевидно, вытекает такое
Следствие. Если г>,(-) G C1(D), г G I, и БотФН = D, то многозначное отображение ФН непрерывно на множестве D и имеет на нем компактные и выпуклые значения.
4. Понятие кооперативного решения. Рассмотрим многозначное отображение L : {U,x„) м- L(t,,x„) С Rm, (t.,x„) G D,
такое, что
Ци,х.) = {у G Rm\M■) : у = H(U,x, !«(•))},
где и(-) = (щ(■),...,и,п(-)) - набор допустимых управлений, а Н(-) = (Н[(•), . ..,ЯТО(-)), #,•(•) - функционал качества г-го игрока (г G /), определяемый формулой (3). Это отображение любой начальной позиции (f*,x*) G D ставит в соответствие множество всех векторов выигрышей игроков в игре Г(£„,ж»).
Примем следующую терминологию. Пусть П и А - произвольные непустые множества, а0:шн ©(w) С А (со G fi) - строгое многозначное отображение, т. е. такое, что Dom0 = П, где
Dom0 = {w G fi|0(w) ф 0}.
Тогда любое строгое многозначное отображение 0' : Г2 Д такое, что Q'(oj) С ö(w) для любого и £ П будем называть селектором отображения 0. Заметим, что обычно под селектором многозначного отображения понимают его однозначную ветвь, которую далее будем называть однозначным селектором.
Определение 1. Многозначное отображение L : (t,x) L(t,x) С Ят будем называть кооперативным решением игры Г(D), если:
1) L - селектор L;
2) для любой позиции (£*,ж*) £ D и для любого у £ L(t,,x*) существует такой набор допустимых управлений «(•) = (mj(•),..., ит(-)), что для всех ti,t2 £ [£,,+оо) таких, что t2 ^ t\, справедливо
где ж(-) = ж(-,£*,а\,и(-)), /г(-) = (/гх(•),...,Нт(-)), а © - операция сдвига множества на вектор, т. е. а®В-{с = а + Ь\ Ь£ В}, а € Ят, В С Ят.
Заметим, что свойство 2), являющееся проявлением принципа неухудшения позиции, по аналогии с [10] можно назвать свойством стабильности. В теории дифференциальных игр с конечной продолжительностью и терминальным выигрышем такое название было присвоено подобному свойству, поскольку оно - прямой аналог свойства постоянства функции Беллмана в задаче терминального управления вдоль оптимальных траекторий в расширенном фазовом пространстве.
Рассмотрим многозначные отображения
X* : (£,,ж.) Н> Х*{г,,х,) С А{и, ж»), (£„,ж„) € О,
Ь* : (¿,,аг.) Н- Г{и, ж.) С Ят, (£.,ж.) € £>, Ь*(и,х,) = {у е Ят|ЗЦ-) :у = Я(<„ж,Ю), ж(-,£,,ж,,и(-)) £
(здесь, напомним, Х*(£»,ж») - множество всех стабильно равновесных траекторий в игре Г(£»,ж„) [5]). Непосредственно из их определения следует, что само отображение Ь* является кооперативным решением игры Г(/)).
5. Подход к построению кооперативных решений. Следующая теорема доставляет подход к построению кооперативных решений игры Г(О) на основе сужения локальных возможностей игроков влиять на процесс управления. Подразумевается, что это сужение достигается на основе кооперативного соглашения о принципах управления.
Теорема 2. Пусть выполнены условия теоремы 1 и С?Я - такой селектор многозначного отображения ФН, что для любой точки (£*,ж«) £ Б дифференциальное
включение
гевНЦ,х) (12)
(г = (ж,ух,... ,ут)) с начальными данными
*(«.) = ( ж,,0,...,0) (13)
имеет хотя бы одно абсолютно непрерывное решение на интервале [£*,+оо). Пусть также многозначное отображение
Ван : (г, ж) Ьан&х) С Ят, (г, ж) £ Б,
каждой позиции (t*,x*) £ D ставит в соответствие множество
LGH(t*,X*) =
= {у = (у1,---,ут)\уг = , Hm yi(t), i e i, {x{-),yi{-),...,ym(-)) e Zenit*,x*)},
t—»+oo
где ZoH{t*,Xt) - множество всех абсолютно непрерывных региений дифференциального включения (12), удовлетворяющих начальному условию (13). Тогда отображение Lau является кооперативным решением игры T(D).
Доказательство. Покажем, что Lgh - селектор многозначного отображения
L*.
В начале доказательства отметим, что поскольку GH - селектор многозначного отображения ФН, то G : {t,x) н-> G{t,x), (t,x) £ D,
G(t,x) = {/ € F(t,x)\3h £ Rm : (f,h) € GH(t,x)}
- селектор многозначного отображения Ф. А тогда если многозначное отображение Xq ставит в соответствие каждой позиции (t*,x,) £ D множество Ха(1„, xt) всех абсолютно непрерывных решений дифференциального включения
х £ G(t, х)
с начальными данными x(t*) = х*, то, в силу теоремы 1, А'g ~ селектор многозначного отображения X*. Кроме того, очевидно, что для любой позиции (£*,ж„) £ D множество А<з(£*,а;*) является проекцией множества ZG#(i,,a;*) на соответствующее подпространство вектор-функций размерности п.
Выберем произвольную точку (£«,ж«) £ D и покажем, что
LGH(t*,xr) С L*(tt,x,).
Пусть у = (yi,... ,ут) £ LGn(t*,x„). По определению множества LGH(t*,x*) найдется такая функция z(-) = (х(-), ух (•), • ■ ■ ,Ут(-)) € ZGfj(t*, х,), что
уi = lim yi{t).
t—¥ + 0о
При этом по доказанному выше
х(-) £ Xg(U,x.) С X*(U,x,).
Пусть и(-) = (Ui(-),... ,ит(-)) - набор допустимых управлений на полуоси [i*, +оо), порождающий траекторию ж(-). Положим
<?(•) = (/(•),МО,•••,М-))-
Поскольку
*(•) = (х(-),1/1 (■),■■■, У,п(-)) е ZGH{U,xt),
ai(-) = x(-,t*,x*,u(-)), то функция z(-) является решением системы дифференциальных уравнений
z = g(t,x,u(t))
с начальным условием (13). Следовательно, но определению вектор-функции д(-), для всех t £ [£»,+оо) имеют место равенства
t
yi(t) = j hi(t,x{t),u(t))dt, iel. t.
Таким образом, имеем
-f oo
Уг= lim iji{t) - / hi(t,x(t),u(t))dt, iel,
t—v+oo J
t.
но поскольку x(-) e A'*(i»,x»), то по определению множества L*(i*,x„) вектор у = (уь • • • ,Ут) £ L*(t*,x*). Теорема доказана.
Далее при выполнении условий теоремы 2 будем говорить, что соответствующее отображение GH индуцирует решение Lqh игры T(D).
Из этой теоремы и известной теоремы о существовании решения дифференциального включения [7] получим такое
Следствие. При выполнении условий теоремы 1 всякий полунепрерывный сверху и имеющий компактные и выпуклые значения селектор многозначного отображения ФН индуцирует решение игры Г(D).
Считая выполненным предположение 1, рассмотрим многозначное отображение
X : (t,x) н-» x(t,x), (t,x) £ D,
X(t,x) = {d(t,x,f) + h\(f,h) e ФН(£,x)}.
Лемма 4. Если Vj(-) e C1(D), i £ I, то отображение x полунепрерывно сверху и имеет компактные и выпуклые значения, при этом оно непрерывно на ОотФН, если это множество непусто.
Доказательство. Так как отображение d афинно по /, а отображение ФН по лемме 2 имеет компактные и выпуклые значения, то отображение \ также имеет компактные и выпуклые значения.
Покажем, что оно полунепрерывно сверху. Выберем произвольные (t*,x„) £ D и е > 0. Поскольку каждая из функций Hj(-), г £ I, непрерывно дифференцируема в некоторой окрестности S(D) множества D, то отображение d непрерывно в каждой точке (■t,x,f), (t,x) £ S(D), f £ Rn. Пусть
07(t„,xt) = {(i,x) £ D\ \t — t*\ + ||a: -i.H < 7}
- такая 7-окрес.тность (7 > 0) точки (i*,x*), что cl07(i»,x«) С S(D) (здесь cl07(i*,x*) -замыкание множества 07(i*,x»)). Из доказательства леммы 2 следует, что отображение ФН на множестве S(D) также является полунепрерывным сверху и имеет компактные и выпуклые значения. Поэтому, в частности, ФН(сЮ7(<*,х«)) - компакт [9].
Так как отображение d непрерывно на S(D) х Rn, то отображение
Z:(t,x,f,h)^d(t,x,f) + h
равномерно непрерывно на компакте сЮ7(£»,х») х ФН(сЮ7(<»,.г-«)). Следовательно, найдется такое <5, 0 < <5 < 7, что
Мг,х,/) + к-с1(и,х.,п-к'\\ <£, (и)
если (¿,ж) £ 07(£*,ж») и
[|/ - ГЦ + ||/г - /7*|| < <5, (/,к),(Г,к*) е ФН(сЮу(и,х*)).
Поскольку отображение ФН полунепрерывно сверху, то для данного 6 существует такое сг, 0 < 17 < 6, что каковы бы ни были (¿,ж) 6 Осг(£*,ж») П I? и (/,/1) € ФН(£,ж) найдется такая точка (/*,Л*) £ ФН(г»,ж»), для которой
11/-/*11 + 11Л-Л*|| <г. (15)
Таким образом, существует такое <7 > 0, что для любых точек (£,ж) € 0<7(£«,ж») П -О и (/,/г) £ ФН(£,ж) найдется такая точка (/*,/г*) £ ФН(г»,ж«), для которой справедливо неравенство (14). Следовательно, существует такое а > 0, что для любой точки (£,ж) £ 0<г(£*,ж*) П .О справедливо включение
Х^,х) С Хе(и,хл), (16)
где Хе^т,х„) - ^-окрестность множества х^*,2-'*)- В силу произвольного выбора точки (¿,,ж„) € Б и £ > 0 это означает, что отображение х полунепрерывно сверху на множестве Б.
Пусть БотФН 0, (£»,ж„) £ БотФН и £ > 0. По лемме 3 отображение ФН непрерывно на множестве БотФН и, в частности, в точке (£*,ж,). Тогда, рассуждая как и выше, заключаем, что а (0 < а < <5) можно выбрать так, что каковы бы ни были (£,ж) £ (0<т(£«,ж*) П Б) С БотФН и (/*,/г*) £ ФН(£»,ж») найдется такая точка (/,/г) £ ФН(£,ж), для которой выполняется неравенство (15). Следовательно, для этих (<, ж), (/, /г) и (/*, /г*) справедливо неравенство (14). Таким образом, имеем, что существует такое <7 > 0, что для любой точки (¿,ж) £ (Ост(£„,ж») П I)) С БотФН справедливо не только включение (16), но и включение
Х(£*,ж.) С Хе(*,х).
В силу произвольности (£„,ж„) £ БотФН и £ > 0, это означает, что отображение х непрерывно на БотФН. Лемма доказана.
Используя полученные результаты, опишем подход к построению кооперативных решений игры Г (Б), в рамках которых предполагается, что в каждой позиции (£,ж) £ Б игроки решают задачу о совместном выборе того или иного направления / £ ж). При этом имеется в виду, что каждый из игроков г £ / заинтересован в возможно большем значении величины й;(£,ж,/) + /¿¿.
Рассмотрим семейство классических кооперативных игр
7(£,ж) = (/,У(£,х)>, (£, ж )ЕБ,
в каждой из которых значение х) характеристической функции х) : 21 —> Я определяется по правилу
Y^di(t,x,f) +hi .
Jes
В этом определении считаем, что Vs(t,x) = 0, если 5 = 0. Определенное в итоге отображение
V : (t,x) ~ V{t,x), (t, х) £ D,
можно назвать характеристическим.
Как известно [11], функции, являющиеся значениями характеристического отображения, построенного таким образом, обладают свойством супераддитивности. Кроме того, если Vi(-) £ Cl(D), г £ /, то так определенные отображения непрерывны на множестве D. Тогда, в силу непрерывной зависимости TV-ядра от характеристической функции [12], будет непрерывно и отображение грн : D —> Rrn такое, что для любой позиции (t,x) £ D ipiv(t,x) - А-ядро в игре (I,V(t,x)). Поскольку отображение \ п0 лемме 4 имеет выпуклые и компактные значения, то какова бы ни была точка (i, х) £ D существует единственный вектор i//v(i,x) € x(tix)i ближайший в евклидовой метрике из векторов множества \(t,x) к вектору ipjv(t,x), т. е.
{vN(t,x)} = arg min \\i[)N(t,x) - v\\, (t,x) £ D.
v£x(t,x)
Таким образом, в предположении непрерывной дифференцируемости на D потенциалов Vi(-), г £ I, отображение 4>n определяет однозначный селектор vn многозначного отображения который будем называть проекцией 'фк в Заметим также, что поскольку функция
(t,x,v) \\ipN(t,x) -|/||, {t,x) GD, ие Rm,
непрерывна (в силу непрерывности отображения ipjv(t,x) и евклидовой нормы), а многозначное отображение х по лемме 4 непрерывно и имеет компактные значения, то по теореме о маргинальном отображении [9] отображение
(t,x) н-» {vN(t,x)}
полунепрерывно сверху, но так как его значения одноточечные, то оно, а следовательно, и соответствующее отображение г/дг непрерывны. А тогда, по аналогии с доказательством леммы 2, нетрудно показать, что селектор GH^ многозначного отображения ФН со значениями, определенными по формуле
GHN(t, х) = {(/, Л) £ ФН(г,х)| d(t,x,f)+h = uN(t,x)},
индуцирует решение игры Г(£)).
Summary
Adrianov A. A., Chistyakov S. V. On cooperative differential game theory.
Availability of cooperative theory tools for choice one of equilibrium (in Nash sense) trajectories in differential game with infinity duration is founded. The theorem about description of set of all stable-equilibrium trajectories in terms in solution of differential inclusion form is proved. Using this theorem, the construction of cooperative theory of differential games under consideration is realized.
Vs(t,x)= inf
(М)€ФН(1,а)
Литература
1. Петросян Л. А., Данилов H. Н. Кооперативные дифференциальные игры и их приложения. Томск: Изд-во Томск, ун-та, 1985. 276 с.
2. Жуковский В. И. Кооперативные игры при неопределенности и их приложения. М.: Эдиториал, 1999. 334 с.
3. Клейменов А. Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993. 185 с.
4. Чистяков С. В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 1992. Вып. 1 (№ 1). С. 50-54.
5. Адрианов А. А., Чистяков С. В. Об одном классе бескоалиционных дифференциальных игр с неограниченной продолжительностью // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2005. Вып. 1. С. 78-93.
6. Варга Док. Оптимальное управление дифференциальными и функциональными уравнениями / Пер. с англ.; Под ред. Р. В. Гамкрелидзе. М.: Наука, 1984. 624 с.
7. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985. 224 с.
8. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М.: Наука, 1972. 496 с.
9. Обен Ж., Экланд И. Прикладной нелинейный анализ / Пер. с англ. Б. С. Доржовского, Г. Г. Магарил-Ильяева. М.: Мир, 1988. 510 с.
10. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР. 1981. Т. 259, № 5. С. 1052-1055.
11. Демьянов В. Ф., Малозёмов В. Н. Введение в минимакс. М.: Наука, 1972. 368 с.
12. Schmeidler D. The nucleolus of a characteristic function game // SIAM J. Appl. Math. 1969. Vol. 17. P. 1163-1170.
Статья принята к печати 11 ноября 2007 г.