Научная статья на тему 'Существование равновесия по Бержу в дифференциальной игре с "разделенной" динамикой'

Существование равновесия по Бержу в дифференциальной игре с "разделенной" динамикой Текст научной статьи по специальности «Математика»

CC BY
90
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЗИЦИОННАЯ ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / POSITIONAL DI ERENTIAL GAMES / ГЕРМЕЙЕРОВСКАЯ СВЕРТКА / GERMEIER CONVOLUTION / СЕДЛОВАЯ ТОЧКА / SADDLE POINT / СТРАТЕГИИ / STRATEGIES / КВАЗИДВИЖЕНИЕ / РАВНОВЕСИЕ ПО НЭШУ И ПО БЕРЖУ / NASH AND BERGE EQUILIBRIUM / QUASI-MOTION

Аннотация научной статьи по математике, автор научной работы — Жуковский В. И., Смирнова Л. В.

Понятие "равновесия по Бержу" (РБ) появилось в России в 1994-1995 годах в диссертации Константина Семеновича Вайсмана (тогда аспиранта В. И. Жуковского; К.С. Вайсман умер в 1998 г., не дожив до 36 лет). Затем понятие РБ было вывезено из России Муссой Ларбани и Мухамедом Раджефом (в то время алжирскими стажерами В. И. Жуковского) и получило за пределами России широкое распространение. В настоящее время количество публикаций по РБ насчитывает уже свыше 100 названий. Как показали эти публикации, в математической теории РБ заканчивается период накопления фактов и зарождается этап эволюционного развития. Предлагаемая статья относится ко второму эволюционному периоду и является пионерской в построении нового математического направления: исследование вопросов существования равновесия по Бержу в позиционных дифференциальных играх многих лиц. В ней установлено существование равновесной по Бержу ситуации в одной бескоалиционной позиционной дифференциальной игре многих лиц с "разделенной" динамикой. Доказательство базируется на применении, во-первых, гермейеровской свертки функций выигрыша, во-вторых, теории антагонистических позиционных дифференциальных игр, именно, использовании математической формализации квазидвижений и, наконец, в-третьих, предложенным российским академиком Николаем Николаевичем Красовским способом управления с поводырем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The existence of Berge equilibrium in differential game with ¾separated¿ dynamics

The notion of "Berge equilibrium" (BE) appeared in Russia in 1994-1995 in the thesis written by Vaisman (post-graduate student of Zhukovskiy V.I. at that time; he died at the age of 36 in 1998). Then the notion BE was exported by Moussa Larbani and Radjef Muchamed Said (Algerian post-graduate students of Zhukovskiy V.I. at that time) beyond the bounds of Russia and became widespread in the whole world. BE publications member over 100 titles. The survey showed that in mathematical theory of BE the period of accumulation of facts had been completed and the stage of evolutionary development is being arised. The suggested article corresponds to the second stage and it is pioneer in construction of a new mathematical direction: the investigation of questions of Berge equilibrium existence in N-persons positional differential games. In will be established the existence of situation BE in one non-cooperative positional differential game of N-persons with "separated" dynamics. First the proof is based on the application of Germeier convolution of payoff functions, second, on the theory of antagonistic positional differential games, namely, the application of mathematical formalization of quasi-motions and finally, third, on the method of control with the help of a quide offered.

Текст научной работы на тему «Существование равновесия по Бержу в дифференциальной игре с "разделенной" динамикой»

УДК: 518.833.2 MSC2010: 91.A10

СУЩЕСТВОВАНИЕ РАВНОВЕСИЯ ПО БЕРЖУ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С "РАЗДЕЛЕННОЙ" ДИНАМИКОЙ

© В. И. Жуковский

Московский государственный университет им. М.В. Ломоносова факультет вычислительной математики и кибернетики кафедра оптимального управления Ленинские горы, МГУ, ВМК, 2 учебный корпус, Москва, ГСП-1, 119991, Российская Федерация

e-mail: [email protected]

© Л. В. Смирнова

Московский государственный университет технологий и управления им. К.Г. Разумовского филиал в г. Орехово-Зуево Московской области кафедра естественнонаучных дисциплин ул. Шулайкиной, 2, Орехово-Зуево, Московская область, 142601, Российская Федерация

e-mail: [email protected]

The existence of Berge equilibrium in differential game with

«separated» dynamics.

Zhukovskiy V. I., Smirnova L. V.

Abstract. The notion of «Berge equilibrium» (BE) appeared in Russia in 1994-1995 in the thesis written by Vaisman (post-graduate student of Zhukovskiy V.I. at that time; he died at the age of 36 in 1998). Then the notion BE was exported by Moussa Larbani and Radjef Muchamed Said (Algerian post-graduate students of Zhukovskiy V.I. at that time) beyond the bounds of Russia and became widespread in the whole world. BE publications member over 100 titles. The survey showed that in mathematical theory of BE the period of accumulation of facts had been completed and the stage of evolutionary development is being arised.

The suggested article corresponds to the second stage and it is pioneer in construction of a new mathematical direction: the investigation of questions of Berge equilibrium existence in N-persons positional differential games. In will be established the existence of situation BE in one non-cooperative positional differential game of N-persons with «separated» dynamics. First the proof is based on the application of Germeier convolution of payoff functions, second, on the theory of antagonistic positional differential games, namely, the application of mathematical formalization of quasi-motions and finally, third, on the method of control with the help of a quide offered.

Key words: positional differential games, Germeier convolution, saddle point, strategies, quasi-motion, Nash and Berge equilibrium.

Введение

Понятие «равновесия по Бержу» (РБ) появилось в России [1, 2, 3] в 1994-1995 годах в диссертации Константина Семеновича Вайсмана (тогда аспиранта В. И. Жуковского; К.С. Вайсман умер в 1998 г., не дожив до 36 лет). Затем понятие РБ было вывезено из России Муссой Ларбани и Мухамедом Роджефом (в то время алжирскими стажерами В. И. Жуковского) и получило за пределами России широкое распространение [4]. В настоящее время количество публикаций по РБ насчитывает уже свыше 100 названий. Как показал обзор [4], в математической теории РБ заканчивается период накопления фактов и зарождается этап эволюционного развития. Предлагаемая статья отвечает второму эволюционному периоду и является пионерской в построении нового математического направления: исследование вопросов существования равновесия по Бержу в позиционных дифференциальных играх многих лиц. В ней установлено существование равновесной по Бержу ситуации в одной бескоалиционной позиционной дифференциальной игре многих лиц с «разделенной» динамикой. Доказательство базируется на применении, во-первых, гермейе-ровской свертки функций выигрыша (см. [5]), во-вторых, теории антагонистических позиционных дифференциальных игр, именно, использовании математической формализации квазидвижений (см. [6, с. 22-30]) и, наконец, в-третьих, предложенным российским академиком Н. Н. Красовским в [6, § 57] способом управления с поводырем.

Рассматривается бескоалиционная позиционная дифференциальная игра N-лиц (БПДИ) вида

(N, (Si}i€N, (Vi}i€N, {ВД§])}^), (1)

где множество порядковых номеров игроков N = {1,... , N}, изменение (во времени) управляемой подсистемы Ei описывается векторным обыкновенным дифференциальным уравнением

Xi = fi(t,Xi,Vj), Xj[to] = x0 (i E N), (2)

здесь xi E Rmi являются компонентами фазового вектора x = (xi,...,xN) E Rm (m = mi), управляющее воздействие i-го игрока vi E Qi E comp Rni, время t E [t0,§], постоянные § > t0 > 0; предполагаем, что для элементов упорядоченного набора (1) выполнены

Условия. Компоненты m^-вектор-функций fi(t,xi,vi) определены и непрерывны по совокупности аргументов в области R1+mi х Qi, локально липшпцевы по первой и второй переменной, т. е.

||fi(t(1),x(1),Vi) - fi(t(2),x(2),Vi)| < Ai(Gi)(|x(1) - x(2)II + |t(1) - t(2)|), (3)

где V (tj),xj)) G [0,$) х Gi (j = 1,2), а Gi — любое ограниченное подмножество в Rmi, Ai(Gi) = const > 0 — постоянная Липшица, зависящая от множества Gi; выполнено ограничение подлинейного роста: 3 ki = const > 0, для которой ||/i(t,xi, vi)|| < ki(1+ ||xi|) при любых (t,xi,vi) G [0,$) хRmi х Qi; кроме того функция выигрыша i-го игрока Fi(x) непрерывна на Rm (i G N).

1. Предварительные сведения

Систему (2) далее представим в виде

ж = f(¿,ж, у), ж[^] = Хо, (4)

здесь уже фазовый вектор ж = (ж^ ... , жм) С , управляющие воздействия игроков

V = (VI,..., Ум) С Я = П Яг С (п = ^ пг), т-вектор-столбец f = (fl, ..., ^).

¿ем ¿ем

Предполагаем далее, не оговаривая особо, что условия 3 выполнены для каждой ¿-ой подсистемы (г С М) из (2), откуда будет следовать, что эти же условия имеют место и для всей системы (4).

Напомним, что стратегия У для г-го игрока в игре (1) отождествляется с пг-вектор-функцией уг(£,ж) С Яг при любых (¿, ж) С [0,$) х Ет (этот факт обозначается У — Уг(£,ж)); множество таких стратегий {У} представлено символом (г С М). Используем также и ситуацию

У = (У1,...,Ум) С V = Д тг, У - у(*,ж) = Ы*,ж),...,ум (¿,ж)) С Я;

¿ем

будем далее применять и пучки квазидвижений [6, с. 22-30].

БПДИ (1) может представлять, например, математическую модель конкуренции двух, трех и т. д. производителей, у которых отсутствуют прямые производственные связи (последним обстоятельством как раз и вызвана «разделенность» динамики в системе (4)). Это же БПДИ можно использовать и как математическую модель динамики нескольких механических самостоятельно управляемых объектов, осуществляющих, например, сближение к заданному моменту времени

Определение 1. Ситуацию Ув = (У^,... , У^) С V будем называть равновесной по Бержу для игры (1), если

тах ^(ж[$,;£0,ж0,ув]) < тт ^(ж[$, ¿0, ж0, Ув]) (г С М). (5)

г[']ех [*0 ,хо,Ув ] х[.]ех \г0,х0ув ]

Замечание 1. Согласно [6, с. 14] и включениям

X[¿0,Ж0,УВ] С X[¿0,Ж0,УВ] (г С М),

X[0,*о,жо, Vй] С X[0,*о,жо] (г € Н),

неравенства (5) эквивалентны выполнению неравенств

Vй]) < Vй]) (г € Н)

при любых квазидвижениях [6, § 2] системы (4) ж[-,^о,жо,^Б]) € X[¿о,жо,^Б], ж[-,£о,жо, Vв]) € X[¿о,яо,Ув], порожденных из начальной позиции (¿о,яо) стратегией Vй и ситуацией Vв соответственно, причем значение ^(ж[$, ¿о, хо, Vв]) будет единственным при V г € N и V х [■, ¿о, хо, Vв] € X [¿о, хо, Vв].

Замечание 2. Здесь и далее запись «стратегия V — ф» будет означать, что «используется любая из стратегий V € V». Из определения пучка квазидвижений X[¿о,хо, VB] следует, что пучок X[¿о,хо, VB] при V г € N включает в себя все квазидвижения

хМо,хо, VI - дь..., V-1 - д-ь ^ - «вх), V+1 - ф+ъ..., V* - ],

а значит и квазидвижение х[-, ¿о, хо, Ув,... , VB, V+1,... , ^] = х[-, ¿о, хо, Vв]. Отсюда как раз и получаем единственность ^(ж[$,£о,жо, Vв]) (г € Н) в (5).

2. Управление с поводырем

Надежда на существование ситуации равновесия по Бержу в игре (1) (в смысле определения 1) весьма и весьма проблематична. Для решения такой задачи привлечем идею управления с поводырем из [7, § 57], которую предложил академик Николай Николаевич Красовский при построении седловой точки антагонистической позиционной дифференциальной игры, устойчивой по отношению к информационным помехам. «Введение поводыря можно рассматривать как включение в схему управления некоторого регулятора, моделирующего управляемый объект на ЭВМ» [7, с. 248]. Следуя такому подходу, «расширим» для каждого i Е N управляемую систему (2), добавив к (2) динамическую систему, описывающую изменение (во времени) состояния zi (t) для i-го поводыря

Zi = f (t,Zi,Ui), Zi[to] = X0 (i Е N),

где zi Е Rmi, ui Е Qi (i Е N). Аналогично переходу от (2) к (4) приходим к векторному обыкновенному дифференциальному уравнению

Z = f(t,z,u), z[to] = Xo = (x0,...,xN). (6)

Здесь уже вектора г = (г1,..., ) С Ет, С (г С М), и = (иь ..., им) С Я =

= П Яг, напомним, что вектор-столбец f = (f1,... , ) С Кт. Следуя «идее поводы-геМ

ря», присоединим (6) к системе (4) и тогда изменение (во времени) «новой расширенной» управляемой системы будет описываться системой обыкновенных дифференциальных уравнений 2т-го порядка

( ж = /(¿,ж,у), ж[^] = Ж0,1

{ . , ^{У = Л^и^ уМ = У0}, (7)

[ г = / (¿,г,и), ¿[¿0] = Ж0 J

где уже 2т-вектор-столбцы у = (ж, г), /(¿,у,и,у) = (f (¿, ж,у),/ (¿,г,и)). Пучок квазидвижений системы (7) у[М0,у0,и,У], ¿0 < £ < порожденных «расширенной» ситуацией (и, У) С А х V из начальной позиции (¿0,у0) будем обозначать через ^[¿0,у0,и, У], аналогично ^[¿0,у0,У] — пучок квазидвижений у[^,£0,у0,У] этой же системы (7), построенный в соответствии с требованиями [6, с. 22-39].

Как уже отмечалось, уравнение (6) описывает движение (изменение состояния во времени ¿) поводыря, который, в свою очередь, представляет объединение N поводырей, заданных, в свою очередь, уравнениями ¿г = ^(¿,гг,иг) (г С М). Стратегия и—и(£, ж, г) С Я в процессе синтеза управляющих воздействий симулирует квазидвижение управляемой системы (6), заданных таким же как (4) уравнением (6) с теми же начальными условиями (¿[¿0] = ж0) и с теми же ограничениями на управляющие воздействия (иг С Яг).

Итак, от БПДИ (1) переходим (за счет добавления поводыря) к «расширенной» БПДИ

Ге = (М, £е — (3.6), {Аг, ЗДеК, {Я (ж [$]) }*ек) , где, как и в (1), множество порядковых номеров игроков М = {1,... , N}, но, в отличие от (1), позицию игры Ге образует тройка (¿,ж, г) С [0,$) х Е2т, здесь фазовый вектор (ж, г) С х Ет, т-вектора ж = (ж1,..., жм), г = (г1,..., ) и жг, С (г С М); поэтому стратегией г-го игрока уже будет У — Уг(£,ж,г) С Яг (г С М) множество таких {У} обозначаем символом VI, аналогично для г-го поводыря иг—иг(£, ж, г) С Яг У(£, ж, г) С [0, $) хЕ2т, а {иг} обозначим Аг; заметим, что выбор пары (У, иг) С ^ х Аг осуществляется г—ым игроком (г С М); тогда «роль расширенной» ситуации в игре Ге выполняет пара (У, и) С V х А, где

У = (У1,..., Ум) С V = Д V., и = (йь ..., им) С А = Д Аг,

геМ геМ

Уг — Уг(г,ж,г), Уг С V,, и» — й»(г,ж,;г), Уг С Аг(г С М);

одновременно далее будут использоваться и ситуации

(Щь ..., 7, 7+1,..., ) = (и II 7) € А1 х ■ ■ ■ х X Яг х А¿+1 х ■ ■ ■ х Ам.

В игре Ге каждый г-ый игрок выбирает свою «расширенную» стратегию (7,Щг) € 5г х Аг (г € Н); в результате образуется «расширенная» ситуация

(7, 7) € V х А, где

V7 — «(¿, х, г) = («1(^, х, г),..., зд(¿, х, г)), Щ — й(£, х, г) = (м^, х, г),..., (¿, х, г)).

Затем, строятся пучки ^[¿о,уо, V, Щ квазидвижений у[¿, ¿о, уо, V,[/"], ¿о < £ < $ системы (7), порожденные из начальной позиции (¿о,хо,хо) «расширенной» ситуацией (}, [7), а сам пучок [¿о, хо, хо, V, Щ образуют пары квазидвижений х[-, ¿о, хо, V7], г[-, ¿о, хо, [7] соответственно подсистем х = f (¿,х,«), х[£о] = хо и г = f (¿,г,м), г [¿о] = хо. Наконец, функция выигрыша г-го игрока определяется функционалом ^г(х[$]), здесь х[$] € X[$, ¿о, хо, V], сам выигрыш г-го игрока — значением этого функционала ^г(х[$]). Заметим, что функционалы ^г(х[$]) определены на «правых концах» квазидвижений х[-,^о,хо,}] € X[¿о,хо,}] системы (4), порожденных из (¿о,хо) набором V7 € V, т. е. х[$] = х[$,;£о,хо, V7] € X[$,£о,хо,7] = {X[¿о,хо, V7] П {г = $}}. Применяем далее и функционалы [$] || хг[$]), где

(г[$] || хг[$]) = (^1[^,^о,хо, ¿71],... , гг_1[$, ¿о, хо, ¿7г_1], хг[$, ¿о, хо,17г],

*г+1[$,*о,хо,Щг+1],...,г^[$,*о,хо,ВД ^ € А (^ € Н\{г}). Отметим также, что расширение пространства позиций от (¿, х) до (¿,х,г) и является основой доказательства существования равновесной по Бержу ситуации, конечно, наряду с применением гермейеровской свертки функций выигрыша и теории антагонистических позиционных дифференциальных игр (в квазидвижениях). Итак, подчеркнем еще раз, что в системе (7) (с «расширенной динамикой» за счет N поводырей (г € Н)) позицией игры, уже становится тройка (¿, х,г) € [0,$) х М2т. Аналогом определения 1 здесь уже можно считать

Определение 2. Набор стратегий 7в = (^в,..., ) € V = Л 5г назовем реали-

геН

зующим в игре Ге концепцию равновесности по Бержу, если

ВД0,*о,хо,Щ] II хг[$,^о,хо, ]) < ^г(х[$,^о,хо,7в]) (г € Н) (8)

при любых квазидвижениях г[-,£о,хо, Щ € ^[¿о,хо, Щ системы (6), порожденных из начальной позиции (¿о,хо) любым возможным набором стратегий

7= (71,..., ) — й(*,х,г) € д V(í,x,z) € [0,$) х К2т

и любых квазидвижениях ж[£,£0,ж0,Ув] системы (4), порожденных из (¿0,ж0,ж0) набором стратегий Ув = (Ув,..., Ув) С V, иВ — ив(¿, ж, г) С Яг V(t, ж, г) С [0, $) х Е2т (г С М), напомним, что (г || жг) = (г1,..., гг-1, жг, гг+1,..., ).

Заметим, что пучки

^[¿0,У0,УВ] С ^[¿0,У0,УгВ] (г С М),

и поэтому при «замороженных» (¿0, у0) = (¿0, ж0, ж0) С [0, $) х Е2т, Ув С VI выигрыш каждого г-го игрока ^г(ж[$, ¿0, ж0, Ув]) единственен (что сразу следует из (8)).

Целью этого раздела статьи является доказательство существования такого набора Ув (при выполнении условий 3).

3. Вспомогательная антагонистическая игра

Для доказательства существования набора ув С V, реализующего концепцию равновесности по Бержу (далее, для краткости называем равновесным по Бержу набором стратегий в игре Ге), будем использовать вспомогательную антагонистическую позиционную дифференциальную игру

Г„ = ({/,//}, Е — (7), V, А,^(ж[$],,г[$])) = р(у[$])>. (9)

В ней стратегии У у 1-го игрока (минимизирующего функционал <^(ж[$], г[$])) отождествляются с п-вектор-функциями у(£, ж,г) С Я при любых £ С [0,$) и (ж, г) С К2т, множество {у} обозначили символом V; стратегии 11-го игрока и (максимизирующего <^(ж[$], г[$])) вводятся аналогично: и — и(£, ж,г) С Я при всех (¿,ж,г) С [0,$) х Е2т и {и} = А, применяем далее и ситуации (У, и) С V х А. Затем, строим пучки квазидвижений X[¿0,ж0, у] системы (4), ^[¿0,ж0, и] системы (6) и [¿0,ж0, у, и] системы (7), порожденных из (¿0,ж0) стратегией 1-го игрока У С V, стратегией и С А игрока II и ситуацией (у, и) соответственно, при этом используем также 2т вектор-столбец у = (ж, г).

Функция выигрыша игрока II (проигрыша игрока I) формируется следующим образом (с помощью функций выигрыша ^(ж[$]) для г—го игрока в игре Ге). Именно, каждая из скалярных функций ^¿(ж) (г С М) определена на области достижимости X[$,£0,ж0, У — Я] = X[У — Я] системы (4), причем X[У — Я] совпадает с областью достижимости % [$, ¿0, ж0, и — Я] = % [и — Я] системы (6). Эти области достижимости являются компактами в Кт. С помощью ^г(ж) (г С М) уже аналитически конструируем используемую в (9) скалярную функцию

<^(у) = шах[^г(г || жг) — ^г(ж)]. (10)

геМ

Утверждение 4. При выполнении условий 3 в игре Га существует седловая точка (ув, йо) € V х А, определяемая цепочкой неравенств

^(у[^о,Уо,ув]) < В,у0]) < ^[^Уо,^]) (11)

для любых квазидвижений у[-,£о,уо, Vв] € ^[¿о,уо, Vв],

уМо,Уо,ув,уо] € ^[¿о,Уо,уВ,уо], уМо,Уо,уо] € ^[¿о,Уо,уо]

системы (7), порожденных из начальной позиции (¿о,яо) стратегией 1-го игрока ув, ситуацией (ув, й7о) и й7о — стратегией игрока II соответственно.

Доказательство. Согласно теореме 3.1 из [6, с. 43] в игре Га существует седловая точка (уB, U0) G V х A при любом выборе начальной позиции (t0,y0) G [0,$) х R2m, если выполнены условия 3, функция <^(x, z) непрерывна на X[V^Q] х Z[U^Q] и имеет место условие седловой точки для маленькой игры [7, с. 56] . Если F(x) непрерывна, то [8, с. 54] непрерывной по x G X[V ^ Q] и z G Z[U ^ Q] будет и <^(x,z) (следует из компактности в Rm множеств X[V ^ Q] и Z[U ^ Q], а также непрерывности F(x) (i G N)). Проверим, наконец, выполнение условия седловой точки для маленькой игры: это требование означает, что для каждой позиции (t, y) G [0, $) х R2m и любого 2т-вектора (si,s2) G Rm х Rm существует седловая точка (vB, u0) G Q х Q

max[s'1/x v) + s2/(t z u0)] = s1/(t x vB) + s2f (t z, u0) = veQ

= min[s1/(t,x,vB) + s'2/(t,z,u)] Vu, v G Q (12)

(напомним, что штрих сверху означает операцию транспонирования и поэтому s1 есть m-вектор-строка).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из «разделенности» (12) следует, что выполнение (12) эквивалентно существованию пары (vB , u0) G Q2, удовлетворяющей двум равенствам

max si/(t,x,v) = si/(t,x,vB), veQ

min s2/(t,z,u) = s2 / (t,z,u0),

а само существование (vB, u0) при «замороженных» (t, x, z, s1, s2) G [0, $) х R4m сразу получаем из непрерывности /(t, x, v), /(t, z, u) по управляющим воздействиям v G Q, u G Q, а также компактности Q (теорема Вейерштрасса).

Итак, установлено, что при выполнении условий 3 в Га существует седловая точка (УB ,У0) G V х A. □

4. Теорема существования

Теорема 1. Пусть для игры (1) выполнены условия 3. Тогда при любом выборе начальной позиции (¿0,х0) € [0,"$) х в бескоалиционной дифференциальной позиционной игре Ге существует равновесный по Бержу набор стратегий ув € V, т. е. для ув имеет место (8).

Доказательство. Согласно утверждению 4 в игре Га существует седловая точка (ув, и0) € V х А, для которой имеет место цепочка неравенств (11). В правом неравенстве из (11) каждое квазидвижение у[-, ¿о, Уо, &0] образует два квазидвижения х[^,£0,х0, V] и ¿ф,£0,х0, &0] систем (4) и (6) соответственно, где могут использоваться V V € V. Положив здесь V = &70 получаем, что при любых таких квазидвижениях х[^,£0,х0, &0] и ¿ф,£0,х0, &0] функция ¿0, У0, &0, &0]) = 0. В самом деле, для каждого квазидвижения х [•, £0, х0, &0] найдется совпадающее (при каждом £ € [£0,"]) с ним г[^£0,х0,&0] и обратно.

Из (11) и ¿0, у0, &70]) = 0 следует, с учетом единственности, что

¿0, у0, Vй, &0]) < 0, и тогда снова, согласно (11), имеем

р(у[",*0,у0, Vв]) < 0 V У[^,*0,У0, Vв] € ^[¿0,У0, Vв].

Любое квазидвижение у[-,£0,у0, Vй], согласно (7), образуют всякие пары квазидвижений х[-,£0,х0, ув] и 2ф,£0,х0, &] системы (4), порожденные набором ув € V и системы (6), порожденные каким-либо набором & € А соответственно из одной и той же начальной позиции (£0,х0).

Так как ^(х,г) = шах[^(г || х^) — ^¿(х)] < 0 (см. (11)), то отсюда и из (12) для каждого г € N имеем

ВД",*0,х0,&] || хг[",£0,х0,ув]) — ^г(х[",£0,х0,Ув]) < 0 (13)

при любых квазидвижениях г[-,£0,х0, &] системы (6) для всяких & € А и всех квазидвижениях х[-,£0,х0, Ув] системы (4), порожденных из начальной позиции (£0,х0) набором & и ув соответственно. Учитывая включение [¿0,у0, Vв] С [£0,у0,У^в] (г € М) и выполнение неравенств (13) для любых участвующих в них квазидвижениях, устанавливаем,

во-первых, единственность ^¿(х[", ¿0, х0, Vв]) для каждого г € М, во-вторых, справедливость (8) при V х[-, ¿0,х0, ув], х[-, ¿0,х0, Vв], 2ф,£0,х0,Ц7] Ш € А. □

Заключение

В работе получены следующие результаты: доказано существование ситуации равновесия по Бержу для дифференциально бескоалиционной позиционной игры при обычных для таких игр ограничениях. Основой доказательства является применение гермейеровской свертки функций выигрыша игроков, использование управления с поводырем и математической формализации квазидвижений динамической системы.

Исследование выполнено при финансовой поддержке РФФИ, проект №14-0190408 Укр_а и НАН Украины, проект №03-01-14.

Описок литературы

1. Вайсман, К.С. Равновесие по Бержу: автореферат дис. ... канд. физ. мат. наук. — СПбГУ, 1995. — 13 с.

VAISMAN, K. (1995) The Berge equilibrium: abstract of diss. ... cand. of phys. math. sciences. SPbSU.

2. ZHUKOVSKIY, V., SALUKVADZE, M. and VAISMAN, K. (1994) The Berge equilibrium: preprint. Tbilisi: Institute of Control Systems.

3. Вайсман, К.С. Равновесие по Бержу // Линейно-квадратичные дифференциальные игры / Жуковский, В.И., Чикрий, А.А.. — Киев: Наукова Думка, 1994. — C. 119-142.

VAISMAN, K. (1994) The Berge equilibrium. In ZHUKOVSKIY, V. and Chikrii, A. Linear-quadratic differential games. .Kiev: Naukova Dumka

4. COLMAN, A., KORNER, T., MUSY, O. and TAZDAIT, T. (2011) Mutual support in games: some properties of Berge equilibria. Journal of Mathematical Psychology, Article in Press. . p. 1-10.

5. Гермейер, Ю.Б. Введение в теорию исследования операций. — M.: Наука, 1971. — 384 с. GERMEYER, Y. (1971) Introduction to the theory of operations research. Moscow: Nauka.

6. Жуковский, В.И., Салуквадзе, М.Е. Оптимизация гарантий в многокритериальных задачах управления. — Тбилиси: Мецниереба, 1996. — 447 с.

ZHUKOVSKIY, V. and SALUKVADZE, M. (1994) The Vector-Valued Maximin. N.Y. inc.: Academic Press, Inc.

7. Красовский, Н.Н., Субботин, А.И. Позиционные дифференциальные игры. — M.: Наука, 1974. — 456 c.

KRASOVSKIY, N. and SUBBOTIN, A. (1974) Differential games. Moscow: Nauka.

8. Морозов, В.В., Сухарев, А.Г., Федоров, В.В. Исследование операций в задачах и упражнениях. — M.: Наука, 1986. — 287 c.

MOROZOV, V., SUKHAREV, A. and FEDOROV, V. (1986) Operations research in problems and excercises. Moscow: Nauka.

Статья поступила в редакцию 26.05.2015

i Надоели баннеры? Вы всегда можете отключить рекламу.