Научная статья на тему 'Some problems of theory of nonantagonistic differntial games'

Some problems of theory of nonantagonistic differntial games Текст научной статьи по специальности «Математика»

CC BY
89
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕАНТАГОНИСТИЧЕСКАЯ ПОЗИЦИОННАЯ ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / СТРАТЕГИИ / ДВИЖЕНИЯ / РАВНОВЕСНОЕ РЕШЕНИЕ ПО НЭШУ / НЕУЛУЧШАЕМОЕ ПО ПАРЕТТО РЕШЕНИЕ / РЕШЕНИЕ ПО ШТАКЕЛЬБЕРГУ / NONANTAGONISTIC POSITIONAL DIFFERENTIAL GAME / STRATEGIES / MOTIONS / EQUILIBRIUM NASH SOLUTION / UNIMPROVABLE ON PARETTO SENSE SOLUTION / SHTACKELBERG SOLUTION

Аннотация научной статьи по математике, автор научной работы — Kleymenov Anatoliy Fyodorovich

Some general ideas and results of nonantagonistic positional differential game are given. The work is executed with support of Russian Fundamental Researches Fund, project № 09-01-00313.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Some problems of theory of nonantagonistic differntial games»

отделения Российской академии наук (интеграционный проект СО РАН-УрО № 85).

Поступила в редакцию 5 октября 2009 г.

Dykhta V. A. Hamilton-Jaeobi inequalities in the optimal control theory: smooth duality and control improvement. For classical optimal control problem with terminal constraints, new variants of the Caratheodory and Krotov types global necessary and sufficient optimality conditions are proposed and compared. In a spirit of so-called Hamilton-Jacobi canonical optimality theory, these conditions are obtained by using some sets of strongly monotone solutions to the corresponding Hamilton-Jacobi inequality and have forms of duality relations between the optimal control problem and an extremal problems on the sets of strongly monotone Lyapunov type functions. A control improvement procedure is proposed using the Hamilton-Jacobi inequality for weakly monotone functions and the method of proximal (or extremal) aiming.

Key words: monotone Lyapunov type functions; Hamilton-Jacobi inequalities; global optimality conditions; smooth duality; control improvement.

УДК 519.83

ПРОБЛЕМЫ ТЕОРИИ НЕАНТАГОНИСТИЧЕСКИХ ПОЗИЦИОННЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР

© А. Ф. Клейменов

Ключевые слова: неантагонистическая позиционная дифференциальная игра; стратегии; движения; равновесное решение по Нэшу; неулучшаемое по Паретто решение; решение по Штакельбергу.

Приведены основные идеи и результаты теории неантагонистических позиционных дифференциальных игр.

1. Динамика.

Пусть динамика управляемой системы описывается уравнением

т

X = ^2 ^ (£,х,и) , т ^ 2 (!)

г=1

х е Еп, £ е [£о, #] , иг е Рг е сотрЯш, х(£о) = хо,

где управление и подчинено г-ому игроку. Пусть заданы I показателей качества вида

1г = аг(х(д)),г = !,...т (2)

где I ^ т.

Предполагаем,что функции f непрерывны по совокупности аргументов, липшицевы по ж и удовлетворяют условию продолжимости решений на [to, $] , функции &i—непрерывны.

Случай l = m

1) I\ = ... = Im = I - задача командного управления (team problem).

2) Ii = ... = Ik = I, Ik+1 = ■■■ = Im = —I, 1 ^ k ^ m — 1 - групповая антагонистическая дифференциальная игра (групповая АДИ).

3) остальные случаи - пеаптагопистическая дифференциальная игра (НАДИ).

Случай l < m

4) Ii = ... = Ii = I - задача командного управления с неизвестной динамической помехой,

l=1

о) остальные случаи - НАДИ при наличии динамических помех.

2. Формализация стратегий и движений в НАДИ.

Мы используем формализацию стратегий pi движений в пеаптаготтистических позиционных дифференциальных играх, аналогичную формализации в антагонистических позиционных дифференциальных играх [1, 2] с введением дополнительных технических деталей [3J.

Позиционная стратегия игрока i: Ui ^ [ui(t,x,e), pi (е)}, i = 1, 2,...m, где ui(-) - произвольная функция, зависящая от позиции (t, ж) и параметра точпости е со значениями в множестве Pi. Функция Pi : (0, ж) ^ (0, ж) непрерывна, монотонна и удовлетворяет условию f3i (е) ^ 0 при е ^ 0. При фиксированном е величина @i(e) есть верхняя граница шага разбиения отрезка [to, 0],

i

Рассматриваем движения двух типов: аппроксимационные pi предельные.

Аппроксимационное движение ж [■,to,Xo ,Ui^i, Ai, ...,ит,ет, Am] при фиксированных значениях параметров точности игроков el, ...ет, фиксированных разбиениях Ai = {t(i)},..., Am =

= {t^} отрезка [to, 0], выбираемых каждым игроком при условии S(A{) ^ &(е£),к = 1,...,m.

Здесь 5(Ai^max(t^i+i — t^).

t х2 хп. t

----1----1—I—I------------1—I----------------------1-►

to e

Предельное движение, порожденное набором стратегий (и1,...ит) из начальной позиции (£о, хо), есть непрерывная функция хЩ= х[£, £о, хо, ^1, ...ит], являющаяся равномерным пределом

последов стельности Э/ПпроксимЭ/Ционных движении

{х [г,го,хо,и1,£{, А1,...,ит,£т, дт]} при 8 ^ ж, е\ ^ 0, г8о ^ £о, хо ^ хо ^(А|) ^ вг(е\), г = 1..., т.

Набор стратегий (^1, ...ит) порождает непустое компактное (в метрике пространства С[£о,0]) множество X(£о, хо, ^1, ...ит), состоящее из предельных движений х[-,1о, хо, и1, ...ит].

3. Выбор понятия решения.

Равновесное по Нэшу решение (Ж-решение):

Определение1. Набор стратегий (и%,...и.%) образует N -решение, если Ух*(-) е X(Ьо,хо,и^,...и%), V т е [£о,$), Уг е 1,т тахаг(х($,т,х*(т), и%, ...игг-1, иг, и%+1, ...и%)) ^

тш аг(х(§,т, х*(т), и?,..., и?, ...и?)), где операции тах и тгп берутся по соответствующим множествам предельных движений. Неулучшаемое (по Парето) N-решение (Р*-решение):

Определение 2. N -решение (и?*, ...и? )образуетР*-решение, если У(и?, ...и?) г, г = 1, ... , т,

аг(х($, и?,..., и?, ...и?)) = аг(х($, и?, ...и?)), либо найдется ] , такое,что выполняется неравенство

а, (х(§, и?,..., и?, ...и? )) < а, (х($, и? * ,...и? *))

Определение 3. Нг -решение определяет ся как Р *- решение, наилучшее для г—игрока.

Решение по Штакельбергу в иерархической игре (т = 2) с лидером г-ым игроком (Зг—решение)

х = /1 (г,х,п) + /2 (1,х,у) (3)

Определим З -решение.

Предположение 1. Первый игрок-лидер объявляет стратегию и * + п*(Ь,х,е), @1(е)} до начала игры.

Предположение 2. Второй игрок - ведомый рационален. Это означает, что он выбирает свою стратегию из условия

а2(х(§, го,хо, и *, V)) —► тах

Пусть К2(и*)—множество рациональных стратегий, соответствующих объявленной стратегии и*

Ставится задача а1(х(§,1о,хо,и^ е К2(и))) —► тах,

и пусть (и51 — решение этой задачи, тогда

Определение 4. Пара стратегий (и31, V е К2(и31)) образует 51-решение.

Аналогично определяется З^-решение.

4. Расширенный набор элементов игры.

1.Уравнения движения, начальные условия, множество игроков, ограничения на их управле-НИ я.

2.Формализация стратегий и порождаемых ими движений.

3.Функции выигрыша.

Элементы 1-3 составляют нормальную форму игры.

4.Множество разрешенных коалиций отклонения (РКО) и для каждой РКО-множество разрешенных моментов отклонения (РМО).

5.Описание поведения игроков, не вошедших в отклонившуюся коалицию, после отклонения этой коалиции.

Определение 5. Набор стратегий называем допустимым, если ни одной РКО ни в один РМО невыгодно отклоняться от набора.

Множество допустимых наборов обозначим через О.

6.Описание дополнительных условий па допустимые наборы стратегий О* С О.

7.Описание последовательности (порядка), в котором игроки осуществляют выбор набора стратегий.

и

Обозначим через Т(О*) множество неулучшаемых (по Парето) элементов множества О* относительно показателей 11,12,..., 1т.

Определение 6. и - решением называем любой элемент множества Т(О*), если выбор игроками стратегий одновременный. Если же выбор иерархический, то сначала находим множество Т1 С Т(О*) всех неулучшаемых элементов для игроков верхнего уровня иерархии;

Т2 С Т1 и и

элементов игры можно добиться совпадения его с каждым из описанных выше понятий решения игры.

т=2

В варианте I, в котором

4. Множество РКО: {1}, {2}; РМО - [го,в].

5. Неуклонисты выбирают любую стратегию.

6. Доп. условий нет.

7. Выбор одновременный.

и Р*

В варианте II, отличающемся от I элементом 7: г

и Нг

В варианте III, отличающемся от II элементом 4:

4.Множество РКО: 3 — г; РМО - ^о,в]. и~решения совпадают с Зг-решениямп.

В варианте IV, отличающемся от I элементом 4.

4. Множество РКО пусто.

иР

По сути дела получена классификация решений в неантагонистической дифференциальной позиционной игре. По предлагаемой схеме можно генерировать новые понятия решений. Вернемся снова к игре двух лиц. Динамика игры описывается уравнением (3).

5. Вспомогательные антагонистические позиционные дифференциальные игры Г1 и Г2.

Г1

пал а1(х(в)) (2),а игрок 3-1 ему противодействует.

Г1 Г2

пг(1,х,е), ьг(Ь,х,е), г = 1,2 (4)

и непрерывные функции цены

71(1, х) и 72(1, х) (5)

Свойство универсальности стратегий означает, что они оптимальны не только для фиксированной начальной позиции (Iо,хо) е О, но и для любой позиции ^*,х*) е О, рассматриваемой в

качестве начальной.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Нестандартные задачи управления и оптимального управления

Задача 1. Найти измеримые функции и(г) и ь(г), го ^ г ^ в, которые порождают траекторию х(г) го ^ г ^ в, удовлетворяющую неравенствам

7г(г,х(г)) ^ ъ(в, х(в)), го ^ г ^ в, г = 1, 2 (6)

Задача 2. Для фиксированного а,1 е (0,1), а2 = 1 — а,1 найти решение задачи 1, которое максимизирует показатель тш аг аг(х(в)).

Задача Зл (1=1,2). Найти решение задачи 1, которое максимизирует показатель аг(х(в)). Задача 4л (1=1,2). Найти измеримые управления и(г) и у(г), го ^ г ^ в, которые порождают траекторию х(г) го ^ г ^ в, удовлетворяющую неравенству 7з-г(г,х(г)) ^ 7з-г(в,х(в)), и максимизируют показатель аг(х(в)).

Пусть кусочно-непрерывные функции и* (г) и У*(г), го ^ г ^ в порождают траекторию х*(г), го ^ г ^ в системы (3).

Рассмотрим стратегии первого и второго игроков

и0 + {п0(г,х,є), 0°(є)}, V0 + {у0(г,х,є), 0°(є)}, (7)

где

) если IIх - х-т < М , (8)

і п2(г,х,є), если \\х — х*(г)\\ < є^ (г)

0. . \у* (г), если ||х — х*(г)\\ < єр (г)

V (г,х,є) = < л

IV (г,х,є), если \\х — х*(г)\| < єр(г)

для всех г £ [го, @\-

Функции ві(■) и положительная возрастающая функция р(-) выбраны так, что неравенство

\\х(г, г0,х0, и0, є, А1, V0, є, а2) — х*(г)\| < єр(г) (9)

выполнено при є > 0, 5(Аі) ^ ві (є) Функции и(2\^) и v(1)(■) определены в (4).

Теорема 1.[3]. Пусть управления и*( ) и V*(■) доставляют решение задачи 1 (или задачи 2, задачи 3-і, задачи 4-і)- Тогда пащ стратегий (и0, V0') (7)-----(9) есть М-решение (или Р* - реше-

ние, Н,і-решени е, Бі-решен ие). Обратно, для, л, юбого N-решен ия (или Р *-решени я, Ні-решения,

Бі-решения) существует эквивалентное решение того же типа в форме (и0, V0') (7)---------------(9), где

и*( ) и ^^( ) решение задачи 1 (или задачи 2, задачи 3-і, задачи 4-і)-

Теорема 1 устанавливает соответствия между множествами решений задач 1, 2, 3-і, 4.і и множествами N, Р*? Ні, £і-решений. Эта теорема определяет также структуру решений игры. Теоремы существования N Р% Ні, £і-решений являются следствиями теоремы 1. Отметим, что стратегии П2 (г, х, є), v(1) (г, х, є) можно трактовать как стратегии наказания.

и

Отмєтрім две главные, тта папт взгляд, проблемы, с которыми приходится считаться при использовании решений пэптевского типа.

Первая состоит в том, что решений, как правило, много. И выбор одного решения різ множества рептетшй представляет собою сложную задачу с точкрі зретшя мотрівацрш этого выбора. Вторая состоріт в том, что пэптевское рептетше не всегда бывает хороітшм в другріх аспектах. Пррі-ведем прршеры, ріллтостррірутощріе указанные две проблемы.

7. П р Рі м е р 1.

х = /і (г, х, и) + /2 (г, х, V)

Пусть векторное уравпепріе

( = и + V, ( Є М2,п Є М2^ Є М2

(10)

(И)

описывает движение материальной точки единичной массы в плоскости (£1, (2) под действием силы Р = и + V, ||и|| ^ 1, ||VУ ^ 1. Первый (второй) игрок, который распоряжается управлением и (у), стремится максимизировать показатель ог(((§)) (02((($))), где

*1 (( И) = — С (V)

-а(і)

, а

(і) = (аЦ],а^У), і = 1,2

(12)

Здесь а(г), г = 1, 2 - заданные целевые точки игроков. Обозначая у1 = £1, у2 = (1, уз = (2, у4 = (2 и делая замену переменных х1 = у1 + ($ — г)у3, х2 = у2 + (•& — г)у4, х3 = уз, х4 = у4, получаем сртстему, первое рт второе уравпетшя которой будут

\ х 1 = (V — г)(т + и1), [х 2 = (V — г)(и2 + ^2

Далее, (11) может быть перепрісатіо

аі(х(&)) = — х(&)

-а(іі

, х = (х1,х2), і = 1,2

(13)

(14)

Достаточно рассмотреть только укороченную срістєму (12) с показателямрі Рігроков (13). Пусть заданы следутопще начальные условрія рі зпачетшя параметров:

г0 = 0, С01 = 2,2, (01 = —0, 8, (02 = 1, 3, (02 = —0,2^ = 2, а{11) = —1, а^ = 5, а^ = 5, а^ = 4.

Тогда имеем х01 = 0, 6, х02 = 0, 9.

Были построены множества N -решений, Р * -решени й, Ні -решений и Б і -решений, которые опрпттем через множества концов траекторрій, порожденных этршрт реїттепріямрі. На ррісутіке круг радиуса 4 с центром в начальной точке В(0.6, 0.9) представляет множество достижимости системы (12) в момент V = 2.

а(1) к х? * 2

Замкнутая кривая ограничивает множество концов траекторий, порожденных

Ж-решенпямп. Кривая Р1^1 ^2^2 есть множество концов траекторий для Р*-решений. Точка

- единственная конечная точка для траектории, порожденной б^-решением и ^-решением одновременно. Точка ^2 - единственная точка, порожденная б^-решением и ^-решением одновременно.

Видно, что множество Ж-решений, а также множество Р*-решений содержат много решений. И выбор одного единственного решения представляет собою Проблему 1.

8. П р и м е р 2.

Повторяющаяся биматричная игра 2 х 2 типа "дилемма заключенного"

Первая стратегия С обоих игроков: кооперироваться. Вторая стратегия Б обоих игроков: отклониться от кооперации. N - решением в статической игре является пара (0,0), которая доставляет выигрыш в (-8 ) единиц обоим игрокам. В то же время выигрыш па наборе (С,С) составляет (-1) ед. у обоих игроков.

Пусть игра повторяется. Если число повторений конечно и заранее известно, то Нэптевским решением будет:(В,В) па каждом птаге. Возникает Проблема 2: как выбирать стратегии, чтобы привести игру как можно ближе к состоянию (С,С)?

9. Разбиение множества позиций в НАДИ.

Определение?. Позиция (г*, х*) называется неантагонистической (NA - позицией), если существует траектория х(г), г* ^ г ^ в, х(г*) = X* системы (3) такая, что функции 7і(ї,х(ї)) (5), і = 1, 2 не убывают на [г*, в] и хотя бы для одного і выполняется строгое неравен-

Статическая игра

кооп откл

А

откл

кооп

7г(в,х(в)) > ъ(и,х*)

Упомянутую траекторию назовем ЖА - траекторией.

Определение 8. Позиция (г*, х*) называется локально антагонистической (ЬА - позицией), если она не является неантагонистической и существует траектория системы (3) х(г), г* ^ г ^ ^ в, х(г*) = х* такая, что выполняются неравенства

7г(в, х(в)) ^ 71 (г, х(г)), г* ^ г ^ в, г = 1,2

и, кроме того, по крайней мере одно неравенство является строгим при г = г*.

ЬА

Определение 9. Позиция (г*,х*) называется глобально антагонистической (СА -позицией), если для любой траектория системы (1) х(г), г* ^ г ^ в, х(г*) = х* либо выполняются равенства

7г(в,х(в)) = 7г(г*,х*) г = 1, 2, либо по крайней мере для одного ] неравенство

Ъ(в,х(в)) < Ъ(т,х(т))

для некоторого Т € [г*, в).

СА

ется тождество

7г(г, х(г)) = 7г(и,х*), г* ^ г ^ в, г = 1,2.

СА С1 ЖА

ций, через С2 - множество ЬА - позиций, и через Сз - множество СА - позиций. Множество С всех возможных позиций представимо в виде

С = С1и С2и Сз

Теорема 2. (для НАДИ с информацией у игроков относительно (г,х) ) [4]. Если на-

ЖА Р* ЖА

ЬА СА Р*

СА

ТеоремаЗ. ( для НАДИ с информацией у игроков относительно (^ х) и хо ) [Клей-

ЖА Р*

ЖА ЬА ЬА

Р* ЬА СА

Р* СА

Обратимся к рассмотренному выше Примеру 1. Приведенные уравнения движения и ограничения на управления имеют вид:

Гх 1 = (в — г)(ш + у{),

2 = (в - г)(П2 + У2), \\п\\ ^ 1, |Н| ^ 1

аг(х(в)) = — ||х(в) — а(г) Ц; а(г - заданные целевые точки;

С = (—ж,в] х Я2;

Тогда нетрудно найти, что Сз = (—то, в] х [а(1)а(2)^, а множество С1 состоит из всех остальных С С2

10. ПримерЗ.

{х1 = и1 + ь1

х2 = и2 + у2 ||«|| ^ 1, ||-и|| ^ 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а1(х(в)) = — ||х(в) — а(1) ||,

&2(х(в)) = уД \х1(в)\ — х2(в).

Тогда имеем ^1(Ь, х) = — ^х — а(1) ^ , 72(Ь, х) = л/3 \х]_ \ — х2

Фиксируем а(1) = (1, \/3). Линия КОЬ есть линия уровня функции ^(г,х), проходящая

через точку Са(1) ± ОС СЕ ± Оа(1), \ СЕ \= 3/2. С' С

г = оопвг. Опишем разбиение С' на подмножества С*, С2, и СЗ при г = в — л/3/4.

С2 есть множество [СЬ);

С3 есть множество (АС) У[а(1)В);

С\ состоит из всех остальных точек.

11. Подход к построению решений в позиционной НАДИ двух лиц.

Предлагаемый подход к построению решений в позиционной НАДИ базируется на:

- использовании принципа неухудшения гарантированного результата игроков;

- использовании правила максимального сдвига на направлении Нг-решенпя;

- на использовании нэшевских равновесий во вспомогательных биматричных играх.

Основная идея

Пусть векор в1 задает направление, желаемое для первого игрока, а вектор в2 задает направление, желаемое для второго игрока.

Определим пары (п1,у1) и (п2, у0) из условия максимального сдвига на направления в1ъ в2 соответственно. Рассмотрим предлагаемую процедуру более подробно для игры с динамикой (3) и функционалами (2).

Сначала мы определяем функции р0 : С —► Я1 и р0 : С —► Я1, предполагая, что р>0{Ь,х) есть значение функционала (2) игрока г на Нг-решенпп, если позиция (г, х) принимается за начальную.

Обозначим через Б0 множество векторов выигрышей игроков (11,12) (2), которые достигаются па Р*-решениях игры (3), (2).

Теперь опишем процедуру Ь(Б°, р0(-), р2(')), которая позволит нам па основе множества Б0 и функций р1(г,х) и р0,{Ь,х), (Ь,х) € С, построить множества Б1 С Б0 и определить функции р^(Ь,х) и р^(Ь,х), (г,х) € С. Предположим, что задана позиция (г,х) € С (где ^ ^ г < в) . Тогда будут определены множества Р*(г,х), Н1(г,х) и Н2(г, х)-решений и множества Б°(г,х) для позиции (г, х), рассматриваемой в качестве начальной. Рассмотрим следующую г-модель, динамика которой описывается уравнением (3)

4 = Ь(т,г,п) + 1'2(т,г,у) (15)

г(г) = х, т € [г, в]

Обозначим через г1 (т), г ^ т ^ в и г2(т), г ^ т ^ в траектории, порожденные Н1-решением и

Н2-решенпем, соответственно. Фиксируем е > 0. Рассмотрим векторы

в!(г,х,е) = г1 (г + е) — х,

в2(г, х, е) = г2(г + е) — х.

Определим векторы п0(г,г,е), у10(г,г,е), п2,(г,г,е) и у20(г,г,е) из условий

тах в^Р [f1 (т,г,п) + Ыт,г,у)] = пеР,уеЯ 1

в0Т [Л(т,г,п0) + Ь(т,г,у°0)] ,

тах в2Т [Н1 (т, г, п) + Н2(т, г, у) = в0Т [Л (т,г,п0°) + Н2(т,г,у%)] .

Теперь сконструируем биматричную 2 х 2 игру (А, В), в которой первый игрок имеет две стра-п01 п02

у10 у20

А = ( а11 а12 ^ , В = ( Ъ11 Ъ12 ^

\ а21 а22 ) \ Ъ21 Ь22 )

aгj = р°°_(г + е,х + (Н (г,х,п0) + д(г,х,у0))е),

Ъц = р°0(Ь + е,х + (Н (г,х,п0)+ д(Ь,х,у°0))е),

г,Э = 1,2.

Очевидно, что an ^ a2i и Ъ22 ^ Ъ21, что позволяет нам исключить ситуацию (2,1) при нахождении нэшевскпх равновесий в игре (A, B). Нетрудно показать, что игра (A, B) имеет по крайней мере одно нэшевское равновесие в чистых стратегиях. Управления и(т, z,e) и v(r,z,e), которые

(A, B)

z(r), t ^ т ^ t + e системы (8). В дополнение к условию (4), которое при т = t имеет вид

ji(9, x(9)) ^ Yi(t, z(t)),t ^ т < 9,i = 1,2, (16)

добавляем следующие условия

ji(9,x(9)) ^ Yi(t + е, z(t + e)),i = 1,2. (17)

Условие (10) влечет, ЧТО множества P*(t,x), Hi(t,x) И H2(t, х)-решений, вообще говоря, изменились. Обозначим их через множества P(1) (t,x) H^1 (t,x) и H21 (t, x)-pemennft, соответственно. Пусть pj(t, x) есть значение функци он ала (2) i -го игрока на Н^ - решении. Обозначим через S 1(t,x) множество векторов выигрыша игроков (Ii, I2) (2), которые достигаются на P(1)-решениях. Аналогично, процедура L(S1, р^(-), р2(')) доставляет множества

P(2') (t, x)-pemeHnй, H1^\t, x)-pemeHnft и Н^2 (t, x)-pemennft, а также функции p\(t, x) и множество S2(t, x).

При этом имеем S2(t,x) С S1 (t, x). Переходя к пределу, получаем непустое множество Sкоторое, в частности, может состоять из единственной точки. Пара стратегий u(t,x,e) и v(t,x,e), доставляющая вектор выигрыша из множества S^, является как раз искомой парой рациональных стратегий P1 и P2. Имея в виду неединственность ^-решений и ^-решений, описываемый алгоритм порождает многозначные функции-стратегии U(t,x,e) и v(t,x,e). То есть для нахождения движений мы имеем дифференциальное уравнение с многозначной правой частью.

В заключение отметим, что в работе [4] предложено одно из решений Проблемы 1, а в работах [6, 7] было предложено решение Проблемы 2 для повторяющейся биматричной игры типа дилеммы заключенного.

ЛИТЕРАТУРА

Х.Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

2. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.

3.Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.

4. Клейменов А.Ф. О решениях в неантагонистической позиционной игре // ПММ. 1997. Т.61. Вып.5. С. 717-723.

5. Клейменов А.Ф. Различные типы решений в позиционной неантагонистической дифференциальной игре. // Вестник Тамб ун-та. Сер. Естеств. и техн. науки. Тамбов. 2007. Т. 12. Вып.4. С. 464-466.

6. Kleimenov A.F. An approach to building dynamics for repeated bimatrix 2x2 games involving various behavior types. // Dynamic and Control. / L.: Gordon & Breach Sci.Publ. 1998.

7. Kleimenov A.F., Kryazhimskii A. V. Normal behavior, altruism and aggression in cooperative game dynamics. // Int. Institute for Applied System Analysis. Interim Rep. IR-98-076. Laxenburg, 1998.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект 09-01-00313.

Поступила в редакцию 5 октября 2009 г.

Kleymenov A. F. Some problems of theory of nonantagonistie differntial games. Some general ideas and results of nonantagonistie positional differential game are given.

Key words: nonantagonistie positional differential game; strategies; motions; equilibrium Nash solution; unimprovable on Paretto sense solution; Shtaekelberg solution.

i Надоели баннеры? Вы всегда можете отключить рекламу.