Научная статья на тему 'Численное построение решений в классе неантагонистических позиционных дифференциальных игр'

Численное построение решений в классе неантагонистических позиционных дифференциальных игр Текст научной статьи по специальности «Математика»

CC BY
169
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕАНТАГОНИСТИЧЕСКАЯ ИГРА / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / РАВНОВЕСНОЕ ПО НЭШУ РЕШЕНИЕ / ЧИСЛЕННОЕ РЕШЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Кувшинов Дмитрий Рустамович

Представлен численный алгоритм построения равновесных (и, в частности, неулучшаемых) по Нэшу решений неантагонистической позиционной дифференциальной игры двух лиц с терминальными показателями качества, геометрическими ограничениями на управления игроков и динамикой с разделяющейся по управлениям игроков правой частью. Формализация стратегий игроков и порождаемых ими движений основывается на формализации и результатах теории позиционных антагонистических дифференциальных игр, разработанной Н.Н. Красовским и его научной школой. Задача нахождения решений игры сводится к решению нестандартных задач оптимального управления. Численный алгоритм задействует ряд алгоритмов вычислительной геометрии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NUMERICAL CONSTRUCTION OF SOLUTIONS IN A CLASS OF NON-ANTAGONISTIC POSITIONAL DIFFERENTIAL GAMES

The report is devoted to a numerical algorithm for the construction of Nash equilibrium solutions (including non-improvable ones) in a non-antagonistic positional differential game with two players, terminal payoff functionals, geometric constraints on choice of controls and dynamics with separating right part. Formalization of the players's strategies and motions generated by those strategies is based upon formalization and results of the theory of antagonistic positional differential games developed by N.N. Krasovskii and his scientific school. The problem of game solutions construction is reduced to the solution of nonstandard optimal control problems. The numerical algorithm uses a number of computational geometry algorithms

Текст научной работы на тему «Численное построение решений в классе неантагонистических позиционных дифференциальных игр»

Общая и прикладная механика Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 4 (2), с. 186-188

УДК 517.977.8

ЧИСЛЕННОЕ ПОСТРОЕНИЕ РЕШЕНИЙ В КЛАССЕ НЕАНТАГОНИСТИЧЕСКИХ ПОЗИЦИОННЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР

© 2011 г. Д.Р. Кувшинов

Институт математики и механики УрО РАН, Екатеринбург evetro.here@gmail.com

Поступила в редакцию 16.05.2011

Представлен численный алгоритм построения равновесных (и, в частности, неулучшаемых) по Нэшу решений неантагонистической позиционной дифференциальной игры двух лиц с терминальными показателями качества, геометрическими ограничениями на управления игроков и динамикой с разделяющейся по управлениям игроков правой частью. Формализация стратегий игроков и порождаемых ими движений основывается на формализации и результатах теории позиционных антагонистических дифференциальных игр, разработанной Н.Н. Красовским и его научной школой. Задача нахождения решений игры сводится к решению нестандартных задач оптимального управления. Численный алгоритм задействует ряд алгоритмов вычислительной геометрии.

Ключевые слова: неантагонистическая игра, дифференциальная игра, равновесное по Нэшу решение, численное решение.

Постановка задачи

Рассматривается позиционная дифференциальная игра двух лиц с фиксированным моментом окончания 0 и динамикой вида

x = f1(t, x,u) + f2(t,x,v), x(to) = xo,

где x e Rn — фазовый вектор, векторы u из компакта P - управление первого игрока, v из компакта Q — управление второго игрока. Пусть G — компактное подмножество [t0 , 0]xRn, содержащее позицию (t0 , x0), такое, что все траектории системы, начавшиеся в произвольной позиции (t *,x *) из G, остаются в G при t * < t < 0. Пусть в G выполнены стандартные условия существования, единственности и продолжимости решения. Предположим также, что в любой позиции (t, x) из G множество {f (t, x, u) + f2(t, x, v) | u e P, v e Q} выпукло.

Пусть заданы непрерывные функции с,: Rn ^ R, множества уровня которых выпуклы. Показатели качества игроков заданы как I1 = a1 (x(9)) ^ max, 12 = а2 (x(9)) ^ max.

“(■) v(-)

Оба игрока имеют полную информацию о текущей реализующейся позиции игры (t,x(t)). Используемая формализация стратегий игроков и порождаемых ими решений в неантагонистической игре опирается на формализацию, введенную для антагонистических позиционных дифференциальных игр в [1, 2], и подробно изложена в [3].

Чистая стратегия U (далее — стратегия) игрока 1 определяется как пара {u(t, x, е), Pi(£)}, где u(t, x, е) — произвольная функция позиции и положительного параметра точности е, принимающая значения из P. Функция в1 : (0, ^) ^ (0, ^) является непрерывной, монотонной и удовлетворяет условию в1(е) ^ 0 при е ^ 0. Она имеет следующий смысл: при фиксированном е величина в1 (е) служит ограничением сверху на шаг разбиения отрезка [t0 , 0], используемого игроком 1 при построении ломаных Эйлера. Стратегия V игрока 2 определяется аналогично, как пара {v(t, x, е).

Р2<е)}.

В общем случае каждый игрок может выбрать свое значение параметра е,. Далее полагается согласованность движений: е, = е,- = е. При построении численных решений для обоих игроков выбирается общее разбиение временного отрезка [t0 , 0]. Множество X(t0 , x0 , U, V) движений x(t; t0 , x0 , U, V), определяемых как равномерный предел ломаных Эйлера, непусто.

Определение 1. Пара стратегий (U^, VN) — равновесное по Нэшу решение игры (N-решение), если для любого движения x*() из X(t0 , x0 , U, V), любого Т из [t0 , 0) и любых стратегиях U и V выполнены неравенства (максимумы и минимумы берутся по соответствующим множествам движений)

maxc1(x(9;т,x*(x),U,VN)) <

< min c1(x(9; т, x*(т), UN ,VN)),

maxc2(x(9;т,x*(т),UN,V)) <

< min с2 (x(9;т, x*(t),UN ,VN)).

Траектории, порожденные N-решениями, будем называть N-траекториями.

Задача 1. Построить аппроксимацию множества всех N-решений.

Определение 2. Пара стратегий (UP, VP) — не-улучшаемое равновесное по Нэшу решение игры (P-решение), если при переходе от нее к любой другой паре стратегий, составляющей^решение, строгое увеличение выигрыша одного из игроков возможно лишь при строгом уменьшении выигрыша другого. Траектории, порожденные P-решениями, будем называть P-траекториями.

Задача 2. Построить аппроксимацию множества всех P-решений.

Краткое описание алгоритма

Задача нахождения N-решений сводится к решению нестандартной задачи оптимального управления [3], которая формулируется так: найти допустимые программные управления обоих игроков такие, что вдоль порождаемой ими траектории оба игрока не ухудшают свой гарантированный выигрыш. При решении нестандартной задачи применяются известные процедуры построения максимальных стабильных мостов [4, 5] в некоторых вспомогательных играх сближения— уклонения, в качестве цели в которых используются множества уровня функций Ог( ). Все пространственные множества аппроксимируются многогранниками. В ходе вычисления используется ряд алгоритмов вычислительной геометрии, в частности объединение и пересечение многогранников, что накладывает дополнительное ограничение n < 4.

Алгоритм построения аппроксимации множества концов всех N-траекторий (и, в частности, P-траекторий) возник как обобщение алгоритма построения решений Штакельберга [6]. Приведем краткое описание этого алгоритма. Он может быть представлен в виде внешнего и внутреннего циклов, перебирающих определенным образом значения выигрышей игроков. Для каждой фиксированной пары выигрышей находятся концы N-траекторий (если таковые существуют), доставляющие заданные выигрыши, при этом строится множество незапрещенных позиций, которое используется при восстановлении решения игры, порождающего N-траекторию, по заданному концу этой траектории. Управления игроков аппроксимируются кусочно-постоянными функциями времени.

Во внешнем цикле происходит одновременный перебор (в сторону увеличения) выигрышей игрока 1 и игрока 2, заканчивающийся, когда построенные участки границы множества концов ^-траекторий пересекутся. Для каждого выбранного значения выигрыша игрока / производится максимизация выигрыша игрока (3 — /) в рамках нестандартной задачи управления, при этом попутно находятся концы У-траекторий, на которых достигаются эти выигрыши.

При аппроксимации множества концов всех У-траекторий производится перебор выигрышей игрока (3 — /) (в сторону уменьшения), начиная с найденного максимального значения. В процессе перебора находятся концы соответствующих Ы-траекторий.

Также возможен поиск только Р-решений, менее затратный в смысле машинного времени и требуемого объема оперативной памяти. Более ранние результаты работы над описываемым алгоритмом отражены в [7, 8].

Работа выполнена при поддержке РФФИ, грант № 09-01-00313.

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.

2. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 520 с.

3. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993. 184 с.

4. Исакова Е.А., Логунова Г.В., Пацко В.С. Построение стабильных мостов в линейной дифференциальной игре с фиксированным моментом окончания // Алгоритмы и программы решения линейных дифференциальных игр (материалы по мат. обеспечению ЭВМ). Свердловск: ИММ УНЦ АН СССР. 1984. С. 127—158.

5. Тарасьев А.М., Ушаков В.Н., Хрипунов А.П. Об одном вычислительном алгоритме решения игровых задач управления // Прикладная математика и механика. 1987. Т. 51 (2). С. 216—222.

6. Осипов С. И. О реализации алгоритма построения решений для класса иерархических игр Штакельберга // Автоматика и телемеханика. 2007. №11.

С. 195—208.

7. Кувшинов Д.Р. Алгоритм численного построения решений по Нэшу в позиционной дифференциальной игре двух лиц // Вестник Удмуртского ун-та. 2009. №3 (Математика. Механика. Компьютерные науки). С. 81—90.

8. Клейменов А.Ф., Кувшинов Д.Р, Осипов С.И. Численное построение решений Нэша и Штакельберга в линейной неантагонистической позиционной дифференциальной игре двух лиц // Труды ИММ УрО РАН. 2009. Т. 15, №4. С. 120—133.

NUMERICAL CONSTRUCTION OF SOLUTIONS IN A CLASS OF NON-ANTAGONISTIC POSITIONAL DIFFERENTIAL GAMES

D.R. Kuvshinov

The report is devoted to a numerical algorithm for the construction of Nash equilibrium solutions (including non-improvable ones) in a non-antagonistic positional differential game with two players, terminal payoff functionals, geometric constraints on choice of controls and dynamics with separating right part. Formalization of the players's strategies and motions generated by those strategies is based upon formalization and results of the theory of antagonistic positional differential games developed by N.N. Krasovskii and his scientific school. The problem of game solutions construction is reduced to the solution of nonstandard optimal control problems. The numerical algorithm uses a number of computational geometry algorithms.

Keywords: non-antagonistic game, differential game, Nash equilibrium solution, numerical solution.

i Надоели баннеры? Вы всегда можете отключить рекламу.