Пусть для уравнения (1) нелинейный оператор F дуйствует из пространства Мр в пространство В, где Мр пополнение пространства Мр. Тогда имеет место следующая теорема.
Теорема. Пусть для уравнения (3) допустима пара (Мр, В и для, любого l > 0 найдется такое 5 > 0, что
WFxWb < l\\x\\uY
при всех x G Мр, ||x||M7 ^ 5. Тогда уравнение (1) Мр -устойчиво.
На основе предыдущей теоремы исследуются вопросы р-устойчивости тривиального решения для различных классов уравнений вида (1).
Abstract: the questions of p-stability of nonlinear stochastic functional-differential equations trivial solution; sufficient conditions of stability are obtained by the method of auxiliary equations.
Keywords: stability of solutions; stochastic differential equations; method of auxiliary equations.
Кадиев Рамазан Исмаилович д. ф.-м. п., профессор
Дагестанский государственный университет Россия, Махачкала e-mail: [email protected]
Ramazan Kadiev
doctor of phys.-math. sciences, professor Dagestan State University Russia, Mahachkala e-mail: [email protected]
УДК 517.977.8
ПОСТРОЕНИЕ НЭШЕВСКИХ РЕШЕНИЙ В НЕАНТАГОНИСТИЧЕСКОЙ ПОЗИЦИОННОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ДВУХ ЛИЦ 1
© А. Ф. Клейменов
Ключевые слова: неантагонистическая позиционная дифференциальная игра двух лиц; решение по Нэшу; алгоритм построения.
Аннотация: В работе предлагается модификация предложенного ранее автором подхода к задаче численного построения нэшевских решений в неантагонистической позиционной дифференциальной игре двух лиц; модификация позволяет приближенно найти не только некоторые нэшевские решения, но и все нэшевские решения, оптимальные по Парето.
В работе [1] представлен один подход к построению решений нэшевского типа (Ж- решений) в неантагонистической позиционной дифференциальной игре двух лиц. Этот подход основан на использовании принципа неухудшения гарантированных выигрышей игроков вдоль траектории, порождаемой решением, и на использовании правила максимального сдвига в направлениях, определяемых решениями некоторых вспомогательных биматричных игр. На основе этого подхода был разработан и программно реализован алгоритм численного построения соответствующих
1 Работа выполнена при поддержке РФФИ (проект № 09-01-00313) и Федеральной программы Президиума РАН №29 «Математическая теория управления».
Ж-решений. В то же время построенные таким образом Ж-решенпя, вообще говоря, не являются неулучшаемыми по Парето на множестве всех Ж-решений.
В данной работе предлагается модификация упомянутого подхода, предполагающая введение семейства вспомогательных биматричных игр, каждая из которых ориентирована на построение Ж
Пусть динамика игры описывается уравнением
x = A(t)x + B(t)u + C(t)v, t £ [to,§}, x(t0) = x0, (1)
где фазовый вектор x £ R2, управления u £ P £ comp Rk и v £ Q £ comp Rl подчинены игроку 1 и игроку 2 соответственно, а § - фиксированный момент окончания игры. Игрок i стремится максимизировать терминальный показатель качества
Ii = ai(x(§), i = 1, 2, (2)
где функции ai(x) непрерывны и вогнуты.
Формализация чистых позиционных стратегий игроков и движений системы (1), ими порождаемых, производится как в [2, 3], за исключением технических деталей [4]. Далее, для каждого i £ 1, 2 вводится вспомогательная антагонистическая дифференциальная игра Гi с динамикой (1), в которой игрок i максимизирует показатель Ii (2), а игрок 3 — i ему противодействует. В обеих играх Г i и Г2 существуют универсальные седловые точки и непрерывные функции цены Yi(t,x) и Y2(t,x) [2,3].
Опишем процедуру численного построения Ж-решений. Пусть фиксирована позиция (t*,x*) игры. На отрезке [t* ,t*}, t* = t* + h, h — шаг дискретной схемы, определим постоянные управления u(t) = и* ж v(t) = v* следующим образом. Обозначим через G(t*; t*,x*) множество достижимости
t* (t* , x* )
Wm1 (t*; t*,x*)m W2m2(t*; t*,x*)-.
wm(t*; t*,x*) = {x £ R2 : Yi(t*,x*) ^ Yi(t*,x) ^ Yi(t*,x*) + midi,
Y3-i(t*,x*) ^ Y3-i(t*,x)}, i = 1, 2
Здесь di и ¿2 - заданные положительные числа; mi, m2 £ {0} причем
mi ^ 1 max (ji(§, x) — Yi(to,xo)) = Mi,
¿i xeG(^;to,xo)
Yi(-) И 72(•) - функции цены игр Г1 И Г2.
Пусть индекс i £ {1, 2} и число mi £ {0,1, ...Mi} фиксированы. Введем множество
H(t*; t*,xk\i,mi) = G(t*; t*,x*)f] W™1 (t*,t*,x*).
Заметим, что множества Wmi могут быть найдены приближенно с использованием алгоритмов построения максимальных стабильных мостов в специальных играх сближения - уклонения. Обозначим через wk(t*; t*,x*\i, mi) точку максимума функции Yk(t*,x) на множестве H(t*; t*,xk\i, mi), k = 1, 2. Рассмотрим векторы sk(t*; t*, x*\i, mi)=
= wk(t*; t*,x*\i,mi) — x*, k=l,2.
uio u2o vio vio
max skT [B(t*)u + C(t*)v} = skT [B(t*)ui0 + C(t*)vi0}, k = 1,2. ueP,veQ
Вводится вспомогательная биматричная 2 х 2 игра (A,B) [5]. В этой игре первый игрок имеет
uio u2o
vio v2o A B
aij = Yi(t* ,x[t*; t*,x*,uio,vjo}), bj = Y2(t*,x[t*; t*,x*,uo,vjo}), i,j = 1, 2.
(A, B)
Выбрав пэшевское равновесие, получаем вектор, в направлении которого игроки осуществляют максимальный сдвиг. Таким образом, получаем постоянные управления
u(t) = u* и v(t) = v* на отрезке [t*,t*}. Описанная процедура позволяет целиком найти аппрок-
Ж
Перебирая различные i £ {1, 2}, mi £ {0,1,...Mi}, получаем множество приближенных тра-Ж
ЛИТЕРАТУРА
1. Клейменов А.Ф. Различные типы решений в позиционной неантагонистической дифференциальной игре. // Вести. Тамб. ун-та. Сер. Естественные и технические науки. Тамбов, 2007. Вып.4. С. 464-466.
2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
3. Красовс кий Н.Н. Управление динамической системой. М.: Наука, 1985.
4. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.
5. Клейменов А.Ф. О решениях в неантагонистической позиционной игре //ПММ. 1997. Т. 61. Вып. 5. С. 717-723.
Abstract: in this paper modification of early offered approach to the problem of numerical construction of Nash solutions in two-person nonantagonistic positional differential game is offered; the modification permits us to find approximately not only some Nash solutions, but all optimal on Paretto Nash solutions.
Keywords: two-person nonantagonistic positional differential game; Nash solution; constructing algorithm.
Anatoliy Kleymenov doctor of phys.-math. sciences, professor Institute of Mathematics and Mechanics of UrD RAS Russia, Ekaterinburg e-mail: [email protected]
Клейменов Анатолий Федорович д. ф.-м. п., профессор Институт математики и механики УрО РАН Россия, Екатеринбург e-mail: [email protected]