Научная статья на тему 'Некоторые задачи теории линейных динамических неантагонистических игр'

Некоторые задачи теории линейных динамических неантагонистических игр Текст научной статьи по специальности «Математика»

CC BY
128
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕГРОДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ ВОЛЬТЕРРА / ИНТЕГРАЛЬНОЕ УРАВНЕНИЕ ВОЛЬТЕРРА / УПРАВЛЯЮЩЕЕ ВОЗДЕЙСТВИЕ / ИЗМЕРИМАЯ ФУНКЦИЯ / ПОЗИЦИЯ ИГРЫ / ОПТИМАЛЬНАЯ СТРАТЕГИЯ / INTEGRODIFFERENTIAL EQUATION OF VOLTERRA / VOLTERRA INTEGRAL EQUATION / CONTROL ACTION / MEASURABLE FUNCTION / POSITION OF THE GAME / OPTIMAL STRATEGY

Аннотация научной статьи по математике, автор научной работы — Пасиков Владимир Леонидович

Актуальность и цели. Рассматриваются некоторые вопросы оптимального управления, а именно теории динамических игр для случая, когда динамика игры описывается линейными интегродифференциальными и интегральными векторными уравнениями Вольтерра. Целью работы является решение задач оптимизации функционалов типа расстояния в основном в смысле Нэша. Материалы и методы. Для решения этих задач автором построена некоторая модификация известной экстремальной конструкции академика Н. Н. Красовского, разработанная для обыкновенных дифференциальных систем. Центральным элементом этой модификации является новое определение позиции игры для вычисления которой требуется полная память по управляющим воздействиям, что существенно усложняет все исследование по сравнению со случаем обыкновенных дифференциальных систем. Рассмотренный метод может быть распространен и на случай нелинейных интегродифференциальных и интегральных систем. Результаты и выводы. В работе получены существенно новые результаты, которые дополняют и расширяют общую теорию динамических игр.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOME PROBLEMS OF THE THEORY OF LINEAR DYNAMIC NONANTAGONISTIC GAMES

Background. The paper discusses some problems of optimal control, namely, the theory of dynamic games when the dynamics of a game is described by the linear integrodifferential and integral vector Volterra equations. The aim is to solve the problems of optimization of distance-type functionals mainly in the sense of Nash. Materials and methods. To solve these problems, the author built a modification of the famous extreme construction of the academician N. N. Krasovskiy developed for ordinary differential systems. The centerpiece of this modification is the new definition of the position of the game for which it is necessary to calculate the total memory to manage stress, that greatly complicates the entire study compared with the case of ordinary differential systems. Results and conclusions. The considered method can be extended to the case of nonlinear integrodifferential and integral systems. The paper presents significantly new results that complement and extend the general theory of dynamic games.

Текст научной работы на тему «Некоторые задачи теории линейных динамических неантагонистических игр»

УДК 517.977

В. Л. Пасиков

НЕКОТОРЫЕ ЗАДАЧИ ТЕОРИИ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ НЕАНТАГОНИСТИЧЕСКИХ ИГР

Аннотация.

Актуальность и цели. Рассматриваются некоторые вопросы оптимального управления, а именно теории динамических игр для случая, когда динамика игры описывается линейными интегродифференциальными и интегральными векторными уравнениями Вольтерра. Целью работы является решение задач оптимизации функционалов типа расстояния в основном в смысле Нэша.

Материалы и методы. Для решения этих задач автором построена некоторая модификация известной экстремальной конструкции академика Н. Н. Кра-совского, разработанная для обыкновенных дифференциальных систем. Центральным элементом этой модификации является новое определение позиции игры для вычисления которой требуется полная память по управляющим воздействиям, что существенно усложняет все исследование по сравнению со случаем обыкновенных дифференциальных систем. Рассмотренный метод может быть распространен и на случай нелинейных интегродифференциаль-ных и интегральных систем.

Результаты и выводы. В работе получены существенно новые результаты, которые дополняют и расширяют общую теорию динамических игр.

Ключевые слова: интегродифференциальное уравнение Вольтерра, интегральное уравнение Вольтерра, управляющее воздействие, измеримая функция, позиция игры, оптимальная стратегия.

V. L. Pasikov

SOME PROBLEMS OF THE THEORY OF LINEAR DYNAMIC NONANTAGONISTIC GAMES

Abstract.

Background. The paper discusses some problems of optimal control, namely, the theory of dynamic games when the dynamics of a game is described by the linear in-tegrodifferential and integral vector Volterra equations. The aim is to solve the problems of optimization of distance-type functionals mainly in the sense of Nash.

Materials and methods. To solve these problems, the author built a modification of the famous extreme construction of the academician N. N. Krasovskiy developed for ordinary differential systems. The centerpiece of this modification is the new definition of the position of the game for which it is necessary to calculate the total memory to manage stress, that greatly complicates the entire study compared with the case of ordinary differential systems.

Results and conclusions. The considered method can be extended to the case of nonlinear integrodifferential and integral systems. The paper presents significantly new results that complement and extend the general theory of dynamic games.

Key words: integrodifferential equation of Volterra, Volterra integral equation, control action, measurable function, position of the game, optimal strategy.

Предлагаемая работа продолжает исследование [1]. В дальнейшем следует иметь в виду, что встречающиеся ниже обозначения и понятия, не сопровождаемые ссылками и пояснениями, определены в [1]. Решение задач

приводится на основе методов, разработанных в [2-5], а также их модификаций из [5-8].

1. Рассматривается задача 1 из [1] с системой функционалов [4]:

(«1,..,ит) = фг- (х(0)), I = 1, т , (1)

здесь предполагается, что каждая функция фг- (х) определена и непрерывна на

пП

всем пространстве К и удовлетворяет следующим условиям:

1) множество О! (а) = {х: фг- (х) < аг-, аг- е К} выпукло,

2) О; (аг(1)) = О; (а(2)) ^ а(1) = а!2).

Исследуем сначала вспомогательную задачу.

Найдем стратегии, уравновешивающие систему функционалов [4]:

Yi(ы15..5«2) = р(x(0),Gi(а,-)), i = 1,m,

(2)

здесь а, - фиксированные числа; р(х(0), G, (а,)) - расстояние от точки х(0) до множества G, (а,), которое определяется формулой

p(x, G, (а,)) = inf р( x, y).

yeO,(а,)

Будем рассматривать, как и в [1], три случая динамических систем, описывающих эволюцию управляемого объекта.

Пусть движение объекта описывается системой интегродифференциа-льных уравнений Вольтерра с управляющими воздействиями вне интеграла

t m

x(t) = f (t) + A(t) x(t) + J K (t, s) x( s)ds + ^ ui (t), x(0) = x0,

0 i=1

тогда для любого to e [0,0) начала процесса управления вводится величина

£(t0, x(0, t), а£) = max

111 11=1

min

ceGk (а k)

(1'(c - x(0, t0))-

-J

ГП -

max{1'-x(0,s)}«k(s)ds -^ J min{1'-x(0,s)}« (s)ds

J ueUi

uk eUk

i=1 t i i . , r0 гфк

(3)

которая согласно [5-7] является евклидовым расстоянием от точки х(0, ^) до

множества Ок (а^), к = 1, т , при выборе игроками р , I = 1, т , I Ф к , своих управляющих воздействий наихудшим образом, т.е. они желают максимизировать величину (3), а игрок Рк величину (3) минимизирует.

В выражении (3) максимум достигается на единственном векторе 1к = = 1к(?о,х(0,),ак), непрерывно зависящем от позиции игры {^,х(0,*0)}

в случае, когда £ к (го, х(0, го), ак) > 0 [2], т.е. рассматривается регулярный случай.

г

Напомним, что в [1] введены обозначения Ф(г, 5) = | К (г, т)Х (т, 5^ т,

ф(5) = ф( 5, о) хо +/ (5), х(г, 5) = X (г, 5) + | X (г, т) К(т, ^ т,

К(г, 5) - резольвента матрицы Ф(г, 5),

г

х(г, 5) = X (г, 5) +1X (г, т)К(т, s)d т,х(0, го) = X (0,0) хо +

0 т го

+1 х(0,5)ф(0,5^ + -х(0,•?)«; (5^5,

о I =1 о

X (г, 5) - матрица Коши системы х(г) = А(г) х(г).

После решения задачи (3) - определения вектора 1к и точки Ск е Ок(ак), ближайшей в евклидовой метрике к позиции х(0,го), определяем условие экстремального прицеливания для к-го игрока:

хк(го)ие(го) = тах хек(го) • «к, (4)

ик еик

где 4 (го) = 1 х(0, го).

к

Далее вводится функция

0

£к (г, х(0, г), ак) = 1к (Ск - х(0, го)) -1 хк (г )ик (г) dг -

1 rri v

- J xek (t )«к (t )dt - 2 J xek (t )uek (s)ds. (5)

t0 i=1 t0

i фк

В выражении (5) с возрастанием t оптимальная стратегия игрока Рк заменяется на произвольную допустимую. Вычисляем в (5) производную, получаем

d £

—Т = xk (t)uk (t) - xk (t)uk (t) = max xk (t)щ - xk (t)щ (t) > 0,

dt ukeUk

отсюда вытекает, что функция £k (t, x(0, t), аk), k = 1, m, не убывает при замене оптимальной стратегии k-го игрока на произвольную допустимую uk, таким образом, для системы функционалов (2) выполняются неравенства

% (и(иет) < % (и(иек -!, ик, иек иет):

(6)

т.е. оптимальные стратегии, определяемые согласно (4), уравновешивают в смысле Нэша систему функционалов (2). Теперь рассматриваем задачу 1 из [1].

Из формулы (3) следует, что гк (г, х, а к) строго возрастает при возрастании ак . Пусть а0 - наименьший корень уравнений £к (г, х, а к) = 0 при фиксированных ( и х. Если это уравнение не имеет решения, то полагаем а° = шт фк (х). Из неравенства (6) и строгой монотонности г к (г, х, а к) по

ак получаем а°(9, хе (0)) <а°(9, хк (0)); хе (0) - точка решения системы (2)

, е е е е

при г = 0 и стратегиях и ,..,Ык-1,Пк,^+1,..,ит; ик - произвольное допустимое управление.

Так как а° (0, х(0)) = фк (х(0)), то фк (хе (0)) <фк (хк (0)), и, следовательно, получаем решение задачи 1.

Теорема 1. Оптимальные стратегии, определяемые условиями (4) для системы (2), уравновешивают в смысле Нэша систему функционалов (1).

2. Пусть теперь динамика управляемого объекта описывается системой (15), в которой управляющие воздействия содержатся под знаком интеграла

г т г

х(г) = /(г) + А(г)х(г) +1К(г, 5)х((г, s)ui (з^ , х(0) = хо ,

0 г=1 0

а ее решение с заданным начальным условием определяется формулой (16) из [1]:

x(t) = X (t ,0) x0 + J X (t, s)¥(s, 0) dsф(0)

+

J

J X (t, t)¥ (t, s )d t

d 9(s) + J^

0 j=i

J X (t, T)Xj (t, s )d t

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

иj (s)ds .

Напомним, что здесь

г

у(г, з) = Е +1 Я(г, т^ т,

5

Е - единичная матрица,

X (г, з) = ¥(г, з) В (з, з) +1 т,

x(0, t0) = X (0,0) Х0 + J

J X (0, т)у(т, s )d t

d ф(s) +

0

fo m

0 i=0

IX (е, т)Хі (т, s)d т

uj (s)ds,

x (е, t) = | X (е, т)Хі (т, t )dt.

Теперь используем полученное в [1] с помощью формулы (17) состояние системы (16), в момент ко < к < 0, которое записываем в следующем виде:

t m е

x^, t) = x(е, to) +1 ^ [ IX (е, т)Хі (т, s )d ф; (s)ds,

to i=1 s

далее решаем задачу нахождения экстремального вектора , к = 1, т, и точки ек е Ок (ак ), ближайшей в евклидовой метрике к позиции х(0, ^о)

£k (to, x(е, to), ak) = m ax

l 1

min

C«Gk (ak)

(l'(c -x(е,to)) - I max (lXk(е,s))uk(s)ds -

t ukєUk

rn

I mln (l'5cj (е, s))uj (s)ds

J 1! .<=T I.

. л u^Uj

l=1 to 1 1

i^k

(?)

После нахождения решения задачи (7) 1к и Ск, аналогично (4), определяем условие экстремального прицеливания игрока Рк :

4({о)ие({о) = тах 4({о)ик,0 < ^ < 0, 4(ко)=4*(0,ко)- (8)

ик еик

Далее записываем функцию £к (к, х(0, к), а к), которая по форме полностью аналогична функции (5) и дословным повторением дальнейших, после (5), рассуждений доказывается утверждение.

Теорема 2. Оптимальные стратегии, определяемые условиями (8) для исследования системы, уравновешивают в смысле Нэша систему функционалов (1).

3. Рассмотрим теперь случай, когда эволюция управляемого объекта описывается системой линейных интегральных уравнений Вольтерра 2-го рода

х(к) = / (к) +1 А(к, 5) х( 5^ + ^ | (к, и)и1 (5)а^,

о г=1 о

тогда, как было указано в [7], состояние системы в момент ке [ко,0) определяется формулой

o

е

m 10

x^, t) = Ф(е, 0) f (0) +1 Ф(е, s)df (s) + 21X. (е, s)u. [ s]ds + ^ | X. (е, s)u. (s)ds,

0 i=l 0 1=l t0

t

здесь Ф(к, 5) = Е +1Я(ґ,х)ёт; Е - единичная матрица; Я(ґ, 5) - резольвента

5

матрицы

0

Л(і, 5), X, (0,5) = Ф(0, 5)Ві (5,5) + IФ(0, Т) ^ 5^Т.

5

Теперь записываем выражение

гк (ґ0, х(0, к0), ак) = тах \ тіп (І '(є - х(0, к0) -

ИН ієЄ^к(ак)

-I max {'Xk (е, s)}uk (s)ds - min {l'Xt (е, s)}. (s)ds

\u^Uk itl \щєиг

lf\ 1 1 If

o

i^k

(9)

которое является евклидовым расстоянием от позиции х(0, ) до множества Ок (ак), после решения задачи (9) записываем функцию

гк (к, х(0, t), ак) = 1к (ск - х(0, ^)) -

0 к т 0

-1хк (к)ике (к)Ж -1 хк (к)«к (к)Л - ^ | хк (к)ие (.?№,

к ко г'=| к0

г*1

здесь хк (к) = 4хк (0, к), ие, 1 = 1, т - оптимальное управление.

Далее все рассуждения аналогичны доказательству теоремы 1. Таким образом, справедливо следующее утверждение для рассмотренного случая.

Теорема 3. Оптимальные стратегии, определяемые условиями (8) для линейной интегральной системы Вольтерра 2-го рода, уравновешивают в смысле Нэша систему функционалов (1).

Замечание. Отметим, что из каждой позиции х(0,ко), ко е [0,0), для каждой совокупности стратегий игроков {и1,..,ит} получается пучок решений и в доказательствах речь идет об одной кривой из этого пучка. На практике физически невозможно непрерывно изменять значения управляющих воздействий, поэтому в исследованиях по динамическим играм [2, 3] отрезку управления, например [0, 0], назначают некоторое разбиение на частичные промежутки [кь к+1) и в моменты к определяют управляющее воздействие на весь полуинтервал [к,к+1) как непрерывную или постоянную функцию, а затем переходят к пределу при стремлении к нулю ранга разбиения в соответствующей метрике.

В предлагаемой работе эти моменты опущены, так как сводятся к пересказыванию результатов из работ других авторов.

4. Пусть теперь в «-мерном фазовом пространстве Я" движется группа из т точек , I = 1, т, эволюция каждой из которых описывается системой

г

X (г) = /1 (г) + А (г)х{ (г) +1К (г, 5)х фЖ + щ (г), х{ (0) = х0, (10)

о

эту группу преследует точка х, движущаяся в том же фазовом пространстве Я по закону

г

х(г) = / (г) + А(г)х(г) +1К (г, 5)х(5^ + и (г), х(0) = хо, (11)

о

в (10), (11) ограничения на параметры аналогичны ограничениям для (2).

В каждый момент г е [0,0) игрокам известны взаимные положения преследуемых и преследователя. В качестве платы игры рассматривается величина

т

з=2 а Их (0) - х(0)||, (12)

/=1

игроки р, I = 1, т, распоряжаются выбором управляющих воздействий иг- е и, а игрок Р распоряжается выбором управляющего воздействия и е и;

и, и - выпуклые компакты в Я" ; г0 е [0,0) - начало процесса управления. Для преследующей точки х требуется найти стратегию, которая к моменту 0

позволит минимизировать величину (12) при любых допустимых воздействи-

ях преследуемых точек хI, I = 1, т.

Решения систем (10) и (11) записываем по формулам [6]:

г г

х( (г) = XI (г, 0) х0 +1 хI (г, 5 )фг- (з)Ж +1 х,1 (г, 5)иг- ^^, х(г) =

0 0

г г

= X (t, 0) х0 + J x (t, 5)ф( s) + J x (t, s)u( s)ds,

где Х(г, 5), Х(г, 5) - матрицы Коши систем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

хI (г) = А (г)хI (г), х(г) = А(г)х(г); Я11 (г, 5), Я(г, 5) - резольвенты матриц

г г

Фг- (г, 5) = | К (г, т) XI (т, 5 )й т, Ф(т, 5) = | К (г, т) X (т, 5^ т,

S

t

Xj (t, s) = Xj (t, s) + J Xj (t, т) Я{ (t, s)d t, x(t, s) = X (t, s) + J X (t, t) R(t, s)d t,

Фг (5) = Фг- (5, 0)х° + (5), Ф(5) = Ф(5, 0)х0 + /(5).

Если до момента г, г е [г0 , г), игроки применяли некоторые допустимые управления, а после момента г имеем и; (г) = 0, и (г) = 0, то состояния систем (42), (43) можно записать следующим образом:

0 г0 г

х( (0, г) = XI (0,0)х0 + |х,1 (0,5)ф; (5^5 + | х,1 (0,5)и[5]^5 + | 5с; (0,5)и; (5^; (13)

x(0, t) = Х (О,0) Xo + j X (О, s)9(s)ds + j X,t (О, s)u[s]ds + j X^, s)u(s)ds, (14)

0 t to

обозначим

О to

Xi (О, to) = Хі (0,0) x0 + j Xi (О, s)9i (s)ds + j Xi (О, s)ui [s]ds, x(0, t0) =

0t

О ko

= Х (0,0) Xo + j X (О, s )ф( s )ds + j д:(О, s )u[s ]ds,

тогда

Xj (О, t) = Xi (О, to) + j X,i (О, s)ui (s^s,^, t) = x^, to) + j X (О, s)u (s)ds;

J і = a; ||xi (О) - x^)! = a; max

(Xj (О, to) -x@, to)) +

+ j max іСі (О,s)uj (s)ds - j max x^, s)u(s)ds

^ u; (s)єUг' ^u(s)=U

‘o too

По (15) строим функцию типа программного максимина

u (s)eU

(15)

ei (t) = ai • max

l'

(Xi (О, to) - x@, to)) +

+ j max X.; (О, s)u,- (s)ds -a,- j max ,г(О, s)u(s)ds

^ u;(s^Uj ^u(s\zTT

u (s )eU

(16)

решаем в каждый момент ґ є [ґд, 0) задачу (16) нахождения экстремального вектора її и определяем экстремальные стратегии игроков.

t

0

t

После решения задачи (16) вводим обозначения /х (0,5) = х, (5). При

этом предполагается, что в каждый момент г е [г0,0) решение задачи (16)

единственное, т.е. рассматривается регулярный случай.

Оптимальные стратегии р, I = 1, т, определяем в каждый момент г е [г0,0) условием

тах хее (г) • и^ (г) = хе (г) • ие. (17)

игеиг

т

Для игрока Р записываем вектор /0 = 2 а/ и его оптимальную стра-

1=1

тегию в каждый момент г е [г0,0) определяем соотношением

тах хе (г) • и (г) = хе (г)ие, (18)

иеи

где хе (г) = /0 • х(0, г).

Теперь на основе величины (16) записываем функцию при 1 < к < т :

т т 0

е(г) = 2 а/ (хI (0, г0) - х(0, г0)) + 2 а{ хе (5)ие (5)05 +

«=1 «;=1 г0

хфк

г 0 0

+ак | хк (5)ик (5)05 + ак |хе (5)и| (5)05 -1 хе (5)ие (5)05, (19)

г0 г г0

здесь игрок Рк с увеличением г начиная с момента г0 заменяет свою оптималь-

ную стратегию на произвольную допустимую; вычисляем для (19) производную

= ак • хек (г)ик (г) - акхек(г)иек (г),

аг

с учетом (17) ае(г) < 0, таким образом, с возрастанием г функция е(г) не

аг

возрастает и, следовательно, е(г) < е(г0), где е(г0) - программный максимин,

т т 0 0

£(г0) = 2 а2-1; (х( (0, г0) - х(0, г0) + 2 а* | х‘е (5)^ (5)05 -1 хе (5)ие (5)05.

«=1 i=1 г0 г0

В монографии [5, с. 335] величина а^Цх, (0) - х(0)|| называется защит

щенностью точки хь величина 2 а2- ||х{(0) - х(0)|| - защищенностью группы.

/=1

Следовательно, доказано следующее утверждение.

Теорема 4. Если эволюции преследуемых и преследователя описываются системами (10) и (11), то в регулярном случае при выборе игроком Р своей оптимальной стратегии для защищенности группы Р1, ..., Рт ему будет обеспечен результат е(0) < е(^о) при любых допустимых реализациях управляющих воздействий игроков Р1, ., Рт.

5. Пусть теперь в пространстве Я" движется группа из т точек х^,

1 = 1, т, эволюция каждой из которых описывается системой

г г

х1 (г) = У (г) + А (г)х( (г)х( (г) +1 к] (г, 5)х( (^Л +1Е1 (г, 5)иг- (я)^, х( (0) = х0, (20)

о о

эту группу преследует точка х, движущаяся в том же фазовом пространстве

г%П

Я по закону

Х(ґ) = / (ґ) + А(ґ)х(ґ) +1К (ґ, 5)х(5^5 +1 Б(ґ, s)u , х(0) = х0, (21)

0 0

решения систем (20) и (21) записываем по формулам [7]:

ґ

x{ (t) = Xi (t, 0) x0 + J Xi (t, s) Y i (s, 0)dsфi (0)

+

O

+J

J Xi (t, т)¥ i (т, s)d т

d Фі (s) + J

J X (t, т)Хі (т, s)d т

ut (s)ds,

x(t) = X (t ,0) xo + J X (t, s)Y (s,0)ds • ф(0)

+

+J

J X (t, т)¥ (т, s )d т

d ф(s) + J

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J X (t, т)х(т, s )d т

u (s)ds,

в дополнение к предыдущему здесь ¥г- (Ґ, 5) =Е + | Яі (Ґ, Т^Т, Яі (ґ, 5) - ре-

5

ґ

зольвента матрицы Фг-(ґ,5); ¥(ґ,5) =Е +1Я(ґ,т)dТ, Я(ґ,5) - резольвента

5

матрицы Ф(ґ, 5); далее

xi (0, t0) = Xi (0,0) x0 + J Xi (0, s) Y і (s, 0^ (0)

+

+J

J Xi (0, ^Y і (т, s )d т

O

d Фі (s) + J

J X (0, т)х(т, s )d т

u, [s ]ds ;

x(0, tO) = X (0,0) xo + J X (0, s)Y (s,0)dsф(0)

+

тогда

J

J X (0, тЩт, s)d т

O

d ф( s) + J

J X (0, т)х(т, s)d т

u[s]ds,

к, (0, t) = xi (0, tO) + J

t0

= x(0, tO) + J

J Xi (0, т)х, (т, s)dт

0 " J X (0, т)х(т, s)d т

u, (s )ds, x(0, t) =

u (s)ds.

Программный максимин для Р1 определяем формулой

є, (tO) = m ax l'

(xi(0,tO) - x(0,tO)) + J max

ueU,

0 г г

J l'Xi (0, т)х, (т, s)d т

ut (s)ds ■

тах

иеи

J l'X (0, т)х(т, s)dт

u( s)ds

(22)

Пусть 11 - решение задачи (22), "-мерные вектор-строки

а (г) = I'X1 (0, г), а(г) = !'Х(0, г), они согласно [2, с. 384] являются решениями дифференциальных систем а г- (г) = - Аг- (г )аг-, а (г) = - А(г )а с краевым условием Ц. Обозначим для краткости

0 0 хе (г) = | а' (т)Хг (т, 5)0 т, хе (г) = | а' (т)х(т, 5)0 т,

тогда

:г (to) = l'i ((xi (Q, ) - x(0, t0)) + I max xf (s)uj 9s)ds - I max xe (s)u (s)ds.

J uieUi J ueU

0 11 0

Далее составляем функцию

m m 0

e(t) = ^ a/i (Xi (0, fy) - x(0, t0)) + ^ ai | xe (s)ue (s)ds +

i=1

i=1 t0

i фк

+а£ | хк (5)н£ (5^ + ак |хк (5)и| (s)ds -|хе (5)х^^

Г0 I 0

и вычисляем ее производную

d £

— = акхек ^ и ^) - акхк ^ )ик ^), dt

d £

условия оптимальности здесь по форме совпадают с (17), (18), тогда —< 0.

dt

Таким образом при замене игроком Рк оптимальной стратегии на произвольную допустимую функция £^) не возрастает, следовательно, ) < е(^).

Следовательно доказано следующее утверждение.

Теорема 5. Если эволюции преследуемых и преследователя описываются системами (20), (21), то в регулярном случае при выборе игроком Р своей оптимальной стратегии для защищенности группы Р1, ..., Рт ему будет обеспечен результат е(0) < е(^) при любых допустимых реализациях управляющих воздействий игроков Р1 ,., Рт.

6. Рассматриваем теперь случай, когда эволюция объектов преследуемой группы описывается линейным интегральным уравнением Вольтерра 2-го рода

t t

х1 ^^|Л; ^, 5)х( (5^5 + |В; ^, 5)и (5^5, (23)

0 0

эволюция преследователя описывается системой

t t

х^) = / (t) + | Л(t, 5) х( + / в( , 5)и (s)ds. (24)

0 0

Системы (23), (24) являются линейными интегральными системами Вольтерра 2-го рода) и удовлетворяют условиям, указанным в [1, 8]. Опишем кратко решение задачи для этих систем.

Записываем программный максимин для игрока Р{.

£,■ (^, x^, to)) = m ax Ґ

(xі(е,^) - x(е,to)) + I max [l'X,(е,s)}(s)ds

J 11 с. J J.

+

t u,cU, t

е

+

I max {l'Xt (е, s)} (s)ds

J u .cU.

t u,cU, ТО

(25)

Теперь решаем задачу (25) нахождения экстремального вектора /г-, вво-

т

дим обозначения хе (ґ) = І'X; (0, ґ), /0 = ^ Ї,; оптимальные (экстремальные)

г=1

значения формально определяются равенствами (49), (50). Далее составляем функцию

£(t) = 2li(xito) -x(0,to)) + Jxek(0,s)uk(s) + Jxek(s)uek(s) + 2 Jxi (s)uf (s)ds,

i =1 to t г=1 to

1фк

здесь идет с увеличением t замена оптимальной стратегии игрока Рк на произвольную допустимую. Вычисляем производную

d £

— = xk (0, t)uk (t) - xk (t)uk (t) < 0 dt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

согласно определению оптимальной стратегии игрока Рк. Получаем следующее утверждение.

Теорема 6. Если эволюции преследуемых и преследователя описываются системами (55), (56), то в случае при выборе игроком Р своей оптимальной стратегии для защищенности группы Pt, ..., Pm ему будет обеспечен результат £(0) < e(to) при любых допустимых реализациях управляющих воздействий игроков Pt, ., Pm.

Список литературы

1. Пасиков, В. Л. К теории линейных динамических неантагонистических игр / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2ot3. - № 2 (26). - С. 75-86.

2. Красовский, Н. Н. Игровые задачи о встрече движений / Н. Н. Красовский. -М. : Наука, 197o. - 42o с.

3. Субботин, А. И. Оптимизация гарантии в задачах управления / А. И. Субботин, А. Г. Ченцов. - М. : Наука, 1981. - 288 с.

4. Гороховик, В. В. О линейных дифференциальных играх нескольких лиц /

B. В. Гороховик, Ф. М. Кириллова // Управляемые системы. - 1971. - № 1o. -

C. 3-9.

5. Габасов, Р. Качественная теория оптимальных процессов / Р. Габасов, Ф. Кириллов. - М. : Наука, 1971. - 5o8 с.

6. Пасиков, В. Л. Экстремальные стратегии в игровых задачах для линейных интегродифференцированных систем Вольтерра / В. Л. Пасиков // Вестник Южно-уральского государственного университета. Сер. Математика. Механика. Физика. - 2o12. - Т. 7, № 34 (293). - С. 33-42.

7. Пасиков, В. Л. Задача сближения-уклонения для линейных интегро-дифференциальных систем Вольтерра с управляющими воздействиями под знаком интеграла / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2o11. - № 2 (18). - С. 58-7o.

8. Пасиков, В. Л. Экстремальное прицеливание в игре линейных систем Вольтерра / В. Л. Пасиков // Дифференциальные уравнения. - 1986. - Т. XXII, № 5. -С. 9o7-9o9.

References

1. Pasikov V. L. Izvestiya vysshikh uchebnykh zavedeniy. Povolzhskiy region. Fiziko-matematicheskie nauki [University proceedings. Volga region. Physical and mathematical sciences]. 2o13, no. 2 (26), pp. 75-86.

2. Krasovskiy N. N. Igrovye zadachi o vstreche dvizheniy [Game problems on motion meeting]. Moscow: Nauka, 197o, 42o p.

3. Subbotin A. I., Chentsov A. G. Optimizatsiya garantii v zadachakh upravleniya [Guarantee optimization in control problems]. Moscow: Nauka, 1981, 288 p.

4. Gorokhovik V. V., Kirillova F. M. Upravlyaemye sistemy [Controllable systems]. 1971, no. 10, pp. 3-9.

5. Gabasov R., Kirillov F. Kachestvennaya teoriya optimal’nykh protsessov [Qualitative theory of optimal processes]. Moscow: Nauka, 1971, 508 p.

6. Pasikov V. L. Vestnik Yuzhno-ural’skogo gosudarstvennogo universiteta. Ser. Ma-tematika. Mekhanika. Fizika [Bulletin of South-Ural State University. Series: Mathematics. Mechanics. Physics]. 2012, vol. 7, no. 34 (293), pp. 33-42.

7. Pasikov V. L. Izvestiya vysshikh uchebnykh zavedeniy. Povolzhskiy region. Fiziko-matematicheskie nauki [University proceedings. Volga region. Physical and mathematical sciences]. 2011, no. 2 (18), pp. 58-70.

8. Pasikov V. L. Differentsial’nye uravneniya [Differential equations]. 1986, vol. XXII, no. 5, pp. 907-909.

Пасиков Владимир Леонидович

кандидат физико-математических наук, доцент, кафедра естественноматематических дисциплин, Орский филиал Оренбургского государственного института менеджмента (Россия, Оренбургская область, г. Орск, Орское шоссе, 4)

E-mail. [email protected]

Pasikov Vladimir Leonidovich Candidate of physical and mathematical sciences, associate professor, sub-department of natural and mathematical disciplines, Orsk branch of Orenburg State Institute of Management (4 Orskoe highway, Orsk, Orenburg region, Russia)

УДК 517.977 Пасиков, В. Л.

Некоторые задачи теории линейных динамических неантагонистических игр / В. Л. Пасиков // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2014. - № 2 (30). - С. 59-72.

i Надоели баннеры? Вы всегда можете отключить рекламу.