Научная статья на тему 'Игровая задача наведения интегро-дифференциальной системы типа Вольтерра для трех лиц'

Игровая задача наведения интегро-дифференциальной системы типа Вольтерра для трех лиц Текст научной статьи по специальности «Математика»

CC BY
127
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИГРОВАЯ ЗАДАЧА / ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНАЯ СИСТЕМА / УПРАВЛЯЮЩЕЕ ВОЗДЕЙСТВИЕ / ПОЗИЦИЯ ИГРЫ / СТАБИЛЬНАЯ СИСТЕМА / COALITION / MEMORY ON THE MANAGEMENT / EXTREME STRATEGY / INTEGRO-DIFFERENTIAL SYSTEM / STABLE BRIDGE

Аннотация научной статьи по математике, автор научной работы — Пасиков Владимир Леонидович

Рассматривается задача наведения динамического объекта в пространстве R n на замкнутое множество M. В этой задаче участвуют три игрока, причем, два из них составляют коалицию, которая стремится привести движущуюся точку x(t) на множество M в момент O, а третий игрок стремится не допустить встречи x(t) с множеством M. Особенность работы заключается в описании эволюции объекта нелинейной интегро-дифференциальной системой, что наделяет управляемую систему новыми существенными свойствами: памятью и эффектом запаздывания по управляющим воздействиям, что усложняет исследование по сравнению со случаем, когда эволюция объекта описывается обыкновенными дифференциальными системами. Для решения задачи предполагается существование некоторого стабильного моста в пространстве непрерывных функций, содержащего отрезки решений исходной системы при использовании игроками коалиции своих, определенных в работе, экстремальных стратегий, при любом допустимом управлении противоположной стороны. Предполагается, что стабильный мост обрывается на целевом множестве M в фиксированный момент времени O. Доказывается, что построенные в работе экстремальные стратегии коалиции удерживают выбранное решение (движение) системы на стабильном мосту, что и решает поставленную задачу наведения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Game Problem Guidance for Integro-Differential System of Volterra Type for Three Persons

The problem of guidance of a dynamic object in space R n on a closed set M is considered. In this problem three players take part, and two of them make up the coalition that seeks to bring moving point x(t) to the set of at the moment o, and a third player tries to avoid the meeting, x(t) with the set M. Feature of our work is to describe the evolution of the object of nonlinear integral differential system, which gives to the controlled system new essential properties: memory and the effect of delay on control inputs, which complicates the study, compared with the case where the evolution of the object is described by ordinary differential systems. To solve the problem we assume the existence of a stable bridge in the space of continuous functions, containing pieces of solutions of the initial system when using players' coalition of their extreme strategies defined in the work for any admissible management of the opposite side. It is assumed that a stable bridge dropped on the target set M in a fixed moment of time. We prove that the constructed in the work of the extreme strategy coalition holds the solution (the movement) of the system at stable bridge, and solves the problem of guidance.

Текст научной работы на тему «Игровая задача наведения интегро-дифференциальной системы типа Вольтерра для трех лиц»

КРАТКИЕ СООБЩЕНИЯ

УДК 517.977

ИГРОВАЯ ЗАДАЧА НАВЕДЕНИЯ ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНОЙ СИСТЕМЫ ТИПА ВОЛЬТЕРРА ДЛЯ ТРЕХ ЛИЦ

В.Л. Пасиков

Рассматривается задача наведения динамического объекта в пространстве Мп на замкнутое множество М. В этой задаче участвуют три игрока, причем, два из них составляют коалицию, которая стремится привести движущуюся точку х(€) на множество М в момент в, а третий игрок стремится не допустить встречи х(€) с множеством

Особенность работы заключается в описании эволюции объекта нелинейной интегро-дифференциальной системой, что наделяет управляемую систему новыми существенными свойствами: памятью и эффектом запаздывания по управляющим воздействиям, что усложняет исследование по сравнению со случаем, когда эволюция объекта описывается обыкновенными дифференциальными системами.

Для решения задачи предполагается существование некоторого стабильного моста в пространстве непрерывных функций, содержащего отрезки решений исходной системы при использовании игроками коалиции своих, определенных в работе, экстремальных стратегий, при любом допустимом управлении противоположной стороны.

М

рованный момент времени в.

Доказывается, что построенные в работе экстремальные стратегии коалиции удерживают выбранное решение (движение) системы на стабильном мосту, что и решает поставленную задачу наведения.

Ключевые слова: игровая задача; интегро-дифференциальная система; управляющее воздействие; позиция игры; стабильная система.

с начальным условием xto [т] = x[to + т], —X < т < 0 to > 0 А = const > 0.

Здесь x - n-мерный фазовый вектор; u,v,w - Т\,Т2,Гз - мерные управляющие воздействия, стесненные условиями u € P, v € Q, w € S; P,Q, S - компакты в соответствующих евклидовых пространствах Rri, Rr2, Rr3; оператop f (t, х(т), u, v) и функция K(t,x,w,s), to < s < t < в, в = const > 0, непрерывны по совокупности своих аргументов и определены соответственно на произведениях [to, в] х С^^о] х P х Q, [to, в] х D х S х [to, в], где D -ограниченная область в Rn содержащая все траектории системы (1), C[_^o] - пространство n-мерных непрерывных на [—X, 0] вектор-функция x^), с нормой

Рассматривается конфликтно-управляемая система

t

(1)

1И*)Н

max ||ж(т)|| ,

\<т <0

символ евклидовои нормы.

Реализация u[t], v[t], w[t] управляющих воздействий u, v, w на промежутке [to,0] - измеримые по Лебегу на [to,ö] функции.

Оператор f (t,x(r), u, v) и функция K(t,x,w,s) удовлетворяют в любых ограниченных областях Qi С С[_д)о^ Q2 С Rr, соответственно, условию Липшица по второму аргументу

Оператор / (Щ, х(т), и, V)удовлетворяет следующему условию роста У/(Щ,х(т),и^)\\ < (г(г) + ^2(Щ) ||х(*)\д , где С\(^, &(Щ) - неотрицательные, непрерывные на [Що,в] функции.

Указанные выше ограничения на правую часть системы (1) гарантируют при реализовавшихся управлениях и заданном х¿0[тСуществование на [Що,в] единственного абсолютно непрерывного решения системы (1) [1]. В дальнейшем будем для определенности считать, что в — ¿о > А. Следует иметь в виду, что встречающиеся ниже понятия, не сопровождаемые ссылками и пояснениями определены в работах [2, 3].

Управляющим воздействием и распоряжается игрок р1, управляющим воздей ствием V

- игрок 51, управляющим воздей ствием ,ш распоряжается игрок р2-

Пусть в пространстве Ка задано замкнутое множество М. Задачей коалиции {р1,р2} является приведение траектории системы (1) в момент в на множество М при любом допустимом управляющем воздействии игрока 51.

Стратегию коалиции обозначим символом и = {^1,^2}, стратегию иг рока 51 обозначим символом V.

Пусть Р (а), Q(а), Б (а) - совокупности всех измеримых функций и(^), v(•), '&(•), определенных па множестве а со значениями из компактов Р^, Б соответственно.

Всякую пару {¿, х*[т]} назовем позицией игры. Стратегией и1(у) игрока Р1 (51) назовем правило, которое реализовавшейся позиции {Ь*,Х1„ [т]}, ¿о < < в, ставит в соответствие

множество и1(1*,Х1„ [т]) С Р (VЩ,х^ [т]) С Q). Стратегией игрока Р2 назовем правило, ставящее в соответствие позиции {¿*,х^ [т]}, ¿о < < в, и числу Щ* € [¿*,в) функцию

€ Б([^*, ¿*]).

Пусть заданы начальная позиция ро = {¿о,х^[т]} и разбиение Аотрезка [¿о, в] моментами ¿о = то <т1 <т2 < ... <тп = в, 5 = т&х(п+1 — п).

и=

{ и1 , и2 } ,

с начальным условием хг0[т]д = х[Що + т]д.

Здесь ¥(Щ,х,и) = со{/(Щ,х(Щ + т),и^)^ € Q}^1 на каждом полуинтервале [тг,тг+1) разбиения А уиравлен ие и = сопв^ мо мент т стратеги ей и^ а управление ш[Щ],

Щ € [и, тг+1), назначается стратегией и^, причем ш(^) € Б([^,^+1]).

3L = L(Q1) > 0, yt Є [t0,0], Vxi(r) Є Q1, Уи Є P, Ÿv Є Q :

\\f (t,xi(r),u,v) — f (t,X2(r),u,v)\\ < L ||xi(•) — X2W||A ; 3L = L(Q) > 0, Ÿt Є [to,9] :

t t

f \\K (t, x1(s),w(s), s) — K (t, x2(s), w(s), s)\| ds < L f ||x1(s) — x2(s)|| ds,

to

каковы бы ни были измеримая по Лебегу функция ш(в), Що < в < Щ то свойством ш € Б и абсолютно непрерывные функции па [Що, в] функции х^(в) : х% € 0,2, ъ = 1, 2, Що < в < Щ.

x[t]A = x[t,po, U]д, to < t < в, удовлетворяющую при почти всех t Є [to, в] дифференциальному включению

(2)

t

to

Равномерный предел движений (2) при 5 ^ 0, как обычно, назовем движением системы

и

р2

как абсолютно-непрерывную функцию х[Щ]д = х[Щ,роV]д, Що < Щ* < в, удовлетворяющую при почти всех Щ € [Що, в] дифференциальному включению

¿х[Щ]

I

€ ¥ к

(1Щ

¿0

где ¥(Щ,х,ю) = со{/(Щ,х(Щ + т),и,ю),и € Р}, управление ш[Щ] удовлетворяет условию ш(^) € Б([тг, тг+1]), а управление V = const на каждом полуинтервале [тг, тг+1) разбиения Аназначается в момент тг.

Назовем систему множеств = {х[Щ+т]}, С С^^о], Що < Щ* < в, (^,и^) - стабильной

относительно М, если каковы бы ни были позиция {Щ*,х1„ [т]}, Що < Щ* < в, х1* € момент Щ* € (Щ*, в), число ^ > 0> управляющее воздействие v(•) € Q([t*,t*]), существуют управляющие воздействия и(^) € Р([Щ*,Щ*]), №(•) € Б([Щ*,Щ*]) тшме, что х[Щ* + т] € Ш^*, где Ш^* 7 - окрестность множества Ш^* в С[_д о].

Пусть

Г2(хг[т],Шг) = М ||х*ф — уН||А ,у(^) € Wt, (3)

и для данного х^т] {х(к)[т]} - какая-либо минимизирующая для (3) последовательность. Составим множество предельных точек последовательности х(к) [0], являющейся О-сечением последовательности {х(к) [т]}.

Обозначим символом Z(х(Щ)) совокупность элементов этого множества ближайших к хг[0] в Еп.

Экстремальные стратегии ие, Vе игроков Р1 и 51 в момент тг на полуинтервале [тг, тг+1) выбираем соответственно из условий

шах(хп [0] — г,/(тгх(тг + т),ие^)) = ш\пшах(хп [0] — г,/ (тг,х(тг +т),и^),

пеР

ш\п(х^ [0] — г, /(тг, х(тг + т),и, Vе)) = шахш\п(хп[0] — г, /(тг, х(тг + т),и,у), пеР vеQ пеР

где г € Z(х(Щ)).

Здесь, считаем выполненным условие седловой точки в маленькой игре [4]

ш1пшах(хт. [0] — г, /(тг, х(тг + т),и^) = шахш1п(хт. [0] — г, /(тг, х(тг + т),и^).

пеР ье^ vеQ пеР

и2е р2 1

по позиции {тг,хт[т]}, хп[т] € моменту тг+1, числу 7 > 0, управляющему воздействию Vе = ve[тг+l] € Q([тг, тг+1]) определяем из условия (7, и, V) - стабильности функции: и(^) € Р ([тг, тг+{)),ш(^) € Б ([тг, тг+1)), где 7 < (тг+1, — тг)2.

Определенную таким образом функцию ш(^) € Б ([тг, тг+1)) назовем экстремальным управлением игрока р2 на промежутке [тг, тг+1] и обозначим символом ше[Щ], а соответствующую стратегию игрока р1 обозначим и^, таким образом ие = {ие,ие} - экстремальная { р 1 , р 2 } .

Теорема 1. Пусть начальная позиция игрыро = {Що,х¿0 [т]} такова, ч то г2хо [т], ) = 0.

Если система множеств Що < Щ* < в, (7, и, ш) - стабильна относительно множества М, то экстремальная к ней стратегия ие = {Щ,и%} удовлетворяет условию

r1(x[e],M) = 0,r1(x[e], M) = inf \\x\d] — y\\ ,y € M, x[t] - любое движ,ение x[t,po,Ue], при любой допустимой реализации управляющего воздействия игрока q1.

Доказательство. Получим оценку, подобную оценке из [3]. Для произвольно выбранной функции x[t]& = x[t,Po, Ue] д построим оценку вел ИЧИНЫ £д[Тг+1] Через ВвЛИЧ ИНЫ ед[т ]и 6; здесь £д[гг] = ^^Щд, Wt )•

Рассмотрим позицию p(k, i) = {ti,xTk\т]д}.

В силу (y, u, w) - стабильности системы множеств Wt, to < t* < в, относительно М среди движений со свойством x(k)[t^ = x[t,p(k, i), Vе] есть движение со свойством

x1^!Мд € Wt+. (4)

По определению величины ед [т] с учетом вложения (4) имеем оценку

е2д[Тг+1] < ( xT +1[*]д — 4^! Мд л + Y)2- (5)

Здесь отрезки xT+i[т]д, xTk+![т]дтраекторий x[t]д, x(k)[T]д записываются в следующем

ВИД6 ^СЧИТс16М, ЧТО Ti+i — T% < X, ai(t) = t — Tij Qi = Ti+iTij t € [тг, Tt+i))

t+T t+T £

s s a ... < I < 0

Ti to (6)

xn[т + аг.Щд, —X < T < —ai(t),

x [т]д = < xTi [0]д + j fi [^d + j —ai(t) < т < о

Ti Ti o

t+T t+T С

(k), , I xt/[0U + f f[C]dC + f fK(C,x(k)(s)д,we(s),s)dsdC, —ai(t) < T < 0

xt [т]д = \ Ti Ti to {<)

xTik [т + а^Щд, —X < T < —ai(t),

где fi[t] € F(t,x,ue),t0 < t < в, f2[t] € F(t,x,ve),t0 < t < в. Подставляем (6), (7) в неравенство (5), тогда

(k) 2

e2^[Ti+i] = max{ max xn[т]д — xTi [t]д

— Л>т <-ai(t)

VT

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t+T t+T

max [\\xTi [0]д — xTi 10]д + f fi[C]dC — f f2[C]dC+ (8)

-ai(t)<T <0 Ti Ti w

t+T i t+T t

+ j fK ((,x(s)д,we(s), s)dsd( — j fK ((,x(k)(s)д,we(s),s)dsd(\\ + y]2}-

Ti t0 Ti t0

Из (8), аналогично работам [2, 3, 5] с использованием условия Липшица, следует оценка

едТш] < едТ}^ + C ■ ai + aw(ai),

где C = const > 0, a ^(ai) - неотрицательная функция со свойством ф(ai) ^ 0 при ai ^ 0.

Отсюда, аналогично работам [2, 3, 5], следует доказательство теоремы. □

Литература

1. Зверкина, Т.С. К вопросу о численном интегрировании систем с запаздыванием / Т.С. Зверкина // Тр. Семинара по теории дифференциальных уравнений с отклоняющимся аргументом. - М.: Ун-т Дружбы народов, 1967. - Т. 4. - С. 164-172.

2013, том 6, № 4

119

2. Осипов, Ю.С. Дифференциальные игры систем с последействием / Ю.С. Осипов // ДАН СССР. - 1971. - Т. 196, № 4. - С. 779-782.

3. Осипов, Ю.С. Дифференциальные игра наведения для систем с последействием / Ю.С. Осипов // Прикладная математика и механика. - 1971. - Т. 35, № 1. - С. 123-131.

4. Красовский, H.H. Позиционные дифференциальные игры / H.H. Красовский, А.И. Субботин. - М.: Наука, 1974. - 456 с.

5. Осипов, Ю.С. О позиционном управлении при последействии в управляющих силах / Ю.С. Осипов, В.Г. Пименов // Прикладная математика и механика. - 1981. - Т. 45, № 2.

- С. 223-229.

Владимир Леонидович Пасиков, кандидат физико-математических наук, доцент кафедры естественно-математических дисциплин, Орский филиал ФГБОУ ВПО «Оренбургский государственный институт менеджмента> (г. Орск, Российская Федерация), [email protected].

Bulletin of the South Ural State University. Series «Mathematical Modelling, Programming & Computer Software:»,

2013, vol. 6, no. 4, pp. 116-121.

MSC 91A02

Game Problem Guidance for Integro-Differential System of Volterra Type for Three Persons

V.L. Pasikov, Orsk Branch of Orenburg State Institute of Management, Orsk, Russian Federation, [email protected]

The problem of guidance of a dynamic object in space R" on a closed set M is considered. In this problem three players take part, and two of them make up the coalition that seeks to bring moving point x(t) to the set of at the moment o, and a third player tries to avoid the meeting, x(t) with the set M.

Feature of our work is to describe the evolution of the object of nonlinear integral differential system, which gives to the controlled system new essential properties: memory and the effect of delay on control inputs, which complicates the study, compared with the case where the evolution of the object is described by ordinary differential systems. To solve the problem we assume the existence of a stable bridge in the space of continuous functions, containing pieces of solutions of the initial system when using players’ coalition of their extreme strategies defined in the work for any admissible management of the opposite

M

time 0.

We prove that the constructed in the work of the extreme strategy coalition holds the solution (the movement) of the system at stable bridge, and solves the problem of guidance.

Keywords: coalition; memory on the management; extreme strategy; integro-differential system; stable bridge.

References

1. Zverkina, Т.S. То the Question of the Numerical Integration of Systems with Delay [K voprosu о chislennom integrirovanii sistem s zapazdyvaniem]. Trudy Seminara po teorii differencial’nykh uravneniy s otklonyayushchimsya argumentum [Proc. of the Seminar on the theory of differential equations with deviating argument]. Moscow, Universitet Druzhby narodov, 1967, vol. 4, pp. 164-172.

2. Osipov, Yu.S. Differential Games of Systems with Aftereffect [Differencial’nye igry sistem s posledeystviem]. DAN SSSR, 1971, vol. 196, no. 4, pp. 779-782.

3. Osipov, Yu.S. Differential Game of Guidance for Systems with Aftereffect [DifferenciaPnye igry navedeniya dlya sistem s posledeystviem]. Prikladnaya Matematika i Mekhanika, 1971, vol. 35, no. 1, pp. 123-131.

4. Krasovskiy, N.N., Subbotin A.I. Pozicionnye differencial’nye igry [Positional Differential Games]. Moscow, Nauka, 1974. 456 p.

5. Osipov, Yu.S., Pimenov V.G. About Positional Control when the Aftereffect of the Governing Forces [O pozicionnom upravlenii pri posledeystvii v upravlyayushchih silakh]. Prikladnaya Matematika i Mekhanika, 1981, vol. 45, no. 2, pp. 223-229.

Поступила в редакцию 4 марта 2013 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.