Научная статья на тему 'Однотипная задача управления с выпуклой целью при наличии помехи'

Однотипная задача управления с выпуклой целью при наличии помехи Текст научной статьи по специальности «Математика»

CC BY
128
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / УПРАВЛЕНИЕ / АЛЬТЕРНИРОВАННЫЙ ИНТЕГРАЛ / DIFFERENTIAL GAME / CONTROL / ALTERNATING INTEGRAL

Аннотация научной статьи по математике, автор научной работы — Ухоботов Виктор Иванович, Гущин Денис Васильевич

Рассмотрена однотипная задача о выводе в заданный момент времени фазовой точки на выпуклое замкнутое множество с минимизацией интеграла от выпуклой по норме управления функции. В уравнениях движения присутствует помеха, о которой известно, что величина ее нормы не превосходит заданного числа. Задача рассматривается в рамках теории дифференциальных игр. Доказано существование оптимального управления и изложен алгоритм его построения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A One-Type Control Problem With a Convex Goal in Case of Disturbance

The authors analyze a one-type problem of positioning of a phase point at a preset time on the convex closed set with minimization of an integral of the convex by standards of control function. There is a disturbance in motion equations; the quantity of its norm is less than the predetermined number. The problem is analyzed within the theory of differential games. The authors prove the existence of an optimal control and give the algorithm of its plotting.

Текст научной работы на тему «Однотипная задача управления с выпуклой целью при наличии помехи»

УДК 519.857

ОДНОТИПНАЯ ЗАДАЧА УПРАВЛЕНИЯ С ВЫПУКЛОЙ ЦЕЛЬЮ ПРИ НАЛИЧИИ ПОМЕХИ

В.И. Ухоботовл, Д.В. ГущиН

Рассмотрена однотипная задача о выводе в заданный момент времени фазовой точки на выпуклое замкнутое множество с минимизацией интеграла от выпуклой по норме управления функции. В уравнениях движения присутствует помеха, о которой известно, что величина ее нормы не превосходит заданного числа. Задача рассматривается в рамках теории дифференциальных игр. Доказано существование оптимального управления и изложен алгоритм его построения.

Ключевые слова: дифференциальная игра, управление, альтернированный интеграл.

1. Введение

В дифференциальной игре «изотропные ракеты» [1], в ее варианте при отсутствии трения «мальчик и крокодил» [2] и в контрольном примере Л.С. Понтрягина [2] уравнения движения с помощью линейной замены переменных [3, с. 160] можно привести к виду, когда в правой части новых уравнений стоит сумма управлений первого и второго игроков. Вектограммы этих управлений являются шарами, радиусы которых зависят от времени. Для таких игр, в случае если терминальное множество является выпуклым и замкнутым, в [4] построен альтернированный интеграл, с помощью которого вычисляется множество тех начальных состояний, откуда первый игрок сможет в заданный момент времени вывести фазовую точку на терминальное множество. Построено соответствующее управление первого игрока.

В статье в рамках теории дифференциальных игр рассматривается задача управления при наличии помех о выводе фазовой точки в заданный момент времени на выпуклое замкнутое множество, минимизируя при этом интеграл от выпуклой функции, зависящей от нормы управления. Такие задачи возникают при управлениях системами переменного состава, в которых критерием является количество израсходованной реактивной массы [5].

2. Постановка задачи

В пространстве Я” с нормой || • || движение вектора г происходит по правилу

2 = -а(А)и + Ъ^)у, t < р . (1)

Здесь функции а(А) > 0 и Ъ(А) > 0 являются интегрируемыми на любом отрезке из полуоси (-¥, р]. На выбор управления и накладывается ограничение || и ||< 1. Расходы ресурсов, потра-

р

ченные на формирование управления и на отрезке [А0,р], задаются интегралом |g(г,11 и(г) Ц)& .

Предположение 1. Функция g(А,р) > 0 определена при всех А < р,0 <р< 1 и при любом А < р выпукла и непрерывна по ре [0,1]. При каждом ре [0,1] она измерима и ограничена сверху суммируемой на каждом отрезке из полуоси (-<», р] функцией G(t).

Считаем, что помеха Vе ^ = {ге Я” : || 21| < 1} .

Допустимые управления ищутся в классе функций

и(А, г) = р(А)^(А, г). (2)

Здесь w : (-¥, р]хЯ” ® Я” - произвольная функция, удовлетворяющая равенству

1 Ухоботов Виктор Иванович - доктор физико-математических наук, профессор, заведующий кафедрой теории управления и оптимизации, Челябинский государственный университет.

E-mail: ukh@csu.ru

2 Гущин Денис Васильевич - математик учебно-научной лаборатории методов оптимизации и моделирования игровых ситуаций, кафедра теории управления и оптимизации, Челябинский государственный университет.

E-mail: off side@mail.ru________________________________________________________________________________________________

Ухоботов В.И., Однотипная задача управления с выпуклой целью

Гущин Д.В. при наличии помехи

М, 2)Ц= 1, (3Г

а измеримая функция р: [г0,р] ® [0,1] строится в зависимости от начального состояния г(г0) = г0 . Для такого допустимого управления расход ресурсов задается интегралом

р

| £ (г,р(г))йг. (4)

г0

Зафиксируем начальное состояние. Возьмем разбиение

(О-Ло < Ь < ... < ^+1 = р, й(о) = тах(г,+1 - г,). (5)

0<,<к

Построим ломаную

О) = о({,)-

|а(г)р(г)йг м>(^, гю(Ц)) + |Ь(г)йг

у,. (6)

Здесь ^ < г < г+1,, = 0,к, 2О(10) = 20 и любое V, е S.

Семейство ломаных (6) на отрезке [г0, р] является равномерно ограниченным и раностепенно непрерывным. По теореме Арцела [6, с. 236] из любой последовательности ломаных (6) можно выделить подпоследовательность, равномерно сходящуюся на отрезке [г0, р].

Под движением г(г), порожденным управлением (2), с заданным начальным условием г(г0) = г0 понимаем равномерный предел последовательности ломаных (6), у которых диаметр разбиения й(о) стремится к нулю.

Задано замкнутое выпуклое множество 2 с Я" и начальное состояние г(г0) е Я", г0 < р . Нужно построить допустимое управление (3) такое, чтобы для любого движения г(г), порожденного этим управлением с заданным начальным условием г(г0), выполнялось включение

г(р) е 2. (7)

Среди таких допустимых управлений требуется выбрать такое, для которого интеграл (4) принимает минимальное значение.

3. Построение управления, гарантирующего включение

Зафиксируем измеримую функцию р: (-¥, р] ® [0,1] и рассмотрим дифференциальную игру

2 = -а(г )р(г )и> + Ъ(г )у, (8)

в которой первый игрок выбирает управление w е S, а второй - V е S . Цель первого игрока за-

ключается в осуществлении включения (7). Цель второго игрока - противоположна.

Для этой игры в работе [4] построен альтернированный интеграл Л.С. Понтрягина [2] и предложен алгоритм построения управления первого игрока, обеспечивающего включение (7). Обозначим

}/

Ь(р( )) = тах [(Ъ(г) -а(г)р(г))йг, (9)

Х<Т<

Т

а(г; р()) = Ь (г; р()) -1 (а(г )р(т) - Ъ(г ))йг (10)

г

и введем в рассмотрение геометрическую разность двух множеств X и У в пространстве Я" [2]

Х*У = {2е Я" : 2 + У с X}.

Альтернированный интеграл равен [4]

Ж (г; р()) = 2 *Р(г, р()^ + а(г; р())^ (11)

В [4] показано, что, если начальное состояние г(г0) й Ж(г0;р( )), то для любого управления w : (-¥,р]хЯ" ® S найдется движение г(г) такое, что включение (7) не выполнено.

Пусть начальное состояние г(г0) е Ж(г0;р( )). Обозначим при г < р и 2 е Я"

е(г, г) = т^е > 0: г е Ж (г; р()) + 2eS}.

г

г

Математика

Из замкнутости множества Ж (і; р()) следует, что при некотором ^ є S выполнено включение

2 - є(і, 2)^ є Ж (і; р()) + Є».

Можно показать, что это включение выполнено на некотором векторе ^ = м>(^, 2), у которого

|| Ш^, 2) ||= 1.

Теорема 1. Управление (2) с функцией м>(^, 2) обеспечивает в задаче (1) включение (7) для любого движения 2(і) из любого начального состояния 2(і0) є Ж(і0;р(-)).

Доказательство непосредственно следует из теоремы 2 в работе [4].

4. Построение оптимального управления

Возьмем точку 20 є Я” и число і0 < р и рассмотрим следующую оптимизационную задачу:

р

I g (г, ррг))<яТ ® тіп, р: [І0, р] ® [0,1], (12)

і0

20 є 2*Ь(і0;р(-))»+а(^;р(-))». (13)

Теорема 2. Пусть функция g(і,р) удовлетворяет условиям предположения 1, а включение (13) выполнено на некоторой измеримой функции р:[і0,р] ® [0,1]. Тогда решение р0 : [і0,р] ® [0,1] в задаче (12), (13) существует.

Доказательство. Обозначим через g0 нижнюю грань функционала (12) на измеримых функциях р:[і0, р] ® [0,1], удовлетворяющих включению (13). Из неравенства g(t,р) > 0 следует, что g0 > 0. Существует последовательность измеримых функций рт :[і0,р] ® [0,1], удовлетворяющих включению (13), такая, что

р

Ііт I g(г,рт (г))ёг = go. (14)

т®¥ *

і0

Каждая из функций

/т (і) = I (Ь(г) - а(г)Рт (г)№, Іт (і) = | g(г, рт (г))& (15)

і і при любых і0 < ^ < і2 < р удовлетворяет неравенству

і2 і2

| /т 0і) - /т (і2) |< I Ь(г )с1г, | Іт (^) - Іт ^) |< | 6(г )^, (16)

«2

«2) |< I Ъ(г )ы< , | 1т («1) - 1т (<2)

?! «!

из которого получим, что каждая из последовательностей функций (15) является равностепенно непрерывной и равномерно ограниченной. По теореме Арцела из них можно выделить подпоследовательности, которые на отрезке [?0,р] сходятся равномерно. Не вводя новых обозначений, считаем, что сами последовательности сходятся равномерно: /т («) ® /(«), 1т (?) ® I(«).

Предельные функции /(«) и g(«) удовлетворяют неравенствам (16). Из теоремы об абсолютной непрерывности интеграла Лебега [7, с. 282] следует, что функции / («) и /(«) являются абсолютно непрерывными на отрезке [?0, р].

Допустим, что существует измеримая функция (р0 : [?0, р] ® [0,1] такая, что

/ («) = а(«)р(«) - Ъ(«), I («) < -g(«,р)) (17)

для почти всех «е [?0, р]. Из формул (15) следует, что /т (р) = 0 . Поэтому /(р) = 0 . Интегрируя первое равенство в (17), получаем

/(«) = I(-а(г)р(г) + Ъ(г))Ыг . (18)

I

Ухоботов В.И., Однотипная задача управления с выпуклой целью

Гущин Д.В. при наличии помехи

Из второй формулы (15) получим, что 1т(р) = 0 и согласно (14) 1т(^0) ® g0. Поэтому I (р) = 0 и I (t0) = g0. Отсюда и из второго неравенства (17) следует, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

р

Ig(г,р(г)№ £ go. (19)

г0

Покажем, что функция (р0(т) удовлетворяет включению (13). В самом деле, каждая из функций (рт (г) удовлетворяет включению (13). Это значит, что существует последовательность векторов sm е ^ такая, что

^0 - а^0; <Рт ( • Ж + <Рт ( • ))5 е Z (20)

для любого вектора 5 е ^ . Можем считать, что 5т ® 5* е ^ (иначе перейдем к подпоследовательности). Далее, из равномерной сходимости /т (0 ® /(^ и из формул (9), (10), (15) и (18) следует, что Ь((0;Рт( • )) ®Ь0;Р0( •)), a(t0;рm( )) ®а(10;р0(• )). Отсюда и из включения (20), используя замкнутость множества Z, получим, что включение (13) выполнено и для функции Р0(г).

Чтобы доказать существование измеримой функции р0 : [70, р] ® [0,1], удовлетворяющей формулам (17), введем в рассмотрение многозначную функцию

б(^) = {(<?1,42) е Я2 : 4 = а(г)Р- Ъ(г),42 = -gЦ, Р),"ре [0,1]}. (21)

Из непрерывности по ре [0,1] функции g(^р) следует, что при каждом tе [^,р] множество Q(t) является замкнутым. Далее, множество Q(t) содержится в шаре радиуса а(^) + Ъ(^) + О^). Из измеримости по t е [^, р] функций а(^), Ъ(t) и g (t,р) следует, что многозначная функция (21)

г

измерима по t е [t0, р] [8]. Следовательно, для любых чисел t0 £ t <г£ р интеграл | Q(г )ёг является выпуклым компактом [8].

Из формул (15) следует, что для любых чисел t0 £ t <г£ р выполнено включение

г

(/т (г) - /^), 1т (г) -1 ^)) е IQ(г)<яг. Переходя в этом включении к пределу при т , получаем,

г

0 є j((-f(r), -l(r)) + Q(r) )dr. (22)

что предельные функции / (і) и І (і) удовлетворяют этому включению. Следовательно

г

)Є |((-і (г),-І(г)) +

і

Зафиксируем вектор (у,у2)є ^2 и обозначим через )) опорную функцию мно-

жества Q(г). Функция а(г) = - / (г )у -1 (г )у2 + е(у1,у2; Q(г)) является суммируемой на отрезке

[t0, p]. Из включения (22) следует неравенство j a(r)dr > 0 . У интеграла с переменным верхним

‘0

t

t

пределом g(t) = | a(r)dr почти всюду существует производная и выполнено равенство

to

1 Т

g(t) = a(t). Поэтому a(t) = g(t) = lim ------Г a(r)dr > 0 для почти всех t e [t0, p].

t®t+0 t — t *

Таким образом, для каждого вектора (y,y2)e R существует множество полной меры I с [t0, p] такое, что для любого t e I выполнено неравенство

f (t )y +1 (t )y £ c(yi,^2; 6(r)). (23)

Множество векторов (y,y2) с рациональными координатами образуют счетное множество.

Занумеруем их (у1г),у2;г)). Каждому из них соответствует множество полной меры It. Их пере-

t

Математика

числение I* является множеством полной меры. Для каждого tе I* и для каждого вектора (у1<'г),у2;г)) выполнено неравенство (23). Из непрерывности опорной функции по переменным у и у2 следует, что неравенство (23) будет выполняться при t е I* для любого вектора (У1,У2)е К2 .

Из неравенства (23) следует выполнение (/(^), I(0) е coQ(t) при I е I*. Отсюда, используя теорему Каратеодори [9, с. 9], получим, что существуют числа > 0,р е [0,1],г = 1,2,3, Я1+Л2 + +1 = 1 такие, что

3 3

/(0 = -Ъ(0, I(0 =-£Л^(р). (24)

г=1 г=1

Из этих формул, применяя лемму о выборе А.Ф. Филиппова [10] получим, что существуют измеримые на отрезке ^0, р] функции 1(0 > 0, р(0 е[0,1], г = 1,2,3,1(0 + 1(0 + 1(0 = 1 такие,

что они удовлетворяют равенствам (24) для почти всех t е [^, р]. Следовательно, функция

) = X)р(Г)е [0,1]

г=1

удовлетворяет первому равенству (17). Из выпуклости по р функции g(^р) следует, что

3 ( 3 ^

I(t)=-£1(0g(рдо)£-g t,xл(t)р) =-g(р(0).

г=1

V i=i /

Таким образом, построенная функция p0(t) удовлетворяет требуемым соотношениям (17).

Литература

1. Айзекс, Р. Дифференциальные игры / Р. Айзекс. - М.: Мир, 1967. - 479 с.

2. Понтрягин, Л.С. Линейные дифференциальные игры преследования / Л.С. Понтрягин // Математический сборник. Новая серия. - 1980. - Т. 112. Вып. 3. - С. 307-330.

3. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. - М.: Наука, 1974. - 456 с.

4. Ухоботов, В.И. Однотипные дифференциальные игры с выпуклой целью / В.И. Ухоботов // Труды ин-та математики и механики УрО РАН. - 2010. - Т. 16, № 5. - С. 196-204.

5. Ухоботов, В.И. Однотипные дифференциальные игры с выпуклой интегральной платой / В.И. Ухоботов, Д.В. Гущин // Труды ин-та математики и механики УрО РАН. - 2011. - Т. 17, № 1. - С. 251-258.

6. Люстерник, Л.А. Элементы функционального анализа / Л.А. Люстерник, В.И. Соболев. -М.: Наука, 1965. - 520 с.

7. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М.: Наука, 1972. - 496 с.

8. Hermes, H. The Generilized Differential Equation X e R(t, x) / H. Hermes // Advances in Math. - 1970. - Т. 4, № 29. - С. 149-169.

9. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный. - М.: Наука, 1980. - 319 с.

10. Филиппов, А.Ф. О некоторых вопросах теории оптимального регулирования / А.Ф. Филиппов // Вестник МГУ. Серия «Математика, механика». - 1959. - Вып. 2. - С. 25-32.

Поступила в редакцию 19 декабря 2011 г.

Ухоботов В.И., Гущин Д.В.

Однотипная задача управления с выпуклой целью

при наличии помехи

A ONE-TYPE CONTROL PROBLEM WITH A CONVEX GOAL IN CASE OF DISTURBANCE

V.I. Ukhobotov', D.V. Gushchin2

The authors analyze a one-type problem of positioning of a phase point at a preset time on the convex closed set with minimization of an integral of the convex by standards of control function. There is a disturbance in motion equations; the quantity of its norm is less than the predetermined number. The problem is analyzed within the theory of differential games. The authors prove the existence of an optimal control and give the algorithm of its plotting.

Keywords: differential game, control, alternating integral.

References

1. Ajzeks R. Differencial'nye igry (Differential Games). Moscow, Mir, 1967. 479 p. (in Russ.). [Isaacs R. Differential Games. John Wiley and Sons, 1965.]

2. Pontrjagin L.S. Linejnye differencial'nye igry presledovanija (Linear differential games of pursuit). Matematicheskij sbornik. Novaja serija. 1980. Vol. 112. Issue 3. pp. 307-330. (in Russ.).

3. Krasovskij N.N., Subbotin A.I. Pozicionnye differencial'nye igry (Positional Differential Games). Moscow, Nauka, 1974. 456 p. (in Russ.).

4. Ukhobotov V.I. Odnotipnye differencial'nye igry s vypukloj cel'ju (The same type of differential games with convex purpose). Trudy Instituta Matematiki IMekhaniki UrO RAN. 2010. Vol. 16, no. 5. pp. 196-204. (in Russ.).

5. Ukhobotov V.I., Gushchin D.V. Odnotipnye differencial'nye igry s vypukloj integral'noj platoj (The same type of differential games with convex integral payoff). Trudy Instituta Matematiki I Mekhaniki UrO RAN. 2011. Vol. 17, no. 1. pp. 251-258. (in Russ.). [Ukhobotov V.I., Gushchin D.V. SingleType Differential Games with Convex Integral Payoff. Proceedings of the Steklov Institute of Mathematics. 2011. Vol. 275, Suppl. 1. p. 178. DOI: 10.1134/S0081543811090136].

6. Ljusternik L.A., Sobolev V.I. Jelementy funkcional'nogo analiza (Elements of functional analysis). Moscow, Nauka, 1965. 520 p. (in Russ.).

7. Kolmogorov A.N., Fomin S.V. Jelementy teorii funkcij i funkcional'nogo analiza (Elements of the Theory of Functions and Functional Analysis). Moscow, Nauka, 1972. 496 p. (in Russ.).

8. Hermes H. The Generilized Differential Equation Xe R(t,x). Advances in Math. 1970. Vol. 4, no. 29. pp. 149-169.

9. Pshenichnyj B.N. Vypuklyj analiz i jekstremal'nye zadachi (Convex analysis and extremal problems). Moscow, Nauka, 1980. 319 p. (in Russ.).

10. Filippov A.F. O nekotoryh voprosah teorii optimal'nogo regulirovanija (On some questions in the theory of optimal control). VestnikMGU. Serija “Matematika, mehanika”. 1959. Issue 2. pp. 25-32. (in Russ.).

1 Ukhobotov Viktor Ivanovich is Dr. Sc. (Physics and Mathematics), Professor, Head of the Theory of Control and Optimization Department, Chelyabinsk State University.

E-mail: ukh@csu.ru

2 Gushchin Denis Vasilevich is a mathematician of a university research laboratory of methods of optimization and modeling game situations, Theory of Control and Optimization Department, Chelyabinsk State University.

E-mail: off side@mail.ru________________________________________________________________________________________________

i Надоели баннеры? Вы всегда можете отключить рекламу.