Научная статья на тему 'О модельных движениях в задаче управления при функциональных ограничениях на помеху'

О модельных движениях в задаче управления при функциональных ограничениях на помеху Текст научной статьи по специальности «Математика»

CC BY
159
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНАЯ ГАРАНТИЯ / СТРАТЕГИИ С ПОЛНОЙ ПАМЯТЬЮ / ФУНКЦИОНАЛЬНЫЕ ОГРАНИЧЕНИЯ / OPTIMAL GUARANTEE / STRATEGIES WITH FULL MEMORY / FUNCTIONAL CONSTRAINTS

Аннотация научной статьи по математике, автор научной работы — Серков Дмитрий Александрович

Рассматривается задача управления системой, описываемой обыкновенным дифференциальным уравнением. Предполагается, что значения управления и помехи в каждый момент времени содержатся в некоторых компактных множествах. Предполагается также, что помехи удовлетворяют некоторым дополнительным ограничениям функционального характера, отражающим природу рассматриваемой задачи. Качество управления оценивается функционалом, заданым на множестве фазовых траекторий рассматриваемой системы, и непрерывным в метрике равномерной сходимости. Ранее установлено, что стратегия с полной памятью разрешает данную задачу управления при компактных ограничениях на помеху и при других функциональных ограничениях, которые к ним сводятся. Вместе с тем, построенные для этих случаев стратегии не являлись универсальными, то есть они зависели от начальной позиции движения системы. Также оставался открытым вопрос о возможности разрешения задач управления с функциональными ограничениями в более узком (классическом) множестве стратегий позиционных стратегий. В данной статье приводится конструкция оптимальной стратегии, использующая в цепи обратной связи вспомогательную модель управляемой системы и обладающая свойством универсальности. Даны примеры, мотивирующие расширение класса разрешающих стратегий до стратегий с полной памятью.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the Model Motions in Control Problem with Functional Constraints on Disturbances

A control problem for a system described by an ordinary differential equation is considered. It is suggested that the values of the control and of disturbance belong compact sets at every instant. It is also assumed that the disturbance meets some additional functional constraints showing the nature of the problem under consideration. The control quality is assessed by the functional continuous in the metrics of uniform convergence over the set of phase paths of the system. As it is previously stated, a strategy with full memory solves the control problem under compact constraints to the disturbance as well as under other functional constraints which are reduced to them. At the same time, the strategies constructed for the cases above are not universal, i.e. they depend on the starting position of the system motion. The question of possibility to solve the control problem with functional constraints in a narrower (classic) set of strategies (positional strategies) remains open. This paper gives the construction of the universal optimal strategy using a model of the control system in the feedback path. The examples that lead to the expansion of the class of solution strategies up to strategies with full memory are also given.

Текст научной работы на тему «О модельных движениях в задаче управления при функциональных ограничениях на помеху»

УДК 517.952, 517.977

О МОДЕЛЬНЫХ ДВИЖЕНИЯХ В ЗАДАЧЕ УПРАВЛЕНИЯ ПРИ ФУНКЦИОНАЛЬНЫХ ОГРАНИЧЕНИЯХ НА ПОМЕХУ

Д. А. Серков

Рассматривается задача управления системой, описываемой обыкновенным дифференциальным уравнением. Предполагается, что значения управления и помехи в каждый момент времени содержатся в некоторых компактных множествах. Предполагается также, что помехи удовлетворяют некоторым дополнительным ограничениям функционального характера, отражающим природу рассматриваемой задачи. Качество управления оценивается функционалом, заданым на множестве фазовых траекторий рассматриваемой системы, и непрерывным в метрике равномерной сходимости. Ранее установлено, что стратегия с полной памятью разрешает данную задачу управления при компактных ограничениях на помеху и при других функциональных ограничениях, которые к ним сводятся. Вместе с тем, построенные для этих случаев стратегии не являлись универсальными, то есть они зависели от начальной позиции движения системы. Также оставайся открытым вопрос о возможности разрешения задач управления с функциональными ограничениями в более узком (классическом) множестве стратегий — позиционных стратегий. В данной статье приводится конструкция оптимальной стратегии, использующая в цепи обратной связи вспомогательную модель управляемой системы и обладающая свойством универсальности. Даны примеры, мотивирующие расширение класса разрешающих стратегий до стратегий с полной памятью.

Ключевые слова: оптимальная гарантия, стратегии с полной памятью, функциональные ограничения.

Введение

Рассматривается задача оптимизации гарантированного результата в случаях, когда па помеху наложены дополнительные ограничения функционального характера. Рассмотрение основывается па подходах, берущих начало в школе Н. Н. Красовского по теории управления (СМ. [1, 2]).

Задачи управления с функционально ограниченной помехой имеют содержательные предпосылки и исследовались в качестве самостоятельные проблемы [3, 4, о]. В работах [3, 4] исследовались множества программного поглощения [6, 7] для случаев, когда помеха формируется па основе непрерывной позиционной стратегии, либо посредством полунепрерывного сверху многозначного отображения, определенного па расширенном фазовом пространстве управляемой системы. В работе [о] рассматривались помехи, ограниченные некоторым неизвестным компактным (в топологии пространства ¿2 (Т, М”) — функций из Т С М в М” суммируемых по Лебегу с квадратом) подмножеством множества допустимых помех (далее в тексте такие ограничения на помехи будут именоваться «^-компактными ограничениями па помеху»). Для этого вида ограничений устанавливается, в частности, равенство оптимальных результатов, достигаемых в классе стратегий с полной памятью [1, § 95] и в классе квазистратегий [2, с. 24].

Известно, что стратегия с полной памятью разрешает задачу управления при ¿2-компактпых ограничениях па помеху и при других функциональных ограничениях, сводящихся к ним [о, 8]. Следует отметить, что построенные в этих работах стратегии тте являлись универсальными, то есть они зависели от начальной позиции го- Также оставался

открытым вопрос о возможности разрешения задач управления с функциональными ограничениями в более узком (классическом) множестве стратегий — позиционных стратегий. Цель этой работы состоит в построении стратегии с полной памятью универсальной и оптимальной при ¿2-компактных ограничениях на помеху, а также примеров, показывающих, что при функционале качества терминального типа (общего вида), вообще говоря, не существует универсальной позиционной стратегии (позиционной стратегии) оптимальной при ¿2-компактпых ограничениях на помеху.

1. Постановка задачи

Рассматривается управляемая система, описываемая обыкновенным дифференциальным уравнением

Х(т) = /(т,х(т),и(т),у(г)), т £ Т =[^,Щс М, (1)

и начальным условием х(^) = го £ Оо С М”, где «=» означает «равно по определению». Реализации управления и(-) и помехи у(-) предполагаются измеримыми по Борелю функциями, удовлетворяющими геометрическим ограничениям и(т) £ V С Мр, у(т) £ Q С М9. т £ Т. Множества всех таких реализаций управления и помехи обозначим соответственно и и V. Множества Оо, V и Q суть компакты в соответствующих евклидовых пространствах. В отношении функции /(■) будем предполагать, что она

— определена и непрерывна по совокупности аргументов в области М”+1 х V х^.

— локально липшицева по второй переменной: \\/(т,Х1,и,ь) — /(т,Х2,и,у)\\ ^ Lf ||х1 —

х2||, где (т,Х]_), (т,х2) £ Б, и £ V, V £ ^ Б — любое ограниченное подмножество из М”+1, Lf = (Б) — константа Липшица, зависящая от множества 5:

— удовлетворяет условию подлинейного роста: \\/(т,х,и^)\\ ^ К(1 + ||х||), К ^ 0 для всех (т, х,и^) £ Т х М” XV хQ.

При указанных условиях решение в смысле Каратеодори задачи Копти (1) существует па всем интервале [¿о, $] и единственно для любых реализаций управления и(^) £и и помехи v(■) £ V (см. [9, 11.4]). Для (¿*,х*) £ Т х М”, и() £и, v(■) £ V обозначим х(^^*,г*,и(^)^() такое решение задачи (1) с начальным условием х^*) = х*.

Выделим следующее подмножество пространства состояний системы (1):

О = с\тхМ™ {(т,х) £ [¿о,$] X М” I х = х(т,и,го,и(^)^(^)),го £ Оо,и(■) £ и^() £ V}.

Пусть Ат = { А £ 2т \{0} | | А| < то, тттед т = tо, тахтед т = $}. Для всякого А £ Ат определим чи ело ^А) = тах {т1п т' — т} (далее — диаметр раз биения А) и един-

Т €Д\{$} т'еД

Т1 >Т

ственный кортеж (тг)г&о..пА £ А”а, пд = |А|, сохраняющий естественный порядок в Т: тг > т—1, г £ 1..пд. Элемен ты Ат будем называть дазбиеншии и отрезка Т. Каждое разбиение А £ Ат порождает дизъюнктное покрытие интервала [¿о,$) системой интервалов [тг-1,тг), тг-1,тг £ А, г £ 1..пд.

Для произвольного А £ Ат обознач им и (А) С и подмножество реализаций управления

А

Обозначим в и назовем стратегиями управления множеств о всех функций и вида

и : Т х С(Т, М”) х Ат ^Р, (2)

где С(Т, М”) пространство функций из Т в М” непрерывных в равномерной норме. Поясним содержательный смысл аргументов в (2):

— первый отвечает текущему моменту времени в процессе управления;

— второй аргумент - истории движения; он представляется функциями, определенными на T, но в силу приведенной ниже пошаговой процедуры формирования движений на управление влияют лишь значения этих функций в моменты, предшествующие текущему моменту (первый аргумент);

- последний аргумент доставляет информацию о выбранном разбиении интервала управления.

Для произвольных zo € Gq, v(-) €V и A € Ат обозначим

xA(-) = x(-,to,zo,U,A,v(-)), u(-) = uA(-,to,zo,U,A,v(-)) € U(A)

пошаговое движение и соответствующую реализацию управления [1], порождаемые стратегией U € S из начальной позиции (to,zo) при разбиении А и помехе v(-), определяемые следующим образом:

и(т, to, zo, U, А, v(■)) = U(Ti, xA0,Ti](-), A), т € [Ti,Ti+i), i € 0..(nA - 1), xAt) = x(^,to,zo,uA (■),?;(■)),

где для произвольных ti,t2 € T, ti ^ t2 и функции h(^) : [t\,t2] ^ H символы h[tl,t2\(■) обозначают следующую функцию из T в H:

(h(ti), т € [to,ti], h[ti,t2\(T) h(t2), T € [t2,$}, (3)

[h(T), T € [to,ti] U [t2,tf].

Экстраполяция (3) использована в построении пучка движений для того, чтобы в процессе формирования управления доопределить второй аргумент стратегии U € S (не из-

U

определеттии пошаговых движений не возникает необходимости в свойстве ттеупреждаемо-

S

пучков конструктивных движений возникает как следствие ттеупреждаемости пошаговых движении.

Пусть имеются zo € Gq, U € S и V С V. Определим пучок движений X(zo,U,V) как множества всех элементов x(^) € C(T, R”), для которых найдутся последовательности

{(zok ,vk (■), Ak) € Gq x V x At | k € N},

удовлетворяющие условиям limk^TO zok = zo, limk^TO d(Ak) = 0,

lim^ l|x(0 - x(^,to,zok ,U,Ak ,vk (■WHcotr™ ) = 0,

Pi введем в рассмотрение следующие пучки конструктивных движений, порожденные стратегией U € S:

X (zo,U) 4 clc №)< U X (zo,U,V)

t V^compL2(T) (V)

X(zo, U) 4

clC (T,Rn) u X (zo,U,{v(^)})

(v(-)GV

где с1С(удп) означает замыкание в топологии пространства C(T; М”), a comply;Rq) (V )-семейство всех подмножеств V, компактных в сильной топологии пространства L2(T; М”). Качество движения системы (1) будем оценивать функционалом

Y(■): C(T, М”) м- М, (4)

непрерывным в пространстве C(T, М”). Сторона, формирующая управлепие u(-) Е Ы, стремится минимизировать показатель качества (4).

Гарантированным результатом стратегий U Е S для начальной позиции zo Е Go при программных ограничениях на помеху (при L2-KOMna,KmHbix ограничениях на помеху) назовем величину

TP(zo,U) = sup l(x(')) (rc(zo,U) = sup l(x(-))).

x(-)£XP (zo,U) x(-)eXc (zo,U)

Определим величину оптимального гарантированного результата rP(zo) (rc(zo)) в классе стратегий S для начальной позиции zo Е Go при программных ограничениях на помеху (при L2-KOMnaKmHux ограничениях на помеху):

TP(zo) = inf TP(zo, U) (Tc(zo) = inf Tc(zo, U)).

UeS UeS

Следуя [2, с. 24J, назовем квазистратегией (управления) всякое отображение а(-) : V такое, что для всяких т Е T, v(-),v'(-) Е V таких, что v(-)|[t0;T] = v;(^)|[to,т], выполняется a(v('))|[t0,r] = a(v'(-))l[t0,т]. Здесь операция •|[а,ь] означает сужение операнда, определенного на интервале, содержащем отрезок [a, Ъ], па отрезок [a, Ъ]. Пусть Q — множество всех таких квазистратегий. Для каждых zo Е М” и а(-) Е Q элементы множества

X(zo, а(■)) ={x(‘, zo, a(v(-)), v(■)) | v(-) Е V}

представляют собой движения из начальной позиции zo Е Go, порожденные квазистратегией а(^). Значение

= inf sup y (x(■))

a(-)^Q x(-)^X(zo,a(-))

есть оптимальный гарантированный результат в начальном состоянии zo Е Go в классе квазистратегий (при отсутствии функциональных ограничений па помехи).

Замечание 1. Подобно тому, как это сделано выше, можно также определить оптимальный гарантированный результат в классе квазистратегий при L2-KOMnaKTHbix ограничениях на помехи или при программных ограничениях; однако, эти определения приведут к одинаковым величинам: квазистратегии с точки зрения оптимального гарантированного результата нечувствительны к функциональным ограничениям па помехи.

Назовем стратегию U* Е S оптимальной в тачальной позиции zo Е Go щи L2-компактных ограничениях па помеху (при программных ограничениях па помеху), если выполнено равенство rc(zo, U*) = rc(zo) (rp(zo, U*) = rp(zo)).

Из определений следуют неравенства rQ(zo) ^ rp(zo) ^ rc(zo), справедливые при всех zo Е Go - В работе [5] в предположении инъективности правой части уравнения (1) по последней переменной v ЕЯ установлено равенство rQ(zo) = rc(zo) и вид разрешающей стратегии. В [8] предложено более общее условие (11) па систему (1), достаточное для выполнения равенств TQ(zo) = Tp(zo) = Tc(zo), и конструкция стратегии с полной памятью, оптимальной L2

будет также оптимальной при программных ограничениях па помеху). Однако, стратегии,

предложенные в этих работах, не являлись универсальными, то есть они зависели от начальной позиции го- В следующей части приводится вариант стратегии из множества й универсальной и оптимальной при ¿2-компактпых ограничениях на помеху и строятся примеры, показывающие отсутствие в общем случае такой стратегии во множестве позиционных стратегий (то есть функций из О в V).

2. Универсальная стратегия с полной памятью

Дадим краткое содержательное описание предлагаемой стратегии (обозначим ее иь).

Стратегия иь в процессе синтеза управляющего воздействия симулирует движение вспомогательной управляемой системы (именуемой ниже у-моделыо), описываемой теми же уравнениями и теми же начальными условиями, что и рассматриваемая управляемая система (1). При формировании движения у-модели на очередном интервале разбиения строится помеха, аппроксимирующая (в подходящем смысле) неизвестную помеху в исходной системе (1). Построение аппроксимирующей помехи, по-сути, сводится к решению обратной задачи динамики [10, 11]. Управление в у-модели формируется контрстратегией [1], оптимальной по отношению к выбранной аппроксимирующей помехе. Заданное таким образом в у-модели управление используется в «реальной» управляемой системе (1) па следующем отрезке разу

коттструктивпым движениям, а движения исходной системы (1) приближаются к соответ-

у

зпачепие показателя качества па движениях исходной системы и, как следствие, — оптимальность стратегии иь. Модель лидирует в реакциях па помеху, что и послужило поводом отметать эту стратегию индексом «Т,».

Приведем формальное определение стратегии иь. Пусть имеются произвольные £ € Т. х() € С(Т, М™), А € Ат и некоторые непустые компактные множества Ш(г) С С(Т, М™). заданные для всех г € Оо- В дальнейшем построении используются множества

V(и, х(-),т, г1) = ащшт ||х(г/) — х(т) — (т/ — т)/(т, х(т),и, у)

v&Q

определенные для произвольных и € Vр т,т € Т, т < т , х(') € С(Т, М™).

Из разбиения А сделаем «почти равномерное» разбиение А/ ={тд | г € 1..иА/} € Ат Т

тд' = шт{т € А | т ^ г(§ — Ьо)/иА/}, г € 0..иА/, иА/ = шт{п € N | п2 ^А) ^ 1},

и&Т '

где г € 1..Ц] Щ, Уо — некоторые произвольно выбранные и фиксированные значения: Ш(х(£о))|[4о тд'| означает множество сужений на интервал ^о,тд ] элементов из множества Ш(х(Ьо)) С С(Т, М™). И, наконец, положим

иь(г, х(), А) = иь(тА, х( ), А). (10)

Замечание 2. До настоящего момента стратегия иь определена с точностью до множества Ш(■) (зависящего от начальной позиции движения) и не связана с показателем качества ^(')-В следующей теореме множества специального вида (зависящие от ^() завершат определение стратегии иь.

В определении значения иь(г,х(■), А) при всех г € Т, по-существу, участвует лишь

отрезок х(^)|г А', траектории х() € С(Т, М™).

[г°,т1 1 1

Введем в рассмотрение множества №(г) Q С(Т, М™), полученные из траекторий «почти оптимальных» квазистратегий:

№ (г) = П с1С (Т,М") { и X(г,а(^))^, г € Оо,

£>о Тя(г,а(-))^

гя(г)+£

а также фактор-множество 2/ ~ множества Q, порожденное отношением эквивалентности

Ьхи

Ьхи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(У1 ~ У2) & (/(г,х,и,У1) = /(г,х,и,У2)), У1,У2 € 2,

Ьхи

определенное для любых (г, х") € О, и €Р.

Теорема 1. Пусть для системы (1) фактор-множества 2/ ~ не зависят от и €Р:

Ьхи

2/ ~ = 2/ ~ для всех и,и/ € V, (г,х) € О. (11)

1хи Ьхи'

Тогда для любой начальной позиции го € Оо справедливы равенства

Тр(го) =Тс(го) =Т<л(го), го € Оо. (12)

Стратегия иь, заданная формулами (5)-(10), в которых

Ш (г) = № (г), г € Оо,

является стратегией, оптимальной при Ь2-компактных ограничениях на помехи для любой начальной позиции го € Оо.

Замечание 3. Ввиду равенства (12), определенная в теореме 1 стратегия иь будет также оптимальной при программных ограничениях па помеху

Замечание 4. Из определений видно, что стратегия иь является универсальной, то есть

го

варианта определения стратегии, в работе [8] элементы Wi(■) (см. (9)), по-сути, были заданы соотношением

щ(■) € а^тт 1И0 — у()\\с(Ь а'

а', с([ Т 1 )

[t0,Ti ]

явно указывагопщм па отсутствие универсального характера стратегии.

Замечание 5. В качестве примера семейства управляемых систем, удовлетворяющих условию (11), можно привести системы вида:

где д(-) — матрица-функция размерности п х д, /2^) — вектор-функции (столбцы)

размерности п, и Н(-) — вектор-функция размерности д таковы, что правая часть (13) удовлетворяет условиям существования и продолжимости решений, и при всех (і, х) Є О ядро линейного оператора д(і, х, и) : М9 ^ М™ те зависит от и ЄР.

В частности, управляемая система

Доказательство теоремы 1 в основном следует схеме доказательства теоремы 1 из [8] и дополнительно использует свойство полуттепрерывпости сверху по включению множеств № (г) С С (Т, М™) при изменении пара метра г € Оо.

3. Об отсутствии в общем случае универсальной чисто позиционной стратегии

В данном пункте па известном примере задачи оптимального управления [2, гл.VI, §1] покажем, что в случае терминального показателя качества в классе позиционных стратегий ира5, то есть функций и гада О Э (т,х) ^ и(т,х) € V, вообще говоря, не существует универсальной стратегии, оптимальной при ¿2-компактных ограничениях на помеху.

Пример 1. Рассмотрим скалярную управляемую систему

очевидно, непрерывный в С(Т, М). Множества измеримых по Борелю функций и(^) и у() на Т удовлетворяющих ограничениям (15), как выше, обозначим и и V.

С помощью теоремы 1 проверяется, что в задаче управления (15)-(16) выполняются равенства

где Тс(г*,г*), ТР(г*,г*) — значения оптимального гарантированного результата в классе й при .¿2-компактных и программных ограничениях на помеху, соответственно, а Тя(г*,г*) — значения оптимального гарантированного результата в классе квазистратегий Р в начальной позиции (г*, г*) € [0,1] х М.

Х(і) = ¡і(і,х(і),и(і)) + ¡2(і,х(і),у(і)) + д(і,х(і),и(і)) ■ Н(і,х(і),у(і)), (13)

Т Є Т =[0,1], Р = Я ={—1,1}

д(х) = тах{0, х},х Є М,

иі(т),и2(т) Є Р, Уі(т),У2(Т) Є Я,

(14)

имеет вид (13):

х(т) = и(т) ■ у(т), х(0) = 0,

и(т) ЄР, у(т ) Є Я, т Є Т =[0,1], Р = Я ={-1,1},

(15)

її показатель качества

7 (хх(■)) = х(1),

(16)

Гс(і*,г*) = ГР(і*, г*) = Гя(і*,г*) = г* + і* — 1, (і*,г*) Є (—ж, 1] х М,

Положим

О —{(т,х) | х ^ т + 1,т € [0,1]}.

Более точно доказываемое далее утверждение формулируется следующим образом: в задаче управления (15)-(16) не существует стратегии ии € ира5, оптимальной при Ь2-

О

Пусть, вопреки утверждению, стратегия ии € ироз удовлетворяет равенствам:

Тс(г*,г*,ии) = Гс(г*,г*) = г* + г* — 1, (г*,г*) € О. (17)

Тогда, следуя рассуждениям [12], можно установить, что каждое из множеств и- — {(т, х) € О | ии(т, х) = —1}, и+ —{(т, х) € О | ии(т, х) = 1}

О

Опираясь па этот факт, мы построим последовательность

{(г*к, Ак,ук(■)) € М х Ат XV ^ € М}, удовлетворяющую соотношениям:

Пт г*к = 0, Пт ^Ак) = 0,

к^<х> к^<х>

Ит \\Ук(■) — Уо(*)Н^2([о,1];М) = 0, Уо(т) — 1, т € [0,1], (18)

ии(ткг,хк(ткг)') 1, ткг € Ак, г € 1..’пА^ ,

хк (■) — х(■, 0,г*к, {ии, Ак }, у к (■)), к € N.

Из этих соотношений сразу следует, что

¿т \\хк(■) — хо()\с([о,1];М) = 0, хо(т) — т, т € [0, 1].

Как известно, последовательность, сходящаяся в сильной топологии пространства Ь2(Т, М), образует множество, компактное в этой топологии. Следовательно, в силу сходимости (18) имеем {ук(■) | к € М}€ еошрЬ2(Т;Мч) (V) и

хо(^) € X(0, ии, {Ук(■) | к € М}) С X(0, ии).

Последнее соотношение влечет равенство

Гс(0, 0,ии) = 1,

противоречащее (17) при (г*,г*) = (0, 0).

Обратимся к построению указанных последовательностей. Всегда выполнено по крайней мере одно из утверждений:

(а) существует последовательность (г+)кем такая, ч то Нт^^ г+ = 0 ии(0,г+) = 1,

к € N

(б) существует последовательность (г-)кем такая, что Ит^.^ г- = 0 ии(0,г—) = —1, к € N

Если выполнено (а), то положим (г*к)кем —(г+)кем^ Ук(т) — 1 для всех моментов т € [тко,тк1), то есть на первом интервале разбиения Ак. Если же (а) не выполнено, ТО непременно выполняется (б), И МЫ ПОЛОЖИМ (г*к)кеМ —(г-)кеМ ДЛЯ всех моментов т € [тко,тк1) (момент тк1 € Ак будет определен ниже). Затем значения помехи Ук(■) будут

инвертированы (поменяют знак на противоположный) на малом завершающем интервале [т'к 1,тк1) С [тко,тк1 )■ Момент тк 1 € [тко,тк1] также определяется ниже. На всех последующих интервалах т € [тк (г-1),ткг), * € 1..пд значение помехи у к (■) сначала будут устанавливаться

1 —1

ющем подпнтервале т € [т'к(г-1),ткг) С [тк(г-1),ткг)-

Перейдем к определению разбиений А к и моментов т'кПоложим

* 1 Ткг — ¥, £к — , * € 0..2к ,к € М

Для определения моментов т'к 1, тк 1 зададим круг радиуса ек с центром в точке (тк 1,г*к + тк 1 — \[2ек), то есть круг, касающийся спизу прямой у(т) — г*к + т, которая в свою очередь

х (■) О

силу плотности в О множества и + данный круг непременно сод ер жит точку (т+1,х+1) € и +. Положим тк 1 — т+1, а момент т'к 1 выберем из интервала [Тк 1 — у/2е к, Тк 1 ] так, чтобы инвертированием значений Ук (■) на интервале [т'к 1,тк 1] было удовлетворено равенство х к (тк 1) = х+. Существование такого момента проверяется посредством теоремы Ролля. На всех последую-

А

Ук(■) полагаются равными 1 вначале и —1 на малом завершающем интервале.

В результате этих построений реализация управления в пошаговых движениях па всех интервалах разбиения кроме, может быть, первого будет равняться 1. Помеха также будет принимать значение 1 всюду за исключением малых «завершающих» интервалов и, быть может, первого интервала. При этом знаки управления и помехи па первом интервале согласованы так, что правая часть системы равняется 1. Таким образом, правая часть системы (15) вдоль движения хк(■) равняется 1 всюду за исключением множества «завершающих» интервалов, мера которых в сумме не превосходит величины

Е ткг — ткг ^ Е ^ек = ^Ш*2к= кТ^.

ге1..2к ге1..2к

У (■) 1

величины

11

+

2к клД'

Из этой оценки сразу следуют сходимость (18). Остальные заявленные свойства последовательностей (г*к)кем, (Ак)кем, (ук(■))кем следуют непосредственно из построения.

Для показателей качества более сложного вида отсутствие решения в классе иро5 может быть установлено без апелляции к свойству универсальности.

Пример 2. Рассмотрим пример (см. [13]) скалярной управляемой системы вида

( х(т) = и(т )Д(т) + у(т )/2(т), х(0) = 0,

\и(т) € V, У(т) € а, т € Т —[0, 4п], V — Я — [—1,1],

, (т) —( ° т € [0, 2п}, ,, ) —\ зш(т), т € [0, 2п],

1 |вт(т), т € [2п, Аж], 2 10, т € [2п, Аж]

с показателем качества вида

7(х( )) — | тах х(т) — тах х(т)^ (х() € С(Т, М),

т е[о,2п] т е[2п,4п}

очевидно, непрерывным в C(T, R).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Неравенство inf иeupos suP^(-)e^(о,и) Y(x(')) ^ 1 следует из рассмотрения двух помех

Vl(T) = 00, т € [0, 4п], V2(t) = i 0’ Т ]

[0, т € (2п, Ап].

Соотношение Гс(0) = 0 также легко проверяется при рассмотрении квазистратегии

a(v('))(r) =

д I 0, т € [0, 2п],

v(t — 2п), т € (2п, Ап].

В самом деле, так как выполнены условия теоремы 1, мы можем записать следующие соотношения 0 ^ Гс(0) = rQ(0) ^ sup^(.)e^(0,«(-)) Y(x(')) = 0- И, значит, в данном примере выполняется неравенство Г^(0) <С inf иeUpOS sup^(.)£^c(о и) Y(х('))-

Работа выполнена в рамках программы фундаментальных исследований Президиума РАН «Динамические системы и теория управления» при финансовой поддержке УрО РАН (проект Г2-П-1-1002), а также при поддержке гранта РФФИ (проект 12-01-00290).

Литература

1. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. — М.: Наука, 1974.

2. Субботин, А.И. Оптимизация гарантии в задачах управления / А.И. Субботин, АТ. Чепцов. — М.: Наука, 1981.

3. Барабанова, Н.Н. О непрерывных стратегиях уклонения в игровых задачах о встрече движений / Н.Н. Барабанова, А.И. Субботин // Прикладная математика pi механика.

- 1970. - Т. 34, вып. 5. - С. 796-803.

4. Барабанова Н.Н. О классах стратегий в дифференциальных играх уклонения от встречи / Н.Н. Барабанова, А.И. Субботин // Прикладная математика pi мехатшка. — 1971. -Т. 35, вып. 3. - С. 385-392.

5. Kryazhirriskii, A.V. The Problem of Optimization of the Ensured Result: Unimprovability of Full-Merriory Strategies / A.V. Kryazhirriskii // Constantin Caratheodory: An International Tribute, T.M. Rassias Ed., World Scientific. 1991.

6. Красовскртй, Н.Н. Программное поглощетше в дртфферетщргальпых Pirpax / / Н.Н. Красовский // Докл. АН СССР. - 1971. - Т. 201, № 2. - С. 270-272.

7. Красовскртй, Н.Н. Альтерпатртва для ртгровой задачрт сблртжетшя / Н.Н. Красовскртй, А.И. Субботртп // Пррткладпая математртка pi мехатшка. - 1970. - Т. 34, вып. 6. -

С. 1005-1022.

8. Серков, Д.А. Гараптртроваппое управлетше пррт функциональных ограттртчетгаях тта помеху / Д.А. Серков // Математртческая теорртя ртгр рт ее прртложеттртя. - 2012. - Т. 4, вып. 2.

- С. 71-95.

9. Варга, Дж. Оптртмальттое управлетше дртфферетщртальпымрт pi футткцртоттальттымрт урав-ттетшямрт / Дж. Варга. - М.: Наука, 1977. - 624 с.

10. Кряжртмскртй, А.В. О моделртроватшрт управлетгая в дртттамртческой сртстеме / А.В. Кря-жртмскртй, Ю.С. Осртпов // Изв. АН СССР. Техтт. кртберттетртка. - 1983. - № 2. - С. 51-60.

11. Osipov, Yu.S. Inverse Problem of Ordinary Differential Equations: Dynamical Solutions / Yu.S. Osipov, A.V. Kryazhimskii. - London: Gordon and Breach, 1995.

12. Субботина Н. Н. Универсальные оптимальные стратегии в позиционных дифференциальных играх / Н.Н. Субботина // Дифференциальные уравнения. - 1983. -Т. 19, №11.

- С. 1890-1896.

13. Чепцов, А.Г. Программные конструкции в дифференциальных играх с информационной памятью / А.Г. Чепцов // Оптимальное управление системами с неопределенной информацией. - Свердловск, 1980. - С. 141-144.

Дмитрий Александрович Серков, кандидат физико-математических паук, старший научный сотрудник, Институт математики и механики Уральского отделения РАН (г. Екатеринбург, Российская Федерация), доцент, кафедра «Вычислительные методы и уравнения математической физики», Уральский федеральный университет имени первого Президента России Б.Н.Ельцина (г. Екатеринбург, Российская Федерация), serkov@imm.uran.ru.

Bulletin of the South Ural State University. Series «Mathematical Modelling, Programming & Computer Software:»,

2013, vol. 6, no. 2, pp. 62-73.

MSC 93C15, 49N30, 49N35

On the Model Motions in Control Problem with Functional Constraints on Disturbances

D. A. Serkov, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, Yekaterinburg, Russian Federation, serkov@iinm.uran.ru

A control problem for a system described by an ordinary differential equation is considered. It is suggested that the values of the control and of disturbance belong compact sets at every instant. It is also assumed that the disturbance meets some additional functional constraints showing the nature of the problem under consideration. The control quality is assessed by the functional continuous in the metrics of uniform convergence over the set of phase paths of the system. As it is previously stated, a strategy with full memory solves the control problem under compact constraints to the disturbance as well as under other functional constraints which are reduced to them. At the same time, the strategies constructed for the cases above are not universal, i.e. they depend on the starting position of the system motion. The question of possibility to solve the control problem with functional constraints in a narrower (classic) set of strategies (positional strategies) remains open. This paper gives the construction of the universal optimal strategy using a model of the control system in the feedback path. The examples that lead to the expansion of the class of solution strategies up to strategies with full memory are also given.

Keywords: optimal guarantee, strategies with full memory, functional constraints.

References

1. Krasovskii N.N., Subbotin A.I. Game-Theoretical Control Problems. N.Y., Springer-Verlag, 1988. 517 p.

2. Subbotin A.I., Chentsov A.G. Optimization of Guarantee in Control Problems [Optimizatsiya garantii v zadachah upravleniyaj. Moscow, Nauka, 1981. 288 p.

3. Barabanova N.N., Subbotin A.I. On Continuous Evasion Strategies in Game Problems on the Encounter of Motions: PMM. Journal of Applied Mathematics and Mechanics, 1970, vol. 34, issue 5, pp. 796-803.

4. Barabanova N.N., Subbotin A.I. On Classes of Strategies in Differential Gaines of Evasion of Contact: PMM. Journal of Applied Mathematics and Mechanics, 1971, vol. 35, issue 3, pp. 385-395.

5. Kryazhimskii A.V. The Problem of Optimization of the Ensured Result: Unimprovability of Full-Memory Strategies. Constantin Caratheodory: An International Tribute, T.M. Rassias Ed., World Scientific. 1991.

6. Krasovskii N.N. Programm Absorption in Differential Games [Programmnoye pogloshcheniye v differentsialnykh igrakhj. Dokl. Acad. Nauk SSSR. [Reports to Academy of Science of USSRJ,

1971, vol. 201, no. 3, pp. 270-272.

7. Krasovskii N.N., Subbot.in A.I. An Alternative for the Game Problem of Convergence: PMM. Journal of Applied Mathematics and Mechanics, 1970, vol. 34, issue 6, pp. 1005-1022.

8. Serkov D.A. Guaranteed Control under the Functional Restrictions on Disturbance [Garantirovannoye upravleniye pri funktsionalnykh ogranicheniyakh na pomekhuj. Matematicheskaya teoriya igr i yeye prilozheniya [Mathematical Game Theory and Its Applications], 2012, vol. 4, issue 2, pp. 71-95.

9. AVarga ,J. Optimal Control of Differential and Functional Equations. N.Y., Academic Press,

1972. 544 p.

10. Kryazhimskii A.V., Osipov Yu. S. On the Control Modeling in Dynamic System [O modelirovanii upravleniya v dinamicheskoy sistemej. Izv. Acad. Nauk SSSR. Tehn. Iiibernet. [Proceedings of the Academy of Sciences of the USSR. Tech. Cybernetics], 1983, vol. 2, pp. 51-60.

11. Osipov Yu.S., Kryazhimskii A.V. Inverse Problem of Ordinary Differential Equations: Dynamical Solutions. London, Gordon and Breach. 1995.

12. Subbotina N. N. L'niversal Optimal Strategies in Positional Differential Games [Universalnyye optimalnyye st.rat.egii v pozitsionnykh differentsialnykh igrakhj. Differentsial'nye uravneniya [Differential Equation], 1983, vol. 19, no. 11, pp. 1890-1896.

13. Chentsov A.G. Programming Constructs in Differential Games with Information Memory [Programmnyye konst.ruktsii v differentsialnykh igrakh s informatsionnoy pamyatyuj. Optimal Control of Systems with Uncertain Information [Optimalnoye upravleniye sistemami s neopredelennoy informatsiyeyj, Sverdlovsk, 1980, pp. 141-144.

Поступила в редакцию 5 сентября 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.