Теоремы существования решения в задачах импульсного оптимального управления

Карамзин Дмитрий Юрьевич; Перейра Фернандо Лобо

УДК 517.977.5

ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЯ В ЗАДАЧАХ ИМПУЛЬСНОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Ключевые слова: импульсное управление; смешанные ограничения; теоремы существования решения.

Рассмотрена задача оптимального импульсного управления при наличии смешанных ограничений. В определенных предположениях выпуклости установлены теоремы существования решения.

Рассматривается следующая задача импульсного управления:

ф(р) Д шт,

йх = /(х, и, {)& + д(х, и, £)йФ,

йу = йЩ, уо = 0,г е Т = [^0,^1], (1)

р = (хо,Х1,го,и,У1) е Б, ( )

Е(х, и, £) е С, ч Ф = (у, {ит, ут}), г&щв(у) С К.

Здесь Т = [£0,^] - время (которое заранее не фиксировано); р = (х0,х1,Ь0,Ь1,у1), где х0 = х(Ь0), х1 = х{Ь]_), у1 = у(Ь]), есть так называемый концевой вектор; Б - замкнутое

подмножество М2га+3; С - замкнутое подмножество Мг; ф(р) - функционал, который

нужно минимизировать; Ф = (у, {ит, ьт}) - импульсное управление (его определение дается ниже). Относительно функций, входящих в постановку задачи (1), предполагается, что все они непрерывно дифференцируемы по совокупности аргументов.

Приведем точные определения импульсного управления и решения х(-), удовлетворяющего дифференциальной связи

йх = /(х,и,1)йЬ + д(х,и,£)йФ, £ е Т, х(£0) = х0, (2)

фигурирующей в (1).

Пусть К - заданный замкнутый выпуклый конус в Мк. Рассмотрим борелевскую векторную меру у, принимающую значения в конусе К. Через \у\ обозначим ее вариацию (напомним, что вариация векторной меры у - это сумма вариаций всех ее компонент, т. е.

\у\=1: ,‘=1И)-

Обозначим через V(у) множество скалярных неотрицательных борелевских мер V таких, что существуют борелевские векторные меры уг, принимающие значения в конусе К, для которых (уг,\уг\) Д (у^). Здесь Д означает сходимость в слабой* топологии, т. е. каждая координата меры уг и мера \уг \ сходятся слабо* в С*(Т). Например, если К содержится в одном из ортантов пространства Мк, то V (у) = {\ у \} (это одноточечное множество). Если конус К неострый (т. е. если К содержит какое-нибудь одномерное подпространство), то V(у) = {V е С*(Т): V ^ \у \}. Заметим, что всегда \у \ е V(у) ^ V(у) = 0. Кроме того, V ^ \у\ VV е V(у).

Возьмем произвольную скалярную меру V е V(у) и число т е Т. Рассмотрим измеримую вектор-функцию кт : [0,1] Д К такую, что к

I) ^2 к(в)\=v(т), п.в.«е [0,1];

3=1

II) / кт (в)йв = у(т).

0

Здесь, у(т) :=у({т}) е К - это значение у на одноточечном множестве {т}; запись п. в. в означает “для почти всех в в смысле меры Лебега”. Следующие понятия играют ключевую роль в дальнейшем изложении.

Определение 1. Семейство вектор-функций {ит ,кт}, которое зависит от вещественного параметра т е Т, назовем присоединенным к векторной мере у, если, во-первых, существует скалярная борелевская мера V е V(у), такая, что для каждого т выполняются условия 1) и 11), и, во-вторых, вектор-функции ит : [0,1] Д Мт являются измеримыми и существенно ограниченными равномерно по т.

Определение 2. Элемент Ф = (у; {ит ,кт}) назовем импульсным управлением в задаче (1), если у - это такая борелевская векторная мера, принимающая значения в конусе К, что семейство вектор-функций {ит,кт} является присоединенным к у. Вариацией импульсного управления назовем скалярную меру \Ф\ := v(\ + \ус \, где индексы ё, с означают дискретную и непрерывную компоненты мер.

Функция и(-) в (1) есть обычное ограниченное управление, но оно теперь предполагается измеримым и существенно ограниченным относительно обеих мер: Лебега I (порожденной длиной интервала на вещественной прямой М ) и меры Лебега-Стилтьеса \ Ф \. Тогда пару (и,Ф) назовем управлением в задаче (1). Термин “Лебега-Стилтьеса” выше означает, что борелевская а -алгебра пополняется за счет множеств нулевой \ Ф\ -меры. Любая борелевская мера у, заданная на а -алгебре В(Т) борелевских подмножеств отрезка Т, может быть единственным образом продолжена до соответствующей лебеговской меры, заданной на пополненной а -алгебре с помощью так называемый процедуры лебеговского продолжения меры, [1]. Это продолжение полное, и оно называется мерой Лебега-Стилтьеса (порожденной у). Заметим, что множество А измеримо относительно обеих мер I и \Ф\ тогда и только тогда, когда оно измеримо относительно меры Лебега-Стилтьеса I + \Ф\ (что следует непосредственно из того факта, что множество А может быть представлено как объединение борелевского множества и множества нулевой меры). Таким образом, функция и(Ь) измерима относительно I + \ Ф\.

Возьмем импульсное управление Ф = (у, {ит,кт}), число т е Т и вектор а е М™. Обозначим через х(') = х(',т, а) решение следующей динамической системы (если оно существует)

/ х(в)= д(х(в),ит(в),т)кт(в),ве[0,^ (3)

\х(0)= а. (6)

Функцию ограниченной вариации х(Ь), заданную на отрезке времени Т, назовем решением дифференциального уравнения (2), отвечающим управлению (и,Ф) и начальному значению х0, если х(Ь0) = х0 и для каждого £ е (£0,£1] имеет место:

х(г)= х0 + / /(х,и,я)йя + / д(х,и,я)йус + У^ \хт(1) - хт(0) , (4)

Ло J[t о,*|

где хт( ) := х(',т,х(т-)). Заметим, что сумма в (4) определена корректно, поскольку, согласно 1), 11), существует не более чем счетное множество точек т, где функция кт отлична от нуля.

Ограничения R(x, u,t) € C называются смешанными, но здесь они должны пониматься в более широком смысле, чем просто обычное включение. Это связано с присутствием импульсной части g в задаче (1). Поэтому уточним понятие смешанных ограничений в (1), которым удовлетворяет пара траектория-управление. Пусть задана тройка (x,u,§), где траектория x(t) отвечает (u,§) по правилу, указанному выше в (4). Включение R(x,u,t) € C понимается в следующем обобщенном смысле:

R(x(t), u(t), t) € C п. в. t € T,

R(xT(s),uT(s),T) € C п. в. s € [0,1] Vт € Ds( |§|).

Здесь Ds(v) = {т € T: v(т) > 0} - множество атомов меры. Будем считать, что смешанные ограничения регулярны. Пусть U(x, t) := {u € Rm : R(x, u,t) € C}. Смешанные ограничения в задаче (1) называются регулярными, если

dR*

NC(R(x,u,t)) П ker —— (x,u,t) = {0} V u € U(x,t) V x,t,

где Nc (y) - нормальный конус в смысле Мордуховича. Подобного рода предположения регулярности являются стандартными в задачах оптимального управления со смешанными ограничениями.

Тройка (x,y,u,§) называется процессом управления, если выполнено (4). Процесс управления называется допустимым, если он удовлетворяет всем ограничениям задачи (1). Допустимый процесс (x, у, u, А) называется оптимальным, если для любого допустимого в задаче процесса (x,y,u,§) справедливо неравенство ф(р) ^ ф(р).

В задаче (1), отметим, присутствуют ограничения на полную вариацию импульсного управления yi, а также возможна и минимизация полной вариации, поскольку yi является аргументом функционала качества ф.

В работе [2] на множестве импульсных управлений была предложена метрика р и обоснована корректность данного выше определения решения (4). Там же были получены необходимые условия оптимальности в форме принципа максимума Понтрягина. Займемся теоремами существования.

Как отмечал L. Young, любая теория необходимых условий оптимальности остается довольно наивной, если неясно, будет ли существовать решение вариационной задачи в указанном классе функций или нет. Выше мы определили некоторую новую концепцию расширения задач управления на случай разрывных траекторий. Тогда необходимо понять, а будет ли построенное расширение успешным в том смысле, что можно гарантировать решение расширенной задачи. Ниже мы установим существование решения в предположениях филипповского типа о выпуклости векторграммы [3].

Если A - линейный оператор, то через A* обозначим сопряженный к нему оператор. Под модулем вектора ниже будем понимать сумму модулей его координат: Ixl = ^i lx%l. Таким образом, например единичная сфера Sru в пространстве Rk имеет вид:

SRfc := {x € Rk : £* И = 1}.

Справедлива следующая теорема.

R(x, u,t) € C ^

Теорема 1. Предположим, что:

а) Множество Б компактно.

Ь) Множество

|^) а/(х, и, і), 0,1 ^ + (1 — д(х, и, і)ь, 1,0^ Q Мга+2

а € [0,1], и € и(х,і),

V € К П 5^

выпукло при всех х, Ь.

с) Существует константа с> 0 такая, что для любой допустимой траектории х(Ь) задачи (1) выполняется: \х(£)\ ^ с VЬ е Т, и \и\ ^ с Vи е и(х,Ь) Vх,Ь.

ё) В задаче (1) существует по крайней мере один допустимый процесс.

Тогда решение в задаче (1) существует.

Доказательство теоремы 1 основывается на разрывной замене времени Лебега и теореме Филиппова.

Условие Ь) можно упростить в том случае, когда функция д от и не зависит: д = д(х, Ь). Тогда достаточно предположить выпуклость множеств /(х,и(х,Ь),Ь) и д(х,Ь)(К П Бкй). В общем же случае требовать раздельную выпуклость множеств уже нельзя, что показывают простые контрпримеры.

В обоих случаях предположение Ь) теоремы выглядит довольно жестким. В самом деле, зачастую оно будет подразумевать, что пересечение конуса К со сферой выпукло. Но это сразу же влечет, что конус К вложен в один из ортантов в М^ (т. е. это только тот случай, когда V(у) = \у \ ). Тем не менее, когда предположение Ь) не выполнено, например, если К = М^, утверждение теоремы 1 может легко нарушаться. Приведем соответствующий контрпример.

Пример 1.

Рассмотрим задачу

Минимум в этой задаче не достигается из-за последовательности допустимых траекторий

которая сходится равномерно к нулю, но Уаг ^ х1 = 1 V г.

Тогда возникает естественный вопрос об усилении предположений теоремы 1 с тем,

а/ — 1^1?

х(0)=0, х(1)=0, у(0) = 0, у(1) = 1, V Є М1.

чтобы включить в рассмотрение и случай К = М^. Следующая теорема предлагает ответ на этот вопрос.

Теорема 2. Предположим, что:

a) Имеют место представления Б = С х [0, а], где С С М2™ - компакт, а е М1 - число, и ф(р) = ф1(х0,х1)+ ф2(у1), где ф1,ф2 гладкие функции, причем функция ф2 монотонно не убывает.

b) Множество

(^) а/(х, и, Ь), 0,1 ^ + (1 — д(х, и, Ь)к, 1,0^)

а е [0,1], и е и(х,Ь),

V е К О В^к

выпукло при всех х, Ь.

Пусть также выполнены предположения с), !) теоремы 1. Тогда решение в задаче (1) существует.

ЛИТЕРАТУРА

1. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1981.

2. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. On constrained impulsive control problems: controlling system jumps // Journal of Mathematical Sciences. 2010. V. 165. № 6. P. 654-687.

3. Филиппов А.Ф. О некоторых вопросах оптимального регулирования. Вестник МГУ. Математика и механика. 1959. № 2. С. 25-38.

Поступила в редакцию 10 ноября 2012 г.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты № 12-01-33023, № 12-01-00427).

Karamzin D.Yu, Pereira F.L. EXISTENCE THEOREMS IN IMPULSIVE OPTIMAL CONTROL PROBLEMS

The impulsive optimal control problem with mixed constraints is considered. Solution existence theorems are obtained under certain convexity assumptions.

Key words: impulsive control; mixed constraints; solution existence theorem.

Теоремы существования решения в задачах импульсного оптимального управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Карамзин Дмитрий Юрьевич, Перейра Фернандо Лобо

Похожие темы научных работ по математике , автор научной работы — Карамзин Дмитрий Юрьевич, Перейра Фернандо Лобо

EXISTENCE THEOREMS IN IMPULSIVE OPTIMAL CONTROL PROBLEMS

Текст научной работы на тему «Теоремы существования решения в задачах импульсного оптимального управления»