Научная статья на тему 'Приложения функций типа Ляпунова к задачам оптимизации в импульсных управляемых системах'

Приложения функций типа Ляпунова к задачам оптимизации в импульсных управляемых системах Текст научной статьи по специальности «Математика»

CC BY
111
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИМПУЛЬСНАЯ УПРАВЛЯЕМАЯ СИСТЕМА / MEASURE-DRIVEN IMPULSIVE CONTROL SYSTEM / ТРАЕКТОРИИ ОГРАНИЧЕННОЙ ВАРИАЦИИ / TRAJECTORIES OF BOUNDED VARIATION / УСЛОВИЯ ОПТИМАЛЬНОСТИ / OPTIMAL CONTROL CONDITIONS / ПРОМЕЖУТОЧНЫЕ ФАЗООГРАНИЧЕНИЯ / INTERMEDIATE STATE CONSTRAINTS / МОНОТОННЫЕ ФУНКЦИИ ТИПА ЛЯПУНОВА / MONOTONE OF LYAPUNOV TYPE FUNCTIONS

Аннотация научной статьи по математике, автор научной работы — Самсонюк Ольга Николаевна

В статье обсуждается применение функций типа Ляпунова к условиям оптимальности импульсных процессов. Рассматривается задача оптимального импульсного управления с траекториями ограниченной вариации и импульсными управлениями типа регулярной векторной меры. Эта задача характеризуется двумя основными особенностями. Во-первых, управляемая система линейна по импульсному управлению и может не удовлетворять так называемому условию корректности типа Фробениуса. Это приводит к появлению дополнительной компоненты управления, позволяющей связать соответствующую разрывную траекторию с аппроксимирующей последовательностью абсолютно непрерывных траекторий. Во-вторых, в задаче имеются промежуточные фазовые ограничения на односторонние значения траекторий в заданные моменты времени. Для задачи оптимального импульсного управления с промежуточными фазоограничениями получены достаточные условия оптимальности, относящиеся к канонической теории оптимальности Гамильтона Якоби. Они основаны на применении множеств сильно монотонных функций типа Ляпунова решений соответствующих проксимальных неравенств типа Гамильтона Якоби. Наличие в задаче промежуточных фазоограничений потребовало применения составных функций типа Ляпунова, кусочно определенных по переменной времени t. Непрерывные компоненты составных функций обладают свойством сильной монотонности относительно импульсной управляемой системы на соответствующих промежутках времени t. При этом для получения симметричных результатов и расширения области применения условий оптимальности в составные функции включены необязательные компоненты, обладающие свойством сильной монотонности относительно предельной системы, описывающей эволюцию скачков разрывных траекторий. Рассмотрены примеры, иллюстрирующие представленные условия оптимальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Applications of Lyapunov Type Functions for Optimization Problems in Impulsive Control Systems

This paper deals with an application of Lyapunov type functions for optimality conditions of impulsive processes. A impulsive optimal control problem with trajectories of bounded variation and impulsive controls (regular vector measures) is considered. The problem under consideration is characterized by two main features. First, the dynamical control system is linear with respect to the impulsive control and may have not the so-called well-posedness property of Frobenius type. Second, there are intermediate state constraints on the one-sided limits of the trajectory at fixed instants of time. Sufficient optimality conditions corresponding to the Hamilton Jacobi canonical optimality theory are presented. These optimality conditions involve some sets of Lyapunov type functions. These functions are strongly monotone solutions of the corresponding proximal Hamilton Jacobi inequalities. Moreover, we introduce compound (defined piecewise in the variable t) Lyapunov type functions, which are more applicable for dynamical systems with discontinuous trajectories and intermediate state constraints. Examples illustrating the optimality conditions are discussed.

Текст научной работы на тему «Приложения функций типа Ляпунова к задачам оптимизации в импульсных управляемых системах»

Серия «Математика» 2015. Т. 14. С. 64—81

Онлайн-доступ к журналу: http://isu.ru/izvestia

ИЗВЕСТИЯ

Иркутского государственного университета

УДК 517.977.5

Приложения функций типа Ляпунова к задачам оптимизации в импульсных управляемых системах *

О. Н. Самсонюк

Институт динамики систем и теории управления им. В. М. Матросова СО РАН

Аннотация. В статье обсуждается применение функций типа Ляпунова к условиям оптимальности импульсных процессов. Рассматривается задача оптимального импульсного управления с траекториями ограниченной вариации и импульсными управлениями типа регулярной векторной меры. Эта задача характеризуется двумя основными особенностями. Во-первых, управляемая система линейна по импульсному управлению и может не удовлетворять так называемому условию корректности типа Фробениуса. Это приводит к появлению дополнительной компоненты управления, позволяющей связать соответствующую разрывную траекторию с аппроксимирующей последовательностью абсолютно непрерывных траекторий. Во-вторых, в задаче имеются промежуточные фазовые ограничения на односторонние значения траекторий в заданные моменты времени. Для задачи оптимального импульсного управления с промежуточными фазоограничениями получены достаточные условия оптимальности, относящиеся к канонической теории оптимальности Гамильтона-Якоби. Они основаны на применении множеств сильно монотонных функций типа Ляпунова — решений соответствующих проксимальных неравенств типа Гамильтона-Якоби. Наличие в задаче промежуточных фазоограничений потребовало применения составных функций типа Ляпунова, кусочно определенных по переменной времени Ь. Непрерывные компоненты составных функций обладают свойством сильной монотонности относительно импульсной управляемой системы на соответствующих промежутках времени Ь. При этом для получения симметричных результатов и расширения области применения условий оптимальности в составные функции включены необязательные компоненты, обладающие свойством сильной монотонности относительно предельной системы, описывающей эволюцию скачков разрывных траекторий. Рассмотрены примеры, иллюстрирующие представленные условия оптимальности.

Ключевые слова: импульсная управляемая система, траектории ограниченной вариации, условия оптимальности, промежуточные фазоограничения, монотонные функции типа Ляпунова.

* Работа выполнена при финансовой поддержке РФФИ, грант № 14-01-00699

1. Введение

Монотонные функции типа Ляпунова имеют широкий спектр приложений в теории управления. Они играют важную роль в исследовании качественных свойств управляемых систем, таких как устойчивость, управляемость, инвариантность, оптимальность и др. Для задач управления импульсными системами наиболее полные результаты в этом направлении связаны с методом динамического программирования [16; 19; 21; 22], в котором функция цены является сильно монотонной функцией типа Ляпунова. Обобщение, связанное с применением множеств функций типа Ляпунова, этот метод получил в условиях оптимальности импульсных процессов, относящихся к канонической теории оптимальности Гамильтона-Якоби [4; 5; 20]. Отметим также работы, связанные с приложением функций типа Ляпунова к задачам устойчивости импульсных процессов [18; 26].

В данной работе представлены достаточные условия оптимальности для задачи оптимального импульсного управления с траекториями ограниченной вариации и импульсными управлениями типа регулярной векторной меры. В задаче имеются промежуточные фазовые ограничения на односторонние значения траектории в заданные моменты времени. Такие задачи возникают в моделях робототехники, экологии, экономики и др. [1; 2; 6; 10].

Представленные достаточные условия относятся к канонической теории оптимальности Гамильтона - Якоби и основаны на применении сильно монотонных функций типа Ляпунова — решений соответствующих проксимальных неравенств типа Гамильтона-Якоби. Достаточность условий выражается в существовании разрешающего набора таких функций. Однако из-за наличия промежуточных фазоограниче-ний нельзя рассчитывать на существование непрерывных разрешающих функций. Поэтому рассматриваются составные функции, кусочно определенные по Ь. Непрерывные компоненты составных функций типа Ляпунова обладают свойством сильной монотонности относительно импульсной управляемой системы на соответствующих промежутках времени Ь. Для получения симметричных результатов и расширения области применения условий оптимальности в составные функции включены необязательные компоненты, обладающие свойством сильной монотонности относительно предельной системы, описывающей эволюцию скачков разрывных траекторий.

2. Постановка задачи

Рассмотрим импульсную управляемую систему (V) йх(Ь) = /(Ь,х(Ь),и(Ь)) йЬ + С(Ь,х(Ь)) п(^), х(а-) = х0, (2.1)

и(г) е и п.в. на Т, п(ц) е №(Т,К). (2.2)

Здесь Т = [а, Ь] — заданный отрезок времени, и — компактное подмножество пространства Мг, К — выпуклый замкнутый конус в Мт, х(-) е БУ (Т, Мга), где БУ(Т, Мга) — банахово пространство вектор-функций ограниченной вариации на Т. Через и и п(ц) обозначены обычное и импульсное управления соответственно. Обычное управление описывается измеримой существенно ограниченной функцией и(-) со значениями в и. Множество импульсных управлений №(Т, К) состоит из элементов п(ц) := (ц,^(ц)), где ц — К-значная ограниченная борелевская мера на Т, а 7(ц) — набор {ё8,ш8(-)}8£з, компоненты которого удовлетворяют условиям:

(а) Б — не более чем счетное подмножество отрезка Т, Б 5 Ба(ц) := {в е Т | ц({в})=0};

(б) V в е 5 й8 > 0, ( : [0, й8] ^ со Кг,

Г

Ъ >ЫШ1, ш8(т)йт = ц({в});

(в) ^^ (8 < ж.

Здесь Кг = {у е К I ||у|| = 1}, ||у|| = 1уз I, со А — выпуклая

оболочка множества А.

Обозначим через цс и Цс | непрерывную составляющую в разложении Лебега меры ц и ее полную вариацию. Решение системы (V) понимается в смысле следующего определения.

Определение 1. Пусть и(-) и п(ц) = (ц,^(ц)) удовлетворяют (2.2), хо е Мга Многозначное отображение ку : Т ^ Мга+1 называется решением системы (2.1), соответствующим управлениям и(-), п(ц) и начальному условию х0, если выполнены условия: а) V г е Т/Б

ку (г) = { (х(г),у (г))},

где функции х() и У(•) заданы равенствами:

х(а) = х0, х(г) = х0 + /(г,х(г),и(г))(г + о(г,х(г))цс((г)

■)а 3 а

+ Е (х(в) - х(в-)), г е (а, Ь],

у (а) = 0, У (г) = ы^г]^ + £ й8, г е (а,Ь].

Здесь для каждого в е Б х(в) = г8(й8), а г8(•) — решение дифференциального уравнения

(Х8 (т)

= С(в,г8(т))(^8(т), г8(0)= х(в-), т е [0,(8]; (2.3)

б) V s е 5

Kv(s) = {(zs(r),V(s-)+ т) I т е [0,ds]}. (2.4)

По определению полагаем, что

KV (t-) = {(x(t-),V (t-))} V t е (a, b], KV (a-) = {(xo, 0)}, kv (t+) = {(x(t+), V (t+))} V t е [a, b), kv (b+) = {(x(b), V (b)) }.

Прокомментируем кратко приведенное определение. Рассмотрим обычную управляемую систему

x(t) = fit, x(t),u(t)) + G(t, x(t)) v(t), x(a) = x0,

V(t) = II v(t) ||, V (a) = 0, (2'5)

u(t) е U, v(t) е K п.в. на T (2.6)

с измеримыми, существенно ограниченными управлениями u(-), v(-) и абсолютно непрерывными траекториями x(-), V(■). Множество скоростей системы (2.5), (2.6) не ограничено и, следовательно, последовательности траекторий могут поточечно сходиться к разрывным функциям. Импульсная система (D) является в определенном смысле расширением

(2.5), (2.6). А именно, для каждого kv найдется последовательность траекторий системы (2.5), (2.6), {kvu (■)}, Kvk (■) ■= {xk (■),Vu (■)), такая, что имеет место сходимость

d( graph Kvk, graph kv) — 0 при k — (2.7)

T T

Здесь d(A, B) — расстояние Хаудорфа между компактными множествами A,B с Rra+1, а graph kv — график отображения kv на отрезке T, T

т. е.

graph kv ■= {(t,x,V) ■ t е T, (x, V) е kv(t)}.

T

С другой стороны, если последовательность траекторий системы (2.5),

(2.6) {Kvk(■)} обладает свойством (2.7) при некотором многозначном отображении kv, то найдутся управления u(^) и п(ц), удовлетворяющие (2.2), для которых kv — соответствующее решение (D). В указанном смысле, kv является обобщенным решением (2.5), (2.6). При этом произвольный селектор kv — функция ограниченной вариации. Концепция решения системы (D) и способ нахождения аппроксимирующей последовательности {Kvk(■)} по заданным управлениям u(^) и п(ц) рассмотрены в [12; 13].

Заметим, что компонента управления y(ц) возникает из-за нелинейности управляемой системы и отсутствия предположений на коммутативность векторных полей, порождаемых столбцами матрицы G. В

случае, когда матрица О удовлетворяет условию корректности типа Фробениуса [2], компонента 7(ц) полностью определяется мерой ц и может быть исключена из управления. В этом случае при описании скачка траектории полагаем: Б = Б<\(ц), = ||с||, ш3(г) = с/||с||, где с = ц( {в}).

Отметим, что множество всех траекторий (V) совпадает с замыканием множества абсолютно непрерывных траекторий в слабой* топологии в пространстве функций ограниченной вариации, если вместо многозначных отображений рассматривать их непрерывные справа на (а, Ь] селекторы ограниченной вариации (функции х(-), V(■) из определения 1). Принятое в данной работе понятие решения импульсной системы является модификацией определений обобщенного решения, введенных в [7; 8; 9; 10; 23; 24], и примыкает к определению V-решения из работ [6; 14; 15], данному при К = Мт.

Под импульсным процессом системы (V) будем понимать набор а = (ку ,п(^),п(ц)), состоящий из управлений и соответствующеего решения. Множество всех импульсных процессов а будем обозначать £, а соответствующее множество траекторий — Т.

Пусть в = (во,. ..,вк) — вектор фиксированных моментов времени таких, что а < в0 < ■ ■■ < вк < Ь, к < ж. Пусть а = (ку, п(^),п(ц)) € £. Для жу определим односторонние значения и ку(в^+), ] = 0, к,

и образуем векторы

д(в-) := 9(0+) :=

да := (д(в-),д(в+)). Рассмотрим задачу Р(в) минимизации функционала

3 (а) = ¡о(да)

на множестве импульсных процессов

а € Я,

удовлетворяющих условиям допустимости

да € С.

Здесь С С ) — замкнутое множество, соответствующей размерности ((да), 1о : ) ^ И — непрерывная функция.

Относительно функций / (Ь,х,п), О(Ь,х) будем считать выполненными следующие предположения.

П1. Функции / (Ь,х,п), О(Ь,х) непрерывны по совокупности переменных, для любого компактного множества Q С Ига существуют такие константы Ьщ, ¿2^ > 0, что выполняются неравенства

/(г,хх,п) - /(t,X2,u)| < Ь^х - х21

^(г, хг) - С(г, х2) < Ь2д^1 - X2|

V (г, хг,и), (г,х2 ,и) е Т х Q х и; кроме того, существуют константы сг, С2 > 0:

/(г,х,у) < Сг(1 + |x|), г< С2(1 + х) V (г,х,и) е Т х Мга х и.

П2. Множество /(г,х, и) выпукло V (г,х) е Т х Мга

3. Составные функции типа Ляпунова

Достаточные условия оптимальности для задачи Р(в) будут сформулированы при помощи составных сильно монотонных функций типа Ляпунова [11].

Пусть р — некоторое разбиение отрезка Т = [а, Ъ] точками а = ¿о < ¿1 < ... < ¿м = Ь, N < оо. Пусть Аг = г = Будем

рассматривать функции типа Ляпунова, обладающие свойством сильного убывания относительно сужений импульсной системы (V) на А^,

г = ХЙ.

Для каждого г обозначим через Фд4 множество непрерывных на А^ сильно убывающих функций типа Ляпунова [11; 12; 20]. Тогда каждая V е Фд4 — решение системы проксимальных неравенств типа Гамильтона - Якоби

Рг + По(г,х,рх) < 0,

V Р = (рг,рх,РУ) е дрф(г,х,У), V (г,х,У) е (г-1,г) х Мга х [0, +ж); РУ + Нг(г,х,Рх) < 0

VР = (рг,рх,РУ) е дрф(г,х,У), V (г,х,У) е [г-1,г] х мга х (0, +ж).

Здесь Но, Нг — аналоги гамильтониана по обычному и импульсному управлениям для системы (V), т. е.

По(г,х,ф) = тах(ф,/ (г,х,и)), Н1(г,х,ф) = тах {ф,С(г,х)ш),

дрф(г, х, У) — проксимальный субдифференциал функции V в точке (г,х,У). Напомним [17; 27], что вектор р е называют прокси-

мальным субградиентом функции у ^ 1£(у) в точке уо, если найдутся окрестность О точки уо и константа с > 0, такие, что выполняется неравенство

V(y) > V(Уо) + (р, (у - Уо)) - с\у - уо|2 Vу е П.

Это неравенство означает, что локально (в окрестности уо) V имеет квадратичную функцию, опорную снизу в точке уо, с градиентом р в

данной точке. Проксимальный субдифференциал дрф(у0) состоит из всех таких субградиентов. Он может оказаться пустым множеством; в этом случае соответствующие проксимальные неравенства считаются выполненными автоматически в точке уо.

Далее, для каждого 3 = О, Н, рассмотрим предельную систему

г'(т) = ,г(т))ш(т), гУ(т) = 1, ш(т) € со Кг п. в. т > 0. (3.1)

Совокупность решений системы (3.1) обозначим через и рассмотрим сильно убывающие относительно (3.1) функции £(г,гу), т. е. такие, что для всех (г(^),гу() € Ь%1 суперпозиция т ^ £(г(т),гу(т)) не возрастает при т > 0. Заметим, что необходимое и достаточное условие сильного убывания непрерывной функции £ (г, гу) состоит в принадлежности ее множеству решений проксимального неравенства Гамильтона - Якоби [17]:

'Рху + ,г,-рх) < 0

(3.2)

V (р2,Ргу) € др£(г,гу), V (г,гу) € Ига х (0, +ж).

Множество всех непрерывных решений (3.2) обозначим через ^^.

Определение 2. Будем говорить, что задана сильно убывающая составная функция типа Ляпунова, если задана совокупность

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где ^г € Фд4, % = 1,М, £ € ^^, 3 = 0,Ы. Кроме того, будем говорить, что задано множество составных функций типа Ляпунова, если заданы множества Фд. С Фд4, г = 1, N, и С ] = 0, N. Обозначим это множество через Ф*, т.е. Ф* = {{Фд.Д^ТлГ' Ь=о1у}-

4. Достаточные условия оптимальности

Сформулируем достаточные условия оптимальности для задачи Р(в), включающие множестса составных функций типа Ляпунова.

Пусть а = {ку,и(),п(ц)) € Т удовлетворяет условиям допустимости в задаче Р(в). Пусть р = ...^м | а = ^ < tl < ... < tN = Ь} — некоторое разбиение отрезка [а, Ь], включающее все промежуточные точки вз = 0, к, т. е.

р ^{во,...,вк}.

По определению положим

I = {3 €{0,...,N}| ^ € {во ,...,вг}} .

Введем обозначения, связанные с импульсной системой (V) и соответствующие разбиению р :

Лд, = 4 ((хг-1,Уг-1), (хг,У)

3 ку еГ : ку (гг-1 +) = (хг-1,Уг-1), ку (гг-) = (хг, Уг)

— множество соединимых точек на А^, г = 1, А?";

^ = ^ {(¿о,гуо), (г1,гу 1))

3 (,г(-),гу(•)) е ЬТЬ : г(0) = го, г(й) = гу (й) - гу (0) = й, й := гу 1 - гуо

— множество точек, соединимых скачком в момент г^, ] = 0,М. Для импульсного процесса а = (ку,и( ),п(ц)) введем обозначения

ЯаО = д3а1 = з = о, Ж,

1<г>Р = ( {ЧаО> <¿1 ^(щ) •

Определение 3. Назовем множеством соединимых точек, соответствующим разбиению р, множество

г;3 )

(д^) е2Ег.,

Очевидно, что для любого импульсного процесса а е Е и заданного разбиения р выполняется включение дар е 'Я.р и, наоборот, для любого д е 'Я.р найдется а е Е, для которого дар = д.

Пусть Ф* = {{Фд.Ь=Т^г, - произвольное множество

составных сильно убывающих функций типа Ляпунова. Определим для него следующие множества:

А[фд]= П Цд1,до) | до,д1 е мга х ш+^(гг,до) - v(гг-l,ql) < 0},

г = 1,М;

ЬА[% ] = р| {(до, дО | до, д1 е Мга х М+, £Ы - £ (до) < 0}

3 =0,М;

{д\-\дЪ)еА[Ф*Аг], г = 1,К,

Тогда множества А[ФД ] и ] задают внешние оценки множеств

Лд, и Ztj соответственно, а множество А[Фр] задает внешнюю оценку

множества соединимых точек, соответствующего разбиению р, т. е. выполняется включение

Rp С А[Фр] (4.2)

(см. [11]).

Сопоставим задаче с промежуточными фазоограничениями P (в) конечномерную экстремальную задачу (AP(в)):

l(qj) ^ min; qj е C, q еА[Фр].

Здесь

Qi '■= ({eo.9ibeJ). Q :=

Пусть <7 = (му,й, 7Г(/!)), где 7f(/J) = (д,7(/1)), — допустимый процесс задачи Р(д), а q^ — соответствующий вектор промежуточных значений траектории. Определим вектор q-^>p как в (4.1).

Будем говорить, что множество Ф* разрешающее для а, если qw доставляет глобальный минимум в задаче (AP(в)).

Сформулируем достаточные условия глобальной оптимальности.

Теорема 1. Пусть существует разрешающее множество Фр для процесса а. Тогда а — глобальное решение задачи Р{в).

Доказательство очевидно и следует из оценки (4.2). Прокомментируем теорему 1.

1. Заметим, что задача (AP(в)) в развернутой форме имеет вид:

l(qj) ^ min; qj е C, qj := ({x(tj-), V(tj-),x(tj +), V(tj+)}ieJ), Vi{ti,x(ti-),V (ti-)) - <pi(ti-i,x(ti-i+),V (ti-!+)) < 0 (4.3)

У<РгеФ*А., ¿ = Щ

< о _ (4.4)

V&eH?., j=ÖJf.

При этом, если матрица G(t,x) удовлетворяет так называемому условию корректности типа Фробениуса, то (4.4) можно заменить на условие скачка траектории (см. [2]).

2. Присутствие в составных функциях типа Ляпунова элементов , j = О, N, позволяет получать более гибкие и симметричные результаты, в частности, по внешним оценкам множеств соединимых точек и условиям оптимальности импульсных процессов. В то же время эти элементы не являются обязательными. При этом формулировка достаточных условий оптимальности изменится очевидным образом. Например, пусть N = 2, р = {to,ti,t2}. Рассмотрим Фр, составленную из трех

компонент (£^1 ^2), где £ е ^, Vl е Ф^оМ) и V2 е Ф[г1,г2\. Тогда неравенства (4.3), (4.4) примут вид:

V2^t2,x(г2+),У(г2+)) - V2{гъх(г1-),У(г-)) < 0, V!. {гих(г1-), У (г-)) - V!, {го, х(го+), У (го+)) < 0, £(х(го+),У(го+)) - £{х(го-),У(го-)) < 0.

Заметим, что для импульсного процесса а соответствующие точки множества 5 можно включить в р, но это не обязательно.

3. Очевидно, что если вектор а ,р является внутренней точкой множества А[Фр], то теорема 1 будет выполняться только в исключительном случае, когда динамическая система (V) не влияет на решение задачи Р(в) и может быть опущена. Поэтому, как правило, разрешающее множество Фр содержит функции типа Ляпунова, постоянные вдоль исследуемой траектории хотя бы на одном Аг.

4. Теорема 1 дает достаточные условия глобальной оптимальности. Для получения локальных условий можно рассматривать окрестность исследуемого процесса и требовать выполнения соответствующих ин-финитезимальных условий на некотором множестве Q из пространства переменных г, х и У.

Проиллюстируем применение теоремы 1 на примерах.

Пример 1. Требуется минимизировать функционал

J = У (1+) (4.5)

на множестве импульсных процессов а, возникающих при импульсном расширении динамической системы

х(г)= х(г)У1 (г)+ У2 (г) + 1 - 2г, у(г) = ^ (г) + ^Ш, (4.6)

(У1(г),У2(г)) е м+ х м при п.в. г е [0,1], (4.7)

и удовлетворяющих условиям допустимости

х(0-) = 0, У(0-) = 0, х(1/2+) > 4, х(1+) = 0. (4.8)

В системе (4.6), (4.7) матрица при управлении С = [х 1] не удовлетворяет условию Фробениуса. В точках импульса в е Б = Sd(У) скачок непрерывной справа траектории [х(в)] := г(й3) - х(в-) описывается предельной системой

г'(т) = г(т)Ш1 (т) + Ш2(т), г(0) = х(в-), г'у (т) = 1, гу (0) = У (в-)

при некотором выборе предельного управления

(Ш1(т),Ш2(т)) е {(^1 ,У2) е м+ х м | ы + Ы < 1} ,

т е [0,(й], йа := [У(в)] .

Исследование задачи (4.5)—(4.8) принципом максимума [3] дает бесконечное множество экстремальных процессов, соответствующих одному значению функционала J = 4, 5 + 1п4. При этом экстремальные импульсные управления := описываются условиями:

= 1п45(г - 1/2),

Р-2:

МЕ) > 0 V Е е В[о,1/2\,

МЕ) < 0 V Е еЗ(1/2,1\, | Ц2Ц [0,1/2]) =0.75, | р.2 К (1/2,10 =3.75.

Здесь 5(г - в) — функция Дирака, сосредоточенная в точке в, Вд — множество всех борелевских подмножеств отрезка А, — полная вариация меры ц2. Соответствующие компоненты набора 7(^,) = {йа,ша(-)} удовлетворяют условиям

Б = {1/2}иБл(а2), (4.9)

Ша(') = (Ш1(-),Ш2 () : в = 1/2 ^ Ша(-) = (0,Ш2(-)):

Ш2(т) = ^ ^^ йа = |М^Ш

в = 1/2 е Бл(Р2) ^ Ша(-) = (Ш1(-), 0):

Ш1(т) = 1, йа = 1п 4; в = 1/2 е БЛ(р2) ^ Ша(-) = (Ш1(-),Ш2(-)) :

Ш1(т) = 0, Ш2(т) = 1, т е [0,т1], Ш1(т) = 1, Ш2 (т) = 0, т е [т1,йа ],

т1 = 1 - х(1/2-),

йа = 1 - х(1/2-) + 1п 4.

На всех экстремалях х(1/2-) < 1, х(1/2+) = 4.

Оптимальность данных процессов устанавливается путем предъявления разрешающего множества функций типа Ляпунова.

Система неравенств Гамильтона-Якоби для (4.6), (4.7) имеет вид

VI + (1 - 2г^х < 0, (4.10)

тах (ш1 х + ш2)Vx + VУ < 0. (4.11)

ш>1 +1 1 =1

(ш1 ,ш2)ек+ х*

Легко заметить, что неравенство (4.11) переходит в одно из следующих двух неравенств

Принимая во внимание промежуточное ограничение в точке t = 1/2, будем искать составную функцию типа Ляпунова, заданную на промежутках [0,1/2) и (1/2,1]. В точке t = 1/2 используем внешнюю аппроксимацию множества точек, соединимых скачком в этот момент. Непосредственной проверкой можно убедиться, что функция

является решением системы дифференциальных неравенств (4.10), (4.11) на промежутке Дг = [0,1/2). А функция

— на промежутке Д2 = (1/2,1].

Такой выбор функций типа Ляпунова был связан со следующими соображениями. Во-первых, функции рг, р2 выбирались так, чтобы они были постоянны вдоль исследуемых процессов на соответствующих промежутках времени. Во-вторых, принималось во внимание, что на исследуемых процессах скачок по первой компоненте управления «начинается» после того, как х достигнет единичного значения. Поэтому функция рг выбрана так, чтобы при X < 1 в уравнение обращалось неравенство (4.13), а при X > 1 — неравенство (4.12). Выбор функции ^>2 был сделан так, чтобы на промежутке (1/2,1] неравенство (4.13) выполнялось как уравнение. Заметим, что это требовалось только для исследуемых процессов, но в данном примере выполнено для всех допустимых процессов.

Для построения внешней аппроксимации множества точек, соединимых скачком в момент t = 1/2, рассмотрим функцию

Функция £ является решением неравенства (4.11) при t = 1/2, так как

хрх + ру < 0 при хрх > ^^ + Ру < 0 в остальных случаях.

(4.12)

(4.13)

£(г, гу)

г — гу,

1 + 1п |г| — гу, |г| > 1, г — гу, |г| < 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+1 | =1 (ш1,ш2)е1+х1

тах (шгх + Ш2)£г + £гу = 0.

Конечномерная экстремальная задача (AP(в)) для данного примера имеет вид

V(1+) ^ min; x(1/2+) > 4, (4.14)

-V(1+) - 1/4 + x(1/2+) + V(1/2+) < 0, (4.15)

если \x(1/2-)\ < 1, то

-1/4 + x(1/2-) - V(1/2-) < 0,

(4.16)

1 + lnx(1/2+) - V(1/2+) - x(1/2-) + V(1/2-) < 0, если \x(1/2-)\ > 1, то

3/4 + ln \x(1/2-)\ - V(1/2-) < 0

(4.17)

lnx(1/2+) - V(1/2+) - ln \x(1/2-)\ + V(1/2-) < 0.

После преобразования (4.14)-(4.17) получим следующую простую задачу

V(1) min;

(4.18)

V(1+) > 1/2+ x(1/2+) + lnx(1/2+), x(1/2+) > 4.

Очевидно, глобальный минимум в (4.18) достигается при x(1/2+) = 4, V(1+) = 4, 5 + ln4. Теперь остается заметить, что это концы траекторий, соответствующих исследуемым импульсным управлениям. Следовательно, соответствующие процессы являются глобально оптимальными в задаче (4.5)-(4.8).

Отметим, что оптимальное импульсное управление в этой задаче может иметь счетное число импульсов по второй компоненте в произвольных точках отрезка [0,1]. Однако совсем не обязательно все точки импульса рассматривать как точки стыковки при определении составной функции типа Ляпунова.

Пример 2. Рассмотрим систему, в которой выполняется условие корректности типа Фробениуса. Требуется минимизировать функционал J = V(1+) на множестве импульсных процессов, соответствующих управляемой системе

x i(t) = x2(t), (4.19)

x2(t) = -xi(t)v(t), (4.20)

V(t) = \v(t)\, (4.21)

v(t) е R, t е [0,1], (4.22)

с концевыми условиями:

xi(0-) = xi(1+) = 0, x2(0-) = 1, V (0-) = 0. (4.23)

Система (4.19)-(4.22) удовлетворяет условию корректности типа Фробениуса [2]. В этом случае компонента управления 7(ц) однозначно определяется мерой ц ив качестве траекторий вместо многозначных отображений ку можно рассматривать непрерывные справа на (0,1] функции ограниченной вариации, удовлетворяющие условию скачка в точке в е Б = Б^(ц):

х2(в+) = х2(в-) - Сх1(в), У (в+) = У (в-) + |с|,

где с = ц({в}).

Принципу максимума удовлетворяет управление:

ц = 45(г - 1/2), J = У(1) = 4, (4.24)

х (г) = I г, г < 1/2, у (1, г < 1/2, х 1(г) - г, г > 1/2, х2(г) = \ -1, г > 1/2.

Оптимальность устанавливается при помощи составных функций типа Ляпунова:

V1 = -(1 - г)х2 - х1 -1/4 {х1 + 1 - г)2{У - 4), г е [0,1/2) и (1/2,1],

V2 = -гх2 + х1 -1/4 У, г е [0,1/2), VI = -(1 - г)х2 - х1 -1/4 У,, г е (1/2,1]

и условий скачка в точке г = 1/2

х2(1/2) - х2(1/2-) = тх1(1/2){У(1/2) - У(1/2-)). Действие функций рассматривается локально на множестве Q = {(г, х1,х2, У) е [0,1] х [0,1/2] х [-1,1] х [0, 4]} .

Список литературы

1. Гурман В. И. Принцип расширения в задачах управления / В. И. Гурман. -2-е изд. перераб. и доп. - М. : Наука, 1997.

2. Дыхта В. А. Оптимальное импульсное управление с приложениями / В. А. Дыхта, О. Н. Самсонюк. - 2-е изд. - М. : Физматлит, 2003.

3. Дыхта В. А. Принцип максимума в гладких задачах оптимального импульсного управления с многоточечными фазоограничениями / В. А. Дыхта, О. Н. Самсонюк // Журн. вычисл. математики и мат. физики. - 2009. - №. 6. -С. 981-997.

4. Дыхта В.А. Неравенства Гамильтона-Якоби в задачах управления импульсными динамическими системами / В.А. Дыхта, О.Н. Самсонюк // Тр. Математ. ин-та им. В.А. Стеклова РАН. — 2010. — Т. 271. — С. 93-110.

78

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15

16

17

18

19

20

21

22

Дыхта В. А. Каноническая теория оптимальности импульсных процессов / В. А. Дыхта, О. Н. Самсонюк // Современная математика. Фундам. направления. - 2011. - Т. 42. - С. 118-124.

Завалищин С. Т. Импульсные процессы: модели и приложения / С. Т. Завалищин, А. Н. Сесекин — М. : Наука, 1991.

Миллер Б. М. Условия оптимальности в задаче управления системой, описываемой дифференциальным уравнением с мерой / Б. М. Миллер // Автоматика и телемеханика. - 1982. - № 6. - С. 60-72.

Миллер Б.М. Условия оптимальности в задачах обобщенного управления I, II / Б.М. Миллер // Автоматика и телемеханика. - 1992. - № 3. - С. 362-370; -№ 4. - С. 505-513.

Миллер Б.М. Метод разрывной замены времени в задачах оптимального управления импульсными и дискретно-непрерывными системами / Б.М. Миллер // Автоматика и телемеханика. - 1993. - № 12. - С. 3-32. Миллер Б. М. Оптимизация динамических систем с импульсными управлениями / Б. М. Миллер, Е. Я. Рубинович. - М. : Наука, 2005.

Самсонюк О.Н. Составные функции типа Ляпунова в задачах управления импульсными динамическими системами / О.Н. Самсонюк // Тр. Ин-та математики и механики УрО РАН. - 2010. - Т. 16, №5. - С. 170-178. Самсонюк О.Н. Монотонность функций типа Ляпунова для импульсных управляемых систем / О.Н. Самсонюк // Изв. Иркут. гос. ун-та. Сер. Математика. - 2014. - Т. 7. - С. 104-123.

Самсонюк О. Н. Инвариантность множеств относительно нелинейных импульсных управляемых систем / О. Н. Самсонюк // Автоматика и телемеханика. - 2015. - № 3. - С. 44-61.

Сесекин А. Н. О множествах разрывных решений нелинейных дифференциальных уравнений / А. Н. Сесекин // Изв. вузов. Математика. — 1994. — № 6.

— С. 83-89.

Сесекин А. Н. Динамические системы с нелинейной импульсной структурой / А. Н. Сесекин // Тр. Ин-та математики и механики УрО РАН. - 2000. - Т. 6.

- C. 497-510.

Стефанова А. В. Уравнения Гамильтона - Якоби - Беллмана для нелинейных импульсных управляемых систем / А. В. Стефанова // Тр. Ин-та математики и механики УрО РАН. - 1998. - Т. 5. - С. 301-318.

Nonsmooth Analysis and Control Theory / F. H. Clarke, Yu.S. Ledyaev, R. J. Stern, P. R. Wolenski. - N. Y. : Springer-Verlag, 1998.

Code W. J. Closed loop stability of measure-driven impulsive control systems / W. J. Code, G. N. Silva // J. Dyn. Cont. Syst. - 2010. - V. 16. - P. 1-21. Daryin A. N. Dynamic programming for impulse control / A. N. Daryin, A. B. Kurzhanski // Ann. Reviews in Control. - 2008. - Vol. 32. — P. 213-227. Dykhta V. Some applications of Hamilton - Jacobi inequalities for classical and impulsive optimal control problems / V. Dykhta, O. Samsonyuk // European Journal of Control. - 2011. - Vol. 17. - P. 55-69.

Fraga S. L. On the feedback control of impulsive dynamic systems / S. L. Fraga, F. L. Pereira // Proc. of 47th IEEE Conference on Decision and Control, 2008. -P. 2135-2140.

Matos A. C. Hamilton - Jacobi conditions for a measure differential control problem / A. C. Matos, F. L. Pereira // Proc. of XII Baikal International conference on Methods of optimization and its applications, Irkutsk, Russia, 2001. - P. 237-245.

23. Miller B. M. The generalized solutions of nonlinear optimization problems with impulse control / B. M. Miller // SIAM J. Control Optim. - 1996. - Vol. 34. - P. 1420-1440.

24. Motta M. Space-time trajectories of nonlinear systems driven by ordinary and impulsive controls / M. Motta, F. Rampazzo // Differential Integral Equations. -1995. - Vol. 8. - P. 269-288.

25. Motta M. Dynamic programming for nonlinear systems driven by ordinary and impulsive control / M. Motta, F. Rampazzo // SIAM J. Control Optim. - 1996. -Vol. 34. - P. 199-225.

26. Pereira F.L. Stability for impulsive control systems / F. L. Pereira, G. N. Silva // Dynamical Systems. - 2002. - Vol. 17. - P. 421-434.

27. Vinter R. B. Optimal Control / R. B. Vinter. - Birkhauser, Boston, 2000.

Самсонюк Ольга Николаевна, кандидат физико-математических наук, старший научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 453151 (e-mail: [email protected])

O. N. Samsonyuk Applications of Lyapunov Type Functions for Optimization Problems in Impulsive Control Systems

Abstract. This paper deals with an application of Lyapunov type functions for optimality conditions of impulsive processes. A impulsive optimal control problem with trajectories of bounded variation and impulsive controls (regular vector measures) is considered. The problem under consideration is characterized by two main features. First, the dynamical control system is linear with respect to the impulsive control and may have not the so-called well-posedness property of Frobenius type. Second, there are intermediate state constraints on the one-sided limits of the trajectory at fixed instants of time. Sufficient optimality conditions corresponding to the Hamilton-Jacobi canonical optimality theory are presented. These optimality conditions involve some sets of Lyapunov type functions. These functions are strongly monotone solutions of the corresponding proximal Hamilton-Jacobi inequalities. Moreover, we introduce compound (defined piecewise in the variable t) Lyapunov type functions, which are more applicable for dynamical systems with discontinuous trajectories and intermediate state constraints. Examples illustrating the optimality conditions are discussed.

Keywords: measure-driven impulsive control system, trajectories of bounded variation, optimal control conditions, intermediate state constraints, monotone of Lyapunov type functions.

References

1. Gurman V.I. The Extension Principle in Optimal Control Problems [Printsip rasshireniya v zadachakh optimal'nogo upravleniya]. Moscow, Nauka, 1997.

2. Dykhta V.A., Samsonyuk O.N. Optimal Impulsive Control with Applications [Optimal'noe impul'snoe upravlenie s prilozheniyami]. Moscow, Fizmatlit, 2000.

3. Dykhta V.A., Samsonyuk O.N. A Maximum Principle for Smooth Optimal Impulsive Control Problems with Multipoint State Constraints. Comput. Math. Math. Phys., 2009, vol. 49, pp. 942-957.

4. Dykhta V.A., Samsonyuk O.N. Hamilton-Jacobi Inequalities in Control Problems for Impulsive Dynamical Systems. Proc. of the Steklov Institute of Mathematics, 2010, vol. 271, pp. 86-102.

5. Dykhta V.A., Samsonyuk O.N. Canonical Theory of Optimality for Impulsive Processes [Kanonicheskaya teoriya optimal'nosti impul'snyh processov]. Sovrem. Mat. Fundament. Napravl., 2011, vol. 42, pp. 118124.

6. Zavalishchin S.T., Sesekin A.N. Impulse Processes: Models and Applications [Impul'snye processy: modeli i prilozhenija]. Moscow, Nauka, 1991.

7. Miller B.M. Optimality Condition in the Control Problem for a System Described by a Measure Differential Equation. Autom. Remote Control, 1982, vol. 43, no. 6, part 1, pp. 752-761.

8. Miller B.M. Conditions for the Optimality in Problems of Generalized Control. I, II, Autom. Remote Control, 1992, vol. 53, no 3, part 1, pp. 362-370; no 4, pp. 505-513.

9. Miller B.M. Method of Discontinuous Time Change in Problems of Control of Impulse and Discrete-Continuous Systems. Autom. Remote Control, 1993, vol. 54, no 12, part 1, pp. 1727-1750.

10. Miller B.M., Rubinovich E.Ya. Optimization of Dynamic Systems with Impulsive Controls [Optimizatsiya dinamicheskikh sistem s impul'snymi upravleniyami]. Moscow, Nauka, 2005.

11. Samsonyuk O.N. Compound Lyapunov Type Functions in Control Problems of Impulsive Dynamical Systems [Sostavnye funkcii tipa Lya-punova v zadachah upravleniya impul'snymi dinamicheskimi sistema-mi]. Trudy Inst. Mat. Mekh. UrO RAN, Ekaterinburg, vol. 16, pp. 170-178.

12. Samsonyuk O.N. (2014). Monotonicity of Lyapunov Type Functions for Impulsive Control Systems [Monotonost' funkcii tipa Lyapunova dlya impul'snykh upravlyaemihk sistem]. The bulletin of Irkutsk state university. Mathematics, 2014, vol. 7, pp. 104-123.

13. Samsonyuk O.N. Invariant Sets for the Nonlinear Impulsive Control Systems. Autom. Remote Control, 2015, vol. 76, no 3, pp. 405-418.

14. Sesekin A.N. On the Set of Discontinuous Solutions of Nonlinear Differential Equations. Izv. Vyssh. Uchebn. Zaved., Mat., 1994, vol. 38, no 6, pp. 83-89.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Sesekin A.N. Dynamical Systems with Nonlinear Impulsive structure [Dinamicheskie sistemy s nelinejnoj impul'snoj strukturoj]. Trudy Inst. Mat. Mekh. UrO RAN, Ekaterinburg, 2000, vol. 6, pp. 497-510.

16. Stephanova A.V. The Hamilton-Jacobi-Bellman Equation in a Nonlinear Impulse Control Problem [Uravnenie Gamiltona-Yakobi-Bellma-

na dlya nelinejnyh impulsnyh upravlyaemyh sistem]. Trudy Inst. Mat. Mekh. UrO RAN, Ekaterinburg, 1998, vol. 5, pp. 301-318.

17. Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. New York, Springer-Verlag, 1998.

18. Code W.J., Silva, G.N. Closed Loop Stability of Measure-driven Impulsive Control Systems. J. Dyn. Cont. Syst., 2010, vol. 16, pp. 1-21.

19. Daryin A.N., Kurzhanski A.B. Dynamic Programming for Impulse Control. Ann. Reviews in Control, 2008, vol. 32, pp. 213-227.

20. Dykhta V., Samsonyuk O. Some Applications of Hamilton-Jacobi Inequalities for Classical and Impulsive Optimal Control Problems. European Journal of Control, 2011, vol. 17, pp. 55-69.

21. Fraga S.L., Pereira F.L. On the Feedback Control of Impulsive Dynamic Systems. Proc. of 47th IEEE Conference on Decision and Control, 2008, pp. 2135-2140.

22. Matos A.C., Pereira F.L. Hamilton-Jacobi Conditions for a Measure Differential Control Problem. Proc. of XII Baikal International conference on Methods of optimization and its applications, Irkutsk, Russia, 2001, pp. 237-245.

23. Miller B.M. The Generalized Solutions of Nonlinear Optimization Problems with Impulse Control. SIAM J. Control Optim., 1996, vol. 34, pp. 1420-1440.

24. Motta M., Rampazzo F. Space-time Trajectories of Nonlinear Systems Driven by Ordinary and Impulsive Controls. Differential Integral Equations, 1995, vol. 8, pp. 269-288.

25. Motta M., Rampazzo F. Dynamic Programming for Nonlinear Systems Driven by Ordinary and Impulsive Control. SIAM J. Control Optim., 1996, vol. 34, pp. 199-225.

26. Pereira F.L., Silva G.N. Stability for Impulsive Control Systems. Dynamical Systems, 2002, vol. 17, pp. 421-434.

27. Vinter R.B. Optimal Control. Birkhauser, Boston, 2000.

Samsonyuk Olga Nikolaevna, Senior Researcher, Institute for System

Dynamics and Control Theory of Siberian Branch of Russian Academy of

Sciences, 134, Lermontov st., Irkutsk, 664033, tel: (3952) 453151

(e-mail: [email protected])

i Надоели баннеры? Вы всегда можете отключить рекламу.