Научная статья на тему 'Об алгоритме построения множеств достижимости управляемых систем с изопериметрическими ограничениями'

Об алгоритме построения множеств достижимости управляемых систем с изопериметрическими ограничениями Текст научной статьи по специальности «Математика»

CC BY
156
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОЖЕСТВО ДОСТИЖИМОСТИ / REACHABILITY SET / УПРАВЛЯЕМАЯ СИСТЕМА / CONTROL SYSTEM / ИНТЕГРАЛЬНЫЕ ОГРАНИЧЕНИЯ / INTEGRAL CONSTRAINTS / ИЗОПЕРИМЕТРИЧЕСКИЕ ОГРАНИЧЕНИЯ / ISOPERIMETRIC CONSTRAINTS / ПРИНЦИП МАКСИМУМА / MAXIMUM PRINCIPLE

Аннотация научной статьи по математике, автор научной работы — Зыков Игорь Владимирович

Предлагается способ построения множеств достижимости для управляемых систем с интегральными ограничениями на управление и траекторию системы, который базируется на использовании принципа максимума Понтрягина для характеризации граничных точек множества достижимости.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE ALGORITHM FOR CONSTRUCTING REACHABLE SETS OF CONTROL SYSTEMS WITH ISOPERIMETRIC CONSTRAINTS

We propose a method for constructing attainability sets for controllable systems with integral constraints on the control and trajectory of the system, which is based on the use of the Pontryagin maximum principle for characterizing the boundary points of the attainable set.

Текст научной работы на тему «Об алгоритме построения множеств достижимости управляемых систем с изопериметрическими ограничениями»

ISSN 1810-0198. Вестник Тамбовского университета. Серия Естественные и технические науки

Том 23, № 122

2018

DOI: 10.20310/1810-0198-2018-23-122-309-316 УДК 519.71

ОБ АЛГОРИТМЕ ПОСТРОЕНИЯ МНОЖЕСТВ ДОСТИЖИМОСТИ

УПРАВЛЯЕМЫХ СИСТЕМ С ИЗОПЕРИМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ

< И. В. Зыков

ФГБУН «Институт математики и механики им. Н.Н. Красовского» Уральского отделения Российской академии наук 620990, Российская Федерация, г. Екатеринбург, ул. Софьи Ковалевской, 16

E-mail: zykoviustu@mail.ru

Аннотация. Предлагается способ построения множеств достижимости для управляемых систем с интегральными ограничениями на управление и траекторию системы, который базируется на использовании принципа максимума Понт-рягина для характеризации граничных точек множества достижимости. Ключевые слова: множество достижимости; управляемая система; интегральные ограничения; изопериметрические ограничения; принцип максимума

Введение

Свойства множеств достижимости нелинейных систем с интегральными ограничениями и алгоритмы их построения изучались во многих работах (см. [1-3]). В статье [4] было показано, что при интегральных квадратичных ограничениях на управление любое допустимое управление, переводящее систему на границу множества достижимости, является локальным решением некоторой задачи оптимального управления с интегральным функционалом, В работах [5, 6] результаты обобщены на случай систем с совместными ограничениями на управление и траекторию, а в [7] на случай нескольких интегральных (изопериметричсских) ограничений. В данной работе результаты конкретизируются для случая линейной системы с квадратичными изопериметрическими ограничениями. Приведено описание способа построения множеств достижимости при двух квадратичных интегральных ограничениях на управление и траекторию.

В дальнейшем приняты следующие обозначения. Для вещественной матрицы А через мы обозначаем транспонированную матрицу. Для ж, у / (х, у) —скалярное произведение векторов, х = (х, ж)1/2 — евклидова норма. Для вещественной прямоугольной kQn матрицы А через А обозначаем норму матрицы, подчиненную евклидовым нормам векторов. Для S —символом dS обозначается граница S. Через L1} L2 и С будем обозначать, соответственно, пространства суммируемых, суммируемых с квадратом и непрерывных вектор-функций на [¿o,ii]- Нормы в этих пространствах будем обозначать символами х L , х L , х с.

1. Нелинейные системы с несколькими интегральными ограничениями

Рассмотрим управляемую нелинейную систему, линейную по управлению

¿(i) = /i(t,x(t)) + /2(t,*(t))n(i), to>t> tu x(t0) / (1)

где x / К" — вектор состояния, и / — управляющий параметр, fi : R"+1 е М", /2 : M"+1 е Milxl" — непрерывные отображения, Х° — заданное подмножество Жп.

Решением (траекторией) системы (1), отвечающим управлению и(/ Lo , называется абсолютно непрерывная функция х : [£o,ii] С М", для которой равенство (1) выполняется для почти всех t / [i0, fi]- Далее будем предполагать, что функции fi и /2 непрерывны, непрерывно дифференцируемы по х, а также удовлетворяют, соответственно, условиям подлинейного роста и ограниченности: /i(£,х) > ¿i(i)(l + х ), f2(t, ж) nxr > l2{t), где ВД / Li, / 1-2 Для любых ж0 / К", / L2 существует единственное решение x(t), удовлетворяющее условию x(to) = х°, которое будем обозначать как z(£,zD,

ti

Пусть заданы функционалы = f + uT(t)Ri(t, x(i))«(i)] dt,

to

г = 1 Здесь x(t) — решение системы (1), отвечающее управлению u(t) и на-

чальному вектору х°, функции Qi(t, х) и симметричные матрицы Ri(t, х) предполагаются непрерывными на [io,ii] О®"- Пару функций (х( >t, и( Я) назовем управляемым процессом, если (ж(Я, и(>}) удовлетворяют уравнению (1). Пусть задай вектор fi = (¿¿1,.. ., ¡-ik) / Rr с положительными координатами.

Определение 1. Множеством достижимости G(t\) системы (1) будем называть совокупность концов траекторий a;(£i) в Ж" , отвечающих управляемым процессам удовлетворяющим условиям

Mx(>l,uW>Vii « = x(to) /Х°. (2)

Обозначим через = ..., векторный функци-

онал, компонентами которого являются функции Ji{x{^, >t). Рассмотрим следующую многокритериальную задачу оптимального управления для системы (1)

J{x(^u{^)e тт. x(t0)/X°, x(t1)=x\ / L2, (3)

где х1 — заданный вектор из К". Управляемый процесс и(^) назовем допусти-

мым в задаче (3), если / Х°, a^(ti) = х1.

Определение 2. Допустимый процесс (.£( >t) называется слабо эффективным (оптимальным по Слсйтеру) в задаче 3, если не существует допустимого процесса и(>)[) такого, что и(^) < г = 1,..., к. Допустимый процесс (х( Я, й( >}) называется слабо локально эффективным (локально оптимальным по Слейтеру), если существует е > 0 такое, что для любого допустимого процесса (х()), и( >}), удовлетворяющего неравенствам х( ^ х( Я с < £, и( >} >t Lj < существует г, для которого Ji(x( ы( >t) с Ji(x( й( у^).

Управляемый процесс (х(и(>$.), удовлетворяющий ограничениям (2), будем называть граничным, если arffi) / dG(ti).

Теорема 1. [7] Пусть управляемый процесс (£()), й( >}) является граничным, и пусть линеаризация системы (1) вдоль (ж(и(^) вполне управляема. Тогда (¿(Я, й(>}) является локально слабо эффективным решением в задаче (3), где х1 = z(£i) и = щ хотя бы для одного г, 1 >г> к.

Рассмотрим функцию Понтрягина следующего вида H(t,p:u,x,u) = pT(fi(t,x) + f2(t,x)u) vi(Qi(^x) + uTRi(t,x)uj. Для допустимого процесса и(^) спра-

ведливы условия оптимальности в форме принципа максимума: существует вектор v = {у\,..., i'k) 0 с неотрицательными координатами и решение p(t) дифференциального уравнения p(t) = Щ- (£,p(i), /у, x(t): ü(t)) такие, что .ff(£,p(i), x(t), ü(t)) =

maxueR. H(t,p(t), г/, x(i), и) и, следовательно, ü(t)= § i/iRi(t,x f2{t,x(t))p(t).

На концах промежутка [t0) ¿i] выполняются условия трансверсальности.

2. Линейная система с двумя интегральными ограничениями

Конкретизируем условия оптимальности для случая линейной системы с двумя ограничениями. Пусть дана управляемая система

х = A(t)x + B(t)u, x(io) = ж0, (4)

ti

и функционалы имеют вид = f [a;T(i)<5i(i)a^(i) + dt, где

to

Qi(t), Ri(t) —непрерывные симметричные матрицы; Qi(t) неотрицательно определена, Ri(t) положительно определена для всех i /[i0,ii]. Рассмотрим вначале случай одного интегрального ограничения. В этом случае задающий ограничения функционал обозначаем как J(x(), и(^) = J(u(%) и ограничения на заданы неравенством > fi. Будем далее предполагать, что: система (4) вполне управляема и существует й( Я / L2 такое, что < fi. Из данных предположений следует, что множество достижимости G(ti) имеет непустую внутренность. Так как функционал 7(й(>^) —выпуклый, то G(ti) — выпуклое множество. Применяя теорему об отделимости выпуклых множеств и теорему Куна-Таккера получим: чтобы £(ii) / dG(ti). необходимо и достаточно существования вектора I 0 такого, что управление й( решает задачу оптимального управления

Ч

[ [хТ(t)Q(t)x(t) + u(t)TR{t)u(t)] dt € min (5)

to

и J(u{^) = рь. Из принципа максимума для задачи (5) следует, что

ü(t) = 1-R-1(t)B-mt), = lB(t)R-4t)B-(t)\ (х\

2 W \2Q(t) AT(t) ) W

где x(t0) = p(t0) = р°. Для линейной управляемой системы с выпуклым критерием (5) принцип максимума дает необходимые и достаточные условия оптимальности. Из этого факта несложно получить следующее утверждение.

Теорема 2. Для того, чтобы пара (£()£, удовлетворяющая (6), являлась

граничным процессом, необходимо и достаточно, чтобы выполнялось равенство J(ü =

Представим решение системы (6) с начальным условием x(t0) = х°, p(ío) = Р° В виде x(t) = Yn(t)x° + Y12(t)p°, p(t) = Y21(t)x°+Y22(t)p°, u(t) = \Rr\t)BT(t)(Y21(t)x° + Y22(J-)p^), где Yij(t) n On блоки фундаментальной матрицы системы (6). Подставляя x(t) и u(t) в формулу для J{u( >}), будем иметь J {и (^) = х° Т 5'i ж 0 + х° Т Sop0 + р° Т Ззр°, где матрицы 5\, S3 неотрицательно определены. Из управляемости системы (4) следует положительная определенность матрицы <S'3. Равенство J (и = р задает границу эллипсоида Ер —> М", Ер = }р° : ж°Т<5'1ж0 + х°Т S2p° + р°ТS3p° > /í||, центр которого р определяется формулой р = ^S^-1 S2x°. После несложных преобразований получим Ер = }р° : (р° р)тБз(р0 р) > ¡i + /í(.t°)||, где h(x°) определяется равенством /¿(ж0) = \х°ТS2S3~lS2x° х°ТSix0. Из теоремы 2 следует, что при афинном преобразовании р° € х = Yn(¿i)x° + )р° граница эллипсоида Ер переходит в

границу множества достижимости G(íj). Образом эллипсоида Ер при афинном преобразовании М™- Е К" является эллипсоид, это означает, что данный эллипсоид совпадает с G(ti). Так как G{t\) имеет непустую внутренность, отсюда следует невырожденность матрицы преобразования ^12(^1)- Положим х = Уц(íi)a:0 + тогда р° р = (ti)(x Подставляя данное выражение в формулу для Ер получим

G(Í!) = }х /Шп:(х x^Yu-'ihySsYu-'it^x х)>р + h(x°).

Перейдем теперь к задаче с двумя интегральными ограничениями, сохранив и в этом случае обозначение G(íi) для множества достижимости. Не ограничивая общности можно считать, что р\ = р2 = р. Обозначим через Gí(í1)) г = 1,2 множество достижимости для системы с одним интегральным ограничением J¿ (и()):) > р. Очевид-по, что GfrJ-^frH Gzfa).

Как и в случае одного ограничения внутренность G(íi) непустая. Точка .i:(íi) принадлежит границе G(ti) тогда и только тогда, когда найдется ненулевой вектор I / Ж" такой, что (/,x(t\)) = гшпц.^^ц.))^ ¿=1,2(^,^(^1))) гДе минимум берется по всем траекториям, отвечающим допустимым управлениям. Рассмотрим функционал Лагранжа Л) = (/, £(ti)) + Aj( p), (A=(Ai,A2) / M2 —множитель Лагранжа).

По теореме Куна-Такксра найдется вектор А С 0 такой, что выполняется неравенство А) > L(u(A), Uu(>} / l2 и условие дополняющей нсжесткости Aj(Jj(ü(^) р) = 0. Не ограничивая общности можно считать, нормируя в случае необходимости множители Лагранжа, что Ах +А2 = 1. Вышеприведенные условия являются и достаточными для того, чтобы точка x(ti) принадлежала dG(ti).

Рассмотрим случай, когда один из множителей Лагранжа, например А2, равен нулю. Тогда Ai = 1, Ji(u( >}) = pi, и мы приходим к тому, что начальный вектор р° для решения сопряженной системы принципа максимума должен лежать в эллипсоиде El = }р° : x°TSlx°+ x°TS¡p°+p°TS¡p° > fi\\. Здесь матрицы Sj, i = 1,2,3 отличаются от матриц Si, г = 1,2,3 только тем, что в определяющих их формулах вместо Q(t), R(t) подставляются Qi(t)7 R\(t), а через l'y(f) обозначены блоки фундаментальной матрицы системы (6) при Q(t) = Qi(t), R(t) = R\ (t). Граничные точки

эллипсоида Щ при сдвиге по траекториям системы переходят в граничные точки эллипсоида Gi(ii). Однако необходимо учитывать и второе ограничение, вытекающее из условий дополняющей нежесткости: > \L- Следовательно, р° принадлежит

эллипсоиду Ер2 = }р° : х° 'si2 х° + ж0 ¿>22Р° + Р° > /¿||. Таким образом, для

нахождения начальных состояний р°, отвечающих точкам границы G(ii), в данном случае надо пересечь границу эллипсоида Е^ с эллипсоидом Е^2. Аналогично, при Аг = 0 надо искать пересечение границы эллипсоида Е2 с эллипсоидом Е^, эти эллипсоиды определяются также, как Е* и Е2, только индексы 1 и 2 меняются местами. Подчеркнем, что односимвольный верхний индекс (например 1) в обозначениях матриц S и эллипсоидов означает, что в соответствующих уравнениях и формулах для S надо использовать матрицы Qi(t), Ri(t). Рассмотрим случай, когда Aj > 0, i = 1,2. Обозначим Q\(t) ^x(i) = XiRi(t), где матрица Q\(t) неотрицательно определена, R\(t) положительно определена для любого t / [f0,ii]. Выписывая принцип максимума для задачи (5), получим, что существует решение p(t) сопряженной системы такое, что и(£) = ^R^1(t)BT(t)p(t). Для пары (x(t),p(t)) ( x(t) —отвечающая û траектория) получим линейную систему дифференциальных уравнений

/¿\ = ( A{t) l-B{t)R.x-\t)BT{i)\ W \2Qx(t) A^t) ) W '

x{t0) = x°, p(t0)=p°.

Условия дополняющей нежесткости можно заменить системой уравнений

+ xoTSl2Xp° = ft i = 1,2, (8)

относительно р°. Здесь S\Xl S'!2X, S'3X) i = 1,2 — nQ)n матрицы, которые определяются формулами для 5\, S2, S3, где в качестве (t, i0), т,к = 1,2 надо взять блоки фундаментальной матрицы системы (7), а в качестве Q(t),R(t) —соответственно Qi(t), Rt(f)-Матрицы S'IX неотрицательно определены, a S'3X положительно определены. Решения системы уравнений (8) при сдвигах по траекториям дифференциального уравнения (7) переходят в граничные точки множества достижимости G'(ii).

Резюмируем сказанное выше, приведя краткое описание процедуры построения множества достижимости. Граница G(ij) представима в виде объединения множеств dG{tr) = £>1 П Дг П А,- Здесь Dt = ЩдЩ { i, j = 1,2, г j, Т{ - линейный опе-

ратор сдвига по траекториям соответствующей системы вида (6). Имеют место включения Di / <9Gj(ti), i = 1,2. Множество D3 определяется как i)3 = Uo<a<i Т\(Р\). где Р\ — множество решений системы (8), Т\ — оператор сдвига по траекториям системы (7). Множества Di, i = 1,2,3 могут оказаться пустыми, но их объединение непусто. При 71 = 2 каждое из множеств Р\ состоит не более чем из 4-х точек. При численной реализации процедуры интервал (0,1) заменяется равномерной сеткой.

СПИСОК ЛИТЕРАТУРЫ

1. Polyak В. Т. Convexity of the reachable set of nonlinear systems under 12 bounded controls // Dynamics of Continuous, Discrete and Impulsive Systems Series A: Mathematical Analysis. 2004. № 11. P. 255-267.

2. Guseinov K.G., Ozer O, Akyar E, Ushakov V.N. The approximation of reachable sets of control systems with integral constraint on controls // Nonlinear Differential Equations and Applications. 2007. Vol. 14. № 1-2. P. 57-73.

3. Guseinov K.G., Nazlipinar A.S. Attainable sets of the control system with limited resources // Труды Института математики и механики Уральского отделения РАН. 2010. № 5. C. 261-268.

4. Gusev M.I., Zykov I.V. On Extremal Properties of Boundary Points of Reachable Sets for a System with Integrally Constrained Control // IFAC-PapersOnLine. 2017. Vol. 50. № 1. P. 4082-4087.

5. Gusev M.I. On Reachability Analysis of Nonlinear Systems with Joint Integral Constraints // Lirkov I., Margenov S. (eds.). Large-Scale Scientific Computing. LSSC 2017. Lecture Notes in Computer Science. Cham: Springer, 2018. Vol. 10665. P. 219-227.

6. Zykov I.V. On the reachability problem for a nonlinear control system with integral constraints // CEUR-WS Proceedings: Modern Problems in Mathematics and its Applications. 2017. Vol. 1894. P. 88-97.

7. Гусев М.И., Зыков И.В. О геометрии множеств достижимости управляемых систем с изо-периметрическими ограничениями // Труды Института математики и механики Уральского отделения РАН. 2018. Т. 24. № 1. С. 63-75. DOI: 10.21538/0134-4889-2018-24-1-63-75.

Поступила в редакцию 23 марта 2018 г.

Прошла рецензирование 26 апреля 2018 г.

Принята в печать 5 июня 2018 г.

Зыков Игорь Владимирович, Институт математики и механики им. Н.Н. Красовского Уральского отделения Российской академии наук, г. Екатеринбург, Российская Федерация, аспирант, e-mail: zykoviustu@mail.ru

Для цитирования: Зыков И.В. Об алгоритме построения множеств достижимости управляемых систем с изопери-метрическими ограничениями // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2018. Т. 23. № 122. С. 309-316. БОТ: 10.20310/1810-0198-2018-23-122-309-316

DOI: 10.20310/1810-0198-2018-23-122-309-316

ON THE ALGORITHM FOR CONSTRUCTING REACHABLE SETS OF CONTROL SYSTEMS WITH ISOPERIMETRIC CONSTRAINTS

I.V. Zykov

N.N. Krasovskii Institute of Mathematics and Mechanics of the Ural Branch of the Russian Academy of Sciences 16 Sophia Kovalevskaya St., Yekaterinburg 620990, Russian Federation E-mail: zykoviustu@mail.ru

Abstract. We propose a method for constructing attainability sets for controllable systems with integral constraints on the control and trajectory of the system, which is based on the use of the Pontryagin maximum principle for characterizing the boundary points of the attainable set.

Keywords: reachability set; control system; integral constraints; isoperimetric constraints; maximum principle

REFERENCES

1. Polyak B.T. Sonvexity of the reachable set of nonlinear systems under l2 bounded controls.

Dynamics of Continuous, Discrete and Impulsive Systems Series A: Mathematical Analysis, 2004, no. 11, pp. 255-267.

2. Guseinov K.G., Ozer O., Akyar E., Ushakov V.N. The approximation of reachable sets of control systems with integral constraint on controls. Nonlinear Differential Equations and Applications, 2007, vol. 14, no. 1-2, pp. 57-73.

3. Guseinov K.G., Nazlipinar A.S. Attainable sets of the control system with limited resources. Trudy Instituta matematiki i mekhaniki Ural'skogo otdeleniya RAN - Proceedings of the Steklov Institute of Mathematics, 2010, no. 5, pp. 261-268.

4. Gusev M.I., Zykov I.V. On Extremal Properties of Boundary Points of Reachable Sets for a System with Integrally Constrained Control. IFAC-PapersOnLine, 2017, vol. 50, no. 1, pp. 4082-4087.

5. Gusev M.I. On Reachability Analysis of Nonlinear Systems with Joint Integral Constraints. In: Lirkov I., Margenov S. (eds.). Large-Scale Scientific Computing. LSSC 2017. Lecture Notes in Computer Science. Cham, Springer, 2018, vol. 10665, pp. 219-227.

6. Zykov I.V On the reachability problem for a nonlinear control system with integral constraints. CEUR-WS Proceedings: Modern Problems in Mathematics and its Applications, 2017, vol. 1894, pp. 88-97.

7. Gusev M.I., Zykov I.V. O geometrii mnozhestv dostizhimosti upravlyaemykh sistem s izo-perimetricheskimi ogranicheniyami [On the geometry of reachable sets for control systems with isoperimetric constraints]. Trudy Instituta matematiki i mekhaniki Ural'skogo otdeleniya RAN -Proceedings of the Steklov Institute of Mathematics, 2018, vol. 24, no. 1, pp. 63-75. (In Russian). DOI: 10.21538/0134-4889-2018-24-1-63-75.

Received 23 March 2018 Reviewed 26 April 2018 Accepted for press 5 June 2018

Zykov Igor Vladimirovich, N.N. Krasovskii Institute of Mathematics and Mechanics of the Ural Branch of the Russian Academy of Sciences, Yekaterinburg, the Russian Federation, Post-Graduate, e-mail: zykoviustu@mail.ru

For citation: Zykov I.V. Ob algoritme postroeniya mnozhestv dostizhimosti upravlyaemyh sistem s izoperimetricheskimi ogranicheniyami [On the algorithm for constructing reachable sets of control systems with isoperimetric constraints]. Vestnik Tambovskogo universiteta. Seriya Estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences, 2018, vol. 23, no. 122, pp. 309-316. DOI: 10.20310/1810-0198-2018-23-122-309-316 (In Russian, Abstr. in Engl.).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.