Известия Института математики и информатики Удмуртского государственного университета
2019. Том 53
УДК 517.977.1 © И. В. Зыков
О ВНЕШНИХ ОЦЕНКАХ МНОЖЕСТВ ДОСТИЖИМОСТИ УПРАВЛЯЕМЫХ СИСТЕМ С ИНТЕГРАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
В настоящей работе рассматривается задача построения внешних оценок множеств достижимости в виде множества уровня некоторой дифференцируемой функции Ляпунова-Беллмана (зависящей только от вектора состояния) для управляемой системы с интегральным ограничением на управление. В частности, при ее подходящем выборе можно получить эллипсоидальные и прямоугольные оценки. Предлагаемые конструкции базируются на интегральных оценках, максимальном решении и принципе сравнения для систем дифференциальных неравенств. За счет использования времени в аргументах функции Ляпунова-Беллмана удается получить более точные оценки. В линейном нестационарном случае последние могут совпадать с множеством достижимости. Приведен ряд иллюстрирующих примеров для нелинейных систем.
Ключевые слова: множество достижимости, управляемая система, интегральные ограничения, интегральные неравенства, принцип сравнения, внешние оценки.
Э01: 10.20537/2226-3594-2019-53-06 Введение
Статья посвящена построению внешних оценок для множеств достижимости управляемых систем. Точные (аналитические) построения последних во многих случаях не представляются возможными, а их численное построение требует значительных вычислительных затрат. В некоторых задачах достаточно получить только оценки, внешние или внутренние; для множеств достижимости эти оценки, как правило, менее трудоемки по сравнению с построением самих множеств. В случае систем с геометрическими ограничениями на управляющее воздействие известны методы, основанные на оценках решений дифференциальных неравенств Гамильтона-Якоби и Ляпунова-Кротова (см., например, [1-5]). Методы этого типа основаны на вычислении производной вдоль траектории управляемой системы от некоторой дифференцируемой функции (функции Ляпунова-Беллмана), максимизации величины производной на множестве управляющих параметров и применении принципа сравнения для дифференциальных уравнений.
В первой части данной работы предлагается способ построения внешних оценок для нелинейных управляемых систем с интегральным квадратичным ограничением на управление с помощью множества уровня функций Ляпунова-Беллмана, зависящих только от вектора состояния системы. Он состоит в подборе функции, производная которой в силу уравнений управляемой системы имеет достаточно простой вид. После интегрирования выражения для производной вычисляется интегральная оценка правой части равенства. При помощи преобразований полученное интегральное неравенство переходит в дифференциальное, которому ставится в соответствие система сравнения. В результате получаются внешние оценки множества достижимости в виде множества уровня данной функции. Использование нескольких функций позволяет получить более точную оценку в виде пересечения соответствующих оценок. Приводятся иллюстрирующие примеры, в частности, когда оценка, в силу «неудачно» подобранной функции, не дает полной информации по всем координатам. В последнем случае можно использовать дополнительные оценки, чтобы обеспечить ограниченность пересечения. Во второй части работы обсуждается возможность улучшения оценок путем добавления времени в число аргументов функции Ляпунова-Беллмана. Зависимость функции Ляпунова-Беллмана от времени позволяет получать более точные оценки. В линейно-квадратичном случае оценка может совпасть с множеством достижимости.
Получающиеся далее уравнения сравнения могут иметь не единственное решение. Это требует привлечения понятия максимального решения уравнения и теорем сравнения, использующих данное понятие. Приведем здесь соответствующее определение.
Рассмотрим задачу Коши
^ = х^о)=хо, (0.1)
где ^ (Ь, х) — непрерывная функция на (Ь, х)-множестве Д0.
Определение 0.1. Решение С(Ь) = С(Ь; ¿0, х0) дифференциального уравнения (0.1), выходящее из точки (¿0,х0) области ДО С Д0 и определенное на некотором отрезке [а,Ь], содержащем внутри точку ¿0, будем называть верхним (максимальным), если для любого другого решения, выходящего из этой точки, справедливо неравенство
р(Ь) < С(1)
для всех Ь € [а, Ь], для которых решения и С(Ь) определены одновременно.
Условия, обеспечивающие существование верхних решений (локальных и глобальных), содержатся в ряде известных теорем (см., например, [6, с. 7-8]), которые здесь приводить не будем.
Следующая теорема будет играть ключевую роль при построении функций Ляпунова-Беллмана.
Теорема 0.1 (теорема сравнения, [6, с. 10-11]). Пусть функция ^(Ь,г) непрерывна в открытой области Д0, содержащей точку (¿0,х0). Предположим, что начальная задача
имеет верхнее решение г(Ь) = С(Ь), определенное в области ¿0 ^ Ь ^ ¿0+6. Если х(Ь) — непрерывная и дифференцируемая на [£0, £0 + 6] функция такая, что (Ь, х(Ь)) € Д0 УЬ € [£0, £0 + 6] и
йх
то справедлива оценка
х(Ь) < С(Ь) Ш € [¿0, ¿0 + 6]. § 1. Внешние оценки и принцип сравнения
Вначале рассмотрим задачу в предположении, что имеется интегральное квадратичное ограничение на управление.
§ 1.1. Случай управления из
Рассмотрим автономную линейную по управлению систему вида
х(ь) = Ь(х(г)) + ¡2(х(г))п(г), о < ь < ¿1, х(0) = х0, (1.1)
где х € Мга — вектор состояния; и(Ь) € Мг — управление; /1: Мга ^ Мга, /2: Мга ^ Мгахг — непрерывные отображения.
Интегральное ограничение на управление имеет вид и( ) € и, где
и = |и( ) € И2: ^ \\и(Ь)\\г2 йЬ < , 0.
Определение 1.1. Множеством достижимости К (Ь) системы (1.1) в момент Ь ^ Ь1 будем называть совокупность всех концов траекторий х(Ь) в Мга, отвечающих управлениям из и.
Пусть известно множество Д С Кга, которое содержит точки всех допустимых траекторий, удовлетворяющих заданному начальному условию и интегральному ограничению на управление. Рассмотрим непрерывно дифференцируемую функцию у(х) на Д, такую что у(х0) = 0.
Предположение 1.1. Пусть на множестве О выполняются неравенства У^(ж)/1(ж) ^ ^ — аг(ж) и ||У^(ж)/2 (ж)||г 2 ^ в2 г(ж). Здесь а ^ 0 и в > 0 — заданные константы, через У-и(ж) обозначен градиент функции г.
Заметим, что из второго условия (неравенства) следует неотрицательность г (ж).
Теорема 1.1. Пусть предположение 1.1 выполнено. Тогда
К(¿) С {ж € Мга: г(ж) < £ € [0,^1],
«2в2
где = —-—£ в случае а = 0. В случае а > 0 можно положить
22
либо (что дает более точную оценку)
т =
^(1-ехр (-§*)) ехр (-§*), еслиК^, 1х2/32/4а, если í >
Доказательство. Дифференцируя г(ж(£)) вдоль допустимой траектории ж(£) получим г(ж(£)) = Vг(ж(t)) (Л(ж(*)) + /2(ж(£))и(£)) = Vг(ж(t))/l(ж(t)) + Vг(ж(í))/2(ж(í))u(í), откуда следует, что
г(ж(£)) = / Vг(ж(s))/1 (ж(«)) ^ + / Vг(ж(s))/2(ж(«))и(«) ./о ./о
^ /г * \ 1/2 / Г * \ 1/2
22
|г
о о о
г(ж(£)) < — а^ г(ж(в)) ^ + ^ ||ф)||г2 ^ ^ |^г(ж(в))/2(ж(в))||г2 ^
,4 / ,4 ч 1/2
г(ж(£)) ^ —а! г(ж(«)) ^ + ^в (у г(ж(«)) . (1.2)
оо Последняя оценка эквивалентна неравенству
/(*) < —а/(*) + ^в ■ /(¿)1/2,
если обозначить /(¿) = / г(ж(«))
о
о
Поставим в соответствие этому неравенству уравнение сравнения
Ш = — аш + ^в ■ -1/2 (1.3)
с начальным условием ш(0) = /(0) = 0.
Пусть а = 0 в уравнении (1.3). Интегрируя, получим два решения: ш(£) =0 и -—(¿)1/2 = ^Ш/2, £ € [0, ¿1 ]. Второе из них является, очевидно, максимальным. Из теоремы сравнения 0.1 получаем при £ € [0, ¿1 ] неравенство /(¿) ^ -(¿), где -(¿) — верхнее решение (1.3). Так как из неравенства (1.2) следует г(ж(£)) ^ ^в ■ /(¿)1/2, то в этом случае
У(х(ф < = Ц-1.
При а > 0, как и в случае а = 0, имеется также тривиальное решение ш(£) = 0. Сделаем замену у = ш1/2 в уравнении сравнения (1.3), которая приводит к линейному уравнению
У = + у(0)=Ц0)1/2 = 0.
В силу линейности, последнее уравнение имеет единственное решение, которое совпадает с верхним или максимальным решением. Поэтому максимальное решение выглядит следующим образом:
а.
а V Т
Учитывая цепочку неравенств
v(x(t)) < -af (t) + /в • f (t)1/2 < /в • f (t)1/2, по аналогии со случаем (a = 0) получаем, что
^(t)) <V(i) = ^(l-exp(~t)). Последнюю оценку можно улучшить, если в качестве ^(t) взять
т= max {-af + jfif1/2}.
Вычисляя максимум, получим, что
^(t) = V2e2/(4a),
Q Q-. Q- _ . . 2 in 2
если /л р /(4a ) ^ "'(/)• эквивалентное неравенству / ^-. В противном случае
a
^(i) = -aw(t) + ^(i)1/2 = ^ (l - exp (-|i)) exp .
Таким образом, для любого t ^ ti, мы имеем оценку сверху для множества достижимости вида
K(t) С {x € Rn: v(x) < ^(t)}, где функция ^(t) определяется одной из приведенных выше формул. □
§ 1.2. Обобщение на случай управления из Lp
Будем рассматривать систему (1.1) на тех же условиях, но интегральное ограничение на управляющее воздействие будет иметь вид u( ) € U, где
U =|О € Lp: J 1 \\u(t)\\rp dt < , p> 1, /> 0.
Определения множества достижимости и множества D С Rn остаются в силе. Также вводим непрерывно дифференцируемую функцию v(x) на D такую, что v(x0) = 0. Предположение 1.1 и теорема 1.1 трансформируются следующим образом.
Предположение 1.2. Пусть на множестве D выполняются неравенства Vv(x)fi(x) ^ ^ —av(x) и \\V v{x) ¡2{х)\\гч ^ [3qv(x), где | + | = 1. Здесь а^0и/3>0 - заданные константы, через Vv(x) обозначен градиент функции v.
Опять же нетрудно заметить, что из второго условия (неравенства) следует неотрицательность v(x).
Теорема 1.2. Пусть предположение 1.2 выполнено. Тогда
K(t) С {x € Rn: v(x) < ^(t)}, t € [0,ti],
(/вV —
где ip(t) = pi—J tp~l в случае a = 0. В случае a > 0 можно положить
№ = <*(-УЛ f а
, , , 1 — exp--1
\ a J V V P
p-i
либо (что дает более точную оценку)
а (l — exp (—9ft)) exp (—, если t <
p in p
a
a
p— 1 у a I \ p
Доказательство. Дифференцируя v(x(t)) вдоль допустимой траектории x(t) получим v(x(t)) = Vv(x(t)) (fl(x(t)) + /2(x(i))u(i)) = Vv(x(i))/i(x(i)) + Vv(x(i))/2(x(i))u(i),
откуда следует, что
v(x(t)) = / Vv(x(s))/1 (x(s)) ds + / Vv(x(s))/2(x(s))u(s) ds, ./0 ./0
0 0 0
v(x(t)) < -^v(s(s)) ds + ^jf ||u(s)||rpd^ ||Vv(x(s))/2(x(s))||rqds^
v(x(t)) ^ -a J v(x(s)) ds + V-в (^J v(x(s)) ds^ . (1.4)
00 Последняя оценка эквивалентна неравенству
/(t) < -a/(t) + ■ /(t)1/q,
если обозначить /(t) = v(x(s)) ds.
0
0
Поставим в соответствие этому неравенству уравнение сравнения
w = -aw + ^в ■ w1/q (1.5)
с начальным условием w(0) = /(0) = 0.
Если a = 0, то для максимального решения уравнения (по аналогии со случаем L2) справедлива формула
w(t)1/p = ^t, t € [0,ii]. Из теоремы сравнения 0.1 получаем при t Е [0,11 ] неравенство
Р )
/ Р-1
Так как из неравенства (1.4) v{x{t)) ^ ц/З ■ f(t) 'q = ц/З ■ f(t) р , то в этом случае
v(x(t)) < ij)(t)
При a > 0, используя, например, подстановку вида y = w1/p в уравнении сравнения (1.5), приходим к линейному уравнению
т < w(t) = (^YV.
у = + у(0) = гу(0)1/р = 0.
р р
Тогда максимальному решению (1.5) (по аналогии со случаем 1,2) соответствует
Учитывая цепочку неравенств
г(ж(£)) < —а/(¿) + ^в ■ /(¿)1/? < ^в ■ /(¿)1/?, по аналогии со случаем (а = 0) получаем, что
< ^(i) (l-exp
Последнюю оценку можно улучшить, если в качестве взять
= тах {—а/ + 1/9}.
Вычисляя максимум, получим, что
«О-•
если
'^У (у- 1ХР
а / \ Р что эквивалено следующим неравенствам
1\р / / а \\р / а \ 1 р 1п р
1 - - ^ 1 - ехр--£ , ехр (--г < * ^ -—-. (1.6)
Р/\ V Р // V Р / Р а
В противном случае (не выполняется (1.6))
= —сш(£) + = ^ ^ — ехр ехР •
Таким образом, для любого í ^ ¿1, мы имеем оценку сверху для множества достижимости вида
К(г) С {х € Мп: г(х) < ^(¿)}, где функция определяется одной из приведенных выше формул. □
§2. Примеры
В данном параграфе приведен ряд иллюстрирующих примеров.
§2.1. Пример 1: осциллятор Дуффинга
Рассмотрим осциллятор Дуффинга, описываемый уравнениями
3
Х1 = Ж2, ¿2 = —Х1 — 10х1 + и, х(0) = 0, г € [0, 3/2],
с интегральным ограничением на управление
3/2
0
За функцию г(х) можно принять
(2.1)
Г 3/2
/ и2(г) ^ < 2.
0
/ \ 5 4 1 2 1 2
«(жьжг) = -а?! + -х1 + -ж2,
которая удовлетворяет предположению 1.1 с параметрами а = 0, в2 = 2 и г(х0) = г(0) = 0. В этом случае
К(3/2) С {х € М2: г(х1 ,¿2) < ^(3/2) = 3}.
Результат представлен на рис. 1, где синим цветом обозначена граница множества достижимости (полученная при помощи алгоритма из [7]), а красным — его оценка.
Рис. 1. Граница множества достижимости системы (2.1) и ее оценка
§2.2. Пример 2: маятник
Рассмотрим математический маятник с ограничением на энергию управления:
1
Х\ = Х'2, Х'2 = —7 вШЖ! + и,
2 (2.2)
х(0) = о, г е [0,п], с интегральным ограничением на управление
/■П
гп
/ и2(г) (г < 2. Jo
Функция у(х) может иметь вид
1>(Х1,Х2) = ^(1 -СОвЖ!) +
эта функция удовлетворяет предположению 1.1 с параметрами а = 0, в2 = 2 и у(х°) = -и(0) = 0. В этом случае
К(п) С {х е М2: ь(х!,х2) < ф(п) = 2п}.
Результат численного моделирования представлен на рис. 2. В данном случае видно, что оценка (красный цвет) в виде бесконечной волнистой полосы не дает информации по координате х1 для границы множества достижимости (синий цвет). Минус подобранной функции состоит в неограниченности по первой координате, когда вторая зафиксирована.
§2.3. Пример 3: модель Лотки-Вольтерры
Математическая модель «хищник-жертва» представляет собой систему двух нелинейных дифференциальных уравнений:
х 1 = ах1 — сх1 х2, х 2 = —Ьх1 + (х1 х2, а > 0, Ь> 0, с > 0, (> 0,
причем х1 — число жертв, х2 — число хищников.
Многие математические модели успешно применяются в биологии, демографии, физике и экономике. В частности, модель «хищник-жертва» также может быть применена не только в биологии
Рис. 2. Граница множества достижимости системы (2.2) и ее оценка
и экологии, но и в экономике для анализа изменения объемов закупок в зависимости от цены. При этом цена выступает в роли хищника, а объемы закупок — в роли жертвы («цена съедает спрос»). Объясним это подробнее.
Обозначим объемы закупок электроэнергии в секторе свободной торговли через хь цену электроэнергии через х2. Спрос тем быстрее уменьшается, чем больше проданной электроэнергии и чем больше ее цена. Иными словами, цена тем быстрее снижает закупки, чем более насыщен рынок электроэнергии по этой цене (х1х2). Поэтому, если объемы закупок электроэнергии ненулевые, то объемы закупок электроэнергии меняются по закону х 1 = ах1 — сх1х2 (а > 0, с > 0). С другой стороны, прибыль, получаемая поставщиками от продажи электроэнергии, стимулирует увеличение цены. Прибыль пропорциональна количеству проданного товара по его цене (х1х2). Поэтому имеем х2 = —Ьх2 + (х1х2 (Ь > 0, (> 0). Модель «цена-объемы покупок» построена.
Полученная модель достаточно точно описывает динамику цен и объемов закупок электроэнергии, которая позволяет предсказывать изменение конъюнктуры на рынке электроэнергии.
Обозначим за управление и неопределенные факторы, влияющие на объем покупок и наложим на и квадратичные интегральные ограничения
х 1 = ах1 — сх1х2 + и, х 2 = —Ьх1 + (х1х2, а > 0, Ь > 0, с > 0, ( > 0,
Г11
/ и2(з) (в < 2. Jo
Примем а = Ь = с = ( =1, ¿1 = 1/4. Считаем, что в нулевой момент времени объем закупок равен 1, а цена равна 3.
Тогда получаем следующее условие:
х 1 = х1 — х1х2 + и, х2 = —х1 + х1х2,
х(0) = (1 3)Т ,
Г1/4
/ и2(в) (в < 2. Jo
В роли функции -и(х) возьмем
■и(х1, х2) = (х1 + х2 — 4)2,
4 3.9 3.8 3.7 3.6 3.5 3.4 3.3 3.2 3.1
1 0.5
0.5
1.5
Рис. 3. Граница множества достижимости системы (2.3) и ее оценка
которая удовлетворяет предположению 1.1с параметрами а = 0, в2 =4 и г(х0) = г(1, 3) = 0. В этом случае
К(1/4) С {х € М2: г(х1,х2) < ^(1/4) = 1}. Результаты численного моделирования представлены на рис. 3.
Таким образом, множество достижимости лежит в полосе |х1+¿2 — 4| ^ 1. Это можно проверить и другим способом. Действительно, из системы (2.3) можно получить
¿1(г) + ¿2(г) = и(г),
х1(г) + ¿2(г) = 4 + / и(«)
0
|х1(г)+ ¿2(г) — 4| ^ ^
12
= ^ € [0,1/4].
В данном случае последняя оценка оказалась более точной.
Границы множеств достижимости, изображенные на рис. 2 и рис. 3 синим цветом, построены с помощью алгоритмов из [8].
§ 3. Нестационарный случай
Если рассматривать функции Ляпунова-Беллмана, зависящие от г, х, то можно получить более точные оценки даже в случае стационарных систем. Проиллюстрируем это утверждение на примере линейных систем с интегральными ограничениями.
Будем рассматривать линейную систему с интегральным ограничением на управление
¿(г) = А(г)х(г) + в(г)и(г), г € [¿о, ¿1 ], ¿(¿о) = ¿0
(3.1)
где ж € Мп, и(г) € Мг; А(г), В (г) — интегрируемые на [г0 ,г1] матричные функции. Ограничение на управление определено интегральным квадратичным неравенством и( ) € V, где
V = |и(-) € Ь2: У ||и(г)||г2 ^г < , 0.
0
1
2
Пусть X(г, 5) = ф(г)ф 1 (5), где ф(г) — матрица Коши, удовлетворяющая уравнению
Ф(г) = А(г)Ф(г), Ф(г0) = I.
Решение (3.1) имеет вид
¿(г) = ¿(г)+ / х(г,в)в(в)и(в)
где ¿(г) = X(г, г0)^0. Симметрическую матрицу
ж (г) = [ х (г,в)в (в)в т(в)хт (г, 5) ^
Лп
будем называть грамианом управляемости системы (3.1). Данная матрица удовлетворяет следующему матричному дифференциальному уравнению
ж (г) = А(г)ж (г) + ж (г)Ат(г) + в (г) в т(г), ж (г0) = 0. (3.2)
Как известно (см., например, [9]), система (3.1) вполне управляема на [г0,г], г ^ г1, тогда и только тогда, когда матрица Ж (г) положительно определена. В этом случае К (г) представляет собой невырожденный эллипсоид
к (г) = {^ € мп : (ж — ¿)тж-1(г)(^ — ¿) < ^2}, г>г0.
Непрерывно дифференцируемую по своим аргументам функцию г: Мга+1 ^ М будем искать в виде положительно определенной квадратичной формы
г(г, x — ¿) = — ¿)т^(г)(® — ¿) ^ 0, дт = д. Рассмотрим следующее дифференциальное уравнение Риккати для матрицы д(г)
д(г) + д(г)А(г) + Ат (г)д(г) = —д(г)в (г)вт(г)д(г). (3.3)
Теорема 3.1. Пусть существует положительно определенное на [г0,г1] решение уравнения (3.3). Тогда для множества достижимости системы (3.1) справедлива оценка
к(г1) с ^ € мп: г(г1,¿) = (x — ¿(г^)^^)^ — ¿(г^) < ^2}, г1 > г0.
Доказательство. Продифференцируем г вдоль траекторий управляемой системы (3.1)
г4 = ^ — ¿)т — ¿) + ^ — ¿^(г)^ — ¿) + ^ — ¿)т ^г)^ — ¿) = = — ¿)тАт(г) + итв т(г)) — ¿) + ^ — ¿^(г)^ — ¿)+ — ¿)т д(г) (Дг)^ — ¿) + в (г)и) = = ^ — ¿)т (<д(г) + д(г)А(г) + Ат(г)д(г)) (x — ¿) + 2(x — ¿)тд(г)в(г)и.
Учитывая (3.3), равенство (3.4) можно преобразовать к виду
г4 = —(x — ¿)тд(г)в ^в^г)^)^ — ¿) + 2(x — ¿)тд(г)в(г)и = = —/(г)/т(г) + 2/(г)и,
где /(г) = ^ — ¿)тд(г)в(г).
Отсюда следует неравенство для функции г
(3.4)
г(г^ — ¿) = — / ||/(в)|г2 + 2/ /(в)и(в) ^ < < — Г ||/(в)|г2+ 2^ Г ||/(8)|г2^ / = —72(г) + 2^7(г)
¿0 \Ло /
= — (7(г) — ^)2 < 70
где 7(í) = (10II/(s)||r2 ds
Таким образом, мы имеем оценку сверху для множества достижимости вида
K(ti) С {x € Rn: v(ti,x) = (x - X(íi))TQ(íi)(x - X(ti)) < ^2}, ti > to- (3.5)
□
Замечание 1. Дифференцируя равенство
W-i(t)W (í) = /,
с учетом (3.2), получаем
W-i(í)W (í) + W-i(í)T^(í) = 0,
WW-i(í) + W-i(í)A(í) + AT(í)W-i(í) = -W-i(í)B(í)BT(í)W-i(í), í > to.
Таким образом, W-i(í) является решением уравнения Риккати (3.3). Если в качестве Q(t) взять W-i(í), то оценка (3.5) совпадает с множеством достижимости. Однако, заметим, что W(to) = 0 и, следовательно, W-i(t) не определена при t = t0. Кроме того, обращение W(t) возможно, если система вполне управляема на любом отрезке [to, t]. Последнее условие выполняется по умолчанию для стационарных систем в предположении полной управляемости.
Список литературы
1. Гурман В.И. Принцип расширения в задачах управления. М.: Физматлит, 1997. 287 с.
2. Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Оптимальное управление и динамические системы. Итоги науки и техники. Сер. Соврем. мат. и ее прил. Темат. обз. М.: ВИНИТИ, 2006. С. 76-108. http://mi.mathnet.ru/into138
3. Куржанский А.Б. Принцип сравнения для уравнений типа Гамильтона-Якоби в теории управления // Труды Института математики и механики УрО РАН. 2006. Т. 12. № 1. С. 173-183.
http ://mi. mathnet. ru/timm 141
4. Гусев М.И. О внешних оценках множеств достижимости нелинейных управляемых систем // Труды Института математики и механики УрО РАН. 2011. Т. 17. № 1. С. 60-69.
http ://mi. mathnet. ru/timm672
5. Никольский М.С. Об оценивании множества достижимости для некоторых управляемых объектов // Материалы Международной конференции, посвященной 110-летию со дня рождения Льва Семеновича Понтрягина. Москва, 2018. С. 194-196. https://doi.org/10.4213/proc23018
6. Мартынюк А.А., Лакшмикантам В., Лила С. Устойчивость движения: метод интегральных неравенств. Киев: Наук. думка, 1989. 272 с. https://elib.pstu.ru/vufind/Record/RUPSTUbooks150278
7. Gusev M.I., Zykov I.V. On extremal properties of boundary points of reachable sets for a system with integrally constrained control // IFAC-PapersOnLine. 2017. Vol. 50. Issue 1. P. 4082-4087. https://doi.org/10.1016/j.ifacol.2017.08.792
8. Зыков И.В. О задаче достижимости для нелинейной управляемой системы с интегральными ограничениями // CEUR-WS Proceedings. 2017. Vol. 1894. P. 88-97. http://ceur-ws.org/Vol-1894/opt7.pdf
9. Lee E.B., Marcus L. Foundations of optimal control theory. New York: Wiley, 1967. https://archive.org/details/FoundationsOfOptimalControlTheory
Поступила в редакцию 05.04.2019
Зыков Игорь Владимирович, младший научный сотрудник, отдел оптимального управления, Институт математики и механики УрО РАН, 620990, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. E-mail: [email protected]
I. V. Zykov
On external estimates of reachable sets of control systems with integral constraints
Citation: Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2019, vol. 53, pp. 61-72 (in Russian).
Keywords: reachable set, controlled system, integral constraints, integral inequalities, comparison principle, external estimates.
MSC2010: 93C15, 49N30, 34A40 DOI: 10.20537/2226-3594-2019-53-06
In this paper, we consider the problem of constructing external estimates of reachable sets as a level set of a certain differentiable Lyapunov-Bellman function (depending only on the state vector) for a control system with an integral control constraint. In particular, with its suitable choice, one can obtain ellipsoidal and rectangular estimates. The proposed constructions are based on integral estimates, the maximum solution, and the comparison principle for systems of differential inequalities. By using time in the arguments of the Lyapunov-Bellman function, it is possible to obtain more accurate estimates. In the linear nonstationary case, the latter can coincide with the set of reachability. A number of illustrative examples for nonlinear systems are given.
REFERENCES
1. Gurman V.I. Printsip rasshireniya v zadachakh upravleniya (The principle of expansion in control problems), Moscow: Fizmatlit, 1997, 287 p.
2. Dykhta V.A. Lyapunov-Krotov inequality and sufficient conditions in optimal control, Journal of Mathematical Sciences (New York), 2004, vol. 121, no. 2, pp. 2156-2177. https://doi.org/10.1023/B:J0TH.0000023085.65837.49
3. Kurzhanski A.B. Comparison principle for equations of the Hamilton-Jacobi type in control theory, Proceedings of the Steklov Institute of Mathematics, 2006, vol. 253, suppl. 1, pp. 185-195. https://doi.org/10.1134/S0081543806050130
4. Gusev M.I. On external estimates for reachable sets of nonlinear control systems, Proceedings of the Steklov Institute of Mathematics, 2011, vol. 275, suppl. 1, pp. 57-67.
https://doi.org/10.1134/S0081543811090057
5. Nikol'skii M.S. On estimating the reachable set for some controlled objects, Proceedings of the International Conference dedicated to the 110th anniversary of Lev Semenovich Pontryagin, Moscow, 2018, pp. 194-196 (in Russian). https://doi.org/10.4213/proc23018
6. Martynyuk A.A., Lakshmikantam V., Lila S. Ustoichivost' dvizheniya: metod integral'nykh neravenstv (Stability of motion: the method of integral inequalities), Kiev: Nauk. dumka, 1989, 272 p. https://elib.pstu.ru/vufind/Record/RUPSTUbooks150278
7. Gusev M.I., Zykov I.V. On extremal properties of boundary points of reachable sets for a system with integrally constrained control, IFAC-PapersOnLine, 2017, vol. 50, issue 1, pp. 4082-4087. https://doi.org/10.1016/j.ifacol.2017.08.792
8. Zykov I.V. On the reachability problem for a nonlinear control system with integral constraints, CEUR-WS Proceedings, 2017, vol. 1894, pp. 88-97 (in Russian). http://ceur-ws.org/Vol-1894/opt7.pdf
9. Lee E.B., Marcus L. Foundations of optimal control theory, New York: Wiley, 1967. https://archive.org/details/FoundationsOfOptimalControlTheory
Received 05.04.2019
Zykov Igor Vladimirovich, Junior Researcher, Department of Optimal Control, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620990, Russia. E-mail: [email protected]