Известия Института математики и информатики Удмуртского государственного университета
2022. Том 60. С. 16-33
УДК 517.977.55, 517.977.58 © И. В. Зыков
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ МНОЖЕСТВ ДОСТИЖИМОСТИ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ ПРИ РАЗНОТИПНЫХ ОГРАНИЧЕНИЯХ НА УПРАВЛЕНИЕ
В работе рассматривается задача приближенного построения множеств достижимости линейной управляемой системы, когда управляющее воздействие стеснено одновременно геометрическим и несколькими интегральными ограничениями. Предлагается вариант перехода от непрерывной к дискретной системе путем равномерного разбиения временного отрезка и замене управлений на шаге разбиения их средними значениями. Доказана сходимость множества достижимости аппроксимирующей системы к множеству достижимости исходной системы в хаусдорфовой метрике при стремлении шага дискретизации к нулю, получена оценка скорости сходимости. Предложен алгоритм построения границы множеств достижимости, основанный на решении семейства задач конического программирования. Проведено численное моделирование.
Ключевые слова: управляемая система, множество достижимости, двойные ограничения, интегральные ограничения, геометрические ограничения, дискретная аппроксимация, метрика Хаусдорфа.
Б01: 10.35634/2226-3594-2022-60-02
Введение
Важной характеристикой управляемого процесса является его множество достижимости. Вид последнего зависит, в частности, от ограничений на управление. Например, геометрические (поточечные) ограничения на входные параметры управляемого процесса означают, что соответствующая величина почти в каждый момент должна находиться в заранее заданном непустом множестве. С помощью них учитываются конструктивные возможности управляемого устройства (нельзя отклонять рули более чем на определенный угол, двигатель имеет ограниченную тягу и так далее). Интегральные же ограничения позволяют в каждый момент времени выбирать произвольное управляющее воздействие при условии, что интегральный функционал от управления не превысит заранее заданной величины, называемой ресурсом управления. В терминах интегральных ограничений часто формулируются, например, условия ограниченности запаса энергии, ресурса топлива для объекта управления. Однако на практике возникают ситуации, когда необходимо налагать на управление одновременно несколько ограничений различных типов. Постановка задачи с двойным (геометрическим и интегральным) ограничением на управление позволяет учесть как конструктивные особенности системы, не позволяющие реализовать сколь угодно большие значения управления, так и конечный объем ресурсов, расходуемых системой. Для линейных управляемых систем с геометрическими ограничениями на управление множество достижимости может быть построено с помощью вычисления значений опорной функции (см., например, [1,4,5]) на равномерной сетке единичной сферы в Мга. Вычисление опорной функции — достаточно простая задача для типичных геометрических ограничений на управление. Сказанное относится и к задаче с интегральными ограничениями из Ьь Задача с ограничениями в даже проще, так как опорная функция множества достижимости вычисляется в явном виде с помощью численного интегрирования линейного матричного дифференциального уравнения Риккати. Одновременное наличие нескольких ограничений
(двойных, тройных и так далее) делает задачу гораздо более трудоемкой. При наличии, например, геометрических и интегральных (в Е^) ограничений вычисление одного значения опорной функции эквивалентно решению полубесконечной задачи линейного программирования [15]. Наличие квадратичных ограничений того или иного вида уже не позволяет использовать алгоритмы линейного программирования, а требует привлечения процедур квадратичного программирования. Квадратичными могут быть геометрические ограничения (ограничения на евклидову норму управления, эллипсоидальные ограничения) равно как и интегральные ограничения в пространстве
Далее приведем небольшой список цитирований, который отсылает к исследованиям, посвященным методам построения и вычисления, а также топологическим свойствам множеств достижимости управляемых систем. Вопросам оценивания и приближенного построения множеств достижимости посвящены монографии [12,21]. Внешние и внутренние оценки рассматривались во многих работах (см., например, [3,7,20]). Задачи и методы аппроксимации множеств достижимости нелинейных управляемых систем с геометрическими ограниченими исследуются в публикциях [8,10,14,22], а для систем с интегральными — в [18,23]. Численные методы построения множеств достижимости для линейных управляемых систем с геометрическими и фазовыми ограничениями приведены в статьях [6,9]. В [2,11] рассмотрены задачи достижимости и управляемости в системах с линейной структурой и двумя видами ограничений на управление: геометрическими и интегральными. Свойства выпуклости и компактности множеств достижимости при интегральных ограничениях изучались в работах [16,19]. Построению и необходимым условиям достижимости линейной по управлению системы с интегральными ограничениями на переменные состояния и управления (изопериметрические ограничения) посвящена публикация [17].
В настоящей работе рассматривается задача приближенного построения множеств достижимости линейной управляемой системы, когда управляющее воздействие стеснено одновременно геометрическим и несколькими интегральными квадратичными и неквадратичными ограничениями. Предлагается вариант перехода от непрерывной к дискретной системе путем равномерного разбиения временного отрезка и замене управлений на шаге разбиения их средними значениями. Доказана сходимость множества достижимости аппроксимирующей системы к множеству достижимости исходной системы в хаусдорфовой метрике при стремлении шага дискретизации к нулю, получена оценка скорости сходимости. Предложен алгоритм построения границы множеств достижимости, основанный на решении семейства задач конического программирования. Проведено численное моделирование.
Далее используются следующие обозначения. Знак := или == — «по определению». Для вещественной матрицы А через Ат мы обозначаем транспонированную матрицу, 0 обозначает нулевой вектор подходящей размерности. Для х,у Е Ега (х, у) — скалярное произведение векторов, ||ж|| = (х,х)2 — евклидова норма, ||ж||1 = \хг\ — норма в IIи||= тах |и^| — чебышевская норма вектора и Е (нижний индекс будем использовать
для нумерации компонент векторов, верхний — для нумерации векторов). Для вещественной прямоугольной т х п матрицы А через ||А|| обозначаем норму матрицы, подчиненную евклидовым нормам векторов. Для Б С Кга символом дБ обозначается граница Б. Через и Е2 будем обозначать, соответственно, пространства суммируемых и суммируемых с квадратом вектор-функций на заданном промежутке.
§ 1. Определения и постановка задачи
Рассматривается управляемая система
х(г) = А(г)х(г) + Б(г)и(г), г е т =[г0,в], х(г0) = х0, (1.1)
где х(*) € Ега — вектор состояния, и(*) € — управляющий параметр; А(*), В(*) — непрерывные на отрезке Т матричные функции соответствующей размерности.
В качестве управлений рассматриваются измеримые по Лебегу функции и(*) на Т, удовлетворяющие ограничениям м(-) € Ц», г = 0,1, 2 (совместно или по отдельности). Здесь
Ц° := {«(•) € : ||д°и(*)||те ^ при п. в. * € Т}, (1.2)
Ц := {«О € ^: £ ^ ^ ^
Ц :={«О € : £ ||^2и(*)П2^ ^ , (1.3)
где постоянные ^ > 0, а ^ — заданные невырожденные квадратные матрицы соответствующей размерности.
Определение 1.1. Множеством допустимых управлений назовем множество функций
2
«(•) € и = Ц(Ас,АьА2) :=р|[Аг • Ц + (1 - Аг) • Ы \г €{0,1}, Ас + А1 + А2 = 0.
г=0
Значение А^ = 1 отвечает за наличие ограничения Ц, а А^ = 0 — за его отсутствие. Пусть X(*, в) = Ф(*)Ф-1(в), где Ф(*) является фундаментальной матрицей, удовлетворяющей уравнению (1.1) Ф(*) = А(*)Ф(*), Ф(*°) = I, * € Т. Тогда решение (1.1) в момент времени * € Т имеет вид
ж(*) = X(Мо)ж° + / X(М)£(5)м(в) (1.4)
Применяя невырожденное линейное преобразование X-1 к обеим частям равенства (1.4), получим
X-1(*,*°)х(*) = X(*о,*)х(*) = + /" X^(Мо^(¿,5)В(в)м(5) ^ =
Ло
= + XСМ^(в)м(в) ^ = + X(*°,5)В(5)и(5) •'¿о •'¿о
что эквивалентно соотношению
у(*) = у(*°)+ /'^(в)и(в) у(*) = Ф-1 (*)х(*), £(*) = Ф-1 (*)В(*).
•/¿О
Таким образом, не ограничивая общности, вместо системы вида (1.1) для упрощения выкладок можно рассматривать равносильную систему
у(*) = £(*)«(*), * € Т, у(*°) = х°, (1.5)
где также является непрерывной матричной функцией.
Каждому допустимому управлению и(-) € и (А°, А1; А2) и начальному условию у(*°) = отвечает абсолютно непрерывное решение у(*,«(•),х°), * € Т, уравнения (1.5).
Определение 1.2. Множеством достижимости О [9, и ] системы (1.5) в момент времени 9 назовем множество всех точек из пространства состояний Мга, в которые можно перевести систему (1.5) из начальной точки х0 при помощи управлений и(-) € и(Ао, А1, А2):
О[9,и] = О[9,Ь, {х0},и]:= и \х0 +1 В(Ь)п(Ь) сИ\. (1.6)
Допустимое управление всегда существует, так как 0 € и(А0, А1; А2), поэтому множество достижимости исходной системы непусто. Нетрудно заметить, что множество достижимости 0[9,и] исходной системы при ансамбле ограничений содержится в пересечении множеств достижимости при отдельных ограничениях, а именно
0[9,и] Ср| С[9,Агиг + (1 - Аг) • и].
i=0
Определение 1.3. Хаусдорфовым расстоянием между ограниченными множествами Г и О из Кга будем называть величину к(В, О), которая определяется следующим образом
Н(Г,О)=тт{т ^ 0: Г С О + Вг(0), О С Г + Вг(0)},
где Вг(0) — шар радиуса т, с центром в 0. В пространстве непустых компактных множеств
•) является метрикой.
Из выпуклости множества допустимых управлений и(А0,А1;А2) и линейности системы (1.5) следует выпуклость множества достижимости О[9, и]. В случае множества и1 компактности О[9, и1], вообще говоря, нет, но его замыкание является компактом. В остальных случаях множеств допустимых управлений можно доказать, что множества достижимости компактны. Это следует из слабой компактности множеств управлений в и2 и вложений
С и2 С иь
В данной работе ставится задачей обоснование нового алгоритма приближенного построения множеств достижимости линейных управляемых систем при нескольких ограничениях различного типа, основанного на дискретных аппроксимациях и процедурах конического программирования.
§ 2. Аппроксимация множества достижимости
В данном параграфе рассматривается метод аппроксимации множества достижимости непрерывной системы путем дискретизации ограничений на управляющее воздействие и перехода к некоторой дискретной схеме за счет приближенного выбора кусочно-постоянных управлений, где постоянство сохраняется на каждом малом шаге разбиения временного отрезка.
Разобьем отрезок Т на N равных частей (Ж ^ 1) точками Ьк = Ь0 + Дк, к = 0,..., N, Д= (9 - 10)/Ж, = 9.
Проинтегрируем систему (1.5) на отрезке Тк = [Ьк С Т:
у(Ьк+1) - У(Ьк)= В(1)п(1) ¿Ь. Суммируем последнее равенство по к от 0 до N — 1:
^ N=1 Г 'к+1
у(9) = у(гм) = х0 + ^ В(1)п(1) ¿Ь.
к=0 *к
Последнее равенство при малых А можно заменить приближенным образом:
М-1 М-1 ггк+1
у(^) ~ ) = Х° + ^ И и(*) = + ^ ^Vй, Vй = и(*) (2.1)
к=° к=°
Перепишем геометрическое ограничение и° (1.2) для Vй:
Г^к+1
Н^|и ||3°и(*)||те ^ ^ ||д°и(0|иА ^ ^°А. (2.2)
Множество последовательностей {Vй}^=°1, удовлетворяющих (2.2), обозначим через
= {К}£=°1: Н^||те ^ ^°А}.
По неравенству Коши-Буняковского перепишем интегральное ограничение Ц2 (1.3)
k
для Vй:
||$2 V
й
Г^к + 1 /
Пк
Г ¿к+1 / Г ¿к+1 \ 1/2
^ / ||^2и(*)| ^ А1/2 / ||^2и(*)|2
</4к
Возведем обе части неравенства в квадрат и просуммируем по к:
N-1 г% гв
^Н^||2 ^ А/ ||^2и(*)|2= А/ ||д2«(*)||2^ ^А. (2.3)
й=° •'¿О •'¿О
Множество последовательностей {Vй}^=°1, удовлетворяющих (2.3), обозначим через
N -1
.^N-1 V1 игл „.Н\\2 / ..2
^ = {Vй }N=-01 : £ ||2 ^ ^2А .
й=°
Аналогично поступаем для интегрального ограничения и1:
'¿к
1
¿к + 1
Г^к + 1 1 ¿¿к
Суммируем последнее по к от 0 до N — 1:
N -1 г ^
||1 ^ / ||^1и(*)Пх^ ^ ^1. (2.4)
й=°
¿о
Множество последовательностей {Vй}^=°1, удовлетворяющих (2.4), обозначим через
N -1
^ = {Vй }N="о1 : £ и^* ||1 ^ ^
й=°
Определение 2.1. Множеством допустимых управлений дискретной системы (по аналогии с определением 1.1) назовем множество конечных последовательностей векторов {Vй^"о1 € ^ = V*(А°,А1,А2) := П2=° [А • ^ + (1 — А) • X , Аг € {0, 1}, А° + А1 + А2 = 0.
Допустимая последовательность управлений всегда существует, так как 0 € Ум, N ^ 1.
Определение 2.2. Множеством достижимости С[Ьм, Ум ] в момент времени гм назовем множество всех точек из фазового пространства Кга, в которые можно перейти из начальной точки х0 по решениям уравнения (2.1) при всех возможных допустимых управлениях {ук }м-01 € Ум•
С[1м, Ум] = 0[1И,Ьо, {х0}, Ум]:
и
м -1
х
Ьк ^ (Л° ,Л1,Л2)
к=0
Предположение 2.1. Матрица О(^) из (1.5) удовлетворяет условию Липшица с константой Ь:
11^(52) - 0(в1)\\ ^ Ь\в2 - Ь> 0, 31,32 € Т.
В следующей теореме будем считать Сг ограничение задачи будет отсутствовать.
если Аг = 0, то есть соответствующее
Теорема 2.1. При N ^ последовательность выпуклых множеств С\Ьм,Ум] стремится к выпуклому множеству С[9,и] в смысле метрики Хаусдорфа. Для хаусдорфо-ва расстояния справедлива оценка
С
где
С = Ь(в - Ьо) • шт{Со, С1, С2},
Со = у/р(О - и) ■ А/о||<5О_1|1оо,
с1 = ц1\\дг1\\1, с2 = у/в-10-11№
-1
Доказательство. Выберем произвольное допустимое управление п(^) € и, которому в момент Ь = в соответствует правый конец у (в) € С[в,и ] траектории исходной системы (1.5). Тогда, как было показано ранее, данным управлению и траектории будут соответствовать последовательность допустимых управлений {^к}м—)1 € Ум аппроксими-
рующей системы V
к
Г*к + 1
п(Ь) ¿Ь, к = 0,1,... ^ - 1, и траектория у(Ьм) € С[в, Ум]
'¿к
аппроксимирующей системы (2.1).
Оценим расстояние между данными траекториями в момент времени в = Ьм •
- У(Ьм)\\ =
,в м-1
I Б(г)п(г) <и вкV
к=0
м-1 ^к+1 м-1 ^к+1
в(ь)п(ь) Б(гк) I п(ь) <ь
к=о ^Ьк
к=0
^к
м-1
Г*к+1
\т) - Б(1к)
к=0 *к
п(г)\\ ¿г.
В силу предположения 2.1
м -1 Г *к+1
у(1м)\\ ^ ЬА^ I \\п(г)\\ ¿г.
(2.5)
=0 ^ ^
к=0
2
Для геометрического ограничения [70.
N -1 Г ifc+1 г в
/ l|u(t)H dt = ||Qo-1Qo«(t)|| dt ^ k=0 ifc •'io
,e
^ \\Qo~1\\ooVP \\QoU(t)\\ocdt ^ VP^-ioHIIQo-lco-
J to
По неравенству Коши-Буняковского для интегральных квадратичных ограничений
лб? i Гв \1/2
/ л/<9 — tollQs"1!! / ||Q2w(i)||2di ^ — io - ^allQa-1!!-
t0t0
Наконец, для интегральных ограничений [Д.
||Qi-1Qiu(t)|| dt ^ ||Qi-1||i / ||Qiu(t)|idt ^ ^i|Qi-1|i.
t0t0
Здесь и далее
IIQo_1||co = max ||i = max HQ,"1)) = ^¡^V),
j=1 i=1
где Лтах обозначает максимальное собственное число заданной матрицы. Отсюда и из (2.5)
С
можно заключить, что || у (в) — ^ N ^ 1. Таким образом, выполняется включе-
ние множества достижимости исходной непрерывной системы во множество достижимости
С
аппроксимирующей системы с некоторой --окрестностью: С[9,и] С Ку + -£>с(0).
Обратно, возьмем, не ограничивая общности, произвольную последовательность допустимых управлений }у=01 € , которой в момент Ь = ¿у соответствует траектория ) € "Уу] аппроксимирующей системы (2.1). Тогда данным последовательности управлений и траектории можно поставить в соответствие последовательность кусочно-
постоянных управлений и(£) = Ь € Тк = 1], /с = 0,1,..., N — 1, и траекторию
у(0) € Ц] исходной системы (1.5). Проверим, принадлежит ли и(Ь) множеству Ц. Действительно.
(1) из определения геометрического ограничения У0,у следует
(2) для квадратичных ограничений У2)У имеем
(3) наконец, для ограничений , имеем
1 N-1 /-tfc+1 N-1
'to k=0 ^tk k=0
в
в
Таким образом, множество допустимых управлений аппроксимирующей системы содержится во множестве допустимых управлений исходной системы.
Оценим расстояние между данными траекториями в момент времени в = Ьм •
м
)-
м-1
Е^кV"1 - / о(г)п(г) ¿г к=0 ^0 м-1 м-1 ^к+1 Е^к -Е/ о(г)и(г) ¿г к=0 к=0 *к
м -1 м -1 1 Г Ьк+1
Е^-Е-/ ^^
к=0
а у 4к
к=0 ,/4к
Так как vk постоянно для каждого к, то данную последовательность можно представить
Г^к+1
в эквивалентной форме ьк = ^ / ук сИ, к = 0,1,..., N — 1. Тогда
Чк
х(Ьм) - х
м-1 1 *к+1
Ед/
к=0 ^1к
м-1 1 /*к+1
^Е д / ры-^И-И^И,
к=0 ^1к
и в силу предположения 2.1
м -1
м
)-
ЬА
(2.6)
к=0
Поэтому справедливы оценки: (1) для геометрического ограничения У0,м •
м-1
м -1
Е 11^0-^0^11 ^ у/рЮо'Чоо Е И^Цоо ^ у/р(в - ¿О^оЦдо"1!
к=0
к=0
(2) из неравенства для скалярного произведения векторов и соотношений для ограничения У2 м •
м-1
м-1
1/2
к2
к=0
к=0
2 \\^2
^ ^-¿о-И!^"1!!;
(3) для ограничений У1м •
м-1
м-1
Е \\^1 -1^к\\ ^ ИЗГ1 \к Е \\З Vк\\1 ^ Ми-1\1.
к=0
к=0
С
Отсюда и из (2.6) можно заключить, что ||у(Ьм) — у(Р)\\ ^
Таким образом, выполняется включение множества достижимости аппроксимирующей системы во множество достижимости исходной непрерывной системы с некоторой
С
-окрестностью: С С[в,17] + Вс_(0) и хаусдорфово расстояние (см. определе-
N
ние 1.3) между этими множествами оценивается как к(О, О) ^
С_
□
Множество достижимости системы (1.1) получается из множества достижимости системы (1.6) путем линейного преобразования множества О(Ь1, и) с помощью матрицы Ф(г1).
к
V
ОО 1
§ 3. Описание алгоритма построения множеств достижимости
Хорошо известно, что выпуклая оболочка компакта представима в виде пересечения конечного или бесконечного числа замкнутых опорных полупространств. Выпуклость множеств достижимости аппроксимирующей линейной управляемой системы позволяет использовать аппарат опорных функций при вычислении множеств достижимости и однозначно определять последние.
Определение 3.1. Опорной функцией множества M С Rn называется скалярная функция c(M, ф) векторного аргумента, определяемая условием c(M, ф) = max/eM ф/.
Если множество M компактно, то для каждого ф £ £1(0) (единичная сфера), неравенство / ^ c(M, ф) задает замкнутное полупространство, ограниченное гиперплоскостью H^,c(M, ф)) = {/ £ Rn | фт/ = c(M, ф)}, опорной для множества M с внешней нормалью ф.
Замкнутое выпуклое множество M С Rn полностью определяется своей опорной функцией, так как оно может быть задано как множество решений системы неравенств M = П(0) {/ £ Rn I фт/ ^ C(M, ф)}. В нашем случае M = G(tN, VN), а / = ).
Опишем в краткой форме алгоритм построения множеств достижимости применительно к ограничениям вида (А0,Л1 , Л2). Для вычисления опорных функций будем использовать процедуру конического программирования второго порядка SOCP (second-order cone program). Стандартная форма SOCP: minz /Tz при ограничениях
||AsC(z) ■ z - bSc(i)|| ^ dTc(i) ■ z - 7(i), 1 ^ i ^ m, (3.1)
A ■ z ^ b, Aeq ■ z = beq, /b ^ z ^ ub, (3.2)
где /, z, b, beq, /6 и ub являются векторами, а A и Aeq являются матрицами линейных ограничений (3.2). Для каждого i матрицы Asc(i), векторы bsc(i), dsc(i) и скаляры 7(i) задают конические ограничения второго порядка (3.1). Другими словами, задача имеет линейную целевую функцию и линейные ограничения, а также набор конических ограничений второго порядка.
Поясним использование термина «коническое ограничение». По определению множество Kzo С Rn называется конусом с вершиной в z0 £ Kzo, когда оно обладает свойством: если z £ Kzo, то и все точки луча z0 + Л(z — z0) для любого Л ^ 0 принадлежат множеству Kzo. В частном случае ограничение (3.1) задает конус, в том числе усеченный, если 7(i) = 0. Пусть
Kz0 = {z: || Asc ■ z — bsc|| ^ ■ z — 7}, det Asc = 0.
Введем обозначения: z = [z zn+i]T £ Rn+1, Asc = [Asc 0] £ Rnx(n+1), djc = [dTc 0] £ £ Rn+1, gT = [0 ... 0 1] £ Rn+1. Тогда
Kzo = K-zo = {z : ||AisCz — bsC|| ^ gTz, (dT — gT) ■ z = 7, gTz ^ 0}.
Покажем, что из z £ Kzo и z0 = 0, bsc = 0, 7 = 0 следует z0 + Л(^ — z0) £ Kzo, Л ^ 0. Действительно,
||Asc(Az)|| ^ gT^z), (dTc — gT) ■ (Л*) = 0, gT^z) ^ 0.
Сокращая все неравенства на Л = 0 (при Л = 0 они очевидным образом выполняются), видим, что Л^ £ K0. При 7 = 0 и Asc(1 — Л)^0 = bsc получаем при Л ^ 1 конус
||Aec(A*)|| ^ (1 — %Tz0 + gT^z) ^ gT^z),
усеченный частью плоскости
(die - 9Т) • * = - gT)z°, gTz > ^уV*0-
Подчеркнем, что конусов может быть несколько (m > 1).
Покажем, как можно преобразовать произвольное квадратичное ограничение xTQx + + 2qTx + c ^ 0 в коническую форму. Предполагаем симметричность и положительную определенность матрицы Q. В этом случае существует матрица S такая, что Q = S • S = = SтS и всегда разрешимо (в силу det S = 0) уравнение Sтb = — q. Тогда xTQx+2qTx+c = = xTSTSx-2(STb)Tx+c = (Sx-b)T(Sx-b)-bTb+c = \\Sx-b\\2+c-bTb ^ 0. При bTb > с получаем ограничение Цбж — Ь|| ^ л/ЬтЬ — с задачи конического программирования с подходящими входными параметрами Asc = S, bsc = b, dsc = 0, 7 = —л/ЬтЬ — с.
В целях упрощения выкладок, рассмотрим нашу задачу для случая тройных ограничений VN(1,1,1) (m = 1). Найти для каждого фиксированного ф £ Si(0) набор векторов {vkj^-Q1, который минимизирует фтy(tN):
(N—1 \ N — 1
xQ + У^ Dkvk I = фтx0 + min фт У^ Dkvk,
k=0 / {v }k=0 k=0
при ограничениях
\\QoVk\U ^ ßoA, k = 0,..., N - 1;
N— 1 N — 1
E\QlVk\l ^ ßl, Y.\\Q2Vk\\2 ^ ^22Д.
Пусть
N—1
{vkmk=o = arg min фт £ Dkvk.
k=0
К }N-1
Тогда граница множества достижимости аппроксимирующей системы представима в виде
ÍN—1
+ Е Dkvk(iP)
k=0
Для случая системы второго порядка в качестве ф будем рассматривать равномерное распределение точек на единичной окружности с помощью параметризации ф(а) = т
= [cos a sin а\ , где а(к0) = — • к0, N0 £ N, к0 = 0,..., N0 — 1.
N0
В качестве альтернативы для размерности задачи два и более можно использовать метод, который состоит из следующих действий:
(1) сфера вписывается в куб;
(2) генерируется множество точек в данном кубе, с использованием генератора случайного числа (получается множество точек, равномерно распределенных в пространстве куба);
(3) отбрасываются точки, отстоящие от центра сферы на расстояние большее, чем ее радиус (получается множество точек, равномерно распределенное в пространстве, ограниченном сферой);
(4) оставшиеся точки проецируются на поверхность сферы.
Данные методы являются достаточно простыми и интуитивно понятными. Конечно, это лишь часть возможных способов построения распределений точек на поверхности шара. Введем необходимые для дальнейшего изложения обозначения:
(1) г = [у ю]Т е , где V = [■
V = V
-1]Т е
м ю = [ю0
ю
N-1
]Т е RP•N;
дополнительный переменный вектор ю возникает в результате перехода от интегрального неквадратичного ограничения к эквивалентным линейным ограничениям (подробно это описано на примере в §4.1);
(2) В = [До ••• ^-1] е );
(3) I — единичная, а О — нулевая квадратная матрица соответствующего порядка;
(4) М-
0
0
е )х(^), ^ = 0, 1, 2; м3
М2 О ОО
е !(2^)х(2^).
В данных обозначениях исходную задачу можно переписать в следующем виде. Найти для каждого фиксированного ф е £1(0) вектор г, который минимизирует фТу(^), т.е.
N -1
//(%)
при ограничениях:
Ш1П фТу(^) = фТх0 + шт 1 фТ ^ Вк= фТх0 + ш1п фТ [В О] г
^ }к = 0
(а) [(-1)в ■ Мо О г ^ [^оА ... ^А]Т е , в = 1, 2, — геометрические;
(б) [(-1)* ■ М1 -1]г ^ [0 ... 0Т е , [О -I]* ^ [0 ... 0Т е ^
,•N
0
^^ 1
г ^ - неквадратичные;
(в) ||М3г|| ^ л/А — квадратичные.
Пусть г(1(ф)) = а^гшгьг 1(ф)тг = а^тш^ фТ [В О] г. Тогда граница множества достижимости аппроксимирующей системы представима в виде
дС(1м,Ум)= и {ж°+[В 0]г(1(ф))}.
^е^х (о)
Следуя приведенной выше форме БОСР, запишем входные параметры (3.1) и (3.2) нашей задачи:
т
1, Азс(1) = м3, ъзс(1) = (1]с(1) = [0 ... 0] 7(1) = -^у/А,
( цол/А \
А
0
[-Мо О] [Мо О] [-М1 [М1 -/] [О -I]
0p•N 1 ' '
\
е
+1)х2-р^
л/А 2•p•N 0
03•p•N \ ^ !
е!5^-1+1,
V
Ь
Aeq = beq = lb = ub = [ ] — остаются пустыми.
Алгоритм вычисляет не только точки максимума (значения опорной функции), но и точки, в которых достигаются максимумы, так как именно эти точки дают аппроксимацию множества достижимости. Наконец, чтобы получить аппроксимацию множества достижимости изначальной системы, необходимо последним шагом произвести линейное преобразование множества dG(tN,VN) с помощью матрицы Коши Ф^м). Заметим, что данную схему нетрудно редуцировать на более простые случаи, либо перенести на случай произвольного (в зависимости от вычислительных мощностей) числа комбинаций разного вида ограничений.
§ 4. Численное моделирование
Для построения дальнейших примеров в качестве программного обеспечения была выбрана система математического моделирования MATLAB, внутри которой использовался решатель coneprog и параллельный цикл parfor. Решатель использует алгоритм, описанный в работе [13]. Эксперименты проводились на 4-ядерном процессоре Intel(R) Core(TM) i7-6700HQ CPU с тактовой частотой 2.60 GHz и NVIDIA GeForce GTX 960M.
§ 4.1. Случай ограничений U(1,1,0) для системы второго порядка
Рассмотрим управляемую линейную систему с постоянными коэффициентами:
X 1 (t) = X2(t), X2(t) = u(t), x e R2, u e R, t e T = [0, 2], x(0) = 0. (4.1)
Допустимыми управлениями будем считать измеримые скалярные функции времени u(t),
Г 2
удовлетворяющие одновременно двум неравенствам: lu(t)l ^ 1, |u(t)| dt ^ 1. Последние
Jo
два неравенства с физической точки зрения означают ограниченность величины и импульса управляющей силы соответственно. Остановимся более подробно на преобразовании данных ограничений к дискретному виду и сведению к форме SOCP. В данном случае коническое ограничение (3.1) отсутствует, а Q0 = Q1 = 1, ß0 = ß1 = 1, z = \v w] e R2 N, v,w e RN. Матрицы D(t) = [-t 1T, Dk = [-M 1]T, k = 0,...,N - 1. В этом случае
D
0 -А ... -A(N - 1) 11 ... 1
e RnxN. Так как Q0 = 1, то M0 = I e RNxN. Геометриче-
ское ограничение |^к| ^ А, к = 0,..., N — 1, принимает вид:
[(-1)* ■ I О] г ^ [А ... А]Т е , з =1, 2. Ситуация с интегральным ограничением посложнее, так как возникает необходимость
N-1
избавиться от модуля под знаком суммы ^ |-ук | ^ 1. Это можно реализовать с помощью
к=0
введения дополнительного вектора т е RN. Действительно, если обозначить тк = |^к |,
N -1
к = 0,..., N — 1, то тк ^ 1 с дополнительными условиями: тк ^ 0 и — тк ^ ук ^ тк.
к=0
При М1 = I е ^^ это можно записать иначе:
[(—1)* ■ I —1] г ^ [0 ... 0]Т е ^, з = 1, 2, [О —I] г ^ [0 ... 0]Те RN, [0 ••• 0N 1 ••• 1N] г ^ 1.
2 1.5 1
0.5 0
-0.5 -1 -1.5 2
2
1
0
Ж1
Рис. 1. Границы множеств достижимости системы (4.1) при двойных ограничениях (черным цветом), геометрическом (красным) и интегральном (синим) ограничениях
1
2
Запишем линейные входные параметры (3.2) нашей задачи:
А
0
[-1 О]
[1 О]
[-1 -']
[ 1
[О
1 ■
Ч/
/ А\
0 1
е Е5
5-М +1
Аед = 6ед = /6 = и6 = [ ] — остаются пустыми. Тогда граница множества достижимости аппроксимирующей системы представима в виде
5С(2, и(1,1,0)) « Ф(2) ■ , Уу (1,1,0))
12 01
У {[Я 0}МФ))}-^€^1(0)
Построим множество достижимости на основе изложенного алгоритма для данной системы при данных ограничениях (см. рис. 1, внутренний график черным цветом). Синим обозначено множество достижимости только при интегральном неквадратичном ограничении, а красным — только при геометрическом. При N = N = 200 время вычисления и построения множества достижимости (черным цветом) составило примерно 2.5 секунды. На данном рисунке можно заметить, что С[2, и(1,1, 0)] С С[2, и0] П С[2, и1].
§ 4.2. Случай ограничений Щ1,0,1) для системы третьего порядка
Рассмотрим тройной интегратор:
X1^) = £2^), X 2 (¿) = Жз(г), ¿з(г) = и(£),
х е Е3, и е Е, г е т = [0,3], х(0) = 0.
(4.2)
X2
Xi
Рис. 2. Сечения плоскостью х3 = 3(2а — 1) € [-3, 3], а € [0 : 0.05 : 1] границы множества достижимости системы (4.2) при геометрическом и интегральном квадратичном (на норме Ь2) ограничениях
Допустимыми управлениями будем считать измеримые скалярные функции времени п({), удовлетворяющие одновременно геометрическому и интегральному ограничениям
1п(1)1 ^ 1, / 1п{Ь)|2 ^ 4. В данном случае присутствует коническое ограничение (3.1)
./о
(т = 1). Построим сечения множества достижимости плоскостью х3 = 3(2а — 1) € [—3, 3], где а € [0 : 0.05 : 1] для данной системы при данных ограничениях (см. рис. 2). Двумерные сечения были выбраны, в частности, с целью избежать проблем визуализации при построении трехмерного массива точек. Отметим, что плоскость, задающая сечение, добавляет ограничение к задаче в виде равенства Лед •г = Ьед, где Лед = гпФ(1м) [Р О, п обозначает вектор нормали к плоскости сечения, а Ьед = а — пФ(1м)х0. В качестве ф выбираем трехмерные единичные векторы параллельные плоскости сечения (в данном примере п = (0, 0,1)),
е
то есть должны выполняться условия ф = ---- и п _1_ е. Из перпендикулярности последних
e
n • e = 0 или ni • ei + n2 • e2 + n3 • e3 = 0. Так как ||n|| = 0, то, не ограничивая общности, бу-
дем считать п3 = 0. Тогда справедливо обозначить e
Ь ч Т
ei е2 - — (/?i • ei + п2 ■ е2) , где
Пз
2п
е\ = cos ß, е2 = sin ß, /5(fco) = ~rr • N0, fco = 0,..., N0 — 1. Всего было построено 21 сечение
N0
по N0 точек на каждое. При N = 300 и N0 = 200 время вычисления и построения каждого сечения множества достижимости составило не более 1.5 секунды, а общее время — около 29 секунд.
Финансирование. Работа выполнена в рамках исследований, проводимых в Уральском математическом центре при финансовой поддержке Министерства науки и высшего образования Российской Федерации (номер соглашения 075-02-2022-874).
СПИСОК ЛИТЕРАТУРЫ
1. Благодатских В. И. Введение в оптимальное управление. М.: Высшая школа, 2001.
2. Дарьин А. Н., Куржанский А. Б. Нелинейный синтез управлений при двойных ограничениях // Дифференциальные уравнения. 2001. Т. 37. № 11. С. 1476-1484. http://mi.mathnet.ru/de10483
3. Зыков И. В. О внешних оценках множеств достижимости управляемых систем с интегральными ограничениями // Известия Института математики и информатики Удмуртского государственного университета. 2019. Т. 53. С. 61-72. https://doi.org/10.20537/2226-3594-2019-53-06
4. Красовский Н. Н. Теория управления движением. М.: Наука, 1968.
5. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Физматлит, 1977.
6. Лотов А. В. Численный метод построения множеств достижимости для линейной управляемой системы // Журнал вычислительной математики и математической физики. 1972. Т. 12. № 3. С. 785-788. http://mi.mathnet.ru/zvmmf6715
7. Максимов В. П. О внутренних оценках множеств достижимости для непрерывно-дискретных систем с дискретной памятью // Труды Института математики и механики УрО РАН. 2021. Т. 27. №3. С. 141-151. https://doi.org/10.21538/0134-4889-2021-27-3-141-151
8. Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и управления. М.: Наука, 1988.
9. Никольский М. С. Линейные управляемые объекты с фазовыми ограничениями. Приближенное вычисление множеств достижимости // Труды Института математики и механики УрО РАН. 2021. Т. 27. № 2. С. 162-168. https://doi.org/10.21538/0134-4889-2021-27-2-162-168
10. Пацко В. С., Федотов А. А. Аналитическое описание множества достижимости для машины Ду-бинса // Труды Института математики и механики УрО РАН. 2020. Т. 26. № 1. С. 182-197. https://doi.org/10.21538/0134-4889-2020-26-1-182-197
11. Сиротин А. Н., Формальский А. М. Достижимость и управляемость дискретных систем при ограниченных по величине и импульсу управляющих воздействиях // Автоматика и телемеханика. 2003. Вып. 12. С. 17-32. http://mi.mathnet.ru/at1984
12. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988.
13. Andersen E.D., Roos C., Terlaky T. On implementing a primal-dual interior-point method for conic quadratic optimization // Mathematical Programming. Ser. B. 2003. Vol. 95. Issue 2. P. 249-277. https://doi.org/10.1007/s10107-002-0349-3
14. Baier R., Gerdts M., Xausa I. Approximation of reachable sets using optimal control algorithms // Numerical Algebra, Control and Optimization. 2013. Vol. 3. No. 3. P. 519-548. https://doi.org/10.3934/naco.2013.3.519
15. Goberna M.A., Lopez M.A. A comprehensive survey of linear semi-infinite optimization theory. Boston: Springer, 1998. P. 3-27. https://doi.org/10.1007/978-1-4757-2868-2_1
16. Gusev M. I., Osipov I. O. On convexity of small-time reachable sets of nonlinear control systems // AIP Conference Proceedings. 2019. Vol. 2164. Issue 1. 060007. https://doi.org/10.1063/1.5130809
17. Gusev M. I., Zykov I. V. An algorithm for computing reachable sets of control systems under isoperimetric constraints //AIP Conference Proceedings. 2018. Vol. 2025. Issue 1. 100003. https://doi.org/10.1063/1.5064932
18. Huseyin N., Guseinov Kh. G., Ushakov V. N. Approximate construction of the set of trajectories of the control system described by a Volterra integral equation // Mathematische Nachrichten. 2015. Vol. 288. Issue 16. P. 1891-1899. https://doi.org/10.1002/mana.201300191
19. Huseyin N., Huseyin A. Compactness of the set of trajectories of the controllable system described by an affine integral equation // Applied Mathematics and Computation. 2013. Vol. 219. Issue 16. P. 8416-8424. https://doi.org/10.1016/j.amc.2013.03.005
20. Kostousova E. K. State estimates of bilinear discrete-time systems with integral constraints through polyhedral techniques // IFAC-PapersOnLine. 2018. Vol. 51. Issue 32. P. 245-250. https://doi.org/10.1016/j.ifacol.2018.11.389
21. Kurzhanski A. B., Varaiya P. Dynamics and control of trajectory tubes. Theory and computation. Cham: Birkhauser, 2014. https://doi.org/10.1007/978-3-319-10277-1
22. Rasmussen M., Rieger J., Webster K.N. Approximation of reachable sets using optimal control and support vector machines // Journal of Computational and Applied Mathematics. 2017. Vol. 311. P. 68-83. https://doi.org/10.1016/j.cam.2016.06.015
23. Rousse P., dit Sandretto J. A., Chapoutot A., Garoche P.-L. Guaranteed simulation of dynamical systems with integral constraints and application on delayed dynamical systems // Cyber physical systems. Model-based design. Cham: Springer, 2020. P. 89-107. https://doi.org/10.1007/978-3-030-41131-2_5
Поступила в редакцию 13.02.2022 Принята в печать 10.07.2022
Зыков Игорь Владимирович, младший научный сотрудник, отдел оптимального управления, Институт математики и механики УрО РАН, 620108, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. ORCID: https://orcid.org/0000-0002-9911-1645 E-mail: [email protected]
Цитирование: И. В. Зыков. Приближенное вычисление множеств достижимости линейных управляемых систем при разнотипных ограничениях на управление // Известия Института математики и информатики Удмуртского государственного университета. 2022. Т. 60. С. 16-33.
I. V. Zykov
Approximate calculation of reachable sets for linear control systems with different control constraints
Keywords: controlled system, reachable set, double constraints, integral constraints, geometric constraints, discrete approximation, Hausdorff metric.
MSC2020: 49M25, 49N05
DOI: 10.35634/2226-3594-2022-60-02
The paper considers the problem of approximate construction of reachability sets for a linear control system, when the control action is constrained simultaneously by geometric and several integral constraints. A variant of the transition from a continuous to a discrete system is proposed by uniformly dividing the time interval and replacing the controls at the step of dividing them with their mean values. The convergence of the reachability set of the approximating system to the reachability set of the original system in the Hausdorff metric is proved as the discretization step tends to zero, and an estimate is obtained for the rate of convergence. An algorithm for constructing the boundary of reachable sets based on solving a family of conic programming problems is proposed. Numerical simulation has been carried out.
Funding. The work was performed as part of research conducted in the Ural Mathematical Center with the financial support of the Ministry of Science and Higher Education of the Russian Federation (Agreement number 075-02-2022-874).
REFERENCES
1. Blagodatskikh V.I. Vvedenie v optimal'noe upravlenie (Introduction to optimal control), Moscow: Vysshaya Shkola, 2001.
2. Dar'in A. N., Kurzhanskii A. B. Nonlinear control synthesis under two types of constraints, Differential Equations, 2001, vol. 37, no. 11, pp. 1549-1558. https://doi.org/10.1023/A:1017960614331
3. Zykov I. V. On external estimates of reachable sets of control systems with integral constraints, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2019, vol. 53, pp. 61-72 (in Russian). https://doi.org/10.20537/2226-3594-2019-53-06
4. Krasovskii N.N. Teoriya upravleniya dvizheniem (Theory of motion control), Moscow: Nauka, 1968.
5. Kurzhanskii A. B. Upravlenie i nablyudenie v usloviyakh neopredelennosti (Control and observation in conditions of uncertainty), Moscow: Fizmatlit, 1977.
6. Lotov A. V. Numerical method of constructing attainability sets for a linear control system, USSR Computational Mathematics and Mathematical Physics, 1972, vol. 12, no. 3, pp. 279-283. https://doi.org/10.1016/0041-5553(72)90050-X
7. Maksimov V. P. On internal estimates of reachable sets for continuous-discrete systems with discrete memory, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2021, vol. 27, no. 3, pp. 141-151 (in Russian). https://doi.org/10.21538/0134-4889-2021-27-3-141-151
8. Mordukhovich B. Sh. Metody approksimatsii v zadachakh optimizatsii i upravleniya (Approximation methods in optimization and control problems), Moscow: Nauka, 1988.
9. Nikol'skii M. S. Linear controlled objects with state constraints. Approximate calculation of reachable sets, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2021, vol. 27, no. 2, pp. 162-168 (in Russian). https://doi.org/10.21538/0134-4889-2021-27-2-162-168
10. Patsko V. S., Fedotov A. A. Analytic description of a reachable set for the Dubins car, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2020, vol. 26, no. 1, pp. 182-197 (in Russian). https://doi.org/10.21538/0134-4889-2020-26-1-182-197
II. Sirotin A.N., Formal'skii A.M. Reachability and controllability of discrete-time systems under control actions bounded in magnitude and norm, Automation and Remote Control, 2003, vol. 64, issue 12, pp. 1844-1857. https://doi.org/10.1023/B:AURC.0000008423.93495.be
12. Chernous'ko F. L. Otsenivanie fazovogo sostoyaniya dinamicheskikh sistem (Estimation of the phase state of dynamical systems), Moscow: Nauka, 1988.
13. Andersen E. D., Roos C., Terlaky T. On implementing a primal-dual interior-point method for conic quadratic optimization, Mathematical Programming. Ser. B, 2003, vol. 95, issue 2, pp. 249-277. https://doi.org/10.1007/s10107-002-0349-3
14. Baier R., Gerdts M., Xausa I. Approximation of reachable sets using optimal control algorithms, Numerical Algebra, Control and Optimization, 2013, vol. 3, no. 3, pp. 519-548. https://doi.org/10.3934/naco.2013.3.519
15. Goberna M. A., Lopez M.A. A comprehensive survey of linear semi-infinite optimization theory, Boston: Springer, 1998, pp. 3-27. https://doi.org/10.1007/978-1-4757-2868-2_1
16. Gusev M. I., Osipov I. O. On convexity of small-time reachable sets of nonlinear control systems, AIP Conference Proceedings, 2019, vol. 2164, issue 1, 060007. https://doi.org/10.1063/L5130809
17. Gusev M. I., Zykov I. V. An algorithm for computing reachable sets of control systems under isoperimetric constraints, AIP Conference Proceedings, 2018, vol. 2025, issue 1, 100003. https://doi.org/10.1063/L5064932
18. Huseyin N., Guseinov Kh.G., Ushakov V.N. Approximate construction of the set of trajectories of the control system described by a Volterra integral equation, Mathematische Nachrichten, 2015, vol. 288, issue 16, pp. 1891-1899. https://doi.org/10.1002/mana.201300191
19. Huseyin N., Huseyin A. Compactness of the set of trajectories of the controllable system described by an affine integral equation, Applied Mathematics and Computation, 2013, vol. 219, issue 16, pp. 8416-8424. https://doi.org/10.1016/j.amc.2013.03.005
20. Kostousova E. K. State estimates of bilinear discrete-time systems with integral constraints through polyhedral techniques, IFAC-PapersOnLine, 2018, vol. 51, issue 32, pp. 245-250. https://doi.org/10.1016/j.ifacol.2018.11.389
21. Kurzhanski A. B., Varaiya P. Dynamics and control of trajectory tubes. Theory and computation, Cham: Birkhauser, 2014. https://doi.org/10.1007/978-3-319-10277-1
22. Rasmussen M., Rieger J., Webster K.N. Approximation of reachable sets using optimal control and support vector machines, Journal of Computational and Applied Mathematics, 2017, vol. 311, pp. 68-83. https://doi.org/10.1016/jxam.2016.06.015
23. Rousse P., dit Sandretto J. A., Chapoutot A., Garoche P.-L. Guaranteed simulation of dynamical systems with integral constraints and application on delayed dynamical systems, Cyber physical systems. Model-based design, Cham: Springer, 2020, pp. 89-107. https://doi.org/10.1007/978-3-030-41131-2_5
Received 13.02.2022 Accepted 10.07.2022
Igor' Vladimirovich Zykov, Junior Researcher, Department of Optimal Control, Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620108, Russia.
ORCID: https://orcid.org/0000-0002-9911-1645 E-mail: [email protected]
Citation: I. V. Zykov. Approximate calculation of reachable sets for linear control systems with different control constraints, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2022, vol. 60, pp. 16-33.