2021 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Т. 17. Вып. 3
ПРИКЛАДНАЯ МАТЕМАТИКА. ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ
ПРОЦЕССЫ УПРАВЛЕНИЯ
УДК 517.977.1 MSC 93В03
Построение множеств достижимости и управляемости в специальной линейной задаче управления*
А. С. Попков
Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 74)
Для цитирования: Попков А. С. Построение множеств достижимости и управляемости в специальной линейной задаче управления // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2021. Т. 17. Вып. 3. С. 294308. https://doi.org/10.21638/11701/spbul0.2021.307
Рассматривается вопрос о построении множеств достижимости и управляемости для задачи управления, в которой движение объекта описывается линейной системой обыкновенных дифференциальных уравнений, а управление выбирается из класса кусочно-постоянных функций. Также заданы прямые двусторонние ограничения для компонент вектора управлений. Приведены определения множеств достижимости и управляемости. Показано, что задачи построения этих множеств эквивалентны и могут быть сведены к задаче линейного отображения многомерного куба. Анализируются существующие подходы к решению поставленной задачи. Поскольку они чрезмерно трудоемки, возникает вопрос о создании более эффективного алгоритма. В работе предложен алгоритм построения искомых множеств как системы линейных неравенств. В виде теоремы доказана корректность алгоритма. Оценена сложность представленного подхода. Ключевые слова: управление, оптимальное управление, кусочно-постоянное управление, множество достижимости, множество управляемости, линейное отображение, элиминация Фурье — Моцкина.
1. Введение. Большое внимание привлекает вопрос о достижимости объектом управления желаемого положения за определенное время при допустимом управлении. В задачах управления обычно задается терминальная задача — требование о попадании в определенную точку или множество. Однако заранее неизвестно, является ли терминальная задача выполнимой. В настоящем исследовании будет изучена задача с кусочно-постоянным управлением при заданных двусторонних ограничениях на него. Такая задача была описана Р. Габасовым [1] и решается сведением к задаче линейного программирования с ее последующим решением. Также она может
* Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 19-31-90033).
© Санкт-Петербургский государственный университет, 2021
рассматриваться в контексте позиционной оптимизации: управление перестраивается в режиме реального времени в случае обнаружения отклонений от заданной траектории. В такой постановке данную задачу можно отнести к актуальному классу задач типа «предиктор^корректор» [2-4].
Задача построения множеств достижимости и управляемости была неоднократно рассмотрена как в классических источниках [5-7], так и в более современной литературе [8]. Отличие этой работы — акцент на специальном виде управления: оно выбирается из класса кусочно-постоянных функций, благодаря чему, как будет показано ниже, множества достижимости и управляемости являются выпуклыми многогранниками и описываются системами линейных неравенств.
Несмотря на то, что рассматривается линейная управляемая система, методы решения нелинейных задач зачастую состоят в использовании линеаризованных систем. Поэтому предполагается, что полученные в текущей работе результаты могут быть применены при разработке алгоритмов поиска оптимального управления в нелинейном случае.
2. Постановка задачи. Рассмотрим линейную задачу управления. Предположим, что движение управляемого объекта описывается системой обыкновенных дифференциальных уравнений
x = Ax + Bu + c, (1)
где x = x(t) — n-мерная вектор-функция фазовых переменных; u = u(t) — r-мерная вектор-функция управлений; t — независимая переменная (время); A — матрица пхщ B — матрица n х m; c — n-мерный вектор.
Цель управления — перевод объекта из начального положения в конечное за заранее определенное время T:
x(0) = x*, x(T) = x*. (2)
Пусть управления ui(t) будут выбираться из класса кусочно-постоянных функций с заданным периодом дискретизации h = T/N:
( Ui(t) = щгк, если (к — 1 )h ^ t < kh, . .
\ k = T^N,' i= Т^т. ^ '
При этом на них наложены прямые ограничения:
l*i < ui(t) < l*. (4)
Обычно задача управления дополняется критерием качества, но он не имеет значения при исследовании множеств достижимости и управляемости. Поэтому будем рассматривать задачу управления (1)-(4).
Определимся с тем, что будем понимать под множеством достижимости и множеством управляемости.
Определение 1. Пусть в момент t (0 ^ t < T) управляемый объект находится в состоянии x. Будем называть множеством достижимости xl(t,t,x) задачи (1)-(4) множество всевозможных состояний x(1)(t), где t G (t, T], в которые система (1) может перейти за время t — t при начальном условии x(tt) = x и выборе управления вида (3), удовлетворяющего ограничению (4):
Xl(t,t, x) = {x(1)(t) = x(t) | x(t) = Ax(t) + Bu(t)+ c, x(t) = x, t G \t , t], u(tУдовлетворяет (3), (4)}.
Определение 2. Пусть в момент t (0 <t ^ T) управляемый объект должен попасть в состояние x. Будем называть множеством управляемости X2(t,t,x) задачи (1)—(4) множество всевозможных состояний x(2) (t), где t G [0, t), из которых система (1) может перейти за время t — t в состояние x(t) = x и выборе управления вида (3), удовлетворяющего ограничению (4):
X2(t, i , x) = {x(2)(t) = x(t) | X(t) = Ax(t)+ Bu(t)+ c, x(tt) = x, t G [t, i], u(tУдовлетворяет (3), (4)}.
Цель данной работы заключается в описании этих множеств в удобном для анализа виде.
3. Переход к задаче линейного отображения. Покажем, что задачи построения множеств Xi(t,t, x) и X2(t,t, x) являются эквивалентными и могут быть сведены к задаче линейного отображения выпуклого многогранника.
Выпишем для задачи (1) с начальным условием x(t) = x формулу Коши
х(г) = еА(—) + I е-А(т(Ви(т) + с) ¿т^ (5)
и воспользуемся представлением управления в виде (3).
Среди чисел 1, N найдем к\ такое, что (к\ — 1)к ^ Ь < к\Н. Аналогично получим число к2 таким образом, что либо £ € [0, Т), тогда среди чисел 1, N можем определить к2, для которого (к2 — 1)Н ^ Ь < к2К, либо Ь = Т, тогда положим к2 = N. Зададим последовательность
Ь при к = к1 — 1,
Як = \ кк при к = кък2 — 1, (6)
Ь при к = к2.
Теперь перепишем (5), раскрыв скобки и воспользовавшись представлением управления в виде (3) с учетом (6):
m k2
c(t) = eA(t-tx +
i=1 k=k\
( sk
j eA(t-T\dTU,k I +J eA(t-T)cdT. (7)
\ffc-i ) t
Здесь bi обозначает г-й столбец матрицы B. Произведем замены:
Ul = (ui,ki ,U2,ki,..., Um,ki, Uiiki + l,U2,ki + l, ..., Um,k2 )T ,
Sk
d% = j eA(t-T\dT,
Sk-i
D = (d(l) d(1) d(1) d(1) d(1) d(1)
'1 = id1,ki, d2,ki,..., dm,ki ,d1,ki + 1 ,d2,ki + 1,..., dm,k2 t
(8)
q1 = eA(t-t)x + J eA(t-T W.
e t
Тогда равенство (7) с учетом (8) перепишем следующим образом:
ж = В1и1 + Я!. (9)
Замечание. Вообще говоря, матрица Д1 и вект ор а следовательно, и вектор ж зависят от параметров Ь, £ , х. Более того, выбор Ь и Ь влияет на размер вектора и и количество столбцов вД^ Будем считать их зафиксированными, и для простоты опустим обозначения зависимостей.
Таким образом, получили систему линейных алгебраических уравнений, в которых матрица Д имеет размерность п х г, где г = ш(к2 — к1 + 1). Конечное значение г определяется выбором точек Ь и Ь, например, при Ь = 0 и I = Т имеем г = шЫ.
Введем Ь^ и Ь^1 гак г-мерные векторы, состоящие из к2 — к! + 1 повторений векторов (111,..., 11т)т и (11,..., 1*т)т соответственно.
Тогда прямые ограничения на компоненты вектора и 1 можно переписать так:
Ь!!) < и1 < Ь21). (10)
Как видно, задача построения множества достижимости состоит в нахождении всех векторов х(Ь) таких, что существует вектор и1, компоненты которого удовлетворяют двусторонним ограничениям (10), и выполняется линейное равенство (9).
Немного упростим вид задачи (9), (10). Сделаем замену вектора управлений и вектора фазовых переменных:
(1) + Ь21)
— № + Ь2ф
1,3 т . _
" (Н)
Также введем матрицу Р размера п х г, состоящую из столбцов
где Д1^ — ^'-й столбец матрицы Б1.
В новых переменных (11) задача (9), (10) примет вид
у = Ру,
— (12)
— 1 < Уу < 1, ] = 1, г.
Таким образом, для построения множества достижимости необходимо провести ли-
гп линейного оператора выступает матрица Р размерности п х г.
Аналогичным образом сведем задачу нахождения множества управляемости. Для задачи (1) с конечным условием ) = ж рассмотрим формулу Коши
ж = еА(—)
......-1 -
\
I
Среди чисел 1, N найдем к1 и к2 такие, что (к1 — 1)к ^ Ь < к1к, и либо Ь € [0, Т), тогда существует к2 такое, что (к2 — 1)Н ^ I < к2К, либо Ь = Т, тогда к2 = N.
Зададим последовательность
' ^ при к = к1 — 1,
вк = \ к^ при к = к1, к2 — 1, (14)
. £ при к = к2.
Перепишем (13), раскрыв скобки и воспользовавшись представлением управления в виде (3) с учетом (14):
х(1) = е-Л<{-)х — ^Т.
г=1 к=к1
Введем такие обозначения:
I
I — У ^^ <15'
\sfc-l / t
(16)
и2 = («1к1 ,«2к!, ..., итк1 ,М1к1 + 1, и2к1 + 1, . . ., итк2 )Т ,
Эк
$ = — I е-Л<Т-%<1т,
Эк-1
П = (я<2) й<2) л<2) л<2) т<2) ,(2
^2 = ^"1к1, и2к1, ..., итк1, а1к1 + 1, а2к1 + 1, .. .,ит
г
42 = е-Л<г-)х — ( е-Л<Т-)ес1т.
Тогда равенство (15) с учетом (16) перепишем как
х = ^2^2 + 42. (17)
Равенства (9), (17) имеют одинаковую форму. Тогда с учетом прямых ограничений задачи построения множества достижимости и множества управляемости могут быть сведены к задаче (12). В этом смысле они эквивалентны.
4. Свойства множеств. Здесь и далее будем рассматривать свойства множества достижимости, подразумевая, что они также справедливы и для множества управляемости.
С учетом результатов сведения в п. 3 введем два множества.
Определение 3. Будем называть множеством допустимых управлений множество V = [—1; 1]г, а множеством допустимых состояний — множество ¥ = {у е Мп| Зу е V : у = Ру].
¥
Оно следует из того, что множество V непустое, ограниченное, замкнутое и выпуклое, а линейное отображение сохраняет вышеперечисленные свойства.
Свойство 2. ¥ — выпуклая оболочка точек {р1,... ,р2 ], где рк = Рьк, ук — вершины V.
Множество V, очевидно, является выпуклой оболочкой своих вершин, т. е. Уу е 2Г 2Г 1/ ЗЛЙ, к = Т^: V = £ Хкук, где £ Лй = 1, Лй > 0.
к=1 к=1
Тогда при Уу € Y ЗЛ^
2r 2r 2r
k=i k=i k=i
Следовательно, множество Y — выпуклая оболочка векторов pk = Pvk.
Свойство 3. Y — выпуклый многогранник, вершинами которого является подмножество набора векторов {p1,... ,p2 }, где pk = Pvk, vk — вершины V.
Оно вытекает из свойства 2 и свойств выпуклых оболочек.
Свойство 4. Если у € Y, то и —у € Y.
Если у € Y, то 3v € V : у = Pv. Но и — v € V, а следовательно, P(—v) = —у € Y.
Свойство 5. Множество Y описывается системой неравенств типа —b ^ Ау ^ b.
Это множество является выпуклым многогранником и может быть описано системой линейных неравенств. По свойству 4, если выполняется а^у ^ bi, то это неравенство будет справедливо и для —у : а^—у) ^ b^. Тогда —bi ^ а^у.
5. Обзор алгоритмов. Существует несколько подходов к решению задачи (12). Коротко опишем их ниже.
1. Построение выпуклой оболочки. Как было показано в свойстве 3, многогранник Y есть выпуклая оболочка точек Pvk, где vk — вершины куба V. Однако уже при достаточно небольшой размерности r такой подход выглядит нереализуемым, учитывая вычислительную сложность алгоритмов построения выпуклых оболочек. Так, при r = 100 будет получено 2100 « 1030 вершин куба.
2. Суммы Минковского. Отложим в пространстве R" r отрезков: от точки —p1 до точки p1, от точки — p2 до точки p2 и т. д. Тогда найдем множество Yi как геометрическое место точек, принадлежащих первому отрезку: Y1 = {у € R"| у = yp1, —1 ^ Y ^ 1^. Множество Y2 определим как сумму Минковского множества Y1 и второго отрезка: Y2 = {у1 + у2 € R"| у1 € Y1, у2 = YV2, —1 ^ Y ^ 1}- Продолжим строить
Y
Y = {у1 + у2 € R"| у1 € Yr_1, у2 = yp", —1 < Y < 1} .
К сожалению, и такой подход также имеет экспоненциальную сложность. На первом шаге будет построен отрезок, соединяющий две точки, на втором — многоугольник с четырьмя вершинами, а на последнем — многогранник, который может содержать 2r вершин.
3. Алгоритм Фурье — Моцкина. Более перспективными выглядят алгоритмы, работающие не с вершинами многогранника, а с его гранями. К ним относится метод элиминации Фурье — Моцкина [9]. Его суть заключается в исключении переменных из системы неравенств. Метод итеративно удаляет по одной переменной из неравенств. Тогда, если рассмотреть систему (12) как систему неравенств относительно перемену v r vi
Тем не менее и у такого подхода есть недостаток — при исключении переменных генерируется слишком много избыточных ограничений, и, если не отсеивать их на каждом шаге, в концу алгоритма будет получена система из n ■ 2r неравенств.
Построим более эффективный алгоритм.
6. Основной результат. На первом шаге необходимо удалить лишние (линейно
P
выделим n — rank P компонент вектора у и выразим их через остальные. Таким образом, будет получено n — rank P ограничений типа равенств. В дальнейшем будем
предполагать, что этот этап пройден и в распоряжении имеется матрица Р полного ранга: rank P = n < r. Кроме того, будем подразумевать, что n > 2 (при n = 1 алгоритм построения множества довольно очевиден).
Теперь будем перебирать столбцы матрицы P. Выберем n — 1 линейно независимых столбцов и найдем фундаментальную систему решений относительно вектора-строки a для уравнения
h^1 ,...,pjn-1) =0. (18)
Это однопараметрическое семейство решений. Выберем из него какое-нибудь значение. Например, для единственности решения можно добавить ограничение ||а|| = 1. По сути вектор а является нормальным вектором гиперплоскости в пространстве R", построенной по векторам pj1,... ,pjn-1.
Теперь умножим а на матрицу P и найдем максимум произведения полученного выражения на вектор v G V:
r
в = maxaPv = ^^ \apj \, (19)
j=i
где aP представляет собой r-мерную вектор-строку, содержащую значения проекций вектора а на столбцы матрицы P. Причем по построению проекции па векторы pj1,... ,pjn-1 равны нулю. Поскольку компоненты вектора v изменяются от — 1 до 1 и не зависят друг от друга, то максимальное значение слагаемого apj vj достигается при v = sgn(apj) и равно \apj\.
Введем матрицу А, состоящую из векторов-строк a, построенных для всех наборов линейно независимых (л.н.з.) столбцов pj1 ,...,pjn-1 матрицы P, и вектор b, состоящий из чисел в> соответствующих строкам a. Также введем множество
Y = {y G R"\ — b < Ay < b}.
Теорема, y G Y тогда и только тогда, когда y G Y.
Доказательство. Необходимость. Пусть вектор y G Y. Значит, существует вектор v такой, что y = Pv и v G V. Покажем, что —b ^ Ay ^ b.
Подставляя в это неравенство выражение Pv вместо y, для строки l получим
—в1 < aiPv < в1,
или, что то же,
r r r
— \aipj \ aipjvj \aipj\. j=i j=i j=i
А поскольку Vj G [—1; 1], j = l,r, неравенство, очевидно, выполняется для любого / = 1, к, а значит, у G ¥. Достаточность.
I. Рассмотрим матрицу А, размерность которой к х n, где к — количество различ-n— 1 P
что к ^ n. Поскольку rank P = n, то в матрице P найдется n л.н.з. столбцов. Тогда из них можно составить n наборов по n — 1 л.н.з. столбцов в каждом.
Теперь покажем, что rank А = n. Составим матрицу P из n л.н.з. столбцов матрицы P: Р = (pj1,... ,pjn). По построению в матрпце А найдутся такие n столбцов ah,..., ain, что
акРп = ■ ■ ■ = aiip,i~1 = o,iip3i+1 = ■■■ = ai€pPn =0, г = 1, п.
Составим из этих строк матрицу A. Тогда
/ a.
АР
\
ii Р
0
ah Р
0
j2
0 0
aln РЗП/
Далее предположим, что alipji = 0. Это означает, что aliР = (0 0 ... 0), из чего следует линейная зависимость столбцов матрицы Р, что противоречит условиям. Потому ацр>* ф 0 V» = 1, п. Тогда det(AP) ф 0, следовательно, det(A) ф 0 или, что то же, rank А = п.
Так как матрица А составлена из строк матрицы А, то rank А > п. Но поскольку А содержит п столбцов, то rank А = п.
II. Для доказательства достаточности стоит показать: для любой точки y G Y найдется такая точка v G V, что будет справедливо y = Pv. Для начала докажем это для вершин множества Y.
Выберем такую точку y из пространства R", что выполняется —b < Ау < b. При
п
1) строки alx,..., aln, порождающие эти неравенства, являются л.н.э.; y
ограничений. Не умаляя общности, будем считать, что в равенства переходят верхние ограничения: ацу = ¡Зц, г = 1, п.
При таких условиях точка у будет являться вершиной многогранника Y. Поскольку rankP = rank{P,y} = п, система уравнений Pv = у будет иметь по крайней мере одно решение. Необходимо показать существование решения при v G V.
v
стемы Pv = y, ^^^^^тся помер j^^то \vj* | > 1.
III. Определим вектор v : Pv = y так, чтобы он обладал рядом удобных свойств. Для этого выберем некоторое равенство ali y = /3^. Для удобства обозначим a = ali, в = ви-
P
нальные со строкой а. Пусть число ri обозначает количество ортогональных столбцов. Из свойств строки а и матрицы P следует, что r1 ^ п — 1, но при этом существует по
P
таким образом, что сначала будут идти ортогональные:
apJ
0, j = 1
ар3 ф 0, j = г 1 + 1, г.
Теперь положим, что = sgll(ap:,), ] = + 1, г. В таком случае равенство ау = ¡3 будет выполняться вне зависимости от значений остальных
ay = aPv = apjv j ^^ apj sgn(apj)
j=ri +1
j=i
E
j=ri +1
\apj \ = в.
Далее зададимся вопросом нахождения vi,...,vri. По построению a известно, п— 1 P
а. ^^^^^тательно, rank{p1,... ,pri} = п — 1. Тогда можно выделить п — 1 столбцов,
0
0
как базис этого подпространства, и выразить через них остальные столбцы. Пусть базисными будут столбцы р1 ,...,рп=1:
С1,зР1 + ••• + еп-1,зРп 1 + р3 =0 Далее введем обозначения:
3 = п,Г1.
(20)
А =
( а\1 \
ак-1 ак+1
( Рк — Ег=Г1+1 акр V] \
ь =
ви-1 - £у ви+1 - £г
3=Г1"
-1. а-к-1
-1 ^¿+1р V з
\а1п ) \ - Е^ + 1 а1пР3 ^з /
Тогда имеет место система из п — 1 уравнений с Г1 неизвестными:
А(р1 «1 + ••• + рГ1 %г
ь.
(21)
Будем называть базисными переменными те V которые стоят при столбцах, входящих в базис подпространства, а решение системы (21) базисным, если небазисные переменные равны нулю. Дополнительно обозначим множество индексов базисных переменных символом В, а небазисных — МВ.
Лемма. Если для любого решения системы (21) найдется номер 3* такой, что \vj-t \ > 1, то существуют такие базисно е решение V и ном ер 3', что \г>з> \ > 1 + \3з \-
Доказательство. Для простоты пусть В = {1,...,п — 1^, а тогда МВ = {п, п + 1,..., п}. Введем матрицу Р^ состоящую из столбцов (р1,... ,рп-1).
Поскольку размер матрицы АР1 (п — 1) х (п — 1) и ее ранг равен п — 1, то для заданного базиса система (21) имеет единственное решение. Найдем его и обозначим Vl,... ,Ъп-1.
Докажем лемму методом индукции в зависимости от количества небазисных столбцов.
1. Пусть Г1 = п — 1. По условию леммы существует такое 3*, что \Vj-t \ > 1.
2. Пусть г1 = в, в > п — 1 и существуют базис {1,...,п — 1} и номер 31> что
\ > 1 + Е^=П 3 з\- Необходимо показать, что есть такое базисное решение V и
номер что 3= \ > 1 + Т,земв \с3'з\-
Перепишем (21), подставив базисное решение:
А(р^1 + •••+ рп=^п=1) = ь.
В левой части равенства вычтем и прибавим выражение Ар8 А8, где А8 — некоторый параметр:
A(plVl + • • •+ pn=1Vn=l — р8А3 + р8А3) = ь.
Теперь для вычитаемой части представим р8 в виде линейной комбинации столбцов р1,..., рп-1 согласно (20):
А (р1^ + С1,еАе) + ••• + рп-1^п=1 + Сп=1^А,)+ р8 Ае) = Ь.
Таким образом, получим новое решение системы (21), зависящее от параметра А8: 302 Вестник СПбГУ. Прикладная математика. Информатика... 2021. Т. 17. Вып. 3
О, 3 = п, в - 1,
А8, з =
Будем рассматривать Л3 в пределах от — 1 до 1.
По условию существует номер 31, что \ир1 \ > ¡л, где ¡л = 1 + \ер2р|. Рассмот-
рим, что произойдет с и31 при варьпрованип Л3. Не умаляя общности, предположим, что \ир1 \ возрастет при увеличении Л3, т. е. \ир1 + ер1,3 \ = \ир1 \ +\ер1,3 \. Тогда возможны два варианта:
а) при уменьшении Л3 до — 1 абсолютное значение V j остается больше Следовательно, \ир1 — ер13 \ = \ир1 \ — \ер1,3 \ > 1 + ^3=п 3 р \■ ® таком случае лемма доказана из'' = я;
б) найдется число Л1 в пределах ( — 1, 0^, что \ир1 + Л^р^З = ¡.В этом случае по условию леммы при Л3 = Л1 существует но мер з2, для которого справедливо \ир2 + Л1 ер2,3\ > Тогда посмотрим, в каком направлении изменяется \ир2 \ при стремлении Л3 к — 1. Если \ир2 \ уменьшается, то по аналогии с 31 либо 3' = з'2, либо есть число Л2 ( — 1 < Л"2 < Л1), для которого выполняется равенство \и р2 + Л'2ер2,3\ = ¡л. При этом найдется номер 33 такой, что \ир3 + Л'2ер3,3\ > Продолжая по той же логике, для некоторого номера зк окажется, что \йрк — ерк,3\ > ¡л, следовательно, 3' = зк.
Если же \ир2 \ уменьшении Л^, т.е. \г>р2 — еj2,3\ = \ир2 \ + \ез-2,3\,
то с учетом непрерывной зависимости V р1 ш V j2 от Л3 можно определить небольшое положительное число е, для которого справедлива система
и31
+ (Л1 + Фл ,3 | = \Vjl \ + (Л1 + е)\^1,з \ > л
\ Vj2 + (Л1 + Фз2 ,з\ Тогда умножим второе неравенство на
\Vj2 \ — (Л1 + е)\Ч2А >
и прибавим к первому:
\Vjl \ +
\3 \ > Л 1 +
-31,«
~323
(22)
Теперь необходимо перестроить базис — внести столбец р33 вместо рр2: Вз = В\{32} и {в}, № = МВ и Ш\М-
Для этого нужно найти такое Л3, что V з2 обратится в нуль. Новое базисное решение можно выразить через старое следующим образом:
з е Вз\{в},
-!("> = )__^
и32 1
3 = в,
0, 3 = 3 е МВз.
Также изменится представление небазисных столбцов через базисные:
ез + рр = ^ У е МВ1,
кеБ1
С 4
01
Со
С
Уп--
3 *
С
где
(s)
—c
^32,3 С 1
■32,3 ,
k = s, Vj e NBs\{n},
Ук e Bs\{s}, j = j2, к = s, j = j2.
Cj2,s 1
Cj2,s
Следовательно, необходимо показать: в базисном решении V j существует такой
номер j', что \v
(s) j' \
> 1 + Е
jeNBs
(s) j' ,j
Из выдвинутых ранее предположений известно, что е^ > 0, а 3 < 0. Отсюда можно сделать вывод, что 2^ < 0, а потому | =
Vji\ +
j2
. Используя (22), получим неравенство
> 1 +
1,8
j2 ,s
или в других обозначениях:
\vj(S) \ > 1 +
(s)
+ Ё |cjl)j
j=n
Е
jeNBs
s — 1 +Ё
(s)
1,8
-32,3
j2 ,s
j ' = j1
доказательству основной теоремы. □
Для простоты определим базисными переменными Vi,..., Vn—i. Также положим j' = 1, a cj' j переобозначим как j Тогда можем доопределить вектор V:
Г > 1 + Е^1„ Ы,
\ vj =0, j = щЩ.
IV. Покажем, что среди строк матрицы A существует строка a* такая, что
1) a*p2 = a*p3 = ■ ■ ■ = a*pn—1 = 0;
2) sgn(aV) = sgn(wi); _
3) (a*pP)(apP) > 0 Vj = l,r.
Известно, что rank{p1 ,p2 ,...,pn—1} = n — 1. Поскольку rankP = n, то в этой матрице найдется такой столбец ps, что rank{p1 ,p2,... ,pn—1,ps} = n, а тогда rank{p2,... ,pn—1,ps} = n — 1.
По построению в матрице A существует такая строка а, что ap2 = ap3 = ■ ■ ■ = apn—1 = aps = 0, но ap1 = 0.
Благодаря тому, что неравенства —в\ ^ aiy ^ в инвариантны относительно нуля, в матрице A можно заменить строку at строкой —at. Следовательно, можно добиться выполнения ap1V 1 > 0.
a
пиям 1 и 2. Выполнение требования 3 покажем по индукции.
База. Для j = 1, п — 1 выполняется очевидно, поскольку ар3 = 0. Шаг индукции. Пусть (ар>)(ар>) > 0 для j = l,k— 1, но (apk)(apk) < 0. Тогда существуют два неотрицательных числа 71 и 72, для которых справедливо
C
J1
C
j=n
71арк + = 0. Введем строку а* = 71а + 72а, в этом случае а*рк = 0. Посколь-
ку а ортогональна с векторами р1 ,р2 ,...,рп~\ а, в свою очередь, а ортогональна с векторами р2,... ,рп~1,р8, то справедливо
а*р3 = (а + а)р3 =0 У] = 2, п — 1.
При этом а*р1Ь 1 = ар1!! 1 > 0. Это означат, что строка а* удовлетворяет требованиям
1 и 2. _
Кроме того, при V? = 1, к
(а*р3)(ар3) = (71 ар3 + 72ар3)(ар3) = 71(ар3)(ар3) + 72(ар3)(ар3) ^ 0.
Осталось показать, что а* входит в матрицу А В матрице А существует строка а1, построенная как решение системы из п — 1 уравнений:
ар = ••• = агр"-1 = ар = 0.
Поскольку решение данной системы представляет собой однопараметрическое семейство и а* является ее решением, то а; и а* совпадают с точностью до множителя. Так как множитель не влияет на выполнение свойств (и строку всегда можно умножить на —1), можно говорить о том, что а* есть строка матрицы А.
а*
трем требованиям.
V. Найдем в* = т&х.Ь£у(а* Рь). Ранее было определено, как небазисные столбцы выражаются через базисные (20). Воспользуемся тем фактом, что а*р3 = 0 для ] = 2,п — 1. Умножив равенства (20) на а* слева, получим равенства
а*р3 = —с^а*р1 V? = п,г\.
Тогда
Г1 г
в* = а*р1 sgn (а*р51) + ^^ (—3а*р1) sgn (—03а*р51) + ^^ \а,*р3 | =
3=п 3=Г1 + 1
Г1 \ г
|а*р1||1^ ¡03¡) + Е 1а*р I .
3=п ) 3=Г1 + 1
Теперь найдем значение а*РЪ. Поскольку а*р3 =0, ] = 2, п — 1, = 0, 3 = п, и = sgll(ap3), ] = Г1 + 1, г, получим выражение
а*РЬ = а*р1%1 + ^^ а*р3 sgn(аp3).
3=Г1 +1
Поскольку (а*р3)(ар3) > 0, то sgn(a*р3) = sgrí(ap3). Учитывая а*Рь1 > 0, найдем, что
г
а*РЬ = |а*р1| ¡ь1| + ^ 1а*р3 | .
3=Г1 + 1
Наконец, оценим выражение а*РV — в*'-
а*РV — в* = ^а*р1^ ^|! 11 — 1 — ^ ¡с3 ¡^ > 0. Вестник СПбГУ. Прикладная математика. Информатика... 2021. Т. 17. Вып. 3 305
Следовательно, a*PV > в*, а так как y = PV, то a*y > в*. Таким образом, показано противоречие: уф Y. Значит, сущест вует V такое, что y = PV и V e V.
VI. Было показано, что вершины многогранника Y принадлежат множеству Y, обозначим их y1,...,yh.
Известно, что многогранник может быть описан, как выпуклая оболочка своих вершин, i.e. y e Y тогда и только тогда, когда y = £h=1 \iyl,тдр, £h=1 Xi = 1,Xi ^ 0. Так как yi e Y, то существует вектор Vi e V, для которого yi = PVi. Зпачит, y =
Eh=1 Xiyi = т: h=1 XiPV = PV. V
щих ему, входит в его состав. Следовательно, V = £h=1 V1 e V, поэтому y e Y. В результате показано, что если у G ¥, то у G ¥. □
7. Анализ алгоритма. В итоге алгоритм построения множества достижимости задачи (12) состоит из следующих фаз:
1) исключение линейно-зависимых уравнений из системы y = Pv. Для этого
n— n1
y rank P = n1
2) составление матрицы A го строк a (18) и вектора b го чисел в (19)- Максимально возможное количество строк в матрице A — число сочетаний Cn1 ■ Найти строки a можно как решение системы (18) или как обобщение векторного произведения на ^-мерное пространство. Например, для трехмерного пространства строку a
pj1 pj2
j1 j2 г PI pj2 j1 j2 j p2 P2
к pj31 P32
Таким образом, Crn1 n1
8. Заключение. В работе был предложен алгоритм построения множеств достижимости и управляемости для линейной задачи управления с двусторонними ограничениями. Алгоритм состоит в переходе от задачи (1)-(4) к системе (12), построении
y
x(t). В результате будет найдено множество достижимости (управляемости), заданное системой линейных ограничений.
Кроме непосредственного использования этих множеств, существуют еще два полезных применения:
• в задаче управления с внешним возмущением, которое может вносить существенные коррективы в движение управляемого объекта, а управление в связи с этим периодически перестраивается в режиме реального времени [10], может быть полезно при каждом перестроении оценивать, является ли желаемое положение системы достижимым;
• нелинейные задачи управления могут решаться с помощью линеаризаций системы. Так, в работе [11] описывается алгоритм построения управления для нелинейной системы, состоящий в последовательной линеаризации системы и построении управления уже для линейной системы. Однако из-за неточности линеаризаций в какой-то момент может оказаться, что желаемое финальное состояние недостижимо. Вероятность возникновения этой проблемы можно минимизировать, если на каждом шаге оценивать, как далеко финальное состояние находится от границы множества достижимости.
Литература
1. Балашевич П. В., Габасов Р., Кириллова Ф. М. Численные методы программной и позиционной оптимизации линейных систем управления // Журн. вычпсл. математики и мат. физики. 2000. Т. 40. № 6. С. 838-859.
2. Rowlings J. В., Маупе D. Q. Model predictive control: Theory & design. Madison, WI: Nob Hill Publishing, 2009. 533 p.
3. Grüne L., Pannek J. Nonlinear model predictive control: Theory and algorithms. 2nd ed. Cham: Springer International Publishing. Communication and Control Engineering, 2017. 473 p.
4. Пономарев A.A. Построение субоптимального управления в регуляторе «предиктор — корректор» // Вестник Санкт-Петербургского университета. Сер. 10. Прикладная математика. Информатика. Процессы управления. 2014. Вып. 3. С. 141—153.
5. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.
6. Формальский A.M. Управляемость и устойчивость систем с ограниченными ресурсами. М.: Наука, 1974. 368 с.
7. Черноусько Ф. Л. Оценивание фазовых состояний динамических систем. Метод эллипсоидов. М.: Наука, 1988. 319 с.
8. Ekimov А. V., Balykina Yu. Е., Svirkin М. V. On the estimation of the attainability set of nonlinear control systems // AIP Conference Proceedings. 2015. P. 1648. N 450008.
9. Dantzig G. В., Eaves В. C. Fourier — Motzkin elimination and its dual //J. Combinatorial Theory. Series A 14. 1973. P. 288-297.
10. Popkov A.S. Application of the adaptive method for optimal stabilization of a nonlinear object // 2016 International Conference "Stability and Oscillations of Nonlinear Control Systems" (Pyatnitskiy's Conference). 2016. P. 1-3.
11. Popkov A.S., Smirnov N. V., Smirnova Т.Е. On modification of the positional optimization method for a class of nonlinear systems // ACM International Conference. Proceeding Series. 2018. P. 46-51.
Статья поступила в редакцию 11 мая 2021 г. Статья принята к печати 4 июня 2021 г.
Контактная информация:
Попков Александр Сергеевич — аспирант; [email protected]
Construction of reachability and controllability sets in a special linear control problem*
A. S. Popkov
St. Petersburg State University, 7-9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation
For citation: Popkov A. S. Construction of reachability and controllability sets in a special linear control problem. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2021, vol. 17, iss. 3, pp. 294-308. https://doi.org/10.21638/11701/spbul0.2021.307 (In Russian)
The article considers the problem of constructing reachability and controllability sets for a control problem. The motion of an object is described by a linear system of ordinary differential equations, and control is selected from the class of piecewise-constant functions. Straight boundaries are also set on the controls. The article provides definitions of reachability and controllability sets. It is shown that the problems of constructing these sets are equivalent and can be reduced to the problem of linear mapping of a multidimensional cube. The properties of these sets are also given. In addition, the existing approaches to solving the problem are analyzed. Since they are all too computationally complex, the question of creating a more efficient algorithm arises. The work proposes an algorithm for constructing
* This work was supported by the Russian Foundation for Basic Research (project N 19-31-90033). Вестник СПбГУ. Прикладная математика. Информатика... 2021. Т. 17. Вып. 3 307
the required sets as a system of linear inequalities. A proof of the theorem showing the correctness of the algorithm is provided. The complexity of the presented approach is estimated.
Keywords: control, optimal control, piecewise-constant control, reachability set, controllability
set, linear mapping, Fourier—Motzkin elimination.
References
1. Balashevich N.V., Gabasov R., Kirillova F. M. Chislennye metody programmnoy i pozitsionnoy optimizatsii lineynyh sistem upravleniya [Numerical methods of program and positional optimization of linear control systems]. Journal of Computational Mathematics and Mathematical Physics, 2000, vol. 40, no. 6, pp. 838-859. (In Russian)
2. Rawlings J.B., Mayne D. Q. Model predictive control: Theory & design. Madison, WI, Nob Hill Publishing, 2009, 533 p.
3. Grüne L., Pannek J. Nonlinear model predictive control: Theory and algorithms. 2nd ed. Cham, Springer International Publishing, Communication and Control Engineering, 2017, 473 p.
4. Ponomarev A.A. Postroenie suboptimalnogo upravleniya v regulyatore "prediktor^korrektor" [Suboptimal control construction for the model predictive controller]. Vestnik of Saint Petersburg University. Series 10. Applied Mathematics. Computer Sciences. Control Processes, 2014, iss. 3, pp. 141-153. (In Russian)
5. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishechenko E. F. Matematicheskaya teoriya optimal'nykh protsessov [The mathematical theory of optimal processes]. Moscow, Nauka Publ., 1969, 384 p. (In Russian)
6. Formalskii A.M. Upravlyaemost' i ustoychivost' sistem, s ogranichennymi resursami [Controllability and stability of systems with restricted control resources]. Moscow, Nauka Publ., 1974, 368 p. (In Russian)
7. Chernousko F. L. Ocenivanie fazovyh sostojanij dinamicheskih sistem,. Metod jellipsoidov [Estimation of phase states of dynamical systems. Ellipsoid method]. Moscow, Nauka Publ., 1988, 319 p. (In Russian)
8. Ekimov A. V., Balykina Yu. E., Svirkin M. V. On the estimation of the attainability set of nonlinear control systems. AIP Conference Proceedings, 2015, p. 1648, no. 450008.
9. Dantzig G.B., Eaves B.C. Fourier — Motzkin elimination and its dual. J. Combinatorial Theory. Series A H, 1973, pp. 288-297.
10. Popkov A. S. Application of the adaptive method for optimal stabilization of a nonlinear object. 2016 International Conference "Stability and Oscillations of Nonlinear Control Systems" (Pyatnitskiy's Conference), 2016, pp. 1-3.
11. Popkov A. S., Smirnov N.V., Smirnova T.E. On modification of the positional optimization method for a class of nonlinear systems. ACM International Conference. Proceeding Series, 2018, pp. 46-51.
Received: May 11, 2021.
Accepted: June 04, 2021.
Author's information:
Alexander S. Popkov — Postgraduate Student; [email protected]