Научная статья УДК 517.977
Б01: 10.18101/2304-5728-2022-2-50-61
УСЛОВИЯ И МЕТОДЫ УЛУЧШЕНИЯ УПРАВЛЕНИЙ В НЕЛИНЕЙНЫХ СИСТЕМАХ С ОГРАНИЧЕНИЯМИ
© Трунин Дмитрий Олегович
кандидат физико-математических наук, доцент, Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а [email protected]
Аннотация. В нелинейных по состоянию задачах оптимального управления с ограничениями предлагается новый подход к улучшению допустимых управлений. Модификация сопряженной системы как системы дифференциально-алгебраических уравнений позволяет построить точные формулы приращения функционала, которые являются основой для конструирования соответствующих процедур улучшения управления, имеющих нелокальный характер. Задача улучшения допустимого управления представляется в форме системы функциональных уравнений, для решения которой модифицируется известный в математике аппарат неподвижных точек. Рассматриваемый подход свободен от трудоемкой операции параметрического варьирования для улучшения управления, характерной для градиентных методов. Кроме того, начальное приближение итерационных процессов может не быть допустимым управлением, что приводит к повышению эффективности разработанных процедур улучшения. Приводятся результаты численных расчетов модельной задачи из механики космических аппаратов, иллюстрирующие эффективность предлагаемых методов построения релаксационных последовательностей управлений.
Ключевые слова: оптимальное управление, нелинейная по состоянию задача, ограничения, улучшение управления, итерационный алгоритм.
Для цитирования
Трунин Д. О. Условия и методы улучшения управлений в нелинейных системах с ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2022. №2 2. С. 50-61.
Введение
Наиболее трудоемкой в стандартных методах оптимального управления является процедура варьирования управления в малой окрестности текущего приближения на каждой итерации для улучшения текущего управления. Освободиться от этой операции можно, если в данной задаче возможно построение точных формул приращения функционала, не содержащих остаточных членов разложений. Такие формулы служат основой для построения нелокальных методов улучшения управлений.
Такие формулы получены в [1] для линейных по состоянию задач оптимального управления со свободным правым концом. Улучшение достигается за счет решения двух специальных задач Коши.
В [2] методы [1] были обобщены для полиномиальных по состоянию задач оптимального управления со свободным правым концом с помощью специального представления сопряженных переменных. В этом случае улучшение управления достигается за счет решения специальной краевой задачи.
В [3; 4] методы [2] модифицируются для нелинейных по состоянию задач оптимального управления со свободным правым концом за счет представления сопряженной системы как системы дифференциально-алгебраических уравнений. В данной статье подход [3; 4] применяется для оптимизации нелинейных систем с ограничениями.
1 Постановка задачи
Рассмотрим задачу
x = f (x,u,t), t e T = [t0, ti ], (1)
x(t0) = x0, (2)
u(t) e U с Rr, t eT, (3)
F0(u) = j(x(t1)) +J F(x,u, t)dt ® min, (4)
Fi(u) = c( x(t1) ) = 0. (5)
В задаче (1)-(5) x = ( x1(t), x2(t),..., xn (t)) — фазовое состояние, u = (u1(t),u2(t),...,ur(t)) — управляющее воздействие. Начальное состояние x0 e Rn задано. Функции f (x,u, t) и F(x,u, t) нелинейны и дифференцируемы по x, непрерывны по (u, t) на Rn х U х T; функции j(x) и c(x) нелинейны и дифференцируемы по x на Rn; U с Rr — замкнутое и ограниченное множество в Rr; значения t0, t1 заданы.
Введем множество доступных управлений
V = {u e PCr (T): u (t) eU, t e T }.
Для функции ve V обозначим x(t,v), t eT — решение задачи Коши (1), (2) при u = v(t), t e T .
Определим множество допустимых управлений W = {u eV: c( x(t^ u) ) = 0}.
Определим функцию Понтрягина
H(p, x,u, t) = (p, f (x,u, t)) - F(x,u, t) .
Введем регулярный функционал Лагранжа
L(u,1) = F0(u) + 1Ф1 (u), le R.
Отметим, что если u eW , то
Ь(и,1) = Ф0(и)
(для допустимого управления функционал Лагранжа совпадает с целевым функционалом).
Введем обозначения: ДуН(р, х,и,^ = И(р, х,V, ^ - Н(р, х,и, ^ (частное приращение функции Понтрягина по управлению), ДуЬ(и, 1) = Ь^, 1) -Ь(и, 1) (приращение функционала Лагранжа).
Пусть (и0,V) — доступные управления. Имеют место следующие точные формулы приращения функционала Лагранжа [3]
ДМи0,1) = -{г Д^И(р^,и0,V, 1),х(1,V),и°(0,I)Ж , (6)
ДуЬ(и°,1) = -|г ДV()Н(р(г,V,и°,Л),х(1,и0),и°(0,^Ж . (7)
где р^,и0,VI), t е Т — решение модифицированной дифференциально-алгебраической сопряженной системы.
р = -Нх (р,x(t,и0),и0(t),t)-г(0, (8)
И (р,х^,и0),и0(t),t),х^,V) -х^,и0)) + (г(t),х^,V) -х^,и0)) =
= И ( р, х^, V), и), t)-И (р, х^, и0), и 0(t), t),
р(О = Р (x(tl,и0)) - 1Хх (x(tl,и0)) - д, (10)
Р (x(tl,и0)) + 1%х (x(tl,и0)),x(tl,V) - х(^,и0)\ + (д,х(tl, V) - х(^,и0)\ =
4 ' (11)
= р( x(tl, V))-р( x(tl, и0) ) + 1(с( x(tl, V) )-с( x(tl, и0))).
Отличительной особенностью модифицированной сопряженной задачи (8)—(11) является наличие соотношений (9) и (11), определяющих вспомогательные величины г{(), д. В общем случае соотношения (9), (11) можно разрешить относительно этих вспомогательных величин и свести задачу к обычной задаче Коши. Отметим, что в общем случае величины г(0, д определяются неоднозначно.
Укажем возможный вид вспомогательных величин г(0, д для отдельных подклассов задач.
Если все функции /, р, с линейны по х (линейная по состоянию задача), нетрудно видеть, что
° 0, д = 0.
В частности, если функции /, р, с квадратичны по х, величины г(^, д могут быть представлены следующими соотношениями
г(0 =1 Их (р,х^,и0),и),t)(х^,V) - х^,и0)),
2
д = 2(Рхх (х^1,и0)) + С (х(^,и0)))(x(tl,V) -х(tl,и0)) .
Таким образом, предлагаемый подход обобщает результаты для поли -номиальных задач оптимального управления на общий нелинейный случай.
Пусть и0 еЖ . Поставим следующую задачу (задача улучшения): найти управление V еЖ такое, что
Ф(у) <Ф(и0) (Д„Ф(и0) < 0).
Поскольку и0 еЖ и V еЖ, эту задачу можно переписать в терминах функционала Лагранжа:
найти управление VеЖи число Л е Я такие, что
ДуЬ(и0,Л) < 0.
2 Подход улучшения
К решению задачи улучшения допустимого управления применим подход, основанный на применении операции проектирования.
Дополнительно предположим, что задача (1)-(5) линейна по управлению и и — выпуклое множество
/(х,и,г) = А(х,г)и + Ь(х,г), ^(х,и,г) = (Ж(х,г),и) + g(х,г).
Тогда функция Понтрягина с сопряженной переменной р е Яп примет вид:
Н (р, х, и, г) = Н о (р, х, г) + (Н (р, х, г), и), где Н о( р, х, г) = ( р, Ь( х, 0) - g (х, г), НДр, х, г) = А(х, г )т р - й (х, г).
В данном подклассе задач формулы приращения (6), (7) принимают соответственно вид:
\Ь(и 0,Л) = -\т{Н1(р(г, и0, V, Л), х(г, V), г), v(t) - и0(0) Ж, (12)
АуЬ(и0, Л) = -\т(Н1(р(г,V,и0, Л), х(г,и0),г), v(t) - и°(0)Ж. (13)
Пусть а > 0 — фиксированный параметр (параметр проектирования). Образуем вспомогательную вектор-функцию
иа(р,х,г) = Ри (и °(0 +аН1(р, х,г)), р е Яп, х е Яп, а> 0, г еТ,
где Ри — оператор проектирования на множество и в евклидовой норме.
Будем полагать, что множество и имеет простую структуру (параллелепипед, шар) и задача проектирования на множество и допускает аналитическое решение.
Имеет место оценка [1]
Г (Н1(р, х, г), иа(р, х, г) - и 0(о) Ж > — Г ||иа(р, х, г) - и °(0||2 Ж . (14)
'ат" 11
Тогда из (12), (13) и (14) следует оценка приращения функционала
Д/(и0,Л) <- — Г ||иа(р, х,г) - и°(0||2 Ж. (15)
ат" 11
Рассмотрим формулу приращения (12). Тогда нетрудно видеть, что улучшающее управление V является решением следующей системы v(t) = иа(р^,и0^,Л),х(^)Л t е Т, 1е Я,
/ ч (16)
с( x(tl, V) ) = 0.
Действительно, пусть управление V является решением системы (16). В силу второго равенства в системе (16) легко можно видеть, что V еЖ. Таким образом, на управлениях и0, V функционал Лагранжа совпадает с целевым функционалом. Тогда в силу оценки (15) имеет место улучшение целевого функционала Ф0 с оценкой
ДvФс(и°) < — |>(0 - и°(0|2 Л . (17)
а Т11 11
Для решения системы (16) при фиксированном а> 0 предлагается следующая модификация известного [5] метода простой итерации в неявной форме при к > 0
vk+1(t) = иа(р^,и0,vk,1),хЦ,vk+1),t), t е Т, 1е Я,
с( x(tl, vk+1) ) = 0. (18)
Начальное приближение процесса (18) — произвольное управление V0 е V (которое может не быть допустимым управлением). Главной особенностью предлагаемого итерационного алгоритма является выбор параметра 1 е Я на каждой итерации при к > 1 для удовлетворения терминального ограничения. Предполагается, что такая возможность существует.
Приведем подробное описание итерацонного процесса (18).
Найдем решение р1^), t е Т задачи (8)—(11) при V = Vк ^).
Пусть х1^), t е Т решение специальной задачи Коши: х = f (х,иа(рд(0,х,0,t), t еТ, x(t0) = х0.
Найдем значение множителя Лагранжа 1 е Я из условия
с(хд(0) = 0. (19)
Cформируем управление
vk+1(t) = иа( р1«), x1(t), t), t е Т .
Замечание 1
К решению задачи (16) может также применяться следующая явная схема
vk) = иа(р^,и0, vk,1),х^, vk), t), t е Т, 1е Я,
Х( x(tl, vk+1) ) = 0. (20)
Для этой модификации на каждой итерации процесса (20) после вычисления решения рЛ(г), г е т задачи (8)-(11) при V = Vк (г) формируется вспомогательное управление
vЛ(t) = иа(рЛ(г), х(г, Vк), г), г ет.
Для вспомогательного управления V1 находится решение х(г, V1), г е т стандартной задачи Коши
х = /(х,Vл(t),г), г е т, х(0 = х0.
Значение множителя Лагранжа Л е Я находится из условия
Х( х(Ц, vЛ) ) = 0. (21)
Для полученного решения Ле Я уравнения (21) определяется следующее приближение управления
Vk+1(г) = Vl(t), г ет.
Аналогично конструируются итерационные процессы решения задачи о неподвижной точке на основе формулы приращения (13).
Сходимость процессов (18), (20) регулируется выбором параметра проектирования а > 0 и может быть обоснована на основе метода возму-щений и принципа сжимающих отображений аналогично [2] для достаточно малых а > 0 .
Замечание 2
В задаче (1)-(5) введем в рассмотрение отображение (Н-максимизирующее отображение)
и(р,х,г) = а^шахН (р,х^,г), р е Яп, х е Яп, г ет .
уеи
Тогда на основе формул приращения (6), (7) улучшающее управление
V является решением соответственно систем функциональных уравнений
V(t) = и'(р(г, и0, V, Л), х(г, V), г), г е т, Ле Я, с( х^, V) ) = 0.
V(t) = и'(р(г, V, и0, Л), х(г, и0), г), г е т, Ле Я, с( х^, V) ) = 0.
Для решения систем (22), (23) можно использовать явные и неявные итерационные процессы, аналогичные процессам (18), (20).
3 Пример
Приведены результаты расчетов модельной задачи стабилизации вращения спутника [6] с помощью предлагаемого метода нелокального улучшения (16) на основе неявного итерационного процесса (18). Проводится сравнительный анализ эффективности указанного метода (М3) со стандартными методами условного градиента (М1) и проекции градиента (М2) [7].
Параметр a > 0, регулирующий сходимость предлагаемого метода (М3), выбирался экспериментально с точностью до порядка. Начальное значение a — 1.
Решение задач Коши осуществлялось с помощью процедуры divprk, а решение вспомогательного алгебраического уравнения — процедуры dumpol библиотеки IMSL языка Фортран [8].
Для численного решения задача [6] приводилась к форме
x = 1 x2x3 + 100u^ t е T = [0, 0.1],
x 2 — x x з l '^2 5 'u 2,
x3 — - x1 x2 + 100u3,
x1(0) — 200, x2(0) — 30, x3(0) — 40,
u1(t) е [-40, 40], u2(t) е [-20, 20], u3(t) е [-40, 40], t е T,
F0(u) — 1 (x22(0.1) + x32(0.1)) ® min, F1(u) — x1(0.1) — 0.
Уравнения системы описывают динамику вращения спутника, снабженного тремя реактивными двигателями. Управления характеризуют расход топлива. Минимизируемый функционал от управления отражает цель достижения состояния, характеризующегося отсутствием вращения спутника (стабилизация).
Начальное приближение u0(t) ° 0, t еT (во всех методах).
Критерий остановки
\F0(uk+1)-Ф 0(uk )| < M ф 0(uk )|,
где k — номер итерации, M —10-5.
Результаты расчетов представлены в таблице.
Таблица
Метод Ф0 ф* N
М1 3.16428 х 10-13 2.45074 х10-7 8512 0.5
М2 1.48471х 10-13 3.13041 х 10-7 2642 0.5
М3 3.63122 х 10-13 5.229144 х 10-8 1458 10-5
В таблице Ф0 — расчетное значение целевого функционала, Ф* — абсолютная величина расчетного значения ограничения, N — суммарное количество расчетных задач Коши. В последнем столбце приведены для методов М1 и М2 значения параметра штрафа, для метода М3 — значение проекционного параметра а , обеспечивающего сходимость итерационного процесса (18).
На рисунках 1-6 представлены графики полученных управлений и соответствующих фазовых траекторий (рис. 1, 2 — М1, рис. 3, 4 — М2,
рис. 5, 6 — МЗ).
ш-
32 -24 ■ 1680 ■ -5 --16-21-■32 -40 ■
I 1 I 1 I 1 I 1 I 1 I 1 I 1 I 1 I 1 I 1 I О ДО 0Л1 ПЛ2 ОЛЗ ОДА 0Л5 П.ПВ О.ОТ 0.08 О.М й.Ю
Рис. 1
Рис. 2
Рис. 3
ОНО П.П1 0П2 0Ш 0.0* 0.05 0.05 ОН? 0.03 ПШ 0.10
Рис. 4
ш-
3224.16" 3-8 --16-24-32-Чй-
0.00 0.01 0.02 0.0(3 0.04 0.05 0.06 0.07 0.03 0.09 0.10
Рис. 5
Рис. 6
Расчеты показывают, что предложенная процедура нелокального улучшения обеспечивает более точное выполнение терминального ограничения при меньшей трудоемкости.
Заключение
Предлагаемый метод свободен от операции варьирования управления и позволяет строить итерационный процесс с выполнением ограничений на каждой итерации.
Отсутствие операции варьирования управлений позволяет существенно снизить трудоемкость предлагаемого подхода по сравнению со стандартными методами.
Выполнение ограничения на каждой итерации дает возможность эффективно решать задачи улучшения допустимых управлений в отличие от стандартных методов штрафов, которые в общем случае не позволяют строить итерационный процесс на множестве допустимых управлений в задачах с ограничениями. Свойство допустимости управлений предлагаемого метода дает возможность эффективно получать приемлемые на практике управления по критерию оптимальности.
Литература
1. Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.
2. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с. Текст: непосредственный.
3. Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. Сер. Математика. 2009. Т. 2, № 1. С. 94-106. Текст: непосредственный.
4. Булдаев А. С. Методы неподвижных точек на основе операции проектирования в задачах оптимизации управляющих функций и параметров // Вестник Бурятского государственного университета. Математика, информатика. 2017. № 1. С. 38-54. Текст: непосредственный.
5. Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.
6. Тятюшкин А. И. Численные методы и программные средства оптимизации управляемых систем. Новосибирск: Наука, 1992. 192 с. Текст: непосредственный.
7. Васильев О. В. Лекции по методам оптимизации. Иркутск: Изд-во Иркут. гос. ун-та, 1994. 340 с. Текст: непосредственный.
8. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека 1М8Ь. Москва: Диалог-МИФИ, 2001. Ч. 2. 320 с. Текст: непосредственный.
Статья поступила в редакцию 27.05.2022; одобрена после рецензирования 15.06.2022; принята к публикации 08.09.2022.
CONDITIONS AND METHODS FOR IMPROVING CONTROL
IN NONLINEAR SYSTEMS WITH CONSTRAINTS
Dmitry O. Trunin
Cand. Sci. (Phys. and Math.), A/Prof.,
Dorzhi Banzarov Buryat State University
24a Smolina St., Ulan-Ude 670000, Russia
Abstract. In nonlinear on a state optimal control problems with constraints, a new approach to improving admissible controls is proposed. Modification of the conjugate system as a system of differential-algebraic equations allows to construct exact formulas for the increment of the functional, which are the basis for constructing the corresponding procedures for improving control, which are of a nonlocal nature. The problem of admissible control improvement is presented in the form of a system of functional equations, for the solution of which the apparatus of fixed points known in mathematics is modified. The approach under consideration is free from the laborious operation of parametric variation to improve control, which is typical for gradient methods. In addition, the initial approximation of iterative processes may not be an admissible control, which leads to an increase in the efficiency of the developed improvement procedures. The results of numerical calculations of a model problem from spacecraft mechanics are presented, illustrating the effectiveness of the proposed methods for constructing relaxation control sequences.
Keywords: optimal control, nonlinear on a state problem, constraints, control improvement, iterative algorithm.
For citation
Trunin D. O. Conditions and Methods for Improving Control in Nonlinear Systems With Constraints // Bulletin of Buryat State University. Mathematics, Informatics. 2022. N. 2. P. 50-61.
The article was submitted 27.05.2022; approved after reviewing 15.06.2022; accepted for publication 08.09.2022.