НАУЧНО-ТЕХНИЧЕСКИЙ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ _
Ф март-апрель2023 Том 23 №2 http://ntv.ifmo.ru/ научно-технический вестник
I/ITMO SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ. МЕХАНИКИ И ОПТИКИ
March-April 2023 Vol. 23 No 2 http://ntv.ifmo.ru/en/
ISSN 2226-1494 (print) ISSN 2500-0373 (online)
АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ И РОБОТОТЕХНИКА AUTOMATIC CONTROL AND ROBOTICS
doi: 10.17586/2226-1494-2023-23-2-252-262 УДК 62.50
Вариационная задача адаптивного оптимального управления. Теоретический и прикладной компьютерный анализ
Алексей Алексеевич Ведяков1, Екатерина Воиславовна Милованович2, Ольга Валерьевна Слита3®, Владимир Юрьевич Тертычный-Даури4
1,2,3,4 Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация
2 Санкт-Петербургский государственный химико-фармацевтический университет Министерства здравоохранения Российской Федерации, Санкт-Петербург, 197376, Российская Федерация
1 [email protected], https://orcid.org/0000-0003-4336-1220
2 [email protected], https://orcid.org/0000-0002-9069-8574
3 [email protected]®, https://orcid.org/0000-0001-7119-3629
4 [email protected], https://orcid.org/0000-0003-4671-7659
Аннотация
Предмет исследования. Рассмотрена задача адаптивного оптимального управления динамической системой, относящейся к классу условных вариационных задач с подвижными границами. Проведено вариационное и компьютерное исследования управляемого адаптивного движения материальной точки в задаче минимизации энергетического функционала качества с подвижной, заранее незаданной правой трансграницей. А также в случае, когда масса точки меняется в зависимости от нефиксированного конечного момента времени. Метод. Задача решена с использованием схем и процедур классического вариационного исчисления. Процедуры включают вывод вариации вспомогательного функционала качества, соответствующих уравнений Эйлера и адаптивного алгоритма оценивания. При решении общей условной вариационной задачи исследована полученная замкнутая система дифференциальных уравнений для формирования адаптивной оптимальной системы управления динамическим объектом с заданным функционалом качества. Основные результаты. Результаты безусловной постановки задачи обобщены на случай дополнительных дифференциальных (неголономных) и голономных связей. В вариационной адаптивной задаче оптимального управления условие трансверсальности сформулировано в терминах условия локального программирования. Достигнутые результаты имеют отношение к полученным конкретным уравнениям, выражениям и формулам относительно изучаемого модельного примера. Получены графики основных функций времени, определяющие характер движения объекта управления и качество переходных процессов. Практическая значимость. Разработанная вариационная схема адаптивного оптимального синтеза может быть использована при расчете и проектировании управляемых динамических систем. Построенная оптимизационная схема перспективна, в том числе для применения в системах, у которых время функционирования заранее не фиксировано. Предложенные алгоритмы адаптивного оптимального управления для целенаправленного движения изучаемой материальной точки успешно прошли тестирование в цифровом режиме и показали свою эффективность. Сделан вывод, что алгоритмы являются перспективными для дальнейшего использования в более сложных нелинейных адаптивных системах динамического оптимального регулирования. Ключевые слова
подвижная граница, материальная точка, условный функционал качества, оптимальное управление, вариация функционала, условие трансверсальности
Ссылка для цитирования: Ведяков А.А., Милованович Е.В., Слита О.В., Тертычный-Даури В.Ю. Вариационная задача адаптивного оптимального управления. Теоретический и прикладной компьютерный анализ // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23, № 2. С. 252-262. doi: 10.17586/2226-1494-2023-23-2-252-262
© Ведяков А.А., Милованович Е.В., Слита О.В., Тертычный-Даури В.Ю., 2023
Variational problem of adaptive optimal control.
Theoretical and applied computer analysis
Alexey A. Vedyakov1, Ekaterina V. Milovanovich2, Olga V. Slita3H, Vladimir Yu. Tertychny-Dauri4
1,2,3,4 ITMO University, Saint Petersburg, 197101, Russian Federation
2 Saint Petersburg State Chemical and Pharmaceutical University, Saint Petersburg, 197376, Russian Federation
1 [email protected], https://orcid.org/0000-0003-4336-1220
2 [email protected], https://orcid.org/0000-0002-9069-8574
3 [email protected], https://orcid.org/0000-0001-7119-3629
4 [email protected], https://orcid.org/0000-0003-4671-7659
Abstract
The problem of adaptive optimal control of a dynamical system, which belongs to the class of conditional variational problems with moving boundaries, is considered. A variational and computer study of the controlled adaptive motion of a material point is carried out for the problem of the energy quality functional minimizing with a moving, not predetermined right transboundary and in the case when the mass of the point changes depending on the unfixed final time. The problem is solved using the schemes and procedures of the classical calculus of variations, as well as adaptive estimation techniques, including the derivation of the variation of the auxiliary quality functional, the corresponding Euler equations, and the adaptive estimation algorithm. When solving a general conditional variational problem, the obtained closed system of differential equations was studied for the formation of an adaptive optimal control system for a dynamic plant with a given performance functional. The results of the unconditional formulation of the problem are generalized to the case of additional differential (nonholonomic) and holonomic constraints. In a variational adaptive optimal control problem, the transversality condition is formulated in terms of the local programming condition. The developed variational scheme of adaptive optimal synthesis can be used in the calculation and design of controlled dynamic systems. This optimization scheme is also promising for use in systems where operating time is non-fixed in advance. The results achieved in this paper concern obtaining specific equations, expressions, and formulas relative to the model example under study and finding graphs of the main time functions that determine the nature of the movement of the control object and the quality of the corresponding transients. The proposed adaptive optimal control algorithms for purposeful movement of the studied material point were tested in digital mode and showed their effectiveness which makes them promising for further use in more complex nonlinear adaptive systems of dynamic optimal control. Keywords
moving boundary, material point, conditional quality functional, optimal control, functional variation, transversality condition
For citation: Vedyakov A.A., Milovanovich E.V., Slita O.V., Tertychny-Dauri V.Yu. Variational problem of adaptive optimal control. Theoretical and applied computer analysis. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2023, vol. 23, no. 2, pp. 252-262 (in Russian). doi: 10.17586/2226-1494-2023-23-2-252-262
Введение. Замечания и пояснения
Рассмотрен новый класс вариационных динамических задач применительно к задачам адаптивного оптимального управления в случае, когда правая концевая трансграница считается изначально не заданной. Применены аппаратные средства, которые широко используются для методов классического вариационного исчисления [1-4] и приемов адаптивного оптимального управления [5-11], основанных на введении обратных связей при решении задач параметрической идентификации. Настоящая работа является продолжением и обобщением работы [12] для случая адаптивного оптимального управления.
В работе применена общепринятая терминология, связанная с адаптивным управлением [11], согласно которой формируется обратная связь, включающая оценивание (или адаптивность — приспосабливае-мость к истинным значениям) неизвестных параметров. Проведено текущее оценивание неизвестных параметров системы с помощью устойчивого адаптивного алгоритма. Полученные в результате оценки параметры служат в качестве настраиваемых параметров регулятора. Особенность работы — факт, что неизвестные параметры системы могут испытывать гладкий огра-
ниченный (в том числе по скорости изменения) дрейф во времени.
Под классическим вариационным исчислением подразумевается использование вариаций в виде малых допустимых смещений функционалов и функций при выводе необходимых и достаточных условий экстремума. В работе будут рассмотрены условные вариационные задачи адаптивного оптимального управления в рамках классического вариационного исчисления, которые можно считать новыми и достаточно актуальными.
Введение параметрической дифференциальной связи играет важную роль в вариационном формировании системы оптимального адаптивного управления. С помощью этой связи возможно определить конкретный устойчивый алгоритм формирования оценок неизвестных параметров. В результате получим оптимальную обратную связь по управлению.
К теории оптимального управления можно отнести часть вариационного исчисления, связанную с принципом максимума, и конструкции которого используют игольчатые вариации, позволяющие преодолевать затруднения, вызванные замкнутостью множества допустимых управлений. Также можно применить метод динамического программирования в теории оптимального управления, приводящий к решению уравнений
Гамильтона-Якоби-Беллмана, и различные его модификации.
Задачи с подвижными границами составляют важный класс условных вариационных задач. Подвижными границами являются концы (начальные и конечные значения) траекторий динамической системы и определены тремя типами:
1) переменные состояния х(/0), х(^) в фиксированные моменты времени ^ и tl не заданы;
2) переменные состояния в моменты времени ^ и ^ заданы, но сами значения времени to и/или ^ не известны;
3) переменные состояния не определены (не заданы) в совокупности величин х(^), ^ и/или х(^), t■í. Проведем общий анализ третьего типа задач в предположении, что начальные значения (х(^), to) заданы, но неизвестны заранее значения конечной трансграничной точки (х(^), t1). Говоря о трансграницах, будем иметь в виду подвижные границы, которые приводят к появлению трансверсальных условий, обуславливающих определенные взаимосвязи между угловыми коэффициентами параметров движения в самой граничной точке.
Отметим, что начиная с середины 80-х годов прошлого века специалисты по общей теории адаптивного управления начали активно интересоваться задачами, в которых неизвестные параметры объекта управления не постоянны, а испытывают неизвестный дрейф во времени. При этом рассматривались в основном два направления исследований: изменение во времени неизвестно; неизвестны некоторые постоянные параметры в известной модели дрейфа.
В работах [10, 11] по адаптивному управлению алгоритмические схемы оценивания не являются оптимальными. Данные схемы состоят из постоянных неизвестных параметров или являются при наличии оптимальности и параметрического дрейфа чрезмерно сложными. При решении сложных схем используется техника интегральных преобразований и фильтрации производных высших порядков.
В настоящей работе решены сложные нелинейные задачи оптимального адаптивного управления, связанные с изменением неизвестных параметров во времени, причем сама зависимость во времени считается неизвестной. Поиск простого решения по сравнению с имеющимися аналогами [10] может быть выполнен с привлечением аппарата условного вариационного исчисления.
Предложено новое теоретическое решение — введение в адаптивный оптимальный анализ свободной правой границы с неизвестным состоянием объекта на конце. При этом временя окончания процесса управления также неизвестно.
Решения поставленных задач имеют, несмотря на обоснованный аналитический характер, значимую практическую направленность. Например, возможны следующие неизвестные параметры: изменяемые во времени внутренние моменты инерции пилотируемой космической станции, воздушного судна, надводного или подводного корабля, парома, сухогруза, вызванные перемещениями людей или грузов; изменения масс и
моментов инерции в ленточных и кассетных устройствах, механизмов с сыпучими грузами, в подъемных кранах, робота-манипуляторах с изменяемыми при переноске массами и т. д.
Характерной задачей здесь может служить задача о построении системы оптимальной адаптивной стабилизации движения космической пилотируемой станции, у которой внутренние моменты инерции меняются во времени неизвестным образом. Эта задача оптимальной стабилизации может быть в дальнейшем исследована с привлечением новых дополнительных приемов ее решения.
Вариационная задача адаптивного оптимального управления
Пусть требуется найти экстремальное значение для функционала вида
h
J = V[x(tj), tj + |F[x(t), x(t), T(t), t]dt ^ extr (1)
t0
с известными положительно определенными, непрерывно дифференцируемыми по своим переменным скалярными функциями V[x(t), t], -F[x(t), x(t), T(t), t].
Векторные величины x(t) 6 Rn, T(t) 6 Rm имеют смысл неизвестных вектор-функций времени состояния и параметров управляемой адаптивной динамической системы, движение которой опишем уравнением:
x(t) = fx, u, т, t); x, u 6 Rn; т 6 Rm, (2)
где u(t) 6 U с Rn — вектор управления, который определен на множестве допустимых управлений U. Считается, что U — множество всех ограниченных непрерывных функций U(t), 16 [t0; tj]). Вектор T(t) 6 Rn — неизвестная неизмеряемая вектор-функция дрейфующих во времени параметров системы (2); T(t) меняется по t непрерывно-дифференцируемым образом. Вектор-функция f(x, u, т, t) 6 Rn — непрерывно дифференцируемая функция своих аргументов. Будем считать, что задействованные в формировании всех процессов функции используют только момент времени t. Учет запаздывания в данной работе не произведен.
Предположим, что правый конец t1 промежутка времени интегрирования [to; tj] и значение x(tj) не заданы. Определены только значения (x(t0), t0), т. е. точка (x(tj), tj) перемещается в пространстве.
Воспользуемся уравнением (2) и получим векторную дифференциальную (неголономную) связь:
у[х, х, u, т, t] = f(x, u, т, t) - x = 0, (3)
где через у обозначается левая часть уравнения (3).
Также предположим, что вектор-функция настраиваемых параметров x(t) удовлетворяет дифференциальным уравнениям связей (адаптивному алгоритму настройки параметров r(t)) формирующих оптимальное управление u0(t) = u0(x(t), x(t), t):
ф[т(0, T(t), t] = x(t) - Щ + a[x(t) - т(0] = 0, (4)
где x(t); т(t) 6 Rm, a > 0 — заданное положительное число; x(t) — вектор-функция оценки неизвестных па-
раметров т(/); ф обозначает левую часть уравнения (4). Очевидно, уравнение адаптивного алгоритма настройки (4) с решением
T(f) = T(f) + [T(to) - т^Ж^о)
(5)
приводит к сходимости оценок т(/) к т(/) в зависимости от требуемой точности оценивания е > 0:
lim ||T(f) - T(f)|| < е
f^ij
(6)
и времени окончания процесса оптимизации и адаптации ||т(/) - т(/)|| — евклидова норма вектора. Видно, что дифференциальная связь (4) может рассматриваться как голономная (проинтегрированная) связь (5).
Найдем три неизвестные вектор-функции (х(/), и(/), т(/)) со значениями в Я" и Ят . При этом время t 6 [/0;/х], должно удовлетворять начальным условиям (х(^), т(to), и обеспечить выполнение следующих условий: J ^ ех1г (1) вместе с обеспечением требований у[х, х, и, т, t] = 0 (3), где у 6 Я", и ф(т, т, /) = 0 (4), где ф 6 Ят.
Докажем, что функционал J с помощью сформированной адаптивной оптимальной системы на соответствующих экстремальных решениях достигает своего целевого значения (1).
В классическом вариационном исчислении задача на условный экстремум сводится к задаче на безусловный экстремум с помощью введения множителей Лагранжа. Условия (2)-(4) порождают вспомогательный функционал качества:
J* = F[x(fj), f1] + I {F[x, fx, u, т, f), T(f), t]dt +
f0
+ ^T(f)y[x, x, u, т, f) + Хг(0ф(т, T, t)}dt ^ extr,
(7)
где ц(/), !(/) — неопределенные множители Лагранжа;
6 Я", X(t) 6 Ят. Отметим, что свободные (или подвижные) величины (х(^), наряду с множителями Лагранжа и Х(/) могут использоваться как еще один класс величин, оптимизирующих выбираемую систему адаптивного управления.
Добавим в рассмотрение вспомогательный функционал J* (7). Заметим, что в процессе вычисления вариации /* функционал J* задается только при решении системы уравнений Эйлера, в которой на интегральных кривых достигаться экстремум. При этом вариация 8/* преобразуется в дифференциал этой функции.
Обратим внимание, что 5х|М1 не равно 8х(^), так как 5х|(=п — приращение координаты х в точке ^ при переходе от экстремали, проходящей через точки (х(/0), /0) и (х(^), t1) к экстремали, проходящей через точки (х(/0), /0) и (x(t1) + 5x(t1), ^ + 5t1), где 5x(t1) — приращение х(^) при перемещении граничной точки в положение (х(^) + 8х(^), tl + 8/^1). В результате получим с точностью до малых высокого порядка
Sx|f=fj = 5x(fj) - x(f1)5f1,
(8)
где 5x(f1) = 5x|f=fj + x(f1)5f1 — полное приращение вектора x(f1) за время 5f1.
Первое основное утверждение
Выполним интегрирование по частям в функционале качества J* (7). Получим функционал вида:
/* = К[х(/1), t1] - ^г(/)х(/)| t1 + 1О(х, и, т,
0 /0
в(х, и, т, t) = в(х, и, т, t, ¿(/), *,(/)) = (9) = ^(х, и, т, t) + Ах, и, т, /) + ^г(/)х(/) + Хг(/)ф(т, т, /).
Рассчитаем вариацию функционала J* (9) на экстремальных движениях (решениях) с подвижной трансграницей (х(^), где 8х(^) = 0, с учетом возникающих вариаций 8х(/), 8и(/), 8т(/), 5х(/1), c точностью до величин второго порядка малости. Напомним, что векторные множители и Х(/) в задаче Лагранжа не варьированы, а выбраны.
Теорема 1. В предположении непрерывной диффе-ренцируемости по всем своим переменным функций V, О, а также справедливости выполнения соотношения (8) для 5х|г=г-1 вариация функционала (9) имеет вид:
( дЩх^), к]
5J* = dJ* =
- 5x(f1) +
I дпт, tl] + G(x, u, T, f)|f=f1 + Hr(f1)x(f1^5f1 + (10)
+ I
f
8G(x, u,t,Q §x + 5G(x,u,t,0 & + 8G(x, u.t.Q^
&
ôu
ôt
dt.
Значение, полученное по выражению (10), имеет точность до второго порядка малости.
Доказательство. Заметим, что поскольку функционал J* (9) на экстремальных движениях при перемещении граничной точки из положения (х(^), в положение (х(^) + Зх^)/ + 8^) превратился в функции х(^) и /ь то его вариация совпадает с дифференциалом этой функции. При этом запишем линейную часть приращения Д/* в виде:
Д/* = | О(х + 8х, и + 8и, т + 8т, ^ - | О(х, и, т, ^ =
/0 /0 /1+8/1
= | О(х + 8х, и + 8и, т + 8т, ^ + (11)
+ | [О(х + 8х, и + 8и, т + 8т, /) - О(х, и, т, t)]dt.
/0
Для первого интеграла в правой части выражения (11) применим теорему о среднем:
/1+8/1
| О(х + 8х, и + 8и, т + 8т, = О=( '8/1,
/1 1 1 е 6 (0; 1).
По условию задачи О(х, и, т, /) — непрерывная функция, следовательно 0*=^ +е8^ = О(х, и, т, /)|/=/1 +
+ с1, где приращение функции с1 Sx(f1) ^ 0.
0 при 5f1
f
f
Таким образом,
ij+Sij
I G(x + Sx, u + Su, t + St, t)dt =
h
= G(x, u, t, t)|t=t1 St1 + c1^St1.
(12)
Предположим, что в равенстве (16) выполнено следующее условие:
-+-x(tl) + G(x(tl), u(tl), т(tl), tl) = 0
ди
ôx(ii)
Во втором интеграле, стоящем в правой части выражения (11), разложим подынтегральную функцию по формуле Тейлора
| [0(х + 5х, и + 5и, т + 5т, t) - 0(х, и, т, t)]dt =
= I
t
8G(x, и, т, t) Sx + su + (13)
Sx
3G(x, u, t, i) 5x
St
Su
dt + c2
где с2 — сколь угодно малая более высокого порядка, чем 5х, 5и, 5т.
Принимая во внимание соотношения (12) и (13), напишем выражение для &/* с точностью до членов порядка выше первого относительно 5х(^), 5^, 5х(^, 5и(0, 5т(t):
5J* = dJ■* =-5х(^) +--5tl -
0x00
- +
Sil
+I
t
dG(x, u, т, 0 Sx + 5G(x, u, t, t) Su + 5G(xlultl0St
ôx
du
8t
dt.
Воспользуемся вновь зависимостью (8) для 5х|М[. В итоге получим утверждение теоремы в виде выражения (10).
Условие трансверсальности
Выберем векторный множитель так, чтобы функциональные коэффициенты при 5х(^), 5х(^ в соотношении (10) обратились в нуль. Получим систему п уравнений Эйлера по х с граничным условием на правом конце:
5С(х,и,т,0 = 0, = (14)
дх
3х(*0
Или с учетом обозначения (9) получим решение системы уравнений:
т, 0 5/Тх, и, т, 0 \г
+ ^T(t) ' ' (15)
dx(t) )
A(t) = -
(dF(x, u, \ ôx(0
с граничным условием ц(^) (14).
Таким образом, выражение (10) при наличии требований (14) перепишем в виде:
&/* = сП* = | ^ + в(х, и, т, + ^)Х(^)] 5t1 +
+ I
t
8ti
ôG{x, и, т, 0 . dG(x, и, т,
-Su +--St
öu
ôt
dt.
(16)
тогда, при сворачивании первых двух слагаемых, получим:
artxfr), h] dti
+ G(x(t1), u(t1), T(t1), t1) = 0,
или
dJ, dt\
■ = 0.
(17)
Необходимо обратить внимание, что требование трансверсальности (17) для переменного граничного значения времени ^ совпадает с известным условием оптимальности в задачах локального программирования [13-16]. По данному условию, интегральный функционал качества имеет переменный верхний предел t (в нашем случае ^ = t и величина ^ принимают значения скользящего текущего момента времени). Следовательно, условие локальной оптимальности превращается в принцип минимума производной функционала (функции) качества J* на семействе оптимальных управлений и0:
¿Л. . ¿¿Л
—|и=и0 = Ш1П— =
ш иеи аЛ
Подчеркнем, что выбор множителей Лагранжа ограничен выбором уравнений Эйлера (14) и связи (3). Исходя из этого, полученное скалярное уравнение (17) имеет определенное условие выбора всех подвижных величин (х(^), в функционале J* или только значений х(^), которым они должны удовлетворять в подвижный момент времени tl, или только значений tl.
Второе основное утверждение
Предположим, что условие локальной оптимальности (17) выполняется во временной точке tl. Тогда с учетом (16) получим соотношение
SJ* = dJ* = I
dG(x, u, т, t) „ , dG(x, u, t,
Su +--St
du
ôt
dt. (18)
В интеграле (18) для второго слагаемого с учетом обозначения (9) выберем набор множителей Лагранжа Е Ят таким образом, чтобы выполнялось равенство:
dG(x, u, т, t) дт
= 0,
(19)
приводящее к системе m уравнений Эйлера по т:
8F(x, u, т, t) дЯх, u, т, t)
+ цу(0 ' +
дт (t)
dx(t)
dm(t, t, t) + >7(0 = 0.
dr(t)
(20)
0
t
0
t
Система (20) может быть решена как система алгебраических уравнений относительно вектора Х(/) при
' <3ср(т, т, 0
условии, что квадратная матрица
£ Rm X Rm
невырожденная:
ôt
1(f) = -
дф(т, т, t) 5т
ôt
(21)
Таким образом, с учетом соотношений (19)-(21), перепишем интеграл (18) в следующем виде:
SJ* = dJ* = I
1dG(x, и, т,0
du
Sudt.
(22)
Для обеспечения необходимых условий стационарности критерия качества /* (т. е. 8/ = 8/* =/* = 0) необходимо потребовать, чтобы
dG(x, и, т, t) öu
= 0
(23)
в интеграле (22).
Видно, что система " уравнений Эйлера по и (23), может быть переписана с учетом обозначения (9) в виде системы уравнений
ЗИх, и, т, 0 5/Гх, и, т, г)
■ + рт(Г) = 0. (24)
ôu(0
du*»
Совокупность 2" + т уравнений (14), (19) и (23) вместе с уравнениями связей (3), (4) представляет собой замкнутую систему уравнений для нахождения вектор-функций х(/), и(/), т(/), Х(/). Данная система обеспечивает решение исходной условной вариационной задачи (задача оптимального адаптивного управления) с подвижной границей на правом конце.
Результатом проведенного вариационного анализа по синтезу условной управляемой динамической системы, отслеживающей т независимых дифференциальных (голономных) связей, может служить следующая теорема.
Теорема 2. Три вектор-функции (х(/), и(/), т(/)), реализующие экстремум (минимум) функционала (1) при наличии условий (3) и (4), удовлетворяют при соответствующем выборе множителей дк/К к = 1, п и Хг(/); I = 1, т решение уравнений Эйлера, составленных для функционала /* (7).
Уравнения Эйлера для определения функций х(/), и(/), т(/), Х(/) имеют вид уравнений (14), (19), (23) с уравнениями связей (3), (4). Решение задачи (3), (4), (15) порядка 2п + т где управление и(/) 6 и с Я" определяется уравнением (24) и осуществляется при наличии " начальных условий Х0 = х(^) на левом конце и " краевых условий (14) на правом конце.
Напомним, что для достижения локального минимума критерия качества, когда / ^ minu6u, необходимо выполнение условия 82/ = 82/* > 0, У8и(/) ф 0.
Заметим, что традиционная запись
дУ\х(и),1{\ , 8V[xÇrQ,^].^ ч дЩх(к), h] -+-x(f1) =-;- (25)
du
ôx(ii)
dti
означает взятие полной производной от функции К^х^), по переменной величине ^ с учетом разложения (8)
8х|/=/1 + х^^! = dx(t1),
где dx(t1) = 8х(^), dt1 = — соотношения, которые связаны при задании К^х^), = х(^) и домножении (25) на dt1. В результате получим равенство (8) в новых обозначениях.
Модельный пример
В качестве простого примера рассмотрим одноосное (по оси x) прямолинейное движение материальной точки с медленно меняющейся во времени неизвестной массой m(t) под действием управляющей силы (управления) u(t), приложенной к точке. Будем считать, что реактивной m(t) и гиперреактивной m(t) составляющими массы m(t) можно пренебречь.
Отметим, что в общем случае будем полагать, что гладкая функция времени ft) медленно меняется, если
dftt)
скорость ее изменения близка к нулю--0, или ско-
' dt
рость ограничена малой константой.
Предположим, что движение осуществляется вдоль опоры, когда сила тяжести уравновешена силой реакции опоры в отсутствии силы трения, т. е. при наличии абсолютно гладкой поверхности (прямолинейной траектории) движения.
В этом случае движение точки опишем уравнением
m(f)q(f) = u(f),
(26)
где д(/) — обобщенная (лагранжева) координата, соответствующая отклонению точки от центра системы координат О. Движение точки (26) определим величиной кинетической энергии Т = тд2/2:
dt dq dt~
(27)
Из соотношения (27), соответствующему второму закону Ньютона, возможно получить уравнение (26) для Q(t) = тд, где Q(t) — количество движения, = и(/) — действующая активная (управляющая) сила. Допустим, что измерению подлежат д(/) и д(/), а не д(/).
Требуется оптимальным образом в данных условиях синтезировать управляемое движение материальной точки, чтобы обеспечить минимизацию энергетического функционала качества
J = x2(f1) + I [x2(f) + x2(f)]dt =
= x2(f1) + I [x2(f) + f 2(x, u, x)]dt ^ min,
0 u£U
(28)
где векторы х, f 6 Я2 скалярного управления и(/) 6 Я и скалярного неизвестного параметра т(/) 6 Я, т = 1/т, У(х, /) = ¥(х) = х2(/), имеют вид
T
х
T
х
0
x =
'q' q '
, f =
,q. Tu
x2 = q2 + q2, f2 = q2 + T2u2
x1 x2 '
X = f(x, u, t), x = ,x2. , f = Tu
относительно компонентов уравнения движения, которые перепишем в нормальном виде следующим образом
(29)
В формуле (29) и(() Е и—управляющая сила (функция управления), приложенная к точке и выбранная из множества допустимых управлений и = С1[0, где С1[0, — множество непрерывных дифференцируемых по t функций, определенных на промежутке времени [0, Предположим, что задана векторная величина Х0 = х(0), а величины х(^) и tl будут заданы из дополнительных условий.
Отметим, что функционал качества J, задаваемый формулой (28) в терминах х, и и т может быть записан также в виде
J = x2(t1) + I [xTAx + T2u2]dt, A = 0
1 0 0 2
(30)
где А — положительно определенная Vt Е [0, матрица. Подынтегральная функция _Р(х, и, т) выражения (30) представляет собой сумму положительно определенной квадратичной формы по х и положительной функции
т2и2.
Таким образом, требуется обеспечить выполнение целевого условия (28) выбором адаптивной оптимальной схемы управления ^(х^), т^), () при надлежащем алгоритме оценивания параметров, когда т(0 ^ т(t) 0 ^ tl) с некоторой точностью отслеживания е > 0.
Приступим к решению поставленной вариационной задачи со свободным правым концом путем сведения ее к безусловной задаче. Согласно полученным результатам, дифференциальные связи: неголономная по х и голономная по т имеют вид
y(x, x, u, t) = f(x, u, t) - X = 0, ф(т) = T + a(T - t) = 0, a > 0, T ~ 0,
(31)
где а — некоторое положительное число.
Второе соотношение (31) можно представить в виде линейного неоднородного дифференциального уравнения по т(0:
т + ат(0 = ат(0, а > 0,
с известным асимптотическим решением [17]: если монотонно т(0 ^ р^ ^ да), в — некоторое положительное число, то тогда монотонно и ^ р^ ^ да), а значит, || т(0 - т(t)|| < 5 при t ^ t1 (6). Такой результат получен из решения данного уравнения
т(0 = в-а\ С + {ат^е^ = Се^ + \т^еа(!1-() =
0
0
= Ce-at + T(s)ea(s-t)L - I ea(s-t)dT(s)-► T(t)
10 0 t—
Запишем вспомогательный функционал с учетом соотношений (30) и (31) в виде:
J* = x2(t1) + I [x2(t) + f2(x, u, т) +
0
+ ^V(x, x, u, т) + X(t^(T)]dt,
(32)
где = [^(0 д2(0]г Е К2, %.(Г) Е Я — множители Лагранжа. Выполним интегрирование по частям в функционале (32), получим:
J* = x2(t1) - ^Tx(t)L +
(33)
+ | [х2(0 + f 2(х, и, т) + ^(х, и, т) + ¿г(0х(0 + Х(0ф(тМ.
0
Составим по разработанной схеме вариацию функционала (33) согласно выражению (10):
&/* = [2x(t1) - ц(^)]т5х(^) +
+ №)+f 2(tl) + ^1)^1) + цT(tl)x(tl) + ц^жда +
t1
+ | [2х1 + ц1)5х1 + 4х2 + ц1 + ц2)5х2 + (2т2и + ц2т)5и +
+ (2tu2 + ^u - al)st]dt.
(34)
в предположении, что dT(t) = T(t)dt ~ 0.
В соотношении (34) выберем множители и д2(0, чтобы решались уравнения Эйлера (14) по х1 и х2 с граничными условиями на правом конце:
= -2x1, ДЛ) = 2x^1), Р-2 = -^1 - 4x2, = 2*2(^). Перепишем выражение для J* (34) в виде:
5Л = [x2(tl) + f 2(tl) + ^1)^) + ^1)х(^) +
tl
+ цT(t1)Х(t1)]5t1 + | [2т2и + ц2т)5и +
+ (2т2и + ^и - аХ)5т] dt.
Пусть условие трансверсальности (17) выполнено, и обеспечено требование на выбор момента времени ^
х2(^) + f 2(tl) + + цT(tl)x(tl) + ц^Х^) = 0,
где все слагаемые слева могут быть выписаны через элементы соответствующих векторов
х2 = х2 + х|, f 2 = х| + т2и2, = Ц1Х2 + Ц2ти, ЦТХ = Ц1Х1 + Д2Х2, = Ц1Х1 + ДО 2. Тогда получим
t1
5J* = | [2т2и + до)5и + (2т2и + ^и - а!)5т^.
Выберем множители Лагранжа пользуясь тем, что вторая скобка в написанном подынтегральном выражении равна нулю. Тогда получим:
1
X = —(2т2и + до). а
t
В результате, для обеспечения стационарности функционала качества /* формула для задания оптимального адаптивного управления ^(0 имеет вид:
u(f) = U0(f) = -
M)
2x(i).
(35)
Отметим, что формула для ^(0 (35) может быть названа также формулой для «идеального» оптимального управления [18-21], поскольку она включает в себя зависимость от неизвестной функции т(/).
Модель параметрического изменения
При наличии дрейфующего во времени параметра т можно использовать различные подходы, например:
1. субоптимальную стратегию, т. е. в формуле (35) поменять т(/) на оценку т(/);
2. метод убывающих функций Ляпунова (самонастройки);
3. метод интегральных преобразований;
4. фильтрацию высших производных вектора состояния и т. д.
Адаптивные подходы 1 и 2 характерны для работы [18], а подходы 3 и 4 — для [19, 22-24].
Добавим в качестве пояснения к подходу 1: субоптимальная стратегия означает обеспечение оптимального режима регулирования с некоторым заданным уровнем оптимальности р: / > р 6 [0, 1] .
Предположим, что в рассматриваемой задаче наиболее эффективным может оказаться применение метода заданной адаптивной модели, использующей в качестве неизвестной величины конечный момент времени 0. На самом деле, неизвестность 0 является условной, поскольку 0 определяется с помощью граничных условий уравнения трансверсальности.
Итак, в общем случае можно задать модель изменения т(/) в виде формулы: т(/) = т0^(/), где т0 = 1/т0, т0 = т(0), а g(t), g(0) = 1 — известная функция времени, которая при / = 0 принимает заданное значение ю: g(t1) = ю > 0. Описанная модель изменения т(/) определяется соображениями чисто физического характера, исходя из наблюдения и изучения процесса заданного управляемого движения.
Пусть, например, т(/) = т0е-^, у > 0, причем т(0) = = т0е-У/1 = ю. Тогда, очевидно, т(0) = т0 = юе^О, т. е.
m(f) = œe-T(f-f1), f £ [0, f1],
(36)
где ю и у — некоторые положительные числа.
В формуле (36) положим величины ю и у достаточно малыми с тем, чтобы т(/) ~ 0. В дальнейшем значение 0 будет найдено в виде корня соответствующего уравнения по 0.
Нахождение экстремали.
Условие трансверсальности
Рассмотрим системы дифференциальных уравнений для определения переменных х(/) и у(/) при заданных х(0) и х(0) после подстановки в них ^(0 и т(/) (36):
X1(f) ■ x2(f) ■ 'M0' 2x1( )
■X2(f). ■ -fe(f)/2. ? ■M2(0. . ^(f) + 4X2(0.
0 1 0 0
0 0 0 1
2
-2 0 0 0
0 -4 -1 0
Для нахождения общего решения введем вектор z = [х1, х2, ц2]Т относительно линейной однородной системы дифференциальных уравнений первого порядка с постоянной матрицей коэффициентов системы:
z(f) = Bz(f), B =
Решим характеристическое уравнение Д = det(B - XI) = 0, где I — единичная матрица размера (4 х 4); X — собственные значения. Найдем Д = (X - 1)2(Х + 1)2 = 0 и получим собственные числа Х^ = 1, Х2 = -1 кратности 2. Применим стандартные приемы поиска фундаментальной системы решений zXl(t) и zX2(t) для случая кратных корней характеристического уравнения. Найдем
С1 + С2/
ZX1 (f) =
ZX2(f) =
C + C2 + C2f 2(C2 - C1 - C2f)
-2(2 C2 + C1 + C2f)
C3 + C4 C4 - C3 - C4f
2(C4 + C3 + C4f) 2(2C4 - C3 - C4 )
где С1, С2, С3, С4 — произвольные постоянные.
Для того чтобы однозначно определить экстремаль
х( )
x(f) =
т. е. найти постоянные интегрирования С1, С2, С3, С4 и конечный момент времени 1, надо задать четыре граничных условия с выбранными числами П0, П!
'X1(0 ' ■ C1 + c2f ■ ■ C3 + C4f
= e +
■X2(0 . .C1 + C2 + C2f. C4 - C3 - C4
■X1(0)" V X1( 0)' V
■X2(0). -П0- ? X2( 0). -П1-
и условие трансверсальности (17) для нахождения момента времени 1:
+ "¿(О) + О[х(/1), и(/1), т(/1), /1] = 0,
ди
Ôx(i0
где V[ x(f1)] = x2(f1), = (2x^0), 2x2(f1)),
5ii
= 0,
dsftO
G[(f1), u(f1), T(f1), f1] = - |x2 + 2x2 + ^J Ц :
- (*?
-(x2 + 3x2) f=f1.
f
e
-f
e
-f
e
с
u(t), H
-4
О 2 ' 4
Рисунок. Графики функций: xj(t) и ^j(t) (a); x2(t) и ^2(t) (b); u(t) (с) Figure. Graphs of functions xj(t) and ^j(t) (a); x2(t) and ^2(t) (b); u(t) (с)
Следовательно, условие трансверсальности принимает вид
2Х1(^)Ж1(^) + 2x2(tl)X2(tl) = х2 (tl) + 3x22(tl),
либо
У(С + С2 + С^ + (С4 - С3 - С^г*] + + шКС + 2С2 + + (С3 - 2С4 - С^)в-Ь] =
= % + 3 ^ 2 .
Рассмотрим числовой пример. Для следующих значений параметров системы и начальных условий ю = 1, у = 0,001, т(0) = 1,0009, т(0) = -0,0001, £0 = 3,5, = 0,5, п0 = 0, п1 = -2 рассчитаем значения t1 = 4,03, ц1(0) = 12,84, д2(0) = 6,12, J = 34,76.
На рисунке показаны результаты моделирования в пакете MATLAB Simulink. За время t1 регулируемые переменные х^) и X2(t) достигают заданные конечные значения и п1. График сигнала управления u(t) изображен на рисунке, с.
Выводы
Модельный пример представляет собой численное решение задачи синтеза адаптивного оптимального управления прямолинейным движением материальной точки с изменяемой, но заранее неизвестным образом, массой, что представляет собой условную вариационную задачу со свободным правым концом траектории и нефиксированным временем окончания процесса. Различные алгоритмы вычисления вариаций функционалов качества в задачах вариационного исчисления и оптимального управления динамическими системами предлагались многими исследователями, в том числе зарубежными [25-32].
Отметим, что в общем случае для граничных условий на правом конце при t = ^ величины ^ и п могут быть заданы функциями параметра т. е. = и П1 = ^1(^*^1). Функции могут быть выбраны из конкретных физических требований к состоянию управляемой динамической системы в момент времени В зависимости от полученных условий уравнение трансверсальности будет иметь то или иное решение.
Заключение
В работе предложено аналитическое решение вариационной задачи адаптивного оптимального управления нелинейными динамическими системами в случае, когда состояние объекта регулирования в конечный момент времени и в фиксированный момент времени заранее не заданы.
Исходная вариационная задача дополнена условиями дифференциальных связей на объект управления и на способ изменения его параметров. Решение поставленной условной вариационной задачи найдено с помощью сведения к безусловной вариационной задаче путем применения метода множителей Лагранжа. Результаты аналитического исследования оформлены в виде двух основных теорем.
Литература
1. Блисс Д.Э. Лекции по вариационному исчислению. М.: Издательство иностранной литературы, 1950. 348 с.
2. Гельфанд И.М., Фомин С.В. Вариационное исчисление. М.: Физматгиз, 1961. 228 с.
3. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. М.: Наука, 1969. 424 с.
4. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974. 488 с.
5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979. 429 с.
6. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969. 408 с.
7. Дикусар В.В., Милютин А.А. Качественные и численные методы в принципе максимума. М.: Наука, 1989. 143 с.
8. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. 446 с.
9. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.: Наука, 1991. 215 с.
10. Тертычный-Даури В.Ю. Галамех, Т. 4. Оптимальная механика. М.: Физматлит, 2019. 608 с.
11. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с.
12. Ведяков А.А., Милованович Е.В., Тертычный-Даури В.Ю., Тимофеева Г.В. Оптимальное управление как условная вариационная задача с подвижной правой границей // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 1. С. 59-66. https://doi.org/10.17586/2226-1494-2019-19-1-59-66
13. Дегтярев Г.Л. Синтез оптимального управления в системе с распределёнными параметрами с помощью функций Ляпунова // Прямой метод в теории устойчивости и его приложения. Новосибирск: Наука, 1981. C. 75-83.
14. Матвеев А.С. Вариационный анализ в задачах оптимизации систем с распределёнными параметрами и вектор-функции множества // Сибирский математический журнал. 1990. Т. 31. № 6. С. 127-141.
15. Панченков А.Н. Экстремальные задачи управления движением с локальными функционалами // Проблемы устойчивости движения, аналитической механики и управления движением. Новосибирск: Наука, 1979. С. 190-202.
16. Тертычный-Даури В.Ю. Галамех. Т. 1. Адаптивная механика. М.: Физматлит, 2019. 544 с.
17. Камке Э. Справочник по обыкновенным дифференциальным уравнениям. М.: Наука, 1976. 576 с.
18. Фомин В.Н. Математическая теория обучаемых опознающих систем. Л.: Издательство Ленинградского университета, 1976. 236 с.
19. Тертычный-Даури В.Ю. Адаптивная механика. М.: Факториал Пресс, 2003. 464 с.
20. Цыпкин Я.З. Оптимальные алгоритмы оценивания параметров в задачах идентификации // Автоматика и телемеханика. 1982. № 12. C. 9-23.
21. Цыпкин Я.З. Оптимальные адаптивные системы управления // Доклады АН СССР. 1984. Т. 277. № 5. C. 1091-1096.
22. Тертычный-Даури В.Ю. Решение вариационных динамических задач в условиях параметрической неопределенности // Проблемы передачи информации. 2005. Т. 41. № 1. C. 53-67.
23. Тертычный-Даури В.Ю. Вариационные динамические задачи с параметрами и их адаптивная интерпретация // Автоматика и телемеханика. 2005. № 9. C. 114-128.
References
1. Bliss G.A. Lectures on the Calculus of Variations. Chicago, Illinois, University of Chicago Press, 1946, 292 p.
2. Gel'fand I.M., Fomin S.V. Calculus of Variations. Moscow, Fizmatgiz Publ., 1961, 228 p. (in Russian)
3. El'sgol'ts L.E. Differential Equations and Calculus of Variations. Moscow, Nauka Publ., 1969, 424 p. (in Russian)
4. Yang L. Lectures on Calculus of Variations and Optimal Control Theory. Moscow, Mir Publ., 1974, 488 p. (in Russian)
5. Alekseev V.M., Tikhomirov V.M., Fomin S.V. Optimal Control. Moscow, Nauka Publ., 1979, 429 p. (in Russian)
6. Boltianskii V.G. Mathematical Methods of the Optimal Control. Moscow, Nauka Publ., 1969, 408 p. (in Russian)
7. Dikusar V.V., Miliutin A.A. Qualitative and Numerical Methods in the Maximum Principle. Moscow, Nauka, 1989, 143 p. (in Russian)
8. Krotov V.F., Gurman V.I. Methods and Problems of the Optimal Control. Moscow, Nauka Publ., 1973, 446 p. (in Russian)
9. Subbotin A.I. Minimax Inequations andHamilton-Jacobi Equations. Moscow, Nauka Publ., 1991, 215 p. (in Russian)
10. Tertychny-Dauri V.Yu. Galamech. Vol. 4. Optimum Mechanics. Moscow, Fizmatlit Publ., 2019, 608 p. (in Russian)
11. Fomin V.N., Fradkov A.L., Iakubovich V.A. Adaptive Control of the Dynamic Objects. Moscow, Nauka Publ., 1981, 448 p. (in Russian)
12. Vedyakov A.A., Milovanovich E.V., Tertychny-Dauri V.Yu., Timofeeva G.V. Optimal control as conditional variational problem with variable right endpoint. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2019, vol. 19, no. 1, pp. 59-66. (in Russian). https://doi.org/10.17586/2226-1494-2019-19-1-59-66
13. Degtyarev G.L. Synthesis of optimal control in systems with distributed parameters using Lyapunov functions. Direct Method in Stability Theory and its Applications. Novosibirsk, Nauka Publ., 1981, pp. 75-83. (in Russian)
14. Matveev A.S. Variational analysis in optimization problems of systems with distributed parameters and set vector functions. Siberian Mathematical Journal, 1990, vol. 31, no. 6, pp. 127-141. (in Russian)
15. Panchenkov A.N. Extreme problems of motion control with local functionals. Problems of Motion Stability, Analytical Mechanics and Motion Control. Novosibirsk, Nauka Publ., 1979, pp. 190-202. (in Russian)
16. Tertychny-Dauri V.Yu. Galamech. Vol. 1. Adaptive Mechanics. Moscow, Fizmatlit Publ., 2019, 544 p. (in Russian)
17. Kamke E. Differentialgleichungen Lösungsmethoden und Lösungen. Springer-Verlag, 1977, 670 p. (in German). https://doi. org/10.1007/978-3-663-05925-7
18. Fomin V.N. Mathematical Theory of the Learnable Identification Systems. Leningrad, Leningrad State University Publ., 1976, 236 p. (in Russian)
19. Tertychny-Dauri V.Yu. Adaptive Mechanics. Moscow, Faktorial Press, 2003, 464 p. (in Russian)
20. Tsypkin Ya.Z. Optimal parameter estimation algorithms in identification problem. Automation and Remote Control, 1982, vol. 43, no.12, pp. 1505-1517.
21. Tsypkin Ya.Z., Optimal adaptive control systems. Doklady Akademii nauk SSSR, 1984, vol. 277, no. 5, pp. 1091-1096. (in Russian)
22. Tertychny-Dauri V.Yu. Solution of variational dynamic problems under parametric uncertainty. Problems of Information Transmission, 2005, vol. 41, no. 1, pp. 45-58. (in Russian). https://doi.org/10.1007/ s11122-005-0009-3
23. Tertychny-Dauri V.Yu. Variational dynamic problems with parameters and their adaptive interpretation. Automation and Remote Control,
24. Тертычный-Даури В.Ю. Условная задача оптимального управления: адаптивный метод решения // Автоматика и телемеханика. 2006. № 3. C. 54-67.
25. Anderson B., Moore J. Optimal Control: Linear Quadratic Methods. N.Y.: Prentice-Hall Inc., 1990. 352 p.
26. Leitmann G. The Calculus of Variations and Optimal Control. N.Y.: Plenum Press, 1981. 312 p. https://doi.org/10.1007/978-1-4899-0333-4
27. Landau I.D. Adaptive Control Systems: The Model Reference Approach. N.Y.: Marcel Dekker, 1979. 406 p.
28. Блэтт Д., Лайнесс Д. Практическое использование вариационных принципов в нелинейной механике // Механика. Сборник переводов. М.: Мир, 1964. № 5. C. 5-11.
29. Mayne D.Q., Polak E. First-order strong variation algorithms for optimal control problems with terminal inequality constraints // Journal of Optimization Theory and Applications. 1975. V. 16. N 3-4. P. 277-301. https://doi.org/10.1007/bf01262938
30. Trullson E., Ljung L. Adaptive control based on explicit criterion minimization // Automatica. 1985. V. 21. N 4. P. 385-399. https://doi. org/10.1016/0005-1098(85)90075-5
31. Hestenes M.R. On variational theory and optimal control theory // Journal of the Society for Industrial and Applied Mathematics Series A Control. 1965. V. 3. N 1. P. 23-48. https://doi.org/10.1137/0303003
32. McShane E.Y. Relaxed controls and variational problems // SIAM Journal on Control. 1967. V. 5. N 3. P. 438-485. https://doi. org/10.1137/0305027
Авторы
Ведяков Алексей Алексеевич — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ^ 49664023200, https://orcid.org/0000-0003-4336-1220, [email protected]
Милованович Екатерина Воиславовна — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; заведующий кафедрой, Санкт-Петербургский государственный химико-фармацевтический университет Министерства здравоохранения Российской Федерации, Санкт-Петербург, 197376, Российская Федерация, 57193453414, https://orcid.org/0000-0002-9069-8574, [email protected] Слита Ольга Валерьевна — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ^3 16242570700, https://orcid.org/0000-0001-7119-3629, [email protected]
Тертычный-Даури Владимир Юрьевич — доктор физико-математических наук, профессор, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, 8980267000, https:// orcid.org/0000-0003-4671-7659, [email protected]
Статья поступила в редакцию 08.12.2022 Одобрена после рецензирования 19.02.2023 Принята к печати 31.03.2023
2005, vol. 66, no. 9, pp. 1465-1477. https://doi.org/10.1007/s10513-005-0185-z
24. Tertychnyi-Dauri V. Yu. A conditional optimal control problem and its adaptive solution method. Automation and Remote Control, 2006, vol. 67, no. 3, pp. 393-404. https://doi.org/10.1134/ s0005117906030040
25. Anderson B., Moore J. Optimal Control: Linear Quadratic Methods. N.Y., Prentice-Hall Inc., 1990, 352 p.
26. Leitmann G. The Calculus of Variations and Optimal Control. NY, Plenum Press, 1981, 312 p. https://doi.org/10.1007/978-1-4899-0333-4
27. Landau I.D. Adaptive Control Systems: The Model Reference Approach. N.Y., Marcel Dekker, 1979, 406 p.
28. Blatt J.M., Lyness J.N. The practical use of variation principles in non-linear mechanics. Journal of the Australian Mathematical Society, 1962, vol. 2, no. 3, pp. 357. https://doi.org/10.1017/ s144678870002694x
29. Mayne D.Q., Polak E. First-order strong variation algorithms for optimal control problems with terminal inequality constraints. Journal of Optimization Theory and Applications, 1975, vol. 16, no. 3-4, pp. 277-301. https://doi.org/10.1007/bf01262938
30. Trullson E., Ljung L. Adaptive control based on explicit criterion minimization. Automatica, 1985, vol. 21, no. 4, pp. 385-399. https:// doi.org/10.1016/0005-1098(85)90075-5
31. Hestenes M.R. On variational theory and optimal control theory. Journal of the Society for Industrial and Applied Mathematics Series A Control, 1965, vol. 3, no. 1, pp. 23-48. https://doi. org/10.1137/0303003
32. McShane E.Y. Relaxed controls and variational problems. SIAM Journal on Control, 1967, vol. 5, no. 3, pp. 438-485. https://doi. org/10.1137/0305027
Authors
Alexey A. Vedyakov — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, 197101, Russian Federation, S3 49664023200, https://orcid.org/0000-0003-4336-1220, [email protected]
Ekaterina V. Milovanovich — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, 197101, Russian Federation; Head of Department, Saint Petersburg State Chemical and Pharmaceutical University, Saint Petersburg, 197376, Russian Federation, S3 57193453414, https://orcid. org/0000-0002-9069-8574, [email protected]
Olga V. Slita — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, 197101, Russian Federation, S3 16242570700, https://orcid.org/0000-0001-7119-3629, [email protected]
Vladimir Yu. Tertychny-Dauri — D.Sc. (Physics & Mathematics), Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, 197101, Russian Federation, S3 8980267000, https://orcid.org/0000-0003-4671-7659, [email protected]
Received 08.12.2022
Approved after reviewing 19.02.2023
Accepted 31.03.2023
Работа доступна по лицензии Creative Commons «Attribution-NonCommercial»