ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ
АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ И РОБОТОТЕХНИКА
AUTOMATIC CONTROL AND ROBOTICS
doi: 10.17586/2226-1494-2024-24-2-198-207 УДК 62-50
Задача адаптивного субоптимального управления и ее вариационное решение
Алексей Викторович Блаженов1, Алексей Алексеевич Ведяков2, Екатерина Воиславовна Милованович3, Ольга Валерьевна Слита4«, Владимир Юрьевич Тертычный-Даури5
1,23,4,5 Университет ИТМО, Санкт-Петербург, 197101 Российская Федерация
1 [email protected], https://orcid.org/0009-0009-2682-9128
2 [email protected], https://orcid.org/0000-0003-4336-1220
3 [email protected], https://orcid.org/0000-0002-9069-8574
4 [email protected]«, https://orcid.org/0000-0001-7119-3629
5 [email protected], https://orcid.org/0000-0003-4671-7659
Аннотация
Введение. Рассмотрена субоптимальная трансграничная задача в применении к нелинейным динамическим управляемым системам в условиях действия на них детерминированных, равномерно ограниченных внешних неизвестных возмущений. Метод. Задача решается с помощью методов классического вариационного исчисления для случая, когда промежуток времени адаптации и оптимизации заранее не задается. Основные результаты. Определены необходимые условия для выбора экстремального движения за счет надлежащего формирования замкнутой субоптимальной системы адаптивного управления. Теоретический анализ сопоставлен с компьютерными расчетами на конкретном модельном примере, который показал эффективность применяемого подхода. Обсуждение. Предложенная схема субоптимального адаптивного синтеза может быть использована при расчете и проектировании нелинейных управляемых динамических систем. Ключевые слова
динамическая система, функционал качества, множители Лагранжа, субоптимальное управление, адаптация,
уравнения Эйлера, условие трансверсальности
Благодарности
Работа выполнена при поддержке Министерства науки и высшего образования Российской Федерации, госзадание № 2019-0898.
Ссылка для цитирования: Блаженов А.В., Ведяков А.А., Милованович Е.В., Слита О.В., Тертычный-Даури В.Ю. Задача адаптивного субоптимального управления и ее вариационное решение // Научно-технический вестник информационных технологий, механики и оптики. 2024. Т. 24, № 2. С. 198-207. doi: 10.17586/2226-1494-2024-24-2-198-207
Adaptive suboptimal control problem and its variational solution
Alexey V. Blazhenov1, Alexey A. Vedyakov2, Ekaterina V. Milovanovich3, Olga V. Slita4«, Vladimir Yu. Tertychny-Dauri5
i,2,3,4,5 ITMO University, Saint Petersburg, 197101, Russian Federation
1 [email protected], https://orcid.org/0009-0009-2682-9128
2 [email protected], https://orcid.org/0000-0003-4336-1220
3 [email protected], https://orcid.org/0000-0002-9069-8574
4 [email protected]«, https://orcid.org/0000-0001-7119-3629
5 [email protected], https://orcid.org/0000-0003-4671-7659
Abstract
A suboptimal cross-border problem is considered about nonlinear dynamic controlled systems under deterministic, uniformly bounded external unknown disturbances. The problem is solved by applying the methods of classical variations calculus for the case when the time interval of adaptation and optimization is not set in advance. The necessary conditions
© Блаженов А.В., Ведяков А.А., Милованович Е.В., Слита О.В., Тертычный-Даури В.Ю., 2024
I/ITMO
НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ март-апрель 2024 Том 24 № 2 http://ntv.ifmo.ru/
SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS March-April 2024 Vol. 24 No 2 http://ntv.ifmo.ru/en/
ISSN 2226-1494 (print) ISSN 2500-0373 (online)
for the choice of extreme motion are determined due to the proper formation of a closed suboptimal adaptive control system. The theoretical analysis is supplemented with computer calculations using a specific model example, which showed effectiveness of the considered approach. The proposed scheme of suboptimal adaptive synthesis can be used in the calculations and design of nonlinear controlled dynamic systems. Keywords
dynamic system, quality functional, Lagrange multipliers, suboptimal control, adaptation, Euler equations, transversality condition
Acknowledgements
The work was carried out with the support of the Ministry of Science and Higher Education of the Russian Federation, state assignment passport 2019-0898.
For citation: Blazhenov A.V., Vedyakov A.A., Milovanovich E.V., Slita O.V., Tertychny-Dauri V. Yu. Adaptive suboptimal control problem and its variational solution. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2024, vol. 24, no. 2, pp. 198-207 (in Russian). doi: 10.17586/2226-1494-2024-24-2-198-207
Введение
В задачах оптимизации в условиях недостаточной априорной информации о действующих возмущениях важно организовать процесс адаптации — процесс восполнения недостаточной информации в ходе управления динамическим объектом. Процесс адаптации (настройки, обучения), под которым подразумевается выбор определенной стратегии, предполагает возможность идентификации действующих на объект управления возмущений с помощью специальным образом сформированной адаптивной обратной связи.
Отметим, что замена идеального оптимального управления, зависящего от неизвестных параметров на адаптивное субоптимальное управление и от известных настраиваемых параметров (оценок неизвестных параметров), происходит в соответствии с одним из двух основных подходов к синтезу адаптивных систем управления [1, 2]:
— «идентификационному», когда в найденный идеальный закон оптимального управления подставляют вместо неизвестных параметров их настраиваемые оценки;
— «прямому адаптивному управлению», где настройка параметров осуществляется непосредственно по рассогласованию динамических характеристик модели и искомой системы без предварительной идентификации объекта управления, т. е. когда параметры системы управления меняются до те пор, пока система не станет в некотором смысле равносильной модели.
Очевидно, что такая процедура обеспечивает сходимость субоптимальных значений функционала качества к его оптимальным значениям по мере сходимости процесса адаптивной параметрической идентификации, т. е. сходимости настраиваемых параметров к их истинным значениям.
Задачи субоптимизации адаптивных динамических систем в рамках линейной модели активно изучались во многих научных работах и решались разными методами и приемами. Отметим некоторые из них, оказавшие наибольшее влияние на последующее развитие теории. В работе [1] рассмотрены системы высокой размерности, большим числом входных и выходных переменных, параметрической и структурной неопределенностями. В [2-12] исследованы в основном линейные управляемые динамические системы с неизвестными
параметрами. Данные работы объединяют общий функционал качества, минимизацию которого требуется обеспечить в процессе адаптивного управления при разных дополнительных ограничительных условиях в рассматриваемых задачах адаптивного синтеза. В частности, этими условиями являются: присутствие помех [3], дискретность [4], критерий обобщенной работы [5], поисковый игровой подход [6], информационный метод [7], метод целевых неравенств [2, 8], информативный метод стохастической аппроксимации [9, 10], декомпозиционный подход с разложением на составляющие, более простые подсистемы [11], запаздывание в управлении [12]. Учет этих и других ограничений в перечисленных работах приводит к появлению результирующих алгоритмов адаптивного управления в виде законов субоптимального управления (с некоторым уровнем оптимальности). Нелинейным моделям из-за сложности анализа уделено значительно меньшее внимание [13, 14].
Настоящая работа посвящена изучению вопросов вариационного синтеза субоптимальных систем адаптивного управления для нелинейных динамических объектов регулирования и продолжает исследования начатых в работах [15-17] в области решения таких задач с помощью вариационных методов при наличии подвижной правой границы.
Постановка задачи
Пусть имеется функционал вида
Ч
3 = У[х(^), ¿1] + |^[х(0, х(0, у(0, {]<И ^ ех(1)
¿0
где гладкие скалярные функции У( ), F(•) имеют энергетический смысл: это заданные положительно определенные, непрерывно дифференцируемые по своим переменным скалярные функции; х(/) 6 Я" — измеряемый V/ 6 [¿0, ¿1] вектор состояния; у(/) 6 Я" — неиз-меряемый неизвестный вектор внешних, равномерно ограниченных возмущений: Бир/6[/0, ?1]||у(/)|| < Су, где Су > 0 — известная (либо неизвестная) константа, которая не участвует в анализе.
Движение исходной системы опишем уравнением
x(t) = fx, u, t) + v, x, u, v £ Rn
(2)
где u(t) £ U с Rn — вектор управлений, U — множество допустимых ограниченных непрерывных функций
и(0, t Е [/0, t]\. Предположим, что начальные значения х(/0), t0 заданы, но значения правой трансграничной точки х(^), t1 заранее неизвестны. Допустим, что вектор-функция /(•) Е Я" гладкая и задана.
Уравнение (1) устанавливает для управляемой системы векторную неголономную связь вида
y(x, х, u, v, t) = 0,
(3)
где тождество у(х, х, и, V, t) = /(х, и, t) + V - х, х, и, V Е Я".
Также считаем, что вектор-функция неизвестных возмущений v(t) удовлетворяет уравнениям настройки ее оценок у(0, т. е. интегральным уравнениям связей, формирующих оптимальное управление и0(0 = и0[х(^, у(0, t]. Эти связи задают сходящийся алгоритм внешней адаптации по правилу:
Ф
v(t), jv(s)ds, t
tn
= 0,
(4)
где тождество
v(t), jv(s)ds, t
= [V(t) - v(t)] +
+ [у(5) - v(s)] ё!} + в = у(0, v(t) Е Я",
а > 0, в = v(t0) - у(^) — заданные числа. Интегральное уравнение Вольтерра 2-го рода (4) имеет решение:
v(t) = v(t) - ße-a(t-to)-» 0,
(5)
приводящее к асимптотической сходимости оценок у(Г) к v(t) в зависимости от требуемой точности оценивания 5 > 0:
limjjv(t) - v(t)|| < 5
(6)
t—>t\
и времени окончания процесса оптимизации и адаптации t1; ||а(0|| — евклидова норма вектора а(0, ||a(t)|| = = (аЩ, а(0)1/2.
Требуется найти тройку неизвестных вектор-функций (x(t), u(t), v(t)) со значениями в Я", t Е tl], удовлетворяющую начальным условиям (х(^), v(to), to) и обеспечивающую выполнение условий: 3 ^ ех1г (1) одновременно с обеспечением требований у(х, х, и, V, t) =
= 0 (3) и ф
v(t), jv(s)ds, t
= 0 (4), где ф(0, у(0 £ Rn.
Задачу на условный экстремум сведем к задаче на безусловный экстремум с помощью введения множителей Лагранжа. С учетом условий (2), (3) и (4) запишем вспомогательный функционал качества в следующем виде:
J* = V[x(ti), tj + jW fx, u, t) + v), v(t), t] +
t0L
+ ^T(t)y(x, х, u, v, t) + + XT(t^(v(t), jv(s)ds, t^j
(7)
где ^(t), X(t) — неопределенные множители Лагранжа, ^(t), Щ £ Rn.
Согласно работе [15],
Sxfr) = 5x|i=il + i(i!)Sii. (8)
Алгоритм адаптации и его асимптотические свойства
Запишем интегральный алгоритм адаптации (4) в виде:
t
y(t) + aj y(s)ds + в = 0, a > 0, в = const, (9)
t0
где y(t) = v(t) - v(t), в = v(t0) - v(t0). Найдем решение (9) в асимптотике при t ^ да.
Для этого введем в рассмотрение обозначение:
t
z(t) = z(t0) + j y(s)ds, at) = y(t),
t0
Тогда алгоритм адаптации (9) преобразуем к виду: z(t) + a[z(t) - z(t0)] + в = 0
или к виду линейного однородного дифференциального уравнения в новых обозначениях по z(t):
z(t) + az(t) = 0. На том основании, что
(10)
z(t) + az(t) + [-az(t0) + ß] = 0 и z(t0) = -,
a
получим
[-az(t0) + ß] = 0.
Решение дифференциального уравнения (10) хорошо известно:
z(t) = z(t0)e-a(t-t0) = —e-a(t-t0) —^ 0, z(t) = z(t0)e-a(t-t0)(-a) = -ße-a(t-t0)-► 0,
т. е. имеем
^ = y(t) = - v(t) ► 0, либо ^ v(t) при t ^ да.
Отметим, что из уравнения (9) получим требование для выбора начального условия:
у(^) + в = 0 ^ в = v(to) - у(^).
Основные результаты
Из интегрирования по частям в функционале (7) получим
J* = V[x(tj), tj - ^T(t)x(t)j1 + j G(x, u, v, t)dt,
t0 t0
G(x, u, v, t) = G(x, u, v, t, ^(t), ¿(t), 1(f)) = = F(x, u, v, t) + ^r(t)fx, u, t) + v] + ¿T(t)x(t) +
(11)
■ XT(t^v(t), jv(s)ds, tj.
0
Величину вариации функционала 3* (11) на экстремальных движениях с подвижной трансграницей (х(/1), /1), где 5х(/0) = 0, с учетом возникающих вариаций 5х(/), 5и(/), 5у((), 5х(^1), 5^1 с точностью до величины 2-го порядка малости представим в формулировке следующей теоремы.
Теорема 1. С учетом непрерывной дифференцируе-мости по всем переменным функций У, G, а также справедливости выполнения соотношения (8) для 5х|г=?1, вариацию функционала 3* (11) зададим выражением:
53* = <3* = - цГ(, Л 5х(/1) +
V аж(*1> )
(дУЫи), ¿1]
+ I ^ + G(x, и, V, + ц^(/1)х(/1))5/1 + (Ц)
, '¡(ддх, д,у,<) \ + ] (-5х +--5и +--5v |</,
дх
Su
д\
полученным с точностью до малости 2-го порядка.
Доказательство теоремы в настоящей работе не приведено из-за массивности. Заметим, что доказательство полностью укладывается в известные схемы, типичные для вариационного исчисления [14]. Далее выберем векторный множитель ,(/) так, чтобы функциональные коэффициенты при 5х(^), 5х(/) в соотношении (12) обратились в нуль. Тогда получим систему п уравнений Эйлера по х с граничным условием на правом конце:
^^^ = 0, ,(/1) = ( М^У (13)
дх \ 5х(г0 )
или, с учетом обозначения (13), составим систему:
¿(t) = -
'dF(x, u, v, t) dflx, u, t)
dx(t)
+ ^
dx(t)
(14)
с граничным условием ,(/1) (13).
Таким образом, выражение (12) при наличии требований (13) перепишем в виде:
53 3 (эть),А]+G( Л|
53* = ш* = I-+ G(x, и, V, 01^, +
\ ди 1
+ ^ж/Л, + )( + (15)
+ адьъ^у
5У )
Допустим, что в равенстве (15) круглая скобка слева равна нулю:
ди
■ + G(x(tj), u(ti), v(ti),t!) + ^r(ti)x(ti) = 0.
Отсюда, используя граничные условия (13), полу-
aFTftiU] дУ[^),и]
-1-+ ——-— x(ti) + G(x(tj), u(tj), v(ti),ti) = 0
dti dx(ti)
или в более компактной форме:
woi
dtx
+ G(x(ti), u(ti), v(ti),ti) = 0,
что в итоге даст
dJ,
— = 0. dh
(16)
Требование (16) представляет собой условие трансверсальности в граничной точке Полагая условие (16) в точке / = /1 выполненным, получим, исходя из выражения (15), выполненным также и соотношение
SJ* — dJ* — J
)(dGjx, и, v, t)^ 8G(x, u, v, t) I I -ou +--
V au
д\
■5v )dt. (17)
В интеграле (17) для второго слагаемого, с учетом обозначения (11), выберем множители Лагранжа Х(/) 6 Я" таким образом, чтобы выполнялось равенство:
dG(x, u, v, f) dv
= 0,
(18)
приводящее к системе n уравнений Эйлера по v
8F(x, u, v, 0
5v(0
+ ^(t)I + lT(t)~
dv(t)
= 0,
где I = — единичная матрица размерности п.
Следовательно, интеграл (17) будет иметь вид:
5J* — dJ* — J
8G(x, u, v, t) du
oudt.
(19)
С целью обеспечения необходимых условий стационарности (экстремума) критерия качества 3* потребуем, чтобы в интеграле (19) выполнялось равенство:
dG(x, u, v, f) du
= 0.
(20)
Система п уравнений Эйлера по и (20) может быть записана с помощью обозначения (11) в виде системы уравнений
dF(x, и, v, t) dfix, и, i)
■ + ^T(t) 7 = 0.
öu(i)
ôu(f)
(21)
Совокупность 3п уравнений (13), (18), (20) вместе с уравнениями связей (3), (4) представляет собой замкнутую систему уравнений для нахождения вектор-функций х(/), и(/), v(/), ,(/), Х(/), обеспечивающих решение исходной условной вариационной задачи оптимального (субоптимального) адаптивного управления с подвижной границей на правом конце.
Полученный результат вариационного исследования для синтеза условной управляемой возмущенной динамической системы, отслеживающей п независимых связей запишем в виде следующей теоремы.
Теорема 2. Тройка вектор-функций (х(/), и(/), v(/)), реализующих экстремум (минимум) функционала (1) при наличии условий (3), (4) удовлетворяет при соответствующем выборе множителей Дк(0, к = 1, п уравнениям Эйлера, составленным для функционала 3* (7). Уравнения Эйлера для определения функций х(/), и(/), v(/), ,(/) и Х(/) имеют вид уравнений (13), (18), (20) с уравнениями связей (3), (4). Решение задачи (2), (4), (14) порядка 3п, где управление и(/) 6 и с Яп,
0
0
T
определяется уравнением (21) и осуществляется при наличии п начальных условий Х0 = х(^) на левом конце и п краевых условий (13) на правом конце.
К сказанному добавим, что для выполнения минимума критерия качества, когда 3 ^ тш^^, необходимо требование: 523 = 523* > 0, У5 и(0 ф 0.
Модельный пример. Синтез субоптимального адаптивного управления
В качестве наглядного и простого примера возьмем задачу с одноосным (по оси Ох) прямолинейным движением материальной точки с известной постоянной массой т под действием управляющей силы (управления) и($), приложенной к точке, и неизвестного равномерно ограниченного возмущения у(^: ¡¡иРге^МОУ - Су, Су > 0 — некоторая постоянная.
Допустим, что это движение осуществляется вдоль абсолютно гладкой опоры (поверхности), когда сила тяжести уравновешена силой реакции опоры в отсутствие силы трения. В этом случае движение точки опишем уравнением:
mq(t) = u(t) + v(t),
(22)
где q = q(t) — обобщенная (лагранжева) координата, представляющая собой отклонение точки от центра О системы координат. Движение точки (22) определяется
величиной кинетической энергии Т(?) =-:
d дЩ d
--т^ = —Q(t) = F(t).
dt 8q(t) dt
(23)
Уравнение (23) отвечает второму закону динамики Ньютона для количества движения Q(t) = m'q(t) и действующей на точку активной силы Е(Г) = и(() + у(t).
При этом предположим, что Vt Е [to, измерению подлежат функции q(t) и q(t), но не q(t).
Требуется оптимальным образом при данных условиях сформировать управляемое движение материальной точки, чтобы обеспечить минимизацию энергетического функционала качества (энергетических и мощностных затрат) вида (1):
J = x2(tj) + j [x2(t) + x2(t)]dt =
= x2(tj) + j {x2(t) + g2[u(t), v(t)]}dt — min,
0 u£U
(24)
где введены обозначения для векторов x, g 6 R2 скалярного управления u(t) 6 R и скалярного возмущения v(t) 6 R; т = 1/m = const, V(x, t) = x2(t):
(q), g f + (xv) U v)), f (Tu)
x2 = q2 + q2.
q2 + q2, g-
q
T(u + v)
2 = q2 + T2(u + v)2, g2 = f2 + T2v(2u + v)
относительно компонентов уравнения движения, переписанного в нормальном виде
х = 8(х, ., у), х = (Х1) = ф, 8= ^ у)).
Функция управления м(t) Е и, и Е С1[0; tl] — множество непрерывно дифференцируемых по t Е [0; функций, С1 — множество всех непрерывно дифференцируемых по t Е [0; tl] функций. Вектор Х0 = х(0) задается, а величины х(^), t1 определяются из дополнительных условий.
Функционал качества (24) можно записать так:
3 = х2(^) + | [хТАх + т2(и + у)2]^, А = (0 2), (25)
где А — положительно определенная матрица. В выражении (25) подынтегральная функция ^(х, и, у) > 0 представляет собой сумму положительно определенной квадратичной формы хТАх и положительной функции т2(и + у)2.
Перейдем к решению искомой условной вариационной задачи.
Пусть имеем два уравнения связей по х и по у соответственно: у() = 0 (3) и ф() = 0 (4).
Тогда вспомогательный функционал с помощью соотношений (3), (4) запишем в виде:
J* = x2(ti) + i{x2(t) + g2[x(t), u(t), v(t)] +
0 /г \1 (26)
^T(t)y(x, х, u ,v) + X(t^(v, jv(s)ds, t)jdt,
+ UT(
где = (^(0, ц2(0)Т Е Я2, Е Я — множители Лагранжа. Проинтегрируем по частям множители Лагранжа в функционале (26), получим:
ti + j
0 +
J* = x2(ti) - ^T(t)x(t)|01 + x2(t) + g2(x, u, v) + ^T(t)g(x, u, v) + (27)
¿T(t)x(t) + X(t^(v, jv(s)ds, t)
dt.
Выпишем по известной схеме вариацию функционала (27) согласно выражению (12):
5J* = [2x(ti) - H(ti)]T5x(ti) + [x2(ti) + g2(ti) +
+ ^T(ti)g(ti) + ^T(ti)x(ti) + ^T(ti)x(ti)]5ti +
tir
+ j (2xi + Ai)5xi + (4x2 + Д1 + №2 + (28)
0
+ (2t2u + 2t2v + ^2T)5u + (2t2u + 2t2v + ^t - ^ -jv(s)ds)5
- a—jv(s)ds )5v Dv0
dt.
В выражении (28) выберем множители ц^), так, чтобы выполнялись уравнения Эйлера (13) по Х1 и Х2 с граничными условиями на правом конце:
Ц1 = -2x1, ДЛ) = 2x1^1),
Ц2 = -Д1 - 4x2, Д2(^) = 2*2(^).
Тогда, при наличии этих соотношений, выражение для 53* (28) запишем в виде:
t
t
x =
J* = [x2(ti) + g2(ti) + ^T(ti)g(ti) + + ^T(ti)x(ti) + ^T(ti)x(ti)]5ti +
+ J
(2t2u + 2x2v + ц2х)5м +
+ (2t2u + 2x2v + - ^ - a—Jv(s)d.s^5v
dt,
где
v(0
1
-|у(5)<5 =-= ■ .
<И
Предположим, что условие трансверсальности выполнено, в результате получим уравнение для выбора момента времени /1:
Х2(/1) + g2(/l) + Ц^)^) + ,Т(/1)х(/1) + ,Г(/1)Х(/!) = 0,
где x2 — Xi2 +
x22, g2 — x22 + t2(u + v)2, ^Tg = ^x2 +
+ ц2х(м + v), ^Tx — ^ixi + ц2х2, ^Tx = ^ixi + д2х2.
Тогда получим:
J* — J
(2t2u + 2x2v + д2х)5и +
it 3vö
+ (2t2u + 2x2v + - ^ - a—Jv(s)d.s^5v
dt.
В этом интеграле выберем множитель Х(/) так, чтобы вторая скобка в подынтегральном выражении была равна нулю, т. е.
д /
X = 2т2(и + V) + д2т - а—|у(5)<5.
5У0
Тем самым, из стационарности функционала качества 3* получим формулу для задания адаптивного оптимального управления И0(/):
u(t) = U0(t) = -
2т
+ v(t)
(29)
Отметим, что зависимость %(/) (29), называемая «идеальной», включает в себя неизвестную функцию внешнего возмущения v(/), откуда следует, что формулой (29) напрямую воспользоваться невозможно.
Формулу для %(/) (29) можно применить для перехода к субоптимальному адаптивному управлению согласно следующей зависимости:
Ü0(t) = -
Ц2 (0
2т
+m
где у(0 — оценка v(/), удовлетворяющая выходу алгоритма параметрической настройки (4)-(9).
При такой замене (^(0 на Й0(/)) очевидно, исходный функционал качества 3 (24) будет принимать другие, большие значения. Обратимся в этой связи к известному определению [7], по которому управление м0(/) 6 и при некотором числе р 6 [0; 1] называется субоптимальным с уровнем субоптимальности р для функционала качества 3, если выполнено неравенство:
minJ — J|
u£U
u—U0
> J
U—Uq>
(31)
где и0(х, v, t) — оптимальное, а м0(х, v, t) — субоптимальное управления.
В соответствии с критерием (31) число р оценивает близость величины 3|Üo (t) к наименьшему значению функционала 3 (24). Приближение р к единице свидетельствует о приближении величины 3\Ü0(t) к минимально возможному. При р = 1 субоптимальное управление üo(t) становится оптимальным: 3\Ü0(t) = minJ. Последнее
ueü
условие требует большого времени адаптации или, другими словами, времени шумовой (параметрической) идентификации объекта управления: v(t) ^ v(t) при t ^ да.
Заметим, что смена оптимального режима функционирования системы на субоптимальный будет сопровождаться ухудшением качества показателей характеристик работы системы. Кроме того, решение задачи субоптимального управления сопряжено с такой серьезной трудностью, как требованием измерения только фазового вектора x(t), t e [0; tj и отсутствием информации о векторе скорости x(t). Для решения этой проблемы выполним следующее: в алгоритме адаптации (4)
[v(t) - v(t)] + a( j[v(s) - v(s)]ös) + ß = 0
вместо v(t) подставим приближенное значение v»(t), пользуясь аппроксимацией уравнения движения (2):
x2(t)-x2(t-e) „
х2--- Tü0(t) + xv*(t),
8
, x2(t) - x2(t - e) , ,, „
где v*(t) =--ü0(t), e > 0 — малый параметр. ет
При рассмотрении системы дифференциальных уравнений для определения переменных x(t) и ^(t) при заданных x(0) и x(ti) после подстановки в них Ü0(t) (30):
( xi(0 ) = ^2(X)(t) ^
lX2(t) ) 1 - Ty(t) Ь
( Ai(t) ) — ( -2xi(t) ) I ) (-^i(t) - 4x2(t) У
-2xi(t) i(t) - 4x
либо с учетом соотношений (4)-(9)
y(t) = v(t) - v(t) = [v(0) - v(0)]e-at,
(30) полагая, что величина v(0) известна, получим:
/ -x2 >
= + Tße-at)
2x
. ^i + 4x2 -
Для поиска общего решения введем вектор z = (х1, х2, ц1, ц2)г относительно линейной неоднородной системы дифференциальных уравнений 1-го порядка с постоянной матрицей коэффициентов системы:
z(t) = Bz(t) + w(t),
(32)
B
0 1 0 0
0 0 0 -1/2
2 0 0 0
0 -4 -1 0
, w(t) =
0
-Tße-at 0 0
z(t) = z, i = 1, 4.
Общее решение неоднородной системы z(t) (32) представляет собой сумму общего решения х(-) однородной системы ¿(^ = Bz(t) и какого-либо частного решения z(t) неоднородной системы (32): z(t) = + z(t).
Общее решение й(-) можно определить [15, 16] с помощью фундаментальной системы решений:
z(t) =
Ci + Qt C1 + C2 + C2t \et + 2(C2 - Ci - C2t) K-1(1C2 + C1 + C2t),
C3 + C4t
C4 - C3 - C4t
2(C4 + C3 + C4t) 2(2C4 - C3 - C4t)
где Ci, C2, C3, C4 — произвольные постоянные, а числа X = ±1 кратные двум являются собственными числами характеристического уравнения Д = det(B - XI) = 0 c единичной матрицей I размерности 4 х 4.
Что же касается частного решения z(t), то его следует задавать в известном виде с неопределенными коэффициентами у у
I Tiit + Г12 \ z(t) = ( Y21t + Т22 \e-at,
\ Y3it + Y32 /
V Y41t + Y42 ' Yy = const, i = 1, 4, j = 1, 2.
Поскольку коэффициент -тв при e-at — многочлен нулевой степени (число), а число -a в показателе степени у экспоненты e-at не является корнем характеристического уравнения Д = 0. Многочлен при e-at должен иметь степень на единицу больше, чем многочлен нулевой степени. Подставляя выражение z(t) с неопределенными коэффициентами у у в систему (32):
, С = - Tß,
получим после сокращения слева и справа на e-
% - a(Yiit + Y12)N Y21 - a(Y21t + Y22) Y31 - a(Y31t + Y32) VY41 - a(Y41t + Y42V
Y21t + Y22
-M_Y42 2 2
-2Yiit - 2Y12 k-4Y21t - 4Y22 - Y31t - Y32/
Приравнивая далее коэффициенты слева и справа при t и свободных членах, получим алгебраическую линейную неоднородную систему уравнений по угу, решая которую найдем:
у,, = к(24 + 10а2 - 3а4) к = —----;
11 (а + 6)(2а - 5а + 8)
к(а6 + 8а2 + 16) , „
у12 = —--, у21 = ка(3а4 - 10а2 - 24);
Y22 = K(2a2 - 3a4 - a6 + 8), Y31 =
к(а2 - 2)(4 - За2)
Y32 = 2K(a4 + 8), y41 = 2Ka(2 - a2)(a2 + 6), y42 = 0.
Определим субэкстремаль при ü0(t): x(t) = x(t) + x(t),
x<0 = ( $ ) = ( C^t)e' +
+(СС3+ +(+712 у-
\С4 - С3 - С4- / \У21- + Y22/
Таким образом, чтобы найти постоянные интегрирования С1, С2, С3, С4 и конечный момент времени t, надо задать четыре граничных условия с выбранными значениями п0, П1:
(Х1(0)) = ( ^0 ) (хх(-1>) = ( ^) (Х2(0)) ( % ^ (Х2(-1)) ( П1 )
и условие трансверсальности (17) для нахождения момента времени
аг[х(;о] дУ[*(к)]
-+-х(-1) + с[х(-1), и01), у(-1), tl] = 0,
ди
где
Ôx(i0
Т/Г (t M ч п V[x(ti)] = x2(ti),-= 0,
WiO]
Sil
= (2xi(ti), 2x2(t2)),
x12 + 2x22 + —
jt=ti +
9x(ii)
G[x(ti), Ü0(ti), v(ti), ti] = -
+ ß2e-2ati = -(Xl2 + 3x22)|t=tl + ß2e-2ati.
Важно, что
G(^)|t=ti = x2(ti) + g2(ti) + ^T(ti)g(ti) + ^T(ti)x(ti) = = xi2 + x22 + x22 + T2(ü0(t) + v)2 + ^ix2 + A2T(ü0(t) + v) +
+ Aixi + ¿2x2 = xi2 + 2x22 + t2^ + y) + H-ix2 +
+ Ц2т(2^ + y) + ^ixi + ^2x2
при t = ti, где
Ai = -2xi, Д2 = -Ai - 4x2 при t = ti; Ai(ti) = 2xi(ti), A2(ti) = 2x2(ti),
причем
y(ti) = v(ti) - v(ti) = -ße-ati, ß = -y(0).
e
Рисунок. Графики изменений значений: xj(t) и ^j(t) (a); x2(t) и ^.2(t) (b); u(t) (c) Figure. Graphs of changes in values: xj(t) and ^j(t) (a); x2(t) and ^2(t) (b); u(t) (c)
Следовательно, условие трансверсальности приобретает вид:
2х1(/1)х1(/1) + 2х2(/1)х2(/1) = х12(/1) + 3х22(/1) - р2е-2а/1, либо
^{(С + С2 + С2Н)вН + (С4 - С3 - С^)^ + + [уп(1 - а/1) - аУ12]е-а/1} + щ{(С1 + 2С2 + С^гЬ + + (С3 - 2С4 + С^)^ + [У21(1 - а/1) - аУ22]г-а/1} = _ + Зт|12 - р2е~2а/' 2 .
Рассмотрим числовой пример для следующих параметров и начальных условий: т = 1, ^ = 4, ^ = 0,5, П0 = 0, п1 = -4,5, в = 1, а = 0,1 были вычислены значения /1 = 2,72, ц1(0) = 10,83, д2(0) = 4,78, 3 = 1140,5.
На рисунке представлены результаты моделирования в пакете МАТЪАБ Simulink.
На рисунке, а, Ь видно, что за время /1 регулируемые переменные Х1(/) и Х2(/) приходят от заданных началь-
ных значений ^ и П0 к заданным конечным значениям и П1. Соответствующий этим переменным график сигнала управления и(/) изображен на рисунке, с.
Заключение
В работе выполнен детальный анализ новых типов оптимальных (субоптимальных) нелинейных управляемых динамических систем в условиях действия на них детерминированных (не наделенных статистическими свойствами) равномерно ограниченных внешних неизвестных возмущений. При этом промежуток времени адаптивного оценивания и оптимизации заранее не задан.
Результатом представленного вариационного исследования является полученный замкнутый синтез адаптивной субоптимальной алгоритмической схемы. Благодаря синтезу гарантируется достижение субоптимального режима функционирования исходной управляемой системы с достаточным уровнем оптимальности.
Литература
1. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. 548 с.
2. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с.
3. Барабанов А.Е. Адаптивное субоптимальное управление линейным объектом со стационарными (детерминированными) помехами // Вопросы кибернетики. Адаптивные системы управления. М.: Научный совет по кибернетике АН СССР, 1979. С. 107-116.
4. Бондарко В.А. Адаптивное субоптимальное управление решениями линейных разностных уравнений // Доклады АН СССР. 1983. Т. 270. № 2. С. 301-303.
5. Красовский А.А. Субоптимальный адаптивный алгоритм оценивания непрерывных процессов // Доклады АН СССР. 1976. Т. 230. № 3. С. 538-540.
6. Кунцевич В.М., Лычак М.М. Об оптимальном и адаптивном управлении динамическими объектами в условиях неопределенности // Автоматика и телемеханика. 1979. № 1. С. 79-83.
7. Немировский А.С., Цыпкин Я.З. Об оптимальных алгоритмах адаптивного управления // Автоматика и телемеханика. 1984. № 12. С. 64-77.
8. Пономаренко В.Н., Якубович В.А. Метод рекуррентных целевых неравенств в задачах субоптимального адаптивного управления динамическими объектами // Вопросы кибернетики. Адаптивные системы управления. М.: Научный совет по кибернетике АН СССР, 1977. С. 16-28.
9. Цыпкин Я.З. Оптимальные адаптивные системы управления // Доклады АН СССР. 1984. Т. 277. № 5. С. 1091-1096.
10. Цыпкин Я.З. Оптимальность в задачах и алгоритмах оптимизации при наличии неопределённости // Автоматика и телемеханика. 1986. № 1. С. 75-80.
11. Черноусько Ф.Л. Декомпозиция и субоптимальное управление в динамических системах // Прикладная математика и механика. 1990. Т. 54. № 6. С. 883-893.
12. Якубович В.А. Адаптивное субоптимальное управление линейным динамическим объектом при наличии запаздывания в управлении // Кибернетика. 1976. № 1. С. 26-43.
13. Красовский А.А. Аналитическая форма субоптимального адаптивного управления нелинейными объектами // Известия АН СССР. Техническая кибернетика. 1983. № 2. С. 137-145.
14. Тертычный-Даури В.Ю. Адаптивная механика. М.: Наука. Физматлит, 1998. 480 с.
15. Тертычный-Даури В.Ю. Галамех. Т. 4. Оптимальная механика. М.: Физматлит, 2019. 608 с.
16. Ведяков А.А., Милованович Е.В., Тертычный-Даури В.Ю., Тимофеева Г.В. Оптимальное управление как условная вариационная задача с подвижной правой границей // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 1. С. 59-66. https://doi.org/10.17586/2226-1494-2019-19-1-59-66
17. Ведяков А.А., Милованович Е.В., Слита О.В., Тертычный-Даури В.Ю. Вариационная задача адаптивного оптимального управления. Теоретический и прикладной компьютерный анализ // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23. № 2. С. 252-262. https://doi. org/10.17586/2226-1494-2023-23-2-252-262
References
1. Miroshnik I.V., Nikiforov V.O., Fradkov A.L. Nonlinear and Adaptive Control of Complex Dynamic Systems. St. Petersburg, Nauka Publ., 2000, 548 p. (in Russian)
2. Fomin V.N., Fradkov A.L., Iakubovich V.A. Adaptive Control of the Dynamic Objects. Moscow, Nauka Publ., 1981, 448 p. (in Russian)
3. Barabanov A.E. Adaptive suboptimal control of a linear object with stationary (deterministic) interference. Voprosy kibernetiki. Adaptivnye sistemy upravlenija, Moscow, Nauchnyj sovet po kibernetike AN SSSR, 1979, pp. 107-116. (in Russian)
4. Bondarko V.A. Adaptive suboptimal control of solutions of linear difference equations. Doklady Akademii Nauk SSSR, 1983, vol. 270, no. 2, pp. 301-303. (in Russian)
5. Krasovskii A.A. Suboptimal adaptive algorithm for continuous processes estimating. Doklady Akademii Nauk SSSR, 1976, vol. 230, no. 3, pp. 538-540. (in Russian)
6. Kuntsevich V.M., Lychak M.M. Optimal and adaptive-control of dynamic objects under conditions of uncertainty. Automation and Remote Control, 1979, vol. 40, no. 1, pp. 60-68.
7. Nemirovskii A.S., Tsypkin Y.Z. Optimal adaptive-control algorithms. Automation and Remote Control, 1984, vol. 45, no. 12, pp. 15891600.
8. Ponomarenko V.N., Iakubovich V.A. Method of recurrent target inequalities in problems of dynamic objects suboptimal adaptive control. Voprosy kibernetiki. Adaptivnye sistemy upravlenija, Moscow, Nauchnyj sovet po kibernetike AN SSSR, 1977, pp. 16-28. (in Russian)
9. Tsypkin Ya.Z. Optimal adaptive control systems. Doklady Akademii nauk SSSR, 1984, vol. 277, no. 5, pp. 1091-1096. (in Russian)
10. Tsypkin Y.Z. Optimality in problems and optimization algorithms under indeterminacy. Automation and Remote Control, 1986, vol. 47, no. 1, pp. 67-72.
11. Chernous'ko F.L. Decomposition and suboptimal control in dynamical systems. Journal of Applied Mathematics and Mechanics, 1990, vol. 54, no. 6, pp. 727-734. https://doi.org/10.1016/0021-8928(90)90001-q
12. Iakubovich V.A. Adaptive suboptimal control of a linear dynamic object in the presence of control lag. Kibernetika, 1976, no. 1, pp. 2643. (in Russian)
13. Krasovskii A.A. Analytical form of suboptimal adaptive control of nonlinear objects. Izvestija AN SSSR. Tehnicheskaja kibernetika, 1983, no. 2, pp. 137-145. (in Russian)
14. Tertychny-Dauri V.Yu. Adaptive Mechanics. Moscow, Nauka. Fizmatlit Publ., 1998, 480 p. (in Russian)
15. Tertychny-Dauri V.Yu. Galamech. Vol. 4. Optimum Mechanics. Moscow, Fizmatlit Publ., 2019, 608 p. (in Russian)
16. Vedyakov A.A., Milovanovich E.V., Tertychny-Dauri V.Yu., Timofeeva G.V. Optimal control as conditional variational problem with variable right endpoint. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2019, vol. 19, no. 1, pp. 59-66. (in Russian). https://doi.org/10.17586/2226-1494-2019-19-1-59-66
17. Vedyakov A.A., Milovanovich E.V., Slita O.V., Tertychny-Dauri V.Yu. Variational problem of adaptive optimal control. Theoretical and applied computer analysis. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2023, vol. 23, no. 2, pp. 252-262. (in Russian). https://doi.org/10.17586/2226-1494-2023-23-2-252-262
Авторы
Блаженов Алексей Викторович — кандидат физико-математических наук, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, https://orcid.org/0009-0009-2682-9128, а_ [email protected]
Ведяков Алексей Алексеевич — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, sc 49664023200, https://orcid.org/0000-0003-4336-1220, [email protected]
Милованович Екатерина Воиславовна — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, sc 57193453414, https://orcid.org/0000-0002-9069-8574, [email protected]
Authors
Alexey V. Blazhenov — PhD (Physics & Mathematics), Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, https://orcid.org/0009-0009-2682-9128, [email protected]
Alexey A. Vedyakov — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, sc 49664023200, https://orcid.org/0000-0003-4336-1220, vedyakov@ itmo.ru
Ekaterina V. Milovanovich — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, sc 57193453414, https://orcid.org/0000-0002-9069-8574, [email protected]
Слита Ольга Валерьевна — кандидат технических наук, доцент, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ее 16242570700, https://orcid.org/0000-0001-7119-3629, [email protected]
Тертычный-Даури Владимир Юрьевич — доктор физико-математических наук, профессор, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, бс 8980267000, https:// orcid.org/0000-0003-4671-7659, [email protected]
Olga V. Slita — PhD, Associate Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, sc 16242570700, https://orcid.org/0000-0001-7119-3629, [email protected]
Vladimir Yu. Tertychny-Dauri — D.Sc. (Physics & Mathematics), Professor, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, sc 8980267000, https://orcid.org/0000-0003-4671-7659, [email protected]
Статья поступила в редакцию 16.01.2024 Одобрена после рецензирования 02.03.2024 Принята к печати 27.03.2024
Received 16.01.2024
Approved after reviewing 02.03.2024
Accepted 27.03.2024
Работа доступна по лицензии Creative Commons «Attribution-NonCommercial»