О некоторых задачах синтеза оптимального управления с матричной и векторной составляющими в системе Риккати
У.А. Сактанов, Б.О. Кочконбаева, А.И. Сиянов, Д.К. Ярошевич
Лысьвенский филиал «Пермский национальный исследовательский политехнический
университет», г. Лысьва
Аннотация: Сформулирована задача синтеза оптимального управления и учтена матричная и векторная составляющие в системе Риккати. Для определения закономерностей использован метод динамического программирования Беллмана. Рассмотрена конкретная математическая модель процесса колебаний и численно исследованы свойства. Приведены примеры линейной и квазилинейной задачи и определено наименьшее возможное значение критерия качества. Построены соответствующие графические зависимости и с помощью инструментария оптимального управления осуществлен перевод состояния объекта из одной точки в другую. Путем использования метода степенных рядов Зубова выявлено оптимальное управление. Произведены численные расчеты и получены функции Риккати в нелинейной системе с сосредоточенными параметрами.
Ключевые слова: задачи синтеза, оптимальное управление, матричная и векторная составляющие, система Риккати, процесс колебаний, критерии качества.
Введение
В решении задач синтеза оптимального управления линейными системами с сосредоточенными параметрами широко используется матричное дифференциальное уравнение типа Риккати [1-3].
Известно, что при постоянных коэффициентах линейной системы с сосредоточенными параметрами решение уравнения Риккати имеет интервалы стационарности. Эти стационарные значения успешно используются для алгоритмов управления и стабилизации [4].
Если минимизируется отклонение системы с сосредоточенными параметрами от ненулевой величины, то в системе Риккати, кроме известного матричного уравнения, присутствует векторное уравнение, векторная составляющая [5, 6]. На данный момент свойства векторной составляющей не достаточно изучены. Поэтому, как следствие, в рамках данной статьи численно исследуется векторная составляющая системы Риккати.
и
Постановка линейной задачи
Пусть математическая модель управляемого процесса имеет вид:
^^ = Ах(1) + Ьи ) + /, х(0) = х0, (1)
Л
где А, Ь, / - постоянные матрицы п*п, п*1 соответственно, х(0 - п-мерный вектор, характеризующий состояние процесса, ы(^) - скалярное управление.
Задан критерий качества:
т т
! + ВС и 2'
J = Yi J (x(t) - g )* Q( x(t) - g )dt + Y 2 (x(T) - g )* F (x(T) - g) + p J u 2 (t )dt, (2)
о 0
где (*) - символ транспонирования; F и Q - положительно определенные матрицы; g - числовой вектор-столбец; постоянные - yi, у2 > 0, в > 0; T -конечный момент времени.
В рамках задачи найдем управление u°(t) и соответствующее ему решение x0(t) задачи Коши (1) так, чтобы критерий качества (2) принимал наименьшее возможное значение.
Для решения используем метод динамического программирования Беллмана [3, 7].
Пусть в критерии качества (2) желаемое состояние g(t) = g = const Ф 0. Имеем вспомогательную систему типа Риккати, состоящую из матричного, векторного и скалярного дифференциальных уравнений вида [5, 8]:
- dK(t) = q + KA + А*к -1 Kbb*K, К(T) = Y2F ,
dt Р
- ^ = -2Qg + А*ф - 1 КЬЬ*ф + 2Kf, Ф(Т) = -2y 2 Fg,
dt p
- ^ = g*Qg + Ф* (t)bb>( t) + fУt), л(Т) = Y2g*Fg. (3)
dt
Оптимальное синтезирующее управление вычисляем по формуле [4]:
u°(t) = -ib*{2K(t)x(t) + Ф(0}. (4)
и
Численно исследуем свойства вектора ф(£). Рассмотрим конкретную математическую модель процесса колебаний вида (1): йх(г) 1
йг 3 йу (г)
х(г) + у(г) + щ(г) + /1, х(0) = -1, -х(г) +1(г) + и2(г) + /2, у(0) = 1,
йг
^ = -6х(г) - у(г) - 2(г) + щ (г) + /3, 7(0) = 2.
йг
Пусть g = g2, gз,) * = (3, 3, 3) *,/ = //2,/3,) * = (0, 0, 0) *. При нулевом управлении = 0 получаем графики, изображенные на рис. 1.
Рис. 1. - Состояние объекта (1) при нулевом управлении = 0
Построим управление, обеспечивающее перемещение решения (х(^), у(0, 2(0) системы (1) в окрестность g.
В алгоритме управления используем стационарные значения матричной и векторной составляющих = с\, ф(?) = с2:
и\г) = -1 Ь*{2с1 х(г) + С2 }, (5)
где С1 - квадратная матрица, с2 - вектор-столбец.
и
Результаты расчетов приведены на рис. 2 - 4.
Рис. 2. - Матричные функции Риккати £¿,(0 в (3)
Рис. 3. - Векторные функции Риккати фг(?) в (3)
В рассмотренном примере осуществлен перевод состояния объекта из начальной точки в окрестность заданной конечной точки g с помощью управления при соответствующем параметре р.
Видно (рис. 2, 3), что компоненты матричной и векторной функций имеют интервалы стационарности. Управления (4) и (5) переводят процесс из начального состояния (-1, 1, 2) в заданное состояние (3, 3, 3) с удовлетворительной точностью. Соответствующие графики имеет одинаковую закономерность и изображены на рис. 4.
Рис. 4. - Состояние объекта (1) при управлении (4) и (5)
Постановка квазилинейной задачи
Пусть управляемый процесс [9, 10] описывается дифференциальным уравнением:
^^ = Ax + Bu(t ) + b( x)u(t ), x(0) = x0, (6)
dt
где x(t) - скалярная функция; u(t) - скалярное управление; t 6 [0, T]; полином
2 3
b(x) = b1x + b2x + b3x ; A, B, b1, b2, b3, x0, T - постоянные.
Критерий качества управления имеет вид:
т
J = j(x2 +pu2 ) dt + Ф0 +Ф1 x(T ) + Ф2 x 2(T ), (7)
о
и
где постоянные в, Ф0, Фь Ф2 > 0.
В рамках задачи найдем управление и°(¿) и соответствующее ему
решение задачи Коши (6) так, чтобы критерий качества (7) принимал
наименьшее возможное значение.
Такую задачу решаем методом динамического программирования
Беллмана [3, 7] и для решения уравнения воспользуемся методом степенных
рядов Зубова [8].
В результате оптимальное управление представим в виде:
1 0 5
и V) = --(В + Ь( х))—, р ох
<х>
где 5 (г, х(г)) = ^ к (г) X (г), 5 (Т, х) = Ф 0 + Ф1 х(Т) + Ф 2 х2 (Т).
I=0
Вспомогательная бесконечная система типа Риккати имеет вид:
- ^ = Лк, - В2кЦк2 - ^к, кх (Т) = ф; Ж 1 р 1 2 2р 1 1 1
¿к2(г) л ^ Л1 В2 ,2 „ 7 ч 2ВЬ^ 1 ВЬ2 Ь2 2 7 ^ 24 у = 1 + 2Лк9 - — (4к2 + 6кк) --1 кк - (—2 + —)к2, к9 (Т) = Ф;
< 2 4р 2 1 3 р 1 2 2р 4р 1 ' 2'
(г) в2 вь , 2ВЬ0 вы ,
= 3Лк, - — (8кк4 + 12к,к,)- —^(6кЛ, + 4к2)--2кк к2 -
< 4р 14 2 3 2р 13 2 р 1 2 2р 1
к,к2 -^к2, к3(Т) = 0; ... и т.д. (8)
р 12 2р
Численные расчеты выполнены при следующих значениях параметров: Т = 6.5; п = 1200; Л = 1; В = 0.5; Ь = 1; Ь = 2; Ь3 = 3; Ф0= 0.1; ф= 0.2; Ф2 = 0.3; р = 0.01; х0 = 0.8. Решения системы (8) приведены на рис. 5.
0.3 0.2 0.1 о -0.1 -0.2 -0.3 -0.4
0 1 2 3 4 5 6 7
Рис. 5. - Функции Риккати к^), к2(/% к3(?), к4(1) в нелинейной системе с сосредоточенными параметрами (8)
На рис. 5 в интервале времени (0, 6) показаны стационарные значения кг, (г = 1, ...,4) первых четырех функций - решений к1(^), к2(0, к3(£), к4(0 системы (8):
к1 = 2.9760 ■ 10 -221; к2 = 0.2440; к3 = - 0.3891; к4 = 0.1032.
Выводы
1. Рассмотрена математическая модель процесса колебаний и выполнены численные исследования свойств. Приведены примеры задач и определено наименьшее возможное значение критерия качества.
2. Построены соответствующие графические зависимости и выявлено оптимальное управление. В линейной и квазилинейной системе определены интервалы стационарности решений векторной составляющей системы типа Риккати.
3. Произведены численные расчеты и выведены функции в нелинейной системе с сосредоточенными параметрами. Стационарные значения использованы в алгоритмах управления.
V
• • • • • • • • •
• / • • t
Литература
1. Mikkola K. Riccati equations and optimal control of well-posed linear systems // Mathematics / arXiv: Optimization and Control. 2016. URL: researchgate.net/publication/301841081.
2. Mokhtarzadeh M.R., Pournaki M.R., Razani A. A note on periodic solutions of Riccati equations // Nonlinear Dynamics. 2010. Vol. 62 (1). URL: link.springer.com/article/10.1007/s11071-010-9703-9.
3. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1978. 551 с.
4. Альбрехт Э.Г., Шелементьев Г.С. Лекции по теории стабилизации. Екатеринбург: Уральский гос. ун-т им. А.М. Горького, 1972. 273 с.
5. Егоров А.И. Основы теории управления. М.: Наука, 2004. 504 с.
6. Шаршеналиев Ж.Ш., Самохвалова Т.П., Сактанов У.А. Моделирование и оптимизация управляемых технологических процессов. Бишкек: Илим, 2009. 242 с.
7. Беллман Р. Динамическое программирование. М.: ИЛ, 1960. 400 с.
8. Зубов В.И. Лекции по теории управления. М.: Наука, 1975. 495 с.
9. Андрашитов Д.С., Костоглотов А.А., Костоглотов А.И., Лазаренко С.В., Ценных Б.М. Универсальный метод синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами // Инженерный вестник Дона, 2014, №1. URL: ivdon.ru/ru/magazine/archive/n1y2014/2251.
10. Пшихопов В.Х., Медведев М.Ю. Алгоритмическое обеспечение робастных асимптотических наблюдателей производных // Инженерный вестник Дона, 2011, №2. URL: ivdon.ru/ru/magazine/archive/n2y2011/431.
References
1. Mikkola K. Mathematics. arXiv: Optimization and Control. 2016 URL: researchgate.net/publication/301841081.
2. Mokhtarzadeh M.R., Pournaki M.R., Razani A. Nonlinear Dynamics. 2010. Volume 62 (1) URL: link.springer.com/article/10.1007/s11071-010-9703-9.
3. Roytenberg YA.N. Avtomaticheskoe upravlenie [Automatic control]. M.: Nauka, 1978. 551 p.
4. Al'brekht EH.G., Shelement'ev G.S. Lektsii po teorii stabilizatsii. [Lectures on the theory of stabilization]. Yekaterinburg: Ural'skiy gos. un-t im. A.M. Gor'kogo, 1972. 273 p.
5. Egorov A.I. Osnovy teorii upravleniya [Fundamentals of management theory]. M.: Nauka, 2004. 504 p.
6. Sharshenaliev ZH.SH., Samokhvalova T.P., Saktanov U.A. Modelirovanie i optimizatsiya upravlyaemykh tekhnologicheskikh protsessov [Modeling and optimization of controlled technological processes]. Bishkek: Ilim, 2009. 242 p.
7. Bellman R. Dinamicheskoe programmirovanie [Dynamic programming]. M.: IL, 1960. 400 p.
8. Zubov V.I. Lektsii po teorii upravleniya [Lectures on management theory]. M.: Nauka, 1975. 495 p.
9. Andrashitov D.S., Kostoglotov A.A., Kostoglotov A.I., Lazarenko S.V., Tsennykh B.M. Inzhenernyj vestnik Dona, 2014, №1. URL: ivdon.ru/ru/magazine/archive/n1y2014/2251.
10. Pshikhopov V.KH., Medvedev M.YU. Inzhenernyj vestnik Dona, 2011, №2. URL: ivdon.ru/ru/magazine/archive/n2y2011/431.