УДК 681.5 ББКЖ50
РЕШЕНИЕ ЗАДАЧИ СЛЕЖЕНИЯ ДЛЯ ЛИНЕЙНОЙ СИСТЕМЫ УПРАВЛЕНИЯ НА ОСНОВЕ МЕТОДА ИНВАРИАНТНЫХ ЭЛЛИПСОИДОВ1
Железное К. 0.2, Квинто Я. И.3, Хлебников М.В.4
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)
Рассматривается одна из возможных постановок задачи слежения для линейной системы управления. В качестве технического средства используется метод инвариантных эллипсоидов, что позволяет переформулировать исходную задачу в терминах линейных матричных неравенств и свести ее к задаче полуопределенного программирования. Численное моделирование демонстрирует эффективность предложенного подхода.
Ключевые слова: задача слежения, линейная система управления, линейные матричные неравенства, инвариантные эллипсоиды.
1. Введение
Как хорошо известно, задача слежения является одной из основных задач теории управления; этой тематике посвящено множество публикаций, см., например, [5, 10, 12, 15, 16]. Известны самые различные постановки задач слежения: это и классическая задача линейного оптимального управления с помощью линейного следящего управления [10], и задача слежения с использо-
1 Исследование выполнено при финансовой поддержке РФФИ (проект №18-08-00140).
2 Кирилл Олегович Железнов, аспирант ([email protected]).
3 Яна Игоревна Квинто, кандидат технических наук ([email protected]).
4 Михаил Владимирович Хлебников, доктор физико-математических наук ([email protected]).
ванием естественного следящего управления [15], и нелинейная задача слежения [12], и многие другие. Столь же широк и спектр подходов к их решению; среди наиболее известных можно выделить линейное следящее управление, естественное следящее управление, аппроксимирующую последовательность уравнений Риккати. В рамках £\-теории робастного управления решена задача точной оценки качества слежения робастной системы управления в условиях полной априорной информации о номинальной модели и верхних границах неопределенностей и внешних возмущений [5].
В настоящей работе предложен подход к одной из возможных постановок задачи слежения на основе метода инвариантных эллипсоидов [3, 6]. Такой подход прост с технической точки зрения, позволяет легко учитывать ограниченность управления и имеет большой потенциал и возможности для обобщений. Наиболее идейно близкой публикацией к данной работе является [1], посвященная линейной задаче слежения по выходу системы. Однако в [1] предполагается, что задающий сигнал удовлетворяет некоторому дифференциальному уравнению, в которое в качестве одного из слагаемых входит ограниченное возмущение. В настоящей работе предполагается только ограниченность сигнала и его производной, что позволяет рассматривать более широкий класс задающих сигналов.
В качестве технического средства задействован мощный аппарат линейных матричных неравенств [4, 11], который позволяет свести исходную задачу к поиску инвариантного эллипсоида, содержащего фазовое состояние динамической системы. С вычислительной точки зрения проблема сводится к решению задачи полуопределенного программирования; для ее решения существуют эффективные программные средства, в частности свободно распространяемые пакеты SDPT3 [21, 22], YALMIP [19] и ^х [13, 14] на базе системы MATLAB.
(2)
^ 7 для всех t ^ 0.
2. Постановка задачи
Рассмотрим линейную непрерывную систему управления
(1) х = Ах + Ви + Б/, х(0) = х0,
где А е мгахга, в е мгахр, Б е мгахга, с фазовым состоянием х(1) е Мга, управлением и(1) е Мр и задающим сигналом /(¿) е Мга, удовлетворяющим ограничению
Г
л
Отметим, что никаких других ограничений на задающий сигнал f (£) не накладывается. Пара (А, И) предполагается управляемой.
Здесь и далее || ■ || — евклидова норма вектора; т — символ транспонирования; ^ — след матрицы; I — единичная матрица соответствующей размерности, а все матричные неравенства понимаются в смысле знакоопределенности матриц.
Задача состоит в построении статической линейной обратной связи, которая: а) стабилизирует линейную систему (1)-(2), т. е. делает матрицу системы гурвицевой, что гарантирует ограниченность траекторий системы, и б) минимизирует рассогласование
(3) е = ж - f е Мга;
критерий минимизации рассогласования е будет обсужден в следующем разделе.
Непосредственным дифференцированием (3) приходим к системе
е = Ае + Ви + (А + Б)/ -Введя обозначение
= ^ е М2га
окончательно получаем
(4) ё = Ае + Ви + D0w,
где
11^(^)11 ^ 7 для всех t ^ 0,
а
Do = {А + D -1) .
Будем полагать, что в каждый момент времени т нам доступны значения е(т) и и!(т), которые будем использовать для синтеза искомой обратной связи. А именно, будем искать комбинированную обратную связь (см. [17]) вида
(5) и = Кге + К^, где Кг е Мрхга, К2 е Мрх2га
При этом, в силу совместной ограниченности значений f (г) и / (т), естественно интерпретировать входной сигнал и> в (4) как ограниченное внешнее возмущение.
3. Вспомогательные сведения
Нам понадобятся некоторые сведения, относящиеся к технике линейных матричных неравенств [4, 11] и методу инвариантных эллипсоидов [6]. Инвариантные множества широко используются в различных задачах гарантированного оценивания, фильтрации и минимаксного управления в динамических системах при наличии неопределенностей. Принципиальными в этом направлении можно считать работы Ф. Швеппе [20], А.Б. Кур-жанского [2] и Ф.Л. Черноусько [9].
Рассмотрим динамическую систему
(6) х = Ах +
где А е Мгахга, И е Мгахт, c фазовым состоянием х(Ъ) е Мга, и внешним возмущением <ы(1) е Мт, ограниченным в каждый момент времени:
(7) \\™(Щ < 1 для всех г ^ 0.
Никаких других ограничений на возмущение не накладывается; так, оно не предполагается ни случайным, ни гармоническим. Заметим, что более общее ограничение вида
УМ^У ^ 7 для всех £ ^ 0
легко сводится к рассматриваемому случаю за счет соответствующего масштабирования матрицы И.
Будем полагать, что система (6) устойчива (матрица А гур-вицева, пара (А, И) управляема). 48
Определение 1. Эллипсоид с центром в начале координат £Р = {х е Мга: хТР-1х ^ 1}, Р У 0,
называется инвариантным для системы (6)-(7), если из условия х(0) е £р следует х(Ъ) е £р для всех моментов времени £ ^ 0 и всех допустимых возмущений ■ш^).
Это означает, что вектор фазового состояния системы будет оставаться внутри £р, если он находится в этом эллипсоиде в начальный момент времени. Матрица Р называется матрицей эллипсоида £р.
Отметим, что из условия управляемости системы следует существование хотя бы одного инвариантного эллипсоида — совпадающего со всем фазовым пространством. Вообще говоря, инвариантный эллипсоид может оказаться неограниченным (матрица Q = Р-1 вырождена) или иметь меньшую размерность (при отсутствии управляемости). Далее мы будем иметь дело с регулярным случаем, когда инвариантные эллипсоиды имеют полную размерность и ограничены.
Теорема 1 [4, 6]. Эллипсоид £р является инвариантным для динамической системы (6)-(7) тогда и только тогда, когда его матрица Р У 0 удовлетворяет линейному матричному неравенству
АР + РАТ + аР + 1ОБ1 4 0
а
при некотором а > 0.
Инвариантные эллипсоиды могут рассматриваться как средство оценивания возможных значений состояния динамической системы, находящейся под влиянием ограниченного постоянно действующего возмущения. Степень влияния ограниченных внешних возмущений •^(ь) на состояние х(Ь) системы будем характеризовать минимальным инвариантным эллипсоидом. Минимальность эллипсоидов можно понимать по-разному; в дальнейшем в качестве критерия примем критерий следа ^ Р, соответствующий сумме квадратов длин полуосей эллипсоида с матрицей Р.
4. Основной результат
Вернемся к задаче минимизации рассогласования е = х — f для системы (1). Будем искать минимальный инвариантный эллипсоид для системы (4), замкнутой регулятором (5); она принимает вид
(8) ё = Асе + Dcw, где
Ас = А + BKU Dc = D0 + ВК2.
Сформулируем основной результат работы в виде следующей теоремы.
Теорема 2. Пусть Р, Y, К2 — решение задачи
(9) mintrP при ограничениях
(10)
{АР+РАТ + аР + BY+YтВт 7(^o + ВК2)\ ^ п _ п V 7(Do + ВК2)Т —а1 Л 0' Р * 0
где минимизация проводится по матричным переменным Р = Рт е Rraxra, Y е Wxn, К2 е Мрх2га и скалярному параметру а. Тогда регулятор (5) с матрицей
(YР-1 К2)
стабилизирует систему (4); при этом Р является матрицей инвариантного эллипсоида для замкнутой системы с нулевым начальным условием.
Доказательство. Применяя Теорему 1 к замкнутой системе (8) и минимизируя размер инвариантного эллипсоида с матрицей Р, получаем задачу
min tr Р
при ограничениях
(А + ВК\)Р + Р (А + ВКг)Т + аР+
+ 1j2(Do + ВК2)фо + ВК2)Т 4 0, Р У 0.
а
Воспользовавшись леммой Шура [8], первому из ограничений придадим вид
((А + ВКг)Р + Р(А + ВКг)Т + аР 7(^0 + ВК2)\ 4 0 V 7(^0 + ВК2)Т -а1 ) 4 0
Введем вспомогательную матричную переменную
У = КгР,
исключая Кг. В силу Р У 0, матрица Кг восстанавливается единственным образом:
Кг = УР-1.
В результате приходим к утверждению теоремы. Теорема доказана.
Сделаем несколько замечаний и комментариев.
1. В ограничениях оптимизационной задачи, сформулированной в теореме, фигурируют как нестрогие, так и строгие матричные неравенства. Возникающая в связи с этим специфика подробно освещена в [4, гл. 2]; она является типичной для используемой техники.
2. Заметим, что минимизация состояния е системы (8) может осуществляться за счет сколь угодно больших значений управления, поэтому естественно потребовать введения ограничений на его величину, например, при помощи явного ограничения вида ||и(£)|| ^ у (см. [7]). Однако в данном случае удобно ввести ограничение на первую компоненту управляющего воздействия (5): (11) ЦКгеЦ < 0.
Дело в том, что в отличие от Кг параметр К2 входит в условия оптимизационной задачи явным образом и поэтому на него — при необходимости — ограничения могут быть заданы априори.
Как показано в [11], условие (11) гарантируется выполнением линейного матричного неравенства
'Р
? Л
которое добавляется в качестве дополнительного условия к ограничениям задачи, сформулированной в теореме.
3. При фиксированном а минимизация (9) при ограничениях (10) представляет собой задачу полуопределенного программирования. При этом оказывается возможным указать границы интервала варьирования параметра а (подробнее см. [4]). А именно, рассмотрим задачу
min Л
при ограничениях
(АР + РАТ + аР + BY + YTBт 7(DQ + ВК2)\ * V 7(Dq + ВК2)Т -а1 ) * 0
(Р ^
^ 0, Р У 0,
где минимизация проводится по матричным переменным Р = РТ е у е Мрхп, к2 е Мрх2п, скалярной переменной Л и
скалярному параметру а > 0.
Легко показать, что допустимым диапазоном варьирования параметра а является вся положительная полуось. При каждом фиксированном значении а полученная задача является задачей полуопределенного программирования; ее решение доставляет функцию ^тт(а) = л/Лт\п(а), на рис. 1 показан график функции Ц.тп(а) для некоторой системы.
Пусть задан некоторый уровень у допустимых управлений. Тогда проекция сечения надграфика функции на уровне у на горизонтальную ось дает соответствующий этому уровню интервал [а, а] варьирования параметра а.
4. Устанавливаемые в теореме условия являются только достаточными и приводящими к субоптимальным решениям. Впрочем, это замечание относится к большинству результатов, получаемых в рамках применяемого подхода.
^mii
Рис. 1. График функции ßmm(a)
5. Пример
Продемонстрируем предложенный подход на примере системы вида (1), в которой числовые значения матриц взяты из задачи AC11 из библиотеки COMPleib [18]:
(- 1,341 0,9933 0 -0,1689 0,2518
43,223 -0,8693 0 -17,251 -1,5766
А = 1,341 0,0067 0 0,1689 0,2518 ,
0 0 0 -20 0
V 0 0 0 0 -20
(0 0 ^ 0 0 1 0 0 ^
0 0 47,76 -0,268 0 -4,56 4,45
0 0 , D = 0 0 0 1 0
20 0 0 0 0 0 1
Vo 20У 0 0 0 0 0
В =
Решение оптимизационной задачи из Теоремы 2 для 7 = 1 и ц. = 5 достигается при
а = 6,6;
этому значению параметра соответствуют следующие величины:
Р
( 1,8083 -2,1786 -0,8381 5,0692 3,5415 \
-2,1786 49,171 -0,6509 40,1701 -2,3267
-0,8381 -0,6509 0,6105 -0,8683 -4,2103
5,0692 40,1701 -0,8683 120,707 -35,5206
3,5415 -2,3267 -4,2103 -35,5206 47,381
К7 =
1245,1 147 1935
-1685,9 -198,6 -2636,1
-79,3 106,9 27,1 -37,5
К? =
7,7995 0,5486 0,6452 -0,1652 0,2047 -0,6452 -0,0851 -0,685 0,05 0
-3,261 -0,3446 -0,362 -1,0632 0,6886 0,362 0,0212 1,357 0 0,05
На рис. 2 в качестве иллюстрации изображена проекция инвариантного эллипсоида для замкнутой системы (8) на плоскость (е\, вб) и соответствующая проекция траектории системы.
На рис. 3 показаны траектории компонент управления при задающем сигнале
0
8Ш (¿/3) 0
есе £ 0
График компоненты и\(Ь) показан синим, а компоненты и2(Ь) — красным цветом.
На рис. 4 показана динамика нормы ||и(£)|| управляющего воздействия.
Численное моделирование проводилось при помощи пакетов SDPT3 и YALMIP в среде MATLAB. 54
-1.5 -1 -0.5 0 0.5 1
е1
Рис. 2. Проекция инвариантного эллипсоида и траектории системы
15 1
Рис. 3. Графики компонент управления
6
4
2
0
5
10
20
25
1.8 1.6 1.4 1.2 1
0.8 0.6 0.4 0.2 0
0 5 10 15 20 25 30
1
Рис. 4. Динамика Ци^ )||
6. Заключение
В статье предложен простой и универсальный подход к одной из постановок задачи слежения для линейной динамической системы. Подход основан на методе инвариантных эллипсоидов и технике линейных матричных неравенств; при этом синтез регулятора в форме комбинированной обратной связи свелся к задачам полуопределенного программирования и одномерной минимизации, легко решающимся численно.
Численное моделирование демонстрирует эффективность предложенного подхода.
Авторы в дальнейшем предполагают распространить полученные результаты на динамические системы в дискретном времени, на робастные постановки задачи, когда в матрицах системы содержится структурированная матричная неопределенность, а также на системы, подверженные воздействию внешних возмущений.
Авторы считают своим приятным долгом выразить благодарность анонимным рецензентам за высказанные важные замечания и полезные предложения.
Литература
1. ЖЕЛЕЗНОВ К.О., ХЛЕБНИКОВ М.В. Применение техники линейных инвариантных эллипсоидов к линейной задаче слежения // Труды МФТИ. - 2013. - Т. 5, №4. - С. 115-121.
2. КУРЖАНСКИЙ А.Б. Управление и наблюдение в условиях неопределенности. - М.: Наука, 1977.
3. НАЗИН С.А., ПОЛЯК Б.Т., ТОПУНОВ М.В. Подавление ограниченных возмущений с помощью метода инвариантных эллипсоидов // Автоматика и телемеханика. - 2007. -№3. - С. 106-125.
4. ПОЛЯК Б.Т., ХЛЕБНИКОВ М.В., ЩЕРБАКОВ П.С. Управление линейными системами при внешних возмущениях: Техника линейных матричных неравенств. - М.: ЛЕНАНД, 2014.
5. СОКОЛОВ В.Ф. Асимптотическое робастное качество дискретной системы слежения в метрике // Автоматика и телемеханика. - 1999. - №1. - С. 101-112.
6. ХЛЕБНИКОВ М.В., ПОЛЯК Б.Т., КУНЦЕВИЧ В.М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автоматика и телемеханика. - 2011. - №11. - С. 9-59.
7. ХЛЕБНИКОВ М.В., ЩЕРБАКОВ П.С. Синтез оптимальной обратной связи при ограниченном управлении // Автоматика и телемеханика. - 2014. - №2. - С. 177-192.
8. ХОРН Р., ДЖОНСОН Ч. Матричный анализ. - М.: Мир, 1989.
9. ЧЕРНОУСЬКО Ф.Л. Оценивание фазового состояния динамических систем. - М.: Наука, 1988.
10. ATHANS M., FALB P.L. Optimal Control: An Introduction to the Theory and Its Applications. - New York: McGraw-Hill, 1966.
11. BOYD S., EL GHAOUI L., FERON E., BALAKRISHNAN V.
Linear Matrix Inequalities in System and Control Theory. -Philadelphia: SIAM, 1994.
12. CIMEN T., BANKS S. Nonlinear Optimal Tracking Control with Application to Super-Tankers for Autopilot Design // Automatica. - 2004. - No. 40. - P. 1845-1863.
13. GRANT M., BOYD S. CVX: Matlab Software for Disciplined Convex Programming, Version 2.0 beta. - 2013. - URL: http://cvxr.com/cvx.
14. GRANT M., BOYD S. Graph Implementations for Nonsmooth Convex Programs, Recent Advances in Learning and Control (A Tribute to M. Vidyasagar) // In: Lecture Notes in Control and Information Sciences / Eds.: V. Blondel, S. Boyd, and H. Kimura. - Springer, 2008. - P. 95-110. - URL: http://stanford.edu/~boyd/graph_dcp.html.
15. GRUJIC L.T., MOUNFIELD W.P. Natural Tracking PID Process Control for Exponential Tracking // AIChe Journal. -1992. - Vol. 38, No. 4. - P. 555-562.
16. KALMAN R. Contributions to the Theory ofOptimal Control // Boletin de la Sociedad Matematica Mexicana. - 1960. - No. 1. -P. 102-119.
17. KHLEBNIKOV M.V. Control of Linear Systems Subjected to Exogenous Disturbances: Combined Feedback // Proc. of the 12th IFAC Int. Workshop on Adaptation and Learning in Control and Signal Processing (ALCOSP 2016), June 29 - July 1, 2016, Eindhoven, Netherlands. - 2016. - Paper WeBT2.3.
18. LEIBFRITZ F. COMPleib: Constraint Matrix-optimization Problem library - A Collection of Test Examples for Nonlinear Semidefinite Programs, Control System Design and Related Problems // Tech. Report. - 2004. - URL: http://www.complib.de/.
19. LOFBERG J. YALMIP: A Toolbox for Modeling and Optimization in MATLAB // Proc. of the 13th IEEE Int. Symposium on Computer Aided Control System Design (CACSD 2004), September 2-4, 2004, Taipei, Taiwan. - 2004.
20. SCHWEPPE F.C. Uncertain Dynamic Systems. - NJ: Prentice Hall, 1973.
21. TOH K.C., TODD M.J., TUTUNCU R.H. SDPT3 - A Matlab Software Package for Semidefinite Programming // Optimizations Methods and Software. - 1999. - Vol. 11. -P. 545-581.
22. TUTUNCU R.H., TOH K.C., TODD M.J. Solving Semidefinite-Quadratic-Linear Programs Using SDPT3 // Mathematical Programming Series. - 2003. - Vol. 95. - P. 189-217.
AN APPROACH TO TRACKING PROBLEM FOR LINEAR CONTROL SYSTEM VIA INVARIANT ELLIPSOIDS METHOD
Kirill Zheleznov, V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences, post-graduate student ([email protected]).
Yana Kvinto, V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences, Senior Researcher, Ph.D ([email protected]).
Mikhail Khlebnikov, V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences, Laboratory Head, Doctor of Science ([email protected]).
Abstract: In the article we propose a simple yet universal approach to the tracking problem for the linear control system by means of linear static combined feedback. Our approach is based on the method of invariant ellipsoids, by which means the optimal control design reduces to finding the minimal invariant ellipsoid for the closed-loop system. With such an ideology, the original problem can be reformulated in terms of linear matrix inequalities, and the control design problem directly reduces to a semidefinite program and one-dimensional minimization. These problems are straightforward to implement numerically using any of the appropriate toolboxes that are presently available, e.g., MATLAB-based toolboxes SeDuMi and YALMIP. Another attractive property of the approach is that it is equally applicable to discrete-time systems (which are not considered in this article but it is a promising topic for further publications). The efficacy of the proposed technique is illustrated through application to the benchmark problem.
Keywords: tracking problem, linear control system, linear matrix inequalities, invariant ellipsoids.
Статья представлена к публикации членом редакционной коллегии Б.Т. Поляком.
Поступила в редакцию 08.06.2017.
Дата опубликования 31.01.2018.