УДК 62.50 ББКЖ30
ПРИМЕНЕНИЕ ИДЕЙ ПРОГНОЗИРУЮЩЕГО УПРАВЛЕНИЯ В СИНТЕЗЕ СТАБИЛИЗИРУЮЩЕГО УПРАВЛЕНИЯ СЕТЕВЫМИ ОБЪЕКТАМИ1
Жучков Р. Н.2
(Арзамасский политехнический институт (филиал) Нижегородского государственного технического университета им. Р.Е. Алексеева, Арзамас)
Рассматривается линейная система, в которой регулятор обменивается информацией с объектом управления через сеть, в которой возможны потери пакетов данных. Строится динамический регулятор с обратной связью по вектору выхода. Для получения оценки вектора состояния в любой момент дискретного времени к используются методы теории прогнозирующего управления, которые позволяют избежать необходимости явного учета смены структурного состояния системы в моменты потери пакетов данных.
Ключевые слова: прогнозирующее управление, фильтр Калмана, сетевые системы управления, линейные матричные неравенства, линейные дискретные системы.
Основные идеи прогнозирующего управления
Модель прогнозирующего управления относится к классу алгоритмов управления, которые используют модели предсказания будущих реакций системы. Изначально подход разрабатывался для удовлетворения специфических потребностей управления электростанций и нефтеперерабатывающих заводов. В настоящее
1 Работа выполнена при частичной финансовой поддержке РФФИ (грант 13-08-01092_а) и Министерства образования и науки РФ, ФЦП «КАДРЫ» (соглашение 8846).
2Роман Николаевич Жучков, аспирант, (mmanjkv@maU.ru).
время прогнозирующее управление можно найти в самых различных областях применения: пищевой, автомобильной и аэрокосмической промышленности.
Суть подхода в следующем: на каждом интервале управления алгоритм пытается оптимизировать будущее поведение поведение системы путем вычисления последовательности будущих управлений. Последовательность управлений рассчитывается таким образом, чтобы оптимизировать будущее поведение системы в течение интервала времени, получившего название горизонта предсказаний. Первое управление из полученной последовательности отправляется объекту, и в следующий момент времени задача управления решается заново, используя обновленные измерения.
Идеи прогнозирующего управления можно проследить до 1960х годов [12], но интерес к этим методам начал быстро расти только в 1980х годах после публикаций первых работ по прогнозирующему управлению: Identification and Command (IDCOM) [19], динамическому матричному управлению (Dynamic Matrix Control [9,10]) и первому всестороннему изложению идей обобщенного прогнозирующего управления Generalized Predictive Control (GPC) [6,7]. Хотя в изначальном виде идеи, лежащие в основе DMC и GPC, схожи, DMC был задуман для многомерного управления с ограничениями, в то время как GPC в первую очередь подходит для одной переменной, а также адаптивного управления.
Название «прогнозирующее управление» связано с идеей использования явной модели объекта, который используется для предсказания будущего поведения выхода системы. Это предсказание позволяет решать задачи оптимального управления в реальном времени, где ошибки слежения, а именно отличия между предсказанным выходом и желаемым выходом сведены к минимуму за время горизонта предсказания, при условии ограничений на входы и выходы. Когда модель является линейной, то задача оптимизации является квадратичной, если показатель качества представляется через L2 норму, или линейной, если выражает-
ся через ^/Ь^-норму. Полученное управление применяется в соответствии с основным принципом прогнозирующего управления: в момент времени Ь только первый член из предсказанной последовательности оптимальных управлений применяется к объекту. Затем решается задача управления для времени Ь + 1.
Идеальная траектория
Предсказанная траектория
1 t+N
Горизонт предсказаний
Рис. 1. Предсказательное управление
На рис. 1 показана основная идея прогнозирующего управления [17]. Мы ограничимся обсуждением системы с одним входом и одним выходом. Будем рассматривать систему с дискретным временем. Текущее состояние обозначено как шаг Ь. На рисунке показаны две траектории: пунктирная - идеальная траектория и предсказанная траектория (обозначена точками). Предсказанная траектория начинается с текущего момента Ь и определяет траекторию, двигаясь по которой объект должен вернуться на идеальную траекторию. Прогнозирующий регулятор имеет собственную модель, которая используется для прогнозирования поведения системы внутри горизонта предсказаний. В простейшем случае мы можем попытаться выбрать предсказанную траекторию таким образом, чтобы совместить ее с идеальной в конце горизонта предсказаний.
Вопросы возможности оптимизации в реальном времени, устойчивости и качества широко изучены для систем, описываемых линейными моделями (книги [3-5,8,16,20]). Значительный прогресс в применении прогнозирующего управления для
гибридных систем, дискретных систем, систем с логическими условиями, эвристического анализа был получен в [2].
Приведем несколько результатов, полученных в области прогнозирующего управлении для управления сетевыми системами. В [15] предложено стабилизирующее управление для сетевой системы с потерями пакетов данных между сенсором и регулятором. В [11] предложен метод для случая двусторонней потери данных. В этой работе зависящая от потери пакетов данных функция Ляпунова используется для стабилизации замкнутой системы. В [13] авторы предложили сетевую систему управления, которая использует предсказания, чтобы компенсировать запаздывания сигналов и потери пакетов данных при передаче между объектом и системой управления. Для того чтобы анализировать свойства системы, они ввели понятие последовательности предсказаний, что позволяет определять свойства сети, необходимые для достижения устойчивости замкнутой системы.
В предыдущих работах автора [1] потеря пакетов данных рассматривалась как одно из структурных состояний сетевой системы управления. Однако, если говорить об объекте управления, то в такие моменты он не переходит в какое-то новое состояние, продолжая функционировать в обычном режиме. Переключение сконструированной системы управления в другое структурное состояние характеризует не сам объект, для которого строится контур управления, но информацию о нем.
С этой точки зрения применение принципов прогнозирующего управления очень привлекательно именно с точки зрения нахождения системы в одном структурном состоянии, когда информация о ней доступна. Хотя нужно помнить, что иногда эта информация будет предсказанной, а не истинной.
Сформулируем здесь основные идеи, использованные в предыдущей работе при построении алгоритмов управления сетевыми системами управления. Во-первых, принималась гипотеза о возможности разделения системы на объект и наблюдатель. После этого матрицы усиления для наблюдателя и регулятора находились по отдельности. Во-вторых, для наблюдателя и регу-
лятора рассматривались возможности потери пакетов данных и находились либо разные матрицы усиления для разных структурных состояний, либо единая матрица для всех структурных состояний.
Используя идеи прогнозирующего управления управления, алгоритм управления сетевой системой предлагается модифицировать следующим образом: введем горизонт предсказаний, равный максимально возможному количеству потерянных пакетов данных. Эта величина является характеристикой сетевого канала обмена данными и может быть выбрана с запасом. Далее вводятся два буфера: с измерениями и управлениями, в которых будут храниться предсказанные измерения и управления. Ниже будет показано, как для построения оценки вектора состояния с учётом прогнозирующего управления используется алгоритм фильтра Калмана. Основываясь на предсказаниях текущего и будущих состояний объекта управления строится последовательность управлений, которая высылается объекту. Обратим здесь внимание на то обстоятельство, что в отличие от работы [18], например, будет использоваться одна и та же матрица усиления обратной связи для текущего и будущих моментов времени. Сделано это из того предположения, что изначально для системы может быть найдена единая матрица усиления обратной связи и потери пакетов данных не меняют ее структуру.
1. Схема функционирования системы
Пусть имеется сетевая система управления, изображенная на рис. 2. Работа ее построена следующим образом:
1) объект управления формирует измерения в виде текущего и предсказанных измерений на несколько шагов вперед (горизонт событий);
2) объект управления пересылает сформированный пакет системе управления;
Рис. 2. Сетевая система управления
3) если потери пакета не произошло, принятый пакет записывается в буфер; в случае, если произошла потеря, берутся предсказанные для этого шага измерения из буфера;
4) строится наблюдатель;
5) формируется пакет из оценки состояния на текущий момент и предсказанные состояния на несколько шагов вперед;
6) пакет пересылается объекту управления;
7) на стороне объекта управления, если не произошло потери пакета, полученный пакет записывается в буфер;
8) берется управление либо с текущего момента, либо предсказания с предыдущих шагов.
2. Уравнения системы
Рассмотрим линейную систему с разностным уравнением следующего вида:
(1) 152
Хк+1 = Ахк + Впк, у к = Схк,
где Хк+1 - п-мерный вектор состояния перехода; Хк - п-мерный вектор исходного состояния; ик - т-мерный вектор управления; Ук - 1-мерный вектор измерений; к - дискретное время, выраженное в числе интервалов дискретности длительности Д£; матрицы А е Мпхп и В е ипхт - матрицы перехода вектора состояния и усиления вектора управления соответственно.
Как и ранее [1], введем гипотезу о возможности разделения и будем искать управление и оценку вектора состояния по отдельности. Полезным свойством использования прогнозирующего является то, что нет необходимости учитывать переключения системы при построении стабилизирующего управления ик = -СХк, так как даже при потери пакета данных можно использовать сохраненную в буфере информацию с предыдущих шагов. В данном случае будем использовать метод функций Ляпунова и линейные матричные неравенства для нахождения матрицы усиления обратной связи С. В случае отсутствия переключений формулы являются тривиальными и поэтому не здесь приводятся.
Замечание 1. Обратим внимание на то, что в отличие от предыдущей работы [1], где система меняла свои структурные состояния, гипотеза о возможности разделения системы может быть легко доказана. Для этого рассмотрим систему (1) и наблюдатель, записанный для этой системы:
(2) Хк+1 = Ахк - ВСХк, Хк+1 = АХк - ВСХк + К (ук - СХк).
Можно показать, что, перейдя во втором уравнении от вектора оценки к вектору ошибки Х = Х — Х, система (2) запишется в следующем виде:
(3) Хк+1 = (А - ВС)Хк + ВСХк,
Хк+1 = (А - КС)Хк,
или в матричном виде:
Хк . Хк .
153
Хк+1
Хк+1
А - ВС ВС 0 А-КС
Видно, что система (4) имеет блочную верхнетреугольную матрицу, собственные значения которой равны собственным значениям блочно-диагональной матрицы (или собственным значениям разделенной системы).
Итак, основная задача теперь состоит в том, чтобы обладать оценкой вектора состояния для любого дискретного момента времени k, в независимости от того, замкнут ли сетевой канал обмена данными. Для этого, опираясь на идеи прогнозирующего управления, сформируем расширенный вектор состояния:
(5) xk+i = Axk + Buk,
Xk+2 - Axk+1 = Buk+1,
xk+N+1 — Axk+N = Buk+N;
(6) у к = Схк,
Ук+1 = Схк+1, Ук+2 = СХк+2,
Ук+М = Схк+М.
Здесь N - размер буфера (горизонта событий). Перепишем систему (5) в следующем виде:
(7)
I 0 ...
-AI 0
0 0 ...
00 ... 0
AI
xk+1 xk+2
xk+3 xk+N+1
A 0 0. .0 xk B 0 0. .0 uk
0 0 0. .0 xk+1 0 B 0. .0 uk+1
0 0 0. .0 xk+2 + 0 0 B. .0 uk+2
0 0 0. .0 xk+N 0 0 0. .B uk+N
Ук С 0 0. .0
Ук+1 0 С 0. .0
(8) Ук+2 = 0 0 С. .0
Ук+м 0 0 0. .С
Хк
Хк+1
Хк+2
Хк+м
Введем расширенные вектора состояния и измерений Х =
[Хк Хк+1 ... Хк+м], У = [Ук Ук+1 ... Ук+м], тогда система (7) запишется в следующем виде:
(9)
А+Хк+1 = АоХк + Воик, Ук = С0Хк.
Обратим внимание, что в векторе измерений ук только измерения Ук являются действительным выходом системы 1, остальной набор ук+1,..., Ук+м - это предсказанные измерения, которые могут быть сформированы из оценки расширенного вектора состояния, например.
В уравнениях (5)-(9) отсутствуют внешние возмущения, хотя в системе 1 допустимо их появление. Объяснение здесь следующее: при прогнозировании будущих состояний и измерений мы исходим из того предположения, что в исходной системе шумы, если они существуют, имеют нулевое математическое ожидание. В нашем случае эти шумы будут скомпенсированы при построении оценки вектора состояния с помощью использования фильтра Калмана.
Для определения состояния системы (9) будем использовать уравнения линейного фильтра Калмана: (10) Хк+1 = А-1АоХк + А+1В^к + К (У - СоХк).
В случае потери пакета данных матрица Со не меняется.
Замечание 2. В случае потери пакета данных логично бы
выглядело использование матрицы Со следующего вида:
С 0 0. .. 0
0 С 0. .. 0
(11) У = 0 0 С. .. 0
0 0 0. .. 0
где отсутствующий пакет заменен нулями. Однако численные эксперименты показали, что такая замена ухудшает характеристики процесса сходимости фильтра Калмана, оригинальная версия которого чувствительна к сменам структурных состояний системы.
Неизменная же матрица Со говорит о том, что вместо потерянных измерений используются не нулевые данные, а последние полученные измерения.
Отметим здесь, что внутри горизонта предсказаний прогнозируемые состояния и измерения выбираются для каждой системы индивидуально. Они могут зависеть от таких факторов, как динамика системы и уровень внешнего воздействия. Еще раз напомним здесь основную идею прогнозирующего управления: внутри горизонта предсказаний модель поведения системы выбирается исходя из желаемого поведения системы, и поэтому может варьироваться в довольно широких пределах.
3. Пример
В качестве примера рассмотрим задачу построения стабилизирующего управления полетом квадрокоптера. Линейная система, характеризующая малые отклонения от положения равновесия по каналу угла крена и нулевого положения в пространстве, была взята из [14].
Для непрерывного времени система может быть записана следующим образом:
(12) ф = 1г,
(13) Х = -дф + ^Г + ! йь.
Ьт т
Здесь т - масса квадрокоптера; I - момент инерции относительно оси Х; Ь - расстояние от плоскости винтов до двигателя; ^ -случайное воздействие, которое может характеризовать силу ветра, например.
Введем новый вектор неизвестных Х = [ф ф х Х] и положим в качестве измеряемых величин ф и Х.
Для внесения возмущений в систему будем использовать функцию ^ следующего вида (см. рис. 3).
Рис. 3. Случайное воздействие
В качестве параметров системы (12) выберем следующие значения: т = 6 кг, Ь = 200 мм, I = 0, 24 кг ■ м2.
Тогда матрицы дискретной системы примут следующий вид:
А=
1,0000 0
-0, 0020 -0,1962
0, 0200 1, 0000 -0, 0000 0, 0020
0 0
1, 0000 0
В=
0, 0008' 0, 0833 0, 0002 0, 0166
0 0
0, 0200 1, 0000
В работе [14] показано, что при выбранных параметрах система (12) является неустойчивой.
При построении системы выберем размер буфера N = 5. В общем случае размер буфера должен выбираться исходя из прогнозируемого количества последовательно потерянных пакетов данных и возможностей вычислительной системы. В случае превышения прогнозируемого числа потерянных пакетов вероятен уход системы со стабилизированной траектории.
Приведем траектории стабилизированной системы (см. рис. 4).
Кроме того, приведем распределение количества потерянных пакетов данных (см. рис. 5).
Видно, что система стабилизирована, несмотря на большое количество потерянных пакетов данных.
Литература
1. ЖУЧКОВ Р.Н., ПАКШИН П.В. Стабилизирующее сетевое управление линейными дискретными системами в условиях потери пакетов данных // Управление большими системами. - 2011. - №33. - С. 113-126.
2. BEMPORAD A., MORARIM. Control of systems integrating logic, dynamics, and constraints // Automatica. - 1999. -Vol. 35. - P. 407-427.
3. BERBER R. Methods of Model Based Process Control // NATO ASI Series E: Applied Sciences. -Vol. 293.- Kluwer Academic Publications, Dortrecht, 1995. - 826 p.
4. BITMEAD R.R. Adaptive Optimal Control. The Thinking Man's GPC // International Series in Systems and Control
Engineering, 1990. - 820 p.
5. CAMACHO E.F., BORDONS C. Model Predictive Control in the Process Industry // In: Advances in Industrial Control. -Springer Verlag, 1995. - 239 p.
6. CLARKE D.W., MOHTADI C., TUFFS P.S. Generalized predictive control - I. The basic algorithm // Automatica. -1987. - Vol. 23. - P. 137-148.
7. CLARKE D.W., MOHTADI C., TUFFS P.S. Generalized predictive control. - II. Extensions and interpretations // Automatica. - 1987. - Vol. 23. - P. 149-160.
8. CLARKE D.W. Advances in Model-Based Predictive Control. - Oxford University Press, 1994. - 552 p.
9. CUTLER C.R., RAMAKER B.L. Dynamic matrix control - A computer control algorithm // AIChE 86th National Meeting, Houston, 1979.
10. CUTLER C.R., RAMAKER B.L. Dynamic matrix control - A computer control algorithm // Joint Automatic Control Conf., San Francisco, 1980.
11. DING B. Stabilization of linear systems over networks with bounded packet loss and its use in synthesizing model predictive control // In: Proceedings of 8th, International Conference on Control and Automation. 2010. - P. 22582263.
12. GARCIA C.E., PRETT D.M., MORARI M. Model predictive control: Theory and practice - a survey // Automatica. -1989. - Vol. 25. - P. 335-348.
13. GRUNE L., PANNEK J. AND WORTHMANN K. A networked unconstrained nonlinear mpc scheme // In: Proc. European Control Conference. - 2009. - P. 91-96.
14. HUA MINH-DUC, HAMEL T., MORIN P. Introduction to Feedback Control of Underactuated VTOL Vehicles: A Review of Basic Control Design Ideas and Principles // Control Systems, IEEE. - 2013. - Vol. 33, No. 1. - P. 61-75.
15. LI Z.J., SUN D.H., SHI Y.T. ET AL. A stabilizing model predictive control for network control system with data packet
dropout // Journal of Control Theory and Application. -2009. - Vol. 7. - P. 281-284.
16. MARTIN SANCHEZ J.M., RODELLAR J. Adaptive Predictive Control // International Series in Systems and Control Engineering, 1996. - P. 263-283.
17. BEMPORAD A., MORARI M. Robust Model Predictive Control: A Survey // Robustness in Identification and Control. - 1999. - Vol. 245. - P. 207-226.
18. NGUYEN Q.T., VESELY V. Design of Robust Networked Predictive Control Systems with Packet Loss // Preprints of 4th IFAC Nonlinear Model Predictive Control Conference International Federation of Automatic Control, 2012. -P. 362-357.
19. RICHALET J., RAULT A., TESTUD J.L. AND OTHERS Model predictive heuristic control: applications to industrial processes // Automatica. - 1978. - Vol. 14. - P. 413-428.
20. SOETERBOEK R. Predictive Control - A United Approach // International Series in Systems and Control Engineering, 1992. - 300 p.
PREDICTIVE CONTROL APPROACH IN NETWORKED CONTROL SYSTEMS
Roman Zhuchkov,graduate student (Arzamas Polytechnic Institute of R.E. Alekseev Nizhny Novgorod State Technical University, 19, Kalinina Street, Arzamas, 607227, Russia, (roman_jkv@mail.ru)).
Abstract: We consider a stabilization problem in a networked control system with packets dropouts and build dynamic feedback control using system outputs. Predictive control approach is used to obtain estimates of plant state at each time moment k, which makes unnecessary taking into account plant state switching when a packet dropout occurs.
Keywords: predictive control, Kalman filter, networked control systems, linear matrix inequalities, linear discrete systems.
Статья представлена к публикации членом редакционной коллегии А. Л. Фрадковым
Поступила в редакцию 22.06.2013. Опубликована 30.09.2013.