УДК 62.50 ББКЖ30
СТАБИЛИЗИРУЮЩЕЕ СЕТЕВОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДИСКРЕТНЫМИ ОБЪЕКТАМИ С ИСПОЛЬЗОВАНИЕМ БАНКОВ СЕНСОРОВ И ИСПОЛНИТЕЛЬНЫХ УСТРОЙСТВ1
Жучков Р. Н.2
(Арзамасский политехнический институт (филиал) Нижегородского Государственного технического университета им. Р.Е. Алексеева, Арзамас)
Рассматривается линейная система, в которой регулятор обменивается информацией с объектом управления через сеть, содержащую множество банков сенсоров и исполнительных устройств. Совокупность сенсоров и исполнительных устройств рассматривается как система случайной структуры. Строится динамический регулятор с обратной связью по вектору выхода.
Ключевые слова: линейные дискретные системы, сетевое стабилизирующее управление, марковские цепи, линейные матричные неравенства.
Введение
В работе автора [1] рассматривался случай, когда объект управления получал информацию через единственный набор сенсоров и передавал управление через единственный набор исполнительных устройств. В реальных системах могут иметь место другие схемы. Например, в системе управления летательным аппаратом обычно содержатся основная и резервная системы дат-
1 Работа выполнена при частичной финансовой поддержке РФФИ (грант №13-08-01092_а) и Министерства образования и науки РФ, ФЦП «КАДРЫ» (соглашение №8846).
2Роман Николаевич Жучков, аспирант (mmanjkv@maU.ru)
124
чиков курса и вертикали. Кроме того, для корректировки текущего положения может использоваться информация со спутников и других внешних устройств. Таким образом, имеем многоуровневую систему резервирования, а, значит, и систему управления, в которой возможны переключения между различными наборами сенсоров и исполнительных устройств. Дополнительные сложности появляются в случае сетевого управления, так как часть передаваемых пакетов может быть повреждена или потеряна.
Предыдущий подход рассматривал сетевую систему управления с одним наборов сенсоров и исполнительных устройств как марковскую цепь с двумя возможными состояниями: пакет получен либо потерян. В дальнейшем стабилизирующее управление находилось из решения линейных матричных неравенств.
В данной работе рассматривается случай произвольного количества блоков сенсоров и исполнительных устройств, через которые происходит обмен данными между объектом и системой управления. Прямое обобщение результатов [1] на такие системы приводят к необходимости решения систем билинейных матричных неравенств сложной структуры, что связано со значительными трудностями.
Для получения эффективного алгоритма построения стабилизирующего управления предлагается новый подход, cуть которого состоит в следующем. Как и ранее в [1], вводится гипотеза
о возможности разделения процессов оценивания и управления. Затем вводится эвристическая модификация неравенств исходной системы, которая позволяет сравнительно легко получить решение. В качестве альтернативного способа рассмотрен подход с использованием наблюдателя Калмана.
Считается, что характеристики канала передачи данных известны, т.е. известны вероятности переключения между блоками сенсоров и регуляторов. Эта информация используется для построения матрицы переходов при построении марковской цепи.
1. Описание системы
Рассматривается система с множеством блоков сенсоров и регуляторов, схема которой представлена на рис. 1. Отметим
Рис. 1. Схема сетевой системы управления
здесь, что в качестве канала обмена данными можно подразумевать канал с протоколом point-to-point, который обычно используется для установления прямой связи между двумя узлами сети. Для простоты будем считать, что прямой канал «объект управления - система управления» и обратный канал организованы с использованием единой физической среды. При работе с такими сетями обычно возникает два типа проблем: запаздывание при передаче сигнала и потеря/порча пакета данных. В настоящей работе считается, что в используемом канале данных длительность задержки при передаче пакетов данных мала по отношению к интервалу дискретности системы управления. Другими словами, динамику каналов связи можно не учитывать в масштабе динамических процессов в рассматриваемом управляемом объекте.
В этой системе объект управления формирует массив дан-
ных для основных и резервных сенсоров системы управления (у к) и высылает их через сетевой канал данных. В процессе пересылки часть информации теряется либо портится (несовпадение контрольных сумм). Таким образом, система управления переключается на доступные в настоящий момент сенсоры (ук).
При пересылке управляющей информации от системы управления объекту управления ситуация повторяется: система формирует сигналы для всех регуляторов (ик), но использован будет только тот, который не был потерян либо испорчен при пересылке.
Модель системы задаётся линейным разностным уравнением следующего вида:
(1) Хк+1 = Ахк + Ви,
ук — Сгхк,
где Хк+1 - п-мерный вектор состояния перехода; Хк - п-мерный вектор исходного состояния; ик - т-мерный вектор управления; Ук - 1-мерный вектор измерений; к - дискретное время, выраженное в числе интервалов дискретности длительности ДЬ; матрицы А е Мгахга и Вг е Мгахт - матрицы перехода вектора состояния и усиления вектора управления соответственно.
В каждый дискретный момент времени матрица выхода системы может находиться в одном из следующих структурных состояний:
(2) 51 : Сг — С\,
5 : Сг — С2,
: Сг — См.
Кроме того, в случае потери сигнала информация может отсутствовать (Сг — 0). Здесь Сг е М1хга - матрицы, характеризующие г-й выход системы в различных структурных состояниях.
Аналогично, в зависимости от задействованного регулятора
(5)
Хк+1
_Хк+1_
Хк
Хк_
матрица Вг переходит в одно из возможных состояний:
(3) 7 : Вг — Bl,
Т2 : Вг — B2,
Тм : Вг — Вм.
Закон управления формируется в виде обратной связи по оценке вектора состояния
(4) икг — -ОгХк,
где Сг - набор матриц усиления обратной связи, соответствующих матрицам Вг.
Таким образом получаем систему с расширенным вектором состояния: _ _
(А — В%С%) -ВгСг
0 (А - К С)]
Аналогично подходу, изложенному в предыдущей статье [1], воспользуемся гипотезой о возможности разделения задач оценивания и управления и будем искать соответствующие матрицы усиления по отдельности. После того как матрицы будут найдены для разделенных систем, подставим их в общую систему (5) и проверим её на устойчивость. Отметим здесь, что при разделении системы предполагается, что пары матриц (А, Вг) полностью управляемы, а пары матриц (А, С г) полностью наблюдаемы.
2. Построение стабилизирующего управления
В соответствии с подходом, изложенным в [2], набор матриц усиления обратной связи Сг, стабилизирующий систему (1) при условии переключения входов, может быть найден следующим образом:
(6) С г — [ВТБ%В% + Яг] - [ВТ Б г Аг + Ьг] ,
где Яг > 0 и Ьг - неизвестные матрицы, которые могут быть найдены из решения системы матричных уравнений и неравенств
(7). Кроме того, матрицы Нг — НТ > 0 в системе (7) также
являются неизвестными.
(7)
Ат БіА — Ні + (1 + БіБіА
¡-¿і$і
Ьі
АтБіВі вТБіБі + Кі
> 0,
ьт
ВТБіВі + Кі
> 0,
[ВІБіВі + Кі] - [ВіТ+іБі+іВі+і + Кі+і] [ВТ БіА + Ьі] — [ВІ+1Бі+1А + Ьі+і]
Кі — К
і — 1, 2,...,Ы.
Для того чтобы удостовериться, что найденные матрицы усиления обеспечивают устойчивость замкнутой системе, необходимо проверить на разрешимость следующую систему матричных неравенств:
(8) (А - В%С%)т ^р%3Нг(А - ВгСг) - Нг < 0,
где Нг — Н - неизвестная положительно определённая матрица. Данная система получена путём применения метода функций Ляпунова к системе (1)-(3).
3. Построение оценки вектора состояния
В ряде случаев алгоритм, изложенный в предыдущем пункте, может выдать идентичные матрицы усиления обратной связи для различных входов системы. В этом случае хотелось бы сконструировать такой алгоритм, который позволял бы получить единственную матрицу усиления и для построения оценки вектора состояния, с целью построить регулятор постоянной структуры.
Однако прежде чем рассмотреть частный случай, рассмотрим ситуацию, когда при решении задачи управления были получены различные матрицы усиления для различных структурных состояний системы.
3.1. НАБЛЮДАТЕЛЬ С ПЕРЕКЛЮЧАЕМОЙ СТРУКТУРОЙ Рассмотрим выход системы как однородную марковскую цепь с известными вероятностями перехода между структурными состояниями. Оценку вектора состояния будем искать в следующем виде:
(9) xk+i = Axk + Buk + Ki(yk - CiXk), где смена структурных состояний Ci описана ранее.
Наблюдатель (9) будет устойчив, если выполнено неравенство Ляпунова [2]:
(10) (A - KiCi)T Ypi3Hj(A - KiCi) - Hi < 0, i = 1...N,
где Hi = HT и Ki - неизвестные матрицы и pij - элементы матрицы вероятностей переходов между структурными состояниями системы. Непосредственное решение этого билинейного относительно неизвестных матриц неравенства приводит к связанной системе линейных матричных уравнений и неравенств. Однако можно ограничиться только решением линейных матричных неравенств, если использовать следующий эвристический прием. Рассмотрим систему неравенств
(11) (A - KiCi) Y, Pij Hj (A - KiCi)T - Hi < 0, i = 1...N.
Эта система не является следствием применения какой-либо функции Ляпунова и сконструирована искусственно. Экспериментально было установлено, что решение системы (11) также является решением системы (10).
Система (11) при умножении ее слева и справа на Xi=H-1 и применении теоремы о дополнении Шура может быть приведена
к следующему LMI:
(12)
Xi (Xi A - YiCi)^pil (XiA - YiCi)^pi2 ... (XiA - YiCi)^piN -
(.XiA - YiCi )T v'pil Xi 0 ... 0
(XiA - YiCi )T ^pi2 0 X2 ... 0
L(XiA - YiCi)Tv'piN 0 0 ... Xn __
где Yi = XiKi. Если эти неравенства разрешимы и найденные значения Ki удовлетворяют неравенствам (10), в чем можно убедиться непосредственно, то они являются матрицами усиления наблюдателя.
3.2. НАБЛЮДАТЕЛЬ ПОСТОЯННОЙ СТРУКТУРЫ
Попытаемся построить оценку состояния с помощью одной из модификаций робастного фильтра Калмана [7, 8]. Отличительной его особенностью является то, что он не требует знания матриц ковариаций шумов. И хотя робастный фильтр Калмана даёт субоптимальную оценку состояния системы, он будет гарантировать ограниченность ошибки оценивания в широком спектре параметров неопределённостей системы.
Приведем основные уравнения робастного фильтра Калмана, вывод которых содержится в [8].
Рассмотрим следующий класс дискретных систем с неопре-делённостями:
(13) хк+х = (А + ААк )хк,
(14) ук = (С + АСк )хк,
где Хк - п-мерный вектор состояния; у к - 1-мерный вектор измерений; А и С - известные матрицы соответствующей размерности.
Матрицы ААк и АСк - неизвестные матрицы, которые описывают неопределённости системы. Считается, что ААк и АСк имеют следующую структуру:
Ек Е,
где Ек - неизвестная матрица, удовлетворяющая соотношению
(15) Е^Ек < I,
и И1,И2,Е - известные матрицы подходящей размерности, показывающие, как элементы матриц А и С затрагиваются неопре-делённостями Ек.
Пример 1. В качестве иллюстрации приведем следующую линейную дискретную систему:
(16) Хк+1 = (1+ $)Хк,
(17) ук = Хк,
'ААк Н\
АОк Н2.
где 5 - неизвестный параметр, удовлетворяющий |5| ^ 0,1, тогда матрицы робастного фильтра Калмана могут иметь следующий вид: И1 = 1, И2 = 0, Е = 0,1, и Ек принимает значения в диапазоне —1 ^ Ек ^ 1.
Отметим ещё раз достоинство подхода: здесь не требуется знания характеристик случайной последовательности Ек, достаточно задать максимальное отклонение неопределённых параметров.•
Доказано, что робастный фильтр, гарантирующий ограниченность верхней границы ошибки оценивания, определяется следующими соотношениями:
(18) Хк+1 = (А + ААек )Хк + К/ [ук — (С + АСек )Хк},
где
(19) ААек = £к АБк ЕТ(1 — еЕБк Ет )-1Е,
(20) АСе± = ек СБк Ет(1 — еЕБк Ет )-1Е,
(21) К/ = (АЯк Ст + - И1ИТ)(—И2ИТ + СЯк Ст)-1,
ек ек
и Б к = Бт > 0 является решением уравнения Рикатти (22) и удовлетворяет Я-1 = Б-1 — екЕтЕ > 0.
Указанное уравнение Рикатти имеет следующий вид:
Бк+1 = АЯкАт — (АЯкСт +---------И1Ит) •
ек
•(— И2И2т + СЯк Ст)-1(АЯк Ст + — И1 И2т )т +
ек ек
1т
(22) +— ИИ
ек
В уравнениях (18)-(22) параметр ек должен быть положительным.
Здесь необходимо отметить то обстоятельство, что хотя робастный фильтр Калмана и свободен от необходимости задания матриц ковариации шумов состояния и измерений, однако набор матриц И1, И2, Е не является уникальным для каждой задачи,
и, более того, не при всех наборах этих матриц и параметра Єк неравенство Б—1 — єкЕТЕ > 0 будет выполняться. Тем не менее структура робастного фильтра Калмана хорошо подходит для построения оценки вектора состояния с изменяемой структурой.
Аналогично случаю с наблюдателем переключаемой структуры найденную матрицу усиления К $ вместе с матрицей усиления обратной связи О необходимо подставить в исходную систему (5) для проверки её на устойчивость.
4. Пример
В качестве примера рассмотрим линейную дискретную систему с двумя регуляторами:
где
А —
хк+1 — Ах к + БіПк,
' 1,0194 0,0199 0,0008
—0,0829 0,9696 0,0821
_ 0,0154 0,0002 0,9847
0,0015 —0,1458 ,0 0 О О О
В2 — [-0,2565 0,0106 -0,0020]Т .
Кроме того будем считать, что информация о системе может приходить с двух сенсоров:
ук — С^Хк,
С — [1 0 0] ,
С2 — [0 0 1] .
В данном случае модель поведения - цепь смены состояний, в которой входы и выходы системы переключаются синхронно, т.е. матрицы измерений и управлений взаимосвязаны: В1 — С1;
В2 - С2.
т
Рис. 2. Переключение по достижении 100 итераций
Рассмотрим два случая. В первом случае Р11 — 0,99, Р12 — 0,01, Р21 — 0,01, Р22 — 0,99. Это соответствует тому, что вероятность перехода системы из структурного состояния 1 в 2 мала, с другой стороны, после перехода система с высокой степенью вероятности останется в структурном состоянии 2.
Во втором случае Р11 — 0,5, Р12 — 0,5, Р21 — 0,5, Р22 — 0,5, что означает, что переход в другое структурное состояние и сохранение текущего состояния равновероятны.
В результате решения системы (6)-(7) получаем, что в случае редких переключений матрицы усиления обратной связи С1 — С2 — [—4,5792 —4,3138 — 76,1954]. В случае равновероятных переключений С1 — С2 — [—4,2589 —5,9491 —83,3282]. Да-
лее наблюдатель строился с использованием двух изложенных подходов.
При построении робастного фильтра Калмана матрицы Н1, Н2, Е, базовую матрицу С и величину е выберем следующим образом: Н1 — 0, Н2 — [10 — 1], Е — 0,005, С — [0,5 0 0,5], е — 1,00. При этом была найдена следующая матрица усиления К — [0,0162 —0,0108 0,0116], которая не зависит от структуры переключений состояний.
20- 40 60 80 100 120 140 160 180 200
0.5
-0 05 і----------------'--------------'--------------'--------------'--------------'-------------'--------------'--------------'--------------'--------------
0 20 40 60 80 10» 120 140 160 180 200
Рис. 3. Случайные переключения между входами
При построении с использованием марковской цепи были найдены следу[ющие решения. Для р]едких переключений К1 — [1,0199 —0,0548 0,0303] ,К2 —
[2,8744 0,5885 1,0281]. Для частых переключений К1 —
[1,0200 —0,0546 0,0016] , К2 — [0,0146 0,1677 0,9849].
Будем моделировать поведение системы в течение 200 итераций. В первой системе для переключения входов выберем 100-ю итерацию, вторая система может переключиться на каждой итерации.
Анализируя полученные траектории системы (рис. 2 и 3), можно отметить, что оба предложенных алгоритма стабилизировали исходную систему. Таким образом, подтверждается работоспособность обоих методов, однако сложно сказать, какой из методов лучше справился с задачей, так как переходные процессы обладают близкими характеристиками.
Литература
1. ЖУЧКОВ Р.Н., ПАКШИН П.В. Стабилизирующее сетевое управление линейными дискретными системами в условиях потери пакетов данных // Управление большими системами. Вып. 33. - М.: ИПУ РАН, 2011. - С. 113-126.
2. ПАКШИН П.В. Дискретные системы со случайными параметрами и структурой. - М.: Физматлит, 1994.
3. HOUNKPEVI F.O., YAZ E.E. Robust minimum variance linear state estimators for multiple sensors with different failure rates // Automatica. - 2007. - Vol. 43. - P. 1274-1280.
4. JIA WANG, QING-LONG HAN, FUWEN YANG Robust Dissipative Control for Networked Control Systems with Multiple Packet Dropouts // Proc. 18th IFAC World Congress. -2011. - Vol. 18. - P. 78-83.
5. KALMAN R.E. A new approach to linear filtering and prediction problems // Journal of Basic Engineering Transactions of the ASME. - 1960. - Vol. 82, No. 1. - P. 3545.
6. MARYAM MOAYEDI, YUNG K. FOO, YENG C. SO LQG Control for Networked Control Systems with Random Packet Delays and Dropouts via Multiple Predictive-Input Control Packets // Proceedings of the 18th IFAC World Congress. -2011. - Vol. 18. - P. 72-77.
7. XIE L., SOH Y.C., DE SOUZA C.E. Robust Kalman filtering for uncertain discretetime systems // IEEE Transactions on Automatic Control. - 1994. - Vol. 39, No. 6. - P. 1310-1314.
8. ZHU X., SOH Y. C., XIE L. Design and analysis of discete-time robust Kalman filters // Automatica. - 2007. - Vol. 38. -P. 1069-1077.
STABILIZING NETWORKED CONTROL OF LINEAR DISCRETE-TIME SYSTEMS WITH SENSORS AND ACTUATORS BANKS
Roman Zhuchkov, graduate student (roman_jkv@mail.ru).
Abstract: We consider a stabilization problem for a networked plant with several banks of sensors and actuators. Banks of sensors and actuators are considered as a system with stochastic structure. We employ technique of linear matrix inequalities to build dynamic feedback control based on system outputs.
Keywords: linear discrete systems, networked stabilizing control, Markov chains, Robust Kalman filter, linear matrix inequalities.
Статья представлена к публикации членом редакционной коллегии Б. Т. Поляком Поступила в редакцию 06.12.2012.
Опубликована 31.05.2013.