информационно-управляющие системы X
УДК 62.50
оценивание состояния пассифицируемых нелинейных систем при коммуникационных ограничениях
А. Л. Фрадков,
доктор техн. наук, профессор Б. Р. Андриевский, доктор техн. наук, профессор А. Б. Андриевский,
младший научный сотрудник Институт проблем машиноведения РАН
Исследуется задача оценки состояния для одного класса нелинейных колебательных систем при информационных ограничениях, вызванных недостаточной пропускной способностью канала связи. Описана схема кодирования данных, основанная на применении нестационарных бинарных кодеров-декодеров полного порядка. Приведены результаты теоретического анализа процесса оценивания состояния нелинейных систем в форме Лурье, выполненного на основе теоремы о пассификации, из которых следует, что оценка ошибки экспоненциально стремится к нулю при достаточно высокой скорости передачи данных. Представлены результаты экспериментальных исследований на многомаятниковом мехатронном комплексе, показывающие эффективность предложенного метода.
Ключевые слова — оценивание состояния, канал связи, нелинейная система, коммуникационные ограничения.
Введение
Во многих интенсивно развивающихся в последнее время областях, таких как автоматизация промышленного производства, автомобилестроение, а также в микроэлектромеханических системах и мобильной телефонии, растет потребность выполнения большого количества сложных дистанционных операций. В крупномасштабных приложениях автоматических систем управления в современной промышленности функциональные агенты: датчики, приводы и регуляторы — географически разнесены друг от друга, поэтому сигналы измерений и управления передаются между ними по каналам связи [1-6]. В сложных сетевых сенсорных системах, содержащих очень большое количество датчиков с низким энергопотреблением, объем данных, поступающих от сенсоров, может оказаться слишком большим для того, чтобы быть полностью переданным по существующим каналам связи [3, 4, 7]. В таких системах регулятору или наблюдателю доступна только последовательность конечнозначных символов, передаваемых по каналу
связи. Такая ситуация может иметь место, например, при передаче управляющих сигналов со стороны общего пункта принятия решений большому числу мобильных агентов. Ввиду ограниченности спектра передаваемого радиосигнала, в таких системах возникают коммуникационные ограничения, которые могут вызывать значительные проблемы.
Задачи управления и оценивания при коммуникационных ограничениях решаются в различных постановках многими исследовательскими группами [4-7]. Первые результаты по синхронизации нелинейных колебательных систем при коммуникационных ограничениях представлены в работах [8-10], где рассматривалась так называемая синхронизация на основе наблюдателей. Получено, что для алгоритма системы кодирования-декодирования первого порядка верхняя граница предельной ошибки синхронизации пропорциональна максимуму скорости связывающего системы сигнала и обратно пропорциональна скорости передачи данных по каналу [8]. Эти результаты распростанены на сетевые системы с древовидной топологией [9, 11], а также на
системы адаптивной синхронизации на основе наблюдателей [10, 12, 13]. В данной статье излагается процедура оценивания состояния нелинейных систем, основанная на передаче по каналу связи скалярного сигнала ошибки по выходу и использовании кодеров-декодеров полного порядка. Мы ограничиваемся исследованием нелинейных систем, представленных в форме Лурье. По результатам работы [14] получено, что при идеальном канале связи (без искажений и выпадений данных) и отсутствии погрешностей измерений предложенный метод оценивания состояния обеспечивает экспоненциальное затухание во времени ошибки оценивания, если скорость передачи данных по каналу связи превосходит некоторое пороговое значение. Аналогично [14] для обоснования предложенного алгоритма наблюдения используется теорема о пассификации [15-17].
Метод оценивания состояния
Рассмотрим модель объекта в форме Лурье (линейная часть и нелинейность в обратной связи по выходу):
х (г) = Ах(г) + Ву(у); у(г) = Сх(г), (1)
где х(і)єЯп — вектор переменных состояния объекта; у (і) — скалярная выходная переменная; А — матрица размером п х п; В — матрица размером п х 1 (столбец); С — матрица размером 1 х п (строка); у(у) — непрерывная нелинейная функция.
Считаем, что измеряется только выход объекта у (і). Задача состоит в получении оценки неиз-меряемого вектора состояния х@) с помощью удаленного наблюдающего устройства на основе доступных измерений с учетом ограниченности скорости передачи данных по каналу связи. С этой целью введем следующий нелинейный наблюдатель полного порядка (см., например, [18]):
х(£) = Ах(£) + В у (г/) + Ьє(£); г/(£) = Сх(#), (2)
где Xє Rn — вектор оценок состояния объекта; у^) — скалярная выходная переменная наблюдателя; є^) = у(^ — у^) — сигнал ошибки между выходами объекта и наблюдателя; L — матрица размером п х 1 (столбец), подлежащая выбору при синтезе наблюдателя.
Предполагается, что система наблюдения содержит интеллектуальный сенсор с микропроцессором на стороне объекта, в котором реализуется алгоритм нелинейного наблюдателя (2), т. е. оценки состояния, вырабатываемые на стороне передатчика, формируются на основе полной информации о выходе объекта (если не учитывать
погрешности измерений). В отличие от работы [19] и ряда других публикаций, в которых используется передача по каналу связи всего вектора оценки состояния X(t), в данной работе считается, что по каналу передается только скалярная переменная, причем вместо значений выхода объекта y(t) (в отличие от работ [8-10, 17, 20]) передается скалярный «сигнал инноваций» e(t). Анализ показывает, что это приводит к асимптотически затухающей по t ошибке оценки состояния e(t) = x(t) — X(t) при достаточно большой скорости передачи данных (при отсутствии погрешностей и шумов). Заметим, что этот результат согласуется с теоремой о скорости передачи данных [4-6, 21-2З].
Основная сложность в рассматриваемой задаче возникает вследствие того, что сигнал ошибки между выходами объекта и наблюдателя непосредственно не доступен, а передается по каналу связи, имеющему ограниченную пропускную способность. Несмотря на то что на скорость передачи данных от сенсора (расположенного непосредственно у объекта) ограничения не налагаются, наблюдатель (2) не может быть непосредственно реализован на стороне передатчика вследствие требований «условия равноосведом-ленности» (equi-memory condition) [21] (см. также [6]). Согласно этому условию, кодер и декодер принимают решения на основе одинаковой информации. Для рассматриваемой системы наблюдения это означает, что процедура кодирования-декодирования должна включаться и в алгоритм оценивания состояния на передающей стороне. Таким образом, ошибка оценивания e(t) должна кодироваться символами из конечного алфавита в дискретные мометны времени tk = kT, где k = 0,
1, 2, ... — дискретное время, T — интервал квантования. Полученная в результате кодирования величина є [k] = є (tk) должна использоваться вместо e(t) в наблюдателе (2), в результате чего (2) принимает вид
x(t) = Ax(t) + By (y) + Le(t); y(t) = Cx(t), e(t) = e[k] при t є [tk, tk+i), tk = kT. (3)
Значение s[k] передается через канал связи приемнику, где воспроизводится процедура оценивания состояния, а именно — в декодере выполняется следующий алгоритм:
X d (t) = Ait d (t) + В у (yd) + Le (t); i)d (t) = Cxd (t), (4)
где Xd (t) є Rn — вектор оценки состояния объекта, генерируемый в декодере, причем берется Xd (0) = X(0). Считаем, что измерения получаются без искажений и запаздывание и искажение в канале связи отсутствуют. При преобразовании ди-
йи^ 29
скретной последовательности ё[k] в непрерывный сигнал ё(^, входящий в (4), используется экстра-полятор нулевого порядка, так что ё (^ = ё[Щ при
< t < (И + 1)Т. Теоретический анализ выполнен для матриц L вида L = кB, где скалярный коэффициент усиления к — параметр наблюдателя.
Ниже излагаются конструктивные условия наблюдения при передаче данных через канал связи, полученные для класса пассифицируемых (или пассивных с обратной связью) систем [14,
16, 17, 24].
Процедура кодирования данных
В работе [8] установлены свойства процесса синхронизации на основе наблюдателей при коммуникационных ограничениях для нелинейных систем Лурье с использованием кодеров первого порядка, где показано, что верхняя граница предельной ошибки оценивания пропорциональна некоторой верхней границе ошибки передачи данных по каналу связи. В предположении, что интервал квантования может выбираться надлежащим образом, показана оптимальность двоичного (бинарного) кодирования при обеспечении заданной ошибки синхронизации. В работе также найдена связь между точностью синхронизации и величиной оптимального интервала квантования. На основе этого результата в настоящей статье рассматриваются бинарные процедуры кодирования.
Рассмотрим сначала статический бинарный квантователь, заданный выражением
д(е, М) = М sign(e). (5)
Параметр М характеризует диапазон квантования. Выход квантователя ё[ЭД = Msign(e[k]) представляется символом в^] из некоторого двоичного алфавита, содержащим один бит информации, поэтому скорость передачи данных составляет R = 1/Т бит/с.
В нестационарных кодерах [8, 22, 25, 26] диапазон М изменяется во времени, так что на каждом шаге обработки информации используются разные значения М, М = М[к]. Использование такого метода масштабирования (зуммирования) в кодерах позволяет увеличить точность кодера в установившемся режиме и в то же время избежать его насыщения в начале процесса. В данной работе используется следующий метод пересчета диапазона квантования по времени:
М[Щ = М0р^ k = 0,1, ..., (6)
где 0 < р < 1 — выбранный параметр затухания. Начальное значение М0 должно быть достаточно большим, чтобы охватить возможную область
значений кодируемого сигнала. Уравнения (5), (6) описывают алгоритм, выполняемый в кодере. Подобная процедура реализуется в декодере, а именно значения М[к] воспроизводятся на стороне приемника согласно (6), таким образом величины у[Щ восстанавливаются по М[к] из полученных символов кодового алфавита.
Аналогично [14] для алгоритма (3)-(6) следует, что при выполнении условий гиперминималь-нофазовости (ГМФ) линейной части модели объекта (1) и при нелинейности, удовлетворяющей условию Липшица
|у(у) - ¥(у)| < -Ц \у - у|, (7)
ошибка оценивания при достаточно больших к затухает экспоненциально быстро:
|ВД| <|\еЩ\ < Мо р\ (8)
Напомним, что ГМФ означает, что числитель Р(1) передаточной функции W(A,) = С(И - А)-1В = = Р(1)/а(1) — гурвицев (устойчивый) многочлен степени п - 1 с положительными коэффициентами, что эквивалентно пассифицируемости линейной части модели объекта [16, 17, 24], т. е. существованию обратной связи по выходу, делающей замкнутую систему пассивной. В свою очередь, условие пассивности, возникшее в теории электрических цепей, означает отсутствие в системе внутренних источников энергии, а для общих линейных систем — выполнение частотного неравенства ReW(^ю) > 0. Ключевым моментом в анализе является применение метода непрерывных моделей: анализа нелинейных гибридных (непрерывно-дискретных) систем через исследование их непрерывных моделей [27, 28].
Заметим, что на практике целесообразно отделять величину М[Щ от нуля. Тогда вместо (8) можно рекомендовать следующий алгоритм вычисления М[Щ:
МЩ = (Мо - М^ + Мх, (9)
где Мже(0, М0) задает нижнюю предельную границу М[Щ. Использование (9) вместо (8) приводит к практической (с некоторой установившейся ошибкой) сходимости процедуры наблюдения, но позволяет избежать расходимости процесса при малых М[Щ, вызванной неучтенными факторами (погрешностями и шумами измерений).
Экспериментальное исследование на многомаятниковом мехатронном комплексе
Многомаятниковый мехатронный комплекс (ММК) разрабатывается в лаборатории управле-
ния сложными системами ИПМаш РАН с 2005 г. [29, 30]. Комплекс ММК (рис. 1) включает многосекционную маятниковую систему, состоящую из двигателя возбуждения и маятниковых секций (до 50), последовательно связанных между собой торсионными пружинами, и управляющую вычислительную машину для управления в реальном времени, обработки и визуализации результатов экспериментов. Каждая маятниковая секция снабжена датчиком угла поворота маятника и локальным вычислительным устройством. Обмен данными между вычислительным устройством и вычислительной машиной осуществляется по общей шине.
Математическая модель маятниковой системы может быть представлена в виде [29, 30]
Ф2 + дф2 + Ю0 sinфх — &(ф2 — 2фх) = ku(t),
ф; + Дфi + Ю0 sin ф; - k(^i+i - 2ф; + ф;_1 ) = О, (i = 2,..., N-1),
ФN + М-ФN + ®0 sin 9n _ k(9N ~ 9n-1) _ 0, (10)
где N — число маятников в цепи; ф;^) — угол отклонения i-го маятника от вертикального положения; д, ю0, k — коэффициент вязкого трения, собственная частота колебаний маятника при малой амплитуде и параметр жесткости торсионной пружины соответственно. Угол поворота ротора двигателя обозначен через u(t).
При большом числе маятников актуальна задача снижения объема передаваемых по шине данных. Рассмотрим возможность ее решения на основе предложенного метода. Пусть углы поворота некоторых маятников измеряются с мини-
■ Рис. 1. Многомаятниковый мехатронный комплекс ИПМаш РАН
мально возможной ошибкой и передаются с большой частотой по каналу связи (погрешность измерений угла валкодерами комплекса составляет 2°), в то время как положения остальных маятников передаются через описанную выше процедуру двоичного кодирования, что служит уменьшению загрузки канала.
Проведены эксперименты для системы из четырех маятников. Углы поворота ротора двигателя и маятника № 2 (нумерация идет от двигателя) измерялись с точностью 2° с интервалом выборки Т0 = 10 мс, а положение маятника № 1 передавалось по алгоритму (4), (5), (9).
Уравнения маятника № 1 в форме (1) имеют вид
— ^2,
&2 = — 2kx■^ — ДХ2 ~Ь ©оУ (у) ~Ь k (ф2 (£) ~Ь
у = хг, у(у) = -8ІП у, (11)
откуда получим матрицы линейной части системы (1) в следующем виде:
О 1 О
A = -2k -д , В = “О
Заметим, что в (1) отсутствует слагаемое, соответствующее сумме внешних воздействий ф2(0 + + и(г), но, так как эти внешние воздействия измеряются и передаются с достаточно высокой точностью, соответствующая добавка вводится в наблюдатель (4) и не приводит к дополнительным ошибкам оценивания.
Параметры модели (10) найдены путем идентификации с использованием пробного гармонического сигнала, подаваемого на двигатель, и выполнения процедуры поисковой оптимизации. Получены значения: д = 0,95 с-1, ю0 = 5,5 с-1, к = = 5,8 с-2. Период Т передачи данных по каналу связи взят Т = 0,25 с, что с учетом двоичной процедуры кодирования соответствует загрузке канала со скоростью R = 4 бит/с. Выбор матрицы L выполнен методом расположения полюсов наблюдателя так, чтобы получить многочлен Бат-терворта det(1I - А + ЬС) = I2 + 1,401 + О2, где параметр О задает быстродействие наблюдателя. В эксперименте использовано значение О = 5 с-1. В выражении (9) выбрано М0 = 0,5, = -0,01,
р = 0,829.
Результаты экспериментов отражены на рис. 2-
5. Из рис. 2 видно, что переходный процесс в наблюдателе занимает около 8 с, что при данной скорости передачи данных соответствует 32 бит информации. Заметим, что рассогласование Ф1 — ф 1М , наблюдаемое на графике, вызвано не
только ошибками кодирования-декодирования, но и погрешностью измерений угла ф1(г), составляющей 0,035 рад. Оценка фх производной угла
ф, рад
10 t,c
■ Рис. 2. Результат измерения ф1(і), полученный в эксперименте (сплошная линия); оценка фвыработанная в декодере по процедуре (3)-(6) (штрихпунктир); рассогласование фі(£) — фі(£) между измеренным и восстановленным сигналами (пунктир)
ф 1( рад/с
-10
-20
101, с
■ Рис. 3. Оценка ф-,_(£) производной угла ф](£), выработанная наблюдателем
ф1(г), выработанная наблюдателем, представлена на рис. 3. В комплексе отсутствуют датчики угловой скорости Ф!(£), информация о которой получается благодаря алгоритму (4), (5), (9).
Как видно из полученных экспериментальных данных, алгоритм (4), (5), (9) позволяет существенно уменьшить загрузку канала связи, обеспечивая при этом высокое быстродействие и точность наблюдения.
Заключение
Разработан метод оценивания состояния нелинейных динамических систем вида Лурье при коммуникационных ограничениях, обеспечивающий асимптотически точное оценивание при достаточно большой скорости передачи данных по каналу в отсутствие искажений и помех, а также модификация метода, позволяющая обеспечить практически точное оценивание при влия-
Литература
1. Navet N., Song Y., Simonot-Lion F., Wilwert C.
Trends in automotive communication systems // Proc. IEEE. Jun. 2005. Vol. 93. N 6. P. 1204-1223.
2. Stilwell D. J., Bishop B. E. Platoons of underwater vehicles // IEEE Control Syst. Mag. 2000. Vol. 20. N 6. P. 45-52.
s[ft]
-1
SHiHH
0 2 4 6 8 10 t,c
■ Рис. 4. Последовательность символов s[k]e{-1, 1}, переданная по каналу связи
-0,2
10 t, с
■ Рис. 5. Сигнал поправки є(t), восстановленный на стороне приемника по s[k]
нии искажений. Показано, что предложенный [14] метод применим не только к задачам управляемой синхронизации ведомой и ведущей систем, но и к оцениванию состояния нелинейных колебательных (в том числе хаотических) систем по каналу связи с ограниченной пропускной способностью. Обоснование алгоритма основано на методах пассификации и непрерывных моделей.
Применение разработанного метода для передачи данных на многомаятниковом мехатронном комплексе ИПМаш РАН экспериментально подтвердило эффективность предложенной процедуры.
Продолжение работы намечено посвятить исследованию более реалистичных моделей системы, учитывающих неидеальность канала связи (пропадание данных, искажения и запаздывание), а также расширению предложенного метода на системы с распределенными параметрами.
Работа выполнена при финансовой поддержке РФФИ (гранты 07-01-92166, 08-01-00775, 09-0800803), Межсекционной программы фундаментальных исследований ОЭММПУ РАН «Проблемы управления и безопасности энергетики и технических систем. Активно-адаптивные сети» и ФЦП «Кадры» (госконтракт 16.740.11.0042).
3. Baillieul J., Antsaklis P. J. Control and communication challenges in networked real-time systems // Proc. IEEE. 2007. Vol. 95. N 1. P. 9-28.
4. Matveev A. S., Savkin A. V. Estimation and Control over Communication Networks. — Boston: Birkhaus-er, 2009. — 533 p.
5. Андриевский Б. Р., Фрадков А. Л. Управление и наблюдение через каналы связи с ограниченной пропускной способностью // Гироскопия и навигация.
2009. № 4. С. 103-114.
6. Андриевский Б. Р., Матвеев А. С., Фрадков А. Л. Управление и оценивание при информационных ограничениях: к единой теории управления, вычислений и связи // Автоматика и телемеханика.
2010. № 10. С. 34-99.
7. Evans R., Krishnamurthy V., Nair G., Sciacca L. Networked sensor management and data rate control for tracking maneuvering targets // IEEE Trans. Signal Proc. 2005. Vol. 53. N 6. P. 1979-1991.
8. Fradkov A. L., Andrievsky B., Evans R. J. Chaotic observer-based synchronization under information constraints // Physical Review. E. 2006. Vol. 73. P. 066209.
9. Fradkov A. L., Andrievsky B., Evans R. J. Synhroni-zation of nonlinear systems under information constraints // Chaos. 2008. Vol. 18. N 4. P. 037109 1-11.
10. Fradkov A. L., Andrievsky B., Evans R. J. Adaptive observer-based synchronization of chaotic systems with first-order coder in presence of information constraints // IEEE Trans. Circuits Syst. I. 2008. Vol. 55. N 6. P. 1685-1694.
11. Fradkov A. L., Andrievsky B. Application of passifi-cation method to controlled synchronization of tree networks under information constraints // Proc. 3rd IEEE Multi-conf. on Systems and Control (MSC 2009), Saint Petersburg, Russia, Jul. 8-10, 2009. Р. 513- 518.
12. Андриевский Б. Р., Фрадков А. Л. Адаптивная синхронизация нелинейных систем // Изв. вузов. Приборостроение. 2007. Т. 50. № 10. С. 17-23.
13. Андриевский Б. Р., Фрадков А. Л. Адаптивная синхронизация нелинейных систем одного класса при ограниченной пропускной способности канала связи // Управление большими системами: Сб. 2009. Вып. 25. С. 48-83.
14. Fradkov A. L., Andrievsky B., Evans R. J. Synchronization of passifiable Lurie systems via limited-capacity communication channel // IEEE Trans. Circuits Syst. I. 2009. Vol. 56. N 2. P. 430-439.
15. Фрадков А. Л. Квадратичные функции Ляпунова в задаче адаптивной стабилизации линейного динамического объекта // Сибирский математический журнал. 1976. Т. 2. С. 436-445.
16. Fradkov A. L. Passification of nonsquare linear systems and Feedback Kalman — Yakubovich — Popov Lemma // Europ. J. Contr. 2003. Vol. 9. N 11. P. 573582.
17. Андриевский Б. Р., Фрадков А. Л. Метод пассифи-кации в задачах адаптивного управления, оцени-
вания и синхронизации // Автоматика и телемеханика. 2006. № 11. С. 3-37.
18. Nijmeijer H., Mareels I. M. Y. An observer looks at synchronization // IEEE Trans. on Circuits and Systems. I. 1997. Vol. 44. N 10. P. 882-890.
19. Cheng T. M., Savkin A. V. Output feedback stabilisation of nonlinear networked control systems with non-decreasing nonlinearities: A matrix inequalities approach // Int. J. Robust Nonlinear Control. 2007. Vol. 17. N 5-6. P. 387-404.
20. Fradkov A. L., Andrievsky B., Evans R. J. Controlled synchronization under information constraints // Physical Review. E. 2008. Vol. 78. P. 036210 1-6.
21. Tatikonda S., Sahai A., Mitter S. Control of LQG systems under communication constraints // Proc. American Control Conf., San Diego, California, USA: AACC, Jun. 1999. P. 2778-2782.
22. Brockett R. W., Liberzon D. Quantized feedback stabilization of linear systems // IEEE Trans. Automat. Contr. 2000. Vol. 45. N 7. P. 1279-1289.
23. Matveev A. S., Savkin A. V. Optimal state estimation in networked systems with asynchronous communication channels and switched sensors // Proc. 40th IEEE Conf. on Decision and Control, Orlando, Florida, USA: IEEE, Dec. 2001. Vol. TuM13. P. 825-830.
24. Фрадков А. Л. Синтез адаптивной системы стабилизации линейного динамического объекта // Автоматика и телемеханика. 1974. № 12. С. 96-103.
25. Tatikonda S., Mitter S. Control under communication constraints // IEEE Trans. Automat. Contr. 2004. Vol. 49. N 7. P. 1056-1068.
26. Nair G. N., Fagnani F., Zampieri S., Evans R. Feedback control under data rate constraints: an overview // Proc. IEEE. 2007. Vol. 95. N 1. P. 108-137.
27. Деревицкий Д. П., Фрадков А. Л. Две модели для анализа динамики алгоритмов адаптации // Автоматика и телемеханика. 1974. № 1. С. 67-75.
28. Деревицкий Д. П., Фрадков А. Л. Прикладная теория дискретных адаптивных систем управления. — М.: Наука, 1981. — 216 с.
29. Андриевский Б. Р., Бойков К. Б., Лавров Б. П., Фрадков А. Л. Многомаятниковый мехатронный комплекс // Нелинейные проблемы теории колебаний и теории управления: Сб./Под ред. В. В. Белецкого, Д. А. Индейцева, А. Л. Фрадкова; ИПМаш РАН. СПб.: Наука, 2009. C. 129-140.
30. Фрадков А. Л., Андриевский Б. Р., Бойков К. Б., Андриевский А. Б. Многомаятниковый мехатрон-ный комплекс // Мехатроника, автоматизация, управление. 2011. № 1. С. 41-54.