СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ SYSTEM ANALYSIS, CONTROL, AND INFORMATION PROCESSING
УДК 681.51
DOI: 10.17586/0021-3454-2023-66-10-828-833
АДАПТИВНЫЕ НАБЛЮДАТЕЛИ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ НА ОСНОВЕ ПРОЦЕДУРЫ ДИНАМИЧЕСКОГО РАСШИРЕНИЯ И СМЕШИВАНИЯ
В. В. Беспалов*, А. А. Ведяков
Университет ИТМО, Санкт-Петербург, Россия [email protected]
Аннотация. Рассмотрена задача синтеза адаптивного наблюдателя переменных состояния нелинейных динамических систем. Получение корректной оценки компонентов вектора состояний при параметрической неопределенности — достаточно сложный процесс, необходимый, например, при решении ряда задач управления или диагностики. Процесс синтеза предложенного адаптивного наблюдателя разделен на два этапа. На первом этапе осуществляется параметризация нелинейной динамической системы, принадлежащей заранее определенному классу систем, приводимых к линейной по состоянию форме. На втором оцениваются неизвестные параметры на основе метода градиентного спуска и синтезируется градиентный наблюдатель переменных состояния.
Ключевые слова: адаптивный наблюдатель, параметризация нелинейной системы, линейные по состоянию формы, глобальная сходимость, оценка параметров
Благодарности: работа выполнена при поддержке Министерства науки и высшего образования Российской Федерации, паспорт госзадания 2019-0898.
Ссылка для цитирования: Беспалов В. В., Ведяков А. А. Адаптивные наблюдатели для нелинейных систем на основе процедуры динамического расширения и смешивания // Изв. вузов. Приборостроение. 2023. Т. 66, № 10. С. 828—833. DOI: 10.17586/0021-3454-2023-66-10-828-833.
ADAPTIVE OBSERVERS FOR NONLINEAR SYSTEMS BASED ON DYNAMIC EXTENSION AND MIXING PROCEDURE
V. V. Bespalov*, А. А. Vedyakov
ITMO University, St. Petersburg, Russia [email protected]
Abstract. The problem of synthesizing an adaptive observer of state variables of nonlinear dynamic systems is considered. Correct estimation of state vector components under parametric uncertainty is a rather complex process necessary e.g. for solving several problems of systems control and diagnostic. Synthesis of the proposed adaptive observer consists of two steps. In the first one, a parameterization of the nonlinear dynamical system, which can be transformed to a state affine form, is performed. In the second step, the unknown parameters are estimated based on the gradient descent method, and a gradient-based observer for the state variables is designed.
Keywords: adaptive observer, nonlinear system parameterization, affine state form, global convergence, parameter estimation
Acknowledgment: The work was carried out with the support of the Ministry of Science and Higher Education of the Russian Federation, state assignment passport 2019-0898.
For citation: Bespalov V. V., Vedyakov А. А. Adaptive observers for nonlinear systems based on dynamic extension and mixing procedure. Journal of Instrument Engineering. 2023. Vol. 66, N 10. P. 828—833 (in Russian). DOI: 10.17586/0021-3454-2023-66-10-828-833.
© Беспалов В. В., Ведяков А. А., 2023 ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2023. Т. 66, № 10
Введение. Одним из популярных и актуальных направлений исследований в современной теории управления является разработка методов синтеза наблюдателей переменных состояния нелинейных динамических систем.
Большинство методов предполагает, что существует отображение, позволяющее свести систему к требуемому виду. Часть методов основана на построении линейной модели, схожей с линейной регрессией, для получения оценок состояний системы. Однако применимость таких методов зависит от ряда ограничений, связанных с допущениями, требующими существования такого отображения [1, 2].
В работе [3] представлен метод для систем, сводимых к каскадной форме. Основная идея метода заключается в том, что задача синтеза адаптивного наблюдателя сводится к оцениванию неизвестных параметров, связанных с начальными условиями неизвестных состояний системы. В работе [4] возможности метода расширены для систем, сводимых к линейной по состоянию форме. Указанный метод отличается простотой процедуры синтеза наблюдателя, однако он не позволяет получать оценки состояний напрямую.
В работе [5] предложен метод синтеза адаптивных наблюдателей, позволяющий получать оценку вектора состояний напрямую, но только для систем, сводимых к каскадной форме.
В настоящей работе на основе результатов, полученных в [4, 5], предлагается метод синтеза наблюдателя для систем, сводимых к линейной по состоянию форме, позволяющий напрямую получать оценку вектора состояний.
Постановка задачи. Рассматриваются нелинейные динамические системы вида:
х (г) = / (х (Г), у (Г), 0 р ), у (г) = к ( х (Г), и (Г)), (1)
где х (г)е Мп — неизвестный вектор состояния системы, и := и (г)е Мт — сигнал управления, у (г) =: у е М5 — измеряемый выходной сигнал, 0р е Мр — вектор неизвестных параметров.
Целью работы является синтез динамической системы вида
С = ^(£Мр) 0р = р0 (^Си,0р), х = к(у,х,и),
для которой гарантируется глобальная сходимость к нулю ошибки оценивания состояния х (г) := х (г)- х (г) и ошибки оценивания вектора неизвестных параметров 0р (г) := 0р - 0р (г)
для любых начальных условий х(0) е Мп , где £() е МИг= и х ()е М9 — внутренние переменные системы, которые формально определены далее, х (г), 0р (г) — оценки вектора состояний
и неизвестных параметров соответственно.
Допущение 1. Для нелинейной динамической системы вида (1) существует инъективное
гладкое отображение %(г) = ф(х(г)) :Мп ^ М9, преобразующее ее к линейной по состоянию
форме:
X (г ) = Л ( у, и )х( г) + Н ( у, и )0 р + ч (у, и ), (2)
где х(г)е М9 — образ неизвестного вектора состояния х(г);Л(у,и)е М9X9 — известная, в
частном случае — стационарная, матрица; Н (у, и) е М9Хр и ч (у, и) е М9 — известные гладкие функции.
Допущение 2. Существует алгебраическое соотношение, связывающее образы координат вектора состояния системы с известными гладкими функциями ф(у, и): М5 х Мт ^ М'+9 и
с (у, и): М5 X Мт ^ М :
фт (у, и)
" б/ ' х( )
= с (у, и),
(3)
где 9/ е М/ — вектор неизвестных параметров.
Допущение 3. Сигнал управления и (t) обеспечивает ограниченность траекторий нелинейной системы (1).
Параметризация модели. Первый случай. Пусть в соотношении (2) матрица состояний Л (у, и) — известная нестационарная, причем выполняется следующее допущение.
Допущение 4. Решения динамической системы г ^) = Л (у, и) г (t) ограничены.
Утверждение 1. Нелинейная динамическая модель (1), удовлетворяющая допущениям 1—4, совместно с вспомогательными переменными, являющимися решениями следующих дифференциальных уравнений:
г ( ) = Л( у, и ) г ^ ) + w (у, и ), г ( 0 ) = 0, П ( ) = Л (у, и )П() + Н (у, и ), О (0 ) = 0, приводима к линейной модели
q(y, и ) = у^ и )со1 [9/; х(); е (0); 9
(4)
где
р + а
?(у, и) := с/ (у, и)+- ф/ (у, u)w (у, и) + г ()- Л (у, и)фу/(у, и)
р + а
1
т 1
(Л(у, и) г (t) + w (у, и ) + Л (у, и)П()) - Лт (у, и)ф/ (у, и)
р + а[ч " ' 4 ' " ' р + а
¥(^ и):=[^Т (t) ^¡Х (t) ¥т (t) VТ (t)
компоненты регрессора у (у, и) определены как
V/ ():=Ф// (У, и ), ¥х() :=Ф^ (y, и), 1
¥0 (t) := + 1
р + а
р + а 1
р + а
фт/ (у,и)(л(у,и))_фл (у,и) ф/ (y,и)(Л(y,и))_Фл^и)
1
р + а
(t):=--Ф/ и)Н (у,и)
р + а
Ф,^/ ^ и ^^ и )
р + а
—[фТ/ (у, и )(Л(у, и ))](Л(у, и )П() + Н (у, и ))
Параметризация модели. Второй случай. Пусть нелинейная динамическая система (1) приводима к линейной по состоянию форме (2), в которой матрица состояний является стационарной Л (у, и) = Л, и выполняются допущения.
Допущение 5. Для измеряемого сигнала выхода системы у(t) = ), где С> известная матрица.
Допущение 6. Пара матриц (Л, С) является полностью наблюдаемой.
е
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2023. Т. 66, № 10
ЛЭиКМА!- СР ^вТКУМЕМТ ЕМЗ^ЕЕИМЭ. 2023. Уо!. 66, N 10
Утверждение 2. Нелинейная динамическая модель (1), удовлетворяющая допущениям 1—3 и 5—6, совместно с вспомогательными переменными, являющимися решениями следующих дифференциальных уравнений:
¿1 (г ) = ЛТ1 (г) + Ьу (г), 21 ( 0 ) = 0; ¿2 (г ) = Л22 (г)+ч ( у, и ), ¿2 ( 0 ) = 0; О (г ) = ЛО( г)+н (у, и), О( 0 ) = 0,
где Л е М^ : Л = Л - ЬС, Ь е М^5 — настраиваемая матрица, приводима к линейной модели
т
?(у,и) = ¥(у,и)[е7 х() е(0) 0р] ,
и ):= С/ (у, и )+ —-1— Фт^ (у, и ) (у, и ) + ф/ (у, и )Л( (г ) + ¿2 (г ))
^и) :=[¥] (г) (г) Vт (г) VТ (г) компоненты регрессора у (у, и) определены как
(5)
1
VI (г) := Ф/ (у,и), (г) := Ф/ (у,и), ¥0 (г) :=- Ф/ (у, и)
V р(г ):=-
р + а
ф]/ (у, и )н (У, и)
р + а т
Лг
р + а
Ф]/ ^ и )ЛО(г)
Доказательство утверждений 1 и 2 может быть построено следующим образом. К алгеб-
а
, где а > 0,
р + а
раическому соотношению (3) применяется линейный устойчивый фильтр р := ё--оператор дифференцирования, благодаря чему становится возможным применить
ёг
лемму о перестановках [6, 7]. В получившемся выражении выполняется замена величины X (г) согласно соотношению (2). После этого, по аналогии с [4], вводится соответствующий набор вспомогательных переменных для формирования сигнала ошибки. Полученная модель ошибки позволяет произвести замену величин X (г) и х(г) и перейти к линейной модели
требуемого вида с использованием леммы о перестановках.
Метод синтеза адаптивного наблюдателя. После того как нелинейная система (1) преобразована к линейной модели (4) или (5), возможно построить алгоритм оценивания неизвестных параметров и переменных состояния. Для этого используется N = I + 2q + р различных значений параметра аг- > 0, г = 1,...,N, чтобы сформировать набор линейных моделей:
и, аг ) = ¥( и, аг )со1 [е/; х; е (0 ); 0 р .
Полученные линейные модели объединяются в „расширенную" модель:
Е(г) :=
?(у, и, а1) ?(у, u, а 2 )
?(у, и, а n )
*(г) :=
¥( у, и, а1) V^.У, и, а2 )
у(у, и, а N)
^ xn
(6)
На следующем этапе выполняется процедура „смешивания" [5], в результате которой линейная модель (6) преобразуется к виду
7 (г ) = д(г )со1 [01; х; е (0 ); 0
где измеряемые сигналы Z (t) и Д^) определены следующим образом:
7(t) := аё])(t), Д(t) := ёе1 t)).
Если А () удовлетворяет условию интервального возбуждения [6], оценку неизвестного параметра 0р можно сформировать по методу, описанному в работе [5]. Утверждение 3. Наблюдатель переменных состояния
X () = Л (У, и) х (t) + Н (у, и) 9/тсо + w (^ и) + ухА (t) (7Х (t) - х (1) А (t)),
х ^ ) = ФЬ (X (t))
нелинейной динамической системы (1), приводимой к линейной модели (4) или (5), где ух —
х ртсо
настраиваемый параметр, 0р — оценка неизвестного параметра 0р, построенная аналогично [5], обеспечивает экспоненциальную сходимость ошибки оценивания неизвестного вектора состояний х () к нулю:
\х ^ )\<^\х (0), ,р>0, (8)
при условии, что А (t^2 : ]*А2 (t= ю, отображение ф^ (х) удовлетворяет условию Лип-
шица: 3 L > 0 :
фЬ (Х1 )-фL (х2 ) < L |X1 (t)- X2 (t)|, а матрица л(y u) тaкaя, что
t+T
35 > 0,T > 0: J (Л(т)- ухА2 (x)lq)dT<-5Iq, (9)
где е 4 — единичная матрица.
Для доказательства утверждения 3 необходимо сформировать динамическую модель ошибки оценивания х ()= X (t)- X () с учетом полученной оценки вектора неизвестных параметров. Поскольку ошибка оценивания вектора неизвестных параметров сходится к нулю за конечное время, становится возможным упростить модель ошибки оценивания вектора состояний. Учитывая неравенство (9), можно сделать вывод об экспоненциальной сходимости ошибки оценивания вектора состояний к нулю, на основании результата, описанного в [8].
Согласно допущению 1, существует левое обратное отображение ф^ (XX), удовлетворяющее условию Липшица, из чего можно показать, что неравенство (8) выполнено, следовательно, доказательство завершено.
Заключение. В работе представлен метод синтеза адаптивных наблюдателей нелинейных динамических систем, приводимых к линейной по состоянию форме. Предложен способ параметризации таких систем к линейной модели. Аналогично методу, описанному в [5], осуществляется преобразование полученной модели, после чего с помощью метода градиентного спуска синтезируется алгоритм оценивания неизвестных параметров со свойством сходимости ошибки оценивания к нулю за конечное время. Затем формируется корректирующее слагаемое и конструируется наблюдатель переменных состояния, обеспечивающий экспоненциальную сходимость ошибки оценивания переменного состояния к нулю.
СПИСОК ЛИТЕРАТУРЫ
1. Kazantzis N. and Kravaris C. Nonlinear observer design using Lyapunov's auxiliary theorem // Proc. of the 36th IEEE Conf. on Decision and Control. San Diego, CA, USA, 1997. Vol. 5. P. 4802—4807. DOI: 10.1109/CDC.1997.649779.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2023. Т. 66, № 10
JOURNAL OF INSTRUMENT ENGINEERING. 2023. Vol. 66, N 10
2. Andrieu V. and Praly L. On the Existence of a Kazantzis-Kravaris/Luenberger Observer // SIAM Journal on Control and Optimization. 2006. Vol. 24, N 5. P. 432—456.
3. Ortega R., Bobtsov A., Pyrkin A., Aranovskiy S. A parameter estimation approach to state observation of nonlinear systems // Systems & Control Letters. 2015. Vol. 85. P. 84—94. ISSN 0167-6911. https://doi.org/10.1016/j.sysconle.2015.09.008.
4. Ortega R., Bobtsov A., Nikolaev N., Schiffer J. Generalized parameter estimation-based observers: Application to power systems and chemical-biological reactors // Automatica. 2021. Vol. 129. Р. 109635. ISSN 0005-1098. https://doi.org/10.1016/j.automatica.2021.109635.
5. Pyrkin A., Bobtsov A., Ortega R., Vedyakov A., Aranovskiy S. Adaptive state observers using dynamic regressor extension and mixing // Systems & Control Letters. 2019. Vol. 133. Р. 104519. ISSN 0167-6911. https://doi.org/10.1016/j.sysconle.2019.104519.
6. Sastry S., Bodson M. Adaptive Control: Stability, Convergence and Robustness. Englewood Cliffs, NJ: Prentice Hall, 1989.
7. Kreisselmeier G., Rietze-Augst G. Richness and excitation on an interval— with application to continuous-time adaptive control // IEEE, Trans. Automat. Control. 1990. Vol. 2, N 35. P. 165—171.
8. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. М.: Высш. шк., 2003. ISBN: 5-06-004162-Х.
Сведения об авторах
Владимир Владимирович Беспалов — аспирант; Университет ИТМО, факультет систем управления и робототехники; E-mail: [email protected]
Алексей Алексеевич Ведяков — канд. техн. наук; Университет ИТМО, факультет систем управления
и робототехники; доцент; E-mail: [email protected]
Поступила в редакцию 01.06.23; одобрена после рецензирования 14.06.23; принята к публикации 28.08.23.
REFERENCES
1. Kazantzis N. and Kravaris C. Proceedings of the 36th IEEE Conference on Decision and Control, San Diego, CA, USA, 1997, vol. 5, pp. 4802-4807, DOI: 10.1109/CDC.1997.649779.
2. Andrieu V. and Praly L. SIAM Journal on Control and Optimization, 2006, no. 45(2), pp. 432-456.
3. Ortega R., Bobtsov A., Pyrkin A., Aranovskiy S. Systems & Control Letters, 2015, vol. 85, pp. 84-94, ISSN 01676911, https://doi.org/10.1016/j.sysconle.2015.09.008.
4. Ortega R., Bobtsov A., Nikolaev N., Schiffer J. Automatica, 2021, vol. 129, pp. 109635, ISSN 0005-1098, https://doi.org/10.1016/j.automatica.2021.109635.
5. Pyrkin A., Bobtsov A., Ortega R., Vedyakov A., Aranovskiy S. Systems & Control Letters, 2019, vol. 133, pp. 104519, ISSN 0167-6911, https://doi.org/10.1016/j.sysconle.2019.104519.
6. Sastry S., Bodson M. Adaptive Control: Stability, Convergence and Robustness, Englewood Cliffs, NJ, Prentice Hall, 1989.
7. Kreisselmeier G., Rietze-Augst G. IEEE Trans. Automat. Control, 1990, no. 35(2), pp. 165-171.
8. Afanasyev V.N., Kolmanovsky V.B., Nosov V.R. Matematicheskaya teoriya konstruirovaniya sistem upravleniya (Mathematical Theory of Design of Control Systems), Moscow, 2003, ISBN: 5-06-004162-X. (in Russ.)
Data on authors
Vladimir V. Bespalov — Post-Graduate Student; ITMO University, Faculty of Control Systems and Robotics;
E-mail: [email protected]
Alexey A. Vedyakov — PhD; ITMO University, Faculty of Control Systems and Robotics;
E-mail: [email protected]
Received 01.06.23; approved after reviewing 14.06.23; accepted for publication 28.08.23.