ТЕХНИЧЕСКИЕ НАУКИ
ОБ ОДНОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧ СИНТЕЗА ОПТИМАЛЬНЫХ НАБЛЮДАТЕЛЕЙ ПОЛНОГО ПОРЯДКА В ПРОСТРАНСТВЕ СОСТОЯНИЙ
12 3
Есаков В.А. , Дудко В.Г. , Шлопак А.А. Email: Esakov 17117@scientifictext. ru
1Есаков Виталий Анатольевич - академик Российской академии космонавтики, кандидат технических наук, профессор; 2Дудко Владимир Григорьевич - кандидат технических наук, доцент; 3Шлопак Александр Анфирович - кандидат технических наук, доцент, Секция кафедры «Системы автоматического управления» (ИУ-1 МФ), Мытищинский филиал Московский государственный технический университет им. Н.Э. Баумана,
г. Мытищи
Аннотация: в статье рассматривается метод решения задач синтеза оптимальных по квадратичным критериям качества асимптотических динамических наблюдателей состояния линейных стационарных объектов, заданных дифференциальными уравнениями в нормальной форме Коши с использованием системы уравнений Эйлера и необходимых условий оптимальности в форме усиленных условий Лежандра. Рассмотрены особенности постановки детерминированной задачи об оптимальном наблюдении состояния линейной стационарной обыкновенной непрерывной динамической системы. Ключевые слова: наблюдатель, оптимальный, метод, стационарный.
ON A METHOD FOR SOLVING PROBLEMS OF SYNTHESIS OF OPTIMAL OBSERVERS OF COMPLETE ORDER IN THE STATE SPACE Esakov V.A.1, Dudko V.G.2, Shlopak A.A.3
1Esakov Vitaly Anatolyevich - Academician of the Russian Academy of Astronautics, PhD in Engineering Sciences, Professor;
2Dudko Vladimir Grigoryevich - PhD in Engineering Sciences, Associate Professor;
3Shlopak Alexander Anfirovich - PhD in Engineering Sciences, Associate Professor, SECTION OF THE DEPARTMENT «AUTOMATIC CONTROL SYSTEMS» (IU-1MF),
MYTISHCHI BRANCH BAUMAN MOSCOW STATE TECHNICAL UNIVERSITY, MYTISHCHI
Abstract: in the article the method of solving problems of synthesis of optimal quality according to quadratic criteria asymptotic dynamic observers of the state of linear stationary objects, given by differential equations in the normal form of Cauchy using the system of Euler equations and necessary optimality conditions in the form of enhanced Legendre conditions is considered. The features of the formulation of the deterministic problem of optimal observation of the state of a linear stationary ordinary continuous dynamical system are considered. Keywords: observer, optimal, method, stationary.
УДК 681.51
Обычно доступны непосредственным измерениям не все компоненты вектора состояния системы, а лишь некоторая их часть или некоторые их линейные комбинации.
Поэтому выходной вектор объекта имеет размерность меньшую размерности вектора состояния [1]-[3]. Пусть задан линейный стационарный непрерывный динамический объект управления с сосредоточенными параметрами следующим векторно-матричным дифференциальным уравнением в нормальной форме Коши:
Х = ^Х + 5и, (1)
где X = (х,х,■■■,X)Т - вектор состояния объекта;
и = (и, и2, ■■■, }Т - вектор управления объекта;
А = (ау }пп, В = (Ъу }пт - заданные постоянные матрицы объекта.
Уравнение (1) описывает динамику изменения во времени вектора состояния объекта. Для того чтобы математическое описание объекта было полным, к его дифференциальному уравнению динамики (1) должно быть добавлено дополнительное второе алгебраическое уравнение вида:
У = СХ, (2)
где У = (у, у2, ■■■, у }Т - вектор выходных измеряемых переменных объекта;
С = (с^ }гп - заданная постоянная матрица,
Г < П. (3)
Это уравнение (2) устанавливает связь неизвестного и недоступного непосредственным измерениям вектора состояния объекта с его выходным вектором, каждая компонента которого доступна измерению. Подаваемый на вход объекта вектор управления также полностью доступен измерению.
Итак, имеется вид уравнений (1), (2) объекта управления, то есть его структура, с известными всеми матрицами, то есть параметрами, входящими в эти уравнения; доступный измерению выходной вектор объекта; доступный измерению входной вектор управления объекта. Опираясь на знание указанных матриц, управляющего и выходного векторов объекта, необходимо оценить вектор состояния объекта управления. Оценку вектора состояния данного динамического объекта (1) будем
обозначать через X:
Близость этой текущей оценки (4) к истинному текущему значению вектора состояния
Х(0 = (МО, *2(0,---, хп (г)}Т (5)
будем характеризовать вектором текущей ошибки
Х(0 = Х(0-Х(0 (б)
Требуется по известным параметрам и структуре объекта (1), (2) и наблюдаемым входному и выходному векторам этого объекта построить линейную стационарную динамическую систему, которая давала бы на выходе такую оценку (4) вектора состояния (5) объекта (4), чтобы ошибка (6) с течением времени стремилась к нулю:
Х(0 —» 0 при ? —» оо. (7)
Такую динамическую систему называют динамическим идентификатором состояния объекта (1), (2).
Для того чтобы создаваемый динамический идентификатор обладал высокой эффективностью его стремятся строить с использованием методов классического или современного вариационного исчисления.
Если такая динамическая система построена так, что достигается минимум функционала вида
1 к • J = -\(XrOk + XrBX)dt -> min; (8)
20
QT = Q = iqJn,n > o, RT = R = irX„ > o,
то полученный идентификатор состояния объекта будет оптимальным по квадратичному критерию точности (8).
Рассмотрим метод решения задачи (1)-(8) о построении оптимальных детерминированных наблюдателей состояния линейных стационарных непрерывных динамических объектов, полагая, что синтезируемый наблюдатель должен восстанавливать все компоненты вектора состояния объекта. Прежде чем решать эту задачу синтеза, необходимо убедиться в том, что она имеет решение, то есть выяснить, возможность в принципе найти для заданного конкретного объекта (1), (2) оценку (4) его вектора состояния (5) по измеряемым входному и выходному векторным сигналам объекта. Имеется в виду, что оценка (4), получаемая наблюдателем, должна удовлетворять асимптотическому условию (7) исчезновения ошибки (6). Известно [2], что при указанных условиях восстановить, то есть найти оценку вектора состояния объекта (1), (2), можно только в том случае, когда данный идентифицируемый объект представляет собой вполне или полностью наблюдаемую динамическую систему.
Система, заданная уравнением динамики (1) и уравнением наблюдения (2), называется полностью наблюдаемой, если все координаты текущего вектора состояния могут быть восстановлены по результатам измерений выходного и управляющего векторов на предшествующем интервале времени, включая текущий момент.
Для анализа условий наблюдаемости линейных стационарных динамических систем вида (1), (2) следует составить так называемую матрицу наблюдаемости
NH = {CT, ATCT,...,(AT )n-lCT }. (9)
Система (1), (2) полностью наблюдаема тогда и только тогда, когда ранг матрицы наблюдаемости (9) равен порядку этой системы.
Сформулированный выше критерий Калмана полной наблюдаемости системы (1), (2) математически может быть записан в виде:
rank NH = n . (10)
Если это условие выполняется, то приступают к построению наблюдателя. Поскольку вид и параметры объекта (1), (2) известны, то целесообразно для получения динамической системы, дающей на выходе оценку (4), создать по уравнению (1) модель объекта, на вход которой подается тот же управляющий векторный сигнал, который поступает на реальный объект. Если начальное состояние модели:
Х(0) = Хо (11)
точно совпадает с начальным значение вектора состояния (5) идентифицируемого объекта (1)
X(0) = Xo, (12)
то при устойчивом объекте вектор состояния модели будет совпадать с текущим вектором состояния объекта. Модель должна конструироваться так, чтобы все ее переменные состояния были доступны непосредственным измерениям. В этом случае измеряемый выходной вектор (4) модели будет давать хорошую довольно точную оценку вектора состояния (5) объекта (1). По этой известной оценке (4) можно найти и оценку выходного вектора (2) объекта (1) по формуле
Y = СХ, (13)
Построенный таким образом идентификатор состояния объекта является довольно простым, но обладает по крайней мере двумя существенными недостатками. Во-первых, трудно добиться того, чтобы начальное состояние (11) наблюдателя совпало с начальным состоянием (12) объекта (1). Второй, более серьезный недостаток состоит в том, что если характеристическое уравнение объекта (1) имеет корни с положительными вещественными частями, то даже очень малое отклонение начального вектора (11) от значения (12), которое может быть вызвано помехой или ошибками измерений, будет приводить к росту во времени ошибки (6). Этот рост будет протекать тем быстрее, чем больше величина положительной вещественной части корня указанного характеристического уравнения. По этой причине асимптотическое условие (7) не будет выполняться, и такой наблюдатель оказывается неработоспособным.
Чтобы избежать этих недостатков, простейший наблюдатель следует надлежащим образом модифицировать. В схеме наблюдателя использовалась не вся информацию о системе, которая имеется. В формировании оценки состояния не участвует выход системы, который доступен для измерения. Использование выходного вектора (2) объекта позволит улучшить оценку вектора состояния объекта. Измеряемый выход (2) объекта будем сравнивать с его оценкой (13) и их разностью
У = У-СХ (15)
будем в качестве ошибки подавать с определенным весом на вход идентификатора в качестве корректирующего воздействия. Уравнение динамики такого усовершенствованного наблюдателя может быть записано в следующем виде:
Х = ЛХ + ДУ-СХ)+Яи (16)
£ = {'„■}„,,• (17)
где Ь - матрица коэффициентов усиления наблюдателя.
Дифференциальное векторно-матричное уравнение наблюдателя (16) в этом случае имеет вид:
Х = 2Х + £У + £и (18)
А = А - ЬС . (19) Рассмотрим пример синтеза линейного стационарного объекта со скалярным входом и выходом, заданным следующими уравнениями динамики и измерений соответственно:
х1=х2: (20) х2 = -2х1 - Зх2 + 4г/: (21) У = 2х,. (22)
Требуется синтезировать структуру динамического асимптотического наблюдателя полного порядка, который обеспечивает формирование по непрерывно измеряемым управлению и и выходу у оценку
Х={ХРХ2}Г (23) вектора состояния объекта (20)-(22)
X = (х1, Х2}Т, (24) оптимальную в смысле безусловного минимума заданного функционала
/ = |_(5Х12 + 36*2 + 0,2^1 + ^2 (25)
о -
Квадратичного относительно ошибок восстановления
х1 = X, - х1, 7=1,2; Х = {х1,х1}г (26) Матрицы, входящие в (1), (2) и (8), имеют следующий вид для данной задачи:
о 11 _ Го 1
; С = (2; 0}; (27)
Г 5 0 1 _ Го,2 01 ° =е=10 36}'0 ;; ЛТ=*=(о Г0. <28)
Матрицы (28) квадратичного функционала (8) являются положительно определенными симметричными матрицами.
Матрица наблюдаемости (9), которая с учетом выражения (26) в данном случае запишется в виде
Кн = [СТ, АТСТ ] = {2 0}. (29)
Воспользовавшись критерием Калмана (10), проверяем выполнение условий полной наблюдаемости системы (20), (21):
{2 01
ёе ^ \ = 4, ганкИн = п = 2. (30)
Отсюда вытекает, что рассматриваемая задача о наблюдателе разрешима.
Полагая, что структура создаваемого наблюдателя должна совпадать со структурой объекта (1) и иметь дополнительную обратную связь по ошибке восстановления выходного сигнала:
Дифференциальное уравнение этого наблюдателя запишем в следующей форме:
X = АХ + Ь(у - СХ) 4- Ли (32)
или
Х = {А-1С)Х + 1у + Ви (33)
В этих соотношениях матрица-столбец коэффициентов усиления наблюдателя обозначена через
Ь = [/„ /2}т. (34)
Вычитая уравнение наблюдателя (31) из уравнения объекта (1), найдем дифференциальное уравнение относительно ошибки восстановления вектора состояния объекта
X = (.А-ЬС)Х, Х(оо) = 0. (35)
Матрица этого уравнения имеет следующую структуру
А - ЬС = { -2/1 1 1. (36)
\-2(/2 +1) -з/ ( )
Эта матрица одновременно является матрицей уравнения динамики проектируемого наблюдателя (32), (33) и должна иметь оптимальные значения
собственных чисел, что может быть обеспечено надлежащим выбором коэффициентов усиления (33) наблюдателя.
Вариационную задачу на безусловный экстремум (24) решаем с помощью векторного уравнения Эйлера
и условия Лежандра
%>-±%. = 0. (37) дХ Л
а2/-
■/о=К>0 (38)
дХ2
Подставляя подынтегральную функцию /0 функционала (8) в уравнение (37),
получим после простых преобразований векторное уравнение Эйлера в следующем виде:
Х-ТГ^Х = 0, (39) Этому векторному дифференциальному уравнению (38) соответствует свое характеристическое уравнение:
6ег{Е2Р2 - Я-0 = 0, (40) которое с учетом матриц (27) может быть записано в следующем виде:
0
(41)
0
(р2 - 25)(р2 - 36) = 0. (42)
Поэтому получаем два отрицательных корня
р1 = -5; р2 = -6 (43)
и два положительных корня
Рз = 5; р 4 = 6. (44)
Отсюда вытекает, что экстремали уравнения Эйлера (38) могут быть записаны в следующей развернутой форме:
х. = сле* + сг2£Г6' + сае+ сг4е6' ,/ = 1,2. (45)
Так как ошибки (45) восстановления вектора состояния (24) должны со временем стремиться к нулю, то:
Сг3 = Сг 4 = 0, г = 1,2 . (46)
Проверку условия Лежандра выполняем путем непосредственной подстановки в него подынтегральной функции функционала (8) с четом соотношений (28)
Выполнение усиленного условия Лежандра свидетельствует о том, что на устойчивых экстремалях
(0 = сае~51 + с12е-61 ,/ = 1,2 (47)
достигается безусловный минимум функционала. Поэтому искомыми оптимальными корнями характеристического уравнения синтезируемого наблюдателя являются корни (42), которым соответствует следующий оптимальный характеристический полином наблюдателя:
Р (р) = (р + 5)(р + 6) = р2 + V!р + у0, (48) ^ = 30, ^ = 11. (49)
Явное выражение для полинома создаваемого наблюдателя:
<(р, L) = det{E2p - (A - LC)}; (50)
или
<р(р,L) = р2 +^(L)р + ^o(L) ; (51) где ^ (L) = 6/ + 2/2 + 2 , \(L) = 2/х + 3; (52)
С полученным оптимальным полиномом (48) должен совпадать фактический характеристический полином (50), что возможно только при равенстве их одноименных коэффициентов. Отсюда получим следующую систему алгебраических уравнений:
2/ + 3 = 11; 6^ + 2/2 + 2 = 30; (53)
решая которую находим искомые оптимальные значения коэффициентов усиления синтезируемого наблюдателя:
/* = 4; /* = 2; L = {4;2}T . (54)
Таким образом, получим дифференциальное уравнение искомого асимптотического наблюдателя полного порядка в следующей развернутой форме:
Список литературы /References
1. Карабутов Н.Н. Адаптивная идентификация систем: Информационный синтез. М.:КомКнига, 2006. 384 с.
2. Методы классической и современной теории автоматического управления: Учебник в 5 тт. / под ред. К.А. Пупкова и Н.Д. Егупова. М.:МГТУ, 2004.
3. Мирошник И.В. Нелинейное и адаптивное управление сложными динамическими системами / И.В. Мирошник, В.О. Никифоров, А.А. Фрадков. СПб.: Наука, 2000. 549 с.