УДК 62-501.2
АНАЛИЗ И СИНТЕЗ МИНИМАЛЬНО-ФАЗОВЫХ НЕЛИНЕЙНЫХ SISO-СИСТЕМ ОРИ ДЕЙСТВИИ ВНЕШНИХ НЕСОГЛАСОВАННЫХ ВОЗМУЩЕНИЙ
С.А. Краснова, A.B. Уткин
Для нелинейных минимально-фазовых систем с одним входом и одним выходом формализована структура эквивалентной формы «вход — выход» с учетом гладких возмущений, не принадлежащих пространству управления. На ее основе синтезирован базовый закон комбинированного управления, обеспечивающий асимптотическую стабилизацию ошибки слежения. В отличие от традиционного подхода, предполагающего ввод генераторов задающего и возмущающих воздействий, для комплексного оценивания внешних сигналов и их производных применен наблюдатель на скользящих режимах. Формализованы условия физической реализуемости инвариантной системы слежения для случая, когда прямым измерениям доступны только выходная (регулируемая) переменная и задающий сигнал.
Ключевые слова: нелинейная ЗКО-система, слежение, инвариантность, наблюдатель состояний и возмущений, скользящий режим.
ВВЕДЕНИЕ
Процесс слежения относится к одному из самых распространенных технологических режимов работы систем автоматического управления. С расширением области применения современных перспективных технических объектов возрастают требования к их функциональным возможностям, безопасности и надежности при изменении условий эксплуатации и внешних факторов. Один из аспектов решения данной проблемы заключается в разработке методов обеспечения инвариантности регулируемых переменных к внешним возмущениям. В рамках классического подхода [1—4] синтез следящей системы осуществляется на основе модели объекта управления, расширенной включением в ее состав автономных динамических моделей (генераторов задающих и возмущающих воздействий, а также динамических компенсаторов, порождающих производные управляющих воздействий), что приводит к существенному увеличению динамического порядка замкнутой системы. Наиболее разработаны в нелинейной постановке методы синтеза систем, в которых выполнены либо условия полной инвариантности выходных переменных к внешним возмущениям, либо условия согласования. В последнем случае можно с по-
мощью «силовых» методов (управлений с большими коэффициентами или разрывных управлений [5]) «подавить» внешние возмущения или, располагая оценками внешних возмущений, непосредственно их компенсировать с помощью комбинированного управления.
В настоящей работе рассматривается проблема синтеза инвариантной системы слежения для нелинейных минимально-фазовых объектов автоматического управления с одним входом и одним выходом (8180-систем) при действии внешних возмущений, которые полагаются неизвестными, гладкими, ограниченными функциями времени. Рассматривается общий случай систем с произвольными входными каналами внешних возмущений. Исследуется «узкая» задача слежения в том смысле, что ее постановка предполагает решение с помощью обратной связи по состоянию, задающему воздействию и внешним возмущениям, а также их производным, но не предусматривает наращивания динамического порядка системы за счет автономных динамических моделей внешних воздействий. Для информационного обеспечения базовых законов комбинированного управления используются наблюдатели состояния на скользящих режимах, которые при определенных условиях позволяют получить текущие оценки не только неизмеряемых переменных состояния объекта уп-
равления, но и внешних возмущений без наличия их динамической модели [6—8].
1. ОПИСАНИЕ МОДЕЛИ ОБЪЕКТА УПРАВЛЕНИЯ. ПОСТАНОВКА ЗАДАЧ
Рассматривается математическая модель нелинейной аффинной SISO-системы
x = f(x) + Q(x)n + b(x)u, yl = h(x), (1)
где x e X с Rn — вектор состояний, u e R — управление, yl e Y с R — выходная (регулируемая)
переменная, n(t) = col(nl(i), ..., ns(t)) e Rs — вектор внешних возмущений, компоненты которого полагаются неизвестными гладкими ограниченными функциями времени с ограниченными производными в общем случае до (и — 1)-го порядка:
|г|/0! < N0j = const > 0, |j (t)| < Ny = const > 0,
t > 0, i = 1, и - 1, j = 1, s.
(2)
Функция А(х), элементы вектор-функции /(х) и матрицы 0(х) полагаются непрерывно дифференцируемыми по всем своим аргументам необходимое число раз;
rankb(x) = 1, rank(3h(x)/3x) = 1.
(3)
Здесь и далее ранговые и алгебраические соотношения для рассматриваемых функций считаются справедливыми в открытой ограниченной области
X с Rn изменения переменных x(t) при t e [0, +<»).
Ставится задача слежения за заданной достижимой траекторией g(t) выходной переменной yl(t) в предположении, что g(t) — гладкая ограниченная функция времени с ограниченными производными в общем случае до и-го порядка:
|g(t)| < G0 = const > 0, |g(i)(t)| < Gi = const > 0,
t > 0, i = Т7Й . (4)
Предполагается, что аналитический вид функции g(t) не известен, наблюдаются только ее текущие значения, как следствие, не имеется текущей информации о ее производных. В построения не вводятся автономные динамические модели, порождающие внешние воздействия и их производные, в выражениях (2) и (4) N.. и G. — известные
ij i
константы.
В сделанных предположениях требуется синтезировать закон комбинированного управления (по состоянию, внешним воздействиям и их производным), при котором отклонение выходной переменной от заданной траектории (ошибка слеже-
ния el(t) = yl(t) — g(t), el e R) асимптотически стремится к нулю:
lim el(t) = 0,
t ^ Ю
(5)
а остальные переменные ограничены при ? > 0. Класс допустимых управлений включает в себя функции того же класса, к которым относятся внешние воздействия.
Синтез инвариантной системы слежения предполагает анализ разрешимости, т. е. формализация условий, при которых задача (5) имеет решение в условиях полных измерений переменных состояния, внешних воздействий и их производных; синтез базового закона комбинированного управления; информационное обеспечение базового закона управления с помощью наблюдателя смешанных переменных на скользящих режимах в случае полных измерений переменных состояния; формализацию условий физической реализуемости инвариантной системы слежения в случае измерения только выходной (регулируемой) переменной, определение структуры подсистемы наблюдения для допустимых случаев. Решению перечисленных задач и посвящено дальнейшее изложение.
2. ЭКВИВАЛЕНТНАЯ МОДЕЛЬ «ВХОД — ВЫХОД» С УЧЕТОМ ВНЕШНИХ ВОЗМУЩЕНИЙ.
БАЗОВЫЙ ЗАКОН УПРАВЛЕНИЯ
В случае невозмущенной 8180-системы (1), где 0(х) = О (здесь и далее О — нулевая матрица/вектор соответствующей размерности), конструктивный прием решения задачи слежения состоит в диффеоморфной замене переменных, приводящей к эквивалентной канонической модели «вход — выход», отражающей связь управления (входа) и регулируемой переменной (выхода), и дальнейшем синтезе обратной связи по переменным нового координатного базиса [2, 4]. Для существования соответствующей диффеоморфной замены фазовых переменных выходной переменной и ее производными необходимое условие имеет вид:
rank (дЛЩ
v dx )f
= и, H =
^ h (x) ^ Lf h (x)
Lf lh (x)
(6)
где
4 h(x) = f™ fx)
— i-я производная Ли
от скалярной функции h(x) вдоль векторного поля
0 1 dh f(x), в частности Lf h(x) = h(x), Lf h(x) = — fx).
J J Я-у
_ 3Af
ЙХ
Условие (6) означает локальную наблюдаемость разомкнутой системы (1) относительно выхода y при Q(x) ^ O [2].
Базовое понятие данного метода — относительная степень (относительный порядок) системы v е N: 1 < v < и, которая равна минимальному числу дифференцирований выходной переменной yl в силу невозмущенной системы (1) при Q(x) = O, необходимому для получения явной зависимости между выходом и входом [2, 9]:
v = min{/ е 1, и : LbLlfl h(x) ф 0},
Vx(t) е X, t е [0, +<»), (7)
где Lb Lf h(x) = § =
Lb Lf h(x)
3x 3x _ 3Lfh (x)
..., ^ | = Vh,
Vdx1 dxn
3x
b(x) = V(Lf h(x))- b(x),
f-1 h(x) = dLfdXh(X) b(x) = V(Lf-1 h(x))- b(x).
Lb Lf"
Аналогично выражению (7) введем понятие относительной степени по внешним возмущениям ре N как минимального числа дифференцирований выходной переменной у1 в силу разомкнутой системы (1) (т. е. при Ь(х) = О), необходимого для получения явной зависимости между выходом и внешними возмущениями:
р = min{i е 1, n : (3/ е 1, s), Lq Lf 1 h(x) ф 0},
Vx(t) е X, t е [0, +<»),
(8)
где Х0А = УИ-^, Х}-1 И = У(Х}-1 А)- О,,
О,(х) — п-мерный у-й столбец матрицы О. Выражение (8) означает, что все 5-мерные вектор-
строки + 1 = У(Х^ И) - О, к = 0, р - 2 являются нулевыми и хотя бы один элемент вектор-строки #р = У(-1 И) - О не равен нулю.
Если в системе (1)
гапкЬ(х) = гапк(Ь(х) О(х)), (9)
то внешние возмущения принадлежат пространству управления, т. е. выполняются условия согласования, которые означают, что действие внешних возмущений на систему может быть непосредственно компенсировано (если они известны) с помощью комбинированного управления. При V < п и невыполнении условия согласования (9), а именно гапкЬ(х) < гапк(Ь(х) О(х)), в задаче регулирова-
ния выходной переменной обычно выделяют частные случаи: V < р или р = V [2, 3]. Первый означает полную инвариантность выходной переменной у1 к внешним возмущениям. Во втором действие внешних возмущений именно на выходную переменную может быть компенсировано (если они известны) с помощью комбинированного управления. В настоящей работе основное внимание уделяется малоизученному общему случаю несогласованных (т. е. не принадлежащих пространству управления) возмущений: р < V < п.
Если в системе (1) выполняются условия (6) и V = п, то с помощью диффеоморфной замены переменных у = Н(х), у = со1(у1, ..., уп) е Яп,
у = 1 И(х) она представима в полной форме «вход — выход»:
У/ = У/ + 1 + q(x)n, i = 1, n - 1;
У n = a„(x) + qn(x)n + b„(x)u, (10)
где an(x) = Lj h(x), VLbLf h(x) = 0, k = 0, n - 2,
bn(x) = LbLf-1 h(x) * 0; q = V(Lf-1 h)- Q, i = 1, n, и
/ -1
все 5-мерные вектор-строки qk при к = 1, р - 1 являются нулевыми. Здесь 1 < р < п, выполнение условия согласования (9) означает, что р = V = п.
Если в системе (1) 1 < V < п, т. е. Х, Ц И(х) = 0,
к = 0, v - 2 , LbLf l h(x) ф 0, то условия (6) могут быть ослаблены следующим образом:
rank
3H1( x, x)
Зх
= v,
H =
vH2 у
(11)
где с точностью до перестановок х = со1( х, х), х е х е Яп - Тогда с помощью диффеоморфной замены переменных х — со1( у, х), где у = = Н1( х, х), у = со1(ур ..., уу) е система (1) представима в виде двух подсистем:
-У/ = У/ + 1 + q(x)n, i = 1,v - 1; -v = av(x) + qv(x)n + bv(x)u;
xx = f (x) + (?(x)n + b(x)u,
v - 1
(12) (13)
где av(x) = Lf h(x), bv(x) = Lb Lf h(x) ^ 0; q.
V(Lf 1 h)- Q, i = 1, v и все s-мерные вектор-
строки qk, k = 1, min{р - 1, v}, нулевые.
Если в уравнении (13) (и — v)-мерный вектор-
столбец Ь (х) содержит ненулевые элементы, то требуется дополнительно выполнить диффеомор-
фную замену локальных координат X = у (у,, X),
х е Яп \ где вектор-функция X) — решение матричного уравнения в частных производных ^ Ь (у , XX) + ^ Ь (у , X) = 0. Условия теоре-
ду,, ^ ' дхх ^ ' Р
мы Фробениуса, определяющие решение данного уравнения [10], всегда выполняются в рассматриваемой нелинейной 8КО-системе, что позволяет представить систему (12), (13) в виде
у, = у,- + 1 + 4,(у, X )п, / = 1, V - 1; Уv = «V(у, X) + о,(у, X)П + Ь, (у, X)и; (14)
х = /(у, X) + О (у, X )п,
(15)
где уравнения (14) и (15) описывают подсистемы внешней и внутренней динамики соответственно. Отметим, что выполнение условия согласования (9) означает, что в системе (14), (15) р = V, т. е.
4,(у, х) = 0, V/ = 1, V - 1, и О (у, х) = О. В данном исследовании ограничимся рассмотрением минимально-фазовых систем, в которых решения подсистемы (15) ограничены:
||х (г)|| < X = сош!;, г > 0.
(16)
Данное требование выполняется, если нулевая динамика (система (15) при у = О, О = О) устойчива и || О (х(г))п(г)|| < Vx(г) е X, г е [0, +<») [9].
Таким образом, необходимые условия существования для ВКО-системы (1) эквивалентной формы «вход — выход» имеют вид: (3) и (6) — для полной формы (10); (3), (11) и (16) — для неполной минимально-фазовой системы (14), (15).
На основе системы (10) или (14) синтезируется базовый закон комбинированного управления, который формулируется в терминах канонической системы, записанной относительно ошибки слежения е1 = у1 — g. В рассматриваемом случае р < V данный процесс порождает производные не только задающего, но и возмущающих воздействий. В рамках применяемого подхода допустимым считается класс систем (1), для которых в канонической форме «вход — выход», полученной путем дифференцирования внешних возмущений, относительная степень по управлению будет равна относительной степени V (7), полученной на основе невозмущенной системы, и множитель пе-
ред управлением ^ не будет зависеть от внешних возмущений. Для данного класса систем введем достаточные условия существования эквивалентной формы «вход — выход» в терминах системы (10) или (14): все элементы ненулевых вектор-
строк / = р, V - 1, либо постоянные, либо их аргументы не включают в себя иных переменных, кроме указанных:
4,0*1, ..., у,), ' = Р^ -1.
(17)
С учетом условия (17) системы (10) и (14) соответственно примут вид:
у, = у, + 1 + 4,01 ..., угН / = 1 и -1;
уп = ап(х) + 4п(х)п + Ьп(х)и; (18)
у = у, + 1 + 4^ ..., уК / = ^ 'у -1;
Уv = «V (у, X) + 4,( у, X )п + у, X )и; (19)
где в качестве аргументов функций фигурируют новые переменные, что требует выполнения обратной замены переменных у = Н(х) или у = Н1( х, XX)
и х = , XX) соответственно, что не всегда возможно аналитически. Как будет показано в § 3, в рамках применяемого подхода обратную замену можно не выполнять, т. е. оставить в качестве аргументов функций переменные векторы состояния х исходной системы (1), если все они непосредственно измеряются. В случае неполных измерений существенную роль будет играть только состав аргумента множителя ^ (•) перед управлением.
За основу дальнейшего изложения примем систему (19) при р = 1 < V (как более общий случай), которую представим относительно ошибки слежения е1 = у1 — g и ее производных:
е, = е, + р / = ^ -1; = у (х, г) + ^ (у, X)«,
(20)
где е2 = у2 + ^(у^п - g, 42 01 у2, П, П) = 42^1, у2)п + (^/Ф^пОЪ + 41^1)п) + ОМ) П; е, = у,. + + 4,-1 (у1, ..., у, - 1, П, П, ..., П° - 2)) - / - 1), 4, = = 4,01 ..., уг)п + ¿г 4,-1 (Уl, ..., у, - Р Т п, ..., П(г-2)), / = 3, V; у(х, г) = а(у, X) + 4л, (у, X, п, п , п("-1)) -
- ¿(V).
Условие технической реализуемости системы слежения заключается в требовании ограниченности по модулю функции
|^(х, < Д Ух(?) е X, I е [0, +ю), (21)
что выполняется в силу априорных предположений и ограничений (2), (4), (16).
Базовый (т. е. в условиях полной определенности и доступности для измерений всех сигналов) закон комбинированного управления в силу выражения (7) имеет вид
u = -(ce + yv)/bv( y, x),
(22)
где е = со1(е1, ..., еу) е Яп, с = (с1, ..., су) — вектор-
строка с постоянными элементами, и приводит к
--т-
замкнутой системе е. = е; + 1, / = 1, V - 1; еу = —с е.
Устойчивость данной системы, а также желаемые характеристики переходного процесса сходимости ошибки слежения к нулю (5) инвариантно в асимптотике к действию внешних, несогласованных возмущений обеспечиваются соответствующим выбором элементов вектора с.
В § 3 решаются проблемы информационного обеспечения базового закона управления (22) с помощью наблюдателей с разрывными корректирующими воздействиями, функционирующих в скользящем режиме, в «узкой» постановке, т. е. без расширения пространства состояний благодаря автономным динамическим моделям внешних воздействий. Синтез базового закона комбинированного управления на основе системы (18) и проблемы его информационного обеспечения решаются аналогичным образом и здесь не приводятся.
3. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ БАЗОВОГО ЗАКОНА УПРАВЛЕНИЯ
3.1. Случай полных измерений фазовых переменных
Вначале рассмотрим случай, когда прямым измерениям доступны все фазовые переменные х(?) системы (1) и задающий сигнал £(?), как следствие, известны текущие значения ошибки слежения е1(?) = И(х(?)) — £(?). В классической постановке [1—3] модель (1) дополняется автономными динамическими моделями с известными или неизвестными параметрами, порождающими задающее и возмущающие воздействия. В данной работе рассматривается «узкая» задача слежения, которая не предусматривает другой возможности расширения пространства состояний, кроме той, которая заложена в подсистеме наблюдения.
Для реализации базового закона управления (22) требуются текущие оценки внешних возмущений,
их производных и производных задающего воздействия. Заметим, что в данном случае можно получить их оценки по отдельности и без наличия соответствующих динамических моделей внешних воздействий [11], но этот путь представляется неоправданно громоздким. Главная особенность предлагаемого в данной работе метода состоит в комплексном подходе к задаче оценивания: наблюдатель строится как реплика системы (20), записанной относительно невязок. Данная система имеет вид канонической формы наблюдаемости с учетом неопределенностей уу(х, ?), которые сосредоточены в последнем уравнении, и не сужают наблюдаемое относительно е1(?) пространство переменных состояния этой системы [6, 7]. Техника каскадного синтеза разрывных корректирующих наблюдателя и организация скользящих режимов в пространстве ошибок наблюдения позволяет за теоретически конечное время получить оценки
смешанных переменных е и которые непосредственно фигурируют в базовом законе управления (22) и являются линейными комбинациями функций от переменных состояния системы (1), внешних воздействий и их производных.
Наблюдатель смешанных переменных, построенный на основе системы (20), имеет вид:
Z, = z, + i + i = 1,v- 1;
Zv = bv(x)u + ^
(23)
где г = со1(г1, ..., гу) е Яу — переменные состояния,
w¡ е Я (/ = 1, V) — разрывные корректирующие воздействия, которые выбираются так, чтобы обеспечить стабилизацию системы, записанной в силу системы (20), (23) относительно ошибок наблюдения е; = е. - г.:
£, = e, + i - i = 1,v- 1; £ v = Vv(X t) - wv.
(24)
Применим стандартную процедуру каскадного синтеза корректирующих воздействий наблюдателя (23) с учетом (24) [6—8]. В первом уравнении системы (24) сформируем разрывное корректирующее воздействие по измеряемой переменной wl = Mlsgnel. При |е2| < Ml = const > 0 выполняется
достаточное условие sl £ l < 0 и на поверхности Sl = {el = 0} ^ zl = el за конечное время tl > 0 возникнет скользящий режим. При t > tl из уравнения статики £ l = £2 — wleq = 0 имеем эквивалентное управление wleq = £2, которое получим с вы-
хода фильтра первого порядка с малой постоянной времени
HТ1 = —I + lim тД?) = w,(t) = w2(i) (25)
^ +0
и используем для формирования разрывного корректирующего воздействия во втором уравнении системы (24): w2 = M2sgnT1 = M2sgns2. При |s3|< M2 = = const > 0 выполняется достаточное условие е2е2 <0, и на поверхности S2 = {S1 Пе2 = 0} ^ z2 = e2 за теоретически конечное время t2 > ?1 (т. е. с точностью до затухающего собственного движения переменной фильтра (25)) возникнет скользящий режим. При t > t2 из уравнения статики е2 =
= е.
2eq
w.
2eq
= 0 имеем эквивалентное управление = е3, которое получим с выхода фильтра типа (25) и используем для формирования разрывного корректирующего воздействия в третьем уравнении системы (24): w3 = M3sgnx2 = M3sgnE3 и т. д. Наконец, в последнем, v-м уравнении системы (24) с учетом ограничения (21) и предыдущих построений разрывное корректирующее воздействие wv = Mvsgnxv _ j = MvsgnEv с амплитудой F < Mv =
= const > 0 ^ evEv < 0 приведет к возникновению за теоретически конечное время tv > tv- j > ... > tj скользящего режима на поверхности Sv = {Sv - j П ev = = 0} ^ Zv = ^ где S - 1 = {S - 2 П Ev - jV = 0}. При
t > ?v из уравнения статики е = ш (x, t)
w
veq
= 0
имеем эквивалентное управление wv (?) = yv(t),
значение которого получим с выхода фильтра типа (25), а именно:
КЛ = + ^, Ит. „Ту (0 = ^= ^0). (26)
^V ^ +0
Таким образом, при вводе в контур обратной связи наблюдателя (23), расширенного V фильтрами типа (25), (26), базовый закон комбинированного управления (22) реализуется в виде т
и = —(с г + тЛ,)/Ьл,(х)и. Тот факт, что наблюдатель на скользящих режимах сходится за конечное время, а собственные движения фильтров быстро затухают, позволяет пренебречь ошибкой наблюдения в замкнутой системе. Предложенный подход существенно упрощает вычислительный аспект процедуры синтеза, поскольку для построения наблюдателя (23) требуется получить аналитически, по сути, только функцию
bv(x) = LbLf 1 h(x) * 0;
(27)
детализация неопределенной функции ^ (х, ?) не требуется, достаточно ее оценки (21); нет необходимости возвращаться к координатным базисам
ни системы (19), ни (14), ни (1). Кроме того, наблюдатель (23) не требует перенастройки в случае существенного изменения внешних воздействий. Выбор априори максимально возможного значения F (21) (и, как следствие, большего значения Mv = const) обеспечит более быструю сходимость невязки ev = 0 и не приведет к избыточному потреблению ресурсов управления в штатной ситуации.
Таким образом, главное преимущество наблюдателя (по сути, дифференциатора) на скользящих режимах — оценивание за теоретически конечное время не только переменных состояния системы (20), но функции от внешних возмущений и их производных без ввода генераторов внешних воздействий. Данный наблюдатель является робаст-ным, так как настройка параметров корректирующих воздействий осуществляется на основе неравенств, не требующих детализированной математической модели объекта управления. С другой стороны, динамический порядок наблюдателя (23) увеличивается в два раза благодаря вводу v фильтров типа (25), (26), которые вносят дополнительные малые динамики. Основная проблема наблюдателя на скользящих режимах заключается в том, что микропроцессорная реализация разрывных управлений с большой, но конечной частотой переключений может привести к неудовлетворительному качеству (негладкости) оцениваемых сигналов, так как на полезный сигнал накладывается паразитный высокочастотный с малой амплитудой. Цифровое моделирование стандартного скользящего режима возможно только методами первого порядка (Эйлера, Адамса и др.), так как методы более высоких порядков требуют существования производных от правой части дифференциального уравнения, что не выполняется при наличии высокочастотных разрывных управлений. Амплитуда паразитных сигналов прямо пропорциональна шагу интегрирования и амплитуде разрывных корректирующих воздействий [5]. Для повышения точности оценивания нужно уменьшать шаг дискретизации, что в свою очередь приводит к увеличению времени счета, а также применять алгоритмы с переменной амплитудой разрывных корректирующих воздействий [6].
Другая альтернатива для обеспечения лучшего качества (гладкости) оцениваемых сигналов — использование в наблюдателе (23) непрерывных S-образных корректирующих воздействий (sat-функций, сигма-функций и т. п.). Показано [12, 13], что с помощью наблюдателя с S-образной коррекцией, размерность которого равна порядку наблюдаемой системы (в данном случае v), можно также получить оценки смешанных переменных и неопределенностей, входящих в последнее уравнение. Принцип разделения движений в таком наблюдателе реализуется в допредельной ситуации, что
при наличии незатухающих возмущений приведет к решению задачи оценивания с некоторой, наперед заданной точностью, которая обеспечивается выбором параметров непрерывных корректирующих воздействий.
3.2. Случай измерения только выходной переменной
Теперь рассмотрим частный случай неполных измерений фазовых переменных, наиболее распространенный на практике, когда прямым измерениям доступны только выходная, регулируемая переменная yl(t) и задающий сигнал g(t), как следствие, известны текущие значения ошибки слежения el(t) = yl(t) — g(t). В этом случае для реализации базового закона управления (22) дополнительно к оценкам, полученным с помощью наблюдателя смешанных переменных (23) порядка v, потребуются оценки переменных системы (14), (15), которые фигурируют в качестве аргументов функции bv(-) (27). Для определения состава аргументов требуется выполнить обратную замену переменных y = Hl( X, X) и X = y(yv, X).
Формализуем условия физической реализуемости следящей системы при измерениях только yl(t) в рассматриваемой «узкой» постановке, а также структуру подсистемы наблюдения для допустимых случаев в зависимости от состава аргументов функции bv(-) (27).
1. Если в функции (27) bv^l) или bv = const, то проблема информационного обеспечения базового закона управления (22) полностью решается с помощью наблюдателя смешанных переменных (23) с фильтрами типа (25). Закон управления ре-
т
ализуется в виде u = —(c z + xv)/bv^l). Никакие дополнительные требования к структуре системы (19) не предъявляются.
2. Если в функции (27) bv( y), то, кроме наблюдателя смешанных переменных (23), требуется дополнительно построить наблюдатель преобразованных переменных состояния системы (19). Такой наблюдатель без наличия динамической модели внешних возмущений физически реализуем только тогда, когда внешние возмущения не сужают наблюдаемого относительно yl пространства y е Rv
и служит основой для построения укороченного наблюдателя размерности V — 1:
[6], а именно, когда р > V, т. е. #г = О, / = 1, V - 1, Ух(?) е X, ? е [0, +<»). При выполнении данного условия система (19) имеет вид
¿1 = ¿1 + 1 + ^, ' = 2; ¿V- 1 = Wv- 1, (29)
где г = со1( ¿1, ..., ¿^ 1) е Яv - 1 — переменные состояния, wг• е Я — разрывные корректирующие воздействия, которые выбираются так, чтобы обеспечить стабилизацию системы, записанной
относительно ошибок наблюдения Бг- = У1 — г{:
y, = y,
, + l
i = 1, v- 1;
y v = OX y, X) + fl( y, X )n + bv( y )u (28)
£, = £,+1 — w, i = 1,v_ 2; £v-1 = yv — wv-1.
Применяя описанную в п. 3.1 процедуру каскадного синтеза разрывных корректирующих воздействий, имеем:
wl = Mlsgn£l, |£21 < Ml = const > 0, t > 11 > 0:
Sl = {£l = 0} ^ zl = Уl, £l = £2 — vleq = 0
^l Tl = Tl + Wl , lim Tl (t) = W, (t) = £2 (t);
Vi ^ +0
= Mi sgn T,_1 = Mi sgn £,, 1 £, +11 < Mi = = const > 0,
t > t, > tt_i: = {S,_2 П £, = °} ^ z, = y, £, = £, + l — W,eq = 0, T, = — T, + ,
lim T, (t) = Wieq (t) = £, +1 (t), i = 2, v_ 2;
Vi ^ +0
Wv_l = Mv_ lsgnTv_2 = Mv_lsgn£v_ l , |yj < Mv_ l = const > 0, t > t v_ l > t v_ 2 :
Sv_ l = { 2 n £v_ l = 0} ^ zv_ l = yv - Г
£v_ l = yv — W(v_ l)eq = 0
l Tv_ l = — Tv_ l + Wv_ l ,
lim Tv_ l (t) = W(v_ l)eq (t) = yv(t).
1 ^ +0
В результате за теоретически конечное время t > tv_ l получим оценки вектора состояния y (t) в
виде сигналов z(t) = col(yl(t), z2 (t), z3 (t), ...,
zv_ l (t), Tv_ l (t). В предположении, что функция (27) удовлетворяет условию Липшица, а также с учетом априорных предположений имеем оценку |(bv( y) — bv( Z ))u| < AbU = const > 0, VX(t) е X, t е [0, +<»). Тогда последнее уравнение наблюдателя (23) реализуется в виде
г, = »,(Z )u + M.sgnx, - l, (30)
где F + AbU < Mvconst > 0, |yv(x, t)| < F, yv (x, t) =
= о, (У, x) + q, (У, x )n - g(v).
При t > tv _ 1 ошибками наблюдения укороченного наблюдателя (29) можно пренебречь, т. е. считать |(bv(y (t)) — bv(z (t))| ^ 0. Тогда при
t > max{tv, tv_ 1} справедлив предел (26), и базовый закон комбинированного управления (22) реализуется в виде u = -(cTz + т v)/bv (z).
Заметим, что если в построения вводится генератор задающего воздействия g(t), порождающий
производные g (t), ..., g(v)(t), то в наблюдателе смешанных переменных (23) нет необходимости, достаточно наблюдателя полной размерности системы (28) вида
zi = z+1 + w, ' = 1,v-
zv = bv(z)u + wv ,
(31)
где = М sgn_!, |я,(у, х) + (у, х )п| + + Аьи < Му, с V фильтрами типа (25), (26). Тогда за
теоретически конечное время t > 1 v > 1 v _ 1 имеем оценки элементов вектора у (t) (и, как следствие, переменных е. = у. — / = 1, V), а также сиг-
нала ху (t) « (у, х) + (у, х )п — слагаемого
функции у. Тем не менее, для построения универсальной системы, более простой с вычислительной точки зрения, не требующей смены генератора задания и работоспособной при разных режимах, предпочтение следует отдать подсистеме с наблюдателями (23), (30) и (29) (укороченным) или (23), (30) и (31) (полным).
Если функция (27) зависит только от части переменных вектора у и у е N 1 < у < V — максимальный порядковый номер переменной у. из состава ее аргументов, условие наблюдаемости относительно выхода переменных у2, ..., у. инвариантно к внешним возмущениям имеет вид
р > у (т. е. 4. = О, I = 1,у - 1, Ух(0 е X, t е [0; +<»)), что в случае у < V расширяет класс допустимых систем. Тогда на основе первых (у — 1) уравнений сис-
темы (19), а именно у; = у. + р I = 1, у - 1, строится наблюдатель на скользящих режимах, аналогичный (29).
3. В общем случае bv (у, х) для реализации следящей системы требуется по измерениям получить оценки всего вектора состояний системы
(14), (15). Для разомкнутой возмущенной системы (1) выполнение условий наблюдаемости всего
вектора состояний х е Яп инвариантно к внешним возмущениям означают выполнение условий (6) и р = п (8) [6]. Тогда система (1) с аффинным вхождением управления при V < р = п с помощью диффеоморфной замены переменных у = Н(х),
у = со!^, ..., уп) е Яп, у. = 1 Л(х) приводится к виду
У = у + р ' = 1,v -1;
у. = у. + 1 + Ьу.(у)и(0, у = V, п - 1;
у^п = *пОО + ЬДуЖО + 4п(у)л(<), (32) где ап(х) = Ьп Л(х), Ь.(х) = ЬьЬ1/1 Л(х), 4п =
= У(ЬП -1 Л)" о * о.
Достаточные условия наблюдаемости системы (32) можно сформулировать аналогично условиям (17), а именно: считая функцию и ее (п — V) производные известными сигналами, относительно измерений у^) вектор состояния системы (32) полностью наблюдаем инвариантно к внешним возмущениям только тогда, когда все ненулевые
функции Ь., у = V, п - 1 либо постоянные, либо их аргументы не включают в себя иных переменных, кроме указанных:
bj(y1, ..., y), j = V, n - 1.
(33)
Выполнение условий (33) гарантирует, что в канонической системе, полученной путем дифференцирования функции на основе системы
(32), (33), относительная степень по возмущению будет равна относительной степени р = п, полученной на основе разомкнутой системы, и не будет зависеть от функции и ее производных. Из выражений (32) и (33) следует, что максимально допустимый состав аргументов функции Ьу(•) (27)
имеет вид Ьу (у) и сводится к случаю, рассмотренному в п. 2. Поскольку для реализации базового закона управления в рамках применяемого подхода для минимально-фазовых систем все переменные вектора состояний системы (32) не требуются (только оценки аргументов функции Ьу (•) (27)), постольку дополнительные требования, сформулированные в данном пункте, а именно (6) и р = п, могут быть ослаблены до условий (11) и V < р < п соответственно. Тем не менее, условия (6), р = п и
(33) могут оказаться существенными при исследовании неминимально-фазовых систем с неустойчивой внутренней динамикой, для синтеза которых потребуются оценки всего вектора состояний системы (32) [14].
ЗАКЛЮЧЕНИЕ
Показано, что предположение о гладкости внешних возмущений позволяет обеспечить асимптотическую сходимость выходной переменной к заданному сигналу в системах, в которых не выполняются ни условие полной инвариантности выходной переменной к внешним возмущениям, ни условие согласования.
Один из главных аспектов решения рассмотренной проблемы состоит в разработке методов оценивания неизмеряемых внешних воздействий и функциональных неопределенностей с помощью подсистем наблюдения. Такой подход существенно упрощает структуру регулятора, так как не требует ввода автономных динамических моделей внешних воздействий, детализации и реального вычисления нелинейных выражений (что особенно актуально при синтезе системы управления на основе полной нелинейной модели), а также снижает требования к объему априорной информации об объекте управления и среде его функционирования. Результат нацелен на создание универсальных и простых в реализации инвариантных систем слежения, не требующих перенастройки при существенном изменении параметров и внешних факторов в процессе эксплуатации, а также наличия полного комплекта датчиков в системе управления.
ЛИТЕРАТУРА
1. Уонем У.М. Линейные многомерные системы управления. Геометрический подход. — М.: Наука, 1980. — 376 с.
2. Isidori A. Nonlinear control systems. 3rd Ed. — Berlin: Springer-Verlag, 1995. — 550 р.
3. Никифоров В. О. Адаптивное и робастное управление с компенсацией возмущений. — СПб.: Наука, 2003. — 282 с.
4. Уткин А.В. Метод расширения пространства состояния в задаче синтеза автономного управления // Автоматика и телемеханика. — 2007. — № 6. — С. 81—98.
5. Емельянов С.В., Коровин С.К. Новые типы обратной связи. - М.: Наука, 1997. - 352 с.
6. Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния динамических систем. — М.: Наука, 2006. — 272 с.
7. Ахобадзе А.Г., Краснова С.А. Решение задачи слежения в условиях неопределенности на основе совместной блочно-канонической формы управляемости и наблюдаемости // Управление большими системами. — 2009. — Вып. 24. — С. 34—80.
8. Ахобадзе А.Г., Краснова С.А. Задача слежения в линейных многомерных системах при наличии внешних возмущений // Автоматика и телемеханика. — 2009. — № 6. — С. 21—47.
9. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. — СПб.: Наука, 2000. — 549 с.
10. Рашевский ПЛ. Геометрическая теория уравнений с частными производными. — М.: Гостехиздат, 1947. — 356 с.
11. Краснова С.А, Кузнецов С.И. Оценивание на скользящих режимах неконтролируемых возмущений в нелинейных системах // Автоматика и телемеханика. — 2005. — № 10. — С. 54—69.
12. Краснова С.А., Мысик Н.С. Каскадный синтез наблюдателя состояния с нелинейными корректирующими воздействиями // Автоматика и телемеханика. — 2014. — № 2. — С. 106—128.
13. Бабин В.А., Дик В.В., Краснова С.А. Допредельные реализации разрывных корректирующих воздействий наблюдателя, функционирующего в скользящем режиме // Тр. XII Всероссийского совещания по проблемам управления ВСПУ—2014 / ИПУ РАН. — М., 2014. — С. 374—390.
14. Уткин В.А., Уткин А.В. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // Автоматика и телемеханика. — 2014. — № 9. — С. 62—81.
Статья представлена к публикации членом редколлегии В.Ю. Рутковским.
Краснова Светлана Анатольевна — д-р техн. наук, гл. науч. сотрудник, ® (495) 334-93-21, И [email protected],
Уткин Антон Викторович — канд. техн. наук, ст. науч. сотрудник,
® (495) 334-93-21, И [email protected],
Институт проблем управления им. В.А. Трапезникова РАН, г. Москва.
Содержание сборника «Управление большими системами», 2014, вып. 52
■ Хаметов В.М., Шелемех Е.А., Ясонов Е.В. Алгоритм решения задачи об оптимальной остановке с конечным горизонтом. — С. 6—22.
■ Чесноков А.М. Конечные мультимножества как образы в интеллектуальных системах на основе колонок. — С. 23—36.
■ Авдеева З.К., Коврига С.В. О некоторых принципах и подходах к построению коллективных когнитивных карт ситуаций. — С. 37—68.
■ Губанов Д.А., Чхартишвили А.Г. Связи дружбы и комментирования пользователей социальной сети Facebook. — С. 69—84.
■ Бреер В.В., Новиков Д.А., Рогаткин А.Д. Стохастические модели управления толпой. — С. 85—117.
■ Постовалова И.П. Эффективный синтез сетевой модели «работы—дуги» с минимальным числом фиктивных ра-
бот. — С. 118—132.
■ Воронин А.А., Васильченко А.А., Храпов С.С. Анализ эффективности природовосстановительных проектов в эколого-экономической системе «Волжская ГЭС — Волго-Ахтубинская пойма». — С. 133—147.
■ Тупиков Д.В., Резчиков А.Ф., Иващенко В.А. Алгоритм поддержки принятия решений по устранению пожароопасных ситуаций на промышленных предприятиях. — С. 148—163.
Тексты статей доступны на сайте http://ubs.mtas.ru/