УДК 517.977.1, 519.71
ИДЕНТИФИКАТОРЫ В КВАЗИЛИНЕЙНЫХ СИСТЕМАХ Я. А. Шахов
Санкт-Петербургский государственный университет, факультет прикладной математики — процессов управления,
198504, Санкт-Петербург, Старый Петергоф, Университетский пр-т, 35.
E-mail: yakov. shakhov@gmail. com
Рассматривается задача стабилизации квазилинейных нестационарных систем в случае неполной обратной связи. При синтезе стабилизирующего управления ввиду нехватки информации о текущем векторе состояния системы используется его оценка. Для построения данных оценок строятся идентификаторы 'различного типа: полного порядка п и идентификаторы Люенбергера меньшей размерности. Получены достаточные условия существования указанных идентификаторов.
Ключевые слова: квазилинейные системы, стабилизация, программное управление, неполная обратная связь, идентификатор полного порядка, идентификатор Люенбергера.
Введение. Одной из основных задач математической теории управления является задача стабилизации объекта на заданном программном движении [1]. В практической реализации стабилизирующего управления часто вектор состояния объекта недоступен полностью для измерений [2]. В этом случае строят идентификаторы состояний различных типов — как полного порядка п, так и специфические идентификаторы Люенбергера [3] меньшей размерности. Оценки состояния системы, полученные с помощью указанных идентификаторов, используются в блоке стабилизации программного движения. В [2] построены идентификаторы для линейных, в [4] — для билинейных систем. В настоящей работе исследуется вопрос синтеза идентификаторов полного порядка и идентификаторов Люенбергера для квазилинейных систем [1].
1. Постановка задачи. Рассмотрим квазилинейную управляемую систему £ = A(i)£ + B(t)v + f(t) + /xQ(i, £, v, fj,),
где £ — n-мерный вектор фазового состояния, v - r-мерный вектор управлений; элементы матриц A(t), B(t) и компоненты вектора f (t) заданы при t ^ 0, вещественны,
непрерывны и ограничены; Q(t, £, v, ц) — вещественная непрерывно дифференцируемая по компонентам х, и вектор-функция; ¡л ^ 0 — малый параметр.
Для некоторого программного движения £p(t) и соответствующего ему управления Vp(t) построим систему в отклонениях
х = A(t)x + B(t)u + /xG(i, х, и, /х), (1)
где
x = £-£p(i), u = v - vp(t),
G(t, x, u, ц) = Q(t, x + £p(t), u + vp(t), fx) - Q(t, £p(t), vp(t), ju).
В стандартной задаче построения непрерывного стабилизирующего управления [1,4] допустимым считается управление вида линейной обратной связи
u = C(t)x, (2)
Яков Александрович Шахов, аспирант, каф. моделирования экономических систем.
где (г х п)-матрица С(t) подлежит определению. Конечной целью при этом является экспоненциальная устойчивость нулевого решения замкнутой системы (1), (2). Однако для формирования управления (2) необходима полная информация о векторе отклонений x(t). Далеко не в каждой прикладной задаче она является доступной, поэтому возникает следующая
Задача 1. Будем считать, что доступны для измерения только отдельные компоненты вектора x(t) или их линейные комбинации, т.е. вместе с системой (1) задано уравнение измерителя (или наблюдателя)
у = R(t)x, (3)
где у — т-мерный вектор измерений; R(i) - заданная, вещественная, непрерывная при t ^ О, ограниченная (то х п)-матрица. Иногда в литературе уравнение (3) называют уравнением выхода, а вектор у - выходом системы (см. [2]).
Требуется построить такую оценку x(t) вектора состояния x(t), чтобы она обладала свойством
x(t) — x(t) —> 0 при t —> +оо. (4)
Если это удастся, то стабилизирующее управление для системы (1) можно искать в виде
и = С (t)x. (5)
Определение 1 [2]. Динамическую систему, которая формирует на выходе вектор x(t) по данным о выходах и входах системы, будем называть идентификатором состояния.
Определение 2. Квазилинейную динамическую систему, выходом которой является вектор x(t), будем называть квазилинейным асимптотическим идентификатором состояния системы (1), (3), если вектор оценки x(t) удовлетворяет свойству (4).
2. Синтез идентификатора полного порядка. Перейдём к решению поставленной задачи. Будем искать идентификатор в виде
х = A(t)x + B(t)u + L(t)(y — R(t)x) + /xG(i, x, u, /x). (6)
В (6) матрицы A (t), B(t), R(i) и функция G(t, x, u, /х) те же, что и в системе (1), (3), а неизвестная (пхто)-матрица L(t) подлежит определению. Слагаемое L(t)(y — R(t)x) учитывает качество оценки состояния. Ввиду (3) получаем у — R(t)x = R(t)(x — x). Поэтому в идеальной ситуации при x(t) = х система (6) с точностью до обозначений совпадает с исходной системой (1).
Таким образом, задача 1 сводится к выбору матрицы L(t) так, чтобы имело место свойство оценки (4) и существовало стабилизирующее управление (5) для системы (1).
Рассмотрим далее две вспомогательные системы
xi = A(t)xi + B(t)ub (7)
±2 = —A T(t)x2 + RT(t)u2, (8)
где матрицы A(t), В (t), R (t) те же, что ив (1), (3), а векторы xi, х2, ui, u2 соответствующих размерностей имеют характер формальных обозначений.
Следующее утверждение решает задачу 1.
Теорема 1. Если системы (7), (8) стабилизируемы и для функции G(t, х, и, ¡л) из ( 1) при допустимых значениях величин и, /х справедлива оценка
IlG(t, х, и, /х)|| < ф(г)||х||т,
где то > 1, ф(€) — непрерывная положительная функция при £ ^ О, характеристический показатель Ляпунова которой равен пулю, то для системы (1) существует нестационарный асимптотический квазилинейный идентификатор (6) и стабилизирующее управление (5).
Замечание 1. Стабилизируемость систем (7), (8) понимается в смысле возможности обеспечить соответствующим замкнутым системам наперед заданные спектры характеристических показателей [5].
Доказательство. Введём в рассмотрение новую переменную х(£) = х(£) — — х(£), которая описывает качество оценки вектора х(£). Её динамика с учётом управления (5) описывается системой
Если рассматривать системы (10), (9) как единое целое, то остаётся показать, что за счёт выбора матриц С(£), Ь(£) можно обеспечить экспоненциальную устойчивость её нулевого решения. Поскольку стабилизируемость вспомогательных систем (7), (8) и соответствующая оценка нелинейности гарантируются условиями теоремы, матрицы С(£),Ь(£) можно построить по алгоритмам, описанным в [5], а затем воспользоваться теоремой Перрона и теоремой об устойчивости по линейному приближению (см. [6], с. 170 и с. 267 соответственно). Таким образом, возможность построения идентификатора (6) и стабилизирующего управления (5) подтверждена конструктивно. □
3. Идентификаторы Люенбергера. Для построения оценки состояния системы при решении задачи 1 данные измерителя (3) использовались лишь косвенно (при синтезе идентификатора), а сама оценка х(£) является п-мерным вектором, соответствующим вектору х(£).
Изменим постановку задачи 1 следующим образом.
Задача 2. Для системы (1) требуется выбрать п — т линейных комбинаций компонент вектора х:
где z(t) — (п — т)-мерный вектор, чтобы выполнялись следующие условия:
2) для вектора г(і) должен существовать идентификатор, позволяющий находить оценку ъ(£), обладающую асимптотикой
Если задача будет решена, то алгоритм для построения вектора х(і) можно модифицировать следующим образом. С учётом (3) и (11) имеем
х = (A(t) - L(t)R(t))x(t) + /xG(i, х, х, С(t)(x - х), /л), (9)
где G(t, х, х, C(t)(x — х), ц) = G(t, х, C(t)(x — х), ц) — G(t, х — х, С(t)(x — х), ц). При
этом замкнута система (1), (5) в новых переменных примет вид
х = (A(t) — B(t)C(t))x — B(t)C(t)x + x, С(t)(x — x), ц). (10)
z (t) = Tx(t),
(H)
z (t) — z (t) —> 0 при t —> +oo.
Из (12) получим
Это возможно, так как матрица М считается неособой по построению. Если предположить, что найден вектор г(£), то для вектора оценки состояния всей исходной системы получим выражение
Стабилизирующее управление для системы (1) будем искать в виде (5), (13), что и является конечной целью.
С алгебраической точки зрения задача сводится к разработке алгоритма построения матрицы Т, удовлетворяющей условиям 1), 2) в постановке задачи 2.
Замечание 2. Принципиальное отличие данной задачи от предыдущей состоит в том, что информация (3) о векторе х(£) используется непосредственно в (13) для формирования его оценки.
4. Синтез идентификаторов Люенбергера. Перейдём к решению поставленной задачи. Прежде всего сделаем в системе (1) замену переменных (12), чтобы получить уравнение, описывающее изменение вектора z{t). Введём обозначения для блоков следующих матриц:
Здесь первое уравнение описывает изменение вектора z{t), поэтому идентификатор Люенбергера для построения оценки х(£) будем искать в виде
Проблема выбора матрицы Т с учётом введенных обозначений трансформируется в проблему выбора матриц Агг(€), Агу(€), Вг(£).
Следующее утверждение решает задачу 2.
Рассмотрим матричное уравнение
Теорема 2. Пусть выполнены следующие условия:
1) вспомогательная линейная система (7) стабилизируема;
2) матричное уравнение (15) имеет такое решение относительно матрицы Т, что rang М = п, а характеристические показатели Ляпунова линейной системы с матрицей Azz(t) отрицательны;
3) для функции G(t, х, и, ¡л) из (1) при допустимых значениях величин и; /х справедлива оценка ||G(t, х, и, /х)|| ^ ^>(t)||x||m, где то > 1, ф(€) —непрерывная положительная функция при t ^ 0, характеристический показатель Ляпунова которой равен пулю.
(13)
MG t, М“1
1 ^ М
Gz(t, z,y, и, /х) Gy(i, z, у, и, /х)
Тогда система (1) в новых переменных примет вид
z = Azz(t)z + Azy(t)y + Bz(t)u + /xGz(i, z,y, u,/x); у = Ayz(t)z + Avv(t)y + By(t)u + z, y, u, ¡j).
z = Azz(t)z + Azy{t)y + Bz(t)u + /xGz(i, z, у, u, /x).
(14)
TA(t) = Azz{t)T + Azy(t)R(t).
(15)
Тогда для системы (1) существует квазилинейный асимптотический идентификатор Люенбергера (14) и стабилизирующее управление (5), (13).
Доказательство. Отметим основные моменты доказательства, поскольку основная идея остается той же, что и при доказательстве теоремы 1. Для построения стабилизирующего управления (5), (13) и неизвестных коэффициентов идентификатора (14) рассматривается объединенная система уравнений, первая подсистема которой есть (1), а вторая описывает динамику качества оценки вектора z. Выполнение первого и второго условий теоремы обеспечивает экспоненциальную устойчивость линейного приближения этой системы. Используя третье условие теоремы, можно применить теорему о стабилизации по линейному приближению [6], тем самым установив, что нулевое решение данной системы экспоненциально устойчиво. В результате получаем конструктивный подход к построению асимптотического идентификатора Люенбергера (14) и стабилизирующего управления (5), (13). □
Заключение. В настоящей работе исследован вопрос стабилизации программного движения квазилинейной системы в случае неполной обратной связи. Получены достаточные условия существования идентификаторов полного порядка и идентификаторов Люенбергера для данного класса систем.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Зубов В. 77. Лекции по теории управления. — М.: Наука, 1975. — 496 с.
2. Андреев Ю. 77. Управление конечномерными линейными объектами. — М.: Наука, 1976. — 424 с.
3. Luenberger D. С. Observers for multivariable systems // IEEE Trans, on Automatic Control, 1966. — Vol. 11, No. 2. — P. 190-197.
4. Смирнов 77. В. Стабилизация билинейной нестационарной системы в случае неполной обратной связи// Вестн. С.-Петербург, ун-та. Сер. 1, 2000. — Т. 4, №25. — С. 28-34.
5. Смирнов Е. Я. Стабилизация программных движений. — СПб.: С.-Петербург, ун-т, 1997. - 307 с.
6. Демидович Б. 77. Лекции по математической теории устойчивости. — М.: Наука, 1967. — 472 с.
Поступила в редакцию 26/VI/2010; в окончательном варианте — 12/Х/2010.
MSC: 34Н15, 49N30, 93В07
OBSERVERS FOR THE QUASI-LINEAR SYSTEMS Y. A. Shakhov
St. Petersburg State University,
Faculty of Applied Mathematics and Control Processes,
35, Universitetsky prosp., St. Petersburg, 198504.
E-mail: yakov. shakhov@gmail. com
The problem of quasi-linear systems stabilization in the case of incomplete feedback is considered. While synthesising a stabilizing control, estimation of a current state vector is applied. To design this estimation, observers are constructed. The full-dimensions observer and the Luenberger’s observer are studied and sufficient conditions of its existence are obtained,.
Key words: quasi-linear system, stabilization, program control, incomplete feedback, full-dimensions observer, Luenberger’s observer.
Original article submitted 26/VI/2010; revision submitted 12/X/2010.
Yakov A. Shakhov, Postgraduate Student, Dept, of Economics Systems Modeling.