Сер. 10. 2011. Вып. 2
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
ПРОЦЕССЫ УПРАВЛЕНИЯ
УДК 517.977+519.71
М. А. Александров, Н. В. Смирнов
АСИМПТОТИЧЕСКИ УСТОЙЧИВЫЙ ГИБРИДНЫЙ ИДЕНТИФИКАТОР В ЗАДАЧЕ МНОГОПРОГРАММНОЙ СТАБИЛИЗАЦИИ
1. Введение. Постановка задачи. Стабилизация программных движений управляемых динамических систем является по сути центральной в современной математической теории управления. Наиболее распространенный подход при ее решении состоит в построении управлений вида обратной связи [1, 2]. Задача многопрограммной стабилизации была впервые сформулирована В. И. Зубовым в работах [3, 4]. В них предложено представление правых частей систем дифференциальных уравнений, имеющих наперед заданное конечное семейство решений, а также рассмотрена задача синтеза управлений, которые реализуют заданную совокупность программных движений и обеспечивают их асимптотическую устойчивость по Ляпунову.
Допустим, что движение объекта управления описывается линейной системой
где х Є И" - вектор фазового состояния; и Є Иг - вектор управлений; Р и Р - постоянные, вещественные матрицы соответствующих размерностей; f (і) - вещественная, непрерывная вектор-функция, заданная при і Є [0, +го).
Задача 1 [4] (многопрограммная стабилизация). Требуется построить управление
которое реализует заданные программные движения Xj = Xj(t) при программных управлениях uj = иj(t), j = 1, N. Кроме того, необходимо, чтобы программные движения Xj (t) при управлении (2) были асимптотически устойчивы по Ляпунову.
Александров Михаил Александрович — аспирант кафедры моделирования экономических систем факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук, проф. Н. В. Смирнов. Количество опубликованных работ: 2. Научное направление: математическая теория управления. E-mail: [email protected].
Смирнов Николай Васильевич — доктор физико-математических наук, профессор кафедры моделирования экономических систем факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 81. Научные направления: теория устойчивости, математическая теория управления, управление макроэкономическими системами. E-mail: [email protected].
© М. А. Александров, Н. В. Смирнов, 2011
X = Px + Qu + f (і),
(1)
u = u(x, і),
(2)
Конструктивное решение задачи 1 предлагает
Теорема 1 [4]. Пусть выполнены следующие условия: 1) система X = Px + Qu при u = Cx может иметь сколь угодно большой запас устойчивости, получающийся путем выбора постоянной матрицы C; 2) программные движения Xj (t) различимы при t ^ to ^ 0, иначе говоря, inft^0 ||x* — Xj|| > 0, i = j. Тогда существует управление (2), реализующее программные движения Xj(t), при этом каждое из них будет асимптотически устойчиво по Ляпунову.
В общем случае число N не связано с размерностью системы (1) и размерностью пространства управлений. Управление (2) имеет следующее представление:
Функция (3) - это интерполяционный полином Эрмита, в котором узловые точки -программные движения ху(£), а значения - программные управления иу (£). По построению управление (3), (4) обладает такими очевидными свойствами: ру(ху,£) = 1; Ру(х*,£) = 0, г ^ j; и(ху(£),£) = иу(£), j = 1,М. Выражения вида (ху — х*)(х — Ху), (ху — х^)2 представляют собой скалярные произведения соответствующих векторов. В формулах (3), (4) и далее по тексту, где это не мешает пониманию сути, не будем указывать аргумент £ у векторных функций х*, ху, иу, .... Кроме того, зависимость функций ру(х,£) от времени является неявной, лишь через х*(£), ху(£), поэтому имеет смысл обозначение ру (х) в левой части (4).
Система (1), замкнутая управлением (3), (4), представляет собой многопрограммный автомат, способный реализовать произвольное программное движение ху (£) из заданного семейства и обеспечить его асимптотическую устойчивость. В [5] задача 1 была рассмотрена для билинейных систем, а в [6, 7] - для линейных и билинейных систем в случае неполной обратной связи. В них предложены алгоритмы построения непрерывных идентификаторов полного порядка и Люенбергера [8], позволяющих, в конечном итоге, заменить векторы отклонений х — ху в (3) на их оценки х — ху.
Практическая реализация управления (3), (4) в конкретной прикладной задаче требует непрерывного получения информации о векторах отклонений уу (£) = х(£) — ху (£) для всех программных движений ху (£). Эта проблема отпадает, если построить дискретный регулятор вместо непрерывного.
Отметим, что при решении задачи 1 векторы отклонения от программных режимов х — ху считались доступными для измерения. Изменим постановку задачи. Предположим, что задано уравнение измерительного прибора
где zy (і) Є Ит - вектор измерений; И. - постоянная, вещественная (т х п)-матрица. Уравнение (5) называют уравнением выхода [9], а вектор zy (і) - выходом системы. Зная выход zy (і), требуется построить такую оценку у у (і) вектора у у (і), чтобы она обладала свойством [9]
где
Zy(t) = Ryy(t), j=l,N,
(5)
yj (і) — yj (і) ^ 0, і ^ +ro.
(6)
Если такая оценка существует, то ее можно было бы использовать для синтеза управления, аналогичного управлению (3), (4). В этом и состоит задача многопрограммной стабилизации линейной системы (1) в случае неполной обратной связи.
Определение 1. Многопрограммным управлением с неполной обратной связью будем называть управление вида (3), (4), в котором вектор фазового состояния х(£), недоступный для прямого измерения, заменяется соответствующей оценкой У(£), построенной с применением асимптотического идентификатора.
Многопрограммное управление с неполной обратной связью построим в виде [6]
и(х,*) = + С(х-ху) -2иу ^ (Хд , (7)
3 = Л г=1,г=у (ху х) '
14 Сх—тгЛ2 ____
р№= П (х. _х.)2^ 3 = 1^' (8)
г=1,г=у у 1
Замкнем систему (1) управлением (7), (8) и рассмотрим некоторое ее программное движение хи (£) из данного семейства. Здесь и в дальнейшем индексом к будем обозначать некоторое конкретное движение семейства, относительно которого ведутся рассуждения. Полагая ук(£) = х(£) — хк(£), Ук(£) = х(£) — хк(£), построим систему в отклонениях
У к = Рук + + Ий(уй). (9)
Здесь
н^,^(сй-2иі £д^)(г £ £^+м*))+
і=1,і=к ' 4 і=1,і=к 7
N ,
+ Ри нк(ук ) + ^ ^ (иу + С(уЙ + Хк - Ху ) -
у = 1,у = к '■
о ^ (Ху - Хі)(ук + Хк - Ху)\ >
-2иу 2^ -----(х._х.)2------ ру(ук+хк), (10)
і=1,і=у \ у і) /
Ьк (Ук) - скалярная функция, порядок которой по компонентам вектора у к не меньше двух.
По построению нелинейную систему (9) можно рассматривать как систему, замкнутую управлением вида у к = Сук. В этом случае ее можно записать в форме
У к = Рук + Цуй + Нк(Ук, Уй ). (11)
Идентификатор состояния для системы (11) предлагается строить в таком виде:
ук = Рук + Цуй + Ь^к - Иук) + Нк(Уй, Уй), (12)
где Ь - (п х т)-матрица параметров идентификатора, подлежащая определению. Слагаемое Ь^й - Иук) в правой части (12) учитывает качество оценки состояния. Поскольку с учетом (5) zk - Иук = И(ук - ук), то в идеальной ситуации при ук = ук
система (12) с точностью до обозначений совпадает с исходной системой (11).
Перед формулировкой задачи введем еще несколько понятий.
Определение 2. Управление Ук будем называть допустимым дискретным управлением, если оно имеет вид кусочно-постоянной векторной функции
Ук = СУк (аН), г £ [аН, (а + 1)Н[ , а = 0,1,..., (13)
где Н - шаг дискретности; у к (0) = Уко - вектор начальных данных для идентификатора (12).
Определение 3. Идентификатор (12), замкнутый дискретным управлением (13), будем называть гибридным идентификатором полного порядка.
Идентификатор полного порядка позволяет оценить весь вектор ук в отличие от идентификатора Люенбергера [8, 9].
Определение 4. Гибридным многопрограммным управлением будем называть управление вида (3), (4), в котором только первые слагаемые иу(г), отвечающие за реализацию программных движений ху(г), являются известными непрерывными и ограниченными функциями времени, а все остальные слагаемые и сомножители, отвечающие за стабилизацию программных движений, вычисляются в дискретные моменты времени г = вН, а = 0, 1,....
Задача 2 (многопрограммная стабилизация при неполной обратной связи с применением гибридного идентификатора). Выяснить, при каких коэффициентах усиления в виде матриц С, Ь и при каком выборе шага Н существуют гибридный идентификатор полного порядка и допустимое дискретное управление (13), обеспечивающие асимптотическую устойчивость нулевому решению системы (11).
Решение этой задачи позволит указать алгоритм построения гибридного многопрограммного управления с неполной обратной связью, что и является конечной целью данной работы. В заключение п. 1 отметим, что задача синтеза гибридного идентификатора с целью обеспечения технической устойчивости многопрограммного регулятора рассматривалась в [10].
2. Синтез многопрограммного регулятора на основе асимптотически устойчивого гибридного идентификатора состояния системы. Перейдем к решению поставленной задачи. Прежде всего построим непрерывное стабилизирующее управление в системе (11), (12). Для этого рассмотрим (11), (12) как одну систему, учитывая уравнение измерителя (5) и вид допустимого непрерывного управления Ук = Сук:
Г у к = Рук + дсук + Нк (Ук, СУк),
(14)
[у к = РУк + QCyk + ЬИ.(ук — Ук) + Нк (ук, СУк).
В системе (14) сделаем неособую замену переменных:
|ук(г) = ук(г) (15)
\ук(1) = Ук&) -Ук&).
Переменная ук(г) отражает качество оценки состояния и может быть использована
для анализа ее асимптотики (6). В новых переменных система (14) примет вид
Ц) = (р +оЧС гЛСк) (Й + (Н‘(У‘ - ^ “ *”) ■ <“>
Система (16) состоит из двух подсистем. Первая представляет собой систему (11), замкнутую управлением у к = СУк, выраженным через новые переменные (15), а вторая, по уд,, описывает качество оценки отклонения у к по измерениям (5). В результате
задача сводится к выбору матриц С и Ь таким образом, чтобы нулевое решение системы (16) было асимптотически устойчиво по Ляпунову.
Перейдем к формулировке основного результата.
Теорема 2. Пусть выполнены условия теоремы 1 и существуют матрицы С и Ь, при которых система линейного приближения в (16) асимптотически устойчива по Ляпунову. Тогда существует гибридное многопрограммное управление, построенное с применением гибридного идентификатора (12), (13), которое реализует заданные программные движения ху(£), j = 1,М, и обеспечивает их асимптотическую устойчивость.
Доказательство. Условия теоремы означают, что существуют непрерывное стабилизирующее управление у к = Сук для системы (14) и построенное на его основе непрерывное многопрограммное управление с неполной обратной связью (7), (8), где У = ук + хк, а ук - выход идентификатора (12).
Рассмотрим теперь дискретное управление (13) с той же матрицей С и соответствующее гибридное многопрограммное управление
N
и(У(аН), г) = | иу (г) + С(У(аН) — ху (аН)) —
у=1 V
_2ц>(() £ (17)
где
.=1.=у (ху (аН) — х*(аН))2
1У' (У(аН) — х* (аН))2
»<**>> (18)
Построим оценки отклонений решений замкнутой системы (1), (17), (18) от программных движений ху (г). Повторяя для нее вывод системы в отклонениях (11), получим
ук = Рук + ЦСук (аН) + Нк(Ук (аН), Сук (аН)). (19)
Соответствующий гибридный идентификатор имеет вид
у к = РУк + ЦСук(аН) + Ь^к — ИУк) + Нк(Ук (аН), Сук (аН)). (20)
Объединим (19), (20) в одну систему, учитывая уравнение измерителя (5), и выполним замену переменных (15):
у Л = (Р О \ /уЛ + ^С — дС\ (ук (аН) + Ук) [о Р - ЪВ.) ^у к) + \0 О \ук(8к) +
+
Нк(ук(в/г) - ук(вН), С(ук(вН) - ук(вН)))\ ^
Введем обозначения
ИЙ' Чо р°ьк)' « = (Чо° -2°
Тогда система (21) примет вид
У к = Р Рк + Р Рк (зН) + Ок(рк (зН)),
(22)
где Ок(Ук(аН)) - обозначение вектора нелинейности в (21).
Вектор Ок(УУк(аН)) состоит из двух блоков, построенных на основе нелинейных слагаемых в (21). Функция Нк(ук($]г) — ук(в]г), С(ук(в]г) — ук(в]г))') имеет вид полинома (см. (10)), максимальная степень которого конечна и зависит только от параметра N, а порядок по компонентам векторов ук(вк), ук(зк) не меньше второго. Следовательно, при достаточно малых по норме отклонениях Ук(аН) справедлива оценка
|Ок(Ук (зН))|| < «ІІУк (зН
(23)
где Ь ^ 2; а - положительная константа, зависящая от норм матриц Р, С и функций
и, х.
Оценим норму разности ук(г) — ук(аН) при г € [аН, (а + 1)Н] в системе (22). Применяя формулу Коши, запишем
сі-вК
Ук
(і) - У к (зН) = ер (і-вК) - Е + ер (і-вК-т) д,т Р У к (зН) +
сЬ — вК
+
Используя (23) и очевидные вспомогательные оценки
ер(і-вК-тЧтОк (Ук (зН)).
ер(і-вК) _ е|| ^ е||р||К - 1,
сі-вК
гр (і-вК-т )ат
Р К
справедливые при і Є [зН, (з + 1)Н], получим
ІІУк (і) - Ук (зН) | < т(Н, Ук (зН))|Ук (зН)||, т(Н, рк(зН)) = ецрЦК - 1 + НецрЦК|р| + аНе||РЦК||рк(з
(24)
\Ъ-1
Для любого допустимого дискретного управления (13) функция т(Н, Ук (зН)) > 0 при Н > 0 и обладает свойством т(Н, У к (зН)) ^ 0 при Н ^ 0 и ||Ук (зН) | ^ ш, з = 0,1..., где ш - некоторая положительная постоянная.
Поскольку ||Ук (і) - рк (зН) | < т(Н, рк(зН))||рк (зН) - Ук (і)+рк (і)|, то при достаточно малом Н, когда т(Н, У к (зН)) < 1, имеет место окончательная оценка
ііуй(і) - уй(«М11 <
1 - т(Н, Ук (зН))
Запишем систему (22) в эквивалентной форме
рк = (Р + р)рк + р(Ук(зН) - рк) + Ок(рк(зН)). Рассмотрим систему
рк = (Р + р)Ук ,
(25)
(26) (27)
Ъ
0
0
0
которая совпадает с системой линейного приближения в (16). По условию теоремы существуют матрицы С и Ь, при которых (27) асимптотически устойчива. Тогда существует квадратичная форма «(ук) = у^Уук такая, что йю (у к)/&\(27) = —||ук||2. Матрицу V квадратичной формы «(ук) можно найти, решая матричное уравнение Ляпунова.
Продифференцируем теперь «(ук), в силу системы (26):
dv(ук)
dt
= - ||Ук У2 + (gradv(yk), Q (ук(sh) - yk)) + (grad v(yk), Gk(ук(sh))). (28)
Для оценки сверху модуля второго слагаемого в (28) используем (25) и неравенство Коши-Буняковского
| (grad'y(yfc), Q(yk(s/i) — Ук)) | < А, ^’^-^.ЛукЩ2, (29)
|V 71 1 - m(h, yk (sh))
где A! = 2||V||||Q||.
Построим аналогичную оценку для третьего слагаемого в (28), применяя неравенство Коши-Буняковского и (23):
| (grad v(y k), Gk (yk (sh))) | < A2||yk ||||yk(sh)||b, A2 = 2a||V||.
Поскольку
b-1 / Л , m(h У k(sh)) \ ||~ ||||~ ! 7 M|b-1
l|yfc(sMII = \\yk(sh)-yk+yk\\\\yk(sh)\\ <(l + i-------\h ~ , llyfcll||yfc(-sfc)||
V 1 - m(h, yk (sh)) )
то окончательно получим
I (gradw(yfc), Gk(yk(sh))) \ ^A2(l+ ) \ ||yfc (sfe) || b~i || yfc ||2. (30)
V 1 - m(h, yk (sh)))
Объединяя оценки (29), (30), найдем
dv(У*) ^_||yfc||2(l_Al:
dt
(26) \ 1 - m(h, yk (sh))
V 1 — т(Н, Ук (ап))) у
Для доказательства асимптотической устойчивости нулевого решения системы (26) приведем несколько вспомогательных оценок.
В силу основного свойства функции т(Н, у к (аН)), существуют положительные числа Д и Но такие, что при Н € (0, Но), |Ук(аН)| < Д выполнено
т(к,ук(вк)) < (32)
.4,, (1 + , 11»(«Ч||*-‘ « I- (33)
1 — т(Н, ук (аН)) V 1 — т(Н, ук (аН)) J 2
Пусть для некоторого ао ^ 0 и 6 < Д выполнено ||ук(аоН)|| < 6, тогда, в силу (24), (32), справедлива оценка
||Уй((«о + < ||уй(во/г)|| + ||Уй((«о + 1)М - Уй(«о/г)|| < (5 + ^<5 < 2(5.
Будем считать, что 26 < Д. В этом случае имеем ||Уй((*о + 2)Л-)|| ^ ||Уй((во + 1)^)|| + ||Уй((5о + 2)1г) — Уй((во + 1)^)|| ^ 2(5 + —25 < 4(5.
Пусть теперь 2е 6 < Д, тогда аналогичные рассуждения позволяют получить оценку
||ук((ао + 1)Н)Ц < 2е6. (34)
Далее, в силу оценки (31) и неравенства (33), имеем
(35)
Вместе с тем положительно-определенная квадратичная форма удовлетворяет неравенствам
а\ ||ук||2 < «(ук) < а2||ук||2, (36)
где а1 > 0, а2 > 0. Из (35), (36) следует
(37)
Оценки (34), (37) позволяют сделать вывод о том, что на решениях системы (26), удовлетворяющих условию ||ук (аоН) | < 6, выполнены неравенства
«(Уй(«0 + £)Ь) < «(Уй(«о/г))е_1^№. (38)
Далее, в силу (35), (36) и (38), имеем
\\Ы(*о + т\\ < * /^\\ук(в0к)\\е^^.
V а1
Пусть число I выбрано так, чтобы было справедливо соотношение
< -е 2 < 1.
V а1
Тогда имеют место оценки
II ук ((ао + 1)Н)Ц < 6.
Получаем, что решения системы (26), начинающиеся в области ||у|| < 6, при возрастании времени остаются в области ||у|| < Д. Значит, для таких решений при всех
t € ^о, +го) выполняются неравенства (35) и (37). Следовательно, нулевое решение
системы (26) асимптотически устойчиво. Теорема доказана.
3. Заключение. В работе предложен метод построения гибридного многопрограммного управления с неполной обратной связью. Реализация данного класса управлений возможна при наличии соответствующего идентификатора. С этой целью доказана теорема о достаточных условиях существования асимптотически устойчивого
гибридного идентификатора. Доказательство теоремы конструктивно. Оно основано на втором методе Ляпунова и содержит алгоритм построения указанного идентификатора. Таким образом, изложен конструктивный метод синтеза многопрограммных гибридных управлений для класса линейных систем, обеспечивающий заранее прогнозируемую точность и асимптотическую устойчивость по Ляпунову программных движений из наперед заданного семейства.
Литература
1. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 496 с.
2. Зубов В. И. Математические методы исследования систем автоматического регулирования. Изд. 2-е, перераб. и доп. Л.: Машиностроение, 1974. 336 с.
3. Зубов В. И. Интерполяция систем дифференциальных уравнений // Докл. АН СССР. 1991.
Т. 318, № 1. С. 28-31.
4. Зубов В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. 1991. Т. 318, № 2. С. 274-277.
5. Смирнов Н. В., Смирнова Т. Е. Синтез многопрограммных управлений в билинейных систе-
мах // Прикл. математика и механика. 2000. Т. 64, № 6. С. 929-932.
6. Смирнов Н. В. Многопрограммная стабилизация линейных и билинейных систем в случае неполной обратной связи // Изв. РАН. Теория и системы управления. 2001. № 3. С. 40-44.
7. Smirnov N. V. Synthesis of multiprogrammed stable controls using the Luenberger observer // Proc. of 11th IFAC Workshop: Control Appl. Optim. 2000. Vol. 1. P. 327-330.
8. Luenberger D. G. Observers for multivariable systems // IEEE Trans. Automat. Control. 1966. Vol. AC-11, N 2. P. 190-197.
9. Андреев Ю. Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с.
10. Смирнов Н. В. Синтез гибридного идентификатора полного порядка в задаче многопрограммной стабилизации // Автоматика и телемеханика. 2006. № 7. С. 41-52.
Статья рекомендована к печати проф. А. П. Жабко. Статья принята к печати 16 декабря 2010 г.