УДК 517.977
Вестник СПбГУ. Сер. 1. 2012. Вып. 2
РЕШЕНИЕ ЗАДАЧИ СИНТЕЗА ДИСКРЕТНОЙ СТАБИЛИЗАЦИИ С УЧЕТОМ НЕПОЛНОЙ ИНФОРМАЦИИ ДЛЯ НЕЛИНЕЙНОЙ СТАЦИОНАРНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ
А. Н. Квитко1, Д. Б. Якушева?
1. С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, [email protected]
2. С.-Петербургский государственный университет, аспирант, [email protected]
Часто при решении практических задач формировать закон управления на основе информации о полном фазовом состоянии объекта не представляется возможным ввиду доступности измерению лишь некоторой функции от фазовых координат. В связи с этим обстоятельством возникает проблема нахождения искомых управляющих функций по реально измеряемым величинам. Одним из подходов к решению этой проблемы является метод, связанный с построением асимптотического наблюдателя. Основы теории асимптотических наблюдателей для линейных стационарных систем были заложены работой Люенбергера [2]. В последующие десятилетия появились работы, обобщающие и распространяющие эту теорию на линейные нестационарные, билинейные и нелинейные системы специального вида [3-9]. Однако проблема построения асимптотических наблюдателей для нелинейных управляемых систем общего вида еще недостаточно изучена и далека от своего решения. Аналогично обстоит дело и с решением задачи дискретной стабилизации нелинейных систем общего вида. Основные усилия авторов данной статьи направлены на разработку достаточно простого для численной реализации алгоритма синтеза дискретного управления и соответствующего асимптотического наблюдателя при решении задачи дискретной стабилизации для широкого класса нелинейных стационарных систем с учетом нелинейности и дискретности измерителя, ограниченности управления, а также нахождению конструктивных критериев, гарантирующих существование решения поставленной задачи.
Объектом исследования является управляемая система обыкновенных дифференциальных уравнений
X = /(X, и),
и =(и1,...,иг )Т, и € Ет, г < п, Ь € [0, то), / € С 2(Еп х Ег; Еп), / =(/1,...,/п)Т, / (0,0) = 0, гапк (Б,ЛБ,...,Лп-1 В)=п,
(1)
(2)
(3)
(4)
© А. Н. Квитко, Д. Б. Якушева, 2012
г = 1 3 = 1,...,п,
* = {|£(°.°>}. г = 1,...,п, 3 = 1,...,г,
\\п\\<С. (5)
Предположим, что в некоторые дискретные моменты времени г = кН, Н > 0,
к = 0,1,..., доступен измерению вектор у(кН) е Нт, т < п, связанный с фазовым вектором х уравнением
у(кН)=д(х(кН)), (6)
где
д е С 2(Кп; Кт), д = (д1 ,...,дт)Т, (7)
гапк{Т *,Л* Т *,...,Л*п-1Т *} = п, (8)
Определение. Управление и(г) называется дискретным, если
и(г) = и(кН), г е[кН, (к + 1)Н), к = 0,1,..., Н > 0.
Задача 1. Используя результаты измерения у(кН), к = 0,1,..., Н > 0, найти дискретное управление и(г) так, чтобы решения системы (1) удовлетворяли условиям
х(0) = хо, х(г) ->■ 0 при г^-оо. (9)
Теорема. Пусть для системы (1) и уравнения измерителя (6) выполнены условия (2)-(4), (7), (8). Тогда существуют е > 0, Но > 0 такие, что для всех хо е Нп, Н > 0, удовлетворяющих неравенствам
\\хо \\ < е, 0 < Н < Но,
существует решение .задачи 1, которое может быть получено после решения задачи непрерывной стабилизации линейной стационарной системы и построения матрицы асимптотического наблюдателя типа Люенбергера.
Доказательство. Будем искать уравнение асимптотического наблюдателя в виде
х = Лх + Ви + К (у(кН)-д(х(кН))), х =(х1,...,хп)Т. (10)
В уравнении (10) К — неизвестная постоянная матрица размерности [пхт], подлежащая определению. Используя свойства (2), (7), системы (1) и (10) можно представить в виде
х = Лх + Ви + <р(х,и) +ф1(х,и), (11)
V )Т, VI = (Ч>1,...,Ч>П )Т, (12)
1 п г д 2 г 1 г г р{2 .р г
1 п г д 2 {г 1 г г д 2 {г
^ = о £ Е тоЬ^)^ + о Е Е (13)
2 к=1 дхЗдик 2 дидик
1 п п д 2 / г
иЛ = — V" V" ————г(х, й)х-'хк, 1=1 ,...П,
1 дх!дхкК ' У '
X = х, и = вги, вг € [0,1], X = Лх + Би + КТ(х(кН) - х(кк)) + К(д1(х(кН)) - д1(х(кН))), (14)
/1 т\
д1 = (д1,...,д1 ),
1 т т д 2 пг
й-ЕЕ^Йл', (15)
х = вгх, вг € [0,1], г = 1,...,т.
Рассмотрим систему
х = Лх + Би, (16)
X = ЛХ + Би + КТ (х - х). (17)
Будем искать постоянные матрицы Мгхп, Кпхт так, чтобы система (16), (17), замкнутая управлением
и(г) = Ых(г), (18)
была экспоненциально устойчивой.
Сделаем замену переменной ж на 6 по формуле
ж - х = 6. (19)
Тогда в новых переменных х, 6 система (16), (17), замкнутая управлением (18), примет вид
' х \ I Л + БМ БМ \1 х
6 ) \ 01 Л - КТ Д 6 '. (20)
Здесь О1 — матрица, состоящая из нулевых элементов размерности п х п. Используя известный алгоритм непрерывной стабилизации линейных стационарных систем [1], находим матрицу М, при которой спектр матрицы Л + БМ лежит в левой полуплоскости. Чтобы подобрать матрицу К, гарантирующую расположение спектра матрицы Л- КТ в левой полуплоскости, достаточно по упомянутому алгоритму найти матрицу К такую, чтобы спектр матрицы -Л* + Т * К * лежал в правой полуплоскости. Тогда из свойства произведения фундаментальных матриц исходной и сопряженной систем будет следовать, что спектр матрицы Л - КТ лежит в левой полуплоскости. Отсюда и из структуры матрицы системы (20) следует экспоненциальная устойчивость системы (20) при выбранных матрицах М и К .С другой стороны, согласно замене (19), получим экспоненциальную устойчивость системы (16), (17), замкнутой управлением (18). Для удобства дальнейших рассуждений запишем ее в виде одного уравнения
£ = Р£, (21)
где
£ =( ")Т Р = ( Л БМ \
£ =(х,х) , Р =( КТ Л - КТ + БМ \ .
Рассмотрим систему (10), (11), замкнутую дискретным управлением
и(г) = М х(кН), г € [кН, (к + 1)Н), к = 0,1,.... (22)
По аналогии с системой (16), (17) ее можно записать в виде одного уравнения
£ = де + Щ(кН) + ф(£, £(кН)) + <Р1(€,€(кН)). (23)
Здесь
д= ( Л О \ р= ( О ВМ д у О Л \, л у О ВМ
V = (ф(Г£ МГ2£(кН)),К(д(Г1£(кН)) - д(Г2£(кН))))Т, (24)
VI = (Ф1(Г1£, МГ2£(кН)), 0,...,0)Тпх1,
Г1 = (Е, 0)пх2п, Г2 = (0,Е)пх2п,
где О — матрица с нулевыми элементами размерности [п х п]. Наряду с системой (23) рассмотрим систему
£ = де + Е£(кН) + ф(£,£(кН)). (25)
Введем в рассмотрение функцию г (г):
г(г) = £(г)-£(кН) = £(г)-£к, £к = £(кН), г е[кН, (к + 1)Н]. (26)
Решение системы (25) на промежутке [кН, (к + 1)Н], к = 0,1,..., имеет вид
£(г) = еЯ(^)£к + [4 е-«т(Е£к + ф(£,£к)) ¿т. (27)
кН
Сделаем в (27) замену переменной г на в по формуле г - кН = в. Тогда при в е [0,Н] получим
гв+кН
£(в + кН) = е^в£к + е^(в+кН I +кН)(Щк + Ф(£,£к)) ¿т. (28)
кН
Равенство (28) можно записать в виде
ч гв+кН
£(в + кН) = £к + де^Н£к + е^в+кК) ^ е^+кН)(Щк + Ф(£,£к)) ¿т, в е [0,Н], г е [0,Н].
Подставив (29) в (26), получим
в+кН
кН к к (30)
в+кН
г(в+кН) =£(в+кН)-£(кН)=де^Н£к + е®(в+кН) I +кН) (Е£к + Ф(£, £к)) ¿т,
кН
в е[0,Н], £ е[0,Н].
Из (30) следует
в+кН
\\г(в + кН)1<\\дЦе^Шк \\Н +\\е«в \\ ^ ¡е-^ ЦЕ£к + Ф(£,£к )\\¿т, (31) в е [0,Н], Iе [0,Н].
На основании (2), (7), (12), (24) в области
\\£\ < С1 (32)
существует константа Ь такая, что
мик )\\< Ь\\£к |. (33)
В (32) С1 > 0 — произвольное число.
Используя (33), неравенство (31) можно записать в более компактном виде:
\\*(г)\\ < Ь1Н\\£к\\ + Ь2Н\\£к|, г € [кН, (к + 1)Н].
(34)
Константы Ь1, Ь2 в неравенстве (34) не зависят от номера промежутка [кН, (к + 1)Н]. С другой стороны, согласно (26)
(35)
(36)
+ \Кг)\\, г € [кН, (к + 1)Н]. Неравенства (34), (35) дают оценку
(Ь1 + Ь2)Н
т<
1 -(Ь1 + Ь2)Н
, г € [кН, (к + 1)Н].
В силу экспоненциальной устойчивости системы (21) существует положительно определенная квадратичная форма V(£) [1] такая, что
¿V Л
(37)
(21)
После несложных рассуждений нетрудно видеть, что производную V(£) в силу системы (25) можно записать так:
сШ Л
(25)
^гаё^Ег) + ^гаё V, Г3г) + ^гаё^^^(кН)) - М£,£))+ + ^гаё V, (р2(£,£)),
(38)
где
Гз =
О О
КТ КТ
ф2(£,£(кН)) = (^(Г1£,МГ2£(кН)),К(д1(Г1£(кН))- д^^кН))))'
Ф2(£,£) = (^(Г1£,МГ20,К(д1(Г10- д1(Г20)]Т.
В области (32) справедливы оценки
\\grad V \\<11\\£\\,
\\ (р2 (£, £(кН)) - ф2 (£, £)\\ < 72 \\£(кН) -^^ъЫ. Используя (38)-(41), получаем неравенство
\2 + 7з\\£\\И\+74 \\£l|z| + Y5|e|3.
(39)
(40)
(41)
(42) 25
2
2
В (42) 7г, г = 1, 5 — положительные константы, зависящие от области (32). Из (36), (38), (42) следует
¿V А
< -И6112 + ( + + ^1 + ь2)н \ 2 + (43)
(25) \1 -(Ь1 + Ь2)Н 1 -(Ь1 + Ь2)Н
Выберем константы С2 > 0, Но > 0: 0 < С2 < С1 так, чтобы выполнялось неравенство Чз(Ь1 + Ь2)Но Ч4(Ь1 + Ь2)Но
1 -(Ь1 + Ь2)Но 1 -(Ь1 + Ь2)Но Тогда для всех Н : 0 < Н < Но оценка (43) в области
\£\<С2
примет вид
л/
<-76\\£\\2, 16 > 0.
+ 1ъС2 < 1.
сIV А
(25)
Производную функции V(£) в силу системы (23) можно записать так:
+ ^гаё V,Vl).
ЗУ А
(23)
ЗУ А
(44)
(45)
(46)
(47)
(25)
Оценивая правую часть (47) в области (45), с учетом (46), (45), (24), (13) получаем
<-1бШ2 + 7г\£\3. (48)
сIV А
(23)
Здесь 77 > 0 — константа. Выберем константу С3: 0 < С3 < С2 так, чтобы
ПС3 < 76. (49)
Тогда в области
\£\<Сз
на основании (49) имеет место неравенство
А
<-18 \\£\2, 78 > 0.
(50)
(51)
(23)
С другой стороны, согласно [2] функция V(£) является квадратичной формой, которая находится после решения уравнения Ляпунова (37), и для нее справедлива оценка
*1\е\2 < V(£) < а.2 \\£\\2. (52)
Константы а1 > 0, а2 > 0 определяются матрицей квадратичной формы V(£). Из (51), (52) следует
V(£) < V(£о)е-^/(2а2)4, £о = (х(0),х(0))Т, г е [0; +«>).
(53)
Окончательно условия (52), (53) дают оценку
Пусть
Положим
||£(i,0,£o)||<— i € [0,+00). (54) ai
a\C% aiC
<-, < —¡¡-Tjij-. (55)
a2 a^ \M ||
. \a1C3 aiC \
e = mm <-, ———- >.
1 «2 a2\\M\\j
Тогда из неравенств (54), (55) следует, что решение системы (23) не покидает области (50) и удовлетворяет условиям (9), а соответствующее ему управление (22) удовлетворяет ограничению (5). Теорема доказана.
Замечание 1. Повторяя дословно доказательство теоремы 1, нетрудно убедиться, что в качестве асимптотического наблюдателя можно принять уравнение
dx
— = f(x,u) + КТ(д(х) - д(х)).
Задача 2. Используя результаты измерителя (6), найти пару функций x(t), u(t), удовлетворяющих системе (1) и условиям
x(0) = 0, \x(t')\< £1,
где £1 > 0 —произвольное число, t' — заранее неизвестный момент времени.
Замечание 2. Очевидно, что решение задачи 1 на промежутке [0,t'] дает решение задачи 2 при t', удовлетворяющем условию
а1
Пример. Решение задачи межорбитального перелета. В качестве иллюстрации предложенного метода приведем решение задачи перевода материальной точки, движущейся в центральном поле тяготения, на круговую орбиту, лежащую в плоскости орбиты движущейся точки с помощью реактивной силы. Согласно [10] система уравнений в отклонениях относительно указанного движения по круговой орбите имеет вид
X1 Х2 ,
Х 2 = V1(Х1,Х4 ) + 41,
Хз = Х4,
Х4 = и2(Х1,Х2 ,Х4 ) + из(Х1 )и2,
где Х1 = г - го, Х2 = Г, Хз = ф - аог, Х4 = ф - ао, 41 = агш/ш, 42 = афш/ш, Го — радиус круговой орбиты, Г — радиальная скорость, ф —полярный угол, ф — скорость изменения полярного угла, аг, аф — проекции вектора относительной скорости отделяющейся частицы на направление радиуса и на ортогональ к направлению соответственно, ш, ш — соответственно масса и скорость изменения массы, ао — угловая скорость движения по заданной круговой орбите,
V , ч/ ч2 г,Х2(Х4 + ао) 1
V 1 = "7-— + (х1+г0)(хА +а0) , г/2 =-2-, г/3 =-,
(Х1 + го ) 2 Х1 + го Х1 + го
V = V0М, Vо — постоянная всемирного тяготения, М — масса планеты. Далее,
х = (х1 ,х2 ,х3, х4 ) , и = (и1,и2) . Матрицы Л и В имеют вид
( 0 100 \
а21 0 0 а24 0 0 0 1 ^ 0 а42 0 0 /
Л=
В =
( 0 0 \
1 0
0 0
\ 0 во )
гапк{Ь1,ЛЬ1,Л2 Ъ1,Ъ2} = гапк
= 4.
а21 = |^-(0,0), а24 = |^(0,0), о42 = 0,0), /30 = ^(0),
дх1 дх4 дх2
В = (Ъ1,Ъ2), Ъ1 = (0,1,0,0)Т, Ъ2 = (0,0,0,во)Т,
( 0 1 0 0 ^ 1 0 а21 + а24а42 0 0 0 а42 0
\ 0 а42 0 во /
Рассматривалось следующее уравнение измерителя:
у = Тх, Т =( 0 1 0 0 ) , гапк{Т*,Л*Т*,Л2*Т*,Л3*Т*}=4.
Численное моделирование. В процессе численного моделирования интегрировалась расширенная система
х 1 х2,
х 2 = VI (х1,х4) + и1, х3 = х4,
х4 = V2 (х1,х2,х4) + Vз(xl)u2 2 + 0,21 + 0,240,42
х1 = х2 +
а21
(х2 - Х2) - —(х3 - хз),
а21
х2 = V1 (х1, х4) + и,1 + 3(х2 - Х2), х3 = х,4 + 3(хз - хз),
х4 = V2 (х1,х2,х4) + Vз(Хl)u2 + 2(хз - хз),
ао = л ~Т рад/сек, х\ = 100 м, го = 7 -106 м, х\ =--- рад, е = 0.01 (56)
у г3 106
на промежутке [0,20] с начальными данными
х1 (0) = х1, х2(0) = 0.2, х3(0) = х3, х4(0) = 0.00001, замкнутая управлениями
6
и\ = (-т - 11)х1 (кЬь) - 6Х2(кН)--хз(кН),
а42
и2 = (кН)--Х4 (кН),
vз vз
где т = а21 + а24а42, Н = 0.1, к = 0,1,....
8000
6000
4000
2000
-2000 ■
—4000
Рис. 1. Графики изменения во времени: а— координаты хх, Ъ — управления их, о— координаты Х2, d — управления и2.
На рис. 1 представлены графики изменения искомых управляющих функций п\, и2 и соответствующих им функций фазовых координат х\(Ь), Х2^).
Предварительный анализ результатов численного моделирования позволяет сделает следующие выводы:
1) критическое значение шага дискретности при условиях (56) Н = 0.2; критическое значение для х\ изменяется в зависимости от ограничений на управляющие воздействия;
2) задача межорбитального перелета легко решается с помощью персональных ЭВМ средних возможностей.
Литература
1. Каллман Р., Фалб П., Арбиб М. Очерки по математической теории систем / пер. с англ. под ред. Э. Л. Напельбаума. М.: Мир, 1971. 399 с.
2. Luenberger D. G. Determing the state linear system with observers low dynamic order. Ph. D. dissertation. Stanford University. 1963.
3. Luenberger D. G. Observers for multivariable systems // IEEE Transactions of Automatic Controll. 1966. P. 190-197.
4. Trin H., Ha Q. P. Design of linear functional observers for linear systems with unknown inputs // International Journal of Systems Science. 2000. Vol. 31, N6. P. 741-749.
5. Roman J. R., Bullok T E. Design of minimal-order stable observes for linear functions of the state via realization theory // IEEE Transactions of Automatic Control. 1975. Vol.20. P. 613-622.
6. Bhattachargun S. P. Observer design for linear system with unknown input // IEEE Transactions of Automatic Control. 1978. Vol. 23. P. 483-484.
7. Коровин С. К., Фомичев В. В. Экспоненциальные наблюдатели билинейных систем на плоскости // Дифференциальные уравнения. 2001. Т. 37, №12. С. 1605-1612.
8. Коровин С. К., Фомичев В. В. Экспонециальные наблюдатели билинейных систем на плоскости // Докл. РАН. Теория управления. 2001. Т. 385, №5. С. 713-728.
9. Коровин С. К., Фомичев В. В. Асимптотические наблюдатели для некоторых классов билинейных систем с линейным входом // Докл. РАН. Теория управления. 2004. Т. 398, №1. С. 38-43.
10. Красовский Н. Н. Теория управления движением. М.: Наука, 1968. 475 с. Статья поступила в редакцию 22 декабря 2011 г.
ХРОНИКА
23 марта 2011 г. на заседании секции теоретической механики им. проф. Н. Н. Поляхова в Санкт-Петербургском Доме Ученых РАН выступили канд. физ.-мат. наук, доц. А. Б. Бячков (Пермский ГУ) и д-р физ.-мат. наук, проф. М. П. Юшков (СПбГУ) с докладом на тему «Тензорная форма уравнений Удвадиа—Калабы движения неголономных систем».
Краткое содержание доклада:
Ф. Удвадиа и Р. Калаба вывели уравнения движения неголономных систем с линейными связями второго порядка, не содержащие реакций связей. Количество этих уравнений равно числу обобщенных координат системы. Уравнения были получены с помощью понятия псевдообратной матрицы, предложенной Э. Х. Муром и Р. Пен-роузом. В докладе показано, что подстановка выражений обобщенных реакций из второй группы обобщенных уравнений Маджи в уравнения Лагранжа второго рода с множителями дает наглядную форму записи уравнений Удвадиа—Калабы в тензорной форме.