Научная статья на тему 'Решение задачи синтеза дискретной стабилизации с учетом неполной информации для нелинейной стационарной управляемой системы'

Решение задачи синтеза дискретной стабилизации с учетом неполной информации для нелинейной стационарной управляемой системы Текст научной статьи по специальности «Математика»

CC BY
80
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЕМАЯ СИСТЕМА / ДИСКРЕТНОЕ УПРАВЛЕНИЕ / ЗАДАЧА КОШИ / СТАБИЛИЗАЦИЯ / ФАЗОВЫЕ КООРДИНАТЫ / НЕПОЛНАЯ ИНФОРМАЦИЯ / НАБЛЮДАТЕЛЬ / CONTROLLED SYSTEM / DISCRETE CONTROL / CAUCHY PROBLEM / STABILIZATION / STATE VECTOR / INCOMPLETE INFORMATION / OBSERVER

Аннотация научной статьи по математике, автор научной работы — Квитко А. Н., Якушева Д. Б.

В работе получен алгоритм синтеза дискретных управляющих функций с учетом неполной информации и дискретности измерителя, при которых решения широкого класса нелинейных стационарных систем переходят из заданного начального состояния в произвольную окрестность начала координат с учетом ограничений на управление. Получены конструктивные критерии выбора начальных состояний и шага дискретности, гарантирующие реализацию полученного алгоритма. Эффективность метода продемонстрирована при численном моделировании задачи межорбитального перелета.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Квитко А. Н., Якушева Д. Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Решение задачи синтеза дискретной стабилизации с учетом неполной информации для нелинейной стационарной управляемой системы»

УДК 517.977

Вестник СПбГУ. Сер. 1. 2012. Вып. 2

РЕШЕНИЕ ЗАДАЧИ СИНТЕЗА ДИСКРЕТНОЙ СТАБИЛИЗАЦИИ С УЧЕТОМ НЕПОЛНОЙ ИНФОРМАЦИИ ДЛЯ НЕЛИНЕЙНОЙ СТАЦИОНАРНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ

А. Н. Квитко1, Д. Б. Якушева?

1. С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, alkvit46@mail.ru

2. С.-Петербургский государственный университет, аспирант, dariayakusheva@gmail.com

Часто при решении практических задач формировать закон управления на основе информации о полном фазовом состоянии объекта не представляется возможным ввиду доступности измерению лишь некоторой функции от фазовых координат. В связи с этим обстоятельством возникает проблема нахождения искомых управляющих функций по реально измеряемым величинам. Одним из подходов к решению этой проблемы является метод, связанный с построением асимптотического наблюдателя. Основы теории асимптотических наблюдателей для линейных стационарных систем были заложены работой Люенбергера [2]. В последующие десятилетия появились работы, обобщающие и распространяющие эту теорию на линейные нестационарные, билинейные и нелинейные системы специального вида [3-9]. Однако проблема построения асимптотических наблюдателей для нелинейных управляемых систем общего вида еще недостаточно изучена и далека от своего решения. Аналогично обстоит дело и с решением задачи дискретной стабилизации нелинейных систем общего вида. Основные усилия авторов данной статьи направлены на разработку достаточно простого для численной реализации алгоритма синтеза дискретного управления и соответствующего асимптотического наблюдателя при решении задачи дискретной стабилизации для широкого класса нелинейных стационарных систем с учетом нелинейности и дискретности измерителя, ограниченности управления, а также нахождению конструктивных критериев, гарантирующих существование решения поставленной задачи.

Объектом исследования является управляемая система обыкновенных дифференциальных уравнений

X = /(X, и),

и =(и1,...,иг )Т, и € Ет, г < п, Ь € [0, то), / € С 2(Еп х Ег; Еп), / =(/1,...,/п)Т, / (0,0) = 0, гапк (Б,ЛБ,...,Лп-1 В)=п,

(1)

(2)

(3)

(4)

© А. Н. Квитко, Д. Б. Якушева, 2012

г = 1 3 = 1,...,п,

* = {|£(°.°>}. г = 1,...,п, 3 = 1,...,г,

\\п\\<С. (5)

Предположим, что в некоторые дискретные моменты времени г = кН, Н > 0,

к = 0,1,..., доступен измерению вектор у(кН) е Нт, т < п, связанный с фазовым вектором х уравнением

у(кН)=д(х(кН)), (6)

где

д е С 2(Кп; Кт), д = (д1 ,...,дт)Т, (7)

гапк{Т *,Л* Т *,...,Л*п-1Т *} = п, (8)

Определение. Управление и(г) называется дискретным, если

и(г) = и(кН), г е[кН, (к + 1)Н), к = 0,1,..., Н > 0.

Задача 1. Используя результаты измерения у(кН), к = 0,1,..., Н > 0, найти дискретное управление и(г) так, чтобы решения системы (1) удовлетворяли условиям

х(0) = хо, х(г) ->■ 0 при г^-оо. (9)

Теорема. Пусть для системы (1) и уравнения измерителя (6) выполнены условия (2)-(4), (7), (8). Тогда существуют е > 0, Но > 0 такие, что для всех хо е Нп, Н > 0, удовлетворяющих неравенствам

\\хо \\ < е, 0 < Н < Но,

существует решение .задачи 1, которое может быть получено после решения задачи непрерывной стабилизации линейной стационарной системы и построения матрицы асимптотического наблюдателя типа Люенбергера.

Доказательство. Будем искать уравнение асимптотического наблюдателя в виде

х = Лх + Ви + К (у(кН)-д(х(кН))), х =(х1,...,хп)Т. (10)

В уравнении (10) К — неизвестная постоянная матрица размерности [пхт], подлежащая определению. Используя свойства (2), (7), системы (1) и (10) можно представить в виде

х = Лх + Ви + <р(х,и) +ф1(х,и), (11)

V )Т, VI = (Ч>1,...,Ч>П )Т, (12)

1 п г д 2 г 1 г г р{2 .р г

1 п г д 2 {г 1 г г д 2 {г

^ = о £ Е тоЬ^)^ + о Е Е (13)

2 к=1 дхЗдик 2 дидик

1 п п д 2 / г

иЛ = — V" V" ————г(х, й)х-'хк, 1=1 ,...П,

1 дх!дхкК ' У '

X = х, и = вги, вг € [0,1], X = Лх + Би + КТ(х(кН) - х(кк)) + К(д1(х(кН)) - д1(х(кН))), (14)

/1 т\

д1 = (д1,...,д1 ),

1 т т д 2 пг

й-ЕЕ^Йл', (15)

х = вгх, вг € [0,1], г = 1,...,т.

Рассмотрим систему

х = Лх + Би, (16)

X = ЛХ + Би + КТ (х - х). (17)

Будем искать постоянные матрицы Мгхп, Кпхт так, чтобы система (16), (17), замкнутая управлением

и(г) = Ых(г), (18)

была экспоненциально устойчивой.

Сделаем замену переменной ж на 6 по формуле

ж - х = 6. (19)

Тогда в новых переменных х, 6 система (16), (17), замкнутая управлением (18), примет вид

' х \ I Л + БМ БМ \1 х

6 ) \ 01 Л - КТ Д 6 '. (20)

Здесь О1 — матрица, состоящая из нулевых элементов размерности п х п. Используя известный алгоритм непрерывной стабилизации линейных стационарных систем [1], находим матрицу М, при которой спектр матрицы Л + БМ лежит в левой полуплоскости. Чтобы подобрать матрицу К, гарантирующую расположение спектра матрицы Л- КТ в левой полуплоскости, достаточно по упомянутому алгоритму найти матрицу К такую, чтобы спектр матрицы -Л* + Т * К * лежал в правой полуплоскости. Тогда из свойства произведения фундаментальных матриц исходной и сопряженной систем будет следовать, что спектр матрицы Л - КТ лежит в левой полуплоскости. Отсюда и из структуры матрицы системы (20) следует экспоненциальная устойчивость системы (20) при выбранных матрицах М и К .С другой стороны, согласно замене (19), получим экспоненциальную устойчивость системы (16), (17), замкнутой управлением (18). Для удобства дальнейших рассуждений запишем ее в виде одного уравнения

£ = Р£, (21)

где

£ =( ")Т Р = ( Л БМ \

£ =(х,х) , Р =( КТ Л - КТ + БМ \ .

Рассмотрим систему (10), (11), замкнутую дискретным управлением

и(г) = М х(кН), г € [кН, (к + 1)Н), к = 0,1,.... (22)

По аналогии с системой (16), (17) ее можно записать в виде одного уравнения

£ = де + Щ(кН) + ф(£, £(кН)) + <Р1(€,€(кН)). (23)

Здесь

д= ( Л О \ р= ( О ВМ д у О Л \, л у О ВМ

V = (ф(Г£ МГ2£(кН)),К(д(Г1£(кН)) - д(Г2£(кН))))Т, (24)

VI = (Ф1(Г1£, МГ2£(кН)), 0,...,0)Тпх1,

Г1 = (Е, 0)пх2п, Г2 = (0,Е)пх2п,

где О — матрица с нулевыми элементами размерности [п х п]. Наряду с системой (23) рассмотрим систему

£ = де + Е£(кН) + ф(£,£(кН)). (25)

Введем в рассмотрение функцию г (г):

г(г) = £(г)-£(кН) = £(г)-£к, £к = £(кН), г е[кН, (к + 1)Н]. (26)

Решение системы (25) на промежутке [кН, (к + 1)Н], к = 0,1,..., имеет вид

£(г) = еЯ(^)£к + [4 е-«т(Е£к + ф(£,£к)) ¿т. (27)

кН

Сделаем в (27) замену переменной г на в по формуле г - кН = в. Тогда при в е [0,Н] получим

гв+кН

£(в + кН) = е^в£к + е^(в+кН I +кН)(Щк + Ф(£,£к)) ¿т. (28)

кН

Равенство (28) можно записать в виде

ч гв+кН

£(в + кН) = £к + де^Н£к + е^в+кК) ^ е^+кН)(Щк + Ф(£,£к)) ¿т, в е [0,Н], г е [0,Н].

Подставив (29) в (26), получим

в+кН

кН к к (30)

в+кН

г(в+кН) =£(в+кН)-£(кН)=де^Н£к + е®(в+кН) I +кН) (Е£к + Ф(£, £к)) ¿т,

кН

в е[0,Н], £ е[0,Н].

Из (30) следует

в+кН

\\г(в + кН)1<\\дЦе^Шк \\Н +\\е«в \\ ^ ¡е-^ ЦЕ£к + Ф(£,£к )\\¿т, (31) в е [0,Н], Iе [0,Н].

На основании (2), (7), (12), (24) в области

\\£\ < С1 (32)

существует константа Ь такая, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

мик )\\< Ь\\£к |. (33)

В (32) С1 > 0 — произвольное число.

Используя (33), неравенство (31) можно записать в более компактном виде:

\\*(г)\\ < Ь1Н\\£к\\ + Ь2Н\\£к|, г € [кН, (к + 1)Н].

(34)

Константы Ь1, Ь2 в неравенстве (34) не зависят от номера промежутка [кН, (к + 1)Н]. С другой стороны, согласно (26)

(35)

(36)

+ \Кг)\\, г € [кН, (к + 1)Н]. Неравенства (34), (35) дают оценку

(Ь1 + Ь2)Н

т<

1 -(Ь1 + Ь2)Н

, г € [кН, (к + 1)Н].

В силу экспоненциальной устойчивости системы (21) существует положительно определенная квадратичная форма V(£) [1] такая, что

¿V Л

(37)

(21)

После несложных рассуждений нетрудно видеть, что производную V(£) в силу системы (25) можно записать так:

сШ Л

(25)

^гаё^Ег) + ^гаё V, Г3г) + ^гаё^^^(кН)) - М£,£))+ + ^гаё V, (р2(£,£)),

(38)

где

Гз =

О О

КТ КТ

ф2(£,£(кН)) = (^(Г1£,МГ2£(кН)),К(д1(Г1£(кН))- д^^кН))))'

Ф2(£,£) = (^(Г1£,МГ20,К(д1(Г10- д1(Г20)]Т.

В области (32) справедливы оценки

\\grad V \\<11\\£\\,

\\ (р2 (£, £(кН)) - ф2 (£, £)\\ < 72 \\£(кН) -^^ъЫ. Используя (38)-(41), получаем неравенство

\2 + 7з\\£\\И\+74 \\£l|z| + Y5|e|3.

(39)

(40)

(41)

(42) 25

2

2

В (42) 7г, г = 1, 5 — положительные константы, зависящие от области (32). Из (36), (38), (42) следует

¿V А

< -И6112 + ( + + ^1 + ь2)н \ 2 + (43)

(25) \1 -(Ь1 + Ь2)Н 1 -(Ь1 + Ь2)Н

Выберем константы С2 > 0, Но > 0: 0 < С2 < С1 так, чтобы выполнялось неравенство Чз(Ь1 + Ь2)Но Ч4(Ь1 + Ь2)Но

1 -(Ь1 + Ь2)Но 1 -(Ь1 + Ь2)Но Тогда для всех Н : 0 < Н < Но оценка (43) в области

\£\<С2

примет вид

л/

<-76\\£\\2, 16 > 0.

+ 1ъС2 < 1.

сIV А

(25)

Производную функции V(£) в силу системы (23) можно записать так:

+ ^гаё V,Vl).

ЗУ А

(23)

ЗУ А

(44)

(45)

(46)

(47)

(25)

Оценивая правую часть (47) в области (45), с учетом (46), (45), (24), (13) получаем

<-1бШ2 + 7г\£\3. (48)

сIV А

(23)

Здесь 77 > 0 — константа. Выберем константу С3: 0 < С3 < С2 так, чтобы

ПС3 < 76. (49)

Тогда в области

\£\<Сз

на основании (49) имеет место неравенство

А

<-18 \\£\2, 78 > 0.

(50)

(51)

(23)

С другой стороны, согласно [2] функция V(£) является квадратичной формой, которая находится после решения уравнения Ляпунова (37), и для нее справедлива оценка

*1\е\2 < V(£) < а.2 \\£\\2. (52)

Константы а1 > 0, а2 > 0 определяются матрицей квадратичной формы V(£). Из (51), (52) следует

V(£) < V(£о)е-^/(2а2)4, £о = (х(0),х(0))Т, г е [0; +«>).

(53)

Окончательно условия (52), (53) дают оценку

Пусть

Положим

||£(i,0,£o)||<— i € [0,+00). (54) ai

a\C% aiC

<-, < —¡¡-Tjij-. (55)

a2 a^ \M ||

. \a1C3 aiC \

e = mm <-, ———- >.

1 «2 a2\\M\\j

Тогда из неравенств (54), (55) следует, что решение системы (23) не покидает области (50) и удовлетворяет условиям (9), а соответствующее ему управление (22) удовлетворяет ограничению (5). Теорема доказана.

Замечание 1. Повторяя дословно доказательство теоремы 1, нетрудно убедиться, что в качестве асимптотического наблюдателя можно принять уравнение

dx

— = f(x,u) + КТ(д(х) - д(х)).

Задача 2. Используя результаты измерителя (6), найти пару функций x(t), u(t), удовлетворяющих системе (1) и условиям

x(0) = 0, \x(t')\< £1,

где £1 > 0 —произвольное число, t' — заранее неизвестный момент времени.

Замечание 2. Очевидно, что решение задачи 1 на промежутке [0,t'] дает решение задачи 2 при t', удовлетворяющем условию

а1

Пример. Решение задачи межорбитального перелета. В качестве иллюстрации предложенного метода приведем решение задачи перевода материальной точки, движущейся в центральном поле тяготения, на круговую орбиту, лежащую в плоскости орбиты движущейся точки с помощью реактивной силы. Согласно [10] система уравнений в отклонениях относительно указанного движения по круговой орбите имеет вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X1 Х2 ,

Х 2 = V1(Х1,Х4 ) + 41,

Хз = Х4,

Х4 = и2(Х1,Х2 ,Х4 ) + из(Х1 )и2,

где Х1 = г - го, Х2 = Г, Хз = ф - аог, Х4 = ф - ао, 41 = агш/ш, 42 = афш/ш, Го — радиус круговой орбиты, Г — радиальная скорость, ф —полярный угол, ф — скорость изменения полярного угла, аг, аф — проекции вектора относительной скорости отделяющейся частицы на направление радиуса и на ортогональ к направлению соответственно, ш, ш — соответственно масса и скорость изменения массы, ао — угловая скорость движения по заданной круговой орбите,

V , ч/ ч2 г,Х2(Х4 + ао) 1

V 1 = "7-— + (х1+г0)(хА +а0) , г/2 =-2-, г/3 =-,

(Х1 + го ) 2 Х1 + го Х1 + го

V = V0М, Vо — постоянная всемирного тяготения, М — масса планеты. Далее,

х = (х1 ,х2 ,х3, х4 ) , и = (и1,и2) . Матрицы Л и В имеют вид

( 0 100 \

а21 0 0 а24 0 0 0 1 ^ 0 а42 0 0 /

Л=

В =

( 0 0 \

1 0

0 0

\ 0 во )

гапк{Ь1,ЛЬ1,Л2 Ъ1,Ъ2} = гапк

= 4.

а21 = |^-(0,0), а24 = |^(0,0), о42 = 0,0), /30 = ^(0),

дх1 дх4 дх2

В = (Ъ1,Ъ2), Ъ1 = (0,1,0,0)Т, Ъ2 = (0,0,0,во)Т,

( 0 1 0 0 ^ 1 0 а21 + а24а42 0 0 0 а42 0

\ 0 а42 0 во /

Рассматривалось следующее уравнение измерителя:

у = Тх, Т =( 0 1 0 0 ) , гапк{Т*,Л*Т*,Л2*Т*,Л3*Т*}=4.

Численное моделирование. В процессе численного моделирования интегрировалась расширенная система

х 1 х2,

х 2 = VI (х1,х4) + и1, х3 = х4,

х4 = V2 (х1,х2,х4) + Vз(xl)u2 2 + 0,21 + 0,240,42

х1 = х2 +

а21

(х2 - Х2) - —(х3 - хз),

а21

х2 = V1 (х1, х4) + и,1 + 3(х2 - Х2), х3 = х,4 + 3(хз - хз),

х4 = V2 (х1,х2,х4) + Vз(Хl)u2 + 2(хз - хз),

ао = л ~Т рад/сек, х\ = 100 м, го = 7 -106 м, х\ =--- рад, е = 0.01 (56)

у г3 106

на промежутке [0,20] с начальными данными

х1 (0) = х1, х2(0) = 0.2, х3(0) = х3, х4(0) = 0.00001, замкнутая управлениями

6

и\ = (-т - 11)х1 (кЬь) - 6Х2(кН)--хз(кН),

а42

и2 = (кН)--Х4 (кН),

vз vз

где т = а21 + а24а42, Н = 0.1, к = 0,1,....

8000

6000

4000

2000

-2000 ■

—4000

Рис. 1. Графики изменения во времени: а— координаты хх, Ъ — управления их, о— координаты Х2, d — управления и2.

На рис. 1 представлены графики изменения искомых управляющих функций п\, и2 и соответствующих им функций фазовых координат х\(Ь), Х2^).

Предварительный анализ результатов численного моделирования позволяет сделает следующие выводы:

1) критическое значение шага дискретности при условиях (56) Н = 0.2; критическое значение для х\ изменяется в зависимости от ограничений на управляющие воздействия;

2) задача межорбитального перелета легко решается с помощью персональных ЭВМ средних возможностей.

Литература

1. Каллман Р., Фалб П., Арбиб М. Очерки по математической теории систем / пер. с англ. под ред. Э. Л. Напельбаума. М.: Мир, 1971. 399 с.

2. Luenberger D. G. Determing the state linear system with observers low dynamic order. Ph. D. dissertation. Stanford University. 1963.

3. Luenberger D. G. Observers for multivariable systems // IEEE Transactions of Automatic Controll. 1966. P. 190-197.

4. Trin H., Ha Q. P. Design of linear functional observers for linear systems with unknown inputs // International Journal of Systems Science. 2000. Vol. 31, N6. P. 741-749.

5. Roman J. R., Bullok T E. Design of minimal-order stable observes for linear functions of the state via realization theory // IEEE Transactions of Automatic Control. 1975. Vol.20. P. 613-622.

6. Bhattachargun S. P. Observer design for linear system with unknown input // IEEE Transactions of Automatic Control. 1978. Vol. 23. P. 483-484.

7. Коровин С. К., Фомичев В. В. Экспоненциальные наблюдатели билинейных систем на плоскости // Дифференциальные уравнения. 2001. Т. 37, №12. С. 1605-1612.

8. Коровин С. К., Фомичев В. В. Экспонециальные наблюдатели билинейных систем на плоскости // Докл. РАН. Теория управления. 2001. Т. 385, №5. С. 713-728.

9. Коровин С. К., Фомичев В. В. Асимптотические наблюдатели для некоторых классов билинейных систем с линейным входом // Докл. РАН. Теория управления. 2004. Т. 398, №1. С. 38-43.

10. Красовский Н. Н. Теория управления движением. М.: Наука, 1968. 475 с. Статья поступила в редакцию 22 декабря 2011 г.

ХРОНИКА

23 марта 2011 г. на заседании секции теоретической механики им. проф. Н. Н. Поляхова в Санкт-Петербургском Доме Ученых РАН выступили канд. физ.-мат. наук, доц. А. Б. Бячков (Пермский ГУ) и д-р физ.-мат. наук, проф. М. П. Юшков (СПбГУ) с докладом на тему «Тензорная форма уравнений Удвадиа—Калабы движения неголономных систем».

Краткое содержание доклада:

Ф. Удвадиа и Р. Калаба вывели уравнения движения неголономных систем с линейными связями второго порядка, не содержащие реакций связей. Количество этих уравнений равно числу обобщенных координат системы. Уравнения были получены с помощью понятия псевдообратной матрицы, предложенной Э. Х. Муром и Р. Пен-роузом. В докладе показано, что подстановка выражений обобщенных реакций из второй группы обобщенных уравнений Маджи в уравнения Лагранжа второго рода с множителями дает наглядную форму записи уравнений Удвадиа—Калабы в тензорной форме.

i Надоели баннеры? Вы всегда можете отключить рекламу.