X ИНФОРМАЦИОННО-УПРАВЛЯЮЩИЕ СИСТЕМЫ
УДК 517.977
РЕШЕНИЕ ГРАНИЧНОЙ ЗАДАЧИ ДЛЯ НЕЛИНЕЙНОЙ СТАЦИОНАРНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ НА БЕСКОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ С УЧЕТОМ ДИСКРЕТНОСТИ УПРАВЛЕНИЯ
А. Н. Квитко,
доктор физ.-мат. наук, профессор Д. Б. Якушева,
аспирант
Санкт-Петербургский государственный университет
Получен алгоритм синтеза дискретных управляющих функций, при которых решения широкого класса нелинейных стационарных систем переходят из заданного начального состояния в произвольную окрестность начала координат с учетом ограничений на управление. Приведены конструктивные критерии выбора начальных состояний и шага дискретности, гарантирующие реализацию полученного алгоритма. Эффективность метода продемонстрирована при численном моделировании задачи успокоения гироскопического маятника.
Ключевые слова — управляемая система, дискретное управление, задача Коши, стабилизация, фазовые координаты.
Введение
Использование цифровой вычислительной техники в системах управления обусловливает формирование управляющих воздействий в дискретные моменты времени. Одним из важных и сложных аспектов математической теории управления являются вопросы, связанные с поиском методов синтеза дискретных управляющих функций, при которых решения различных типов систем обыкновенных дифференциальных уравнений соединяют заданные точки в фазовом пространстве. Этим исследованиям посвящены работы [1-8]. Вместе с тем значительное число граничных задач в классе дискретных управлений ввиду их сложности еще недостаточно изучено. Основное внимание в настоящей работе уделено разработке простых с точки зрения численной реализации алгоритмов нахождения решений указанных задач для широкого класса нелинейных управляемых систем, а также иллюстрации эффективности предложенных алгоритмов при решении конкретной практической задачи. Поставленная цель достигнута сведением исходной задачи к задаче непрерывной стабилизации линейной стационарной системы специального вида
и последующим решением задачи Коши для вспомогательной системы обыкновенных дифференциальных уравнений. Получен алгоритм построения дискретной управляющей функции, при которой решение нелинейной стационарной системы переходит из заданного начального состояния в произвольную окрестность нуля с учетом ограничений на управление.
Объектом исследования является система
х = ^х, и), (1)
х = (х1,..., хп )Т, х Е Rn, и = (и1,..., иг )Т, и Е Rr, г < п, t Е [0, ¥),
f Е С3 ^п х Rr; Rn), f = (Д..., Г )Т; (2)
f (0,0) = 0; (3)
гапк(В, АВ,..., Ап-1В) = п, (4)
А = \д~] (0,0)\, I = 1,..., п, ] = 1,..., п,
|дх] \
(0, 0)\ I = 1,..., п, ] = 1,..., г,
||и|| < С1. (5)
В =
\dfi_
ди]
Определение. Управление и(#) называется дискретным, если
u(t) = и(М), "t Е [Ш,(к + 1)К), А = 0,1,...,
где h > 0 — постоянная величина.
Задача 1. Найти дискретное управление и(£) так, чтобы решение системы (1) x(t) удовлетворяло условиям
х(0) = Х1, Х1 = (х}, ..., х’п)Т,
х^) ® 0 при t ®¥. (6)
Указанную пару x(t), и^) будем называть решением задачи (1), (6).
Решение задачи
Теорема. Пусть для правой части системы (1) выполнены условия (2)-(4). Тогда существуют е > 0 и h0 > 0 такие, что для любого x1: 11x1 < е и для любого Ы 0 < h < h0 существует решение поставленной задачи, которое может быть получено после решения задачи стабилизации линейной стационарной системы и последующим решением задачи Коши для вспомогательной системы обыкновенных дифференциальных уравнений (порядки указанных систем совпадают с порядком исходной системы).
Доказательство: Используя свойство (2), систему (1) можно представить в виде
х = Ах + Ви + ф(х ,и ) + ф1(х), (7)
ф(х, и) = (ф1, .. ф" )Т, фх(х) = (ф1,..., ф" )Т,
1 п г д2^
у1 (х,и)=2 ^^дхлии?(х,и )х‘ик+
г г д2Г
1 г г +— Е Е 2 Ны дп’дп1*
1 ПП д2^
фі(х) =йЕЕ
; и
(X, и)и‘и ,
(X,и)х>хк, ] = 1,...,п,
(8)
2 ]=1к=1 дх‘дхк х = 9;х, 11 = 9;и, 9; Е [0,1].
Рассмотрим линейную часть системы (1)
х = Ах + Ви. (9)
Используя условие (4) и известный алгоритм [9], найдем управляющую функцию вида
и^) = Сх^), (10)
где C — постоянная матрица размерности [г х и], обеспечивающую экспоненциальную устойчивость системы (9). Наряду с системой (7) рассмотрим систему
х = Ах + Ви + ф(х, и).
(11)
Система (11), замкнутая дискретным управлением
и = Сх(М), t є [Ш,(к +1)^, к = 0,1,..., (12) примет вид
х = Ах + ВСх(Ш) + ф(х, Cx(kh)). (13)
Введем в рассмотрение функцию z(^): z(t) = x(t) — х(кН) = x(t) — хи,
Ха = х(кЬ), t є [kh, (А +1)^. (14)
Решение системы (13) на промежутке [М, ^ + + 1)h] имеет вид
t
х(г) = еА( ^щхк + еА J е-Ах (ВСхк + ф(х, Схк ))dт,
1гк
t Є [^, (к + 1)^.
(15)
Сделаем в (15) замену независимой переменной t на 9 по формуле t - Ш = 9. Тогда при 9, принадлежащей промежутку [0, Щ, получим
х(9 + М) = eAQXk + е
А(9+М) .
х Je-AІX+щ(BCxk + Ф(х, Cxk))dx, 9 Є [0, Щ. (16)
Равенство (16) можно записать в виде
х(9 + Щ = xk + AeAЧxk + еА(%+ш) х е
х ^ e-A(x+kh)(BCxk + ф(x,Cxk ))dx,
0
е є [0, щ, і є [0, е].
Подставив (17) в (14), получим
z(9 + кС) = х(9 + кС) — х(кС) = АеА^9хк +
9
+ еА((е+кС) J е—А(т+м) (ВСхк + ф(х, Схк ))dx, 0
е є [0, щ, і є [0, е].
(17)
(18)
Из (18) следует
|^(9 + М)||<| |А|
А
9
+
А9II ГІІ -Ах
Є II '|Г
хЛг +
БСхк + ф(х, Схк)|| dx,
о
9 є [о, г], ^ є [о, г]. Из (2), (8) следует, что в области 11х11 < с2
справедлива оценка
(19)
(20)
||ф(х, Cxk)|| < К\X^I.
(21)
В (20) С2 > 0 — произвольная константа. Используя (21), неравенство (19) можно записать в более компактном виде
г(^|| < к h| |х к\ | + к2 h| |х к\\.
(22)
В (22) константы Кь К2 не зависят от промежутка [Ш, (к + 1)h]. С другой стороны, согласно (14):
||х *|| < ||х(#)|| + |^(#)||, t Е [kh,(k + 1)h]. (23)
Неравенства (22), (23) дают оценку
^ )||, t Е [кН,(к + 1)Н]. (24)
I — (К1 + К2 ) ^
Система (9), замкнутая стабилизирующим управлением (10), имеет вид
X = (А + ВС)х. (25)
В силу экспоненциальной устойчивости системы (25) существует положительно определенная квадратичная форма У^) [10] такая, что
dF ,, ,,2
dt
(26)
(25)
Производную У^) в силу системы (13) можно записать в виде
ау
dt
= —1| х| |2 — (gradУ, BCz) +
(13)
+ (gradУ, ф(х, Сх(Ш)) —
— ф(х, Сх )) + (gradУ, ф(х, Сх)).
(27)
В области (20)справедливы оценки
|^гаа^| < Кз ||Х|, (28)
||ф(х, Сх )) — ф(х, Сх)|| < К41|x(kh) — х(#)||. (29)
Используя (27)-(29), получим оценку
^У
dt
(13)
<—1|х||2 + К51|х|||Н1 + К6 ІІХІНІ+ К71|х||3. (30)
В (30) К і = 3, ..., 7 — константы, зависящие от области (20).
Из (24), (30) следует
^У_
dt
< - хГ +
(13)
+
1 — (К1 + К2)Н 1 —(К! + К2)Н
IX |2 +К71X13. (31)
Выберем константу С3: 0 < С3 < С2 и h0 > 0 так, чтобы было выполнено неравенство
К5 (К1 + К2) ho + Ке (К1 + К2) ^ 1 — (К + К2 ) ho 1 — (К + К2) ho
+ К7сз <1. (32)
Тогда для любого Ы 0 < h < h0 оценка (31) в области
х < С.
з
примет вид
6У_
dt
<—у х
(13)
у > 0.
(33)
(34)
Производная функции У^) в силу исходной системы (1) имеет вид
дУ_
dt
(1)
дУ
dt
+ ^гадУ, фі(х)). (35)
(13)
Оценивая правую часть (35) в области (33), с учетом (34) получим
вУ
dt
<—у| |х| |2 + К7| |х| |3.
(36)
(1)
Выберем константу С4: 0 < С4 < С3 так, чтобы К7С4 < у. (37)
Тогда в области
||х| < С4 (38)
справедливо неравенство
6У_
dt
<—Ї1 НІ , У1 > 0.
(39)
(1)
С другой стороны, согласно [2], функция У^) является квадратичной формой, которая находится после решения уравнения Ляпунова, сформированного на базе (26), и для нее справедлива оценка
а11XII2 < V(х) < а,21|Х|2.
(40)
Константы а1, а2 определяются матрицей квадратичной формы УЭД. Из неравенств (39) и (40) получим
dln V У1
dt _ а2
(41)
Интегрируя (41) на промежутке [0, Ц, получим
-Л,
V(х) < V(х1)е а2 . (42)
Окончательно условия (40) и (42) дают оценку
||х(£, 0, Х1 )|| < —Ц|х11|е
0^1
t є [0, ¥). (43)
2
= — х
Пусть
х1 <-
С4а
4^-1.
Ы| <
а2
С1а1
(44)
(45)
*-2
Выберем
I С4а1 С1 а1
ч 4 1,
Са<-,
Тогда из оценок (43)-(45) следует, что решение системы (7) не покидает области (38) и удовлетворяет ее граничным условиям (6), а соответствующее ему управление (12) удовлетворяет ограничению (5). Теорема доказана.
Описание алгоритма решения задачи (1), (6)
1. Решение задачи непрерывной стабилизации системы (9).
2. По заданной константе С2 находим величину К.
3. Используя матрицы А и В, матрицу коэффициентов усиления стабилизирующего управления, полученного в п. 1, находим константы К1, К2.
4. В области (20) находим константы К3, К4, К5, К6, К7.
5. Выбираем константы С3 и ^, удовлетворяющие неравенству (32).
6. По выбранным ^,, С3 находим константу у.
7. Из условия (37) находим константу С4.
8. По выбранному С4 находим константу у1.
9. Решение уравнения Ляпунова дает матрицу квадратичной формы У(х). Далее находим минимальное и максимальное собственные числа этой матрицы, которые соответствуют числам а1 и а2.
10. Используя полученные в предыдущих процедурах константы а1, а2, С3 и Ю, из условий (45) находим допустимые векторы х1 начальных условий.
11. Замыкаем исходную систему управлением (12) с шагом дискретности 0 < h < ^ и интегрируем ее с начальным условием х(0) = х1, удовлетворяющим неравенствам (44)-(45), на достаточно большом промежутке времени. В результате интегрирования получаем искомую управляющую функцию и(М) и соответствующую ей функцию изменения фазовых координат х@).
Замечание. Нетрудно видеть, что предложенный в работе алгоритм можно использовать в случае, когда условие (6) имеет вид
‘(0) = хо, ||х(?)| < ео,
(46)
где е0 > 0 — произвольное число; $ — заранее неизвестный момент времени.
Задача 2.
Найти функции х@), и(М), удовлетворяющие системе (1) и условиям
(47)
х(0) = хо, ||х(£)|| < ео,
где е0 > 0 — произвольное число; $ — заранее неизвестный момент времени. Нетрудно видеть, что решение задачи 1 на промежутке [0, I ] дает решение задачи 2 при $, удовлетворяющем условию
71
2а9
а1
< ео.
(48)
Пример
Рассмотрим задачу перевода гироскопической системы в окрестность положения равновесия.
Уравнения Лагранжа движения рассматриваемой системы имеют вид [11]
,ст1
. ёХ 1
41 + Ю“Г42--------2 41 + у1 4 4) =-----2 1
С2 ^2 та2
а? . ёХ / -ч ^
42 - ю 241-------242 + У2 4 4) = о
а2 а2
(49)
Здесь величины а1 и а2 имеют смысл соответствующих радиусов инерции; X — расстояние от начала координат до центра тяжести маховика; С1 и q2 — углы поворота соответственно наружной и внутренней рамок гироскопа; ю — угловая скорость вращения маховика; и(Ь) — управляющий момент, приложенный к наружной рамке. Функции у^, q) и y2(q, с) обозначают члены, измерение которых по q1, q2, с1 и с2 выше первого.
Управление u(t), обеспечивающее стабилизацию системы линейного приближения
.. + а2 . ёХ 1
41 + ю— 4 2-------------------------------2 41 =---------------;
СТ1 . ёХ
42 - ю 2 41--------------242 = о
а2
(50)
а2
соответствующей системе (49), имеет вид
т 1о •
и($) =-----------4 г
С
а2Ь- Ь2 -35Ь - 24
Ь2 - 24
Ьс
-41
аЬс 5о + ЮЬ
-42-
-42,
(51)
где
1
а = ю—1, Ь = а2
2
та2
Замыкаем исходную нелинейную систему (49) полученным управлением вида (51) с шагом дис-
а
2
х
1
кретности h и интегрируем ее в соответствии с п. 11 описанного выше алгоритма. В результате интегрирования получаем соответствующие решению задачи 2 искомые функции изменения углов поворота наружной и внутренней рамок, а также функцию управляющего момента u(t), приложенного к наружной рамке.
Численное моделирование
Для численного решения задачи был разработан пакет программ на языке C++, а также использовался пакет Wolfram Mathematica 6.0. Исходная система имеет вид
2
•• і • gX 1П—7 3,.ч 1
?1 + 2---------2 (1 +10 (1(t) =-----------2 і
- 2 - 2 m/з 2
2
- 2 • gX _ , л Л—7 з
. (52)
(і2 — ®~2<11---2(2 +10 (t) = 0
-2
-2
Численное моделирование проводилось при следующих значениях физических параметров системы: а1 = 6 м, а2 = 8 м, X = 0,1 м, ю = 600п с-1, т = 2 кг, g = 9,81 м/с2. В процессе численного моделирования решалась задача Коши для системы (49) с начальными данными с1(0) = 10-4, с2(0) = = 10-4, ^1(0) = 0, с2(0) = 0, замкнутой управлением (51) с шагом дискретности h = 7,8125 • 10-5 на промежутке [0, Т], Т = 120 с. Для сравнения при-
10 t
0 80 100 120 t
■ Изменение q2 в случае непрерывного (а) и дискретного (б) управления
ведены графики изменения во времени угла поворота внутренней рамки с2 при непрерывном (рисунок, а) и дискретном (рисунок, б) управлениях. Из рисунков видно, что в случае дискретности необходимо гораздо большее время для стабилизации процесса, и осцилляция выражена в гораздо большей степени.
Заключение
Результаты численного моделирования задачи перевода гироскопической системы показывают, что полученный в работе алгоритм может быть использован для решения различных практических задач управления движением технических объектов, описываемых сложными нелинейными системами дифференциальных уравнений.
Литература
1. Nguen Than Bang. Numerical solution of the d-con-trol problem for nonlinear systems// Autom. and tele-mech. 1983. Vol. 28. N 3. P. 131-143.
2. Лапин С. В. Кусочно-постоянная стабилизация систем, линейных относительно управления // Автоматика и телемеханика. 1992. № 6. С. 37-45.
3. Zezza P. On reachable set for linear systems with piecewise constant controls // Bol. Unione mat. Ital. 1986. Vol. 5. N 1. P. 127-137.
4. Антончик В. С. Методы стабилизации программных движений. — СПб: Изд-во СПбГУ, 1998. — 208 с.
5. Fury M., Nistri P., Pera M. P., Zezza P. L. Linear controllability by piecewise constant control with assigned switching times // J. Optimize Theory and Apl. 1985. Vol. 45. N 2. P. 219-229.
6. Allon Amit, Segev Reuven. Driving a linear constant system by a piecewise constant control // Int. Contr. 1988. Vol. 47. N 3. P. 815-825.
7. Кухта К. Я. О решении нелинейной, нестационарной непрерывно-дискретной граничной задачи в теории управления // Автоматика и телемеханика. 1991. № 6. С. 78-83.
8. Квитко А. Н. Об одном методе решения граничной задачи для нелинейной управляемой системы в классе дискретных управлений // Дифференциальные уравнения. 2008. Т. 44. № 11. С. 1499-1509.
9. Каллман Р., Фалб П., Арбиб М. Очерки по математической теории систем / Пер. с англ. под ред. Э. Л. На-пельбаума. — М.: Мир, 1971. — 399 с.
10. Зубов В. И. Лекции по теории управления. — М.: Наука, 1975. — 495 с.
11. Красовский Н. Н. Теория управления движением. — М.: Наука, 1968. — 475 с.
йи^ 29