Научная статья на тему 'Метод “замораживания” в синтезе терминального управления многомерной системой'

Метод “замораживания” в синтезе терминального управления многомерной системой Текст научной статьи по специальности «Математика»

CC BY
103
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Дубовик Сергей Андреевич

Рассматривается задача приведения с векторным конечным условием для многомерного объекта при действии возмущений. Предлагается приближённый способ последовательного приведения, основанный на процедуре “замораживания” части коэффициентов регулятора, гарантирующей устойчивость и необходимую терминальную точность замкнутой системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The method of “freezing” in a synthesis of the multivariable terminal control

For multivariable of linear object the task of terminal management with a vector final condition is considered. For a case of action perturbation the method of consecutive reduction based on some procedure of “freezing” of factors of a feedback is offered. The conditions are received, at which the stability of the closed system and required accuracy is guaranteed. The procedure of synthesis is illustrated by an example.

Текст научной работы на тему «Метод “замораживания” в синтезе терминального управления многомерной системой»

неоднородных марковских процессов на случай полумарковских процессов.

Литература: 1. Королюк В.С. Стохастичні моделі систем. К.: Либідь, 1993. 135 с. 2. Герасин С.Н. Проблемы стабилизации распределений неоднородных марковских систем. Харьков. Изд-во ХТУРЭ, 1999. 212 с. 3. Герасин С.Н. Условия сходимости к предельному распределению в неоднородных цепях Маркова за конечное время // Вісник Харківського національного університету. 2000. №456. С.256-259. 4. Герасин С.Н, Дикаре в В.А., ЧислинН.И. Существование предельных вероятностей для конечных процессов Маркова с убываю-

УДК 62-50

МЕТОД “ЗАМОРАЖИВАНИЯ”

В СИНТЕЗЕ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ МНОГОМЕРНОЙ СИСТЕМОЙ

ДУБОВИК С.А.__________________________

Рассматривается задача приведения с векторным конечным условием для многомерного объекта при действии возмущений. Предлагается приближённый способ последовательного приведения, основанный на процедуре “замораживания” части коэффициентов регулятора, гарантирующей устойчивость и необходимую терминальную точность замкнутой системы.

Типичной для терминального управления является задача приведения в ноль вектора выхода линейной многомерной системы за конечное время. Известное её решение в форме синтеза имеет в конечный

момент tf особенности в коэффициентах обратной связи [1,2]. Это не позволяет реализовать решение для управления вплоть до tf включительно —

всегда существует интервал (tj, tf), где начинают проявляться некоторые ограничения, затрудняющие дальнейшее увеличение коэффициентов терминального регулятора. Эта проблема реализации терминального управления хорошо известна, но она не является единственной, особенно в многомерных задачах. В [1] показано, что в условиях возмущений задача приведения удовлетворительно разрешима только для идеально управляемых систем, что в обозначениях [1] эквивалентно равенству матриц при управлении и шуме: b = g . В задачах для многоканальных процессов возникают схемы различной управляемости. Так, при управлении продольным движением летательного аппарата с вертикальной тягой (ЛАВТ), совершающего посадку на палубу качающегося плавсредства, можно выделить два контура приведения — по дальности и по высоте. Вследствие качки канал высоты сильно зашумлен и не идеально управляем. В таких условиях представляется рациональной следующая схема последовательного управления. Сначала ЛАВТ приводится по дальности в заданную окрестность при одновременной стабилизации в канале высоты, а затем решается задача приведения по высоте, т.е.

щими к нулю временными промежутками перехода / / Доповіді НАН України. 1998. №7. С.15-19.

Поступила в редколлегию 11.06.2002

Рецензент: д-р техн. наук, проф. Шабанов-Кушнаренко С.Ю.

Герасин Сергей Николаевич, канд. техн. наук, доцент кафедры высшей математики ХНУРЭ. Научные интересы: теория вероятностей и ее приложения, теория процессов Маркова. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел: (0572)40-93-72 (раб.), (057)772-12-38 (дом.), e-mail: sgerasin@mail.ru.

обеспечивается надлежащий контакт ЛАВТ с посадочной площадкой по вертикальным относительным координате и скорости. Успех применения подобной процедуры зависит от возможности перейти в канале дальности от терминального управления к стабилизации, т.е. “заморозить” управление. Эта ситуация является типичной при управлении многомерными марковскими процессами, в состав управляющих параметров которых входит момент остановки. В общей стохастической постановке такие задачи приводят к теории диффузионных процессов, далёкой от практически приемлемых решений. Предлагаемый метод “замораживания” даёт простой способ отделения задачи выбора момента остановки от процедуры синтеза управлений.

Рассмотрим на конечном промежутке [0, tf ] линейную систему для n-вектора состояния T

X = (xbx2,---,xn) :

dX/dt = AX + bU, X(0) = X0.

Здесь U - скалярное управление; A и b - матрица и вектор (соответственно) с постоянными элементами, составляющие управляемую пару. Управление будем выбирать таким образом, чтобы в момент t = tf обеспечить нулевые значения координаты xj (t) и k её производных (k < n). Переходя к каноническим переменным для состояния и управления [1,3], можно конкретизировать указанную задачу:

на движениях системы

dx/dt = Jnx + bnu, x(0) = x0, (1)

T

для вектора x = (xi,x2,---,xn) и выхода (везде далее нулями обозначены нулевые матрицы подходящих размеров)

II <4-1 'х и и y(tfX (2)

C - (ek1,ek2 >‘”ekk ,

где Jn =( 0,enben2> •” e n(n—1) )> bn =en> eni -

n - вектор, і-й элемент которого 1, а остальные -нули, е n = е nn ,

минимизировать функционал (ц > 0)

62

РИ, 2002, № 4

p^=—f + Ju2(t)dt, (3)

0

при p ^ 0.

Задача минимизации (3) при ограничениях (1), (2) и р > 0 имеет единственное решение, которое можно записать следующим образом:

u(t) = u0pt (t) = D(t)x(t), D(t) = - b^Pp,

здесь положительно определённая n x n - матрица

Рц удовлетворяет нелинейному уравнению

dPp/dt = -ppJn - jTp^+ VnbTPn,

Pp (tf) = CTC/P. (4)

Это решение можно использовать в задаче приведения (1)-(3), если устремить параметр р к нулю. При этом для любых t, tj, tj < tf, t є [0,tj], существует предел

P0(t) = KoJ(t) = HrnP, (t) (5)

и для t є [0,tj] имеем управление, решающее задачу (1)-(3):

U0(t) = -bTP0(t)x(t) = -bj^Ko1 (t)x(t). (6)

В указанном промежутке матрица K0 положительно определена, а на всём [0,tf] удовлетворяет линейному уравнению

dK0 /dt = JnK0 + K0JT -bnbT , K0(tf) = 0 . (7)

Особенность предельного терминального регулятора (ПТР) (5), (6) состоит в том, что его нестационарные коэффициенты оказываются дробно-рациональными функциями оставшегося времени

т = tf -1. В рассматриваемом случае имеем

P0(t) = W0T(t)C^CM0(t)CT )"1CW0(t), (8)

где W0(t) = {W0i,W02,-,W0n},

m

W0m(t) = 1 e„i

i-1

(tf-t)m 1 (m-i)!

m = 1,2,

M0(t) = {Mij(t)j,

,n,

Mij(t)

(tf ~t)2n 1J+1 ij = 12

(2n-i-J+1)(n-i)!(n-J)!’ ^

,n.

Применение управления (6) в окрестности момента tf затруднено неограниченным ростом коэффициентов обратной связи, т.е. наличием особенности в коэффициентах замкнутой системы [2,4]. Кроме

того, в реальных условиях момент окончания tf обычно известен лишь приближённо и в процессе управления может уточняться. Указанные и подобные им причины заставляют тем или иным образом

отклоняться от предельного решения (8) в некоторой малой окрестности конечного момента. В [4] приводятся такого рода способы устранения особенности в коэффициентах обратной связи. Некоторым обобщением их может служить метод “замораживания”, состоящий в том, что при t > t1 нестационарные коэффициенты в (6) перестают меняться во времени: если матричная функция

времени Pjx (t) на отрезке t є [0,tf ] удовлетворяет дифференциальному уравнению (4), то значение этой функции P|x1 в фиксированный момент

t1, t1 < tf, является решением алгебраического уравнения:

0 _ Vn JnP(x1 + P|x1bnbnP|x1 Q1,

где по построению Q1 = (dPp (t)/dt)t. Если это фиксированное значение P1 используется в (6) для формирования управления при t > tb то качество такого управления будет определяться свойствами матрицы Q1. А именно, если она оказывается неотрицательно-определённой и имеет квадратный корень S1 (т.е. Q1 = sT S1), составляющий наблюдаемую пару с J0, то очевидным образом гарантируется существование оптимального управления при t > t1 в смысле критерия [3]:

J (xT(t)Q1x(t) + u2(t)) dt. t1

Одновременно обеспечивается и асимптотическая устойчивость замкнутой системы. Аналогичные построения справедливы и в предельном случае

р = 0 , т.е. для матрицы P0 .

То, что указанные свойства матрицы Q1 далеко не всегда выполняются, показывает следующий пример: для случая n = 2, k = 1, т.е. системы (1) второго порядка со скалярным выходом y = x1 будем иметь:

tf -1

W01(t) = e21, W02 (t) = e21—1!— + e22,

C = (1,0), CM0(t)CT = (tf - t)3/3,

следовательно:

P0(t) = 3

1

tf -1

(1, tf - t)/(tf - tf =

= 3

( (tf -1)“3

V I------,_2

(tf -t)

-2 A

(tf - tr (tf -1)-1 у (9)

Подставляя это в правую часть уравнения (4) вместо PM (t), получаем:

Q1

' 9(tf -11)-4 6(tf -11)-3"

v 6(tf -11)-3 3(tf -11)-2,

РИ, 2002, № 4

63

Диагональные элементы этой матрицы положительны, но её детерминант

I Ql I = (tf - ti)“6 (27 - 36) = -9(tf - ЙГ6

— отрицателен, поэтому Qi не является неотрицательно-определённой. Из представления (8) следует результат, который мы приведём без доказательства.

Теорема 1. При k = n матрица Qi является неотрицательно-определённой ранга 1, причём Qi = CTCi, где cT - n - вектор, определяемый формулой

С =®o(tf - ti)Po(ti)

и составляющий наблюдаемую пару с матрицей Jn .

В соответствии с этой теоремой только в случае полного приведения гарантируется устойчивость системы с “замороженным” регулятором. Разумеется, в многомерных задачах это условие является слишком обременительным. Ситуация существенно улучшается, если перейти к сингулярно-возмущённому описанию многомерной системы, т.е. содержащему малый параметр при производных.

Выделяя в исходных уравнениях соответствующий параметр ц > 0, преобразуем их к канонической форме сингулярных возмущений [1] (волна над символом обозначает зависимость от малого параметра):

dX/dt = JnX + bnu, X(0) = x0, X = col(Z,§), (10)

~ = n

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Z є Rm

J

m

0

151 Jr/ bj

Rr,

bn =[e0rJ . E = eme°i, y(t) = CX(t) = CzZ(t),

yf = y(tf), C = (С z,0), (11)

Cz = (e kb e k2 г' e kk >0,#' x 0), k < m, m + r = n, где использованы те же обозначения, что и в (1), (2).

В соответствии с детерминированным вариантом теоремы 2 из [1] (где надо положить нулём возмущение: v = 0 ) решение задачи (10)-(12)

u(t) = ~(t) = p-iD(t)X(t) (13)

представляет собой асимптотическую композицию двух регуляторов — m -мерного ПТР и r -мерного стационарного. Это означает для любого ti = tf - Д из интервала (0, tf) существование равномерного по t, 0 < t < ti, предела

D(t) = (dz,d?) = 1™^Д), (14)

и гурвицевость (а значит, и невырожденность) матрицы A ^ = Jr + er d^, где d^ = -bT P^,

dz = dz (t) = —b° Pz(t), bZ = _EA er ; b ^ = e r ;

а Pz(t) и P§ есть (соответственно) m x m - матрица функций времени и r х r - матрица констант, удовлетворяющие уравнениям:

Pz(t) = W^(t)F“i(t)Wz(t), dWz(t)/dt = - Wz(t)Jm, Wz(tf) = С z,

dF(t)/dt = - WZ(t)bZbT Wz(t), F(tf) = 0 ,

0 = -Pj;Jr - J?Pj;+ P§b? boP^-Q? . (15)

Построим теперь терминальный регулятор, аппроксимирующий и оптимальный для задачи (10)-(12) в указанном смысле на промежутке [0, ti], а на полуинтервале (ti, tf ] воспользуемся следующей процедурой “замораживания” в обратной связи по “медленным” переменным:

dz(t) = dz = dz(ti) = _bZPz(ti). (16)

Полученную композицию из m -мерного ПТР, финального m -мерного стационарного регулятора по “медленным” компонентам и r -мерного стационарного регулятора по “быстрым” компонентам обозначим Di(t):

В уравнении (10) движения разделены на “медленные”, представленные m - вектором Z, и “быстрые” — r - вектор причём терминальные условия накладываются только на “медленные” компоненты. На входных и выходных координатах системы (10), (11) определим критерий следующего вида [1,3]:

+ р2 1 (XTQX + u2(t))dt ^ min, (12)

n 0 u

в котором матрица Q =

Qz Q*

и её m х m -

vQ* Q/M-

и r x r — блоки Qz , Q§ (соответственно) — все

T

неотрицательно-определённые, причём Q ^ = с ^ c ^ и для квадратного корня с^ выполнено условие:

а) пара (Jr, c^) - наблюдаема.

Di(t) - (diz(Н d^X diz(t)

dz(t), t < ti,

dz(tiX ti ^ t ^ tf.

Теорема 2. Пусть для задачи (10)-(12) выполнено условие а) и k = m, т.е. требуется привести в ноль все “медленные” компоненты вектора состояния. Тогда существует ц* > 0 такое, что при любом ц из интервала 0 < ц < ц* обратная связь Di(t) стабилизирует систему при t > ti.

Для доказательства следует воспользоваться линейным вариантом теоремы Климушева-Красовского [5], условия которой оказываются здесь выполненными в силу теоремы 1 и известных свойств инвариантных во времени регуляторов, оптимальных в смысле квадратического критерия [3].

Пример. Пусть первый этап некоторой многомерной задачи терминального управления состоит в приближённом приведении в ноль координаты и скорости системы (10), (11) третьего порядка с

64

РИ, 2002, № 4

двумя “медленными” компонентами Zj, Z2 и одной “быстрой” £, которая в данном случае является ускорением. Учитывая интегральные затраты на ускорение, сформируем критерий следующего вида:

Рд = f1 f 2 +Р2u2(t))dt ,

0

Z(t ) f z1(tf) I ~

где yf = Z(tf) = I I, т.е. блоки матрицы Q в

z2(tf ) )

(12) все нулевые, за исключением Q§ = 1. Условия теоремы 2 здесь выполнены. Для матрицы Dj(t) при t > tj, tj = tf - Д будем иметь:

Dj(t) = Dj = (diz(ti),d4),

здесь djz = djz(tj) = -bZ Pz(tj), d§ = -bj P = ~P.

Уравнение для P§ в (15) в данном случае тривиально: Р| -1 = 0 , откуда следует d^ = -1. Далее имеем

А Jr + er d^-~1, bz =-EA^1er = Є2 .

dWZ(t)/dt--Wz(t)J2, Wz(tf) -Cz -

10

01

откуда следует (см. также [ 1], следствие из теоремы 2), что Wz(t) = 1

F1(t) =

1z

tf -11 и

1}

-1)3/3 (tf -1)2 /2'

-1)2/2 tf -t

-t)-3 - 6(tf -1)-2N

-t)-2 4(tf -1)-1,

d1Z (t1) получим

-1

d1Z - _e2

10 Д 1

12Д"

-3

- 6Д

-2 А

- 6Д

-2

4Д"

-1

1 Д 01

= - (А, 1)

" 12Д_3 ч- 6Д- 2

-2 )

- 2Д

-1

(6 Д_2,4 Д-1)

Если теперь использовать это субоптимальное управление в (13), то для замкнутой таким образом системы будем иметь при t > t1 характеристическое уравнение P(s) = s + a2s + a1s + a0 = 0 с положительными коэффициентами:

—2 —1

a0 = 6Д / р, a1 = 4Д / р, a2 = 1/р.

Теорема 2 утверждает гурвицевость полинома P(s) при достаточно малом р < р*. В данном случае можно определить р*. Действительно, в соответствии с критерием Рауса-Гурвица для асимптотической устойчивости необходимо и достаточно выполнение неравенства для коэффициентов P(s) a1a2 > a0, что означает здесь: 1.5 р/ Д< 1, т.е. р* = Д/1.5.

Литература: 1. Дубовик С.А. Композиционный синтез терминальных регуляторов для систем с разделением движений // Радиоэлектроника и информатика. 1998. №3. С. 48-53. 2. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. М.: Мир. 1972. 521с. 3. Смирнов Е.Я. Некоторые задачи математической теории управления. Л.: Изд-во Ленингр. ун-та, 1981. 200с. 4. Батенко А.П. Управление конечным состоянием движущихся объектов. М.: Сов. радио, 1977. 256с. 5. Климушев А.И, Красовский Н.Н. Равномерная асимптотическая устойчивость систем дифференциальных уравнений с малым параметром при производных // ПММ. 1961. Т.25, № 4. С.680-690.

Поступила в редколлегию 12.06.2002

Рецензент: д-р техн. наук Гайский В.А.

Дубовик Сергей Андреевич, канд. техн. наук, старший научный сотрудник, доцент кафедры технической кибернетики Севастопольского национального технического университета. Научные интересы: асимптотические методы в оптимальном управлении, математическое моделирование, управление движением. Адрес: Украина, 99053, Севастополь, Студгородок, Сев-НТУ, тел. 23-51-30.

УДК 007.51:51+681.51

МЕТОДИКА ІНФОРМАЦІЙНОЇ ОЦІНКИ ДОЦІЛЬНОЇ СТРУКТУРИ ОРГАНІВ УПРАВЛІННЯ ВІДКРИТИХ СИСТЕМ КЕРУВАННЯ

ОРЛОВ М.М., ЯКОБСОН є.в.

На підставі оцінки структури відкритої системи керування будь-якого призначення і розподілення потоків інформації в контурі керування розглядаються підходи щодо оцінки ступеня інформативності певної кількості параметрів, які визначають стан завдання, що досліджується органами управління в умовах обмеженого часового ресурсу. Визначається достатність складу органу управління шляхом автоматичної класифікації за показником схожості між ними.

Як відомо, будь-яка автоматизована система керування (АСК) процесами — людино-машинна система, в межах якої забезпечується автоматизований збір, оброблення і відображення інформації, необхідної для оптимізації керування цими процесами з метою найбільшої їх ефективності. Складовими частинами такої системи є: органи управління (ОУ), пункти керування, підсистема зв’язку і комплекс засобів автоматизації процесів керування. При рішенні певною організаційною структурою конкретних завдань S перед системою керування ставиться відповідна мета, яка потребує конкретних ресурсів. У цьому випадку ресурси можуть характеризуватися: часовими показниками Rt , людськими показниками R ч , матеріальними затратами R м . Кількісна оцінка необхідних ресурсів R ч впливає на визначення структури і складу ОУ і буде змінюватись залежно від характеру і складності завдань S •

РИ, 2002, № 4

65

i Надоели баннеры? Вы всегда можете отключить рекламу.