Научная статья на тему 'Минимаксное управление линейным объектом при внешнем возмущении и неопределенных начальных условиях на конечном временном интервале'

Минимаксное управление линейным объектом при внешнем возмущении и неопределенных начальных условиях на конечном временном интервале Текст научной статьи по специальности «Математика»

CC BY
234
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / МИНИМАКСНЫЙ ПОДХОД / КОНЕЧНЫЙ ВРЕМЕННОЙ ИНТЕРВАЛ / ВНЕШНЕЕ ВОЗМУЩЕНИЕ / НЕОПРЕДЕЛЕННЫЕ НАЧАЛЬНЫЕ УСЛОВИЯ

Аннотация научной статьи по математике, автор научной работы — Бирюков Руслан Сергеевич

Для линейного объекта при внешнем возмущении и неопределенных начальных условиях определяется уровень гашения возмущений как наибольшее значение -нормы целевого выхода, при условии, что -норма внешнего возмущения и выбранная положительно определенная квадратичная форма начального состояния ограничены некоторыми постоянными. С использованием вариационного подхода показано, что построение минимаксных регуляторов, обеспечивающих минимальный уровень гашения, сводится к решению нелинейной краевой задачи для матричного дифференциального уравнения Риккати.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бирюков Руслан Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MINIMAX CONTROL OF A LINEAR OBJECT UNDER EXTERNAL DISTURBANCE AND UNKNOWN INITIAL CONDITIONS ON A FINITE TIME HORIZON

The suppression level of perturbations for a linear object with an external disturbance and unknown initial conditions is determined as the greatest value of the L 2 -norm of the objective output when the L 2 -norm of the external disturbance and some positive definite quadratic form of the initial state are bounded by some constants. Using a variational approach, it is shown that the construction of minimax controllers ensuring a minimum level of perturbation suppression is reduced to the solution of a nonlinear boundary value problem for a matrix Riccati differential equation.

Текст научной работы на тему «Минимаксное управление линейным объектом при внешнем возмущении и неопределенных начальных условиях на конечном временном интервале»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2013, № 3 (1), с. 206-211

УДК 517.977

МИНИМАКСНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПРИ ВНЕШНЕМ ВОЗМУЩЕНИИ И НЕОПРЕДЕЛЕННЫХ НАЧАЛЬНЫХ УСЛОВИЯХ НА КОНЕЧНОМ ВРЕМЕННОМ ИНТЕРВАЛЕ

© 2013 г. Р.С. Бирюков

Нижегородский госуниверситет им. Н.И. Лобачевского

ruslan.biryukov@gmail. com

Поступила в редакцию 12.03.2013

Для линейного объекта при внешнем возмущении и неопределенных начальных условиях определяется уровень гашения возмущений как наибольшее значение Ь2 -нормы целевого выхода, при условии, что Ь2 -норма внешнего возмущения и выбранная положительно определенная квадратичная форма начального состояния ограничены некоторыми постоянными. С использованием вариационного подхода показано, что построение минимаксных регуляторов, обеспечивающих минимальный уровень гашения, сводится к решению нелинейной краевой задачи для матричного дифференциального уравнения Риккати.

Ключевые слова: оптимальное управление, минимаксный подход, конечный временной интервал, внешнее возмущение, неопределенные начальные условия.

Введение

При разработке стратегий управления объектом в случае, когда ни начальное состояние, ни внешнее возмущение точно неизвестны, разумно основываться на принципе гарантированного результата, когда о качестве управления судят по наихудшему возможному случаю.

Если на объект не действует внешнее возмущение, то, следуя [1, 2], назовем уровнем гашения начальных возмущений максимально возможное отношение £2 -нормы его целевого выхода к евклидовой норме начального состояния. Закон управления, минимизирующий уровень гашения, называется у -оптимальным.

В случае когда начальное состояние объекта нулевое и на него действует внешнее возмущение, под уровнем гашения внешнего возмущения понимают наибольшее значение отношения Ь2 -нормы целевого выхода объекта и возмущения. Задача минимизации уровня гашения совпадает с классической задачей Нх -оптимального управления [3, 4].

Особый интерес представляет ситуация, когда объект находится в неизвестном начальном состоянии и на него действует внешнее возмущение. В этом случае в [5] в качестве уровня гашения рассматривалось наибольшее отношение Ь2 -нормы целевого выхода к квадратному корню от суммы квадрата Ь2 -нормы внешнего возмущения и заданной квадратичной формы начального

состояния. Подобный подход называется обобщенным HrJ3 -оптимальным управлением. С использованием вариационного подхода в [6] было показано, что вычисление оптимального уровня гашения сводится к решению нелинейной краевой задачи для некоторого дифференциального матричного уравнения Риккати, которая, в силу нелинейности, может быть решена аналитически лишь в вырожденных случаях.

В данной работе в качестве уровня гашения предлагается взять наибольшее значение L2 -нормы целевого выхода, при условии, что L -норма внешнего возмущения и выбранная положительно определенная квадратичная форма начального состояния ограничены некоторыми постоянными. В этом случае задача вычисления минимального уровня гашения также сводится к решению нелинейной краевой задачи для матричного дифференциального уравнения Риккати. Для решения данной задачи используется метод Ньютона.

Постановка задачи

Рассмотрим на отрезке [0, T] линейный управляемый объект

X = A(t )x + B (t )w + B (t )u, x(0)= x0, z = C(t)x + D(t)u, ( )

в котором x є R”x - состояние объекта, u є R”u

- управление, z є R"z - управляемый выход и

" е К"" — возмущение, А = А(?), В1 = В (?), В = В (0, ^ = С(?) и В = В(?) - заданные матричные функции соответствующих порядков. В дальнейшем для краткости мы будем опускать указание аргумента ?, если это не вызывает недоразумений. Также предположим, что

V? е[0,Т ] справедливо ВТ(?).В(?) > 0 и СТ(?)В(?) = 0 .

Относительно возмущения v(t) будем предполагать, что V е Ь2 [0,Т], т.е. справедливо неравенство

Т

^ | " |2 Л< +да, | " |2= "Т".

0

В качестве допустимых законов управления для системы (1) будем рассматривать такие и = и(?),

при которых для любых возмущений " е В [0,Т] существует и единственно решение системы (1). Данное множество управлений будем в дальнейшем обозначать через и . Очевидно, что с учетом сделанных предположений для любого решения системы (1) управляемый выход ^(?) также будет

принадлежать Ь2 [0,Т ].

Определим целевой функционал формулой

Т

'=}|г|

0

тогда задача минимаксного управления системой (1) заключается в определении такого * * управления u , начального возмущения х0 и

*

внешнего возмущения м> , что

где

J(и ,x0,w ) = тіп тах J(и,х0,w),

ыеП (х0,м)є1¥§

Щ := {(х, w) є ЯПх х В [0,Т]:

х0 Ях0 < 1.

і

|| М2 Л < 82}

ческой задаче Н -управления. С другой сторонні, как нетрудно видеть, если 8 ^ 0, то мы получаем задачу у -оптимального управления.

Решение задачи

о минимаксном управлении

Сформулируем и докажем основной результат.

Теорема. Задача (3) имеет решение тогда и только тогда, когда на интервале [0,і ] существует решение X(і) матричного дифференциального уравнения Риккати

X + Лт X + ХА + С ТС -

- XВ (БТБ) 1 В2Т - V-1 ВВ X = 0, (4)

X (Т) = 5,

параметр V удовлетворяет уравнению

Г Т

[ хтXB1BT^хЛИ = V282, Л 0

где х — решение системы:

х = {л - В (БтБ) 1 ВТX + v-lBfi1 X X

(5)

(6)

(3)

и ЯТ = Я > 0. При этом соответствующие начальное возмущение х0 будем называть

наихудшим начальным возмущением, внешнее

0

возмущение w - наихудшим возмущением, а

0

и - минимаксным управлением.

Заметим, что в случае П(Я) ^ да, где

через Хтіп(Я) обозначено минимальное

собственное число матрицы Я, справедливо х0 ^ 0, т.е. система в начальный момент времени находится в покое и на нее действует только внешнее возмущение w, поэтому задача минимаксного управления сводится к класси-

х(0)= х0.

В этом случае оптимальное значение

функционала J(u , х°, " ) = ц + у82 достигается при минимаксном законе управления

и*(?) = -(ВТ В)-1 ВТ X (?) х(?), (7)

наихудшем внешнем возмущении

"*(?) = у-1ВТ-Х (?)х(?) (8)

и наихудших начальных условиях

х* = ае, а-2 = еТ Ке, (9)

где е — единичный собственный вектор, соответствующий ц = ^^(К^Х (0)), т.е. максимальному собственному числу матрицы К ~1Х (0).

Доказательство. Сначала докажем необходимость, для этого предположим существование решения задачи (3) и воспользуемся вариационным методом на основе подхода Лагранжа. Составим вспомогательный функционал

Л(х, и, х0,") = хТ (Т )5х(Т) +

Т (Ю)

+ ц(1- х (0)Кх(0))+ 1Ь(х,х,и,")й?,

0

где лагранжиан Ь имеет вид

Ь(х, х,и,") = гТг - У"Т" +

+ 2Х (х — Лх—В^м — В2и),

(11)

при этом ц,уеК и А, = А,(?)еК"х - множители Лагранжа.

Условие стационарности по х записывается как

й

Лі

Ь- - 4 = 2ХТ - 2хТСТС + 2ХТЛ = 0

0

(13)

или

1 - СТСх + АТ1 = 0. (12)

Граничные условия на множители Лагранжа

1(?) получаем из условий трансверсальности на концах интервала:

1(0) = -цКх(0),

ЦТ) = -5х(Т).

Поскольку в лагранжиан (11) не входят производные и и ", то соответствующие условия стационарности

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—Ьи - Ьи =0 и —Ь" - Ь" =0

Л “ и й? " "

являются алгебраическими уравнениями, разрешая которые относительно и и " приходим к следующим соотношениям:

и* = (ВтВ)-1 В2Т1,

( ) 2 , (14)

= -V 1В1Т1.

Подставляя найденные значения в систему (1) и добавляя уравнение (12), приходим к системе для отыскания как состояния х , так и множителей Лагранжа 1:

(х = Ах + [В2 (ВтВ) 1В2Т - V^ВВТ 1

3^ = -АТ х + С ТС1,

х(?) "Ф„(?,Т) Ф12 (?, т ) 1 ' х(Т )■

_1(?)_ _Ф 21 (?, Т) Ф22 (?, Т)] 1(Т)_

'Ф„(Т, Т) Ф12Т ,Т)' = I.

Ф 21 (Т ,Т) Ф22 (Т,Т)_

подставляя в первое, получаем: 1(?) = -X (? )х(?),

где

X(?) = {Ф22 (?,Т)5 -Ф21 (?, Т)}> х{фц(?,Т) Ф12 (?, Т )5}-1.

(15)

с граничными условиями

х(0)= х0, 1(0) = -цКх0, 1(Т) = -5х(Т). (16) Существование решения полученной двухточечной краевой задачи следует из предположения о существовании решения задачи (3). Запишем решение системы (15) в терминах фундаментальной матрицы:

(17)

Тогда

1(?) = ф 21(?,Т) х(Т) + Ф 22 (?,Т )1(Т) = = {Ф21 (?,Т) -Ф22 (?,Т)5}х(Т), х(?) = Фц(?,Т) х(Т) + Ф,2(?,Т)1(Т) = = {Ф„(?, Т) Ф,2 (?, Т )5}х(Т).

Так как решение краевой задачи (15), (16) существует, то матрица Фп (?, Т) -Ф12 (?,Т)S обратима для всех ? е [0,Т], следовательно, выражая из второго соотношения х(Т) и

Покажем, что функция X(?) удовлетворяет матричному дифференциальному уравнению Риккати (4). Для этого продифференцируем соотношение (18) в силу системы (15)

- АТ1 + С ТСх = -^Тх -

- X[Ах + (В2 (ВТВ)-1 ВТ - V-1BTВ )1], подставим вместо 1 выражение (18) и упростим:

х Т( X + АТ X + AX + С ТС -

- X [в2 (Вт В)-1 ВТ-v-lBT ВX )х = 0.

Данное соотношение должно выполняться при всех х , следовательно,

X + АТ X + AX + С ТС -

- X {в2 (вт в)-1 в2т -V-1BT в /X = 0.

Дополним полученное уравнение начальным условием, для чего в соотношении (19) положим ? = Т , тогда:

X (Т) = {Ф 22(Т,Т)5-Ф 21 (Т ,Т )}х

> {Фц(Т,Т) Ф12(Т,Т)5}-1 = 5.

Далее, подставим ? = 0 в (18) и воспользуемся условиями (16), после чего получаем соотношение:

[X (0)-цК]х0 = 0,

откуда следует, что наихудшее начальное 0 ^ возмущение х0 = ае, где е - единичный

собственный вектор, соответствующий собственному числу ц матрицы К ^(0). Поскольку по условию матрица К положи-тельно определена, как и решение X(?), то для ц справедливо условие положительности, т.е. ц >0. Множитель а находится из соотношения

Ц(1-(х*)Т Кх*) = 0,

0

подставляя в которое х0 = ае получаем

а-2 = еТ Ке, что совпадает с условием (9).

Уравнение (4) также необходимо дополнить условием для определения V . Из условия положительности получаем, что V >0, а из условия дополняющей нежесткости

(18)

(19)

= 0,

после подстановки выражения м> через X(?), получаем соотношение (5).

Теперь докажем достаточность, т.е. что решение, определяемое уравнением (4) и соотношениями (7), (8) и (9), действительно является минимаксом функционала (2). Для этого рассмотрим следующее выражение

0

V + г Т г -vwT",

где V = хТ Xx, а матрица X = X1 > 0

удовлетворяет уравнению (4), и покажем, что его можно представить в виде:

V + гТ г-V"1" = (и - и*)Т(ВТВ)(и - и*) -

Ж т- * (21)

- v(w - " ) (" - " ),

где и* и "* определяются формулами (7) и (9) соответственно. Действительно, вычислим от функции V производную в силу системы (1):

V + гт г -vwT " =

= х1 {X + АТ X + XЛ + С ТС}х +

(22)

+ "Т ВТ Xx + хТ XBT " - V "Т " +

+ и1 ВТ Xx + хТ XB2u + и1 Вт Ви и преобразуем выражение, стоящее в правой части равенства, выделяя полный квадрат по " :

"Т ВТ Xx + хТ XB1Г" - V"1" =

= -v(w - "*)Т (" - "*) + V-1 х1XBBT Xx

и по и :

и1 ВТ Xx + хТ XB2u + и1 Вт Ви = = (и - и*)Т(ВТВ)(и - и*) - хТXB2 (ВтВ)-1 ВТX*;

Подставляя полученные соотношения в (22) получаем:

V + гтг - vwт" = (и - и*)т(ВтВ)(и - и*) -

^(" - "*)Т(" - "*) + х7^ + Ат X + XЛ + (23)

+ СТС - X[В2 (ВтВ)-1 ВТ - v-1BlBІ X}х. Выражение, стоящее в фигурных скобках, в силу (4) обращается в ноль, следовательно, справедливость соотношения (21) доказана.

Далее, проинтегрируем выражение (21) по переменной ? на интервале от 0 до Т

Т Т

{V—? + {(гТ г - V"1")—? =

0 0

Т

= {(и - и*)Т (ВтВ)(и - и*)—? -

0

Т

- v{(w - "*)Т (" - "*)—?

0

и учтем, что

Т

{V—? = хТ(Т)ХхТ) - хТX(0)х0.

0

Таким образом, после преобразований получаем

Т

х1&х +{г1 гй? = v82 +ц + xT(X (0) -цК)х0 +

0

Т

+ {(и - и*)Т(В1 В)(и - и*)й? -

0

T

-v|(w - v*)T(w - w*)dt. (24)

0

Выражение, стоящее в левой части равенства (24), есть функционал (2), поэтому исходная задача (3) сводится к следующей:

min max [xq(X(0)-цЛ)x0 +

ueU (Xo,w)eW§

T

+ |(u -u*)T(DTD)(u -u*)dt-

0

T

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- v |(w - w*)T (w - w*)dt],

0

где v >0. Последняя же задача легко решается в силу того, что расщепляется на три подзадачи и подынтегральные выражения представляют собой полные квадраты:

max X0T(X(0) -ЦЛ)х0 +

Xq Rxq <1 T

+ min f(u - u*)T (DTD)(u -u*)dt-

ueU J 0

T

- v max I (w - w*)T (w - w*)dt.

||w||<5 J

0

Выше было показано, что ц есть одно из собственных чисел матрицы R lX(0), однако выражение

max X0T( X (0) -цЛ) X0

X0 Rxq <1

достигает своего максимального значения только тогда, когда Ц = ^max(R -X(0)), где через ^max(R X(0)) обозначено максимальное собственное число матрицы RlX(0). Таким

образом, получаем, что набор (u*, х*, w*), определяемый соотношениями (7), (8) и (9), действительно доставляет минимакс функционалу (2), при этом оптимальное значение равно

J(u ,х*,w*) = ц + v52.

Теорема доказана.

Заметим, что уравнение (4) совместно с условиями (5), (6) есть нелинейная краевая задача, решением которой являются как матричная функция X(t), так и параметр v . Для ее решения удобно упростить интегральное условие (5), воспользовавшись следующей хорошо известной леммой (см., например, [7]).

Лемма. Если W (t) является решением уравнения

W + PTW + WP + Q = 0, V(T) = 0,

а x(t) - решение системы X = Рх при t e[0,T],

то справедлива формула г т

xTQxdt = xT(0)W (0)х(0).

J 0

Чтобы применить лемму, положим Р = A - M2X + v-1MX и Q = XMxX, где Mj = BjBQ и M2 = B2 (DTD)-1 BQ, тогда левая часть соотношения (5) принимает вид:

г т

xTXRBQ Xxdt = (x*)TU (0)X

J 0

где функция и (?) является решением уравнения

и + [а - М.X + v-1M1X ]Г и +

+ и [л - М.X + v-1M1X ]+ XMlX = 0, (25) и (Т) = 0.

Далее, подставим полученное соотношение в

(5) и заменим выражение для х0 согласно (9). Тогда после упрощения получаем соотношение:

еТ [и (0)^282Ке = 0. (26)

Таким образом, исходная краевая задача (4) -

(6) после упрощений свелась к решению уравнений (4) и (25) совместно с условием (26). Ввиду нелинейности данных уравнений краевая задача может быть решена аналитически лишь в исключительных случаях, поэтому возникает необходимость использовать численные методы. В следующем параграфе описывается применение метода Ньютона для решения поставленной задачи.

Численное решение краевой задачи

Для решения краевой задачи (4), (25) и (26) рассмотрим соотношение (26) как нелинейное уравнение относительно V:

/ (V) = еТ [и(0)- v282Ке = 0, зависящее от решений (4) и (25). Тогда, используя метод Ньютона, решение этого уравнения можно найти с достаточно высокой скоростью с заданной точностью 8. В этом случае итерационная формула имеет вид:

v = v f (vk)= v eQ U(0)-v252R|

v ^ = v 7,--—---- v t. - -

f '(v*)

- и[м2^ ^-1М/ + v-^M^X]+

+ XMlY + ТМ^ = 0, П(Т) = 0, где Т = Xv,. Аналогично находится уравнение, которому удовлетворяет Т, для этого продифференцируем (4) по параметру V, после чего получаем:

Т + [Л - МX + v-1M1X ]Г Т +

+ Т[л -М.X + v-1M1X]- (29)

-V-2XMlX = 0, Т(Т) = 0.

Окончательно получаем, что на каждом шаге метода Ньютона по формуле (27) необходимо решать систему уравнений (4), (25), (28) и (29) с заданными начальными условиями. Приведем схему вычислений:

1. Задать допустимую абсолютную погрешность 8 >0 и начальное приближение у0 .

2. Положить V = v0.

3. Найти решение уравнений (4), (25), (28) и (29) с заданными начальными условиями.

4. Вычислить следующее приближение " по формуле (27).

5. Если | " - V |< 8 , то останавливаем вычисления и полагаем V0 =". В противном случае V = " и возвращаемся на шаг 3.

В качестве иллюстрации изложенного алгоритма рассмотрим систему первого порядка х = - х + и + ",

z =

X +

(0^ V 1У

,(27)

где V = и' - производная по параметру V

функции и . Для определения уравнения, которому удовлетворяет функция V, продифференцируем уравнение (25) по параметру V, тогда:

V + [А - М^ + v-1M1X ] V +

+ V [А - М^ + v-1M1X ]-- [М2Т - v-1M1Y + v-2M1XI1 и -

для которой 5 > 0 и К >0. Оптимальное значение функционала (2) равно

J (и*, х0‘, "*) = К(0)+v82, где X (?) и V находятся как решение задачи (4), (25) и (26):

ЗX +1 - 2 X - (1^-1) X2 =0^ (Т ) = 5,

Т - 2[1 + (1-v-1)X]т + X2 =0,

Т (Т ) = 0,Т(0)= V 282 К.

Для решения системы и нахождения V использовался метод Ньютона (27), а для численного интегрирования систем уравнений -метод Рунге - Кутты пятого порядка с модификацией Мерсона. Проверка эффективности работы алгоритма осуществлялась следующим образом. Начальное приближение у0 выбиралось как случайная величина, равномерно распределенная на отрезке [0.5,2.0]. Алгоритм стартовал 5000 раз, и каждый раз его работа завершалась успешно, т.е. находилось минимальное значение V = 0.66937 с принятой точностью 8 = 10-5. Число выполненных итераций в

u

этих случаях в процентном отношении отображено на гистограмме. Как видно из рисунка, в подавляющем числе случаев для завершения работы алгоритма потребовалось не более 28 -30 итераций.

Заключение

В данной статье рассмотрена задача синтеза минимаксного управления для линейных детерминированных систем при внешнем возмущении и неопределенных начальных условиях. Показано, что минимаксное управление может

быть выражено через решение нелинейной краевой задачи для матричного уравнения Риккати.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект 12-01-31358 мола).

Список литературы

1. Баландин Д.В., Коган М.М. Синтез оптимальных линейно -квадратичных законов управления на основе линейных матричных неравенств // АиТ.

2007. № 3. С. 3-18.

2. Баландин Д.В., Коган М.М. Линейно-квадратичные и у -оптимальные законы управления // АиТ.

2008. № 6. C. 5-14.

3. Doyle J.C., Glover K., Khargonekar P.P., Francis B.A. State-space solutions to standard H2 and Ha control problems // IEEE Trans. Automat. Control. 1989. V. 34. № 8. P. 831-847.

4. Kwakernaak H. Robust control and H„-optimization - Tutorial paper // Automatica. 1993. V. 29. № 2. P. 255-273.

5. Khargonekar P.P., Nagpal K.M., Poolla K.R. Hw control with transients // SIAM J. Control Optim. 1991. V. 29. № 6. P. 1373-1393.

6. Lu W.W., Balas G.J. and Lee E.B. A variational approach to H control with transients // IEEE Trans. Automat. Control. 1999. V. 44. P. 1875-1879.

7. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с.

MINIMAX CONTROL OF A LINEAR OBJECT UNDER EXTERNAL DISTURBANCE AND UNKNOWN INITIAL CONDITIONS ON A FINITE TIME HORIZON

R.S. Biryukov

The suppression level of perturbations for a linear object with an external disturbance and unknown initial conditions is determined as the greatest value of the L2-norm of the objective output when the L2-norm of the external disturbance and some positive definite quadratic form of the initial state are bounded by some constants. Using a variational approach, it is shown that the construction of minimax controllers ensuring a minimum level of perturbation suppression is reduced to the solution of a nonlinear boundary value problem for a matrix Riccati differential equation.

Keywords: optimal control, minimax approach, finite horizon, external disturbance, unknown initial conditions.

i Надоели баннеры? Вы всегда можете отключить рекламу.