Синтез оптимального управления нелинейными динамическими системами на основе концепции обратных задач динамики

Харьков В.П.

Харьков В.П.

ВУНЦ ВВС «ВВА им. проф . Н.Е. Жуковского и Ю.А.Гагарина»

СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ НА ОСНОВЕ КОНЦЕПЦИИ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ

Существует достаточно широкий класс динамических систем, на которые воздействуют контролируемые возмущения. Если цель управления заключается в отработке некоторого заданного процесса, то возникает задача непосредственного учета возмущений в законе управления.

Представляет определенный интерес синтезировать управление на основе концепции обратных задач динамики [2-4], позволяющей учесть все контролируемые воздействия непосредственно в законе управления .

Пусть динамическая система описывается дифференциальным уравнением вида

x (t) = Ax (t) + Bu (t) + V (t), (1)

где x (t)- n-мерный вектор состояния; u (t) - q-мерный вектор управления, V (t) - вектор контролируемых внешних возмущений; A, B -известные матрицы.

Процесс, предназначенный для отработки, определяется как

XT (t) = f (t) , (2)

где f(t) - s-мерная векторная функция, дифференцируемая требуемое число раз, удовлетворяющая

условию

s< q, (3)

Условие (3) удовлетворяет свойству управляемости на бесконечности, приt0 < t <¥ . Под управляемостью на бесконечности понимается возможность выполнения условия

xT (t) = Fx(t),їдеt e[t0,~], (4)

в котором

00 k 010k 0'

F = 00k 001k 0 , (5)

00k 000 k 10

где F - матрица размером p x n , состоящая из нулей и единиц.

Из условий (4), (5) следует, что компоненты вектора xt (t) имеют тотже физический смысл, что и некоторые компоненты вектора состояния (1).

В математическом плане задача управления формулируется следующим образом. Для системы (1) требуется найти вектор u (t)сигналов управления, обеспечивающий минимум функционала.

I = J[(Fx-xT) Q (Fx-xT) + uTKu ]dt, (6)

в которомО,К- заданные матрицы штрафов за точность и величину сигналов управления.

Из (6)следует, что целью управления является выполнение условия (4). Тогда можно записатьогра-ничение или условие (4) в виде [2] :

Lim [ Fx-xT] =0, (7)

которое учитывает, что в некоторый момент to условие (4) может не выполняться, например, из-за воздействия неконтролируемых возмущений. Приближение к нулю условия (7) может быть осуществлено по различным траекториям, конкретный вид которых определяется как исходной моделью объекта управления (1), так и требованиями к замкнутой системе управления. С учетом (1) будем полагать, что замкнутая система управления должна быть также линейной.

Если ввести обозначение p(x)=Fx-xt, тоусловие(7)можнопредставитьввидедифференциального уравнения

p(m)(x) + Cm-1p<m-1)( x) +...+ C1p(1)( x) + CoP (x) = 0, (8)

где Cj, j=0...m-1 - любые положительно определенные матрицы, обеспечивающие устойчивость решения (8) ; m <n - порядок дифференциального уравнения.

Полагая, что для управляемых координат известны не только значения, но и их первые m производных, получаем после подстановки (1) в (8) либо алгебраическое, либо дифференциальное уравнение относительно неизвестного вектора управления [2].

Для управляемой системы, следовательно, систему уравнений (8) с учетом (5) можно представить в виде уравнения Коши относительно вектора управления [1]:

u0=D0u0+R0z0, (9)

где u0 - [q (m - 1)J - мерный вектор, первый q компонент которого соответствуют

искомому управлению; D 0,R0 - матрицы, a z0 - вектор соответствующих размерностей, полученные после

преобразования системы (8) .

Отметим одну характерную особенность уравнения (9). Если матрица В имеет хотя бы один столбец, у которого все элементыкроме одного равны нулю, то соотношение (9) будет представлять собой совокупность как дифференциальных, так и алгебраических уравнений. Причем, если матрицаВ содержит строго q ненулевых элементов, то эти уравнения будут алгебраическими.

При анализе свойств замкнутой системы управления и оценке ее инвариантности по отношению к возмущениям будем полагать, что система (1) имеет вид

x1 (t ) = x2 (t)+ V1 (t) ,

x2 (t) = a12x1 (t) + a22x2 (t) + bu (t) + V2 (t),

(10)

где V1 (t ) ,V2 (t ) - контролируемые возмущения, непрерывно дифференцируемые по аргументу t.

Требуется определить такое управление u (t) , которое обеспечивало бы отслеживание заданной тра-

ектории Хт (t)

В этом случае функционал (б) примет вид I

|[(Х1-Х1Т)2 + Ku2]dt, а

ограничение

(8) запи-

шется как

(Х1 — Х1Т ) ^ + С1 (Х1 — Х1Т ) ^ + С0 (Х1 — Х1Т ) = 0, (11)

где матрицы C1,Co вырождаются в скаляры.

Так как для системы (10) матрица B= (0,b) имееттолькоодинненулевой элемент, тогда уравнение (11) будет алгебраическим. Подставляя (10) в (11) получаем

U = Ь |^—(^21 + Со)Х1 — (a22 + С1)Х2 — C1V1-V1-V0 + СоХ1тС1><1т + )&1т J, (12)

Замкнутая система (11) с управлением (12) преобразуется к виду

^(t) = Х2^) + V1(t); (13)

Х 2(t) =—CoХ1(t) — C1Х2(t) — k1(t) + k2(t),

где

k1(t) = C1V1(t) + \>1(t); k2(t) = CoMt) + C^t) + i«1T(t), (14)

Коэффициенты C1,Coопределяются из решения системы:

9I(C1,C„) = ai(C1,Cn) = 0 (15)

3C0 ’ 3C1 ’

при условии, что V1=0,V2=0, ax1T=const.

Рассмотримсвойства системы(15).Непосредственноиз(11),(15) видно, что возмущение V2(t) не влияет на процесс x(t). Для оценки точностиотслеживания процесса xn(t) определим передаточную функцию

W1 (p) от х1Т (р ) кх2Т(р).

Применив преобразование Лапласа к (15) при нулевых начальных условиях, получим:

■ p —1 ■ " Х1 (p)'

_С0 p+C0 _ _Х2 (p)_

где V1 (p) = Ї С1 (t

1

-P-C1

L1(p) +

0

p2+C1p+C0

x1T (p),

,-pt .

Тогда передаточная функция W1(p) имеет вид

W1 (p) = p2+C1p+C0 ° 1. (17)

p2+C1p+C0

0

(16)

Равенство W1(p)=l означает, что при начальных условиях Х1 (t0) = Х^ (t0)

входной сигнал xrr(t) будет отрабатываться точно, т.е. справедливо Х1 (t )@ x1T (t),t e[0,T].

В общем случае ошибка выходного сигнала определяется E(t) =Ex (t)+EV (t) , где Ex (t) - составляющая ошибки, обусловленная неточностью отработки входного задающего сигнала xrr(t), a Ev (t)- составляю-

щая ошибки, обусловленная действием возмущения V(t) . Анализ влияния возмущения V(t) управления будем проводить по передаточной функции W2(p) от V(p). Из (16) имеем

W2 ( p)

p+c1-(p+C1) = 0 p2+C1p+C0 '

(18)

на процессы

Следует отметить, что условие W2 (p) = 0 выполняется в случае измерения не только V(t), но и ее

производной V (t) .

Из (17) и (18) следует, что система (15) обладает инвариантными свойствами по отношению к возмущениям V1(t) и V2(t) и астатизмомвторого порядка по отношению ко входному задающему сигналу.

Рассмотримсвойствасистемы(15)впредположении,что контролируется только V2(t). В этом случае имеем передаточную функцию W2(p) вида

W2 ( p)

p

p2+C1p+C2

(19)

Если возмущение V2(t) представляет собой медленно меняющуюся функцию времени, то ошибка Ev (t), обусловленная действием V(t), определяется выражением [4]

E1 (t ) = CLv1 (t)-§у1 (t) +.

C20

Полученное соотношение означает, что замкнутая система управления обладаетинвариантнымисвойствамипоотношениюкпостоянномувозмущению V(t). Это утверждение справедливо, если параметры объекта(11) известны точно. В противном случае на переходных режимах свойства-

системы (15) будут определяться не значениями коэффициентов C1, C0 , аихсмещенными оценками С00 и СюВеличины Ао=С0-С00 и Д=С1-Сю, определяются априорной неопределенностью знания параметров системы .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из (13) следует, что система является инвариантной не только по отношению к возмущению V2(t), но и к коэффициенту Ь.Это достигается засчет непосредственного учета их в законе управления.

В заключение необходимо отметить, что полученный алгоритм является достаточно простым, доставляет замкнутой системе свойства инвариантности по отношению к возмущениям в случае, если известны не только значения, но и их производные. Требуемый порядок производных зависит от «точки» воздействия возмущения на систему и в общем случае не превышает(n — 1) . Так, например, для системы второго порядка (11) инвариантность достигается, если измеряются помехи V1(t), V2(t) и производная от V2(t) .

Работа выполнена при поддержке РФФИ11-08-00292

ЛИТЕРАТУРА

1. Меркулов В.И. Синтез оптимального управления дискретными системами с измеряемыми возмущениями - Радиотехника, 1999, №2.

2. Меркулов В.И., Харьков В.П. Синтез адаптивного регулятора для радиоэлектронных следящих систем - Радиотехника. 2007, №1.

3. Харьков В.П. Адаптивное управление динамическими системами на основе обратных задач динамики - Техн. кибернетика, 1994, №4.

4. Канащенков А.И., Меркулов В.И., Харьков В.П. и др. Авиационные системы радиоуправления, т. 3 - М.: Радиотехника, 2004.

5. Кочетков Ю.А. Основы автоматики авиационного оборудования. - М.: ВВИА им. Н.Е.Жуковского,

1995 .

Похожие темы научных работ по математике , автор научной работы — Харьков В. П.

Текст научной работы на тему «Синтез оптимального управления нелинейными динамическими системами на основе концепции обратных задач динамики»