УДК 517.977.5
ОПТИМАЛЬНОЕ ПО МИНИМУМУ РАСХОДОВ УПРАВЛЕНИЕ ТРОЙНЫМ ИНТЕГРАТОРОМ
© 2012 Ю.Н. Горелов^ М.В. Морозова2
Рассматривается решение задачи оптимального управления тройным интегратором с произвольными граничными условиями методом моментов. Показано, что в случае минимизации полного импульса управляющего воздействия или расхода управления решение ¿^-проблемы моментов аппроксимируется оптимальным импульсным управлением. Получено общее решение задачи и исследована структура оптимального управления. Рассмотрен пример решения задачи с симметричными граничными условиями.
Ключевые слова: тройной интегратор, оптимальное управление, расходы управления, проблема моментов, принцип максимума Красовского, импульсное управление.
1. Постановка задачи
Угловое движение космического аппарата (КА), рассматриваемое по одному из каналов управления его ориентацией на заданном интервале [Ьо,Ь,], описывается уравнениями
т=^ V«,
где 7(Ь) — угол поворота, ш(Ь) — угловая скорость, е(Ь) — угловое ускорение, обусловленное как управляющими, так и возмущающими воздействиями, включая сюда и перекрестные связи между каналами управления, а именно: е(Ь) — сумма относительного управляющего момента т(Ь) и возмущающих ускорений /(Ь), то есть е(Ь) = т(Ь) + /(Ь), VЬ € «о,«,]. В том случае, если управляющие моменты для КА создаются с помощью электромеханических исполнительных органов [1], то простейшая модель для т(Ь) имеет вид
^1= и(Ь), аЬ
где и(Ь) — управляющий параметр (или скорость изменения управляющего ускорения), на который в общем случае может накладываться ограничение: |и(Ь)| ^ ио, VЬ € [Ьо,Ь,], где ио — его максимально допустимое значение.
1 Горелов Юрий Николаевич ([email protected]), Институт проблем управления сложными системами РАН, 443020, Российская Федерация, г. Самара, ул. Садовая, 61; НОЦ СамГУ "Космические системы дистанционного зондирования" 443011, Российская Федерация, г. Самара, ул. Акад. Павлова, 1.
2Морозова Марина Валериевна ([email protected]), кафедра информатики и вычислительной математики Самарского государственного университета, 443011, Российская Федерация, г. Самара, ул. Акад. Павлова, 1.
Поэтому уравнения состояния, описывающие движение КА по каждому каналу управления его ориентацией, суть модель тройного интегратора:
ах1(Ъ) ах2(Ъ) ^ , ^4ч ¿хз{г) (11.
,, = х2(Ъ); ,, = хз(Ъ) + / (Ъ); ,, = и(Ъ) (1-1)
аЪ аЪ аЪ
где х1(Ъ),х2(Ъ),хз(Ъ) — фазовые переменные, /(Ъ) — некоторая функция, которая здесь будет предполагаться известной функцией времени, а и(Ъ) — управляющий параметр. Отметим, что система (1.1) является вполне управляемой [2; 3].
Модель маневра переориентации КА задается граничными условиями для кинематических характеристик его углового движения и относительного управляющего момента. Граничные условия для объекта управления (1.1) в общем случае имеют следующий вид:
хЛ(Ъ0) = хю; х2 (Ъо) = х2о; х3(Ц) = хзо; (1.2)
xl(tf )= x1f; X2(tf )= X2f; xз(tf ) = xзf, (1.3)
где хю, х2о, хзо, x\f, X2f и xзf — некоторые константы, значения которых таковы, что рассматриваемый маневр переориентации КА нетривиален, и, кроме того, здесь Ъо и tf — фиксированные начальный и конечный моменты времени интервала управления, а Т = tf — Ъо — длительность маневра.
Задача управления (1.1)—(1.3) есть двухточечная граничная задача, и для нее здесь требуется найти такое управление и(-) = и[Ъо^], которое минимизирует функционал
J(u) = J \и(т)\3,т. (1.4)
го
Критерий оптимальности (1.4) в [2] рассматривается как расход "топлива" за маневр, а в [3] — как полный импульс управляющего воздействия. В общем случае (1.4) можно рассматривать как суммарную величину расходов управления за маневр.
1.1. Основные соотношения
Уравнения состояния объекта управления (1.1) можно переписать в векторно-матричной форме:
= Ах(Ъ)+ Ъи(Ъ) + f (Ъ), (1.5)
аЪ
где х(Ь) = со1[х1(Ъ), х2(Ъ), хз(Ъ)] — вектор-столбец фазовых переменных, А = 0 1 0 \
0 0 1 I — матрица динамики, Ъ = со1(0,0,1), а f (Ъ) = со1(0, /(Ъ), 0). Со-000
ответственно граничные условия (1.2), (1.3) для объекта управления (1.1) также переписываются в виде
х(Ъо) = хо; x(tf )= xf, (1.6)
где с учетом (1.2), (1.3) Хо = со1(хю,х2о,хзо), Xf = co1(xlf,X2f,xзf).
Как известно, переходное отображение для управляемой системы (1.5) задается формулой Коши:
г
х(Ь) = Ф(Ъ,Ъо)хо + 1 Ф(Ъ,т)[Ъи(т) + f(т)]dт, (1.7)
го
J &(tf ,т)Ы(т)dr = c, (1.10)
где Ф— переходная матрица системы, с учетом вида которой для (1.5) тогда получим
Ф^,т)b = h(r) = col [hi(r), h2(r), h3(r)],
где
hi(T) = 2(tf - т)2; h2(r) = tf - r; h3(r) = 1, Vr G [to,tf ]. (1.8)
t
Введем также вектор-функцию g(t) = f Ф^,т)f (r)dr с компонентами
to
t t gi(t) = j (t - r)f (r)dr; g2(t) = j f (r)dr; gs(t) = 0. (1.9)
to to
При t = tf (1.7) можно переписать в виде
tf
Ф(tf ,т )bu(r )dr = c
to
где c = Xf — Ф^, to)xo — g(tf) = col(ci, C2, C3), а компоненты этого вектора вычисляются с учетом (1.6), (1.8) и (1.9) по формулам:
ci = xif - xio - (tf - to)x2o - 2(tf - to)2X3o - gi(tf);
C2 = x2f - x2o - (tf - to)хзо - g2(tf); сз = x3f - X30. (1.11)
Уравнение (1.10) с учетом (1.8) также можно переписать в виде системы равенств, называемых моментными:
tf
J hk (т)u(r)dr = ск, k =1, 2, 3. (1.12)
to
Таким образом, решение двухточечной граничной задачи (1.5), (1.6) сводится к решению уравнения моментов (1.10) относительно управления u(-) = u[to,tf] или, что то же самое, к проблеме моментов [3; 4]. Если дополнительно потребовать, чтобы искомое управление доставляло минимум какому-либо показателю его качества, например в виде (1.4), тогда задача (1.4)-(1.6) становится задачей оптимального управления. Очевидно, что (1.4) — функционал типа нормы в про-
tf
странстве Li [t0,tf ], поскольку J(u) = f \u(r)\dr = ||u(-)y¿1. В связи с этим задача
to
(1.4), (1.12) — оптимальная L^-проблема моментов. В приведенной постановке задача оптимального управления тройным интегратором ранее не рассматривалась.
1.2. Принцип максимума Н.Н. Красовского
В соответствии с данной постановкой задачи (1.4)—(1.6) и формулировкой проблемы моментов [3; 4] в (1.8) hk(/) G L^[to,tf ], к = 1,2, 3, то есть эти функции суть элементы пространства измеримых существенно ограниченных на интервале [to,tf] функций. Так как в Lœ норма определяется как существенный (истинный) максимум
\\hk = vrai max\hk (t)^
te[t0,tf ]
то здесь для (1.8) норма вводится так:
\\hk= max \hk(t)\.
te[t0,tf ]
Поскольку функции (1.8) линейно независимы на любом интервале [to,tf] (для любых 0 < T < то), то уравнения (1.10) для задачи (1.5), (1.6) разрешимы для любых чисел ck (1.11), из которых хотя бы одно должно отличаться от нуля (это означает нетривиальность маневра переориентации КА). Решение системы уравнений (1.10) состоит в том, чтобы найти такой линейный ограниченный функционал
tf
ф € L^, который здесь имеет вид: ^[h(-)j = J h(r)и(т)dr, что для него выполня-
to
ется система равенств (1.10):
ф[hk(•)] = ck, к =1, 2, 3. (1.13)
Функционал ф в (1.13) называют разрешающим данную проблему моментов.
Если система (1.10) разрешима, тогда существует минимальный элемент ho(-) € P [3; 4]:
P = j h(-) : h(^ = Y lkhk (•), Y lkck = Л , (1.14)
l k=1 k=1 )
и для него выполняется следующее условие: 0 < р0 = ||ho(-)\\LOT ^ \\h(0\\bOT, Vh(^) € P, которое является необходимым и достаточным для разрешимости любой конечномерной проблемы моментов в Lp, 1 ^ p ^ то [3]. При этом для разрешающего функционала имеет место: ф^(-)] = 1, Vh(-) € P. Поскольку ho(^) € P, то и ф^о(-)] = 1. Для разрешающего функционала имеет место оценка: \\ф\\ьр ^ ^ 1/ро. Соответственно норма оптимального разрешающего функционала ф0 равна: Ыь^ = 1/ро [4].
В силу изометрического изоморфизма [3; 4] I: L* [t0,tf ] ^ Lq[t0,tf ], 1 < p < то, 1 +1
p q
им оптимальным проблемам моментов имеет место
min \\и(^\\ья =min Шь; = —. «(•) Ф p P0
На этом равенстве основывается правило минимакса [3] или принцип максимума Н.Н. Красовского [4] как универсальный метод решения задач оптимального управления линейными системами.
Принцип максимума Н.Н. Красовского [4]. Пусть h0(T) = Ф(^,т)b — решение задачи (по l = l0):
min II lTФ^, -)b IL = p0,
IT C=1 II 4 J bp
где l = col(/i,/2,/3,...) и c = col(c1 ,c2,c3,...). Тогда если задача
tf
max j h0(T)и(т)dT
to
p +1 = 1, для задач оптимального управления типа (1.4)—(1.6) и соответствующим
КОК = Po
имеет единственное решение и* (■), то и*(Ъ), Ш € [Ъо^] — оптимальное управление.
В соответствии с принципом максимума решение задачи оптимального управления (1.4)—(1.6) сводится к последовательному решению следующих задач:
во-первых, определение нормы минимального элемента из множества P (1.14), а именно:
min \\h(-)\\Lœ = min ( max \h(r)\) = ||ho(-)||Lœ = po, (1.15)
h( )eP hci+hc2+hc3 = i \re[ta,tf] )
где
h(T) =1 li(tf - T)2 +12(tf - T) + 1з; (1.16)
во-вторых, синтез оптимального управления из условия:
tf
max / h0(T)и(т)dT. (1.17)
"Obi = Po t
to
2. Решение задачи оптимального управления по минимуму его расходов для тройного интегратора
Вначале рассмотрим задачу (1.15). Очевидно, что здесь при любых допустимых значениях li, ¡2 и ¡з, которые удовлетворяют ограничению: l\Ci + I2C2 + I3C3 = = 1, экстремальные значения h(T) (1.16) может иметь только в точках t = to, t = tf, а также в точке т = тт = tf + I2/I1, если, конечно, при этом to < тт < tf. Значения \h(T)\ в указанных точках будут равны
Po = \h(t
o)
2 h(tf - to)2 + ¡2 (tf - to ) + ¡3
Vf = \h(tf )\ = \1з\ ; Ит = \h(Tm)\ =
Пусть ê(l\,l2,l3) = max{vo, Vf ,Ит}. Тогда (1.15) сводится к задаче
1 l2 ¡з - 11-2 3 2 h
Po = po{ho,ho,ko) = min ö{h,h,ls), (2.1)
I1C1+I2 C2+l3C3 = l
решая которую можно получить минимальный элемент ho(r) и его норму po. Если они найдены, то можно приступать к решению задачи (1.17), то есть непосредственно к синтезу программы оптимального управления. С учетом того, что h0(•) £ P и [ho(•)] = 1, задача (1.17) тогда будет представлена следующими соотношениями:
tf
1
............... \и( '
п(-)
to to
i i
max ho(T )и(т )dT = 1; \и(т )\dT =—. (2.2)
) J J po
2.1. Решение задачи с симметричными граничными условиями
Предваряя решение задачи (2.2) в общем случае, рассмотрим вначале пример синтеза оптимального управления для системы (1.1) в одном частном случае задания граничных условий (1.2), (1.3), предполагая дополнительно, что в (1.1) /(Ь) = 0. Итак, пусть (1.2), (1.3) задают маневр переориентации КА на угол 7т (0 < ^т ^ п), а именно:
:л(Ьо) = 0; х2(Ь0)=0; хз(Ьо) = 0; (2.3)
xl(tf ) = 1т; Х2 (tf) = 0; хэ(*/ )=0. (2.4)
Далее для удобства в (2.3), (2.4) примем: ¿0 = -Т/2; = +Т/2, где Т = — ¿0. В этом случае граничные условия (2.3), (2.4) оказываются симметричными относительно момента времени £ = 0.
С учетом (2.3), (2.4) из (1.11) получим: с1 = 7т > 0, с2 =0, с3 = 0. Но тогда в (1.15) и (1.16) ¡1 = /ю = 1/с1 = 1/7т, а параметры ¡2 и ¡3 произвольны. Таким образом, функция (1.16) как элемент множества Р (1.14) будет иметь вид
h(T) = 2c1
(I - т) +2feCl(I - т) +21
и на границах интервала управления [—T/2, +T/2]:
= д(т; /2,/з)
но = 2С1
Так как тт = T/2 +12ci, то условие —T/2 < тт < T/2 выполняется если 0 > I2 > — —T/(4c1) и, стало быть, pm = |h(Tm)| = — (c112)/21. Вводя функцию гд(/2,/з) = = max{^,0,^,pm}, сведем (2.1) к следующей задаче:
Ро = min ^(/2,/з). (2.5)
Можно показать, в том числе прямым расчетом, что минимум в (2.5) достигается только тогда, когда ось симметрии параболы, график которой задается функцией д(т; /2, /з), проходит через точку т = 0, то есть тт = 0. Отсюда получим /20 = —T/(2ci), д(т; /20,/з) = т2 + 2/зС1 — T2/4, но = Hf = /з и рт = — — (2ci)-1 (2/зС1 — T2/4). Стало быть, тогда
Ро = min ^(¿20, /з).
Отсюда получим /зо = T2/(16c1), а также ро = T2/(16c1) и минимальный элемент
1 1 ( T 2 \
hо(т) = 2c1 g(т; /2о,/зо) = 2С1 (т 2 — т). (2.6)
Таким образом, задача (1.15) в рассматриваемом здесь случае решена.
Обращаясь теперь к (2.2), нетрудно видеть, что из условия максимума первого интеграла в (2.2) должно выполняться sign и(т) = sign Л-о(т), если только |Л.о(т)| ^ Д, где Д — некоторое число: 0 ^ Д ^ T2/(16c1), иначе, и(т) = = 0. Кроме того, для выполнения ограничения в виде второго интеграла в (2.2) необходимо, чтобы для управляющего параметра поточечно выполнялось условие: |и(т)| ^ ио < ж, Ут G [—T/2, +T/2]. Но тогда решение задачи (2.2) после замены в (2.2) интегралов интегральными суммами можно было бы свести к простейшей задаче оптимального распределения ограниченного ресурса [5], решение которой в данном случае является очевидным. Однако при любом ио < ж для элемента Л-о(т) (2.6) требуемое число Д не существует. Тем не менее при Д ^ T2/(16c1) и, соответственно, при ио ^ ж приближенное решение задачи (2.2) возможно при "импульсном" управлении, сосредоточенном в малых окрестностях экстремальных точек функции (2.6).
Действительно, выбирая достаточно малые (в сравнении с T ) числа ео, £f и em, можно построить следующую допустимую программу управления:
ао/ео, т G 1о = [—T/2, —T/2 + ео];
(т )=4 af/ef, г G If = [T/2 - f, T/2]; (2?)
am/(2em), т G Im [ em, +em] ;
0, т G [—T/2, +T/2] \ (1о U Im U If),
1
д
где ao > 0, af > 0, am > 0 — некоторые числа. Подставляя (2.7) в (2.2), при (£o,£f ,£m) ^ 0 получим в пределе (как для первого, так и для второго интегралов в (2.2)): ao + af + am = 1/po = 16>ci/T'2 — нижнюю грань расхода управления для программы (2.7) или, что то же самое, полный импульс управляющего воздействия [3]. Отметим, что в программе управления (2.7) при (£o,£f,£m) ^ 0 "импульсы" управления вырождаются в ¿-функции и, соответственно, в пределе также можно принять Д = T2/(I6ci). Далее, интегрируя последовательно третье и второе уравнения в (1.1) с учетом граничных условий (2.3), (2.4) и переходя к пределу в (2.7), получим
ao + af - am = 0; 2ao - am = 0, а отсюда следует, что ao = af и am = 2ao, то есть в (2.7) должно быть
4ci 8ci
a0 = af = T2 ' am = T2 '
Таким образом, здесь получена следующая программа ¿-импульсного оптимального управления (ci = yt > 0):
4^т
и*(т ) = J2-
б(г + I) - 25{т ) + ö(r - I)
(2.8)
где ¿-функции введены с учетом построения отвечающих им "импульсов" в (2.7), а именно: при т = -T/2 ¿-функция определена в точке т = -T/2 + 0, при т = = T/2 - в точке т = T/2 — 0. Очевидно, что программа (2.8) не является элементом Li[—T/2, +T/2], то есть она не относится классу допустимых управляющих воздействий в рассматриваемой задаче, а является предельной "точкой" при (£o,£f ,£m) ^ 0 для программы (2.7).
При наличии ограничения: |u(t)| ^ uo < ж, Vt G [—T/2, +T/2] решение задачи (1.1), (1.4), (2.3), (2.4) можно получить с помощью принципа максимума Л.С. Понтрягина [2]. При этом программа оптимального управления с учетом симметрии граничных условий (2.3), (2.4) здесь будет иметь следующий вид:
( ио, т G [—T/2, —T/2 + п) U [T/2 — п, T/2]; и(т) = < —ио, т G [—т1, +71 ];
[ 0, т G [—T/2 + т1, —п) U [+ruT/2 — п),
где 0 < т1 < T/4, а 4т1ио — минимальный расход управления. Очевидно, что эта программа при ио ^ ж и, соответственно, при т1 ^ 0 также в пределе стремится к полученной ранее программе ¿-импульсного оптимального управления (2.8).
2.2. Предварительные замечания к синтезу оптимального управления в общем случае
Возвращаясь к рассмотрению общего случая произвольных граничных условий, но при to < тт <tf, отметим, что решение задачи (1.15) или (2.1), то есть определение минимального элемента ко(т) и его нормы ро вполне достаточно для синтеза программы управления, которая аналогична (2.7). Из условия максимума первого интеграла в (2.2) необходимо, чтобы соответствующие "импульсы" прикладывались только в точках экстремума функции q(т) = 1ко(т)|, а именно:
(ao/£o) sign ho(to), т G Io = [to, to + £o];
и(т) J (af /£f) sign ho(tfЪ т G If = [tf — £f ,tf]; (29)
' [am/(2£m)] sign ^(тт), т G Im — [тт £m, тт + £m\ ; 0, т G [to,tf ] \ (Io U Im U If),
где £о, £f и em — достаточно малые числа (в сравнении с T), а тт — точка экстремума ко(т) внутри интервала управления [to,tf]• Очевидно, что иные варианты приложения "импульсов", отличные от указанных в (2.9), не обеспечивают достижение максимума для первого интеграла в (2.2). То же самое справедливо и для каких-либо других дополнительных "импульсов" вне точек экстремума ко(т). Не затрагивая здесь достаточных условий максимума для первого интеграла в (2.2), которые требуют, вообще говоря, выполнения условий: Po = Pf = = Pm [3, с. 188, теор. 23.1], рассмотрим с учетом произвольности граничных условий формальное решение задачи, связанной с максимизацией первого интеграла в (2.2).
Итак, пусть to < тт <tf ив общем случае тт = 0, а также пусть хотя бы одно из значений Po, Pf и отлично от других (тем самым исключается случай Po = = Pf = рт). Переходя в (2.9) к пределу при (£o,£f ,£т) ^ 0, получим следующую ¿-импульсную программу управления:
us(т) = воао¿(т - to + 0) + SmOm^^ - тт) + sf af ¿(т - tf - 0), (2.10)
где s0 = sign ho(to), Sf = sign ho(tf ), sm = sign Но(тт). Если подставить (2.10) в (2.2), то получим
роао + Pf af + ¡лтат = 1, ао + af + ат =— • (2.11)
Ро
Кроме того, проинтегрируем еще третье уравнение (1.1) с учетом (2.10):
soao + Sf af + Smam = сэ^ (2.12)
Решение системы (2.11), (2.12) относительно коэффициентов ао, af, ат в (2.10) найдем по формулам Крамера:
D Df Dm (213)
ао = D ; af = D ' ат = D, (2.13)
где
D = Ио^т - Sf ) + Pf (so - Sm) + Pm(sf - So);
s f Pm sm Pf
Do = (Sm - Sf ) + (Pf - Нт)сэ +
Df = (So - Sm) + (Pm - Мо)сэ + Dm = (Sf - So) + (po - Pf )сэ +
po
SmPo - SoPm ;
Po ' SoPf - Sf po
Р0
Тогда вычисления по формулам (2.13) доставляют следующие выражения:
(«т - )ро + (pf - рт)озро + рт - втР} 1
ао = '
а} =
Р0(«т — ) + Р} («0 — «т) + Рт(«} — «0) Р0 = («} - «0)Р0 + (Р0 - Р})сзР0 + «0Р} - Я}Р0 1 (2 14)
Р0(«т - )+ Р} («0 - «т)+ Рт(Я} - «0) Р0 ' '
Очевидно, что полученные выражения для значений а0, а}, ат (2.14) не только носят формальный характер, но и являются недоопределенными. Действительно, если согласно достаточным условиям предположить, что (р0,р/,рт) ^ Р0, то в (2.14) получим неопределенность вида 0/0. Кроме того, очевидно, что знаки в0,
Po(Sm - Sf ) + Pf (So - Sm ) + Pm(S f - So) po
(So - Sm)Po + (Pm - Po)c3Po + SmPo " - SoPm 1
Po(Sm - Sf ) + Pf (So - Sm) + Pm(S f - So) Po
(Sf - So)po + (Po - Pf )сэро + SoPf - - Sf Po 1
вт и sf тогда должны чередоваться, и, наконец, в (2.14) в явном виде отсутствует информация о части граничных условий (например, в виде е\ и е2), в том числе и о параметре тт. В связи с этим необходимо либо получить явное решение задачи (2.1) в виде ко(т) и его нормы ро, либо воспользоваться установленной структурой оптимального управления (2.9) или (2.10), конкретизировав ее в части чередования знаков во, вт и sf, и установить явные зависимости между искомыми параметрами в программах (2.9) или (2.10) и граничными условиями (1.2), (1.3).
2.3. Общее решение задачи оптимального управления
Итак, с учетом структуры программы "импульсного" управления (2.9) в качестве расчетной схемы для определения ее параметров, а именно: ао, af, ат и тт, примем ее предельный вариант (2.10). Для удобства проводимых далее вычислений также примем: ¿о = 0; tf = Т и ](¿) = 0. Для определенности можно еще предположить, что в (2.10) в0 = Sf = ±1, вт = ^1. Тогда программа (2.10) будет иметь вид
us(r) = а05(т + 0) - amS(r - тт) + af S(r - T - 0),
(2.15)
где ак = soak, к = 0,f, m.
На рисунке показан вид получаемых с учетом (2.15) программ изменения фазовых координат xi(t), x2(t), x^(t) объекта управления (1.1) с учетом so = +1, а также их значения в точках t = 0,rm,T с учетом обозначений в (1.2), (1.3); стрелками показаны соответствующие ¿-импульсы.
Рис. Схема определения параметров ¿-импульсного оптимального управления
Учитывая (2.15), из третьего уравнения (1.1) в точке t = 0+ получим хз(0+ +) = хзо + ао = хзт и, соответственно, Ш € (0,тт) имеет место: х^(Ь) = хзт. Далее, интегрируя оставшиеся уравнения (1.1) на интервале [0, тт) с учетом (1.2), получим
1
X2m = Х20 + (хзо + ao)rm; xlm = xw + x2orm + ^(хзо + ao)^.
m
Очевидно, что в точке t = тт + 0 имеет место: Хзт = хзт — ат = хзо + ао — аа (см. рисунок). Поэтому интегрируя далее (1.1) на интервале (тт,Т], с учетом при-
веденных начальных условий х1(тт) = х\т; х2(тт) = х2т] хз(тт) = хзт получим
хз/ = Хзт + а/ = хзо + ао - ат + а/; Х2/ = х2т + (хзо + ао - ат)(Т - тт) = х2о + (хзо + ао)Т - ат(Т - тт);
х\/ = х1т + х2т(Т - тт) + ^(хзо + ао - ат)(Т - тт)2 =
= хю + х2оТ + 2(хзо + ао)Т2 - 1ат(Т - тт)2.
Таким образом, с учетом (1.11) получаем следующую линейную систему относительно ао, а/, ат:
2аоТ2 - 2ат(Т - тт)2 = сЛ; аоТ - ат(Т - тт) = С2; (2.16)
ао -ат + а/ = сз. (2.17)
Решение системы (2.16) имеет вид
2с1 - (Т - тт)с2 2с1 - Тс2 /ою\
ао =-Тт-' ат = (Т-т )т . (2.18)
Т ' т (Т ' т ) ' т
Соответственно, с учетом (2.18) из (2.17) можно получить а/ = ат - ао + сз или а/ = ат - ао + восз. Полный импульс управляющего воздействия, или расход управления (1.4), согласно (2.15), (2.18) будет равен:
I(из; тт) = ао(тт) + ат(тт) + а/(тт) = 2ат(тт) + восз;
его минимум достигается при тт = Т/2, то есть I(и*) = I(из; Т/2) = воЩ/Т2 ^ 0, где Щ = 16с1 -8Тс2 +Т2сз. Очевидно, что здесь во = signF, то есть J(u*) = |Щ|/Т2. Соответственно при тт = Т/2 из (2.17), (2.18) также следует:
во(4с1 - Тс2) во(8с1 - 4Тс2) ^(4^ - 3Тс2 + Т2сз)
ао = -Т2-; ат = -Т2-; а/ =-Т2-. (2Л9)
С другой стороны, с учетом (2.2) и (2.11) I(и*) = 1/ро. Следовательно, норма
минимального элемента Но (т) в рассматриваемой задаче будет равна
Т2 Т2
ро = Щ = |16с1 - 8Тс2 + Т2сз|. (2.20)
Отметим, что (2.19) и (2.20) имеют место и в том случае, когда в (1.1) ](¿) = 0, для чего следует ввести согласно (1.11) соответствующие поправки для с1 и с2 , а именно: а = с1 - д1(Т); С2 = с2 - д2(Т), где с учетом (1.9) (и принятого выше ¿о = 0 и / = Т) требуемые поправки вычисляются так:
т т
д1(Т) = 1 (Т - т)/(т)йт; д2(Т) = | /(т)йт.
оо
Очевидно, что в этом случае значение оптимального расхода управления I(и*) изменяется на величину ДJ(и*) = (8/Т) [д2(Т) - 2д1 (Т)/Т].
Зная норму минимального элемента ко(т) (2.20), его можно записать в явном виде. Действительно, для всех Н(-) € Р в (1.14):
h(T) = 1 h(T — т)2 + l2(T — т) + 1з, lici + l2C2 + I3C3 = 1.
В точках экстремума ho(-) G P на [0, T], то есть в точках т = 0, т = T/2, т = = T, значения |^(т)|, очевидно, должны быть равны po в силу установленной симметрии минимального элемента. Поскольку
1 /T\ 1 1
ho (0) = 2 lioT2 + I20T + I30 ; ho l 2) =8 lioT2 + 2I20T + I30; ho(T ) = I30,
то получим следующую систему уравнений относительно lio, l20, 1з0:
1 lioT2 + l2oT + 1з0 = sopo; 1 lioT2 + 1 l2oT + 1з0 = —sopo; 1з0 = sopo-
2 8 2
Отсюда сразу же следует l30 = sopo, а также li0 = 16s0p0/T2 и l20 = —8s0p0/T. Очевидно, что k=i luocu = 1, а минимальный элемент имеет следующий вид:
7 , Ч 8«0Р0
) = т"
(' - Ю'-т
T2
В заключение здесь отметим, что функция Г = 16с1 — 8Тс2 +Т2сз в знаменателе выражения (2.20) с учетом соотношений для с\, С2 и сз (1.11) является функцией от заданных значений фазовых переменных в граничных условиях (1.2), (1.3) и от Т, то есть Г = Г(х^, Хlf, х2о, Х2f, хзо, xзf, Т). Поскольку ро > 0, то должно выполняться условие \Г \ > 0. Но возможен и такой вариант задания параметров маневра и его длительности Т, что Г = 0. В этом случае объект управления (1.1) на интервале [0, Т] совершает свободное движение, то есть и(т) = 0, с начальными условиями (1.2), и при этом автоматически выполняются конечные условия (1.3).
Заключение
В статье поставлена и решена задача оптимального управления тройным интегратором с произвольными граничными условиями на минимум расходов управления или, что то же самое, полного импульса управляющих воздействий на заданном интервале. Решение получено в виде программы ¿-импульсного управления с помощью принципа максимума Н.Н. Красовского при сведении задачи к L^-проблеме моментов. При анализе параметров оптимальной программы управления выявлен вариант задания граничных условий, для которых управление тождественно нулевое, когда его объект совершает свободное движение, а граничные условия выполняются автоматически. Поскольку с помощью тройного интегратора можно моделировать движение КА с электромеханическими исполнительными органами по одному из каналов управления его ориентацией, в том числе с учетом перекрестных связей между ними, постольку решение рассмотренной задачи представляет интерес как для формирования оптимальных программ управления переориентацией КА в пространстве, так и при проектировании систем управления ориентацией КА в части оценки их предельных характеристик.
Литература
[1] Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974. 600 с.
[2] Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 764 с.
[3] Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.
[4] Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.
[5] Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 460 с.
Поступила в редакцию 2/X/2012;
в окончательном варианте — 2/X/2012.
OPTIMAL CONTROL OF THREEFOLD INTEGRATOR ACCORDING TO MINIMUM CONSUMPTION
© 2012 Y.N. Gorelov? M.V. Morozova4
The solution of optimal control problem of the threefold integrator with any boundary conditions by method of moments is considered. It is shown that in case of minimization of total impulse of control influence or control consumption, the solution of L^ -moments problem is approximated by optimal impulse control. The general solution of the problem is obtained and the structure of optimal control is researched. The example of solution of a problem with symmetric boundary conditions is considered.
Key words: threefold integrator, optimal control, control consumptions, problem
of moments, Krasovsky's maximum principle, impulse control.
Paper received 2/X/2012. Paper accepted 2/X/2012.
3Gorelov Yuri Nikolaevich ([email protected]), Institute for the Control of Complex Systems of RAS, Samara, 443020, Russian Federation; Research and Education Center "Space Systems of Remote Sensing", Samara State University, Samara, 443011, Russian Federation.
4Morozova Marina Valerievna ([email protected]), the Dept. of Informatics and Computational Mathematics, Samara State University, Samara, 443011, Russian Federation.