УДК 629.78.03"313"
АЛГОРИТМЫ ОПТИМАЛЬНОГО И ПРИБЛИЖЁННО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ РАЗВЁРТЫВАНИЯ КОСМИЧЕСКОЙ ТРОСОВОЙ СИСТЕМЫ
© 2011 О.Ю. Заболотнова
Самарский государственный аэрокосмический университет
Поступила в редакцию 07.10.2010
Рассматриваются оптимальные и приближенно оптимальные алгоритмы регулирования, обеспечивающие программное развертывание космической тросовой системы. Система состоит из космического аппарата и полезного груза, соединенных тросом. Производится синтез оптимального регулятора с помощью классического метода динамического программирования Беллмана. В результате анализа классического алгоритма регулирования показана возможность его существенного упрощения практически без потери качества управления. Проведено статистическое моделирование для конкретной программы развертывания тросовой системы, подтверждающее возможность использования предлагаемых приближенно оптимальных алгоритмов регулирования.
Ключевые слова: космическая тросовая система, система регулирования, космический аппарат, математическая модель, синтез регулятора, спуск на тросе.
1. ПОСТАНОВКА ЗАДАЧИ
Проблема управления движением космической тросовой системой (КТС) традиционно разбивается на две задачи: 1) построение программного движения, соответствующего желаемому изменению состояния системы; 2) синтез алгоритмов регулирования, обеспечивающих реализацию программного движения при действии различных возмущений. В данной работе проводится сравнительный анализ различных алгоритмов регулирования на примере движения КТС, состоящей из двух тел: базового космического аппарата (КА) и полезного концевого груза. Развёртывание рассматриваемой КТС производится или с целью перемещения полезного груза (малого спутника) на более высокую орбиту, или для доставки полезного груза в заданный район земной поверхности. В последнем случае груз представляет собой спускаемую капсулу.
Построение и сравнение различных алгоритмов регулирования производится с использованием достаточно простой математической модели движения КТС, допускающей применение как классических методов синтеза регуляторов [1], так и методов, основанных на прямой минимизации выбранных критериев регулирования. В последнем случае используются численные методы нелинейного программирования. Однако применение прямой оптимизации переходных процессов в системе регулирования требует некоторого упрощения структуры регулятора, что и производится в работе. После упрощения регулятора методы синтеза, основан-
Заболотнова Ольга Юрьевна, аспирант кафедры динамики полёта и систем управления. E-mail: [email protected]
ные на прямой минимизации выбранных критериев регулирования, применяются уже в сочетании с более сложными моделями движения КТС. Применение более сложных моделей движения КТС позволяет учесть при проектировании системы регулирования особенности работы управляющего механизма, ограничения на параметры движения КТС и концевого груза, дискретность работы системы регулирования, то есть повысить надёжность и качество проектирования системы управления. В качестве примера приводятся результаты статистического моделирования движения КТС при её развёртывании в вертикальное положение, подтверждающие возможность применения полученных приближенно оптимальных алгоритмов регулирования.
2.УРАВНЕНИЯ ДВИЖЕНИЯ ТРОСОВОЙ СИСТЕМЫ
Для сравнения различных алгоритмов регулирования используются достаточно простые уравнения движения КТС, записанные в подвижной орбитальной системе координат Сх0у0 (рис. 1), где С - центр масс КА, ось Сх0 направлена по радиус-вектору КА, ось С20 параллельна вектору кинетического момента орбитального движения КА. В этой модели трос рассматривается как невесомая и нерастяжимая механическая связь. В качестве обобщённых координат можно использовать два угла в, в и длину троса ^ (рис. 1). Углы в, в в этом случае определяют переход от орбитальной Сх0 у0 20 к тросовой системе координат Схт Ут 2Т (рис.1).
Для вывода уравнений движения грузамассой т удобно применить классический метод Лагранжа
Рис. 1. Задание обобщённых координат Ь, в, в в орбитальной подвижной системе координат
d_
dt
Л
d qi
дГГ,
д qi
= Qr
(!)
T =
1 c
1 (■
—m x
2 V
2 -2 • 2 \ x2 + У2 + ^2 ), (2)
x = xo cos p- yo sin p , y = yo cosp + xo sinp, г = zo.
(3)
L20 + 2LL(0 + Q cos в) - L2Q2 sin в cos в sin2 р --LQ2R0 sin в cos в + L ft2 sin в cos в - (4)
-2L2Qpcos2 в sin p = -
m
L cos2 в в + 2LL0 cos2 в + LL Q sin 2в sin в --L2Op sin20 + 2L2Qвcos2 вslnв +
+L2Q2 cos2 в sin в cos в - LRqQ2 cos в sin в = ——.
m
Обобщённые силы определяются из выражений
дП
Qp
где Тс - кинетическая энергия системы;
,4 и Qi (I = 1,2,3 ) - обобщённые координаты, скорости и силы;
41 = Ь , 42 = в , 4з = Р .
Предположим, что масса груза ^ много меньше массы базового КА, тогда изменением его орбиты можно пренебречь и считать движение КА заданным. В этом случае кинетическая энергия в уравнениях (1) представляет собой кинетическую энергию концевого груза
Ql = Qo -Qp
T
dL
дП -~дв '
дП -~др'
(5)
где - П =
Km
потенциальная энергия цен-
трального гравитационного поля,
r =
fx2 + y 2 + z 2 =
где х, У и 2 - координаты груза в орбитальной геоцентрической системе координат (оси орбитальной геоцентрической системы координат и системы координат Сх0у0г0 параллельны).
В соответствии с заданием описанных систем координат имеем
=-JL2 + Rо2 - 2LR0 cos в cos в ;
К - гравитационный параметр Земли;
Т - сила натяжения троса;
О - угловая скорость орбитального кругового движения КА.
Проводя дифференцирование потенциальной энергии в соответствии с выражениями (5), получим
где Xo = Ro - L cos в cos в ;
yo = -L sin в ; zo = L cos в sin p.
Подставляя соотношения (2), (3) в уравнения (1) и взяв соответствующие производные, получим
L - L(Q2 +в2) - 2ÓQL cos в + +RoQ2 cos в cos в - р2L cos2 в +
+LQ2 cos2 в sin2 р - LQp sin р sin 2в = ,
m
Km
Ql =--3-(L -R0 cosocosв) -T,
r
Qo-
Km
-3- LRo sin в cos в
(6)
r Km
Qp =--3- LRo cos в sin в
r
Уравнения (4), (6) можно упростить при условии, что Ь / Яо << 1. Тогда раскладывая
r
функцию 1/г 3 в ряд Тейлора по переменной Ь и сохраняя только линейные слагаемые, получим
dy dr
= В(т) y + m Áu,
(9)
L"-](0,)2 -201Leos¡5-(в)2Leos2 0 + где y = Áx ,а вектор m = (0,1,0,0,0,0).
+L eos2 0 sin2 в- Le' sin в sin 20 -
T
-3L eos2 0eos2 в =
mQ
2
Причём матрица B(t) имеет следующую структуру
L20"+ 2LL '(0'+ eos в) - L2 sin 0 eos 0 sin2 в B(t) = +]2(в')2 sin 0 eos 0- 2]}в eos1 0sin в + +3L2 sin 0 eos 0 eos2 в = 0,
(0 1 0 0 0 0
В21 0 В23 В24 В25 В26
0 0 0 1 0 0
В41 В42 В43 В44 В45 В46
0 0 0 0 0 1
V В61 В62 В63 В64 В65 В66
■ (10)
L2 eos2 0 в"+ 2LL' в' eos2 0 + LL' sin 20 sin в -L20' в'sin 20 + 2L20 'eos2 0sin в+ +2 L2 eos2 0sln2в = 0.
(7)
Уравнения (7) записаны для круговой орбиты КА, поэтому K = Q 2 R 0 , и для безразмерного времени т = Q t
где Bjj = дFj / dXj
Так, например, Вц =
д Vl '
д l
. Поэтому
2 2 2 Вц =Щ+ 2^0 eos в + ®в eos 0-
.г * 2 /"i * 2 /■> * /■> * ^
Функцией управления в системе (7) являет- - eos 0sin в + ®esin Psin20 +
ся величина u = - T / m Q .
3.ЛИНЕАРИЭАЦИЯ УРАВНЕНИЙ ДВИЖЕНИЯ
+3eos2 0eos2 в,
В23 = -o^Lsin20 + Lsin20sin в +
Для применения классического метода синтеза регуляторов, основанного на принципе Бел-лмана, систему (7) необходимо линеаризовать относительно некоторой номинальной траектории. Стандартная процедура линеаризации системы (7) относительно номинальной траектории в = —2(0 Lsin R — 4Lcos20sin2^ + заключается в представлении решения системы 25 0
и функции управления в виде
+ 2]а>в sin в eos 20 - 3L sin 20eos2 в, В24 = 2La>0 + 2L eos в
x (т) = x 0 (т) + Á x (т) 0,
u (т) = W (т) + Á u (т), (8)
= (], Vl ,0, 0)0 , в, (Ов ) -вектор пере-
где x
менных состояния системы;
о0 = d0 / dT , 0в = dв / dT
+]о>в eos в sin 20,
2
В26 = 2ов]eos 0 + Lsinвsm20,
В41 = 2-2(00+ eos в), L
x 0(т) и u °(т) - номинальные траекто- В42 = -—(о0 + eos в)
0
2
рия и управление;
А х (г) - вектор отклонений переменных состояния от своих номинальных значений;
А и ( г ) - поправки к номинальному управлению.
После проведения процедуры линеаризации, получим
L
2 2
В43 = eos 20 sin в-0в eos 20 -
2
-2oflsin20smв-3eos20eos в,
В 44 = - 2
L '
VL
B45 = 2—^sin в + 4 sin в cos в sin 2в +
L
2
+2ap cos в cos в,
2
B46 =-а в sin2e + 2 cos в sin в, _ _ VL VL sin 2в . _
B61 = 2LL Фв + -2—2-, sm P,
L L cos в
B 2 1 sin2e . _ B62 =-Тав~--~sin в,
L P L cos2 в
B
63 /
' VL л
--L sin в + Фв^в
v L
X
X
2cos2в +
sin2 2вЛ cos2 в
cos2 в'
B
64
ф
sin 2в cos2 в
- 2sin в
B65 =-
VL ^2в L cos в -
L cos2 в ,
- 2ов cos в — 4cos2e,
В _ 2 Vl . sin2e В66 _—2—r +Юв—.
L cos2 в
Учитывая, что в номинальном режиме развёртывания КТС обычно реализуется плоский случай движения в _ со в _ 0 , то структура матрицы В (10) ещё более упрощается
В(т) =
(0 1 0 0 0 0 1
B21 0 B23 B24 0 0
0 0 0 1 0 0
B41 B42 B43 B44 0 0
0 0 0 0 0 1
v 0 0 0 0 B65 B66 J
(11)
После того как определены матрица В и вектор m, нетрудно проверить критерии управляемости для системы (9). Так, в соответствии с критерием управляемости Калмана [2] необходимо составить матрицу
M = (m(r\В(т)т(т), B2(r)m(r), ...Bw-1(r)m(r)),
(12)
размерностью n х n , в которой её составляю-
щие соединяются по горизонтали.
Поэтому, если L0 (т ) ^ 0 , то матрица M будет иметь ранг rang (M ) _ 4 < 6 , что указывает на неуправляемость системы (9). Неуправляемость системы (9) связана с невозможностью, изменяя только силу натяжения троса, компенсировать возмущения по переменным в и Юр , что соответствует выводам работы [3].
Так как система (9) неуправляема по переменным в , Юв , то синтез оптимального регулятора имеет смысл производить для плоского случая в _ о в _ 0 .
4. МЕТОДЫ СИНТЕЗА РЕГУЛЯТОРА
Сформулируем задачу оптимального управления системой (9) при решении задачи регулирования. В начальный момент Tq система (9) находится в состоянии yq , необходимо определить такое управление A u (т) , которое переведёт систему в заданное конечное состояние yk _ У (тk ) _ 0 , где тk - конечное время. Обычно требуется, чтобы переход из точки y0 в точку yk (переходный процесс) был в определённом смысле наилучшим из всех возможных переходов.
Для количественного сравнения различных допустимых управлений вводят критерий оптимальности, который, как правило, для линейной системы (9) представляют в виде некоторого квадратичного функционала [1]
Tk * 2
J _ J (У ay + c Au )dT, (13)
0
где c > 0; *
y - транспонированный вектор У
(вектор-строка);
a - квадратная положительно определенная симметричная матрица.
Классическим подходом при решении задачи оптимального регулирования для системы (9) с критерием (13) является применение принципа динамического программирования. Применение этого принципа к линейным системам при решении задачи регулирования составляет основу метода аналитического конструирования оптимальных регуляторов (АКОР) [1].
Применение этого метода даёт следующее оптимальное управление
A 0 1 dW
Au _---m (14)
2c dy , ()
где функция W (y, т) удовлетворяет уравнению Беллмана
* дж дж 1 т ,2 л (15)
у ау + — +—В(г)у-—(— т) = 0. (15)
от ду 4с ду
Так как уравнение (15) представляет собой неоднородное уравнение и неоднородность определяется квадратичной формой у ау, то частное решение этого уравнение ищется тоже в виде квадратичной формы
ж(у,т) = ЁЁ АаГ(тТ>уауГ = у А(т)у
а у
(16)
где А(г) - матрица неизвестных функций.
Проводя в уравнении (15) перемножение матриц и приравнивая коэффициенты при одинаковых степенях уауу ( а, у = 1, 2, ...4 ; а > у ), получим систему обыкновенных дифференциальных уравнений относительно функций Аау(т)
СА
-ау
+
с аау - Ё (АкаВку + АкуВка ) +
ст к=1
1 п / \п ( \ (17)
- Ё (Акатк ) Ё (Акутк )
ск=1
к=1
В качестве граничных условий при решении (17) используются условия Аау(тк ) = 0 [1]. При этом функции Аау (т) получаются путём численного интегрирования системы (17) с отрицательным шагом до момента, когда т = то (обычно то = 0 ). Зная Аау(т) и подставляя функцию (16) в выражение (14), нетрудно представить его через коэффициенты оптимального регулятора в виде
А и (т) = Ё Ру(т) уу
У=1
1
(18)
Т = т О2( аЬ° + ЬУо - сЬК). (19)
где а о = 4.6 , Ь о = 3.5 , с о = 1.6 - параметры закона;
Ьк = 3ооом - конечная длина троса; тк = 6.9 - конечное время.
На рис.2 показано изменение коэффициентов обратной связи Р1д(т) (Р1(т) - пунктирная линия, р2 (т ) - сплошная линия), вычисленное в соответствии с методом АКОР в случае, когда весовые коэффициенты критерия (13) равны с = о. 1, а = Е , где Е - единичная матрица. Закон (19) близок к закону, который использовался в тросовом эксперименте УЕБ2 [6], проведенном на КА "Фотон М3" в сентябре 2007 года, на первом этапе развёртывания. При управлении в этом эксперименте измерялись только ошибки по длине и скорости выпуска троса, то есть полагалось, что р3 4 (т ) = о . Поэтому здесь также было проверена такая возможность упрощения регулятора. Оказалось, что такое упрощение регулятора практически не изменяет величину критерия оптимальности (13) (менее одного процента) и вполне оправдано. Дальнейшее упрощение регулятора связано с использованием постоянных коэффициентов обратной связи в сочетании прямыми методами оптимизации. В этом случае минимизируется критерий оптимальности (13), который после упрощения регулятора зависит только от двух параметров 3 ( Р1, р2 ) . В этом случае регулятор настраивается путём оптимизации заданного критерия непосредственно по нелинейной модели движения с помощью методов нелинейного программирования. Преимуществом такого подхода является использование его в сочетании с любой (даже очень сложной) моделью движения и любым (даже неклассическим) критерием оп-
где Ру (т) = -— Ё Аа у (т) та - коэф-с а =1
фициенты оптимального регулятора, п = 4 .
В работе [4] предлагается прямые методы синтеза регулятора при управлении КТС. В этом случае коэффициенты регулирования Ру считаются постоянными и подбираются путём минимизации критерия (13) методами нелинейного программирования путём неоднократного численного интегрирования исходной системы (7).
5. СРАВНЕНИЕ АЛГОРИТМОВ РЕГУЛИРОВАНИЯ
Сравнение различных алгоритмов регулирования проводится на примере развёртывания КТС в вертикальное положение по закону [5]
Рис. 2. Изменение коэффициентов обратной связи критерия оптимальности, вычисленных с использованием метода АКОР
тимальности, а также с возможностью учёта некоторых ограничений, например, ограничений на вращательное движение груза, на силу натяжения троса и других.
При решении задачи прямым методом применялись: 1) на предварительном этапе простой случайный поиск по параметрам р -, р 2 ; 2) на заключительном этапе циклический метод координатного спуска [7]. Результаты оптимизации: коэффициенты обратной связи рх = 3.723 8, р2 = 5.8261 . Для сравнения полученных алгоритмов регулирования было проведено статистическое моделирование процесса развёртывания КТС по закону (19) при количестве испытаний 500. Случайно разыгрывались относительная скорость отделения груза от КА и направление отделения по отношению к местной вертикали. Скорость изменялась в пределах Уг (0) е [2.3 5 м / с,2.65 м / с], направление отделения в пределах в (0) е [-5 град, 5 град] . Рассматривал-
Рис. 3. Гистограмма распределения значений критерия оптимальности с коэффициентами обратной связи, вычисленными с использова-
3x10 3
Рис. 4. Гистограмма распределения значений критерия оптимальности с коэффициентами обратной связи, вычисленными с использованием прямого метода оптимизации
ся плоский случай движения КТС и равномерные законы распределения указанных величин. Гистограммы распределения критерия оптимальности для случая использования коэффициентов метода АКОР и коэффициентов, полученных прямым методом оптимизации, приводятся соответственно на рис. 3 и рис. 4. Сравнение приведенных графиков показывает, что гистограммы отличаются незначительно, что подтверждается незначительным отличием оценок математических ожиданий (288 и 252) и стандартных отклонений (199 и 186) для критерия оптимальности (13).
6. ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. С использованием уравнений Лагранжа построена математическая модель движения КТС, предназначенная для сравнения оптимальных и приближенно оптимальных алгоритмов регулирования при управлении движением КТС.
2. Проведён синтез линейного регулятора для развёртывания КТС с помощью классического метода динамического программирования Бел-лмана (метод АКОР) и показано, что полученную структуру регулятора можно упростить, учитывая только ошибки по длине и скорости выпуска троса.
3. Произведено сравнение регуляторов, построенных с помощью классического метода и с помощью прямого метода оптимизации при постоянных коэффициентах обратной связи, и установлено, что переходные процессы в системе регулирования в этих случаях мало отличаются друг от друга.
4. Проведено статистическое моделирование процесса развёртывания КТС, на основании которого построены гистограммы распределения критерия оптимальности для оптимальных и приближенно оптимальных алгоритмов регулирования, и показано, что статистические оценки основных параметров распределения для рассматриваемых алгоритмов отличаются незначительно.
Данная работа выполнена при поддержке Министерства образования и науки РФ в рамках реализации мероприятия 1.3.2 ФЦП "Научные и научно-педагогические кадры инновационной России" на 2009-2013 годы.
СПИСОК ЛИТЕРАТУРЫ
1. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с.
2. Гроп Д. Методы идентификации систем. М.: Мир, 1979. 304 с.
3. Белецкий, В.В., Левин Е.М. Динамика космических тросовых систем. М.: Наука, 1990. 336 с.
4. Заболотнова О.Ю. Выбор критерия при решении задачи регулирования программного развёртывания космической тросовой системы / / Исследовано в России: интернет-журнал. 2007-070. URL: http:// zhurnal.ape.relarn.ru/articles/2007/070.pdf (дата обращения 15.09.2010)
5. Наумов С.А. Управление развёртыванием орбиталь-
ной тросовой системы для спуска малой капсулы: дисс.... канд. техн. наук. Самара, 2006. 93 с.
6. First Mission Results of the YES2 Tethered SpaceMail Experiment / M. Kruijff, E. Heide, M. Stelzer // AIAA-2008-7385.
7. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1988. 198 с.
THE ALGORITHMS OF OPTIMAL AND APPROXIMATELY OPTIMAL CONTROL FOR DEPLOYMENT OF SPACE TETHER SYSTEM
© 2011 O.Yu. Zabolotnova
Samara State Aerospace University
The optimal and approximately optimal algorithms of regulation providing program expansion space tether system are considered. The system consists of a spacecraft and a payload connected by a tether. Synthesis of an optimal regulator by means of a classical method of dynamic programming Bellman is made. As a result of the analysis of classical algorithm of regulation possibility of its essential simplification practically without loss of quality of control is shown. Statistical modeling for the concrete program of expansion tether systems, confirming possibility of use of optimum algorithms of regulation offered approximately is spent. Key words: space tether system, regulation system, spacecraft, mathematical model, synthesis of regulator, deorbiting by tether.
Olga Zabolotnova, Post-Graduate Student at the Flight Dynamics and Control Systems Department. E-mail:[email protected]