Научная статья на тему 'Оптимальный синтез в задаче одноосной стабилизации спутника при наличии фазовых ограничений'

Оптимальный синтез в задаче одноосной стабилизации спутника при наличии фазовых ограничений Текст научной статьи по специальности «Математика»

CC BY
50
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАБИЛИЗАЦИЯ УГЛОВОГО ДВИЖЕНИЯ СПУТНИКА / ANGULAR MOTION STABILIZATION OF A SATELLITE / ФАЗОВЫЕ ОГРАНИЧЕНИЯ / PHASE CONSTRAINTS / НЕОБХОДИМОЕ УСЛОВИЕ ОПТИМАЛЬНОСТИ / NECESSARY OPTIMALITY CONDITION / ОПТИМАЛЬНЫЙ СИНТЕЗ / OPTIMAL SYNTHESIS

Аннотация научной статьи по математике, автор научной работы — Александров Владимир Васильевич, Черемисин Владимир Владимирович

Рассматривается задача оптимальной стабилизации тангажных колебаний спутника. Для редуцированной системы формулируется задача оптимального управления с фазовыми ограничениями и устанавливается область управляемости. С целью определения оптимальных траекторий, в том числе характера взаимодействия траектории с границей фазового ограничения и числа граничных участков, используется необходимое условие оптимальности (принцип максимума в задаче с фазовыми ограничениями). В полученной области строится оптимальный синтез.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимальный синтез в задаче одноосной стабилизации спутника при наличии фазовых ограничений»

СПИСОК ЛИТЕРАТУРЫ

1. Garric I.E., Rubinow S.E. Flutter and oscillating air-force calculations for an airfoil in a two-dimensional supersonic flow // NACA. 1946. Report N 846.

2. Nelson H.C., Cunningham H.J. Theoretical investigation of flutter of two-dimensional flat panels with one surface exposed to supersonic potential flow // NACA. 1956. Report N 1280.

3. Yang T.Y. Flutter of finite element panels in supersonic potential flow // AIAA Journal. 1975. 13, N 11. 15021507. (Пер. с англ.: Исследование флаттера панелей в сверхзвуковом потенциальном потоке методом конечных элементов // Ракетная техника и космонавтика. 1975. 13, № 11. 110-117.)

4. Дун Мин-Дэ. Об устойчивости упругой пластинки при сверхзвуковом обтекании // Докл. АН СССР. 1958. 120, № 4. 726-729.

5. Новичков Ю.Н. Флаттер пластин и оболочек // Механика деформируемого твердого тела. Итоги науки и техники. Т. 11. М.: ВИНИТИ, 1978. 67-122.

6. Веденеев В.В. Флаттер пластины, имеющей форму широкой полосы, в сверхзвуковом потоке газа // Изв. РАН. Механ. жидкости и газа. 2005. № 5. 155-169.

7. Веденеев В.В. О высокочастотном флаттере пластины // Изв. РАН. Механ. жидкости и газа. 2006. № 2. 163-172.

8. Кийко И.А., Показеев В.В., Кадыров А. К постановке задач об аэроупругих колебаниях пластины // Изв. ТулГУ. Сер. Матем. Механ. Информ. 2007. 13, вып. 2. 91-97.

9. Ларионов Г.С. Нелинейный флаттер упруговязкой пластины // Изв. АН СССР. Механ. твердого тела. 1974. № 4. 95-100.

10. Матяш В.И. Флаттер вязкоупругой пластинки // Механ. полимеров. 1971. № 6. 1077-1083.

11. Кийко И.А. Флаттер вязкоупругой пластины // Прикл. матем. и механ. 1996. 60, вып. 1. 172-175.

12. Кийко И.А., Показеев В.В. Колебания и устойчивость вязкоупругой полосы в потоке газа // Докл. РАН. 2005. 401, № 3. 342-344.

13. Показеев В.В. Флаттер упругой или вязкоупругой пластины в непоршневой теории колебаний // Пробл. маши-ностр. и автоматиз. 2008. № 1. 77-80.

Поступила в редакцию 13.05.2009

УДК 51-72

ОПТИМАЛЬНЫЙ СИНТЕЗ В ЗАДАЧЕ ОДНООСНОЙ СТАБИЛИЗАЦИИ СПУТНИКА ПРИ НАЛИЧИИ ФАЗОВЫХ ОГРАНИЧЕНИЙ

В.В. Александров1, В.В. Черемисин2

Рассматривается задача оптимальной стабилизации тангажных колебаний спутника. Для редуцированной системы формулируется задача оптимального управления с фазовыми ограничениями и устанавливается область управляемости. С целью определения оптимальных траекторий, в том числе характера взаимодействия траектории с границей фазового ограничения и числа граничных участков, используется необходимое условие оптимальности (принцип максимума в задаче с фазовыми ограничениями). В полученной области строится оптимальный синтез.

Ключевые слова: стабилизация углового движения спутника, фазовые ограничения, необходимое условие оптимальности, оптимальный синтез.

The optimal stabilization problem for the pitching oscillations of a satellite is considered. For the reduced system, an optimal control problem with phase constraints is formulated and a controllability domain is constructed. A necessary optimality condition (the maximum principle for the optimal control problem with phase constraints) is used to determine optimal trajectories, the nature of interaction between a trajectory and the phase constraint boundary,

1 Александров Владимир Васильевич — доктор физ.-мат. наук, проф., зав. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: vladimiralexandrov366@hotmail.com.

2 Черемисин Владимир Владимирович — асп. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: cheremisin vv@mail.ru.

and the number of boundary segments. An optimal synthesis is proposed in the constructed domain.

Key words: angular motion stabilization of a satellite, phase constraints, necessary optimality condition, optimal synthesis.

Рассматривается спутник, представляющий собой абсолютно твердое тело с центральными постоянными моментами инерции A, B, C. Вдоль одной из осей инерции установлен двигатель-маховик, собственный кинетический момент которого h в силу конструктивных особенностей ограничен по модулю величиной hM. Рассматриваются линеаризованные уравнения тангажных колебаний в отклонениях спутника, движущегося по круговой орбите под действием гравитационного момента Mgrav и моментов других внешних сил M:

' а = p,

Ap = Mgrav - U + M, (1)

h = u.

Упростим систему (1) в предположениях, что отсутствуют внешние моменты: M = 0 и тензор инерции представлен диагональной матрицей с одинаковыми главными элементами: A = B = C = 1, в силу чего получим Mgrav = 0. Тогда редуцированная трехмерная система приобретает простой вид:

' а = p,

Р = -u, (2)

. h = u.

Сформулируем задачу оптимального управления с фазовыми ограничениями:

(x(t) = f (x(t),u(t)),

\x(t) = (a(t),p(t),h(t))T; ( )

x(0) = (ao,po,ho)T, |ho | < hM; (4)

1 u(t) | < 1; (5) 1

2

фг(х(Т ))= a(T) = 0,

ф2(х(Т))= p(T) = 0, (7)

I |h(T)| <hM;

G(x(T),T)= T ^ min . (8)

Итак, имеем автономную систему (2) общего вида (3) с начальными условиями (4), ограничениями на управление (5) и ограничениями на возможные значения фазовых координат (6). В момент времени t = T траектория системы впервые попадает на многообразие M, задаваемое системой (7). Задача оптимизации состоит в определении такой кусочно-непрерывной функции u0(t), при которой соответствующая траектория x0(t) доставляет минимум функционалу (8).

В качестве первого шага определим область управляемости системы, находящейся в точке с фазовыми координатами (ao,Po,ho)T, по переменной p. Связь между значениями фазовых координат p и h представляется в виде

t

S(x(t)) = -(ti2(t)~h2M)^ 0; (6)

f:

p(t) = po - j h(r) dr = po - (h(t) - ho).

Поскольку р(Т) = 0, \Н(Т)| < Нм, то область значений фазовых координат (ао,Ро,Ьо)Т, для которых в области управляемости системы лежит точка р = 0, такова:

-Нм - Но <ро <Нм - Но. (9)

Значение фазовой переменной a(t) определяется интегрированием первого уравнения в (2). Ввиду соотношения (9) область управляемости Da системы (1) по фазовой переменной а совпадает со всей числовой прямой: Da = R. Таким образом, область управляемости D системы (1) можно представить в виде

D = {(a,p, h) е R3 : —то < ао < то, —hM — ho < po < hM — ho, —hM ^ h0 ^ hM}•

Решив задачу отыскания области, в которой становится возможным проведение синтеза, обратимся теперь к необходимому условию оптимальности в задаче с фазовыми ограничениями [1-3]. Пусть [x0(t),u0(t)] — оптимальный процесс для задачи (2)-(8). Тогда существуют кусочно абсолютно непрерывная функция ф : [0,T] ^ R3, функция фо : [0, T] ^ R, кусочно абсолютно непрерывная неотрицательная функция П : [0,T] ^ R+, вектор V е Rq, Vj ^ 0, число Ао ^ 0 и вектор в е R2, такие, что выполнены следующие условия:

(Ао, фо,Ф(£),п(£),в1 ,в2, Vi,•••, Vq) = 0, t е [0, T]; (10)

n(t)S (x(t)) = 0; (11)

ф о = 0,

ф = — Hx + nSx, (12)

H = фо + (ф, f) — функция Понтрягина;

Ф(т+)= ф(т-) + VjSx; (13)

| фо(т ) = — Ао, (14)

\ф(Т) = —АоСх(Т) — (в, Фх(Т));

max H (жо (t), u(t)) = H (x°(t),u° (t));

|u|<1

H(жо(t),u()(t)) = 0 почти всюду на [0,T].

Для задачи (2)-(8) функция Понтрягина имеет вид H = фо + ф1а + [—Ф2 + фз]и, сопряженная система — вид

ффо = 0, фо(Т) = —Ао, откуда фо = —Ао ^ 0; ффi = 0, ф1(Т) = —в1, откуда ф1 = фо; ф2 = —ф1, ф2 (T) = —в2, откуда ф2 = —фоt + фо; фф3 = nh, ф3 (T) = 0, поскольку |h(T)| < hM •

Внутри области фазового ограничения S(x) < 0 оптимальное управление определяется знаком функции переключения Ф: u^t) = sign $(t), Ф(^ = —ф2 + ф3.

Для установления вида траекторий воспользуемся понятием порядка фазового ограничения, т.е. номером первой полной производной по времени функции S(ж), задающей границу фазового ограничения (11). Номер производной определятся только тогда, когда управление u входит в явном виде. В задаче (2)-(8) фазовое ограничение имеет порядок p = 1, так как S(1)(x,u) = hw.

В работе [2] исследуются возможные типы характера взаимодействия траектории при выходе на границу фазового ограничения S(ж) = 0 (далее — просто граница) и самой границы. Для случая p = 1 траектория при выходе на границу фазового ограничения продолжает движение по ней до момента схода, образуя тем самым граничный участок. Таким образом, оптимальная траектория будет состоять из участков траекторий внутри области S(x) < 0 и граничных участков.

В общем случае для каждого граничного участка сопряженные переменные системы при входе траектории на границу и сходе с границы испытывают разрыв в соответствии с условиями (12). В работе [2] для случая p =1 показано, что если в точках входа/схода управление разрывно, то сопряженные переменные непрерывны в этих точках, т.е. Vj = 0. Проверим выполнимость этого условия. При движении по границе h = ±hM, и тогда в силу системы уравнений (2) граничное управление ub = 0. Внутри области S(ж) < 0 управление определяется знаком функции переключения u^t) = sign Ф^). Поскольку сингулярные участки отсутствуют, то условие разрывности управления выполнено и сопряженные переменные непрерывны во всех точках входа/схода, а значит, в (13) Vj = 0.

Определим вид функции n(t). Внутри области S(x) < 0 в силу условия дополняющей нежесткости n(t) = 0. На граничном участке [ti, ¿2] С [0, T] управление пь = 0, тогда ввиду условия максимума функции H

Ф(*) = —02(t) + ^s(t) = 0. (15)

Продифференцируем последнее равенство. Используя полученные результаты, будем иметь

rj(t) = sign к,

t e [ti,t2].

(16)

Определим теперь возможное количество граничных участков. Докажем, что оптимальная траектория содержит не более одного граничного участка. Предположим, что граничных участков два — [ti, ¿2] и [¿з, ¿4], ti > 0, ¿4 < Т, ¿2 < ¿3. В этом случае на каждом участке справедливо равенство (15), в частности ■02^2) = 03(¿2), 02^з) = 0з(¿з). Поскольку на (¿2, ¿з) траектория находится внутри области ограничения S(x) < 0, то n(t) =0 на (¿2, ¿з) в силу условия дополняющей нежесткости и 0з(^ = const на (¿2, ¿з). Тогда 02(t2) = 02(¿з), но поскольку 02(t) = —0 0t + 00 — линейная функция времени, то такое равенство возможно, если либо ¿2 = ¿з, что противоречит предположению ¿2 < ¿з, поскольку тогда [t 1, ¿4] — единственный граничный участок, либо 0° = 0, и тогда 02(t) = 0°. Если имеет место второй случай, то на [0,T] n(t) = 0 в силу (16), и тогда 0з(t) = 0. Поскольку на границе выполнено равенство (15), то 02(t) =0 на [0,Т]. В силу условия стационарности 0o(t) =0 на [0,Т]. Таким образом, нарушено условие нетривиальности (10), а следовательно, рассматриваемая траектория не может быть оптимальной.

Полученные результаты позволяют определить траектории, удовлетворящие необходимому условию и, таким образом, являющиеся претендентами на оптимальность. В построенной выше области D удается решить задачу синтеза оптимального управления. Введем обозначения для областей:

S+ = к) G К3 : а = — ^р2, — км — h <р < км — к, —км ^ к ^ км

S- = |(а, р, к) G М3 : а = ^ р2, —км — к < р < км — к, —км ^ к ^ км },

В+ = к) е М3 : a ф -^p2signp, -2км<Р<0, h = hM },

В_ = |(a,p, к) e M3 : a ф p2 signp, 0 < p < 2hM, h = -/гм},

I+ = {(a,p, h) e M3 : a > — i p2 sign p, —км — h <p < 1%m — h, —км < h < 1%m

/_ = {(a,p, h) e M3 : a < — i p2 sign p, —hM — h <p < км — к, —км < к < км }•

Области попарно не пересекаются, а их объединение дает область синтеза D. Окончательно оптимальный синтез в задаче (2)—(8) представляется в виде

+1, (а,р,к) е (1+ и 5+); и0 = <( 0, (а,р,к) е (В+ и В-); -1, (а,р,к) е (I- и 5-).

Проиллюстрируем полученный результат на примере (рисунок). Предположим, что км = 1 ив начальный момент времени состояние системы характеризуется точкой А с фазовыми координатами (0,86; -0,2; 0,6). Оптимальная траектория для этой задачи состоит из трех участков: два участка внутри области ограничения (АВ и С^) и один участок по границе между ними (ВС). На рисунке схематически изображены граница области синтеза, имеющая вид скошенного па-

Оптимальная траектория для рассматриваемого в примере случая

раллелепипеда, вытянутого вдоль оси а, поверхность переключения и траектория задачи. После старта двигатель-маховик раскручивается, достигает верхнего ограничения для величины кинетического момента, вследствие чего управление отключается и система продолжает движение с раскрученным маховиком по границе до достижения фазовой траекторией поверхности переключения. Затем включается управление с противоположным знаком, маховик начинает замедлять вращение, в результате чего система сходит с границы фазового ограничения и продолжает движение до достижения терминального множества в точке D с координатами (0 ; 0 ; 0,4).

Исследование задачи может быть дополнено случаем прихода системы на терминальное множество при движении по границе фазового ограничения, т.е. если |h(T)| = Нм. Отличие данной задачи от рассмотренной выше будет заключаться в расширении области управляемости системы D и видоизменении условия трансверсальности (14) в формулировке необходимого условия оптимальности в задаче с фазовыми ограничениями. В данной статье этот случай не рассматривается.

Работа выполнена при финансовой поддержке РФФИ (грант № 10-01-00182).

СПИСОК ЛИТЕРАТУРЫ

1. Гамкрелидзе Р.В. Оптимальные по быстродействию процессы при ограниченных фазовых координатах // Докл. АН СССР. 1959. 125, № 3. 475-478.

2. Maurer H. On optimal control problems with bounded state variables and control appearing linearly // SIAM J. Control Optim. 1977. 15. 345-362.

3. Милютин А.А., Дмитрук А.В., Осмоловский Н.П. Принцип максимума в оптимальном управлении. М.: Изд-во ЦПИ при механико-математическом факультете МГУ, 2004.

Поступила в редакцию 30.10.2009

УДК 539.3:534.1;539.4:624.07

ОБ УСТОЙЧИВОСТИ СТЕРЖНЕЙ С ПЕРЕМЕННОЙ ЖЕСТКОСТЬЮ

В. И. Горбачев1, О. Б. Москаленко2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассматривается неоднородный по длине стержень с переменным поперечным сечением. Ось стержня, проходящая через центры тяжести всех поперечных сечений, — прямая линия. Стержень сжимается продольной силой, приложенной в центре тяжести крайнего поперечного сечения. В работе рассматривается случай потери устойчивости прямолинейной формы равновесия стержня, когда наряду с прямолинейной формой возможна искривленная форма. Получены приближенные аналитические выражения для критической сжимающей силы в четырех случаях закрепления концов периодически неоднородного стержня. Для стержня со ступенчато изменяющимся поперечным сечением и состоящего всего лишь из одного периода (предельный случай) проведено сравнение расчетов по найденным формулам с ранее известными точными решениями уравнения устойчивости.

Ключевые слова: упругость, устойчивость, неоднородный стержень, метод осреднения.

A heterogeneous in length bar with a variable cross-section is considered. The axis of a bar, which joins the centers of gravity of all the cross-sections, is a straight line. The bar is compressed by a longitudinal force applied to the center of gravity of the boundary cross-section. The article describes the case of stability loss of the straight-line form of equilibrium of a bar, when both, linear and curved forms are possible. Approximate analytical formulas for critical compressive force in four cases of boundary conditions for periodically heterogeneous bar are obtained. In case of a bar with a stepped variation of its cross-section and which consists of only one period

1 Горбачев Владимир Иванович — доктор физ.-мат. наук, проф. каф. механики композитов мех.-мат. ф-та МГУ, e-mail: vigorby@mech.math.msu.ru.

2 Москаленко Ольга Борисовна — студ. каф. механики композитов мех.-мат. ф-та МГУ, e-mail: olga@moskalenko.org.

i Надоели баннеры? Вы всегда можете отключить рекламу.