Научная статья на тему 'ОПТИМАЛЬНАЯ ПО БЫСТРОДЕЙСТВИЮ КОРРЕКЦИЯ ОРБИТЫ СПУТНИКА'

ОПТИМАЛЬНАЯ ПО БЫСТРОДЕЙСТВИЮ КОРРЕКЦИЯ ОРБИТЫ СПУТНИКА Текст научной статьи по специальности «Математика»

CC BY
24
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Труды МАИ
ВАК
Область наук
Ключевые слова
ИДЕАЛЬНАЯ ИМПУЛЬСНАЯ КОРРЕКЦИЯ / ЛИНЕЙНАЯ ДИСКРЕТНАЯ НЕСТАЦИОНАРНАЯ СИСТЕМА / ПРИНЦИП МАКСИМУМА

Аннотация научной статьи по математике, автор научной работы — Ибрагимов Данис Наилевич

В статье рассматривается задача наискорейшей коррекции движения спутника, расположенного на круговой орбите. Коррекция осуществляется посредством двигателей малой тяги, способных создавать ускорение в радиальном и трансверсальном направлении. Управляющие воздействия предполагаются идеальными и импульсными. Доказано, что исходная задача может быть сведена к задаче быстродействия для линейной нестационарной системы с дискретным временем и ограниченным управлением. Изложен критерий оптимальности управления для задачи быстродействия, сформулированный в виде принципа максимума.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ибрагимов Данис Наилевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE MINIMUM-TIME CORRECTION OF THE SATELLITE''S ORBIT

The minimum-time problem of the correction of the movement of the satellite is considered in this paper. The orbit of the spacecraft is assumed to be circular. Correction Correction is carried out by means of low-thrust engines capable of generating acceleration in the radial and transverse directions. Controls are assumed to be ideal and impulsive. It is proved that the initial problem can be reduced to the minimum-time problem for the linear non-stationary system with discrete time and limited control. The solution of the minimum-time problem for a non-stationary linear discrete-time system is based on the use of the class of sets of 0-controllability - such sets of states of the system from which the origin can be reached in N steps, starting with step k. For the case when the set of feasible controls is a strictly convex body with non-empty interior, an analytic description of the sets of 0-controllability is constructed: each set can be represented as the algebraic sum of strictly convex sets, i.e. it is also a strictly convex set. The lemma on the uniqueness of the expansion of the boundary point of the sum of two strictly convex sets is proved. It is possible to construct a criterion for the optimality of the trajectory of the system and control on the basis of this lemma. The trajectory and controls is connected with each other by a system of conjugate vectors. The obtained results are formulated in the form of the maximum principle. It is also proved that the initial state of the conjugate system is a normal to the set of 0-controllabillity, whose boundary point is the initial state of the control system. For the case, when a set of feasible controls is an ellipsoid, an explicit form of optimal control is proposed. It is proved that if the initial state is an internal point, then the maximum principle becomes incorrect, and optimal control is not unique. Nevertheless, an algorithm is proposed that makes it possible to reduce the given case to the considered one. The obtained theoretical results are applied to the problem of correcting the satellite's orbit. The results of the calculations are given in the table.

Текст научной работы на тему «ОПТИМАЛЬНАЯ ПО БЫСТРОДЕЙСТВИЮ КОРРЕКЦИЯ ОРБИТЫ СПУТНИКА»

Труды МАИ. Выпуск № 94

http://trudymai.ru/

УДК 62-40

Оптимальная по быстродействию коррекция орбиты спутника

Ибрагимов Д.Н.

Московский авиационный институт (национальный исследовательский университет), МАИ, Волоколамское шоссе, 4, Москва, A-80, ГСП-3, 125993,

Россия e-mail: rikk.dan@gmail.com

Аннотация

В статье рассматривается задача наискорейшей коррекции движения спутника, расположенного на круговой орбите. Коррекция осуществляется посредством двигателей малой тяги, способных создавать ускорение в радиальном и трансверсальном направлении. Управляющие воздействия предполагаются идеальными и импульсными. Доказано, что исходная задача может быть сведена к задаче быстродействия для линейной нестационарной системы с дискретным временем и ограниченным управлением. Изложен критерий оптимальности управления для задачи быстродействия, сформулированный в виде принципа максимума.

Ключевые слова: идеальная импульсная коррекция, линейная дискретная нестационарная система, задача быстродействия, принцип максимума.

1. Введение

Задача коррекции орбиты спутника известна достаточно давно и рассматривалась в различных монографиях [1-6]. Необходимость управления движением спутниковой системы может быть обусловлена различными факторами, которые можно разделить на две группы. Первая группа факторов связана с невозможностью точно вывести спутник на расчетную орбиту из-за ограниченных технических возможностей. Вторая группа факторов связана с внешними возмущениями, оказывающими негативное влияние на эволюцию траектории спутника. В результате действия данных факторов спутник оказывается в некоторой малой окрестности расчетной траектории, в связи с чем возникает задача коррекции фактической орбиты и удержания спутника в орбитальной струтктуре.

Коррекция движения спутника осуществляется посредством включения двигателей малой тяги. Существуют различные подходы к построению математической модели движения спутника на круговой орбите, которые в конечном счете определяют оптимизационную задачу. В [3-5] изложен стохастический подход, при котором все возмущающие факторы рассматриваются в виде случайных процессов. Известны результаты для вероятностного критерия [7-8]. В [5] предложено решение задачи коррекции с критерием в форме квантили. В работах [1-2] рассматривается

детерминированный подход и задача определения оптимальных моментов времени для проведения коррекции.

Общей характеристикой рассмотренных работ является фиксированное конечное число корректирующих импульсов. Предположение о произвольном количестве управляющих воздействий естественным образом приводит к задаче быстродействия - минимизации числа включений двигателя при заданном терминальном состоянии. Наиболее хорошо известны результаты для задачи быстродействия для линейных автономных систем с непрерывным временем и выпуклым множеством допустимых управлений [9-11]: оптимальное управление в данном случае релейно, т.е. кусочно-постоянно и имеет конечное число точек переключения. Задачи оптимального управления системами с дискретным временем имеют ряд принципиальных отличий от систем с непрерывным временем. Зачастую такие задачи сводятся к решению задач нелинейного программирования [12-15].

Специфика задачи быстродействия для дискретной системы управления связана с трудностью применения классических методов таких, как динамическое программирование [16] и принцип максимума [15]. В связи с чем, в работах [17-19] предложен подход решения задачи быстродействия для дискретных линейных автономных систем с ограниченным управлением. Данный метод базируется на свойствах класса множеств 0-управляемости, которые позволяют сформулировать критерий оптимальности траектории и управления.

Целью исследования является построение математической модели управления движением спутника расположенного на круговой орбите посредством двигателей малой тяги, а также разработка алгоритма, позволяющего провести коррекцию орбиты посредством наименьшего числа включений двигателя. Предположение, что коррекция является импульсной и идеальной приводит к задаче быстродействия для линейной дискретной системы с ограниченным множеством допустимых управлений. Как продемонстрировано, данная система управления является нестационарной, что не позволяет в явном виде применять методы изложенные в [17-18]. В связи с чем, в работе предложено обобщение алгоритмов основанных на множествах 0-управляемости для случая нестационарных систем.

2. Постановка задачи

Рассматривается нестационарная линейная система управления с дискретным временем (А, и)

х(к +1) = А(к) л(к) + ы(к),

х(0) = х0, и(к) е и (к), к = 0,1,2,..., (1)

где x(k) е R" - вектор состояния системы, U = {U (k)}"

k=0

последовательность множеств допустимых управлений, A = {A(k )}^=0 -последовательность матриц системы. Предполагается, что для каждого k е Nи{0} матрица A(k) е R"x" является невырожденной, 0 е int U(k) , U(k) -строго выпуклое компактное множество. Пространство R" предполагается

евклидовым со скалярным произведением, определяемым соотношением

(X, у) = ЗД + ... + Хпуп.

Для системы (1) решается задача быстродействия: для некоторого заданного начального состояния х0 требуется построить набор допустимых управлений, переводящих систему из начального состояния в начало координат за минимальное число шагов Nт1п . Предполагается, что ЫМп < да . Набор управлений и(0) е и(0),..., и* (Ытт -1) е и(-1) называется оптимальным в решаемой задаче быстродействия, если выполнено условие х(Ыт1П ) = 0 . Полученную совокупность состояний {х*(к)}^тг системы (1) на основе выбора на

каждом шаге к = 0, Ит1 п в качестве управляющего воздействия оптимального управления будем называть оптимальной траекторией.

Определим семейство множеств 0-управляемости {X(М, к)}^=0, где X(Ы, к)

представляет собой множество состояний системы (1), для которых существует набор допустимых управлений, переводящих систему, начиная с шага к е N^{0}, в начало координат за N шагов

X (N, к ) =

{х(к) е Яп : Зи(к) е и (к),., и( N + к -1) е и (N + к -1):

х(N + к) = 0}, N е N, (2)

{0}, N = 0.

Тогда условие Nшn < да можно представить в виде

<

<Х)

х0 Е У X(N,0),

N=0

а минимальное число шагов для достижения начало координат определить согласно соотношению

нтт = шт{# е n: хо е x(n,0)}. При этом условие оптимальности траектории [х*(к)}мкТ™ эквивалентно

х(к) Е X(- к, к), к = 0, .

Лемма 1.

Пусть система множеств {X(N, к,к=0 удовлетворяет условию (2). Тогда для любых N е N, к е Nи {0} справедливо представление

X (N, к) = (- Л'1 (к) ■... ■ А'1 (1 + к )р (к +1).

1=0

Доказательство. Пусть х^) е X(N, к). По определению это эквивалентно тому, что найдется набор управлений и (к) Еи (к),...,и(Ы+к-1) Еи (Ы+к-1)

таких, что

0 = х( N + к ) = А( N + к-1) х( N + к-1) + и( N + к-1) = ... = = А( N + к-1) ■...■ А(к) х(к) + А( N+к-1) ■...■ А(к + 1)и(к) + ... +

+ А(N + к-1)и(N + к - 2) + и(N + к-1), х(к ) = ( А( N + к-1) ■...■ А(к))-1 ■ (А( N + к-1) ■...■ А(к + 1)и(к) + ...+ + А(N + к-1)и(N + к - 2)+и(N+к-1)) =

= -A(k)-1u(k) - A(k)-1 • A(k +1)-1 u(k +1) -... - A(k)-1 •... ■■ A(N + к -1)_1u(N + к -1). Тогда по определению алгебраической суммы Минковского верно условие леммы.

Следствие 1.

Пусть семейство множеств {X(N, k)}N,k=0 определяется соотношениями (2). Тогда справедливо рекуррентное соотношение

A(k) X (N+1, k) = X (N, k + 1) + (-U (k)).

3. Дополнительные построения

Для решения задачи быстродействия системы (1) докажем ряд

вспомогательных утверждений. Обозначим через U2 класс всех строго выпуклых компактных множеств:

U2 = {X с Rn : Vx1,x2 e X, Ле (0;1) Лх1 + (1 - Ä)x2 e int X, X - компакт}, Вектор p e Rn \{0} называется опорным к множеству X eU2 в точке х е SX, если

Xс{uеRn:(p,u)<(p,x)}.

Опорной функцией множества X , будем называть функцию, определяемую соотношением

p, X) = max( p, x).

xeX

Нормальным конусом N(x, X) с Rn множества X в точке x ecX

называется множество, состоящее из всех векторов опорных ко множеству X в точке x :

N(x,X) = {p e Rn \{0}: s(p,X) > (p,x)}.

Лемма 2.

Пусть X eU2 , p e Rn . Тогда существует единственный x' e X , удовлетворяющий условию

(p, x ' ) = s( p, X).

Причем x' e dX.

Доказательство. В силу теоремы Вейерштрасса непрерывная по x функция (p, x) достигает своего максимального значения на компактном множестве X . Т.е. существует точка x' e Arg max (p,x).

xeX

Предположим, что найдется x ''e X такой, что x''ф x' и (p, x '') = s(p, X). Тогда i x '' +1 x ' e int X. Следовательно найдется s >0 такое, что

1 x'' +1 x' + sp e int X,

2 2

(p\ x+2 x+s)=\(p,x')+p,x)+s<p, p)=s( p,X)+s<p, p)>s( p,X).

Получаем противоречие. Существует единственный x' = arg max (p, x).

xeX

Поскольку выпуклая по x функция (p, x) на выпуклом компактном

множестве X достигает своего максимума на границе [21], то х' е дX. В силу леммы 2 существует отображение

рх :Я"\{0}^дX, определяемое соотношением

Px(^) = аг8 шах( p,х).

Лемма 2 позволяет сформулировать в виде следствия важное свойство множеств из класса и2 .

Следствие 2. Пусть X е^ . Тогда для любых двух различных х1, х2 ЕдX

верно

N ( х1, X ) п N (х 2, X ) = 0. Сформулируем свойства класса и2 в виде следующих лемм.

Лемма 3. Пусть А е Япхп - невырожденная матрица, X е и2. Тогда

1) AдX = д( AX); п) N (Ах, AX) = (А"1 )Т N (х, X); ш) AX Е и.

Доказательство. Пусть точка х е дX, а вектор р - опорный вектор ко множеству X в точке х .

1 - II) Покажем, что вектор (А_1)Тр является опорным вектором ко

множеству AX в точке Ах . Тем самым мы покажем, что точка Ах является граничной точкой множества AX. Для этого предположим, что найдется точка

х ' g AX отличная от Ax такая, что

((A~1)Tp, Ax )<(( A~1)Tp, X).

Тогда точка A~lx' g X. При этом верны следующие соотношения

(p, х) = (p, A"1 Ax) = ((A"1 )T p, Ax) < ((A"1 )T p, x') = (p, A~lxr).

Что противоречит определению опорного вектора. Точка Ax - граничная точка множества AX.

iii) В силу биективности невырожденного линейного преобразования будет верно и обратное: если x' g ö(AX), то A~lx' g dX. Причем внутренние точки

множества X переводятся посредством невырожденного линейного преобразования во внутренние точки множества AX .

Пусть x ', x' g AX, 1 g (0;1), тогда, учитывая, что X - строго выпуклое,

A"1 (Ax' + (1 -1) x'' ) = AA~lx' + (1 -1) A"1 x'' g int X. Следовательно,

(Ax' + (1 -A) x' ) g int (AX), т.е. множество AX является также строго выпуклым. Лемма 4.

Пусть X, X2 gU2 , Y = X + X2. Тогда Y gU2 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. Компактность Y следует из того факта, что алгебраическая сумма Минковского двух компактных множеств, как показано в [20], также является компактом.

Пусть x1 е int X1, x2 e int X2. Тогда существуют открытый шар с центром в точке x1 и радиуса £1 > 0 и открытый шар с центром в точке x2 и радиуса s2 > 0 такие, что

O^ (x1) с int X1, OB2 (x2) с int X2,

где через Or(x0) = {x e L :|| x0 -x ||< r} обозначим открытый шар радиуса r с

0

центром в точке x .

Тогда

Omin ^}(x1 + x2) с Овл (x1) + O^ (x2) с Y.

min{£j ,^2 }

Т.е. x1 + x2 e int Y.

Пусть y1, y2 eY , Лe (0;1) . Тогда по определению алгебраической суммы

Минковского, существуют x11, x12 e Xj и x21, x22 e X2 такие, что

1 11 21 2 12 22 y = x + x , y = x + x .

Поскольку X1, X2 e U2, то

Ax11 + (1 - Л)x12 e int X, Ax21 + (1 - Л)x22 e int X2. Следовательно,

Ay1 + (1 - Л) y2 = A( x11 + x21) + (1 - A)( x12 + x22) e int Y, т.е. Y является строго выпуклым.

Получаем, У еи2. Лемма 5.

Пусть Х1, Х2 е и2, У = Х1 + Х2, у * едУ. Тогда

I) Представление вида у * = х1* + х 2*, где х1* е Х1, х 2* е Х2, единственное;

II) х1* е дХ!, х 2* е дХ2;

iii) N(у *, Y) с N(х1*, X) n N(х , Х2)

Доказательство. i - ii) Пусть p е N( у *, Y) . Введем следующие обозначения:

х'* = Рхх (Р\ х2*= Рх2 (Р)-Тогда в силу леммы 2 верно х1* е 5Х1, х2* е сХ2.

(Р, х1* + х2*) = (Р, х1*) + (Р, х2*) = max (Р, х1) + max (Р, х2) =

х еХ^ х еХ^

max (Р, х + х ) = max (Р, у).

х2еХ2

/ \ 1* 2*

По определению опорного вектора pY (р) = х + х . Тогда в силу леммы 2

* 1* 2* у = х + х .

Продемонстрируем, что данное представление единственное. Предположим,

1 21 11 12 * что существуют х ' е дХ1, х ' е Х2 такие, что X Ф X их '+х '= у . Тогда в силу

следствия 2 р е N(х1 ', Х1), т.е.

(р, х1')<( р, х1*).

(p, y ) = (p, xh+x2') < (p, x1*) + max (p, x2) = (p, x1*) + (p, x2*) = (p, y*).

x2eX2

* 1* 2*

Получаем противоречие. Представление y = x + x единственное. iii) Как показано в доказательстве пунктов i - ii), верно включение

N(y , Y) с N(x1*, X ) n N(x2*, X2). Пусть p' e N(x1*, Xj) n N(x2*, X2). Тогда по определению опорного вектора справедлива цепочка равенств

(p', y ) = (p', x1) + (p', x2*) = max (p', x1) + max (p', x2) =

x eX^ x eX^

max (p', x + x ) = max(p', y),

xWj yeY

x2eX2

т.е. р' е И(у , Y). Верно включение

Ы( х1*, X ) п Ы( х2*, X ) с Ы( у*, Y).

Окончательно,

N (у*, Y) = Ы( х1*, X) п Х( х2*, X). 4. Принцип максимума в задаче быстродействия для граничных точек

множества 0-управляемости

Рассмотрим критерий оптимальности управления и свойства оптимальных траекторий, сформуллированные в виде принципа максимума, для случая, когда выполнено условие х0 е дX(Nmln ,0).

* N

Теорема 1. Пусть х0 ЕдX(Nmtn,0), траектория {х (к)}к=0" оптимальна в

задаче быстродействия для системы (A, U). Тогда

i) x (k) e CX(Nmm - k, k). k = 0, N

min '

T У 1 \ IT-/" *

II) N(х (к), X(- к, к)) с А (к) N(х (к +1), X(- к -1, к +1)). к = 0, - 2;

III) Оптимальная траектория единственна.

Доказательство. Включение х*(0) едX(N^„,0) верно в силу условия

теоремы. Предположим, что для некоторого k = 1, Nmm - 2 выполнено

x *(k) e CX (N min - k, k). Тогда в силу следствия 1

A(k)X(Nmln - k, k) = X(Nmln - k - 1, k + 1) + (-U(k)). Так как в силу i) леммы 3 A(k)x*(k) eC(A(k)X(Nmm - k, k)), то согласно лемме 5 существует пара x* (k +1) e X(Nmin - k -1, k + 1) и u* e (-U(k)) такие, что

A(k)x* (k) = x* (k +1) + u . Обозначив через u*(k) = -u*, получим, что w*(k) e U(k),

x*(k +1) = A(k) x*(k) + u *(k).

i) Причем в силу пункта ii) леммы 5 x*(k +1) e dX(Nmm - k -1, k +1).

ii) В силу пункта iii) леммы 5

N(A(k)x (k), A(k)X(Nmm - k, k)) = = N (x *(k +1), X (N min - k -1, k +1)) о N (u VU (k)).

Откуда согласно пункту ii) леммы 3

(A~4k))T N(x», X(Nmm - k, k)) с N(x*(k +1), (Nmn - k-1, k +1)).

Ш) В силу пункта г) леммы 5 представление (3) единственно. Теорема доказана согласно методу математической индукции.

Будем называть семейство векторов {^(0)}^П0ОТ 1 сопряженными векторами

системы (1), если для каждого к = 0, Ыпт -1 выполнено условие

-¥(к ) е N ( х*(к ), X ( N„1" - к, к )).

Теорема 2.

Пусть х0 ЕдX(Nmin ,0) . Тогда семейство сопряженных векторов удовлетворяет рекуррентным соотношениям

¥(к +1) = (A-1 (k))T ¥(к), к = 0, Nmm - 2. -И0) 6 N ( *0, X ( N min ,0)).

Доказательство.. Согласно пункту и) теоремы 1 для каждого к = 0,Nm¡n -2 -¥(к +1) = -(А-Чк))>(к) е (А"1 (к ))Т N (х* (к), X(Nmln - к, к)) с с N(х*(к +1), X(^пп - к -1, к +1)).

Теорема 3.

, * ^ 7 х -V N -1

Пусть набор управлений {и (к)}к„0п оптимален в задаче быстродействия для системы (1), х0 ЕдX(N^„,0). Тогда

i) u\к) = arg max ((A"1 (к))T ¥(к), u), к = 0, Nmn -1,

u6U(к)

ii) Оптимальное управление единственно.

Доказательство. г) Согласно пункту гТ) леммы 3 для каждого к = 0, -1

верно

- (А-1 (к))Т ¥(к) е (А-1 (к))Т N(х* (к), X(Ктт - к, к)) = ЩА(к)х* (к), А(к)X(Ктт - к, к)). Тогда, учитывая (4),

- (А"1 (к ))Т щ(к) е N (и* ,-и(к)),

или же

(А~\к))Тщ(к) е Н(и(к\и(к)). Тогда в силу леммы 2

И (к) = а,(к)((А~\к))>(к)) =

= егв тах ((А"1 (к))Т, и), к = 0, ^ -1.

иеи (к)

И) Согласно пункту ¡) леммы 5 разложение (3) единственно. Тогда существует единственное оптимальное управление и (к) = -и на каждом шаге. 5. Оптимальное управление для внутренних точек множества

0-управляемости

Рассмотрим случай

Хо е ий X(Nmin ,0)\ X(Nmin -1,0). (5)

Условие (5) приводит к ситуации, когда применение леммы 5, которая лежит в основе теорем 1-3, оказывается невозможным. При попытке формально использовать предложенный принцип максимума к случаю (5) не удается

определить начальное значение вектора сопряженной системы у/о аналогично условию, предложенному в теореме 2. Это обусловлено тем, что невозможно

построить нормальный конус Nх0, X(Ыпйп ,0)) для рассматриваемого случая.

Тем не менее существует способ обобщить принцип максимума для произвольного начального состояния системы. Однако это не дает новой информации, и для внутренних точек он приобретает вырожденный характер.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 6.

Пусть верно (5), набор управлений {и(к)}ыкП0п 1 оптимален в задаче быстродействия системой (1) и удовлетворяет соотношениям

u* (к) = arg max ((A"1 (к))T ¥(к), u), к = 0, NMn -1,

ueU (к)

¥(к +1) = (A -1(к ))>(к), к = 0, N min - 2, (6)

^(0) = ^0.

Тогда щ0=0.

Доказательство. Предположим, что существует у/0 ф 0 такой, что выполнено условие леммы. Тогда согласно теоремам 2 и 3 набор управлений {u (к)} к=0ш оптимален в задаче быстродействия и для начального состояния

Рх(N . ,0)(-^0). Т.е.

V min' у

A(Nmn -1)■...■A(0)X0 + A(Nmin -1)■...■A(1)u(0) + ... + + A(Nmin - 1)u(Nmin - 2) + u(Nmin - 1) = 0,

A( N min -1) ■...■ А(0)Рх (N . ,0)(-^0) + A( N min -1) ■...■ A(1)u(0) + ... +

v min' '

+ A(Nmin - 1)u(Nmin - 2) + u(N„iln - 1) = 0.

Откуда в силу невырожденности матриц последовательности A

X0 = Рх (N . ,0)(-^0) Nmm ,0).

v turn' '

Получили противоречие. Таким образом Що=0 .

Хотя лемма 6 позволяет обобщить принцип максимума на случай произвольного начального состояния х0 е X(Nmln ,0) , если выполнено (5), то рекуррентные соотношения (6) не позволяют выислить оптимальное управление.

Условие уУо = 0 приводит к тому, что для каждого к = 0, NmIn -1 у/(к) = 0, и как следствие

Arg max ((A~\k))T ¥(к), u) = U(к).

ueU (к)

Тем не менее возможно построить оптимальное управление, сведя рассматриваемый случай (5) к теореме 3. Обозначим через

а = j( xo, X (Nmin ,0)), где j(x, X) - функционал Минковского [22]. Рассмотрим новую систему управления (A, Ua )

х(к +1) = А(к) х(к) + и(к), х(0) = х0, и (к) eaU(к), к = 0,1,2,

(7)

где иа ={аи (к)},%.

Для системы (7) аналогично определим семейство множеств 0-управляемости {Xа(N,к,к=о. Поскольку верно (5), то в силу определения

функционала Минковского а <1. Лемма 7.

Для системы управления (А,иа) для любых N,к е Nи{0} выполнены

соотношения

i) Xa (N, к) = aX(N, к),

ii) Xa(N, к) с X(N, к),

iii) х0 e5Xa(Nmin,0). Доказательство. i) Согласно лемме 1 верно представление

Xa (N, к) = £ (- A-1 (к) •... • A-1 (i + k))at/(к + i) =

N-1 ,

= а ]Т(- А-1 (к) ■... ■ А'1 (г + к ))у (к + г) = аХ (N, г).

1=0

и) Поскольку 0 е Х(N, г) , множество Х(N, г) выпукло, а <1 , то верно включение

Ха (N, г) = аХ (N, г) с Х (N, г). ///) По определению функционала Минковского х0 еаХ^тт,0) = Ха^тт,0). Но при этом для любого а'е (0;а) аналогичное включение неверно. Обозначим

1 1 А

через £ = — — >0, тогда а а

- Х0 +£Х0=-1 Х0 е Х(Nmгn ,0)

а а

Х0 +8ЯХ0 е Ха (Nmin ,0).

Т.е. не существует ни одной окрестности точки х0, которая лежала бы полностью внутри Ха(Nmin,0). По определению граничной точки х0 е ЭХ(Nmin,0). Теорема 4.

Пусть траектория {x ' (к )}кдш системы (A,Ua) определяется по соотношениям

i) X (0) = x0,

ii) u'(к) = aarg max ((А_1(к))T у(к), u),

ueU (к)

iii) - у (к) e N(X ' (к), Xa (NMn - к, к)),

/V) х '(к +1) = А(к)х '(к) + и'(к), к = 0, Nmin -1.

Тогда траектория {х '(к)}к™п и управление {и'(к)}^™п -1 оптимальны в задаче быстродействия для системы (1).

Доказательство. Утверждение вытекает непосредственно из того факта, что система управления (А,иа) в силу леммы 7 удовлетворяет условиям принципа максимума для граничных точек, доказанного в теореме 3.

6. Частный случай множества допустимых управлений в форме

эллипсоида

Рассмотрим частный случай системы (1), когда для всех к е N^{0} верно и (к) = {и е Яп: (и, Н (к )и) < 1} , где Н (к) е Япхп - положительно определенная матрица. Поскольку отображение (и, Ни) строго выпукло по и е Яп для любой положительно определенной матрицы Н, то каждое и (к) е и2.

Лемма 8.

Пусть X = {х е Я":(х, Нх) < 1} , Н е Япхп - положительно определенная матрица, А е Япхп - невырожденная матрица. Тогда

г) (А"1)7 НА"1 >0,

гг) АХ = {х е Я" : (х, (А'1)7 НА-1х) < 1}. Доказательство. ¡) Рассмотрим квадратичную форму, обозначив через

х = А"1 у,

(у,(А~1)Т НА~1 у) = (А_1у, НА~1 у) = (х, Нх) > 0.

Причем в силу положительной определенности Н квадратичная форма равна 0 тогда и только тогда, когда х = 0, что в силу невырожденности матрицы А эквивалентно у = 0.

и) Пусть х е Х, тогда условие (х, Нх) < 1 равносильно (х, Нх) = (А'1 Ах, НА'1 Ах) = (Ах, (А"1 )Т НА~1х) < 1. Отсюда непосредственно вытекает пункт И) леммы.

Из леммы 8 следует, что для любого к е N множество Ек = А"1 (0) ■... ■ А"1 (к -1)и (к) - эллипсоид, порождаемый матрицей

Н(к) = (А(к -1) ■... ■ А(0))Т Н (к)(А(к -1) ■... ■ А(0)). В силу леммы 1 любое множество Х(^0) можно представить в виде алгебраической суммы эллипсоидов:

N

Х ( N ,0) = £Ек. к=1

Лемма 9.

Пусть для всех к е N ^{0} выполнено: и(к) = {и е Я" :(и,Н(к)и) < 1} ,

Н(к) е Япхп - положительно определенная матрица, х0 ЕдX(Нтп ,0) . Тогда начальное условие сопряженной системы Щ0 может быть найдено из условия

_х =Nmn h-\к)у0

x0 , ~ , г -1 i

k=^(^0,H "4k МО

Доказательство. Согласно пунктам i-ii) леммы 5 для x0 едХ(Nmm ,0) существует единственное разложение

N . min

x0 = ^xk, xk е дЕк. (8)

k=i

В силу пункта iii) леммы 5

N . min

- V е N(xo, X(Nmn ,0)) = П N(xk, Ек). (9)

к=1

Поскольку эллипсоиды имеют дифференциируемую границу, то каждый нормальный конус представляет собой луч

N(X, Ek) = cone (Vx(x, H(k)x) ^^ }\(0}, k = 1, Nm Тогда условие (9) может быть представлено в виде

■ щ Е N(х0, X(^Ып/п ,0)) = N(хк, Ек), к = 1, Nmln. В силу леммы 2 сопряженный вектор Щ0 может быть найден из условий

х = Ре, (-Щ0) = агВ тах (-Щ^х\к = 1,ктп. (10)

к (х,Н(к)х)<1

Каждый хк представляет собой точку максимума линейной функции с квадратичным ограничением, которая может быть найдена аналитически при

помощи метода множителей Лагранжа и будет иметь следующий вид:

* - н~\k v0

*к = , 0 , * = 1, Nmm.

V(^0, H ~\k Vo)

Подставив полученное выражение в (8), получаем утверждение леммы. Система уравнений, предложенная в лемме 9, для нахождения вектора V0 не является линейной и имеет неединственное решение, так как правая часть

инвариантна к домножению вектора V на произвольное положительное число. Если дополнить систему уравнений условием

(V0,V0) = 1, то итоговая система уравнений

N . ~-1

mm L-i 1

Х0

£ H к )V0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

*=1 ^(Уо,Н~\к)¥о) ' (11)

(^с^о) =

будет иметь единственное решение, что позволяет использовать численные методы для его вычисления.

Лемма 10. Пусть для всех к е N^{0} выполнено:

и (к) = {и е Я": (и, Н (к )и) < 1}, Н (к) е Я"х" - положительно определенная матрица,

хо е$Х(Nmm ,0) , уо удовлетворяет (11), набор управлений {и (кжт -оптимален в задаче быстродействия системой (1). Тогда

и. А(к)..... А(0) Н ~'(к + 1)уо

V(V0, H ~'(к +1)^0)

Доказательство. Согласно теоремам 2 и 3 оптимальное управление может быть вычислено, исходя из соотношений (6). В этом случае аналогично решению оптимизационной задачи (10) получим

и-{к)= Н-1(к)(А-1(к ))У(к) =

V« А"1 (к ))т щ(к), Н -1 (к)(А"1 (к ))т щ(к))

=_Н-1(к)(А-1(к))т .....(А-1(0))тЩ0_=

Л/((А"1(к))т .....(А"1(0))тЩ0,Н"1(к)(А"1(к))т ,., (А"1(0))тЩ0)

_ А(к)...А(0)Н-1(к + 1)щ

0, N

д/(Щ0,Н~\к + 1)Щ0) ' ' 7. Коррекция орбиты спутника

Решается задача быстродействия для системы управления положением спутника на круговой орбите. Предполагается, что коррекция движения спутника осуществляется посредством двигателей импульсной тяги. Корректирующие импульсы исполняются без ошибок через равные промежутки времени. Требуется за минимальное число корректирующих импульсов вернуть спутник на исходную круговую траекторию, с которой по каким-либо причинам он сошел.

Как показано в [1,3] движение спутника на круговой орбите описывается уравнениями

Г = УЯ >

в=^,

г

■ = У1_1_

УЯ 2 ,

г г

V = - У^

Ут ,

г

где г - расстояние расстояние от начала координат до спутника, в - угол поворота, уя и Ут - радиальная и трансверсальная составляющие скорости спутника соответственно.

Круговая орбита, на которой должен находиться спутник описывается

значениями переменных г0, 0 и Ут0. Значение в в рассматриваемой задаче не представляет интереса. Обозначим отклонения реальных значений вектора состояния от желаемых следующим образом:

Аг = г - г0,

Ауя = УЯ - УЯ о,

АУг = Уг - Уго.

Предполагая, что отклонения невелики, перейдем к линеаризованной системе

Аг = АУй , Ауй = Аг + 2Ауг , АУТ = -Ауй.

Введя обозначение z(t) = (Аг, Ауя , Аут )т , запишем задачу Коши в векторно-матричном виде:

z(t ) =

0 1 0 1 0 2

V0 -1 °у

z (t), z(0) = Zо

Данная система дифференциальных уравнений имеет решение

z(t ) =

сов t + 2 в1п t - 2 сов t + 2

В1П I

сов t

2в1п I

v сов t -1 - в1п t 2сов t -1 у

ZA

Поскольку управление подается импульсно через равные промежутки времени Аt , то можно рассматривать в качестве наблюдаемых параметров системы вектор состояния в моменты времени kАt, т.е. непосредственно перед выполнением к +1 -го корректирующего импульса, к е N и {0}.

Пусть (к), ^2(к) е [--атах; атах ]

корректирующие импульсы,

направленные вдоль радиальной и трансверсальной направляющих скоростей соответственно и исполняемые в момент времени kАt, у (к ) = z(kАt), к е N и{0}. Тогда вектор у(к +1) может быть найден как значение в момент времени Аt

решения следующей задачи Коши:

z(t ) =

0 1 0 1 0 2

v0 -1 0у

z (t),

^0) = у(к) + (0, ^(к), ^(к ))т. В результате получим конечно-разностные рекуррентные соотношения:

У(к +1) = Ау(к) + Бм>(к),

У(0) = ^ Чк) е [-атах;атах ] Х [-атах; атах Ъ к = 0,1,2

где

А =

сов Дt + 2 вт Дt - 2сов Дt + 2

вт Дt сов Дt -1

сов Дt

2вт Дt

— ■ —

вт Дt 2 сов Дt -1

в =

вт Дt сов Дt

2 сов Дt + 2 2 вт Дt

ч вт Дt 2сов Дt -1 у

, Чк) =

'^1(к у

V Щ2(к ) У

В полученной системе управления, в отличие от (1), вектор состояния и управления имеют различную размерность, что делает неприменимым принцип максимума сформулированный в теоремах 1 -3. Сведем задачу к рассматриваемому случаю, произведя замену.

~(2к) =

г щ (3к) Л w2(Зk)

V Щ1(3к + 1)у

и(2к +1) =

щ (Зк +1) щ (Зк + 2)

V щ2(3к + 2) у

х(2к) = у(3к), х(2к +1) = Ау(3к +1) + в

'щ (3к + 1У 0

А(к ) =

А2, к = 0,2,4, А, к = 1,3,5,.

в(к )=

/ /

А

вт Дt сов Дt

Л /

I А

2сов Дt + 2^ ( вт Дt

2 вт Дt

сов Дt

, к = 0,2,4,.,

V V вт Дtу V 2сов Дt -1 у вт Дtуу ^ ' 2сов Дt + 2^ ( вт Дt ^ (- 2сов Дt + 2лЛ

А

2 вт Дt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

сов Дt

V V 2сов Дt -1 у V- в^п Дtу V 2сов Дt -1 уу

2вт Дt

к = 1,3,5,

<

I

<

Аппроксимируем множество допустимых управлений, которое не является строго выпуклым, шаром радиуса атах с центром в начале координат. В итоге

получим линейную нестационарную дискретную систему управления следующего вида:

х(к +1) = А(к) х(к) + В(к )и(к),

х(0) = z°, ~(к) е {и е Я3: (и,и) < а;^ах}, к = 0,1,2,....

Или же согласно пункту и) леммы 8 эквивалентную ей систему

х(к +1) = А(к) х(к) + и(к),

х(0) = z о, и (к) е и (к), (12)

и (к) = {и е Я3 : (и, (В - (к))т В - (к )и) <а2тах }, к = 0,1,2,...

Каждое множество и(к) является эллипсоидом в Я , т.е. принадлежит

классу и2. Тогда система (12) удовлетворяет условиям теорем 1-4 и лемм 9-10. Проведем численные расчеты для следующих значений параметров:

Аt = 0.25, атах = 0.0035,

^ = 10 2 • (-0.37787, - 0.39109, 1.41512)т.

Наименьшее число шагов для системы (7) составит Nmln = 4. Значение а из теоремы 4 составляет

а = м( Zo, X (4,0)) = 0.9286. Верно включение z0 е 5Хо.9286(4,0).

Из системы уравнений (11) вычислим Ц/о , оптимальное управление

определим согласно лемме 10. Представим полученные результаты в виде следующих таблиц:

к х** (к) х2(к ) х*(к ) ¥х(к) ^(к ) ¥3(к )

0 - 0.37787 -Ю-2 - 0.39109 -10-2 1.41512-10-2 0.1294 0.2360 - 0.9631

1 - 0.30870 -10-2 0.58472 -10-2 1.03056 -10-2 0.1500 - 0.3167 - 0.9219

2 - 0.19824 -10-2 0.59918-10-2 0.47280 -10-2 0.2617 - 0.5720 - 0.6986

3 0.00698 -10-2 0.35937 -10-2 0.07851-10-2 0.6534 - 0.9623 0.0850

4 0 0 0

к и* (к) и2*(к ) и3(к )

0 - 0.04354 -10-2 - 0.24779 -10-2 - 0.27185 -10-2

1 - 0.08869 -10-2 - 0.40092 -10 2 - 0.35862 -10-2

2 - 0.17352 -10-2 - 0.52475 -10-2 - 0.01554 -10-2

3 - 0.10099 -10-2 - 0.38877 -10-2 0.01550-10-2

Работа выполнена при финансовой поддержке РФФИ, проект 15-08-01902-а.

Библиографический список

1. Бахшиян Б.Ц., Назиров Р.Р., Эльясберг П.Е. Определение и коррекция движения. - М.: Наука, 1980. - 360 с.

2. Бахшиян Б.Ц. Оценивание и коррекция параметров движущихся систем. - М.: Институт Космических Исследований РАН, 2012. - 72 с.

3. Малышев В.В., Красильщиков М.Н., Бобронников В.Т. Спутниковые системы мониторинга. - М.: Изд-во МАИ, 2000. - 568 с.

4. Лебедев А.А, Красильщиков М.Н., Малышев В.В. Оптимальное управление движением космических летательных аппаратов. - М.: Машиностроение, 1974. -200 с.

5. Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами. - М.: Машиностроение, 1987. - 304 с.

6. Решетнев М.Ф., Лебедев А.А., Бартенев В.А. Управление и навигация искусственных спутников Земли на околокруговых орбитах. - М.: Машинстроение, 1988. - 336 с.

7. Азанов В.М., Кан Ю.С. Оптимизация коррекции околокруговой орбиты искусственного спутника Земли по вероятностному критерию // Труды Института Системного Анализа РАН. 2015. №2. С. 18-26.

8. Игнатов А.Н. О решении задачи корректирования скалярного терминального состояния летательного аппарата при произвольном распределении мультипликативного возмущения // Труды МАИ. 2016. №87. URL:

https://www.mai.ru/science/trudy/published.php?ID=69775

9. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Б.Ф. Математическая теория оптимальных процессов. - М.: Наука, 1969. - 393 с.

10. Болтянский В.Г. Математические методы оптимального управления. - М.: Наука, 1969. - 408 с.

11. Благодатских В.И. Введение в оптимальное управление. - М.:Высшая школа, 2001. - 240 с.

12. Табак Д., Куо Б. Оптимальное управление и математическое программирование. - М.: Наука, 1975. - 280 с.

13. Болтянский В.Г. Оптимальное управление дискретными системами. - М.: Наука, 1973. - 448 с.

14. Моисеев Н.Н. Элементы теории оптимальных систем. - М.: Наука, 1975. -526 с.

15. Пропой А.И. Элементы теории оптимальных дискретных процессов. - М.: Наука, 1973. - 256 с.

16. Беллман Р. Э. Динамическое программирование. - М.: Изд-во Иностранной Литературы, 1960. - 400 с.

17. Ибрагимов Д.Н., Сиротин А.Н. О задаче оптимального быстродействия для линейной дискретной системы с ограниченным скалярным управлением на основе множеств 0-управляемости // Автоматика и Телемеханика. 2015. №9. С. 3-30.

18. Ибрагимов Д.Н. Оптимальное по быстродействию управление движением аэростата // Труды МАИ. 2015. №83. URL: http://www.mai.ru/science/trudy/published.php?ID=62313

19. Ибрагимов Д.Н. Аппроксимация множества допустимых управлений в задаче быстродействия линейной дискретной системой // Труды МАИ. 2016. №87. URL: http://www.mai.ru/science/trudy/published.php?ID=69797

20. Половинкин Е.С., Балашов М.В. Элементы выпуклого и сильно выпуклого анализа. - М.: ФИЗМАТЛИТ, 2004. - 416 с.

21. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. - М.: ФИЗМАТЛИТ, 2012. - 572 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.