Научная статья на тему 'Алгоритм оптимального адаптивного терминального управления расходом топлива жидкостной двигательной установки ракеты-носителя. Часть i'

Алгоритм оптимального адаптивного терминального управления расходом топлива жидкостной двигательной установки ракеты-носителя. Часть i Текст научной статьи по специальности «Математика»

CC BY
119
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ ПРОГРАММНОЕ И АДАПТИВНОЕ УПРАВЛЕНИЕ / ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ / РАСХОД ТОПЛИВА / РАКЕТА-НОСИТЕЛЬ / ОБЛАСТИ ДОСТИЖИМОСТИ / OPTIMAL CLOSED-LOOP CONTROL / TERMINAL CONTROL / PROPELLANT CONSUMPTION / LAUNCH VEHICLE / REACHABLE SETS

Аннотация научной статьи по математике, автор научной работы — Шориков Андрей Федорович, Калёв Виталий Игоревич

Предлагается алгоритм решения задачи управления расходом топлива жидкостной двигательной установки первой ступени ракеты-носителя, в котором эта задача формулируется как задача оптимального адаптивного терминального управления для соответствующей линейной дискретной динамической системы. Для этого исходная нелинейная непрерывная система, описывающая динамику объекта управления, линеаризуется относительно заданной опорной траектории и затем дискретизируется согласно требованиям к процессу управления, в результате чего сформированная аппроксимирующая модель представляет собой систему векторно-матричных рекуррентных соотношений. В аппроксимирующей системе учитываются все ограничения, наложенные на фазовый вектор и вектор управления, и, кроме того, предполагается, что эти ограничения имеют вид выпуклых, замкнутых и ограниченных многогранников с конечным числом вершин в соответствующих векторных пространствах. В работе формулируются задачи оптимального программного и адаптивного терминального управления для сформированной линейной дискретной динамической системы. На основе решения конечной последовательности задач оптимального программного терминального управления для аппроксимирующей линейной модели предлагается рекуррентный алгоритм оптимального адаптивного терминального управления исходной нелинейной динамической системой. При реализации алгоритма оптимального программного терминального управления используется аппарат построения и анализа областей достижимости, реализованный при помощи общего алгебраического рекуррентного метода построения областей достижимости линейных дискретных динамических систем с несколькими его модификациями, направленными в основном на снижение вычислительной сложности и, как следствие, на увеличение его быстродействия. Эффективность разработанного алгоритма оптимального адаптивного терминального управления демонстрируется на численном модельном примере оптимизации адаптивного управления расходом топлива жидкостной двигательной установки первой ступени ракеты-носителя.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Шориков Андрей Федорович, Калёв Виталий Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE OPTIMAL CLOSED-LOOP TERMINAL PROPELLANT CONSUMPTION CONTROL ALGORITHM FOR LIQUID PROPULSION SYSTEM OF LAUNCH VEHICLE. PART I

In this paper we propose the algorithm of launch vehicle’s liquid propulsion system propellant consumption control problem solving, in which this problem is formulated as the optimal closed-loop terminal control problem for corresponding linear discrete-time dynamical system. To achieve this, initial nonlinear continuous model, which describes the plant dynamics, is linearized along given reference trajectory and then is discretized in accordance to control process requirements. As the result of this, we have formed approximating model represented as the vector-matrix system of recurrence equations. The constraints of state vector and control vector are also taken into account in this approximating system, and we assume that the constraints are convex, closed and limited polyhedra with finite number of vertices in corresponding vector spaces. The optimal open-loop and closed-loop terminal control problems are formulated for generated linear discrete-time dynamical system. For solving the problems the optimal closed-loop terminal control recurrence algorithm is developed, which consists in the solving of number of optimal open-loop terminal control problems for linear discrete-time dynamical system. Based on solution of finite sequence of optimal open-loop terminal control problem for linear approximate model we provide recurrence optimal closed-loop terminal control algorithm for initial nonlinear dynamical system. In the implementation of proposed optimal open-loop control algorithm we use the tool of reachable sets computation and analysis based on general algebraic recurrence approach for linear discrete-time dynamical systems and some modifications of this approach intended for reducing the computational complexity and consequently to increasing the operation speed. The performance of developed optimal closed-loop terminal control algorithm is presented on numerical model example of launch vehicle’s first stage liquid propulsion system propellant consumption closed-loop control optimization.

Текст научной работы на тему «Алгоритм оптимального адаптивного терминального управления расходом топлива жидкостной двигательной установки ракеты-носителя. Часть i»

Управление в технических системах

УДК 681.511 DOI: 10.14529/^сг190103

АЛГОРИТМ ОПТИМАЛЬНОГО АДАПТИВНОГО ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ РАСХОДОМ ТОПЛИВА ЖИДКОСТНОЙ ДВИГАТЕЛЬНОЙ УСТАНОВКИ РАКЕТЫ-НОСИТЕЛЯ. ЧАСТЬ I

А.Ф. Шориков1, В.И. Калёв1'2

1 Уральский федеральный университет им. первого Президента России Б.Н. Ельцина, г. Екатеринбург, Россия,

2 АО «НПО автоматики им. академика Н.А. Семихатова», г. Екатеринбург, Россия

Предлагается алгоритм решения задачи управления расходом топлива жидкостной двигательной установки первой ступени ракеты-носителя, в котором эта задача формулируется как задача оптимального адаптивного терминального управления для соответствующей линейной дискретной динамической системы. Для этого исходная нелинейная непрерывная система, описывающая динамику объекта управления, линеаризуется относительно заданной опорной траектории и затем дискретизируется согласно требованиям к процессу управления, в результате чего сформированная аппроксимирующая модель представляет собой систему векторно-матричных рекуррентных соотношений. В аппроксимирующей системе учитываются все ограничения, наложенные на фазовый вектор и вектор управления, и, кроме того, предполагается, что эти ограничения имеют вид выпуклых, замкнутых и ограниченных многогранников с конечным числом вершин в соответствующих векторных пространствах. В работе формулируются задачи оптимального программного и адаптивного терминального управления для сформированной линейной дискретной динамической системы. На основе решения конечной последовательности задач оптимального программного терминального управления для аппроксимирующей линейной модели предлагается рекуррентный алгоритм оптимального адаптивного терминального управления исходной нелинейной динамической системой. При реализации алгоритма оптимального программного терминального управления используется аппарат построения и анализа областей достижимости, реализованный при помощи общего алгебраического рекуррентного метода построения областей достижимости линейных дискретных динамических систем с несколькими его модификациями, направленными в основном на снижение вычислительной сложности и, как следствие, на увеличение его быстродействия. Эффективность разработанного алгоритма оптимального адаптивного терминального управления демонстрируется на численном модельном примере оптимизации адаптивного управления расходом топлива жидкостной двигательной установки первой ступени ракеты-носителя.

Ключевые слова: оптимальное программное и адаптивное управление, терминальное управление, расход топлива, ракета-носитель, области достижимости.

Введение

Для большинства жидкостных ракет-носителей (РН) существует ряд основных задач: наведение, навигация, стабилизация и оптимизация управления расходом топлива. Последняя может быть классифицирована как задача оптимального терминального управления. Это связано с ее основным назначением: к заданному моменту времени полностью и одновременно израсходовать рабочий запас компонентов топлива (окислителя и горючего) жидкостной двигательной установки (ДУ) РН. Другими словами, критерием качества здесь является отклонение вектора состояния системы от желаемого значения в финальный (терминальный) момент времени, а целью процесса управления - минимизация этого критерия качества.

За последние 40 лет задаче рационализации терминального управления расходом топлива ДУ РН уделялось большое внимание, и полученные результаты этих исследований широко пред-

ставлены в литературе. Основной работой в этом направлении исследований является монография Б.Н. Петрова [1]. В ней показано, что рационализация терминального управления расходом топлива РН может быть достигнута путем стохастического оптимального терминального управления.

В настоящее время задачи оптимального терминального управления динамическими системами с известными вероятностными характеристиками априорно неизвестного вектора начального фазового состояния системы хорошо изучены, однако в реальных условиях производства РН реализовать большое количество испытаний, позволяющих получить вероятностные характеристики априори неопределенных параметров рассматриваемых объектов, зачастую оказывается очень дорого или даже невозможно. Таким образом, информация о вероятностных характеристиках исследуемых объектов управления либо отсутствует, либо недостоверна [2, 3]. С другой стороны, на основании предшествующего опыта и известных физических и технических условий всегда можно сформировать, например, геометрические ограничения на априори неопределенные значения параметров рассматриваемой управляемой динамической системы, и для решения задач оптимального управления динамическими системами использовать детерминированный подход [2, 3].

Данная работа посвящена решению задачи оптимального адаптивного терминального управления расходом топлива ДУ РН для непрерывной нелинейной модели объекта управления, подробно описанной в работах [4, 5]. Исходная нелинейная модель аппроксимируется соответствующей линейной дискретной управляемой системой относительно заданного опорного режима функционирования ДУ РН, и предполагается, что множества, ограничивающие значения состояния объекта и управляющего воздействия, в каждый момент времени, стеснены заданными выпуклыми, замкнутыми и ограниченными многогранниками (с конечным числом вершин) в соответствующих конечномерных векторных пространствах. Предполагается, что решение задачи оптимального программного терминального управления в аппроксимирующей дискретной динамической системе будет достаточно близким к решению аналогичной задачи для исходной нелинейной непрерывной системы относительно заданного критерия качества рассматриваемого процесса управления. Тогда решение задачи оптимального адаптивного терминального управления рассматриваемым объектом может быть сведено к рекуррентному алгоритму [3, 6], основанному на решении конечной последовательности соответствующих вспомогательных задач оптимального программного терминального управления.

Для линейных дискретных управляемых динамических систем с геометрическими ограничениями на векторы состояния и управления в виде выпуклых, замкнутых и ограниченных многогранников (с конечным числом вершин) на основе полугруппового свойства выпуклых многогранных их областей достижимости [3], свойств конечных систем линейных алгебраических уравнений и неравенств, а также возможностей симплекс-метода для решения задач линейного математического программирования и использования преобразования описания многогранников с помощью соответствующих систем линейных алгебраических неравенств в их описание с помощью конечного числа вершин и наоборот в работах [3, 6-9] А.Ф. Шориковым был разработан и описан эффективный общий рекуррентный алгебраический метод построения областей достижимости таких динамических систем.

Предлагаемое решение задачи оптимального адаптивного терминального управления расходом топлива ДУ РН для сформированной линейной дискретной управляемой динамической системы основывается на реализации конечной последовательности решений задач оптимального программного терминального управления, для решения которых А.Ф. Шориковым разработан метод прямых и обратных конструкций, описанный в работах [3, 6, 7]. Для построения областей достижимости рассматриваемых динамических систем он использует общий рекуррентный алгебраический метод и сводится к реализации конечной последовательности решений задач математического программирования, систем алгебраических равенств и неравенств, одношаговых вспомогательных краевых задач, а также к алгебраическим операциям над выпуклыми многогранными компактами [3, 6-9].

Для этих методов А.Ф. Шориковым были разработаны соответствующие численные алгоритмы, послужившие основой для создания им и В.А. Тюлюкиным компьютерного программного комплекса, описание и применение которого представлено в работах [3, 6-9].

Отметим, что общий рекуррентный алгебраический метод построения областей достижимо-

сти применим для линейных дискретных управляемых динамических систем любой конечной размерности, и его компьютерная реализация ограничена только ресурсами памяти и быстродействия используемой компьютерной платформы [9]. Данное замечание относится и к возможностям применения метода прямых и обратных конструкций для решения задачи оптимального программного терминального управления.

Предлагаемый алгоритм решения исследуемой многошаговой задачи оптимального адаптивного терминального управления расходом топлива ДУ РН разработан на основании результатов работ [3-10], он использует модификации общего рекуррентного алгебраического метода построения областей достижимости [10] и сводится к реализации конечной последовательности решений одношаговых задач линейного и выпуклого математического программирования, систем линейных алгебраических равенств и неравенств, а также к алгебраическим операциям над выпуклыми многогранными компактами.

Данная статья состоит из двух частей. В первой рассматривается постановка задачи оптимального адаптивного терминального управления расходом топлива ДУ РН, и вводятся основные определения и утверждения, необходимые для решения задачи. Во второй описываются предлагаемые численные алгоритмы решения задач оптимального программного и адаптивного терминального управления, а также приводится модельный пример, в котором иллюстрируется действие этих алгоритмов.

1. Постановка задачи

На промежутке времени рассмотрим нелинейную непрерывную динамическую мо-

дель [4], описывающую установившийся режим работы жидкостной ДУ РН. Скалярное управляющее воздействие и($) отражает изменение положения дроссельной заслонки, которое позволяет одновременно изменять расходы компонентов топлива: окислителя и горючего.

Значения массовых расходов компонентов топлива можно рассчитать по следующим нелинейным алгебраическим выражениям:

т (Л _ (Р + СЦ(})2 + оЦ(I))(К + и^))

^О(') о ,

(I + С3и^)2 + СЦ Ш1 + К + и (0)

тг(0 _^^Ц^СЦ«_

(I + С3Ц ^ )2 + С4Ц (t ))(1 + К + и ^)) где t е tl]; Р, I, К - номинальные значения тяги, удельного импульса тяги и коэффициента соотношения компонентов соответственно; Ц(/) _ с5и(/) + АК, где и($) - скалярное управление; сь с2, ..., с5 - некоторые коэффициенты, определяющие динамику расхода топлива; ЛК - погрешность выставки дросселя в расчетное положение (погрешность выставки дросселя на расчетное значение).

Значения масс компонентов топлива в баках зависят от массовых расходов компонентов топлива (1) и могут быть найдены согласно соотношениям:

М0 (0 _ М° + ЛМ0 -Г1 т0 ^ )dt,

* (2)

Мг ^) _ М° +ЛМГ тг (t^,

где М°, М° - начальные массы окислителя и горючего в баках; ЛМ0, ЛМf - погрешности заправки топливных баков (определяют начальное фазовое состояние системы).

Далее мы прибегаем к аппроксимации описанной модели с помощью ее линейной дискретной динамической системы. Для этого исходная нелинейная модель, описываемая (1), (2), в первую очередь линеаризуется вдоль опорной траектории:

mf (t) = ,

o I +1 • K

mj (t) = -

nref (t) -_P

I +1 • K

M0ef (t) - MO - 1PKK t,

P (3)

Mff (t) - m0--P—t.

f f I +1 • K

Затем линеаризованная модель дискретизируется с учетом того, что количество допустимых моментов времени для смены значений управляющего воздействия конечно и равно некоторому наперед заданному натуральному числу Т и Т = ^. Детально с процедурами линеаризации и дискретизации математической модели расхода топлива ДУ РН можно познакомиться в работе [4].

Теперь рассмотрим сформированную аппроксимирующую линейную дискретную управляемую динамическую систему на целочисленном промежутке времени 0,Т = {0,1,...,Т} . Значения массовых расходов топлива рассчитываются по формулам: т0 (? +1) = т0 (?) + аи(?), т0 (0) = т"от + аЛК,

mf (t +1) = mf (t) + pu(t), mf (0) = mjm ,

(4)

где t e 0,T — 1; a, p - коэффициенты, полученные при линеаризации исходной системы (1), (2);

/ \ nom nom

u(t) - скалярное управление; mo , mf - номинальные значения массовых расходов. Рекуррентные соотношения для определения масс компонентов топлива: M0 (t +1) = M0 (t) — AT (t)m0 (t), Mo (0) = MO +AMo, M f (t +1) = M f (t) — AT (t)mf (t ), Mf (0) = M0 + AMf,

где t e 0,T — 1; AT (t ) - расчетное время между управлениями.

Выражения (4) и (5), описывающие динамику линейной дискретной системы, могут быть переписаны в следующем рекуррентном векторно-матричном виде:

x(t +1) = A(t)x(t) + B(t)u(t), x(0) = x0, (6)

где ? е 0,Т -1; х(?) е М4 - фазовый вектор системы, х(?) = {т0(?),М0(?),т^(?),М^(?)}, ограниченный следующим множеством:

х(?) е Х^) с М4, г е 0Т (7)

(здесь и далее, Мп - п-мерное векторное пространство векторов-столбцов; п еМ - множество всех натуральных чисел); х(0) = х0 - заданное начальное состояние фазового вектора;

Х1(0) = {х(0)} = {х0}; и(?) е М1 - скалярное управляющее воздействие (управление), которым распоряжается субъект управления Р, ограниченное следующим множеством:

и(?) е и1(г) с М1, г е 0,Т -1; (8)

А (г) е М4х4 - матрица состояния; предполагается, что V? е 0,Т -1 обратная матрица А-1 (г) е М4х4 существует; В(?) е М4х1 - матрица управления.

В данной работе относительно ограничений на фазовое состояние системы и управление делается следующее предположение.

Предположение 1. Множества, ограничивающие значения реализаций фазового вектора системы и управляющего воздействия соответственно в ограничениях (7) и (8), являются выпуклыми, замкнутыми и ограниченными многогранниками (с конечным числом вершин) в соответствующих векторных пространствах (по определению полагается, что одноточечное множество Х1(0) = {х(0)} = {Х0} относится к классу таких многогранников).

Отметим, что момент времени Т в линейной дискретной системе (6) соответствует моменту времени ^ в исходной нелинейной системе (1), (2), и допустимые моменты времени для смены значений управляющих воздействий и(?) в исходной системе и в аппроксимирующей системе совпадают.

Для фиксированного целочисленного промежутка времени т,Т с 0,Т (к Т), учитывая ограничение (8), определим множество Щт,Т) е сотр(М1х(Т-х)) допустимых программных управлений и (•) = {и(г )}?етТ-1 следующим образом:

и(х,Т) = {и(-): и(0 е М1х(Т-х), V? е т,Т -1, и(?) е и1(?)}.

Набор ^(х) _ (т, х(х)} е °,Т х Х1(х) _ _ {°,х°}) назовем т-позицией дискретной динамиче-

ской системы (6)-(8), а множество W(х) _ {т} х Х1 (х) (W(0) _ W° _ {^(°) _ : _ (°, х°} е 0 х Х°}) назовем множеством всех допустимых т-позиций.

Затем для оценки качества процесса управления в динамической системе на временном интервале т,Т с °,Т определим такой выпуклый функционал у^у : W(х) х и(х,Т) ^ М1 такой, что

для реализаций (^(х),м(-)) е W(х) х и(х,Т) его значения будут определяться по формуле

у- (^(х),и(-)) _ ||х(Т) - ха 114 _ Ф(х(Т)), (9)

где х(Т) _ х(Т; х,Т, х(х), -¡иИ)} -—-) - финальное фазовое состояние движения (траектории)

" * ?ех,Т —1

рассматриваемой динамической системы; хd е М4 - желаемое финальное фазовое состояние; || • ||4 - евклидова норма в пространстве М4 .

Тогда целью субъекта управления Р в рассматриваемом процессе управления динамической системой (6)-(9) на отрезке времени х, Т с °, Т будет являться достижение посредством выбора допустимого программного управления н(-) е и(х,Т) такого результата, что функционал у^у,

определяемый (9), будет принимать наименьшее (минимальное) возможное значение.

Эта цель достигается субъектом управления Р путем решения следующей вспомогательной нелинейной многошаговой задачи оптимального программного терминального управления для дискретной динамической системы (6)-(9).

Задача 1. Для промежутка времени х,Т с °,Т (х < Т) и реализации т-позиции н'(х) _ (х, х(х)} е W(т) _ в динамической системе (6)-(9) субъекту управления Р требуется найти множество иуе)(х,Т, ^(х)) с и(х,Т) оптимальных программных управлений и (е)() _ (и ^(О}^—т—1, которое определяется соотношением - условием оптимальности:

иуе) (х,Т, ^(х)) _ (и(е): и(е)(•) е Щ^Т),

у^ (^(х),и(е)(-)) _ шхп_ у^ (^(х),и(0) _ сУр^,^(х))}, (1°)

как реализацию конечной последовательности одношаговых операций. Здесь функционал у^у определен формулой (9). Число с<уе')(х,Т,^(х)) называется оптимальным результатом программного терминального управления на промежутке времени х,Т для дискретной динамической системы (6)-(9) относительно т-позиции w(т) и функционала у^у .

Отметим, что решение Задачи 1 существует, и далее на основе работ [3, 6, 8, 9] будет предложен алгоритм для его нахождения.

Учитывая вышеизложенное, можно сформулировать цель субъекта управления Р в задаче оптимального адаптивного управления для динамической системы (6)-(9).

На промежутке времени °, Т субъекту управления Р необходимо сформировать управление

и( ) _ (и^)}?е°у—1 (для всех t е °,Т -1: и(0 е и^)) объектом (6) как стратегию адаптивного (с обратной связью) управления, учитывающую информацию о ^позиции w(t) _ (^х^)}е W(t) в

каждый момент времени t е °,Т — 1 так, что к концу процесса управления функционал у°у, определенный соотношением (9), принял наименьшее (минимальное) возможное значение.

Тогда, используя вышеприведенные рассуждения и аналогично [3, 6], мы можем формализовать достижение этой цели следующим образом.

Допустимой адаптивной стратегией управления иа субъекта управления Р в динамической

системе (6)-(9) на промежутке времени °,Т называется отображение, которое каждому моменту

времени те 0,Т-1 и допустимой реализации т-позиции ^(т) = (т,х(т)}е W(т) (^(0) = ^0) ставит в соответствие множество Ua (и'(т)) с U1(т) управлений и(т) е U1(т) . Обозначим множество всех

допустимых стратегий адаптивного управления субъекта управления Р для рассматриваемого

*

процесса управления как Uа .

Пучком траекторий системы (6)-(9) назовем множество

Х(;0Т,w0,Uа) = (х*(0: х*(0 е М4х(Т-1), 3 /(•) е Щ^Т),

Vt е 0Т, х* ^) = х(^ ОТ, х0,/(•)), ^) = (t, х* (t)} е W(t), ^(0) = м>0, (11)

«*(•) = {u»}^, Vi е 0,T -1,u*(i) е Ua(w*(i))},

соответствующее начальной позиции w(0) = W0 е Wo и допустимой стратегии Ua = Ua (w* (х)) е U*a , t е 0, Г -1, w*(i) = {i, x*(i)} е W(t) субъекта управления Р на отрезке времени 0,T .

Тогда можно сформулировать следующую нелинейную многошаговую задачу оптимального адаптивного терминального управления для рассматриваемой динамической системы (6)-(9).

Задача 2. Для промежутка времени 0, T и начальной позиции Wo = {0, Хо} е Wo в дискретной динамической системе (6)—(9) субъекту управления Р требуется найти стратегию оптимального адаптивного терминального управления Uae) = Uae)(w(x)) е Ua, w(i) = {i,x(i)} е W(i), t е 0,T -1, (w(0) = W0) , которая удовлетворяет следующему условию оптимальности: y^ (W0, Uae)) = min () Ф(x(T)) =

' x(T)еХ(T; 0,T,W0,Uae)) (12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= min min Ф(x(T)) = min y— (w0,Ua) = ca®.)(0,T,w0),

UaEUa x(T)еХ(T;0,T,W0,Ua) UaEU*a U'T ''

как реализацию конечной последовательности одношаговых операций. Здесь функционал y^j определен соотношением (9). Число 0^(0^, w0) называется результатом оптимального адаптивного терминального управления на отрезке времени 0, T для дискретной динамической системы (6)—(9) относительно начальной позиции W0 и функционала у^.

Отметим, что решение Задачи 2 существует, и в следующем разделе будет описан алгоритм ее решения.

2. Основные определения и предложения

В настоящее время подходы по построению областей достижимости управляемых динамических систем широко распространены в теоретических и практических задачах оптимального управления [2-10]. Введем в рассмотрение следующие определения.

Определение 1. Прямой областью достижимости дискретной динамической системы (6)—(9)

в момент времени Эех + 1,T , соответствующей паре (х,X(х))е 0,T - 1х 2М (здесь и далее для

любого множества Y символом 2 обозначено множество всех подмножеств множества Y), называется множество G + (х, X (х); Э), определяемое соотношением

G + (х,X(х); Э) = {x(-) | x(-) е М4,x(i +1) = A(i)x(i) + B(i)u(i) е X1(i +1),

t е т, 3 —1, х(т) е X(т), u(t) е U1(t)}.

Определение 2. Обратной областью достижимости дискретной динамической системы (6)-(9) в момент времени т е 0,3 — 1, соответствующей паре (3,X(3)) е 1,Т х 2М , называется множество G- (3, X (3); т), определяемое соотношением

С — (3,X(3); т) = (х(т) | х(т) е М4, х^) = А'1 ^) [х^ +1) — Б(^)и^)] е X1 (t), t е (3, 3 — 1,...,т +1,т}, х(3) е X(3),и^) е ^(t)}.

Модификации общего рекуррентного алгебраического метода построения областей достижимости линейных дискретных управляемых динамических систем [3, 6-9], используемые в этой статье, подробно описаны в работе [1°].

Необходимое и достаточное условие для решения Задачи 1 следует из предыдущих рассуждений и результатов работ [3, 6], другими словами, справедливо следующее утверждение.

Утверждение 1. Для промежутка времени х, Т с °,Т (х < Т), начальной позиции е W° в

системе (6)-(9), фазового вектора х(х) е G+ (°,(х°};х) объекта (6), определяющего т-позицию

w(т) _ (х,х(х)}е W(т) рассматриваемой динамической системы, и множества X(:e^(T) е 2М ,

ух,Т

описываемого с заданной точностью с помощью непустого выпуклого многогранника (с конечным числом вершин в М4 ) и являющегося множеством оптимальных финальных фазовых состояний объекта (6), пусть множество ^^(хТ,(х(х)}, X(e)L(T)) с ЩхТ) допустимых программу

мных управлений сформировано согласно работе [6] путем реализации метода прямых и обратных конструкций решения задачи оптимального программного терминального управления. Тогда справедливы равенства:

^^хТ, w(т)) _ ^ЧтУ,^)},(Т)), ^(ГТ, w(т)) _ Ф(У

Замечание 1. Решение Задачи 1 с помощью метода прямых и обратных конструкций состоит в вычислении множества оптимальных программных управлений ^^(тТ,{х(т)}, Xуe^(T)) _

х,Т

_ Uуe)(х,T, w(т)) и значения оптимального результата Ф^ _ с<(е)(х,Т, w(т)) на отрезке времени

х, Т путем реализации конечной рекуррентной последовательности решений задач линейного и выпуклого математического программирования, алгебраических операций над выпуклыми компактными многогранниками и решений систем алгебраических уравнений и неравенств.

Используя решение Задачи 1 для всех те °,Т-1 и всех т-позиций w(e)(х) _(х,х(е)(х)}е W(т) (w(e)(°) _ w°), х^^) _ х(х;°,Т, х°,и(e)(•)), и^(0 е U(e)(0^,{х°},X(e_i(T), можно сформировать

следующие множества:

U(;}(w(e)(x)) - {и(e) (т): й(е) (т) е U1 (х), й(е) (х) - u(e)(х),

i(e)'-„(eVT^_ • -л(е) ^ тт fr\ л (e)M-„(e)i х)

___ ' (13)

и (e)(-) е U(e)(x,T ,{x(e)(x)}, X(el (T))}, те 0,T -1.

x,T

Далее определим стратегию управления U а _ и а (w(e;(х)) е U а (те 0,Т -1, w(т) е W(х),

w(°) _ ) для процесса адаптивного управления в системе (6)-(9) на промежутке времени 0, Т

(

из класса допустимых адаптивных стратегий U а . Она формально описывается следующим образом:

1) для всех те 0,T-1 и всех т-позиций w(e)(x) -{т,х(е)(х)}е W(x) (w(e)(0) - w0) пусть

U ae)( w(e)(т)) _ ^ ^^(х)) с Ul(х); (14)

2) для всех те 0,Т-1 и всех т-позиций w(e)(х) _(х,х^Чх)}^ W(х) (w(e)(°) _ w°) пусть U^^Чх)) _ Ul(х), _ (15)

где х^т) _ х (т;°х, х°, uXe)(•)), uXe)(•) _ (и ^(0}^, и^(^) е U(e)(0^,{х°}, X(e^(T)).

Пусть и^(0 _ (и(e)(tц е Щ0,Т) будет реализацией управления на промежутке времени 0, Т , вычисленным на основании реализации стратегии адаптивного управления U) е ^

и и ^(Т -1) соответствует (1°) для т = Т - 1. Тогда можно вычислить следующее числовое значение:

0%(0,T, W0) = y0T (W0, u (e)(0). (16)

Справедливо следующее утверждение, которое основывается на Утверждении 1 и формулах (13)-(16).

Утверждение 2. Для начальной позиции w(0) = W0 = {0, x0} е W0 в дискретной динамической

системе (6)-(9) стратегия управления Ua ^ е Ua на отрезке времени 0,T, определяемая (14), (15), является оптимальной стратегией оптимального адаптивного терминального управления для Задачи 2, т. е. U^ = Uе Ua и число 0aeyJ(0,T,w0) есть оптимальный результат в Задаче 2, т. е.

caey(0,T,w0) = ¡%(0,T,w0), соответствующий реализации этой стратегии на отрезке времени 0,T

для рассматриваемого процесса управления.

Во второй части данной работы будут описаны алгоритмы решения Задач 1 и 2 и приведен численный модельный пример, иллюстрирующий эффективность предложенных алгоритмов для решения задачи оптимального адаптивного терминального управления расходом топлива жидкостной ДУ РН.

Работа выполнена при финансовой поддержке РФФИ (проект № 18-01-00544).

Литература

1. Бортовые терминальные системы управления (принципы построения и элементы теории) / Б.Н. Петров, Ю.П. Портнов-Соколов, А.Я. Андриенко, В.П. Иванов. — М.: Машиностроение, 1983. — 200 с.

2. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. — М.: Наука, 1968. — 476 с.

3. Шориков, А.Ф. Минимаксное оценивание и управление в дискретных динамических системах /А.Ф. Шориков. — Екатеринбург: Изд-во Урал. гос. ун-та, 1997. — 242 с.

4. Шориков, А.Ф. Формирование линейной дискретной динамической модели для решения задачи оптимального терминального управления расходом топлива ракеты-носителя / А.Ф. Шориков, Калёв В.И. // Информационные технологии и системы: тр. 5-й Междунар. науч. конф. — 2016. — С. 61—66.

5. Калёв, В.И. Моделирование задачи терминального управления расходом топлива жидкостных ракет / В.И. Калёв, А.Ф. Шориков // Известия высших учебных заведений. Физика. — 2016. — Т. 59, № 8-2. — С. 45—48.

6. Тюлюкин, В.А. Об одном алгоритме построения области достижимости линейной управляемой системы /В.А. Тюлюкин, А.Ф. Шориков //Негладкие задачи оптимизации и управление. — Свердловск: УрО АН СССР. — 1988. — С. 55—63.

7. Тюлюкин, В.А. Алгоритм решения задачи терминального управления для линейной дискретной системы /В.А. Тюлюкин, А.Ф. Шориков //Автоматика и телемеханика. — 1993. — № 4. — С. 115—127.

8. Шориков, А.Ф. Алгоритм решения задачи оптимального терминального управления в линейных дискретных динамических системах / А.Ф. Шориков // Информационные технологии в экономике: теория, модели и методы: сб. науч. тр. — Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2005. — С. 119—138.

9. Шориков, А.Ф. Описание библиотеки компьютерных программ для моделирования решения задачи апостериорного минимаксного оценивания /А.Ф. Шориков, В.А. Тюлюкин //Известия Урал. гос. экон. ун-та. — 1999. — № 2. — С. 36—49.

10. Аппроксимация областей достижимости нелинейных дискретных управляемых динамических систем /А.Ф. Шориков, В.В. Булаев, А.Ю. Горанов, В.И. Калев //Вестник БГУ. Математика, информатика. — 2018. — № 1. — С. 52—65.

Шориков Андрей Федорович, д-р физ.-мат. наук, профессор кафедры прикладной математики Уральского энергетического института, Уральский федеральный университет им. первого Президента России Б.Н. Ельцина, г. Екатеринбург; afshorikov@mail.ru.

Калёв Виталий Игоревич, аспирант кафедры прикладной математики Уральского энергетического института, Уральский федеральный университет им. первого Президента России Б.Н. Ельцина; инженер-конструктор отдела управления движением, АО «НПО автоматики им. академика Н.А. Семихатова», г. Екатеринбург; v.i.kalev@urfu.ru.

Поступила в редакцию 1 декабря 2018 г

DOI: 10.14529/ctcr190103

THE OPTIMAL CLOSED-LOOP TERMINAL PROPELLANT CONSUMPTION CONTROL ALGORITHM FOR LIQUID PROPULSION SYSTEM OF LAUNCH VEHICLE. PART I

A.F. Shorikov1, afshorikov@mail.ru, V.I. Kalev1'2, v.i.kalev@urfu.ru

1 Ural Federal University named after the first President of Russia B.N. Yeltsin, Ekaterinburg, Russian Federation,

2 JSC "Scientific and Production Association of automatics named after academician N.A. Semikhatov", Ekaterinburg, Russian Federation

In this paper we propose the algorithm of launch vehicle's liquid propulsion system propellant consumption control problem solving, in which this problem is formulated as the optimal closed-loop terminal control problem for corresponding linear discrete-time dynamical system. To achieve this, initial nonlinear continuous model, which describes the plant dynamics, is linearized along given reference trajectory and then is discretized in accordance to control process requirements. As the result of this, we have formed approximating model represented as the vector-matrix system of recurrence equations. The constraints of state vector and control vector are also taken into account in this approximating system, and we assume that the constraints are convex, closed and limited polyhedra with finite number of vertices in corresponding vector spaces. The optimal open-loop and closed-loop terminal control problems are formulated for generated linear discrete-time dynamical system. For solving the problems the optimal closed-loop terminal control recurrence algorithm is developed, which consists in the solving of number of optimal open-loop terminal control problems for linear discrete-time dynamical system. Based on solution of finite sequence of optimal open-loop terminal control problem for linear approximate model we provide recurrence optimal closed-loop terminal control algorithm for initial nonlinear dynamical system. In the implementation of proposed optimal open-loop control algorithm we use the tool of reachable sets computation and analysis based on general algebraic recurrence approach for linear discrete-time dynamical systems and some modifications of this approach intended for reducing the computational complexity and consequently to increasing the operation speed. The performance of developed optimal closed-loop terminal control algorithm is presented on numerical model example of launch vehicle's first stage liquid propulsion system propellant consumption closed-loop control optimization.

Keywords: optimal closed-loop control, terminal control, propellant consumption, launch vehicle, reachable sets.

References

1. Petrov B.N., Portnov-Sokolov A.Yu., Andrienko A.Ya., Ivanov V.P. Bortovye terminalnye sistemy upravleniya [On-board Terminal Control Systems]. Moscow, Mashinostroenie Publ., 1983. 200 p.

2. Krasovskiy N.N. Teoriya upravleniya dvizheniem (Lineynye sistemy) [Theory of Motion Control (Linear Systems)]. Moscow, Nauka Publ., 1968. 476 p.

3. Shorikov A.F. Minimaksnoe otsenivanie i upravlenie v diskretnykh dinamicheskikh sistemakh [Minimax Estimation and Control in Discrete-Time Dynamical Systems]. Ekaterinburg, Ural State University Publ., 1997. 242 p.

4. Shorikov A.F., Kalev V.I. [Linear Discrete-Time Dynamical Model Forming for Solving Optimal Terminal Fuel Consumption Problem of Launch Vehicle]. Informatsionnye tekhnologii i sistemy. Proceedings of 5th International Conference, 2016, pp. 61-66. (in Russ.)

5. Kalev V.I., Shorikov A.F. [Fuel Consumption Terminal Control Problem Statement for Liquid-Propellant Rockets]. Russian Physics Journal, 2016, vol. 59, no. 8-2, pp. 45-48. (in Russ.)

6. Tyulyukin V.A., Shorikov A.F. [About One Algorithm of Creation of Area of Approachibility of the Linear Operated System]. Optimization and Control Nonsmooth Problems, 1988, pp. 55-63. (in Russ.)

7. Tyulyukin V.A., Shorikov A.F. [The Solution Algorithm of Terminal Control Problem for Linear Discrete-Time System]. Automatics and Telemechanics, 1993, no. 4, pp. 115-127. (in Russ.)

8. Shorikov A.F. [Algorithm of the Solution of a Problem of Optimum Terminal Control in Linear Discrete Dynamic Systems]. Information Technologies in Economy: Theory, Models and Methods: Collection of Scientific Works, Ekaterinburg, 2005, pp. 119-138. (in Russ.)

9. Shorikov A.F., Tyulyukin V.A. [Description of Library of Computer Programs for Modeling of the Solution of a Problem of a Posteriori Minimax Estimation]. News the Ural State Econ. Univ., 1999, no 2, pp. 36-49. (in Russ.)

10. Shorikov A.F., Bulaev V.V., Goranov A.Yu., Kalev V.I., [Approximation of Attainability Domains of Nonlinear Discrete-Time Controlled Dynamical Systems]. Bulletin of the Buryat State University. Mathematics, Informatics, 2018, no. 1, pp. 52-65. (in Russ.)

Received 1 December 2018

ОБРАЗЕЦ ЦИТИРОВАНИЯ

FOR CITATION

Шориков, А.Ф. Алгоритм оптимального адаптивного терминального управления расходом топлива жидкостной двигательной установки ракеты-носителя. Часть I / А.Ф. Шориков, В.И. Калёв // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». - 2019. - Т. 19, № 1. -

С. 30-39. DOI: 10.14529/ctcr190103

Shorikov A.F., Kalev V.I. The Optimal Closed-Loop Terminal Propellant Consumption Control Algorithm for Liquid Propulsion System of Launch Vehicle. Part I. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics,, 2019, vol. 19, no. 1, pp. 30-39. (in Russ.) DOI: 10.14529/ctcr190103

i Надоели баннеры? Вы всегда можете отключить рекламу.