УДК 519.6
Численное решение задач оптимального управления с переключением методом пристрелки
© Т.Ю. Мозжорина МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Проведен численный эксперимент по использованию метода пристрелки при решении задач оптимального управления с переключением. На примере задачи мягкого прилунения отработан алгоритм, обеспечивающий сходимость метода Ньютона в задачах подобного рода. Проведен анализ точности расчетов.
Ключевые слова: численное решение, задачи оптимального управления, принцип максимума Понтрягина, метод пристрелки, задача о мягком прилунении
Введение. Численное решение задач оптимального управления (ОУ) с переключением управления с использованием принципа максимума Понтрягина [1, 2] связано с некоторыми вычислительными трудностями. Решению подобных задач (задачи быстродействия, мягкой посадки космических аппаратов, задачи оптимального перехода спутника между орбитами и т. п.) посвящены труды таких ученых, как Дж. Лейтман [3], Р. Беллман, Д.В. Брекуэлл, Р.П. Федоренко [4] и др. И на сегодняшний день проблема получения точного численного решения задач ОУ остается актуальной [5-14]. Наиболее точные и аккуратные численные решения задач ОУ были получены при решении П-систем, хотя и здесь возникли значительные трудности [4].
Метод пристрелки (или метод стрельбы) заключается в следующем. Система дифференциальных уравнений (ДУ) состояния объекта вместе с сопряженной системой, краевыми условиями и принципом максимума Понтрягина [4, 5] составляет так называемую П-систему, в которой:
• функционал достигает минимального значения при максимуме функции Понтрягина по управлению
T
J(х, у, и ) = | f0 (х, и)dt ^ min,
0
x = (Xj, X2 Xn ^ у = (V^ V n ^
f = (/¡,f2,...,fnf, u = ^u)T;
• система состояния x' = f (x, и);
_ ' дИ
• сопряженная система у =--;
дх
• функция Понтрягина Н (х, у, и ) = (у, / (х, и ) )- /0( х, и );
• ограничения на управление и е [мт1п, мтах ];
• краевые условия
хi (0) = х,. о, , = 1,..., I, I < и, (0) = у, о, , = 1,..., т, т < и, хг.(Г) = хТ, , = I +1,..., и1, у,.(Т) = у,Т, , = т +1, ..., и2, и + и2 = 2и.
Решить П-систему — значит решить краевую задачу для системы обыкновенных ДУ с краевыми условиями первого рода. В методе пристрелки краевая задача приводится к задаче Коши заданием в некотором приближении недостающих начальных условий (так называемых параметров пристрелки). Затем одним из численных методов интегрируется система ДУ, в конце процесса получаются невязки — несоответствия между заданными краевыми условиями на правом конце и условиями, полученными в ходе интегрирования П-системы. Подбор точных значений параметров пристрелки осуществляется при решении системы нелинейных алгебраических уравнений методом Ньютона.
При линейной зависимости функции Понтрягина от управления оптимальные значения управления при некоторых дополнительных условиях лежат на границе интервала [мт1п, и"тах ]. В связи с этим может потребоваться переключение управления. Моменты переключения управления должны быть вычислены с большой точностью. Сходимость метода Ньютона в задачах с переключением зависит от соотношения заданной точности определения невязок и величины шага интегрирования в численном методе решения системы ДУ. Как правило, шаг интегрирования гораздо больше задаваемой точности по невязкам. В результате возникают проблемы сходимости метода Ньютона, как классического, так и модифицированного. Успешные попытки в направлении улучшения сходимости в рассматриваемых задачах ОУ были предприняты математиком Р.П. Федоренко [4].
Цель работы — поиск численного решения задачи ОУ с переключением на примере задачи о мягком прилунении в ее наиболее упрощенной постановке (только для последнего вертикального участка посадки) методом пристрелки, анализ проблемы сходимости метода Ньютона в подобных задачах и оценка точности вычислений. При поиске решения указанной задачи использованы рекомендации работ [4, 5].
Постановка задачи и математическое моделирование процесса посадки. Задача мягкого прилунения космического аппарата формулируется следующим образом: достижение нулевой скорости в момент касания аппаратом поверхности Луны при минимальных затратах топлива.
Найдем экстремум функционала
1
3(и) = | ийг ^ шт,
где Т — конечный момент времени г. При системе состояния
^ = -У.
йг
йУ йг
йт
йг
ри
т
Л >
(1)
= ~От = -и,
где к — расстояние от космического аппарата до поверхности Луны; У — скорость космического аппарата; Ри = Р — тяга двигателя, коэффициент Р пропорционален скорости истечения газа из сопла двигателя (удельный импульс ракетного двигателя); т — масса космического аппарата; gЛ — ускорение свободного падения на Луне, равное 1,62 м/с2; От = и — расход топлива (управление). Краевые условия для массы, высоты и скорости следующие:
к(0) = к0; У (0) = Уо;
<т(0) = то; (2)
к(Т) = А,;
V (Т) = Ух.
На управление наложены ограничения
ишт ^ и < иш
(3)
Запишем систему (1) в следующем виде:
йхх
йг
йх.
йг
йх3
йг
= Х2;
2 Ри
2 =х +gл;
= -и,
где х, = А, х2 = У, х3 = т.
Тогда функция Понтрягина примет вид
Н(х,у,и) = х2 + у2(gл -—) + Уз(-и)"и,
(4)
и сопряженная система
й у1
йг
ё У 2
йг
й у3
= 0;
= У1;
(5)
йг
ри
= У 2 ~'
Функция Понтрягина будет принимать максимальное значение при нулевом управлении, если функция переключения (коэффициент при управлении в функции Понтрягина) отрицательна, и при максимальном значении управления, если функция переключения положительна. По физическому смыслу задачи нулевую скорость в момент посадки можно достичь при работающем двигателе. Следовательно, в начале посадки двигатели должны быть выключены, а в определенный момент времени включены на максимальную тягу. Это, согласно принципу максимума Понтрягина, позволит сократить топливные расходы. Функция переключения Ф = -у2(Р/х3)-у3 -1 должна быть отрицательна в начале посадки и положительна в конце процесса.
Из условий трансверсальности запишем: у 3(Т) = 0.
Имеем краевую задачу для нормальной системы ДУ шестого порядка при следующих краевых условиях:
х1(0) = ¿о; х2(0) = Го; Х3(0) = т0;
х1(Т) = 0; х2(Т) = 0.
Для удобства вычислений задачу приведем к задаче с фиксированным правым концом введением нового аргумента г1 = г / Т. Тогда преобразованная П-система из (1), (5) примет вид
3
3
dx1 dt1
dx2 dt1 dx3 dt
i _
= -x2T;
ßu
- — + Ел x3
\
T ;
= -uT ;
d у1
dt1 d у2
dt1 d у3
dt1
= 0;
= VT ;
ßu T
= У2 ~T•
Функцию Понтрягина и функцию переключения также преобразуем к виду
(
H ( x, у, u ) =
f
"Vi X2 — У2
ßu
V x3
-g Л
Ф=
ß
Л
У
Л
Л
+ у3 (—w ) - u
T,
—У 2--У 3 — 1
T •
За параметры пристрелки примем V1(0), у3(0), T. Уравнения невязок составят нелинейную систему (при этом ôi должны быть равны нулю с заданной точностью)
ô1 = x1(T) — 0 ^ 0;
<02 = x2(T) — 0 ^ 0; (6)
53 = у3 (T ) — 0 ^ 0.
Оставшееся неизвестным начальное условие для у2(0) можно пересчитать по заданному у1(0) и равенству нулю функции Понтрягина в задачах со свободным правым концом и автономной системой состояния в оптимальном процессе [1, 2]
Vi(0F (0)
у2(0)=•
g Л
(7)
Из анализа сопряженной системы (5) и условия возрастания функции переключения можно заключить, что должно выполняться соотношение у1(0) < 0.
Численный метод решения задачи. Интегрирование П-системы осуществляется методом Рунге — Кутты четвертого порядка. Для решения системы уравнений невязок и подбора уточненных значений параметров пристрелки используется метод Ньютона, выход из которого осуществляется по условию max ||5г. < 105. Если не предпринимать никаких дополнительных мероприятий, то сходимости метода Ньютона не наблюдается. Момент переключения управления в этом случае определяется с точностью до величины шага интегрирования, что сильно сказывается на матрице Якоби невязок. Используя линейную интерполяцию функции переключения на шаге интегрирования, на котором происходит смена знака функции переключения, и усреднение управления на этом же шаге по приведенным ниже формулам [4], можно добиться удовлетворительной сходимости метода Ньютона, как его классического варианта (что предпочтительнее с точки зрения объемов вычислений), так и модифицированного:
г — г__Ф(/к') к )
'пер ^ Ф(0-Ф(^)( к-1 ^
г — Ф(гк-1) ( - г \
и — и i Г + и Г.
ср шт^ шах^>
Здесь гпер — момент переключения, переключение управления происходит на шаге интегрирования [гк-1, гк ]; иср — среднее значение
управления на шаге переключения.
Для модифицированного метода Ньютона введем ограничение на максимальный шаг, он не должен превышать ньютоновский шаг классического метода. Остается проблема выбора начального приближения для параметров пристрелки. Если выбранные значения параметров пристрелки приведут к сохранению знака функции переключения при всех значениях времени г е Т, то матрица Якоби по невязкам вырождается, и метод Ньютона теряет сходимость.
Результаты численных расчетов. Краевые условия соответствуют спускаемому аппарату, аналогичному Аро11о-11, в 1969 г. осуществившему посадку на Луну:
Масса, т(0), кг....................................................................................... 15 000
Высота, к(0), м ...................................................................................... 150
к (Т), м ...................................................................................... 0
Скорость, V (0), м/с................................................................................ 8,2
V (Т), м/с ............................................................................... 0
На управление наложены ограничения итах = 15,74 кг/с, итт = 0. Импульс двигателя р = 3050 м/с.
Полученные зависимости фазовых переменных от времени приведены на рис. 1, фазовые траектории представлены на рис. 2.
V, м/с
0 5 10 15 и с
а
б
Рис. 1 (начало). Зависимости скорости (а), высоты (б) от времени:
--— свободное падение;--,-,--включение
двигателя на 4,51, 4,73 и 4,91 с
О 5 10 15 I, с
в
Рис. 1 (окончание). Зависимости массы (в) от времени:
---свободное падение;--, ,--включение
двигателя на 4,51, 4,73 и 4,91 с
V, м/с
25
20 ч ~ -V ч ч ч ч
15 10 ХУ/' ///' // /' \ ч ч ч Ч Ч Ч
5 / / / / X / у// / / / // 1
Рис. 2. Фазовые траектории:
--— свободное падение;--, ,--включение
двигателя на 4,51, 4,73 и 4,91 с
Сходимость классического и модифицированного метода Ньютона в зависимости от начальных значений параметров пристрелки отражена в табл. 1.
Таблица 1
Сходимость классического и модифицированного метода Ньютона
Варианты задания параметров пристрелки ^(0) Уз(0) Т Количество итераций метода Ньютона Норма невязок по начальному приближению параметров пристрелки
классический модифицированный
I — 0,15 — 0,7000 15 4 4 2,170
II — 0,10 — 0,7954 10 6 6 25,928
III — 0,30 — 0,0810 20 5 5 187,70
В результате были получены следующие значения параметров пристрелки: у1(0) = -0,492987, у3(0) = -0,017990, Т = 16,40830, норма
— 8
невязок для решения составила 10 .
Оценка точности результатов расчета. Для оценки точности результатов применим параллельный расчет другим методом. Зная, что в рассматриваемой задаче переключение управления осуществляется один раз, применим метод дихотомии для отыскания времени переключения при интегрировании лишь одной системы состояния (1). Интегрирование ведется неявным методом Адамса до V(Т) = 0, при котором определяется время посадки Т. Условие выхода из метода дихотомии \Ъ(Т)| < 10"5.
Основные полученные значения представлены в табл. 2. Видно, что результаты отличаются в третьей или четвертой значащей цифре, что и можно считать точностью расчетов.
Таблица 2
Полученные значения
Метод Гпер > с Т, с К* > м/с Апер > м ттопл, кг Шаг интегрирования в конечной итерации, с
пристрелки 4,7347 16,4083 15,85820 93,0174 170,08 0,0164
дихотомии 4,7197 16,3783 15,84579 92,7797 171,00 0,0300
Рекомендации по выбору начального приближения параметров пристрелки. Подбор удачных начальных приближений метода Ньютона зависит от конкретной задачи. При решении поставленной задачи возможны следующие рассуждения.
Учитывая, что для работоспособности метода Ньютона необходимо наличие переключения управления в процессе посадки, возможен начальный пересчет у3(0) по заданному значению у1(0) и вы-
ражению для функции переключения. Допустим, что момент переключения tпер = Т /2. Тогда из анализа систем (1) и (5) и равенства
Ф = (-у2 / х3) - Уз -1) Т = 0 в момент переключения имеем:
V2 (/пер )Р
' *з('пер ) ^пер
-V з (^пер) -1 = 0;
V3 = const, х3 = const при u = 0, V1 = const на всем T.
Тогда
Уз(0) =-1 -Г Т + ШЪШ (8)
12 £д ) *3(0)
Используя подобные рассуждения, можно предложить другой набор параметров пристрелки, которые интуитивно проще задать в удачной комбинации у1 (0), ^, Т при сохранении системы невязок
(6). Величины у2(0), у3(0) пересчитываются по формулам (7)
и (8). В этом случае не потребуется осреднение управления на участке смены знака функции переключения, поскольку, задаваясь значением времени переключения, можно устанавливать целочисленное значение шагов интегрирования до момента переключения и после. Вследствие этого может уменьшиться погрешность вычислений.
Заключение. Метод Ньютона можно использовать при решении задач ОУ с переключением методом пристрелки. Классический метод Ньютона успешно используется в подобных задачах и позволяет сократить объем вычислений. Однократное обращение к процедуре вычисления невязок «стоит» интегрирования П-системы. В модифицированном методе Ньютона вместо одного шага (по сравнению с классическим методом) делается несколько шагов в направлении найденного значения ньютоновского шага. Точность вычислений зависит от выбора шага и метода интегрирования.
Отметим, что построение системы уравнений невязок и выбор параметров пристрелки необходимо проводить с учетом особенностей конкретной задачи ОУ. В настоящей статье рассмотрена задача программного управления ОУ. При решении задачи синтеза ОУ, особенно с учетом случайных внешних воздействий, требуется изменение алгоритма исследования.
ЛИТЕРАТУРА
[1] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. Москва, Наука, 1983, 393 с.
[2] Атанс М., Фалб П.Л. Оптимальное управление. Москва, Машиностроение, 1968, 764 с.
[3] Лейтман Дж., ред. Методы оптимизации с приложениями к механике космического полета. Москва, Наука, 1965, 538 с.
[4] Федоренко Р.П. Приближенное решение задач оптимального управления. Москва, Наука, 1978, 486 с.
[5] Григорьев И. С. Методическое пособие по численным методам для решения краевых задач принципа максимума в задачах оптимального управления. Москва, Изд-во Центра прикладных исследований при механико-математическом факультете МГУ, 2005, 160 с.
[6] Meditch J. On the problem of optimal thrust programming for a lunar soft landing. IEEE Transactions on Automatic Control, 1964, no. 9 (4), pp. 477-484.
[7] Хуан И. Оптимальное управление маневром лунного аппарата на выбранную точку мягкой посадки между зависаниями. Труды МАИ, 2016, № 90. URL: http://trudymai.ru/published.php?ID=74747 (дата обращения 21.09.2017).
[8] Blackmore L. Autonomous precision landing of space rockets. The Bridge, Winter 2016, vol. 46, no. 4.
URL: http://web.mit.edu/larsb/www/nae_bridge_2016.pdf (дата обращения 21.09.2017).
[9] Димитриенко Ю.И., Димитриенко И.Д., Коряков М.Н. Комплексное моделирование движения летательных аппаратов и процессов горения в двигателях на основе анизотропных топлив. Инженерный журнал: наука и инновации, 2013, вып. 9.
URL: http://engjournal.ru/catalog/mathmodel/technic/1120.html (дата обращения 21.09.2017).
[10] Жуков Б.И., Лихачев В.Н., Сихарулидзе Ю.Г., Трифонов О.В., Федотов В.П., Ярошевский В.С. Комбинированный алгоритм управления посадкой космического аппарата «Луна-Глоб». Сб. мат. XI Всерос. съезда по фундаментальным проблемам теоретической и прикладной механики. Казань, 20-24 августа 2015, с. 1395-1398.
[11] Жуков Б.И., Лихачев В.Н., Сазонов В.В., Сихарулидзе Ю.Г., Тучин Д.А., Федотов В.П., Ярошевский В.С. Сравнительный анализ алгоритмов управления посадкой на Луну. Космические исследования. 2015, вып. 6, с. 480.
[12] Афанасьев В.А., Дегтярев Г.Л., Мещанов А.С., Сиразетдинов Т.К. Разработка и исследование алгоритмов управления вертикальным приземлением посадочных модулей. Вестник Казанского государственного технического университета им. А.Н. Туполева. 2007, № 3, с. 56-59.
[13] Губарева Е.А., Мозжорина Т.Ю. Оптимизация программы полета дозвукового пассажирского самолета на участке снижения с учетом эксплуатационных ограничений. Инженерный журнал: наука и инновации, 2015, вып. 8. URL: http://engjournal.ru/catalog/arse/adb/1415.html (дата обращения 21.09.2017).
[14] Мозжорина Т.Ю., Губарева Е.А. Моделирование влияния атмосферных условий на результаты оптимизации программы полета дозвукового пассажирского самолета. Математическое моделирование и численные методы, 2014, № 3 (3), c. 74-88.
Мозжорина Татьяна Юрьевна — канд. техн. наук, доцент кафедры «Вычислительная математика и математическая физика» МГТУ им. Н.Э. Баумана. Автор 20 научных работ в области моделирования характеристик газотурбинных двигателей, моделирования полета пассажирских самолетов, оптимизации силовых установок в системе летательного аппарата. e-mail: [email protected]
Статья поступила в редакцию 01.07.2017
Ссылку на эту статью просим оформлять следующим образом:
Мозжорина Т.Ю. Численное решение задач оптимального управления с переключением методом пристрелки. Математическое моделирование и численные методы,, 2017, № 2, с. 94-106.
Numerical solution to problems of optimal control with switching by means of the shooting method
© T.Yu. Mozzhorina Bauman Moscow State Technical University, Moscow, 105005, Russia
We conducted a numerical experiment in applying the shooting method to solve problems of optimal control with switching. We used the problem of lunar soft-landing to test an algorithm that ensures convergence of Newton's method in problems of this type. We analysed the accuracy of our computations.
Keywords: numerical solutions, optimal control problems, Pontryagin's maximum principle, shooting method, lunar soft-landing problem
REFERENCES
[1] Pontryagin L.S., Boltyanskiy V.G., Gamkrelidze R.V., Mishchenko E.F. Ma-
tematicheskaya teoriya optimalnykh protsessov [Mathematical theory of optimal processes]. Moscow, Nauka Publ., 1983, 393 p.
[2] Athans M., Falb P.L. Optimal Control. An Introduction to the Theory and Its Applications. McGraw-Hill, Inc., New York, 1963, 894 p. [In Russ.: Athans M., Falb P.L. Optimalnoe upravlenie. Moscow, Mashinostroenie Publ., 1968, 764 p.].
[3] Leitmann G., ed. Optimization techniques, with applications to aerospace systems. Academic Press, New York, 1962. [In Russ.: Leitmann G., ed. Metody op-timizatsii s prilozheniyami k mekhanike kosmicheskogo poleta. Moscow, Nauka Publ., 1965, 538 p.].
[4] Fedorenko R.P. Priblizhennoe reshenie zadach optimalnogo upravleniya [Approximate solutions to optimal control problems]. Moscow, Nauka Publ., 1978, 486 p.
[5] Grigorev I.S. Metodicheskoe posobie po chislennym metodam dlya resheniya kraevykh zadach printsipa maksimuma v zadachakh optimalnogo upravleniya [Methodological manual on numerical methods for solving boundary problems on the maximum principle in optimal control problems]. Moscow, Centre for Applied Research of the Faculty of Mechanics and Mathematics of Lomonosov Moscow State University Publ., 2005, 160 p.
[6] Meditch J. IEEE Transactions on Automatic Control, 1964, no. 9 (4), pp. 477-484.
[7] Huang Y. Trudy MAI — Trudy MAI journal (Proc. of the Moscow Aviation Institute), 2016, no. 90. Available at: http://trudymai.ru/published.php?ID=74747 (accessed September 21, 2017).
[8] Blackmore L. The Bridge, Winter 2016, vol. 46, no. 4. Available at: http://web.mit.edu/larsb/www/nae_bridge_2016.pdf (accessed September 21, 2017).
[9] Dimitrienko Yu.I., Dimitrienko I.D., Koryakov M.N. Inzhenernyy zhurnal: nauka i innovatsii — Engineering Journal: Science and Innovation, 2013, no. 9. Available at: http://engjournal.ru/catalog/mathmodel/technic/1120.html (accessed September 21, 2017).
[10] Zhukov B.I., Likhachev V.N., Sikharulidze Yu.G., Trifonov O.V., Fedotov V.P., Yaroshevskiy V.S. Kombinirovannyy algoritm upravleniya posadkoy kosmiches-kogo apparata "Luna-Glob" [Combined control algorithm for Luna-Glob spacecraft landing]. Sb. mat. Vseros. sezda po fundamentalnym problemam teoreti-cheskoy i prikladnoy mekhaniki. Kazan, 20-24 avgusta 2015 [Proc. of the 11-th All-Russian congress on basic problems of theoretical and applied mechanics. Kazan, August 20-24, 2015], pp. 1395-1398.
[11] Zhukov B.I., Likhachev V.N., Sazonov V.V., Sikharulidze Yu.G., Tuchin D.A., Fedotov V.P., Yaroshevskiy V.S. Kosmicheskie issledovaniya — Cosmic Research, 2015, no. 6, p. 480.
[12] Afanasev V.A., Degtyarev G.L., Meshchanov A.S., Sirazetdinov T.K. Vestnik Kazanskogo gosudarstvennogo tekhnicheskogo universiteta im. A.N. Tupole-va — "Vestnik KGTU im. A.N. Tupoleva" Scientific Technical Journal (Bulletin of the Kazan State Technical University named after A.N. Tupolev), 2007, no. 3, pp. 56-59.
[13] Gubareva E.A., Mozzhorina T.Yu. Inzhenernyy zhurnal: nauka i innovatsii — Engineering Journal: Science and Innovation, 2015, no. 8. Available at: http://engjournal.ru/catalog/arse/adb/1415.html (accessed September 21, 2017).
[14] Mozzhorina T.Yu., Gubareva E.A. Matematicheskoe modelirovanie i chislennye metody — Mathematical Modeling and Computational Methods, 2014, no. 3 (3), pp. 74-88.
Mozzhorina T.Yu., Cand. Sc. (Eng.), Assoc. Professor, Department of Computational Mathematics and Mathematical Physics, Bauman Moscow State Technical University. Author of 20 scientific publications in the field of modelling gas-turbine engine characteristics, modelling flight of passenger aircraft, optimising power plants as part of an aircraft system. e-mail: [email protected]