ISSN 1810-0198. Вестник Тамбовского университета. Серия: естественные и технические науки
Том 23, № 124
2018
DOI: 10.20310/1810-0198-2018-23-124-861-876 УДК 517.977.56
О ДИФФЕРЕНЦИРОВАНИИ ФУНКЦИОНАЛОВ АППРОКСИМИРУЮЩИХ ЗАДАЧ В РАМКАХ МЕТОДА ПОДВИЖНЫХ УЗЛОВ ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СО СВОБОДНЫМ ВРЕМЕНЕМ
^ А. В. Чернов
ФГБОУ ВО «Нижегородский государственный университет им. Н.И. Лобачевского» 603950, Российская Федерация, г. Н. Новгород, пр. Гагарина, 23 ФГБОУ ВО «Нижегородский государственный технический университет им. P.E. Алексеева» 603950, Российская Федерация, г. Н. Новгород, ул. Минина, 24 E-mail: [email protected]
Аннотация. Дается строгое обоснование формул производных функционалов аппроксимирующих задач, возникающих при использовании метода подвижных узлов в рамках техники параметризации управления для решения задач оптимального управления со свободным временем. В качестве примера приводятся результаты численного решения задачи о посадке на Луну.
Ключевые слова: задача оптимального управления со свободным временем; техника параметризации управления; метод подвижных узлов
Введение
Как отмечено в [1], «проблема синтеза оптимального управления для сложных динамических систем аналитически неразрешима и сопряжена с принципиальными и вычислительными трудностями». При условии тотального (по всем допустимым управлениям) сохранения однозначной глобальной разрешимости управляемой системы эффективным подходом к решению этой проблемы является применение техники параметризации управления, см., например, [2, 3]. Суть ее состоит в том, что за счет дискретизации управление отождествляется с конечным набором параметров, функционалы оптимизационной задачи обращаются в функции конечного числа переменных, а сама задача оптимизации — в конечномерную задачу математического программирования (аппроксимирующую задачу). Основная идея этой техники для одной конкретной распределенной системы первого порядка была описана в [4]. Там же было предложено использовать подвижную (управляемую) сетку при кусочно постоянной дискретизации управления и
были получены формулы частных производных функционала по параметрам. При этом для предотвращения персопределенности при налегании прямоугольников - элементов сетки друг на друга предлагалось итерационно поддерживать специальную систему ограничений на управляемые узлы сетки, а также производить коррекцию сетки, основанную на удалении «накрываемых» узлов (при вычислении значений управления) на каждой итерации. Позже в [5] для сосредоточенных систем в рамках техники последовательной линеаризации (предполагающей дискретизацию всей задачи, включая дискретизацию управляемой системы) был предложен метод плавающих узлов — с целью рационального выбора узлов сетки, см. также [6, п. 2.2.5]. Метод основан на замене
dv
независимой переменной t = v(t), т / [0;1], и(0) = 0, и(1) = Т, — рз 0. Разбиение
ат
отрезка [0; 1] берется фиксированным, а функция г>(т), рассматриваемая как дополнительное управление, обеспечивает варьирование соответствующего разбиения отрезка [0;Т]. Неотрицательность производной обеспечивает неналегание элементов разбиения друг на друга. Та же идея плавающих узлов, но уже в рамках техники параметризации управления, была предложена в [7,8] под названием control parametrization enhancing transform. Там же было показано, что каждая из аппроксимирующих задач, рассматриваемая как конечномерная задача математического программирования, разрешима; проведен анализ сходимости аппроксимаций; приведено несколько примеров численного решения, продемонстрировавших эффективность метода. Поскольку управление v(t) в [7,8] подвергается кусочно постоянной дискретизации и входит всюду, куда входит независимая переменная, здесь можно увидеть некоторые трудности. Кроме того, при использовании методов первого порядка для решения аппроксимирующей задачи потребуется дифференцируемостъ правой части и интегранта функционала по переменной времени. В [9] была предложена более простая конструкция, обеспечивающая неналегание отрезков разбиения друг на друга и не предполагающая никаких дополнительных ограничений, введения новых функций и т.п. Кроме того, при строго сформулированных условиях были приведены «быстрые» формулы производных функций аппроксимирующей задачи для сосредоточенных задач оптимального управления со свободным временем в рамках метода подвижных узлов. В качестве примеров, подтверждающих эффективность соответствующей реализации метода подвижных узлов, были представлены результаты численного решения линейной задачи быстродействия и задачи о прокладке трассы. Однако никаких доказательств в [9] не приводилось ввиду их громоздкости. В |10] были представлены и строго доказаны формулы производных целевой функции аппроксимирующей задачи в рамках аналогичной реализации метода подвижных узлов для задачи оптимального управления системой Гурса-Дарбу на варьируемой области. Доказательство проводилось на основе полученной там же формулы приращения функционала по парс (и, Г) для задачи оптимального управления абстрактным функционально-операторным уравнением типа Гаммсрштейна на варьируемой по набору параметров Т области (и - управляющая функция). Данная работа посвящена обоснованию формул [9] на основе абстрактной формулы приращения |10]. В качестве примера, подтверждающего эффективность метода, представлены результаты численного решения известной задачи о мягкой посадке на Луну.
1. Краткое описание метода подвижных узлов
Пусть £, s / N - заданные числа; а, /3 / Ж3, а > 0 > /3, в / заданные векторы; J- = j-tt / [0; ) : u(t) / [а; /3] для п.в. t / [0; +€ ) - множество допустимых управлений; /(£, v) : [0; +t ) OR" оо - заданная функция, непрерывно дифференцируемая по переменным £ / М£, и / К3 и вместе с производными измеримая по i / [0;+€ ), непрерывная по / О®8 и ПРИ П^ = [0;Т], т = £ удовлетворяющая условиям:
Fi) ЯГ/В+, x/LU ПТ), «/^(Пт) имеем: / .,х(.),<)[ / ЦЧЦт)\ F2) ЯГ/R+, х/4(Пг), «/Ьй(Пт) имвем: «(-)[/1Г£(Пт);
F3) функция /jfi, и) не зависит от г; и непрерывна;
F4) для любых Т / R+ и х /Ьен(Пт) имеем [ / L^* "(Пт).
Рассмотрим управляемую систему
х°°= f(t,x,u), t / [0;+е ), ж / АС£[0;+е ), и / х(0) = 9. (1.1)
Здесь АС£[0;+е )-пространство функций, принадлежащих АС" [0; Т] для любого фиксированного Г > 0; АС[0; Т] - пространство функций, абсолютно непрерывных на [0;Т], наделенное нормой х ас[о:Г] = ИА)II + ^ °°li [о;т] - Норму вектор-функции понимаем как норму ее модуля; модуль вектора - как сумму модулей компонент. Будем считать выполненным предположение
Н) ЯТ / R+ существует константа 7(Г) > 0 такая, что управляемая задача Коши (1.1) имеет единственное решение х[и,Т] / С(Пт)£ / J7, Cx[u7T]CLe > 7(T).
Достаточные условия выполнения предположения Н) можно найти, например, в [ 111. При каждом Т > 0 будем рассматривать функционал
"Г
J[u] = J[u](T) = F t,xu{t),u(t)[dt, о
где функция F(t, v) : [0; ) 0®s 00 ® удовлетворяет таким же условиям, как каждая компонента вектор-функции /. В частности,
*■(*,£,«) = *,(*,€) + Ф(*,0,«[. (12)
Сделанные предположения позволяют нам записать управляемую задачу Коши (на каждом отрезке [0; Т\) в виде интегрального уравнения
x = d + A]f u[l(£), t / [0;Г], х / Цц [0;Г],
где А : L[[0; Т] 00 L\[0; Т] - линейный ограниченный оператор (ЛОО), определяемый
t
формулой = Uz{r)dT. Поскольку время Г rj 0 мы считаем свободным, то
о
управляющими наборами являются пары Т\ / Т Выберем произвольно фи-
нальное время Т и 0 и возьмем два управления и, и / Т. принимающие нулевые
значения вне [0; Т]. При сделанных предположениях удается показать, что существует функция а : оо такая, что справедливо представление
"Т
AJ = 7[у](Т) 3[и] (Т) = ) {¡^Гф + (1СП Ли/А + о(т), (1.3)
о ^
где г = сг(Т) Аи (пт); ф = Т\ / [0;Т] решение сопряженного уравнения
ф = V- (14)
Здесь предполагается, что /Д1., хи, и) и т.д.; [0; Т] эо [0; Т\ - оператор,
т
сопряженный к оператору А : Т] оо Ь[ [0; Т]; А~\г\(1.} = ¿т ] функция ф
является, фактически, решением сопряженной задачи
Ф™= {¡¡РФ I / [0-Т1 ф / А0[о-Т\- ф(Т) = 0.
Пусть г/ / N. Для каждого текущего Т будем разбивать отрезок [0; Т] на и проме-
V
жутков [0; Т] = ^ПУ, ътг]- Соответственно будем рассматривать управляющие переменные двух типов. Управляющие переменные первого типа будем обозначать / М, г = Управляющие переменные второго типа будем обозначать / [а; /3], г = 1, г/. Упорядоченные наборы управляющих переменных первого типа будем обозначать к. Аналогичный смысл будет иметь обозначение ш. Для единообразия всегда будем считать, что /¿о = 0. т0 = 0, и}„+1 = 0. Положим Т = Т[А], т^ = и{Ь) = и}Н\ш|
и г
T[h] = ^ hi ф] = J h], и}к,ш| (£) = }иъ, t / ]п
l [Я]; [Я] [; 0, twT[fe] .
В итоге функционал J [и] обращается в функцию J}h]uj\ и х(1 + s) переменных. Мы используем квадраты Щ вместо /ц, чтобы избавиться от ограничений /?,; ~ 0. Чтобы снять ограничения / [а; /5], можно в указанной выше формуле для u(t) взять вместо U)i вектор с компонентами 7/+7j sin(aJij), j = l,s, где 7"1" = («+/?)/2, 7 = (fi q)/2. Этот прием (синус-параметризация) позволяет сократить количество ограничений в аппроксимирующей задаче на 2 vs. Мы этого не делаем, чтобы упростить изложение.
Положим J{t) = T](t) < ф~[и, T](t) f ^t, xu(t) [ + FJ^t, xu(t) [. При сделанных предположениях, пользуясь формулой (1.3), удается показать, что функция J}h]uj\ непрерывно дифференцируема по всем переменным и справедливы следующие формулы (используется также то, что функции xu(t) и ф{Ь) непрерывны):
•пй
dJ
— = J(t)dt, i = l,v, (1.5)
Т1-1И
dJ
— = }ф0 + jf J^Tj 2hi. (1.6)
Tj = Ti[h], г = 1, и. Задачу, которая отличается от исходной задачи оптимизации
Jo[it](T) оо min, и / Т7, Ji[u](T) > 0, г = 1,/t; ./¿[И]С0 = 0, г = к + 1,/л,
т _
тем, что каждый из функционалов = {jFi(t,xu,u) dt, г = 0, fi, заменяется со-
о
ответствующсй функцией многих переменных Jj}h;u\ по описанной процедуре, мы и называем аппроксимирующей задачей. Формулы вида (1.5), (1-6) позволяют (по крайней мере, формально) использовать для ее решения численные методы условной оптимизации функций многих переменных до первого порядка включительно.
2. Формулировка основных результатов
I. Кусочно постоянная интерполяция искомого управления. См. §1.
II. Кусочно линейная интерполяция искомого управления. Так же, как и раньше, будем рассматривать управляющие переменные двух типов. Управляющие переменные первого типа будем обозначать /tj / R, г = 1, и. Управляющие переменные второго типа будем обозначать = | / [а;/3]2, г = 1,и. Обозначения h, Т = T[h], Tj = Ti[h] имеют прежний смысл; ш — набор управляющих переменных второго типа. С каждой парой }/i;tÄ;| будем соотносить кусочно линейное управление
«(i)=}l/i[Ö;ri 1,т4](0,*/]т, 1[Ä];ri[Ä|[,f = I^;0,iwT[fe] ,
и&) = Щш1П ит№<—1—1 ч(2) J.
п п 1 J I
В итоге функционал J\u\ обращается в функцию J}h]üj\ и х(1 + 2s) переменных. При сделанных предположениях данная функция имеет частные производные по всем переменным, которые определяются формулами (предполагаем здесь, что Ы 0; в случае = 0 все поименованные далее производные равны пулю):
л л
П Tj
dJ =Ä Jiüfa -^4 = Л J(t)(t Ti г)dt- (2.1)
&*(1) Щ "wv* ' ' ац<2> Щ
Ti-1 T|_l
BJ Oh
Щ= '
Ti (1) (2)
Ф0 T,x[u,T\(T)[+ J(t)(t ni)dtj*-(2.2)
(П n xy
Ti- 1
и
,(2)
Зфг+1
/
(2) (1) г I
{J(tM2) Jfa iHa) m dt * j v \.
4 4 1 I
I
Из формул (2.1), (2.2) видно, что указанные производные непрерывны по совокупности переменных, и таким образом, функция непрерывно дифференцируема.
3. Формула приращения функционала
Непосредственно из [10, теорема 3] получаем следующее утверждение.
Теорема 3.1. Пусть Л > 0 - заданное число, и / Т. Существуют функции а : М+ оо и Т : оо М+ такие, что для любых и / Т и Т, Т\ / К+, ||ГЦ |№||> Л, имеем: Т(Т, Т) сю 0 при Т сю Т, и справедливо представление
А3 = 3[и,т] 3[и,Т\= )ф,и|
^ Пт ^
+
хит ХПТ [ Фо х[и, Та] [ Л + Т(Г, Т) К + о(К),
Пт,
(3.1)
где К=С7(|[ГЛ|) Аи < РщМ Рпти ; Ф < (/ЭТпТФ + (КТ, Ф = Ф[щТ]
решение сопряженного уравнения (1.^), /™.7х[и, и т.п.
Замечание 3.1. Как видно из доказательства, при сделанных предположениях функция ЯпТФ[и, Т] непрерывна на множестве ПгА. Поэтому, согласно условию К 3), функция Ф также является непрерывной.
4. Доказательство основных утверждений
Положим 2^ <Щ, з = 1, V; Л Т +1.
I. Пусть производится кусочно постоянная интерполяция искомого управления. Докажем формулы (1.5), (1.6). Зафиксируем произвольно г / 1, V.
1) Найдем дЗ/ди^. Обозначим гВ набор, полученный из й варьированием г-й компоненты: = а^ + Дс^; и / Т - управление, порожденное набором }/?; ш ; Т = Т. Приращение управления Аф) = £ / [ Ч 1;п); 0, иначе . Норма Аи1ь* =
КД^НД ^ ЦД^'гЦ следовательно, о(Н) = о(Да^). По теореме 3.1 и в силу (3.1) получаем
Т
АЗ = )ф(£),Аи(£)|<Й + о(ДшО = I Д^, ^г)
<а
+ о( Да;»),
так как £[о;т]Ф(£) = Отсюда сразу следует формула (1.5).
2) Найдем дЗ/дТ\. Рассмотрим вариацию ДД компоненты Д. Положим
Ш31 £ / \тз Ь тз),
Т = Т + ДД, «(£) <\ши t / [п и п + ДД),
ш
л
3 = М
3=*]__
£ / [ту 1 + ДД; т3 + ДД), j = i + 1,1/.
Без ограничивая общности рассуждений примем / [ас; в\, г = 1,1/. Для Аи = у. и нетрудно получить: Аи щ > ||б а ||2г/ |(ДДЦ откуда (см. теорему 3.1)
Т(Т,Т)К+о(К) = о ДД[.
(4.1)
Используем теорему 3.1 и формулу (3.1). Для упрощения выкладок примем з = 1. а) Рассмотрим
~Т "Vi т^ДЛ
Т0- дл
[ шз
Ф(£) <Й.
Очевидно, что
ту^ДЛ "V, т^-Т+ДЛ TjWi
Ф(*) dt = Ф{t)dt Ф(£)di + Ф(£)(Й.
Tj-1+ДЛ Tj -1 Tj-1 Tj
Отсюда получаем
"Т "Т Т.^ДЛ
Ф(£)¥(£)^= Ъ{t)u(t)dt+шi Ф (*)й+ / ы,
Г
т-ДДЛ Тз-Т+ДЛ
TJ Ti-1
Таким образом, согласно замечанию 3.1,
1
lim л
ДЛ/ о АД
Ф(£) и(£) (ft Ф(£) и(£) dti = Di Ф(т*)+
1
+ Шз
1
б) Рассмотрим
у у
J=>+1 зфг+l
(4.2)
A?/ < Ф0 t, x(t) [ dt Ф0 t, x(t) [ dt.
ru nT nT n^
Т+ДЛ
Если АД > 0, то Т > Т и ATi = (J t,x(t)\dt, lim ££ = Ф0 Т,х(Т)\.
т ДЛ' +0
Если же АД <0. то Т < Т и А % = U Ф0 i, x{t) [ dt, следовательно,
т \дл\
Нш ^^ = Нш
Т
дл/ о АД +0 ||ЗД||
Ф0 £,х(£)[di = Ф0 Т,х(Т)[.
Т \АЛД
Таким образом, Из (4.1)—(4.3) и теоремы 3.1 получаем (1.6).
АТУ
lim = Ф0 Т,х(Г)[.
ДЛ/ о АД
(4.3)
II. Пусть производится кусочно линейная интерполяция искомого управления. Докажем формулы (2.1), (2.2). Зафиксируем произвольно г / 1, V.
1) Найдем дЗ/ди^ . Обозначим ш набор, полученный из ш варьированием компоненты: «4 = +Дйс4 , и / Т- управление, порожденное набором }Я; ; 2р = Т. Соответственно, приращение управления
Аи(г) =
) П п 1
t / [п 1; тг); 0, иначе
и
а и та =
1М
(1) I
ц Ц I
ид,.,/1) ii
(т. г) м = (п п О,
следовательно, о(К) = о(До;| ). По теореме 3.1 и формуле (3.1) получаем
Т
Д7 = )ф,Д«|А + о(Дш(а>)
Дч(1) ^
1 г)<Й
- + о(Дшг), или
Т|-1
1
- + о(Дшга)), так как 5[0;Т]Ф{£) = ^Пф,
Тг-1
откуда сразу следует первая из формул (2.1). Вторая доказывается аналогично.
2) Найдем дЗ/дТ\. Не ограничивая общности рассуждений, будем предполагать, что Шг / [а; /3], ¿=1,1/. Рассмотрим вариацию 5 = Д'Д компоненты Д. Положим
Ц-(£), £ / [т3- 1;т3), з = 1,1 1; ^ = Т + ¥(*)< > + 15г,+ 5), ^ =ч_
Будем считать, что т* 1 < т» и [5| настолько мал, что г,; 1 < т,; [5|[ Формулы для случая г,; 1 = т,; можно вывести путем предельного перехода т; оо т; 1+0, то есть /¿г оо 0. Для приращения Ди = и и нетрудно получить оценку:
Аиц>Р а||2г/ |р||+ {»+ Г
Зфг+1
[т» 1 гп]^ [тч1 ;т( -Н5]
(Й,
Ь<
6) ¿1 > У2)
Очевидно, что существует производная
д
£ Т;
С^ (п п
Исходя из наших соображений и леммы Адамара, нетрудно найти, что
1И'
и>
4Ч ч<2,|
2
Таким образом (см. теорему 3.1),
Т(Г,Т)К +о(К) = о 5). (4.4)
Используем теорему 3.1 и формулу (3.1). Для простоты примем 5 = 1. Рассмотрим
Ф(£)и(£)Й Ф(£)«(£)<Й = Щп + 5) } ]Щ5) ^(0){,
О о зФШ
лу п+у
ЩУ)< иу\{№, Щу)<
ТЧ-1 т3-_Н~у
В силу замечания 3.1, построения функций £/»[т^ 1,т*](£), 1, т^](£) и теоремы о
дифференцировании интеграла, зависящего от параметра, существуют пределы
Нт + = = т д т
5/0 О ОТг ОТг
Т1-1
(1) (2)
+Ф1,т,](Т0 = /-Ф(£)(£ т, ОА + ФСгО^;
[п П ъ)2
Нт = ЦЩ = ф(Т.) г7.(т.) ф(т. 0 [/.(Т. 0
Ф(£) СТО) <11 = Ф(т^)ш\2) Ф(т3 0 -3— Ф(£) Й.
Т] Т} 1
При этом £[о;т]Ф(£) = «Т"-^)- Отсюда, с учетом соотношения (4.3), которое доказывается точно так же, как это было сделано в п. I, и соотношения (4.4), получаем (2.2).
5. Постановка задачи о посадке на Луну
Рассмотрим управляемую систему из задачи о мягкой посадке на Луну, см., например, [12, глава III, §3, п.З, с. 125-128] (здесь к— высота, V— скорость, тп— масса, ад-расход топлива в единицу времени):
Л°°= V, г/°°= д + —и, Т7г°°= щ /г(0) = Я, и(0) = V, т(0) = М. (5.1) т
Ограничение на значения управления: и(1) / [0; а"4, t / [0;Т]. Будем считать, что к = 3000, (7—>= 7.08, д = 1.62, Н = 190000, V = 2650, М = 500.
Условие мягкой посадки:
Л[и](Т) = «[и](Г)=0. (5.2)
Функционал цели:
m[tí](T) ос шах. (5-3)
Имеем управляемую двухточечную краевую задачу (5.1), (5.2). Чтобы обеспечить диф-ферсицируемость правой части по фазовым переменным, переобозначим переменные:
Ж! = /г, х2 = V, х3 = —. Здесь мы исходим из того, что для искомого оптималь-
т
ного управления масса аппарата m(t) > 0, t / [0;Т] (а с физической точки зрения m(t) RJ М0, где М0— сухая масса спускаемого аппарата). В результате задача переформулируется следующим образом:
xf= x2,xf= g + kx3u,xf= (х3)\ ^(0) = Н,х2(0) = У,х3(0) = М \ (5.4)
x3[it](T) оо min, хг[и](Т) = x2\v\{T) = 0. (5-5)
Из аналитического решения задачи минимизации (5.4)—(5.5) с помощью принципа максимума Л.С. Понтрягина известна структура оптимального управления:
uj^t) = j-0, если t / [0;т]; если t / (т;Т] .
Момент переключения т и финальное время Т нам, вообще говоря, неизвестны. В соответствии с информацией о структуре оптимального управления определим набор параметров а = (afj, а2) / М2 и произведем параметризацию искомого управления:
т = а1 T = a¡ + al «[«](*) = }о, t / [0;т); t / [т;Т] .
В результате функционалы задачи преобразуются в функции двух переменных:
Jb[a] = жз[и](Т) ос min, Jifa] = ¡Ei[u](T) = 0. = х2[и\(Т) = О,
и = и[ct], a / R2. Финальные ограничения можно учитывать с помощью штрафа:
f(a) = J0[a] + <7iJi[a] + a2J2[a], а / R2.
Решение системы (5.4) для каждого конкретного управления будем искать численно методом Эйлера с шагом 0.3 (при уменьшении шага точность решения оптимизационной задачи повышается, но и время вычислений существенно увеличивается). В итоге исходная задача сводится к задаче безусловной минимизации:
f(a) оо min, а / R2.
Попытка решения этой задачи дает а —>(6.75,6.7), ио оказывается неудачной в связи с сильной неустойчивостью к малейшим отклонениям параметров. Так, например, если взять а = (6.753702689,6.7), то получаем финальные значения: h(T) = 0.0651, v(T) = 25.1076, m(T) = 198.7744. Если же изменить значение лишь в последнем знаке: а = (6.753702688,6.7), то получаем: h(T) = 274.1060, v(T) = 233.6999, in(T) = 182.1186. Примечательно, что в [12, глава III, §3, п. 3, с. 126] тоже есть косвенное замечание иа эту же тему. Существенно повысить устойчивость численного решения удастся с помощью увеличения количества параметров.
20
■Optimal Control; fEval=7467|
40
60
80
100
4.5
3.5
2.5
1.5
■ Optimal Control; 1Eval=7351
20 40 60 80 100 120
Рис. 1 : Метод Хука-Дживса
Рис. 2: Метод Полака-Рибьсра
■ Optimal Control; fEval=1116|
Л
20 40 60 80
100
■ Optimal Control; fEral=3451
20 40 60 80 100 120
Рис. 3: Метод ВРСЭ
Рис. 4: Метод ЗдР
6. Результаты численных экспериментов
Используем для численного решения задачи о мягкой посадке на Луну метод подвижных узлов в рамках техники параметризации управления в соответствии со схемой, описанной в разделе 1, см. также [9]. Количество узлов сетки берется существенно больше 3 (как следовало бы брать в соответствии с решением по принципу максимума). Попытка взять меньшее число узлов не дает достаточно хорошего результата -чувствительность численного решения управляемой системы к изменению параметров параметризованного управления остается все еще высокой. При увеличении количества узлов наблюдается снижение чувствительности до приемлемого уровня. Итак, будем использовать набор параметров, состоящий из двух поднаборов а = («х,..., а^) / К*;) /3 = (Д,..., /?(.) / К*\ Параметризацию управления производим по правилу:
u(t) = ^(1 + sinßi), t / [U 1 -,и), to = 0, it = f au, г = l,fc, T = tk.
2 и
Сравним следующие способы численного решения аппроксимирующей задачи.
1. Минимизация штрафной функции методом Хука Джмвса. Для к = 10 были получены следующие результаты, см. также рис. 1:
ЦТ) = 2.1136 х10 5, у(Т) = 0.0001, т(Т) = 197.6182, Т = 88.9913;
а = {3.4742,1.4793,1.8042,1.8042,3.4742, 3.4742, 2.8058,3.4742, 3.4742, 3.4742),
/3 = ( 1.3410, 1.7629, 1.7321, 1.5052, 1.6690, 1.3406,0.9296,1.3946,1.3932,1.1731).
Количество вычислений функции: 3467. Затрачено времени (при расчетах на ноутбуке средней мощности): 140.3917 секунд.
2. Минимизация штрафной функции методом Полака Рибьера. Для к = 10 были получены следующие результаты, см. также рис. 2:
к(Т) = 0.00029705, у(Т) = 0.00024252, т{Т) = 195.2666, Т = 108.3433;
а = (3.2911,3.2881, 3.2860, 3.2850,3.2850, 3.2864, 3.2893,3.2940, 3.3007, 3.3098),
/3 = (0.5343,0.4722, 0.4067,0.3378, 0.2648, 0.1882,0.1068, 0.0207, 0.0712, 0.1693).
Количество вычислений функции: 735. Затрачено времени: 33.6667 секунд. Как видно из рис. 2, график полученного решения сильно отличается от теоретического оптимального управления. Таким образом, наблюдается сходимость по функционалу. То же самое происходит и при использовании других градиентных методов. Естественно предположить, что это связано с сильной неустойчивостью теоретического решения задачи оптимального управления: в весьма малой его окрестности функционал принимает уже довольно большие значения; поэтому методы, ориентирующиеся на малость градиента, не могут обнаружить искомую точку в силу естественной погрешности вычислений. Тем не менее, они находят другие точки, достаточно от нее удаленные, в которых функционалы задачи принимают близкие значения, причем принимают их достаточно устойчиво. Важно отметить, что при реализации метода использовалась следующая коррекция: при выходе какой-либо компоненты управления на границу отрезка допустимых значений [0; (7_4 производилось смешение от границы внутрь отрезка на величину 10 Такая коррекция необходима в связи с использованием метода синус-параметризации: соответствующая частная производная целевой функции по параметру /3,; содержит косинус, который зануляется при выходе на границу, никоим образом не означая близости к точке минимума. Более того, при использовании градиентных методов без описанной выше коррекции после выхода компоненты управления на границу ей уже «трудно с нее сойти». Этот эффект мы называем «эффектом залипания на границе». Как показывают численные эксперименты, он может сильно замедлять или препятствовать сходимости (при использовании методов первого порядка и выше без коррекции на границе).
3. Минимизация штрафной функции методом ВРОЯ. Для к = 10 были получены следующие результаты, см. также рис. 3:
ЦТ) = 1.166 >40 и, и(Т) = 0.00025904, т(Т) = 196.7929, Т = 95.4369;
а = (4.8099,1.3345,3.2908, 2.0500, 2.8127, 1.0017,3.6544, 2.2463, 3.7767,3.7296),
в =( 1.1624, 1.2791, 1.4280, 0.7595, 0.0699, 0.5134, 0.9012, 0.9778, 0.7494, 0.2229).
Количество вычислений функции: 1116. Затрачено времени: 48.2373 секунд.
4. Решение задачи .математического программирования SQP-методом. Для к =10 были получены следующие результаты, см. также рис. 4:
Н(Т) = 0.0038851, ь(Т) = 0.0071613, т(Т) = 196.2581, Т = 100.9140;
а = (2.5155, 2.4809, 2.5732, 2.7714, 3.0282, 3.2947, 3.5399, 3.7121, 3.7756, 3.6796), в =(1.0201,0.0785, 0.6710, 1.1446, 1.3148, 1.1746, 0.7867, 0.1525,0.5413,1.2714).
Количество вычислений функции: 345. Затрачено времени: 103.0311 секунд.
Проверка правильности формул (1.5), (1.6) для функций аппроксимирующей задачи успешно была проведена отдельно с помощью аппроксимации конечными разностями. Проверка правильности формул (2.1), (2.2) проводилась ранее для функций аппроксимирующей задачи при решении задачи о прокладке трассы [9].
Проведенные численные эксперименты (не ограничиваясь только описанными выше) позволяют сделать следующие выводы:
1. Подтверждается правильность представленных выше формул частных производных (1.5), (1.6) и (2.1), (2.2).
2. Представленный вариант метода подвижных узлов в сочетании с методом синус-параметризации и указанными выше формулами частных производных позволяет успешно решать достаточно сложные задачи оптимального управления со свободным временем, в том числе такие, где теоретически расчитанная точка оптимума оказывается сильно неустойчивой.
3. Для решения аппроксимирующей задачи можно использовать различные численные методы как условной, так и безусловной оптимизации (в сочетании с методом штрафа в простейшей форме): нулевого порядка, градиентные и квазиньютоновские. Однако при использовании методов первого порядка в сочетании с методом синус-параметризации следует применять процедуру коррекции выхода на границу множества допустимых значений для противодействия «эффекту залипания на границе».
4. Метод нулевого порядка обнаружил сходимость по аргументу. Методы первого порядка обнаружили сходимость по функционалу.
5. Наиболее затратным по количеству вычислений функции и времени расчетов оказался метод нулевого порядка. Метод Полака-Рибьера оказался наиболее быстрым по количеству затраченного времени. БдР-метод оказался наименее затратным по количеству вычислений функции (при меньшей точности выполнения ограничений - по крайней мере, при численном решении управляемой системы простейшим методом Эйлера с шагом 0.3; при более удачном выборе начального приближения точность повышалась на один-два порядка).
СПИСОК ЛИТЕРАТУРЫ
1. Габасов Р., Кириллова Ф.М. Оптимальное управление в режиме реального времени // Вторая Международная конференция по проблемам управления: пленарные доклады. М.: Институт проблем управления, 2003. С. 20-47.
2. Teo K.L., Goh C.J., Wong K.H. A unified computational approach to optimal control problems // Pitman Monographs and Surveys in Pure and Applied Mathematics. Harlow; New York: Longman Scientific & Technical, John Wiley & Sons, Inc., 1991. Vol. 55. 329 p.
3. Чернов А.В. О гладких конечномерных аппроксимациях распределенных оптимизационных задач с помощью дискретизации управления // Журнал вычислительной математики и математической физики. 2013. Т. 53. № 12. С. 2029-2043.
4. Волин Ю.М., Островский Г.М. О методе последовательных приближений расчета оптимальных режимов некоторых систем с распределенными параметрами // Автоматика и телемеханика. 1965. Т. 26. № 7. С. 1197-1204.
5. Голубев Ю.Ф., Серегин И.А., Хайруллин Р.З. Метод плавающих узлов // Известия АН СССР. Техническая кибернетика. 1991. № 2. С. 48-53.
6. Лазарев Ю.Н. Управление траекториями аэрокосмических аппаратов. Самара: Самарский НЦ РАН, 2007. 274 с.
7. Teo K.L., Jennings L.S., Lee H.W.J., Rehbock V. The control parameterization enhancing transform for constrained optimal control problems //J. Austral. Math. Soc. Ser. B. 1999. Vol. 40. P. 314-335.
8. Li R, Teo K.L., Wong K.H., Duan G.R. Control parameterization enhancing transform for optimal control of switched systems // Math. Comput. Modelling. 2006. Vol. 43. № 11-12. P. 1393-1403.
9. Чернов А.В. О приближенном решении задач оптимального управления со свободным временем // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 6 (1). С. 107-114.
10. Чернов А.В. О гладкости аппроксимированной задачи оптимизации системы Гурса-Дарбу на варьируемой области // Труды Института математики и механики Уральского отделения РАН. 2014. Т. 20. № 1. С. 305-321.
11. Чернов А.В. О мажорантно-минорантном признаке тотального сохранения глобальной разрешимости управляемого функционально-операторного уравнения // Известия высших учебных заведений. Математика. 2012. № 3. С. 62-73.
12. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высшая школа, 2003. 614 с.
Поступила в редакцию 19 апреля 2018 г.
Прошла рецензирование 23 мая 2018 г.
Принята в печать 26 июня 2018 г.
Чернов Андрей Владимирович, Нижегородский государственный университет им. Н.И. Лобачевского, Нижегородский государственный технический университет им. Р.Е. Алексеева, г. Нижний Новгород, Российская Федерация, кандидат физико-математических наук, доцент кафедры прикладной математики, e-mail: [email protected]
Для цитирования: Чернов А.В. О дифференцировании функционалов аппроксимирующих задач в рамках метода подвижных узлов при решении задач оптимального управления со свободным временем // Вестник Тамбовского университета. Серия: естественные и технические науки. Тамбов, 2018. Т. 23. № 124. С. 861-876. DOI: 10.20310/1810-01982018-23-124-861-876
DOI: 10.20310/1810-0198-2018-23-124-861-876
ON DIFFERENTIATION OF FUNCTIONALS OF APPROXIMATING PROBLEMS IN THE FRAME OF SOLUTION OF FREE TIME OPTIMAL CONTROL PROBLEMS BY THE SLIDING NODES METHOD
A. V. Chernov
Nizhni Novgorod State University named after N.I. Lobachevski 23 Gagarin Ave., Nizhni Novgorod 603950, Russian Federation Nizhni Novgorod State Technical University named after R.E. Alekseev 24 Minin St., Nizhni Novgorod 603950, Russian Federation E-mail: [email protected]
Abstract. We give strict justification for derivative formulas of functionals in problems approximating free time optimal control problems in the frame of sliding nodes method and control parametrization technique. As example we present results of numerical solution for landing on the Moon problem.
Keywords: free time optimal control problem; control parametrization technique; sliding nodes method
REFERENCES
1. Gabasov R., Kirillova F.M. Optimal'noe upravlenie v rezhime real'nogo vremeni [Optimal real-time control]. Vtoraya Mezhdunarodnaya konferentsiya po problemam upravleniya: plenarnye doklady [The Second International Conference on Control Problems: Plenary Reports]. Moscow, Institute of Control Sciences RAS Publ., 2003, pp. 20-47. (In Russian).
2. Teo K.L., Goh C.J., Wong K.H. A unified computational approach to optimal control problems. Pitman Monographs and Surveys in Pure and Applied Mathematics. Harlow, New York, Longman Scientific & Technical, John Wiley & Sons, Inc., 1991, vol. 55, 329 p.
3. Chernov A.V. Smooth Finite-Dimensional Approximations of Distributed Optimization Problems via Control Discretization. Computational Mathematics and Mathematical Physics, 2013, vol. 53, no. 12, pp. 1839-1852.
4. Volin Yu.M., Ostrovskii G.M. O metode posledovatel'nykh priblizheniy rascheta optimal'nykh rezhimov nekotorykh sistem s raspredelennymi parametrami [On the of successive approximation of optimum behaviour design of certain distributed parameter systems]. Avtomatika i telemekhanika - Automation and Remote Control, 1965, vol. 26, no. 7, pp. 1197-1204. (In Russian).
5. Golubev Yu.F., Seregin I.A., Khayrullin R.Z. The floating nodes method. Sov. J. Comput. Syst. Sci., 1992, vol. 30, no. 2. pp. 71-76.
6. Lazarev Yu.N. Upravlenie traektoriyami aerokosmicheskikh apparatov [Trajectories Control of Aerospace Vehicles]. Samara, Samara Scientific Center of Russian Academy of Sciences Publ., 2007, 274 p. (In Russian).
7. Teo K.L., Jennings L.S., Lee H.W.J., Rehbock V. The control parameterization enhancing transform for constrained optimal control problems. J. Austral. Math. Soc. Ser. B, 1999, vol. 40, pp. 314-335.
876
А. В. MepHOB
8. Li R., Teo K.L., Wong K.H., Duan G.R. Control parameterization enhancing transform for optimal control of switched systems. Math. Comput. Modelling, 2006, vol. 43, no. 11-12, pp. 1393-1403.
9. Chernov A.V. O priblizhennom reshenii zadach optimal'nogo upravleniya so svobodnym vremenem [On approximate solution of free time optimal control problems]. Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo - Vestnik of Lobachevsky University of Nizhni Novgorod, 2012, no. 6 (1), pp. 107-114. (In Russian).
10. Chernov A.V. O gladkosti approksimirovannoy zadachi optimizatsii sistemy Gursa-Darbu na var'iruemoy oblasti [On the smoothness of an approximated optimization problem for a Goursat-Darboux system on a varied domain]. Trudy Instituta matematiki i mekhaniki Ural'skogo otdeleniya RAN - Proceedings of the Steklov Institute of Mathematics, 2014, vol. 20, no. 1, pp. 305-321. (In Russian).
11. Chernov A.V. A majorant-minorant criterion for the total preservation of global solvability of a functional operator equation. Russian Mathematics, 2012, vol. 56, no. 3, pp. 55-65.
12. Afanas'ev V.N., Kolmanovskii V.B., Nosov V.R. Matematicheskaya teoriya konstruirovaniya sistem upravleniya [Mathematical Theory of Control Systems Construction]. Moscow, Vysshaya Shkola Publ., 2003, 614 p. (In Russian).
Received 19 April 2018 Reviewed 23 May 2018 Accepted for press 26 June 2018
Chernov Andrei Vladimirovich, Nizhni Novgorod State University named after N.I. Lobachevski, Nizhni Novgorod State Technical University named after R.E. Alekseev, Nizhni Novgorod, the Russian Federation, Candidate of Physics and Mathematics, Associate Professor of the Applied Mathematics Department, e-mail: [email protected]
For citation: Chernov A.V. O differentsirovanii funktsionalov approksimiruyushchikh zadach v ramkakh metoda pod-vizhnykh uzlov pri reshenii zadach optimal'nogo upravleniya so svobodnym vremenem [On differentiation of functionals of approximating problems in the frame of solution of free time optimal control problems by the sliding nodes method]. Vestnik Tambovskogo universiteta,. Seriya: estestvennye i tekhnicheskie nauki — Tambov University Reports. Series: Natural and Technical Sciences, 2018, vol. 23, no. 124, pp. 861-876. DOI: 10.20310/1810-0198-2018-23-124-861-876 (In Russian, Abstr. in Engl.).