Серия «Математика»
2012. Т. 5, № 3. С. 63-72
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.977.56
Численные методы на базе
вариационного принципа масимума для решения задачи оптимального управления нелинейными волновыми процессами *
Е. А. Лутковская
Иркутский государственный университет
Аннотация. В статье для задачи оптимального управления нелинейным волновым уравнением с нелинейными граничными условиями приводятся конструкции численных методов, основанных на необходимом условии оптимальности в виде вариационного принципа максимума.
Ключевые слова: численные методы; оптимальное управление; вариационный принцип максимума; волновое уравнение.
Численные методы, основанные на необходимых условиях оптимальности, занимают видное место в теории численного решения задач оптимального управления. Получение необходимого условия оптимальности в виде вариационного принципа максимума для задачи оптимального управления волновыми процессами [2] сделало возможным применение к ней соответствующих численных методов. Схема предлагаемых методов в общем стандартна. Нестандартными являются конструкции, позволяющие использовать данные методы для решения задач оптимального управления волновыми процессами.
Введение
* Работа выполнена при частичной финансовой поддержке Федеральной Целевой Программы "Научные и научно-педагогические кадры инновационной России" на 2009-2013гг и РФФИ, проект 11-01-00713 на 2011-2013гг.
1. Постановка задачи
В прямоугольнике П = Б X Т, Б = (в0, в\), Т = (¿0, tl) плоскости переменных (в, ¿) определим связь между управлением и = и(в, ¿),и(в, ¿) € Я, и состоянием х = х(в,Ь),х(в,Ь) € Я, дифференциальным уравнением с частными производными второго порядка
хи — a2(в)xss = I (х, хг, х3 ,и, в, ¿), (1.1)
с начальными
х(в,£0) = х0(в), хг(в,£0) = х1(в), в € Б. (1.2)
и граничными условиями
хг(во^) = д°(х(во^),у°,t),Xs(вl,t) = д1(х(в1,г),у1 ,г), £ € Т. (1.3)
Здесь функции Vх = ьг(£), г = 0,1, служат управлениями. Допустимыми управлениями будем считать измеримые и существенно ограниченные функции и = и(в, ¿) и Vх = ьг(£), г = 0,1, стесненные ограничениями
и(в, ¿) € и, Vх (¿) € Vх, г = 0,1, (1.4)
для почти всех (в, ¿) € П, £ € Т.
Требуется найти такие допустимые управления и,у0 и V1, которые доставляют минимум целевому функционалу
■](и,ю) = / р(х,хг,хц^,в,1)д,ш +й Ф(х,хг,хц,и,в,1)йвё£ (1.5) ]дП Лп
на решениях смешанной задачи (1.1)-(1.3). В функционале (1.5) первое слагаемое является интегралом первого рода по границе 9П прямоугольника П, dш = . В нем естественно считать ф = 0 на
нижней границе прямоугольника П, т.е. при в € Б, £ = ¿0.
Наложим следующие предположения на задачу (1.1)-(1.5):
— функция а = а(в) абсолютно непрерывна на замкнутом отрезке [в0,в1], отделима от нуля числом а0 и ограничена сверху числом а: 0 < а0 < а(в) < а< +гс>, в € Б = [в0,в1];
— функции I = I(х, хг, Xs,u, в, ¿), = дг(х, Vх, ¿), г = 0,1, ф = ф(х, хг,
хц^, в,£), Ф = Ф(х, хг, хц, и, в, ¿) непрерывны по совокупности своих аргументов и непрерывно дифференцируемы по фазовым переменным х, хг, хц всюду в области своего определения;
— функция х0 = х0(в) абсолютно непрерывна на Б, функция х1 = х1 (в) измерима и существенно ограничена на Б;
— для любого набора допустимых управлений и^0, V1 существует ограниченное решение х, имеющее ограниченные производные хг, xs почти всюду в П.
2. Эквивалентная задача
В работе [2] доказано существование и единственность обобщенного решения волнового уравнения (1.1) с начально-краевыми условиями
(1.2)-(1.3). Исследование свойств решения ведется путем сведения исходной волновой задачи к эквивалентной ей гиперболической системе четырех дифференциальных уравнений первого порядка со смешанными условиями. Сведение осуществляется путем введения понятия характеристики в = 3і (£,т,і) волнового уравнения как решения обыкновенного дифференциального уравнения (в/(і = ±а(в), проходящего через точку ,т), дифференциального оператора Vіх являющего собой производную вдоль характеристики: Біх(в,і) = [х(ві(в,і; т)]|*=т, и двух новых функций Vі = гі(в,і), равных по определению Vі = хг Т ах3. В итоге имеем задачу:
д(х,г ,т+,и,в,£) = I(х, (т + т+)/2, (т — т+)/2а,и,в,£) — а'(г — т+)/2,
а обратная замена, естественно, выглядит следующим образом: хг = (т- + т+)/2, xs = (т- — т+)/2а. Таким образом, задача оптимального управления (1.1)-(1.5) редуцируется к задаче оптимального управления для системы (2.1) с начальными (2.2) и смешанными граничными условиями (2.3), при этом целевой функционал (1.5) на допустимых управлениях (1.4) остается тем же с точностью до замены переменных.
Введем в рассмотрение вариации управления на узких полосках вдоль соотвествующих характеристик:
Vі х = Бігі = д(х,г ,г+,и,в,і),
х(в,і0) = х0(в), гі(в,і0) = х1(в) т а(в)х0'(в), в є Б,
г+(во,і) = -г-(во ,і) + 2д0(х(во,і),У0,і), г-(ві,і) = (ві,і) + 2а(ві)д1((х(ві,і),ь1 ,і), і є Т.
(2.1)
(2.2)
(2.3)
Здесь
3. Вариационный принцип максимума
^(£, т) = {(в, і) є П : 3і (£ - є,т; і) <в< ві(£, т; і)}.
66 Е. А. ЛУТКОВСКАЯ
Б^(£, т) = (3і(£ - є, т; іі),ві(£, т; іі)) и в случае, если Т^((,т) = $, положим
= Г Т1 ЛЖо, є Т.
Ь-г'і(і) = ( 1,1 -?(і)’ ,1 ЄТ^;І\ А-у0(і) =0,і є Т.
0, і є Т\Т-(£,т),
Здесь іі(в,і) - момент начала характеристики ві(в,і; ■), проходящей через точку (в, і), ^ є [і0,і1].
Далее для простоты наложим предположение, что время іі достаточно мало, чтобы характеристика, стартующая на левой границе прямоугольника П, завершилась на его правой границе:
«і
- [ (в
іі < і = іо +
а(в)
«0
Обозначим за і+(£,т) (і-(£,т)) момент прихода характеристики
в+(С,т; ■) (в-(£,т; ■)) на правую в = ві (левую в = во) границу прямоугольника П.
Анализ приращения целевого функционала на таких вариациях допустимых управлений [2] приводит к паре семейств (для каждой точки (£, т) задача своя) задач оптимального управления составными обыкновенными дифференциальными уравнениями:
у = д(х,г-,у,и,в+ (£,т; і),і), і є (і+(£,т),і+ (£,т)), у(і+(р т)) = ] г+(в+(І,т;іо),іо), і+(^,т) = іо,
У( \ -г-(во,ї+((,т)) + 2д°(х,і°,ї+((,т')), і+(£,т) > іо,
г = д(х,г,г+,и,в-(во, і+(С,т );і), і), і є (і+ (£,т), іі), г(і+(£,т)) = у(і+(С,т))+2а(ві)ді(х,уі,і+(С,т)),
и(і) є и, і є (і+(£,т),і+(С,т)), V0 є V0, (3.1)
І+т (и,ь0) = -а+<р(х,г-,у,Ю0,во,і+(£,т ))-
-в+<р(х, V- ,у, в+(І, т; іі),іі)а(в+ (£, т; іі))-
-(1 - в+)ф(х, г-,у, Vі, ві,і+(С, т))-
-(1 - в+)ф(х,г,г+,в-(ві ,і+(С,т); іі),іі)а(в-(ві ,і+(С,т); іі)+
і+(І,т)
+ І Н(ф-, 0,(-, 0,х,г-,у,и,в,і)а(в))13=3+(^т;І)М+
І+ (І ,т)
іі
+ / Н(0 , ф+, 0 , С+ , х , г, г+, и, в, і)а(в)І8=8-(8і>і+і>т);і)(і ^ тах ,
і+(Іт)
y = g(x,y,r+,u,s-(£,r; t),t), t е (t-(£,r),t(£,r)),
■,,(+-(? TW = \ r-(s-(t,T; to),to), t-(£,T) = t0,
y( ^, )) \ r+(si,t-((,T)) +2a(si)q1(x,v1,i-((,T)), t-((,r) > to,
z = g(x,r-,z,u,s+(so,t-(£,T); t),t), t е (t- (£,r ),ti), z(t-(C,T)) = -y(t-(C,r ))+2q0(x,v0,t-(C,r)),
u(t) е U, t е (t-(C,r),t-(C,r)), V1 е V\ (3.2)
I- (u,V1) = -a-^(x,y,r+ ,V1,si,i-(£,r ))--в~v(x, y, r+, s~(£, r; h),h)a(s-(£, r; h))-
-(1 - в-)^(x,y,r+,v0,so,i-(C,r))-^
-(1 - в-)p(x, r-,z, s+(so,t-(C, T); t1), t1)a(s+(so,t-(C, r); h)) + t-(tr)
+ f H (0,ф+, 0,(+,x,y,r+,U,s,t)a(s)\8=8-(tiT ;t)dt+ i-{tr)
ti
+ J H(ф-, 0,Z-, 0,x,r-,z,u,s,t)a(s)\8=8+{80,i-(t,r);t)dt ^ max. t-(Z,r)
Здесь параметры a± и в± определены соотношениями
(3.3)
0, ^±(с,т) = го, в± = \1, 1±(£,т) = Ь,
1,г±((,т) > го, р \о,1±(^,т) <ь
а функции ф±,(± являются решениями сопряженной задачи:
Б±ф± ± а'ф± = —Нх±; 0±(± ± а'(± = —Нг±, (в, г) е П,
ф±(в,Ь1) = —^х± М1]; С±(в,Ьг) = —рг± [в,^],в е Б,
ф-(вх ,г) = ф+(вх,г)—
—(фх[во,г] + 2д°х [во,г](^г+ [во,г] — а(во )(+(во,г)))/а(во),
(-(вх,г) = —(+(вх,г) — (<Рг- [вх,г] — ^т+ [вх,г])/а(вх),
Ф+(в1 ,г) = ф-(в1,г)—
—^х[в1 ,г]/а(в1) — 2д1х[в1,г](^г- [в1,г] — а(в1)с-(в1,г)),
(+(в1,г) = (-(в1,г) — (<рг-[в,] + ^г+ [в1,г])/а(в1), г е т,
где функция Понтрягина
Н(ф-,ф+, С,-,(+, х, т-,т+, и, в, г) = ф+т- + ф-т++
+(С- + С+)д(х,т-,т+,и,в,г,) — ф(х,т-,т+,и,в,г).
Можно показать, что для всех точек (£, т) е П справедливы равенства
А+J(и*,у*) = —АГ+Т(и*,у°*)е/а(0 + о(е), (3 5)
А-J(и*,у*) = —А1-т(и*,у1*)е/а(() + о(е), ( . )
откуда следует вариационный принцип максимума.
(3.4)
Теорема 1. Пусть управления и*(в, і) и '*(і) оптимальны в задаче
(1.1)-(1.5). Тогда для почти всех (£, т) Є П след и*(і) = и*(в+(£, т; і),і) и число V0* = 'т*(і+(£,т)) доставляют максимум функционалу І+Т в задаче оптимального управления (3.1), а след и*(і) = и*(в-(£,т; і),і) и число Vі* = 'і*(і-(£,т)) доставляют максимум функционалу і-т в задаче оптимального управления (3.2).
4. Численные методы
Заметим, что решения и*,'* задач (3.1),(3.2) вариационного принципа максимума не меняются, если в них точку (£,т), исполняющую роль параметра семейства задач (3.1),(3.2), заменить на любую другую точку (£,т) той же характеристики, т.е. такую, что £ = в±(£,т,т).
Определять конкретную характеристику можно разными способами. Например, "номером" характеристики можно считать значение т Є Т, при этом вторая координата £(т) вычисляется по т так, чтобы точка (£(т),т) принадлежала соответствующей диагонали прямоугольника.
Далее для удобства введена в рассмотрение точка і+, которая отделяет характеристики, берущие начало на нижней границе прямоугольника П, от характеристик, стартующих с левой границы.
Таким образом, функционалы, введенные в рассмотрение в задачах
(3.1), (3.2), фиксируются для одной характеристики, т.е. будем рассматривать функционалы 1Т±(иТ,'Т). Они определены для функций и±(і) и чисел і0, Vі, которые являются следами управлений и и V на соответствующую характеристику. Тогда вспомогательная задача метода, основанного на вариационном принципе максимума, имеет вид
І±(итV) = тах І±(и(в±(£±(т),т,-), ■),'(і±(£±(т),т))). (4.1)
и Є и
V Є V
Ее решения для любого т обозначим за иТ ,'Т. Совокупность решений задач вида (4.1) сформирует распределенное управление
и±(в,і) : и±(в±(£±(т),т; і) = и±(і), т Є Т,
і Є (і±(£±(т),т); і±(£±(т),т)), ( . )
и граничные управления:
'(і) : '+(і+(£+(т),т) = і0т, т Є (і+,іі), (4.3)
('-(і-(£-(т),т)= VI, т Є (і-,іі)) .
Теперь определим функции
Ш±ч^)(т) = І± (и±, 'т ) - І±(и(в±(£±(т ),т,^), ■),'(і±(£±(т),т))). (4.4)
По построению ш± > 0, т Є T, причем если ш± = 0, то соответствующая задача вариационного принципа максимума для базового управления выполнена. В этом смысле числа
V±(u,v) = ^ - 0І ш±и^)М (4.5)
T
естественно трактовать как невязку выполнения принципа максимума. Если ц> 0, проверяемое управление не оптимально. Опишем схему его улучшения. Рассмотрим семейство измеримых подможеств отрезка T с мерой є :
T(utV)(e) Q T, mes T(uv) (є) = є, є Є [0, ti - t0]. (4.6)
На этом множестве определим однопараметрическое семейство варьирования по правилу
( U(s,t), s = s±(DZ(t),t; t), т Є T(uv)(є), u£(s,t) = І t Є (t±(£±(T),т); ї±(С±(т),т)), (4.7)
u(s, t), s = s±(DZ(t),t; t), т Є T \ T(u,v)(є);
v+(t) = \ v+(t), t = t+((+(T),т),т є T(u,v)(є) П (t+,t1), (4 8)
є () \ v°(t), t = t+(Ç+ (t),t),t Є T \ T(u,v)(є), ( . )
(v-(t) = \ v~ (t), t = t~ ((~(т),т),т Є T(u,v)(є) П (t~,t1)Л
ує () \ v1(t), t = і-((-(т), т), T Є T \ T(u,v)(є) J ,
где u(s,t), V±(t) берутся из формул (4.2),(4.3). Приведенные конструкции позволяют использовать методы последовательных приближений, описанные в [1].
Проведем описание метода на основе семейства задач (3.1) вариационного принципа максимума. Схема метода на базе семейства задач
(3.2) строится аналогично.
Пусть на k-ой итерации метода для допустимых управлений ик = uk(s,t) и vok = vok(t) найдены соответствующие решения xk = xk(s,t), r±k = r±k(s, t) и ф± = ф±(s, t), Z±k = Z±k(s, t) задач (2.1)-(2.3) и (3.3). Для каждого значения т Є T определим решения U+ = U+ (t) и vT задачи
(3.1) с функционалом I+, что позволит сконструировать функции U+ и v° по правилу (4.2),(4.3).
Вычислим функцию ш+ по формуле (4.4) и определим ее среднее значение = ¡d+(uk,vk) согласно (4.5). Если = 0, то (uk,vk) являются решениями задачи. Иначе управление (uk,vk) можно улучшить.
Опишем способ построения улучшающего управления. Выберем семейство измеримых подмножеств Tk(є) Є T, удовлетворяющее (4.6). Определим варьированные управления uk(s,t),v(0k(t) на множестве Tk(є) по правилу (4.7)-(4.8).
Следующее приближение будем искать в виде:
пк+1(в,і) = ПкЄк (8,і), У0к+1(і) = У°екк (і). где шаг є є обеспечивает уменьшение функционала
3(ик,У°£к) <3(пк,уок). (4.9)
Таким образом, общая схема методов, основанных на вариационном принципе максимума, для решения задачи (2.1)-(2.3), (1.4)-(1.5) описана. Для обеспечения условия убывания (4.9) функционала 3(и,ь) и обоснования сходимости методов необходимо конкретизировать вид множества Тє(є) и выбор шага є є■ На множество Тє (є) наложим следующее условие:
У ш+(ї)йі > є^є, є Є [0,іі - іо], (4.10)
Тк (є)
Оно означает, что семейство Тє (є) строится таким образом, чтобы для любого є Є (0,і — і0) среднее значение функции ш+(і) на множестве Тє (є) было не меньше ее среднего значения на всем отрезке Т. Выбор
шага є будем осуществлять в соответствии с правилом наискорейшего
спуска
єє : тіп 3(ик,у%), є Є [0,іі — іо],
или исходя из менее жесткого условия, которое более удобно при практической реализации:
єє = &, І = 0,1,...,
3(и%,Ук,) - 3(ик,ук) < .
Здесь 5 Є (0,1) - параметр метода, І - минимальный номер, при котором выполняется данное неравенство.
В [1] доказано, что при указанном способе выбора множества Т%(є), дополнительном условии непрерывности по Липшицу частных производных от функций ф, Ф, f по фазовым переменным, а также при условии ограниченности снизу целевого функционала, последовательности {ик}, [ук} являются релаксационными и сходятся в смысле (ик, ук) ^
0, к ^ <х>.
Важный момент реализации метода связан с построением семейства множеств варьирования Т%(є), удовлетворяющих условиям (4.6),(4.10). Эта задача решена для обыкновенных динамических систем. В работах [3; 4] и др. приведены разнообразные способы формирования множеств Т%(є), которые могут быть применены и в рамках предлагаемой схемы варьирования распределенных управлений. Представим два из них. В способе [4] используется деление отрезка Т% на два подмножества:
Т+ = {т Є Т : и+(т) > 9к}, Т- = {т Є Т : и+(т) < 9%}.
Предполагается, что каждое подмножество является конечным объединением отрезков и имеет вид
lk mk
T+ = U Ti, T- = [J П, Ti = [t0 ,t\], i = 1,
1 lk + 1
Далее произвольным образом выбираются точки t G Ti и вводятся семейства множеств Tk(е) по правилу:
Tk(e) = [tг — ai(e)(t'1 — fo),t% + ai(e)(t1 — t% )], i = ~1, mk,
. . e mes T ai(e) =-------=+■, i = 1, 2,...,lk,
mes T+
, . e mes T — mes T+
ai(e) =------- -----------—, i = lk + 1,...,mk■
mes T — mes T+
Полагается T+(e) = Ulk Ti (e), T-(e) = (J mk+1 Ti (e), и основное множество варьирования определяется как
T (e) = i T+(e), e G [0, mes T+/mes T], k(e) \ T+ U T-(e), e G [mes T+/mes T, 1].
В способе [3] используется деление отрезка Tk на совокупность отрезков невозрастания и неубывания функции ш+ (т) :
mk
Tk(e) = U Ti, e G (0,1),
Тк(е) — [£о,£о + — £0)], г — 1, 2,... ,1 к,
тк (£) — £ - £(£\ - £о), £], г — I к + 1,..., тк,
где Тк — [зг0,8\}, г — 1, 2,...,1 к, - семейство отрезков невозрастания функции ш+ (т), а Тк — [£0,£\\, г — Iк + 1,..., тк, - семейство промежутков, на которых функция ш+ (т) не убывает.
Список литературы
1. Васильев О.В. Методы оптимизации и их приложения. Ч.2. Оптимальное управление /О. В. Васильев, В. А Срочко, В. А Терлецкий. - Новосибирск : Наука, 1990. - 151 с.
2. Терлецкий В. А. Вариационный принцип максимума в задаче оптимального управления нелинейными волновыми процессами / В. А. Терлецкий, Е. А. Лутковская // Изв. Иркут. гос. ун-та. Сер. Математика. - Т. 3, № 3. - 2010. - С. 105-117.
3. Терлецкий В. А. К обоснованию сходимости одной модификации метода последовательных приближений, основанного на принципе максимума / В. А. Терлецкий / Методы оптимизации и их приложения. - Иркутск, 1983. - С. 58-69.
4. Mayne D. Q. First Order, Strong Variations Algorithms for Optimal Control / D. Q. Mayne, E. Polak // J. of Optimization Theory and Applications. - 1975. - Vol. 16, N 3, 4. - P. 277-301.
E.A. Lutkovskaya
Numerical methods based on variational maximum principle for solving the problem of optimal control of nonlinear wave processes
Abstract. In the paper numerical methods based on the necessary optimality condition in form of variational maximum principle for solving the problem of optimal control of nonlinear wave equation with nonlinear boundary conditions are presented.
Keywords: numerical methods, optimal control, wave equation, variational maximum principle
Лутковская Екатерина Александровна, старший преподаватель, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 ([email protected])
Lutkovskaya Ekaterina, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003, Phone: (3952)521282 ([email protected])