Серия «Математика»
Том 2 (2009), №1, С. 257-268
Онлайн-доступ к журналу: http://isu.ru/izvestia
ИЗВЕСТИЯ
Иркутского
государственного
университета
УДК 518.517
К оптимизации нелинейных волновых процессов *
В. А. Терлецкий, Е. А. Лутковская
Иркутский государственный университет
Аннотация. В статье для задачи оптимального управления нелинейным волновым уравнением приводятся необходимые условия оптимальности в виде вариационного, конечномерного и линеаризованного принципа максимума.
Ключевые слова: оптимальное управление, вариационный принцип максимума, волновое уравнение.
1. Постановка задачи
В области П = Б1 х Т, Б1 = («0,51), Т = (¿о,^) рассмотрим управляемый процесс {и, V; х} в котором функция х = х(в, ¿) подчинена волновому уравнению
хы - a2(s)xss = /(х, Хг, Xs, и, в, ¿), (1.1)
начальным
х(в,Ь0) = х0(в), хг(в,Ь0) = х1(в), в € Б, (1.2)
и граничным
хг(в0,1) = q0(x,v0,t),xs(s1,t) = д1(х,г)1,{), t € Т, (1.3)
условиям. Пусть требуется найти измеримые и ограниченные в области своего определения распределенное и = и(в,£) и граничные V1 = vг(t) управления, удовлетворяющие ограничениям
и(в, ¿) € и, (в, ¿) € П, vг(t) € Уг, г = 0,1 £ € Т, (1.4)
* Работа выполнена при финансовой поддержке РФФИ, гранты 08-01-00709-а, 08-01-98007-р_ сибирь_а.
и доставляющие минимум целевому функционалу
J (u,v) = / <p(x,xt,xs,v,s,t)du + ^(x,xt,xs,u,s,t)dsdt (1.5)
Jan ж
на решениях x начально-краевой задачи (1.1)—(1.3). Здесь дП - граница области П, du = у/ds2 + dt2.
Будем предполагать, что гладкий коэффициент а = a(s) < а >
0, s € S = [so, si], функции f = f (x,xt,xs,u,s,t),qi = qi(x,vi,t),i = 0, = <p(x,xt,xs,v,s,t), Ф = ^(x,xt,xs,u,s,t) непрерывны по сово-
купности своих переменных вместе со своими частными производными по x,xt,xs; функции x0 = x0(s), x0/ = dsx0(s), и x1 = x1(s) измеримы и ограничены в S, множества U,Vi,i = 0,1 - замкнутые подмножества вещественной прямой.
2. Допустимый процесс
При сделанных предположениях на параметры задачи (1.1)—(1.5), как известно [1], классического решения х не существует. Введем в рассмотрение обобщенное решение х, воспользовавшись результатами работы [2]. Для этого определим характеристики в = в±(£,т; {) как семейство интегральных кривых дифференциальных уравнений ^ = ±а(в) соответственно, удовлетворяющих условию в±((,т; т) = £. Введем в рассмотрение производные 0± по направлению характеристик, положив по определению
й
В±х(в,г) = [—х(в±(в,р; т ),т)] |т=г■
В [3] доказано, что для любых допустимых управлений (1.4) обобщенное решение х существует и единственно в пространстве функций Ш1,1 (П), снабженном нормой
||х|| + М + ||Xs|| +
Ьгс(П) ЪХ(П) ЪХ(П)
+ р+ (хг — аxs)\\L^(п) + Н-О-(хг + axs)\\L^(п)
если функция / удовлетворяет условию Липшица по переменным х,хг, xs■ Кроме того, результаты работы [3] позволяют установить оценки приращения Ах = х — х и его частных производных Ахг = хг — хг, Axs = Xs — xs для двух произвольных допустимых процессов {и, V; х} и {и,и; х}■ Данные оценки имеют вид
|Дх(5,Ь)| < К{ / + $ №-/[8,Щ8М},
тпда(з,г) а(з,г)
1Дхг(в,г) ± Дхз(в,і)І < К{ІД-д[і±(в, Ь)} | +
+ _ 1 [*±(*,ї; т),тШт+ (2Л)
і±(в,і)
+ I 1Д-ЦЩ№ + ІЇ ІД-/ [8,Щ8М}.
тпда(з,г) о(з,г)
Здесь К - положительная константа, не зависящая от выбора допустимых процессов; С(в, Ь) - область определенности (см. [1, с.47]) решения х в точке (в,Ь), С(в,Ь) = {(£, т) Є П : шах^о, 8+^, Ь; т)} < { <
шіп^, в-(в, Ь; т)}, т < Ь}, дС(з, Ь) - ее граница; Д-/[£, т] = /(х, Хі, ха, и,£,т) — /(х,хі,х3,и,^,т) - частное приращение функции / по управ-
1 „• •
лению, вычисленное в точке (£,т); Д-д[т] = ^2(дг(х,ьг,т) — дг(х,ьг,т))
•=о
- частное приращение одной из функций дг, вычисленное в момент т на соответствующей границе; і±(в,Ь) - момент начала характеристики з±(в,і; ■), проходящей через точку (в,Ь), причем {±(в,Ь) < Ь.
3. Эквивалентная задача оптимального управления
Исследование задачи (1.1)—(1.5) проведем с помощью эквивалентной ей задачи оптимального управления. Введем в рассмотрение инварианты Римана т± для волнового уравнения (1.1), положив по определению т± = хг ^ axs■ Очевидно, что обратная замена имеет вид
хг = (т- + т+)/2, х8 = (т- — т+)/2а■ (3.1)
Непосредственной проверкой нетрудно убедиться в том, что функции х, хг, xs удовлетворяют уравнению (1) тогда и только тогда, когда функции х, т± удовлетворяют гиперболической системе
Б±х = тт, В±т± = /(х,т+,т-,и,в,Ь), (3.2)
где / = /(х, (т- + т+)/2, (т- — т+)/2а, и, в, Ь) — а'(т- — т+)/2■
Нетрудно видеть, что начальные условия (1.2) совпадают с равенствами
х(в,Ь0) = х0(в), т±(в,Ь0) = х1(в) ^ а(в)х0 (в), в € 5, (3.3)
а граничные условия (1.3) переписываются в форме
т+(во,Ь) = —т-(во,Ь) +2д0(х(во,Ь),У0,Ь), (3 .)
т-(в1,Ь) = т+(в1,Ь) + 2а(в1)д1((х(в1,Ь),у1 ,Ь), Ь € Т■ ( . )
Понятно, что замена начально-краевой задачи (1.1)—(1.3) на дифференциальную систему (3.2) со смешанными граничными условиями (3.3)-
(3.4) не затрагивает множества допустимых управлений (1.4) и сохраняет фактически неизменным целевой функционал (1.5) ввиду взаимной однозначности между функциями хі,х3 г±. Далее везде, где аргументы исходной функции заменены на г± по правилу (3.1) над функцией будем использовать знак -
4. Сопряженная задача
Для задачи (3.2)-(3.4)определим функцию Понтрягина
H = H(ф+ ,ф-,Z +, (-,x, r+, r-,u, s, t) =
= ф+r- + ф-г+ + (( + + Z- )f(x+ ,x-,r+, r-,u, s, t, ) — (4.1)
—Ф(x+, x-,r+, r-,u, s, t)
с функциями ф±, Z±, удовлетворяющими на допустимом процессе {u,v; x, r±} сопряженной задаче
0±ф± + о!ф± = —Hx; D±Z± + a'Z± = —Hr±, (s, t) € П,
ф±^,ь) = —ipx[s,ti}; Z±(s,ti) = —ZPr± [s, ti], s € S,
ф-^о^) = ф+ (so,t) — (ko(t)(qX (x(so,t),v0,t) — (fx[so,t\)/a(so),
Z-(so,t) = —Z +(so,t) — (Cpr- [so,t] — (pr+ [so,t])/a(so),
ф+isi,t) = ф-(si,t) + (ki(t)(qX (x(si,t),vi,t) — fix[si,t])/a(si),
Z+(si,t) = Z-(si,t) — (ppr- [si, t] + (pr+ [si,t])/a(si), t € T,
ko(t) = —2(a(so)Z + (so,t) + pr+ ), ki(t) = 2a(si)(a(si)Z-(si,t) — pr-)■
(4.2)
5. Вариационный принцип максимума
Предположим для определенности, что время Ь1 не превосходит времени Ь, которое необходимо для прохождения характеристикой интервала Очевидно, значение Ь одновременно является корнем уравнений
- - - - ^ й в+(в0,Ь0; Ь) = в1, в-(в1 ,Ь0; Ь) = во, а также удовлетворяет Ь = / ащ■
so ( )
Данное ограничение означает, что любая характеристика в+(в0,т; ■) (в-(в1,т; ■)), начинаясь на левой (правой) границе прямоугольника П, заканчивается на его верхней границе Ь = Ь1, «не успевая» дойти до противоположной боковой границы в = в1 (в = в0) (см. рис. 1).
Рис. 1.
Введем в рассмотрение подмножества Пгє(т), і = 0,1 и П±(£) прямоугольника П, представляющие собой полоски ширины порядка є вдоль соответствующих характеристик:
Щ(т ) = {(8, Ь) Є П : § Є со{в±(ві ,т ; Ь),в±(ві, т — є; Ь}}, т Є Т, і = 0,1; П±Ш = {(8,Ь) Є П: § Є со{в±(£ — є,Ьі; Ь),в±(£,Ь1; Ь}},
где £ Є (в+(в0,Ь0; Ь1),в1) или, соответственно, £ Є (в0, в-(в1,Ь0; Ь1)) (см. рис. 2, рис. 3)
Рис. 2.
Рис. 3.
С помощью множеств Щ. (т) построим вариации А и и Аь управлений и и ьг по правилу
Ап(ч /) = I и(в’ г) - и(г) (в’г) 6 П.(т)’
Аи(5,г) I 0, (5, г) 6 П\П.(т),
А 0/^ / ь°(^) - V0, г 6 (т - £,т), . 1м .
Аь (г) - { о, г 6 т\(т - £, т), Аь (г) = 0 если 1 = 0
А 0/^ п А 1/^ / ь1(г) - V1, г 6 (т - £,т), .
А“(г) = 0 Аь(г)-{ 0, г 6 т\(т - £,т), если 1 -1
Аналогично с помощью множеств П±(£) (в том случае, когда они не пустые, т.е. при г1 < г) построим вариацию Аи управления и, положив
ди(ч г) -I и(^г) - и(г) (в>г) 6 П±(^)’
(5,г) I 0, (5, г) 6 п\п±(е).
В силу полученных оценок роста приращений (2.1) приращение Ах на каждой из перечисленных вариаций имеет порядок £. В то же время приращение Аг- (Аг+) внутри характеристических полосок с отрицательным (положительным) наклоном от величины £ не зависит.
Анализ приращения целевого функционала на соответствующих приращениях распределенного и и граничных V управлений по схеме работ [4-6] приводит к следующим четырем семействам задач оптимального управления с обыкновенными дифференциальными уравнениями.
К ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ ВОЛНОВЫХ ПРОЦЕССОВ Задача 1.
I(и,-и) = <£>(ж,г+,у,#,80,т) - <£>(ж,у,г ,5+($0,т; ¿і),іі)
•а(в+(в0, т; ¿і)) + / Н(ф+, ф , С +, 0, ж, г+, у, и, £, т)а(С)
¿0
£=8-($о,т ;£)
+ /Н(ф+,ф-,0,С-,ж,у,г-,й,£,т)а(£) ^ -
Т _ 5=«+(«о ,т ;і)
у/ = /(ж,г+,у,й,8-(80,т;¿),¿), і Є [¿0,т], у(іо) = (х1 (С) + а(£)ж0'(£)) ,
_ 5=«-(«о,т;*о)
у/ = /(ж, у, г-, и, 8+(80, т; і), і), і Є (т, ¿і], у(т + 0) = У(т) + 2^0 (г- ^0, т), V0, т), и(і) Є и, * Є Т, V0 Є V0, т Є Т.
тах,
Задача 2.
I (и, V) = — <£>(ж,у,Г ,^1,81,т) — (^(ж, Г+,у, 8 (81,т; ¿1),*1)-
•а(в (в1, т; ¿1 )) + / Н(ф+,ф , 0,( ,ж,у,г ,и,С,т)а(С)
¿0
¿1
+ Т Н(ф+, ф -,С +, 0, ж, г+, у, и, Є, т)а(Є)
_ 5=«- («і,т ;і)
у/ = /(ж,у, г-,й,8+(^1,т;і),*), і Є [¿0,т]
У(і0) = (ж1(Є) — а(Є)ж0'(Є))
у/ = /(ж,г+,у,й, 8-(81, т; і),і), і Є (т, ^1], у(т + 0) = у(т) + 2а(з1)з1(г+(з1,т ),#,т), и(і) Є и, і Є Т, V1 Є V1, т Є Т.
Задача 3.
I(и) = —<^(ж, у, г , С, і1)а({) +
¿і
+ / Н(ф+,ф , 0, £ ,ж,у,г , и, п, і)а(п)
¿0
п=«+(5,іі;і)
£=8+(зі,т ;і)
тах,
5=«+(«і,т ;іо)
тах,
у = /(ж,у,г ,8+ (С,і1;і),і),
у(і0) = (ж1(п) — а(п)ж0/ (п)) ,
п=«+(5,іі;іо) и(і) Є и, і Є Т, С Є (8+(^0, і0; £1), 81).
Задача 4.
I (и) = — <^(ж,г+ ,у,£Л)а(£) +
—► тах,
¿і
+ /Н(ф+,ф-,(+, 0, ж, г+, у, и, п, і)а(п)
¿о
ч=«-(ї,*і;*) у/ = /(ж,г+,у,5-(С,і1; і), і),
у(і0) = (ж1(п) + а(п)ж0/(п))
п=«-(5,іі;іо) и(і) Є и, і Є Т, С Є (з0,з-(зьі0; і^).
Теорема 1. Пусть управления и и Vі оптимальны в задаче (1.1)-
(1.5), а функции ж, г± и ф±,£± являются решениями задач (3.2)-(3.4) и (4.2). Тогда
1). для почти каждого т Є Т управления
Г и(5-(50,т;і Є (і0,т), _ = v(т)
() \ и(8+(80,т;і),і), і Є (т,і1), ( ),
оптимальны в задаче 1, а управления
и(і) = {и(8+(81,т;і),і),і Є (і0,т), у = v(т)
() \ и(з (^1,т;і),і), і Є (т,і1), ( ^
оптимальны в задаче 2;
2). для почти каждого С Є (8+ (^0,і0,і1), 81) управление и(і) = и(8+(С,т; і), і) оптимально в задаче 3, а для почти всех С Є (^0,£-(з1,і0; ^)) управление и(і) = и(з-(£,і1; і), і) оптимально в задаче 4.
6. Конечномерный и линеаризованный принцип максимума
Введем дополнительные предположения на параметры задачи (1.1)—
(1.5). Будем считать, что каждая функция дг дифференцируема по управлению Vі, а множества Vі -выпуклые, і = 0,1. Тогда принцип максимума Понтрягина можно применить не только к задачам 3,4, но и к задачам 1,2. Итоговым результатом здесь будет
Теорема 2. Пусть управления и и Vі оптимальны в задаче (1.1)-
(1.5), а функции г±,г± и ф±,£± являются решениями задач (3.2)-
(З.4) и (4.2). Тогда распределенное управление и почти всюду на П удовлетворяет принципу максимума Понтрягина
Н (ф+, ф-, С +, £-, г+, г-, г+, г-, и, 8, і) =
= уіп? тахиєи Н(ф+, ф-, £+, £-, г+, г-, г+, г-, и, 8, і),
а для граничных управлений ьг справедлив линеаризованный (дифференциальный) принцип максимума Понтрягина
ko(i)q°o(x(so, t), v0, t)(v0 — v0(t)) < 0, v0 € V0, ki(t)qli(x(si, t), v1, t)^1 — v1 (t)) < 0, v1 € V
Наконец, если допустить, что функция f дифференцируема по u, а множество U — выпуклое, то будет справедлива
Теорема 3. Пусть управления u и v* оптимальны в задаче (1.1)-
(1.5), а функции r±, r± и ф±, Z± являются решениями задач (3.2)-(3.4) и (4.2). Тогда распределенное управление и почти всюду на П удовлетворяет линеаризованному (дифференциальному) принципу максимума
Яи(ф+, ф-, Z +, Z-, r+, r-, r+, r-, и, s, t)(u — u(s, t)) < 0, и € U, а для граничные управления v* - условиям (6.1).
Отметим, что результаты теорем нетрудно переписать в терминах исходной задачи (1.1)—(1.5). Для этого достаточно учесть связь между функциями f, ^>, Ф и /,<ф, Ф, а также замену переменных x,xs и ж* на переменные r±,r± в форме (3.1).
Подчеркнем, также, что вариационный принцип максимума является более сильным необходимым условием оптимальности, нежели чем принцип максимума конечномерный. Это можно доказать, приведя конкретные примеры задачи (1.1)—(1.5) с выпуклыми множествами V* и
гладкими по управлению функциями q*, в которых управления u, v*
удовлетворяют конечномерному принципу максимума, но бракуются вариационным принципом максимума. В частности, для указанной цели подходит следующий
Пример.
ж« — = u, (s, t) € П = S х T,
x(s, 0) = xt(s, 0) = 0, s € S = [0, 3],
ж*(0,t) = xs(3,t) =0, t € T = (0,1),
u(s,t) € [—1, 4], (s,t) € П,
3
J (ж) = — - J (ж* + xs)2ds —► min.
0
Очевидно, что в силу независимости целевого функционала от состояния ж, имеет смысл рассматривать систему (3.2) и сопряженную к ней систему (6.1) только для переменных r± и Z± соответственно.
Заметим, что r± = ж* ^ ж8, и эквивалент задачи (3.2)—(3.4) имеет вид
(dtr±)± = u, r±(s, 0) = 0, s € S; r+(0,t) = —r-(0,t), r-(3, t) = r+(3,t), t € T,
3
J (u) = — “У (r-(s, 1))2ds —► min.
0
Решения r± для u = const легко вычисляются по правилу
r+(s,t) = ( и^’ s > ^ r-(s,t) = ut, (s, t) Є П.
v ' [ (2s — t)u, s < t, v ' v '
В этом случае
J (u) = — 3 u2.
Нетрудно догадаться, что оптимальным управлением здесь служит u(s, t) = 4.
Проверим принцип максимума Понтрягина для очевидно неоптимального управления u = —1. Здесь функция Понтрягина H = (Z + + Z-)u. Решение сопряженной задачи
dt(Z±)± = 0, Z+(s, 1) = о, Z-(s, 1) = r-(s, 1) = —1,
Z-(о,t) = —Z+(о,t), Z+(3,t) = Z-(3,t)
имеет вид
ґ+( +\ / 0, s < t + 2, , , ( —1, s > 1 — t, ( л
Z <^> = { — 1, s>t + 2, Z (M) = \0, s< 1 — t, (M) Є П
Принцип максимума Понтрягина для распределенного управления u(s, t) эквивалентен условию
(Z-(s, t) + Z +(s, t))(u — u(s, t)) < 0, u Є [—1, 4],
которое в силу равенства
( 0, s < 1 — t,
Z-(s,t) + Z+(s, t) = і —1, 1 — t < s < t + 2, (s, t) Є П
і —2, s > —2,
для управления u(s,t) = —1 справедливо всюду в П. Другими словами, управление u(s,t) = —1 удовлетворяет принципу максимума Понтрягина.
Обратимся теперь к вариационному принципу максимума. Семейство задач 1 в силу того, что ему соответствуют тривиальные значения Z±, а функция <р не зависит от у, является вырожденным, т.е. формально данному семейству задач удовлетворяет любое допустимое управление.
Семейства задач 2-4, построенные для управления u(s,t) = —1, выглядит следующим образом
Задача 2.
т 1
I (и) = 2 у2(1) — / u(t)dt — / U(t)dt —► max,
0 т
у/ = и, у(0) = 0, t € [0, т], у = U, у(т + 0) = у(т), t € [т, 1].
U(t) € [—1, 4], t € [0,1], т € (0,1).
Задача 3.
1
I (и) = — / U(t)dt —► max,
0
2/ = U, y(0) = 0, U(t) € [—1, 4], £ € (2, 3).
Задача 4.
1
I (u) = 1 y2(1) — / U(t)dt —► max,
0
3/ = u, y(0) = 0, U(t) € [—1, 4], t € [0,1], £ € (0, 2).
Очевидно, что управление U(t) = —1 доставляет максимум целевому функционалу, а следовательно, не бракуется только в семействе задач 3. Однако в целом вариационный принцип максимума неоптимальное управление u(s, t) = —1 отвергает, т.к. во втором и четвертом семействах максимизирующим управлением является U(t) = 4, а не проверяемое управление.
Таким образом, доказано, что вариационный принцип максимума является более сильным необходимым условием оптимальности, нежели принцип максимума конечномерный.
Список литературы
1. Рождественский Б. Л. Системы квазилинейных уравнений и их приложения к газовой динамике / Б. Л. Рождественский, Н. А. Яненко. — М.: Наука, 1978. — 687 с.
2. Терлецкий В. А. Обобщенное решение одномерных полулинейных гиперболических систем со смешанными условиями / В. А. Терлецкий // Изв. вузов. Математика. — 2004. — № 12. — C.75-83.
3. Терлецкий В. А. Обобщенное решение нелинейного волнового уравнения с нелинейными граничными условиями первого, второго и третьего родов /
B. А. Терлецкий // Дифференциальные уравнения. — 2009. — Т. 45. — № 3. —
C. 403-415.
4. Васильев О. В. Методы оптимизации и их приложения. Ч.2. Оптимальное управление / О. В. Васильев, В. А. Срочко, В. А. Терлецкий. — Новосибирск: Наука, 1990. — 151 с.
5. Терлецкий В. А. Вариационный принцип максимума в управляемых системах одномерных гиперболических уравнений / В. А. Терлецкий //Изв. вузов. Математика. — 1999. — № 12. — С. 82-90.
6. Терлецкий В. А. Вариационный принцип максимума для полулинейных гиперболических систем со смешанными условиями / В. А. Терлецкий // Методы оптимизации и их приложения. — Иркутск, 2005. — С. 201-205.
V. A. Terletsky, E. A. Lutkovskaya
On optimization of nonlinear wave processes
Abstract. We present necessary optimality conditions in form of variational, classical and linearized maximum principles for the problem of optimal control of non-linear wave equation with nonlinear boundary conditions of first, second and third types.
Keywords: optimal control, wave equation, variational maximum principle.
Терлецкий Виктор Анатольевич, кандидат физико-математических наук, доцент, Институт математики,экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952) 24-22-16, ([email protected])
Лутковская Екатерина Александровна, старший преподаватель, Институт математики,экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952) 24-22-16, ([email protected])
Terletsky Viktor, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003 professor, Phone: (3952) 24-22-16, ([email protected])
Lutkovskaya Ekaterina, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003 professor, Phone: (3952) 24-22-16, ([email protected])