УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977
doi: 10.18101/2304-5728-2017-1-38-54
МЕТОДЫ НЕПОДВИЖНЫХ ТОЧЕК НА ОСНОВЕ ОПЕРАЦИЙ ПРОЕКТИРОВАНИЯ В ЗАДАЧАХ ОПТИМИЗАЦИИ УПРАВЛЯЮЩИХ ФУНКЦИЙ И ПАРАМЕТРОВ ДИНАМИЧЕСКИХ СИСТЕМ1
О Булдаев Александр Сергеевич
доктор физико-математических наук, профессор кафедры прикладной математики Бурятский государственный университет Россия, 670000, Улан-Удэ, ул. Смолина, 24а E-mail: buldaev@mail.ru
Рассматривается новый подход к оптимизации управляющих функций и параметров нелинейных систем, основывающийся на решении специальных задач о неподвижной точке проекционных операторов в пространстве управлений. Задачи о неподвижной точке дают возможность строить улучшающие и экстремальные управления, получать новые условия оптимальности управления в классе оптимизационных задач.
Ключевые слова: управляемая система, задача о неподвижной точке, условия улучшения и оптимальности.
Введение
Распространенным подходом к решению задач оптимального управления является поиск управлений, удовлетворяющих необходимым [1-3] или достаточным [4-6] условиям оптимальности. При этом классический подход заключается в построении краевой задачи принципа максимума, трудности решения которой общеизвестны [1,2]. Другой подход состоит в последовательном решении задач локального улучшения, в результате которого строится релаксационная последовательность управлений, сходящаяся при определенных условиях к экстремальному управлению. К этому типу относятся, например, известные градиентные методы [2,3]. В работах [4-7] предложены перспективные нелокальные методы улучшения управления, основанные на нестандартных аппроксимациях функционалов задач. Более высокое качество аппроксимаций функционала по сравнению со стандартными обусловливает повышенную эффективность нелокальных методов.
В работе [7] в классах линейных и квадратичных по состоянию задач оптимального управления построены формулы приращения функционалов задач, не содержащие остаточных членов разложений. Трудоемкость
1 Работа выполнена при финансовой поддержке РФФИ, проект 15-01-03680-а; МОИ РФ, проект 1.5049.2017/БЧ
одного улучшения управления определяется решением специальной задачи Коши для фазовых или сопряженных переменных. Построенные нелокальные методы характеризуются тем, что улучшение управления гарантируется не только в достаточно малой окрестности улучшаемого управления, в отличие от локальных методов типа градиентных. Методы не содержат процедуру поиска улучшающего управления в достаточно малой окрестности улучшаемого управления и имеют возможность улучшать неоптимальные управления, удовлетворяющие принципу максимума. На основе методов получены новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемых классах задач.
В работах [8-11] нелокальный подход [7], основанный на конструировании формул приращения функционалов без остаточных членов разложений, разработан и обобщен на классы полиномиальных по состоянию и общих нелинейных задач оптимального управления. При этом построение формул приращения функционалов задач без остаточных членов разложений достигается с помощью дифференциально-алгебраических модификаций стандартной сопряженной системы. Трудоемкость одного улучшения управления определяется уже решением специальной краевой задачи в пространстве состояний или операторного уравнения в пространстве управлений, интерпретируемого как задача о неподвижной точке специального оператора управления.
В данной работе указанный нелокальный подход развивается в классе задач оптимизации нелинейных систем по управляющим функциям и параметрам. Метод иллюстрируется в рамках следующего класса задач оптимального управления:
ф(<т) = cp{x{tx),со) + jF(x(t),и(0, со, t)dt inf , (1)
т сте
x(t) = f(x(t),u(t),co,t), x(t0) = а,
u(t)eU, со eW, ае A, teT = [t0,tl], (2) в котором x(t) = (xl(t),...,xn(t)) - вектор состояния, u{t) = {u.i{t),...,um{t)) -вектор управляющих функций, со ={со1,...,со1) и а = (а1,...,ап) - векторы
управляющих параметров. Множества С/с/Г, W^R1, A^R" компактны и выпуклы. Интервал Т фиксирован. В качестве допустимых управляющих функций рассматривается множество V кусочно-непрерывных на Т функций со значениями в множестве U . а = {и,со,а) - допустимое управление со значениями в множестве Q = V xWxA . Функция <р(х,со) непрерывно-дифференцируема на R" xW, функции F(x,u,co,t), f(x,u,co,t) и их частные производные по х, и, со непрерывны по совокупности аргументов на множестве R" xU xW хТ . Функция f(x,u,co,t) удовлетворяет условию Липшица по х в R" xU xW хТ с константой
L > 0 : I f{x,u,co,t) - fiy,и,со,щ < Щх - j||.
Условия гарантируют существование и единственность решения x{t,a), t <еТ системы (2) для любого допустимого управления и е Q .
Функция Понтрягина с сопряженной переменной f ей" и стандартная сопряженная система имеют вид
Hiy/,x,u,co,t) = (y/,fix,u,co,t))-Fix,u,co,t), у/(0 = -Ях(у/(0,х(0,и(0,®,0, teT, \i/(tl) = -(Px(x(tl),co). (3)
Для допустимого управления creQ обозначим i//(/.cr). / е Т - решение стандартной сопряженной системы (3) при x{t) = x{t,a) и аргументах и, со , соответствующих компонентам управления а . Частное приращение произвольной вектор-функции giyl,...,y1) по переменным _уЛ| , ys
будем обозначать
= g(yi,-,ySl + 4ySl,-,yS2 +&ys2,-,yi)-g(yi,-,yi)
Дополнительно обозначим Ax(t) = x(t,u) - x{t,a' ), Au(t) = u(t) - и1 (t),
A со =co - со1, Aa = a-aI.
Задача улучшения управления рассматривается в следующей общей постановке: для заданного управления сг7 е Q требуется найти управление <7 eQ с условием АстФ(сг/) = Ф(сг) - Ф(<т7) < 0 .
Введем модифицированную дифференциально-алгебраическую сопряженную систему в форме
p{t) = -Нх (pit), x(t), и it), со,t)-rit), (4)
(Нх ipit), xit),uit), co,t) + rit),y it) - x(0) = Ay(f)Hipit), x(t),u(t), ®, 0 (5) с краевыми условиями
p(0 = ~<РЛХ(((6)
{(pxixit1),CD) + q,yit1)-xit1)) = AЛ),®), (7)
в которой по определению полагаем rit) = 0, q = 0 в случае линейности функций (р, F, f по х (линейная по состоянию задача (1), (2)), а также в случае }'(/) = x(t) при соответствующих teT.
В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (4)-(7) в силу определения совпадает со стандартной сопряженной системой (3).
В нелинейной по состоянию задаче (1), (2) алгебраические уравнения (5) и (7) всегда можно разрешить относительно величин rit) и q (возможно, не единственным образом).
Универсальным способом разрешения является следующее правило (на примере уравнения (5)).
Если существует £е{1,...,и}, для которого yk{t)^xk{t), то для / е {1,..., п) полагаем
r.(t) = 0, г Фк,
Ф) =
_ Ay(t)H (p(t),x(t),u(t),Д>, t)dt - (Нх(p(t), x(t),u(t),®,t) + r(t),y(t) - x(Q)
i = k .
Если для всех к е{1,...,и} имеем ук(!) = хк(!). то в силу определения г(0 = 0.
Альтернативный простой способ разрешения можно использовать в полиномиальной по состоянию задаче (1), (2) (функции (р, F, f являются полиномиальными по переменной х ), применяя формулу Тейлора для полинома. В частности, в квадратичной по состоянию задаче (1), (2) получаем (на примере уравнения (5))
КО = ^Ha{p{t),x{t),u{t),e>,t){y{t) - x(t)) ■
Таким образом, дифференциально-алгебраическую сопряженную систему (4)-(7) всегда можно свести (возможно, не единственным образом) к дифференциальной сопряженной системе с однозначно определенными величинами r{t) и q .
Для допустимых управлений creQ, и1 е Q обозначим р(!.о'.о). t <еТ - решение модифицированной сопряженной системы (4)-(7) при x(t) = x{t,a'), y(t) = x(t,u), u(t) = и1 (t), со =col. Из определения следует очевидное равенство p(t,a,a) = y/(t,<j), teT .
В работе [11] в рассматриваемом классе задач (1), (2) получены две формулы приращения функционала. Первая формула основывается на решении стандартной сопряженной системы (3) и имеет стандартный вид, содержащий остаточные члены разложений,
АстФ(ст/) = -Аш{-<р(х^,ст/),®/) +
+\H(xi/(t,aI ),x(t,а1 ),«' (t),со1, t)dt} - (у/^ст1 ), Да) - (8)
т
т т
Вторая формула использует решение модифицированной сопряженной системы (4)-(7) и не содержит остаточных членов разложений
ДСТФ(С77 ) = -К {~(р(х(^ ,(т),со1) + ¡H(p(t, a1, a), x(t, а), и^со1, t)dt} -
Т (9)
-(p(t0,а1, а), Да) - J Au(t)H(p(t, а1, a), x(t, а), и1 (t), со1, t)dt.
т
В [11] на основе формул (8), (9) построены условия улучшения и оп-
41
тимальности управления в форме задач о неподвижной точке на основе операций на максимум функции Понтрягина по управлению. В данной работе условия улучшения и оптимальности управления конструируются как задачи о неподвижной точке на основе операции проектирования управления на допустимое множество значений. Предлагаемые методы неподвижных точек состоят в решении конструируемых задач о неподвижной точке.
1. Задача о неподвижной точке на основе операций проектирования
Обозначим Рг - оператор проектирования на множество Y a R1 в евклидовой норме
Рг (z) = arg min(||j - zh , zeRk .
y<aY
При заданном er7 e Q для а > 0 рассмотрим следующую систему уравнений относительно сг = (и,со,а):
u{t) =Ри(и1 (0 + а(Ни (p(t,a1,a), x(t, а),и1 (t), со7, t) + su (t))), t e T, (10)
Au(i)H(p(t,<TI,<T),x(t,<T),uI(t),a)I,t) = / \> (u)
= (Hu(p(t,(71,a),x(t,<j),u'(0,co',t) + su(t),u(t) -u'(t)) co=Pw(coI +
+a(~<pa (x(tx ,o),coI ) + \Ha (p{t,er7,a), x(t, а),и(Г)У ,t)dt + Г))' (12)
T
Aa {-cp(x(tx ,a),coI) + \H(p(t,aI ,a),x(t, a), u(t), со1, t)dt} =
T
= ( -q>a(x(tl,cj),coI)+ (13)
+|Я(в(^,С77,С7),Х(^,С7),М(0,Ю/,0^ + ^,Ю -CO1 ),
T
a = PA(aI +ap(t0,aI,CT)), (14)
в которой в уравнении (11) по определению полагаем s"(t) = 0 в случае линейности функций F, f по и (линейная по управляющей функции и задача (1), (2)), а также в случае u(t) = и1 (t) при соответствующих t еТ .
Аналогично в уравнении (13) по определению полагаем sa = 0 в случае линейности функций F, f по со (линейная по параметру со задача (1),
(2)), а также для со = со1.
В нелинейной по управляющей функции и задаче (1), (2) уравнение (11) всегда можно разрешить относительно величины s" (t) (возможно, не единственным образом).
Универсальным способом разрешения является следующее правило.
Если существует ke{l,...,m}, для которого uk(t) ^ul(t), то для i е {1,..., п) полагаем
<(0 = о, iФк.,
;~п nit ^■1 г
u(t)
<(0 =
Au(f)H(p(t,а1,a), x(t,а),и1 (t),со>, t) -- (ff „ , gJ,a),x(t,а),и1 (Q,со1 ,t) + su (t),u(t) -и1 (Q)
«,-(0-«,(0
i = к .
Если для всех к е {1,..., т] имеем ик (t) = и'к (t), то в силу определения имеем s"(t) = 0 .
В полиномиальной по управляющей функции и задаче (1), (2) (функции (р, F, f являются полиномиальными по переменной и) можно использовать альтернативный простой способ разрешения, применяя формулу Тейлора для полинома. В частности, в квадратичной по и задаче (1), (2) получаем
su(t) = \нии (p(t, сг7, сг), x(t, а), и1 (t), со1, t)(u{t) - и1 (t)) .
В нелинейной по параметру со задаче (1), (2) строятся аналогичные простые правила разрешения уравнения (13) относительно величины sa. В частности, в квадратичной по со задаче (1), (2) можно использовать правило
L Т
Таким образом, систему (10)-(14) всегда можно свести (возможно, не единственным образом) к системе уравнений с однозначно определенными величинами s" (t) и sa .
Предположим, что задача (10)—(14) имеет решение сг77 =(ип ,соп,ап)
(возможно, не единственное) и управление и11 является кусочно-непрерывным. В силу свойств операции проектирования получаем
Л я(f)H(p(t, a1, a11), x(t, о11),и1 (t), со7, t) > I\ип (0 - и1 (i)f > 0 , t е Т,
A,I{-(p{x{tl,a11),co1) +
+ fH(p(t,a1 ,an), x(t, a11 ),un (t), со1, t)dt} > — L
J /V II
>—IIсо11 -co1 II2 >0:
а 1
р(10,о>,о11),а11 - а1) >—||а77 -а'(>0.
'а11 11
Отсюда и из формулы (9) следует оценка улучшения функционала
А яФ(ст7) < -— ГЦ и" (0 - и1 (0|Г Л -~\ооп - со1 II2 -—II а" - а1 Т . (15) ст ау] 11 а11 11 а11 11
Используемая система обозначений решений фазовой и сопряженной систем в форме явной зависимости от управления позволяет интерпрети-
ровать систему уравнений (10)—(14) как задачу о неподвижной точке специального оператора управления.
При заданном а1 е Q определим оператор Ga : а —» ê = (û,â,â), а > 0 на множестве допустимых управлений Q следующими соотношениями: Ы(0 = Ри {и1 (0 + а (Ян (/>(f, ст7, ст), x(f, CJ), м7 (0, ®7, о + 5м (0)) ,teT, A mH(p(t, a1,a), x(t,a),u' (t), а1, f) =
= (Ян (/?(í, a1,a), x(t, а),и1 (t), со1,0 + 5м (f),«(0 - и1 (t)), ê=Pw(coI +
+а (~<ра (x(tx ,о),со1) + \На (p(t, С77 , Ст), x(f, ст), ы(0, ю', t)dt + sa )),
т
A¿ {-cp(x(tx, a), a1 ) + ¡H(p(t, ст1, a), x(t, a), u(t), a1, t)dt} =
T
+|Я(0(^,С77,С7),Х(^,С7),М(0,Ю/,0^ + ^,Ю -СО1 ),
т
â = PA{a' +ap(t0,<jI,<j)) .
Тогда система (10)—(14) записывается в форме стандартной задачи о неподвижной точке оператора управления Ga
и = Ga(u), а> 0.
Выбирая однозначно определенные правила определения указанных выше величин r{t) и q. s" (t) и s10, будем получать однозначно определенные операторы управления Ga . Таким образом, возникают модификации метода неподвижных точек с различными однозначно определенными проекционными операторами управления. Множества неподвижных точек возможных модификаций оператора управления существенно расширяют потенциал улучшения заданного управления.
Данная особенность предлагаемого подхода неподвижных точек позволяет конструировать специальные вычислительные технологии улучшения управления, в которых на каждой итерации улучшения выбирается наилучшее по определенному правилу управление. Такие технологии могут эффективно реализовываться с помощью параллельных вычислений на многопроцессорных компьютерах.
Задаче о неподвижной точке (10)—(14) в пространстве управлений соответствует эквивалентная краевая задача в пространстве фазовых и сопряженных переменных
x(t) = f(x(t),ua(t),0)a,t), x(t0) = aa, (16)
p(t) = -#х(/К0У (0У (0V ,0 - r{t), (17)
(нх (p(t), X1 (ОУ (О, О)1,0 + Г (0, х(0 - X1 (0) =
(18)
= ЛХ(0ЯО?(ОУ (ОУ (0, ®7,0
= (19)
(<рх (х7 ft), ®7 ) + q, x{tx ) - х7 (О) = Ax(t )<р(х7 (О, ®7 ), (20)
в которой
иа (0 = (и7 (0 + а(Ян (/>(0, X(t),u' (0, ®7, о + 5м (0)) ,t е Т, (21)
А яо?(0,х(0У(0У,0 = " (0 . (22)
= (Ян (p(t), x(t),u' {t),œ1, t) + (t),ua (0 - и1 (О),
+а (xft ), ®7 ) + |Яш (p(t), x(t),ua (0, ®7, t)dt + Г )), (23)
т
Аш„ {-<р(х(^ ), ю7 ) + |Я(^(0, х(0У (0, co\t)dt} =
\ (24)
т
аа =РА(а' +ap(t0)) (25)
и для удобства обозначено х7 (t) = x(t. а1), t еТ .
Предположим, что решение (x(t),p(t)), i е Т интегро-дифференциально-алгебраической краевой задачи (16)—(25) существует (возможно, не единственное). Сформируем соответствующее выходное управление сг77 = (иа,соа,аа) по правилам проектирования (21)-(25), причем управляющая функция ua(t), / е Т является кусочно-непрерывной. Тогда x(t) = x(t,an), p(t) = p(t,<r', сг77) и из формулы (9) получаем оценку улучшения функционала (15).
Эквивалентность краевой задачи (16)—(25) и задачи о неподвижной точке (10)—(14) понимается в следующем смысле. Пусть пара (х(/). p(t)).
t еТ, является решением краевой задачи (16)—(25). Тогда управление сг77, формируемое по указанному выше правилу, является решением задачи о неподвижной точке (10)—(14). Наоборот, пусть допустимое управление сг77 является решением задачи (10)—(14). Тогда пара (x(i,cr77),/>(i,cr7,cr77)), teT является решением краевой задачи (16)—(25).
Таким образом, для улучшения управления сг7 е Q достаточно решить задачу о неподвижной точке (10)—(14) или эквивалентную ей краевую задачу (16)—(25).
2. Условия оптимальности управления
Установим связь необходимых условий оптимальности управления с задачей о неподвижной точке (10)—(14).
В [11] на основе формулы приращения (9) рассматриваются необходимые условия оптимальности управления сг7 е Q в задаче (1), (2) в форме принципа максимума
и1 (t) = argmaxH(y/(t,<jI),x(t,<jI),iï,coI,t), teT, (26)
со
ùeU
I
= argmax( ~(pa(x(tl,<jI),CDI) +
à eW
+\На (y/(t,c71 ), x(t, a '),u' {t),co',t)dt, â ),
(27)
a = arg max (i//(i0,cr ),a). (28)
aeA \ '
Из условий (26)-(28) следуют ослабленные необходимые условия в форме дифференциального принципа максимума
и1 (t) = arg max [Ни (i//(t, а1), x(t, о1),и1 (t),co', t),u), teT,
HeU » '
со1 =argmax(-(pai(x(t1,crI),caI) + \н ^(t^Xx^^Xu1 (t),®1 ,t)dt,a>),
cb eW \ J /
\ T /
a1 = argmax(i//(i0,cr7),a) ,
которые можно представить в проекционной форме с параметром a > 0
М7(0 = ^(н7(0 + «Ян(^,^/),^,ст/),и/(0,®/,0), teT, (29) a1 = PW(CDI +
+a (~<ра (x(t, ,aI),coI) + \Ha (w(t, ст1), x(t, ст7), и1 {t), со7, г)Л)), (3°}
т
a1 =PA(aI +ays(t0,CT1)). (31)
Обозначим Qa(cr7)cQ - множество допустимых неподвижных точек задачи (10)-(14).
Пусть сг7 е Qa(cr7), тогда очевидно сг7 удовлетворяет условиям (29)-
(30). Обратно, пусть сг7 удовлетворяет условиям дифференциального принципа максимума (29)-(30), тогда сг7 является решением системы (10)—(14) при (7 = (71. Таким образом, получаем следующее утверждение.
Теорема 1. В задаче (1), (2) управление сг7 е Q удовлетворяет условиям дифференциального принципа максимума в проекционной форме (29)-
(31) тогда и только тогда, когда
сг7 е Qa(cr7), а >0 . (32)
Следствие 1 (дифференциальный принцип максимума в терминах задачи о неподвижной точке). Пусть управление сг7 е Q является оптимальным в задаче (1), (2). Тогда сг7 е Qa(сг7), а > 0.
Другие следствия в задаче (1), (2)).
1. Задача о неподвижной точке (10)—(14), и, следовательно, краевая задача (16)-(25), всегда разрешимы для управления, удовлетворяющего дифференциальному принципу максимума.
2. В случае неединственности решения задачи о неподвижной точке (10)—(14) появляется принципиальная возможность строгого улучшения управления, удовлетворяющего дифференциальному принципу максимума. Такая возможность иллюстрируется в работах [7 - 10] для частных случаев задачи (1), (2).
3. Отсутствие неподвижных точек в процедуре улучшения управления свидетельствует о неоптимальности управления.
Оценка улучшения функционала (15) позволяет получить усиленное необходимое условие оптимальности управления по сравнению с дифференциальным принципом максимума.
Теорема 2 (усиленное необходимое условие оптимальности управления в терминах задачи о неподвижной точке). Пусть управление сг7 е О. является оптимальным в задаче (1), (2). Тогда
Па (а1 ) = {&'}, а>0. (33)
Действительно, пусть существует неподвижная точка сг77 е Оа(сг7), а" Фи1. Тогда в силу оценки (15) получим строгое улучшение оптимального управления ) <0 . Полученное противоречие доказывает справедливость утверждения теоремы.
Понятно, что в линейной по аргументу и задаче (1), (2) условие (32) является эквивалентным принципу максимума (26)-(28) и, соответственно, условие (33) усиливает принцип максимума.
Отметим, что условия дифференциального принципа максимума в проекционной форме (29)-(31), записанные для произвольного управления с = (п.о).а) е О . можно рассматривать как задачу о неподвижной точке
о = Са(о), а> 0
в пространстве управлений для определяемого правыми частями этих условий однозначно определенного оператора Оа : и —> а = (и,со,а): и (0 = Ри (и(0 + аНи {у/Ц,а), х{1, а),и(0,со, 0) Л е Т,
ё = Р№(со +«(-</>_(х(^,сг),ю) + ^На(ц/(1,о),х(1,о),и(1),со,1)Ж)),
т
а = РА(а + ау/(^,ст)) .
Указанной задаче о неподвижной точке соответствует эквивалентная краевая задача дифференциального принципа максимума в проекционной форме
х(!) = /(х(0Да(0,®,0, х(Г0) = аа, 47
w(t) = -Нх (y/(t), x(t),ua (0, (0a,t), V(0 = -<PÁx(0>ña),
в которой
йа (0 = Ри (йа (0 + аНи (y/(t), x(t), йа (0, (0a,t)), t еТ,
ña = Pw(coa +a(-(Pa(x(tl),ma) + \Ha(xi/(t),x(t),üa(t),ma,t)dt)),
т
aa=PA(aa+aW(t0)).
Отметим, что уравнение для сопряженной переменной в краевой задаче улучшения (16)—(25) проще по свойствам гладкости правых частей, чем уравнение для сопряженной переменной в краевой задаче дифференциального принципа максимума.
Далее задачи о неподвижной точке конкретизируются в рамках частных подклассов общей задачи (1), (2), актуальных для приложений.
3. Линейная по состоянию задача
Предлагаемый подход к улучшению управления проиллюстрируем на примере линейной по состоянию задачи (1), (2) (функции <р(х,со), F{x,u,co,t), f(x,u,co,t) являются линейными по аргументу х в соответствующих областях определения).
В этом случае модифицированная сопряженная система (4)-(7) совпадает со стандартной сопряженной системой (3).
Тогда формула приращения (9) принимает вид
АстФ(с77) = -Аа {-<;p(x(t!,а),со1) + \H(\¡/(t,а1), x(t,a),u(t),co¡, t)dt} -
т
-(y/(t0,a¡), Аа) - J Au(í)H(y/(t,а1),x(t,а),и1 (t),co¡, t)dt.
т
Задача о неподвижной точке (10)—(14) упрощается и принимает следующий вид
u(t) =Ри(и1 (0 + а (Ни (W(t, c/),x(í,ct),m/(0, co¡,t) + su (0)) ,teT, A u(í)H(y/(t, сг1), x{t, а),и1 (0, (o1, t) = = (Hu (y/(t,a1), x(t,а),и1 (t),co¡, t) + su (t),u(t) -u'(t)),
со =PW(со1 + a(-q>a(x(tx,a),coI) + ^Ha(xi/(t,aI),x(t,а),и^со1,t)dt + sa)),
т
Aa {-<;p(x(t!, а), со1) + \H(\¡/(t, a1), x(t, a), u(t),co¡, t)dt} =
т
= { -(pa(x(t1,<r),coI) + jHJy/(t,<TI),x(t,<T),u(t),coI,t)dt + sco,co-coI ),
т
a = PA(aI +ay/(t0,<j1)) .
При этом уравнение для компоненты а становится независимым от остальных уравнений системы.
Эквивалентная краевая задача улучшения (16)—(25) сводится к специальной задаче Коши
x(t) = f(x(t),ua(t),coa,t), x(t0) = аа ,
в которой
Ua(t) = Ри(и1 (t) + а(Ни(цГ1 (0,x(t),и1 (0,®7,Г) + (0)), teT,
Лн„ (0Я(у/(0, х(0У (0, ®7,0 =
= (Ни(у,1 (t),x(t),u' (t),со',t) + Su(t),ua(t) -и1 (О)'
coa=Pw(co' + а(-срш (x(tx ),со1) + \На (y/1 (t), x(t), ua (t), со1, t)dt + sa)),
т
{-<;p(x(t! ),ю7) + |я(у/7 (0, *(0,"а (О,®7,0^} =
т
т
аа =РА(а' + ay,I(Q) и для удобства обозначено у/1 (t) = y/(t,aI), teT .
В данном примере задача о неподвижной точке и краевая задача для поиска улучшающего управления существенно упрощаются по сравнению с задачей о неподвижной точке и краевой задачей дифференциального принципа максимума.
4. Задача с управляющими параметрами
Рассмотрим важный для приложений подкласс задачи (1), (2), в котором функции F, f не зависят от аргумента и в соответствующих областях определения. В данной задаче параметрической оптимизации формула приращения (9) принимает вид
ЛстФ(ст7) = -Аш {-<;p(x(t!,а),со1) + ¡H(p(t,а1,a), x(t,а),со1, t)dt} -
т
в которой сг = (со,а), сг7 = (со1,а1).
При заданном сг7 е Q задача о неподвижной точке улучшения (10)-(14) принимает следующую форму
со =PW (со1 + а(~<ра(x(tx,a),coI) + ^Ha (p(t,а1,a),x(t,а),со1 ,t)dt + Г)),
т
К {-(p(x(tx, а), со7) + ¡H(p(t, a1,a), x(t, а), со7, t)dt} =
т
= { -(pJx(t1,<r),coI) + jHa(p(t,<TI,<T),x(t,<T),coI,t)dt + sco,co-coI ),
т
a = PA(ciI +ap(t0,oI,о)) . Задача о неподвижной точке дифференциального принципа максимума
имеет вид
со=Р№(сд +а(-(рш(х(^,<у),со) + ,
т
а = РА(а + ау/(^,сг)). В данном случае задачи о неподвижной точке являются конечномерными по управляемым переменным.
5. Задача с управляющими функциями
Пусть в задаче (1), (2) функции Р, / не зависят от аргумента со в соответствующих областях определения и начальное состояние задано в виде а = х°. В этом случае получаем задачу (1), (2), в которой формула приращения (9) принимает вид
астф(с77) = -1 Аи(Г)Н(р(Х, а1,а), хЦ, а),и1 (0,
т
где и =и , и1 = и1.
Задача о неподвижной точке для улучшения управления а1 = и1 (10)-(14) имеет вид
и(0 =Ри(и1 (0 + а(Ни {рЦ,и1 ,и), х{1,и),и1 (0, ^ + (0)), X е Т,
К(/)Н(Р((,и1 ,и)Л(,и),и' (0,0 = = (Ни(р(Х,и1,и),х((,и),и1(0,0 + $и(0,и(0-и1(0У
Эквивалентная краевая задача улучшения управления а1 = и1 (16)-(25) принимает форму
х(0 = /(х(0,иа(0,0, Х«0) = х°,
р(() = -Нх(р((),х1((),и1Ш)-г(0,
(я>(0у(0у(0,0 + к0,*(0-*7(0) = = ах(ояо?(0У(0У(0,0
р(0 = ~(РЛх1 (О) ~ ч,
(<рх(х1 (<!)) + ч, х((г) - x7 (г,)) = ах(4)?>(х7 (г,)),
в которой
иа(0 = Ри (и1 (0 + а(Ям (/>(0, х(0, и1 (0, о + 5м (0)) Л е Т, а „ (()#(/>(0, х(0у (0,0 = (#„ (/>(0, х(0, и1 (о, о + 5м (0, иа (о - и1 (0)
и обозначено х7 (0 = х(^, сг7), ^ е Т .
Задача о неподвижной точке дифференциального принципа максимума принимает вид
и(0=Ри(и(0 + аНи(у/(Х,и),х((,и)М(Ш, ХеТ,
которой соответствует эквивалентная краевая задача х(0 = /(х(0Д"(0,0, х(О = х0,
y/(t) = -Hx{y{t),x(t),ua{t),t), W(t,) = -<рМО) , йа (0 = Ри (йа (0 + аНи (W(t), x(t), йа (0, t)),teT.
Стандартные методы численного решения рассматриваемых краевых
задач улучшения и принципа максимума (метод стрельбы, метод линеаризации, конечно-разностный метод) даже в случае гладкости и одно-
значности правых частей задачи, как правило, оказываются вычислительно неустойчивыми, что обусловливается наличием положительных
вещественных значений собственных чисел соответствующей матрицы Якоби. Методы решения эквивалентных задач о неподвижной точке в пространстве управлений определяют новые вычислительно эффективные подходы к решению краевых задач в теории оптимального управления.
6. Итерационные методы решения задач о неподвижной точке
Для решения задачи о неподвижной точке произвольного оператора G.V^V, действующего на множестве V в полном нормированном пространстве,
v = G(v), veV, (34)
можно использовать известный в вычислительной математике метод последовательных приближений и его модификации [12]. В частности, можно применить явный метод простой итерации при к > 0, имеющий форму:
vk+l=G(vk), v°eV.
Для улучшения сходимости итерационного процесса задачу о неподвижной точке (34) можно преобразовать к эквивалентной задаче с параметром S > 0:
v = v + 5(v- G(v)), veV, (35)
на основе которой получаем модификацию итерационного процесса:
Vt+1 =vk +S(vk -G(vk)), v°eV.
Основным условием сходимости метода простой итерации является выполнение свойства «сжимания» [12] для оператора правой части задачи о неподвижной точке. Поэтому, выбирая достаточно малый параметр S > 0, можно регулировать сходимость рассматриваемой модификации (35) метода простой итерации.
Одной из возможных схем метода простой итерации для решения задачи о неподвижной точке (10)—(14) для улучшения заданного управления и1 в задаче (1), (2) при к> 0 является следующий итерационный процесс
иш(0 =Ри(и1 (0 + а(Ни(pit,а\ак),x(t,стк),и1 (t),co'^ + s"(t))) ,teT, \t (tH{p{t, cj\cjk\ xit^Xu1 (0, ®7,0 = = (xHSp{t,o\ak),x{t,ok),uI{t),CDI,t)^su{t),uk{t)-uI{t)Y
сош=Р1Г((о1 +
т
А^ {-(р(х(^ ,ак),со1) + \н(р^,а1 ,ак), х{1, ик\ик (0, со1, =
т
= ( -(ра(х((1,<тк),сэ1) +
т
ак+г = РА{а1 + арЦ0,о1 ,ок)) .
Начальное управление сг° е О. при к = 0 задано.
Расчет задачи о неподвижной точке (10)—(14) производится до первого улучшения исходного управления сг7. Далее строится новая задача улучшения для полученного управления ст11 и расчет повторяется. Итерации улучшения продолжаются до тех пор, пока не выполнится условие
|ф(ст//)-Ф(с7/)|<е|ф(с7/)|,
где е > 0 - заданная точность расчета.
Для решения задачи о неподвижной точке дифференциального принципа максимума (29)—(31) может использоваться следующий итерационный процесс при к > Ос начальным управлением о" е О
ик+1 (0 = Ри{ик (0 + аНи {хуЦ, ак), хЦ, ак),ик( г), 0 ),(еТ, а}к+1=Р№(сок +
т
ак =РА(ак +ау/(^,стк)).
Для анализа сходимости рассматриваемых итерационных процессов к решениям задач о неподвижной точке при достаточно малых параметрах проектирования а > 0 можно применить известный принцип сжимающих отображений аналогично [8, 11].
Заключение
Разработанные проекционные методы неподвижных точек для поиска экстремальных управлений (удовлетворяющих дифференциальному принципу максимума) не гарантируют релаксацию по целевому функционалу в отличие от градиентных методов, но компенсируют это свойство нелокальностью последовательных приближений управления, обусловленной фиксированностью параметра проектирования; отсутствием операции варьирования управления в окрестности текущего приближения; получением необходимых условий оптимальности управления в новой конструктивной форме задач о неподвижной точке определяемых операторов управления в рассматриваемом классе задач, что позволяет эффек-
тивно применить известный аппарат теории и методов неподвижных точек для поиска экстремальных управлений.
Предложенные проекционные методы неподвижных точек для улучшения управления в рассматриваемом классе оптимизационных задач обладают следующими свойствами.
1. Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления, характерной для стандартных градиентных методов.
2. Возможность строгого улучшения неоптимальных экстремальных управлений. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.
3. Получение новых необходимых условий оптимальности управления, усиливающих известный принцип максимума в рассматриваемом классе задач.
Построенные проекционные методы неподвижных точек характеризуется тем, что улучшающие и экстремальные управления определяются решениями соответствующих задач о неподвижной точке при любом значении параметра проектирования а > 0 . В частности при достаточно малых а > 0, обеспечивающих сходимость конструируемых итерационных процессов последовательных приближений к решениям задач о неподвижной точке.
Основное отличие разработанных проекционных методов неподвижных точек от стандартного метода проекции градиента состоит в том, что параметр проектирования а > О фиксируется в итерационном процессе последовательных приближений. В методе проекции градиента этот параметр варьируется на каждой итерации для обеспечения улучшения управлений.
В целом, оптимизация управлений на основе расчета конструируемых задач о неподвижной точке предлагаемыми итерационными методами последовательных приближений сводится к последовательному решению задач Коши для фазовых и сопряженных переменных.
Указанные свойства предлагаемых методов неподвижных точек являются важными факторами повышения вычислительной и качественной эффективности решения задач оптимального управления и определяют перспективное направление развития методов оптимизации нелинейных динамических систем.
Литература
1. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1976. — 392 с.
2. Методы решения задач математического программирования и оптимального управления. — Новосибирск: Наука, 1984. — 232 с.
3. Васильев О. В. Лекции по методам оптимизации. — Иркутск: Изд-во Ир-кут. ун-та, 1994. — 344 с.
4. Новые методы улучшения управляемых процессов / В. И. Гурман. В. А. Батурин, Е. В. Данилина и др. — Новосибирск: Наука, 1987. — 184 с.
5. Методы улучшения в вычислительном эксперименте / В. И. Гурман. В. А. Батурин, А. И. Москаленко и др. — Новосибирск: Наука, 1988. — 184 с.
6. Батурин В. А., Урбанович Д. Е. Приближенные методы оптимального управления, основанные на принципе расширения. — Новосибирск: Наука, 1997. — 175 с.
7. Срочко В. А. Итерационные методы решения задач оптимального управления. — М.: Физматлит, 2000. — 160 с.
8. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. — Улан-Удэ: Изд-во Бурятск. гос. ун-та, 2008. — 260 с.
9. Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского госуниверситета. Серия «Математика». — 2009. — Т.2, №1. — С. 94 - 106.
10. Булдаев А. С., Хишектуева И.-Х. Д. Методы неподвижных точек в задачах параметрической оптимизации систем // Автоматика и телемеханика. — 2013. — №12.— С. 5-14.
11. Булдаев А. С. Методы неподвижных точек в задачах оптимального управления. — Улан-Удэ: Изд-во Бурятск. гос. ун-та, 2016. — 60 с.
12. Самарский А. А., Гулин А. В. Численные методы. — М.: Наука, 1989. — 432 с.
FIXED POINT METHODS ON THE BASIS OF PROJECTION OPERATIONS IN PROBLEMS OF OPTIMIZATION OF CONTROL FUNCTIONS AND PARAMETERS OF DYNAMICAL SYSTEMS
Aleksandr S. Buldaev
Dr. Sci. (Phys. and Math.), Prof., Department of Applied Mathematics
Buryat State University
24a Smolina St., Ulan-Ude 670000, Russia
The article deals with a new approach to optimization of control functions and parameters of nonlinear systems, which is based on solution of special fixed point problems for projection operators in the space of controls. The fixed point problems make it possible to build improving and extreme controls and obtain new conditions for optimal control in a class of optimization problems.
Keywords: controlled system, fixed point problem, conditions of improvement and optimality.