Достаточные условия оптимальности в задачах управления на основе формул приращения функционала

Срочко Владимир Андреевич; Антоник Владимир Георгиевич; Аксенюшкина Елена Владимировна

Серия «Математика»

2014. Т. 8. С. 125—140

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 517.97

Достаточные условия оптимальности в задачах управления на основе формул приращения функционала *

В. А. Срочко

Иркутский государственный университет В. Г. Антоник

Иркутский государственный университет

Е. В. Аксенюшкина

Байкальский государственный университет экономики и права

Аннотация. В работе рассматривается типичная задача оптимального управления для функционала с выпуклой терминальной функцией. Достаточные условия оптимальности получены на основе нестандартных формул приращения функционала, которые до сих пор использовались для построения численных методов последовательного улучшения допустимых управлений. Для каждой формулы вводится понятие сильно экстремального управления, которое доставляет максимум функции Понтрягина относительно некоторого множества траекторий. В линейных и квадратичных задачах сильно экстремальные управления являются оптимальными. В общем случае оптимальность обеспечивается дополнительным условием вогнутости функции Понтрягина по фазовым переменным. Приведены примеры эффективной реализации полученных соотношений.

Ключевые слова: задача оптимального управления; принцип максимума; достаточные условия оптимальности.

Исследования по достаточным условиям оптимальности в рамках формализма принципа максимума Понтрягина [2; 6] имеют давнюю историю, но сохраняют свою актуальность (см., например, [1], [3]-[5], [7], [10]). В этом плане безусловно выделяются выпуклые задачи, для которых принцип максимума является критерием оптимальности, что обес-

1. Введение

* Работа выполнена при финансовой поддержке РФФИ, проект № 14-01-00564.

печивает возможность их эффективного решения. Общие результаты по оптимальности экстремальных управлений связаны с условием вогнутости гамильтониана (максимум по управлению функции Понтрягина) относительно фазовых переменных, которое можно интерпретировать в форме задачи на максимум [1; 5].

В данной работе рассматривается типичная задача оптимального управления для функционала с выпуклой терминальной функцией. Достаточные условия оптимальности получены на основе нестандартных формул приращения функционала, которые до сих пор использовались для построения численных методов последовательного улучшения допустимых управлений [7]. Для каждой формулы вводится понятие сильно экстремального управления, которое доставляет максимум функции Понтрягина относительно некоторого множества траекторий. В линейных и квадратичных задачах сильно экстремальные управления являются оптимальными. В общем случае оптимальность обеспечивается дополнительным условием вогнутости функции Понтрягина по фазовым переменным. Приведены примеры эффективной реализации полученных соотношений.

2. Постановка задачи. Необходимые соотношения

Рассмотрим следующую задачу оптимального управления относительно переменных t £ T = [t0,t^, u(t) £ Rm, x(t) £ Rn (задача

(P)):

Ф(и) = x(t1)) + J F(x(t),u(t),t)dt ^ min, u £ V,

T

X = f (x,u,t), x(t0) = X0, V = { u() £ PC(T) : u(t) £ U,t £ T }.

Введем первый набор предположений:

- терминальная функция p(x) непрерывно дифференцируема на Rn;

- функция F(x, u, t) и вектор-функция f (x, u, t) непрерывны по совокупности своих аргументов на Rn х Rm х T вместе с частными производными Fx(x,u,t), fx(x,u,t);

- множество U С Rm компактно.

Образуем функцию Понтрягина с сопряженной переменной ф £ Rn

H (ф,x,u,t) = fy,f (x,u,t)) —F (x,u,t) и введем функцию максимума

H(ф, x, t) = maxH(ф, x, u, t).

u£U

Определим сопряженную задачу

ф = -Hx(^,x,u,t), ф(ti) = -<Px(x(ti)).

Пусть u(t), t € T - допустимое управление в задаче (P), x(t,u), ф(t, u) - соответствующие решения фазовой и сопряженной систем. Введем множество экстремальных управлений задачи (P) относительно принципа максимума

Ext(P) = { u() € PC(T) : u(t) = argmax H(ф(t,u),x(t,u),w,t), t € T }.

Пусть X с Rn - выпуклое множество, содержащее все фазовые траектории управляемой системы:

x(t, u) € X, t € T, u € V.

Внесем дополнительное предположение по части функционала Ф (условие выпуклости): функция ^>(x) выпукла на X.

Дальнейший анализ задачи проводится на основе двух формул приращения функционала Ф, которые ранее использовались для построения методов фазовой линеаризации [7].

Пусть u(-),v(-) - допустимые управления, Ax(t) = x(t,v) — x(t,u) -соответствующее фазовое приращение. Первая формула имеет вид

AvФ(ь,) = — j Av(t)H(ф(t,u),x(t,v),u(t),t)dt + ni,

T r (2.1)

ni = o^(\\Ax(ti)\\) — j oH(\\Ax(t)\\)dt.

T

Здесь приняты обычные обозначения для приращений

AvФ(u) = Ф^) — Ф(u), AvH(■, ■, u, t) = H(■, ■,v, t) — H(■, ■, u, t).

Остаточные величины ov, oH имеют следующий смысл (остатки линеаризации):

v(x(ti,u) + Ax(ti)) — v(x(ti,u)) = (<px(x(ti,u)), Ax(ti)) + ov(\\Ax(ti)\\),

H(ф(t, u),x(t, u) + Ax(t),u(t),t) — H(ф(t, u),x(t, u),u(t),t) =

= (Hx (4>(t,u),x(t,u),u(t),t), Ax(t)) + oSJ)(\Ax(t)\). Приведем вторую формулу приращения

AvФ(u) = — j Av(t)H(ф(t, u, v),x(t, u),u(t),t)dt + n2,

T f (2) (2.2) П2 = o^(\Ax(ti)\\) — j o%\\Ax(t)\\)dt.

T

Здесь сопряженная вектор-функция ф(Ь, и, у) является решением системы

ф = -ых(ф,х(г,и),у(г),г), ф(и) = —^х(х(и,и)).

Отметим, что в правой части системы управление и состояние не согласованы: у(Ь), х(Ь,и). При у = и получаем стандартный вариант: ф(1, и, и) = ф(Ь, и).

Остаточный член оН определяется соотношением

Н (ф(Ь,и,у),х(Ь,и) + Ах(Ь),у(1),1) — Н (ф(1,и,у),х(1,и),у(1),1) = = {Нх(ф(1,и,у),х(1,и),у(1),1), Ах(г)) + о^^АхЩ).

3. Достаточные условия оптимальности

На основании формул приращения (2.1), (2.2) докажем условия оптимальности для экстремальных управлений с дополнительными свойствами.

Определение 1. Управление и(-) € Ext(P) назовем сильно х-экстре-мальным, если

u(t) = arg max H(ф(t,u),x(t,v),w,t) Vt £ T, v £ V.

Таким образом, сильно x-экстремальное управление максимизирует функцию H на соответствующей ему сопряженной траектории ф(t, u) и множестве фазовых траекторий x(t,v), v £ V. Введем в рассмотрение функцию

H(1)(x,t) = H(ф(t,u),x,u(t),t), x £ X, t £ T

относительно управления u £ V.

Теорема 1. Пусть управление u(t), t £ T является сильно x-экстре-мальным и функция H(1\x,t) Vt £ T вогнута по x на X. Тогда управление u(t) является оптимальным в задаче (P).

Доказательство. Рассмотрим формулу приращения (2.1). С учетом выпуклости функции ^(x) и вогнутости функции H(1) (x,t) по x £ X получаем

o^(\\A(x(t1 \ > о, o^mxm < о.

Следовательно, имеет место оценка приращения

Av > j Au(t)H (ф(t,u),x(t,v),v(t),t)dt.

T

Согласно определению сильно x-экстремального управления выполняется неравенство

Au{t)H(ф(t,u),x(t,v),v(t),t)dt > 0 Уг е T, v е V.

Теорема доказана. □

Замечание 1. На основании формулы приращения (2.1) первичным условием знакоопределённости интеграла является поточечное неравенство для частного приращения

Av(t)H(ф(t,u),x(t,v),u(t),t) < 0, t е T,v е V. (3.1)

Следствием этого неравенства является принцип максимума для управления u(t)

AwH(ф(t,u),x(t,u),u(t),t) < 0, t е T, w е U.

Свойство сильной ж-экстремальности управления u(t) является достаточным условием для (3.1).

Проверка неравенства (3.1) связана с решением задачи на максимум

AwH(ф(t,u),y,u(t),t) ^ max, w е U, y е X,

которая с помощью функции максимума H может быть представлена в виде

H(ф(t, u),y, t) — H(ф(t, u),y, u(t),t) ^ max, y е X.

Если вектор-функция x(t,u) является решением этой задачи, то неравенство (3.1) выполняется. Действительно, с учетом экстремальности управления u(t)

Av(t)H(^(t,u),x(t,v),u(t),t) < < H(ф(t, u),x(t, v),t) — H(ф(t, u),x(t, v), u(t), t) < < H(ф(t,u),x(t,u),t) — H(ф(t,u),x(t,u),u(t),t) =0, t е T, v е V. Таким образом, экстремальное соотношение

x(t,u) = arg max Hfy(t,u),y,t) — H(^(t,u),y,u(t),t) ,t е T (3.2) vex L J

является достаточным условием выполнения неравенства (3.1), т. е. может заменить условие сильной x-экстремальности в теореме 1.

Остается заметить, что свойство сильной x-экстремальности управления u(t) является следствием соотношения (3.2), т. е. является более эффективным достаточным условием.

Определение 2. Управление u(-) Е Ext(P) назовем сильно ф-экстре-мальным, если

u(t) = argmaxH(ф(t,u,v),x(t,u),w,t) Vt Е T, v Е V.

Таким образом, сильно ф-экстремальное управление максимизирует функцию H на соответствующей ему фазовой траектории x(t, u) и множестве сопряженных траекторий ф^,у,,и), v Е V. Введем в рассмотрение функцию

H(2)(x,t) = H(ф(t,u,v),x,v(t),t), x Е X, t Е T,

связанную с управлениями u, v Е V.

Теорема 2. Пусть управление u(t), t Е T является сильно ф-экстре-мальным и Vv Е V функция H(2) (x,t) вогнута по x Е X для каждого t Е T. Тогда управление u(t) является оптимальным в задаче (P).

Доказательство. На основании формулы (2.2) аналогично предыдущему получаем оценку приращения

A^(u) > j Au[t)H (ф(t,u,v),x(t,u),v(t),t)dt.

T

Согласно определению 2 выполняется условие

Au{t)H(ф(t,u,v),x(t,u),v(t),t)dt > 0 Vt Е T, v Е V.

Теорема доказана. □

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Замечание 2. Аналогично предыдущему свойство сильной ф-экстре-мальности является достаточным для выполнения неравенства

Av(t)H(ф(Ь, u, v),x(t, u),u(t),t) < 0, t Е T, v Е V, (3.3)

которое обеспечивает неположительность интеграла в формуле (2.2). Рассмотрим задачу

H(£, x(t, u),t) — H(£, x(t, u),u(t),t) ^ max, £ Е ^(u),

где множество Ф^) С Rn содержит все сопряженные траектории ф(t,u,v), v Е V. Если вектор-функция ф(t,u) = ф(t,u,u) является решением этой задачи, то неравенство (3.3) выполняется. Таким образом, экстремальное соотношение

ф^,^ = arg max H(£,x(t,u),t) — H(£,x(t,u),u(t),t) £еФ(и) L

t e T

является достаточным условием для неравенства (3.3). При этом сильная ф-экстремальность управления и(Ь) является следствием этого условия.

ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 4. Применение результатов

Пусть в задаче (P) переменные x, u разделены, т. е.

F(x,u,t) = Fi(x,t) + F2(u,t), f(x,u,t) = f(1)(x,t) + f(2)(u,t).

Тогда аналогичную структуру имеет функция Понтрягина

H(ф, x, u, t) = И1(ф, x, t) + Н2(ф, u, t),

а сопряженная система явно не зависит от управления: ф = -VxH1(^,x,t), т. е. ф(t,u,v) = ф(t,u) Vv £ V. Следовательно, любое экстремальное управление определяется соотношением

u(t) = argmaxH2(^(t,u),w,t), t £ T,

w£U

т. е. является сильно x, ф-экстремальным.

Таким образом, в задаче (P) с разделенными переменными x, u условие вогнутости функции Hi^(t,u),x,t) по x £ X является достаточным для оптимальности экстремального управления u(t). Пусть задача (P) является выпуклой, т. е.

F(x, u, t) = F1(x, t) + F2(u, t), f (x, u, t) = A(t)x + b(u, t),

причем функция Fi (x,t) Vt £ T выпукла по x £ Rn. В этом случае функция

Hi^,x,t) = (ф, A(t)x) - Fi(x, t)

является вогнутой по x £ Rn Уф £ Rn, t £ T. Следовательно, принцип максимума для выпуклой задачи есть достаточное условие оптимальности.

Рассмотрим далее задачу (P) со следующими условиями:

F(x, u, t) = F1(x, t) + (a(u, t),x) + F2(u, t), f (x, u, t) = A(u, t)x + b(u, t),

(4.1)

где F1(x,t) выпукла по x £ Rn. В этом случае функция Понтрягина H(ф,x,u,t) по-прежнему является вогнутой по x £ Rn Уф £ Rn, u £ U, t £ T. Следовательно, в задаче (P) с условиями (4.1) любое сильно экстремальное управление является оптимальным.

Приведем примеры билинейных задач, в которых экстремальные управления являются сильно экстремальными. Задача (P1).

ti

$(u) = J(1 - u(t))x(t)dt ^ max, 0

x = aux, x(0) = с (a> 0, c> 0), u(t) е [0,1], t е T = [0, t1].

Это простейший вариант задачи об оптимальном планировании инвестиций.

Экстремальное управление выражается следующим образом:

( 0, (a^(t,u) - 1)x(t,u) < 0, u(t) = <

[ 1, (a^(t,u) - 1)x(t,u) > 0.

Далее отметим важное свойство: в задаче (Pi) все фазовые траектории положительны, т. е. x(t, v) > 0 Vv е V. Следовательно, управление u(t) является сильно x-экстремальным, так как Vv е V

( 0, (arf(t,u) - 1)x(t,v) < 0, u(t) = <

[ 1, (a^(t,u) - 1)x(t,v) > 0.

Таким образом, в задаче (Pi) любое экстремальное управление является оптимальным. Это значит, что задача, по существу, является выпуклой.

Задача (P2).

$(u) = (d,x(t1)) ^ min,

x = Ax + ub{c,x), x(t0) = x°, \u(t)\ <1, t е T.

Отметим, что билинейная система в задаче (P2) описывает математические модели целого ряда процессов в биологии, экономике, медицине, энергетике и является объектом исследования в теории автоматического управления (библиографию см. в [9]). В частности, задача (P2) моделирует процесс лечения злокачественных опухолей (химиотерапия) путем задержки развития раковых клеток в определенной стадии [11]. В данном случае сопряженная система имеет вид

ф = -ATф - uc{b, ф), ф(Ь) = -d. (4.2)

Экстремальное управление определяется формулой

u(t) = sign{b, ф(t, u)){c, x(t, u)), t е T.

Справедливо утверждение [8].

Лемма 1. Пусть в задаче (P2) выполнены следующие условия

(Hj > bi\cj\, i,j = Т~п, i^j, Ъ > 0, d < 0, (Ъ, d) < 0. (4.3)

Тогда для любого решения сопряженной системы (4-2) выполняется неравенство {Ь,ф(Ь,ь)) > 0, t е T.

Далее заметим, что сопряженная система (4.2) не зависит от x, т. е. ф(t,u,v) = ф(Ь,ь), v £ V. Следовательно, экстремальное управление представляется в виде

u(t) = sign(b^(t,u,v))(c,x(t,u)), t £ T, v £ V,

т. е. является сильно ф-экстремальным.

Таким образом, в задаче (P2) с условиями (4.3) принцип максимума определяется соотношением u(t) = sign(c,x(t,u)) и является достаточным условием оптимальности.

Остается отметить, что с учетом полученного результата задача (P2) решается элементарно. Оптимальное управление определяется следующим образом: u*(t) = sign(c, x*(t)), t £ T, где x*(t) - решение задачи Коши

x = A(t)x + b\(c,x)\, x(t0) = x°.

В данной задаче можно использовать и свойство сильной x-экстре-мальности. Как известно, [9], при выполнении условий

aij > \bi\cj, i,j = Т~п, г ф j, х° > 0, с > 0, (с,х°) > 0 (4.4)

все фазовые траектории удовлетворяют неравенству (c,x(t,u)) > 0, t £ T. Следовательно, в задаче (P2) с условиями (4.4) принцип максимума определяется соотношением u(t) = sign(b^(t,u)) и является достаточным условием оптимальности.

Замечание 3. Представленные условия оптимальности для задачи (P) определены на множестве экстремальных управлений и включают в себя два фактора: усиленное условие максимума функции Понтря-гина и свойство ее вогнутости по фазовой переменной. Сильно экстремальные управления связаны с определенными свойствами фазовых и сопряженных траекторий и характеризуют устойчивость решения задачи на максимум функции Понтрягина относительно этих траекторий. Другими словами, сильно экстремальное управление не реагирует на изменение фазовой или сопряженной траекторий в пределах некоторых множеств. Это свойство робастности в совокупности с условием вогнутости функции Понтрягина и обеспечивает оптимальность экстремального управления. В задачах, линейных по фазовым переменным, условие вогнутости по x функции Понтрягина выполняется автоматически, и свойство сильной экстремальности характеризует «расстояние» между принципом максимума и достаточным условием оптимальности.

В. А. СРОЧКО, В. Г. АНТОНИК, Е. В. АКСЕНЮШКИНА 5. Квадратичная задача

Рассмотрим задачу (P) в рамках следующих условий на образующие функции:

<р(х) = {с, х) + ^ (х, Dx),

F(x, и, t) = bo (и, t) + (а(и, t),x) + ^ (х, G(u, t)x),

f (x, u, t) = A(u, t)x + b(u, t).

В результате получаем задачу на минимум квадратичного по x функционала Ф(и), связанного с линейной фазовой системой X = f (x,u,t) на множестве допустимых управлений V (задача (Q)). Предположение о выпуклости функции ^(x) снимается.

В данном случае имеют место точные формулы для приращения функционала, в которых фигурирует матричная функция Ф^, u) как решение матричной сопряженной системы

Ф = -A(u, t)TФ - ФA(u, t) + G(u, t), Ф(Ь) = —D.

Для оформления результатов введем в рассмотрение вектор-функцию

p(t, u, x) = ф(t, u) + Ф(t, u)(x — x(t, u))

относительно базового управления u E V.

Первая формула приращения функционала в задаче (Q) имеет вид

[7]

Av Ф^,) = —J Av(t) H (p(t,u,x(t,v)),x(t,v),u(t),t)dt (5.1)

T

и порождает достаточное условие оптимальности для управления u E V в форме неравенства для частного приращения

Av(t)H(p(t, u, x(t, v)),x(t, v),u(t),t) < 0, t E T, v E V. (5.2)

Введем понятие сильно x-экстремального управления, которое применительно к условию (5.2) определяется соотношением

u(t) = arg max H(p(t,u,x(t,v)),x(t,v),w,t), t E T, v E V. (5.3)

wEU

С учётом формулы приращения (5.1) справедливо утверждение: любое сильно x-экстремальное управлением является оптимальным в задаче (Q).

Приведем соответствующую иллюстрацию.

Пример 1.

1

2

Ф(и) = ^ J u,(t)x2(t)dt ->• min,

2

0

x = u, x(0) = 0, \u(t)\ <1, t Е T = [0,1]. В данном случае

H(ip, x,u) = ipu — ^ их2,

максимизирующее управление

u*(ф, x) = signHu^,x),

сопряженные уравнения

ф = ux, ф(1) =0, ^ = u, Ф(1) = 0.

Рассмотрим управление u(t) = —1,t Е T. Соответствующие траектории

x(t, и) = -t, ip(t, u) = i (t2 - 1), Ф (t, u) = l-t. Данное управление является экстремальным:

Hu(ip(t,u),x(t,u)) = -i < 0.

Проверим свойство сильной экстремальности. Вспомогательная функция имеет вид

p(t, и,х) = ^ (t2 - 1) + (1 -t)(x + t). Выясним знак функции

Hu (p(t,u,x(t,v)),x(t,v)) =

= ^(t2 - l) + (1 - t)(x(t,v) +1) - ^X2(t,v), teT, veV. Рассмотрим квадратичную функцию с параметром t

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

g(x) = ^(t2-l) + (l-t)(x + t)-^x2.

Решение задачи g(x) — max, x Е R очевидно: x* = 1 — t. При этом g(x*) = 0. Следовательно, выполняется неравенство

Hu(p(t,u,x(t,v)),x(t,v)) < 0, t Е T, v Е V,

т. е. управление и(Ь) = —1 является сильно х-экстремальным. Отметим, что в данном примере функция

H^(x,t) = H(tp(t,u),x,u(t),t) = i(l ~t2) + ^x2

является строго выпуклой по ж, т. е. достаточное условие теоремы 1 не работает.

В заключение укажем вторую формулу приращения функционала (симметричный вариант) [7]

АуФ(и) = — ! Аф)И{р(Ь,у,х(Ь,и)),х(Ь,и),и(Ь),1)й1. т

Здесь вспомогательная вектор-функция

p(t, v, x(t, u)) = ф(t, v) + Ф(t, v)(x(t, u) — x(t, v))

удовлетворяет обобщенной сопряженной системе, не зависящей от траектории x(t,v)

p = —Hx(p,x(t,u),v,t) — Ф^, v)Av(t) f (x(t,u),u(t),t), p(ti) = —<px(x(ti,u)).

Таким образом, свойство оптимальности в задаче (Q) обеспечивает сильно р-экстремальное управление в смысле следующего условия

u(t) = arg maxH(p(t,v,x(t,u)),x(t,u),w,t), t E T, v E V.

w£U

Пример 2.

1

Ф(u) = ж2(1) + ж(1) - Jx(t)dt ->• min,

0

x = u, x(0) = 1, \u(t)\ <1, t E T = [0,1].

В данном случае H(ф, x, u) = фu + x, максимизирующее управление u*(ф) = sign ф, сопряжённые уравнения

ф = —1, ф(1) = x(1) — 1, Ф = 0, Ф(1) = 1 ^ Ф(t) = 1.

Рассмотрим управление u(t) = 1, t E T с траекториями

x(t, u) = t + 1, ф(t, u) = 2 — t.

Оно является экстремальным: ф(t, u) > 0.

Проверим свойство сильной р-экстремальности:

u(t) = signp(t,v,x(t,u)), t Е [0,1], \v(t)\ < 1. Соответствующее уравнение имеет вид

p = —v, p(1) = x(1,u) — 1 = 1.

Следовательно,

1

p(t,v,x(t,u)) = 1 + Jv(t)dr > t, t Е [0,1], \v(t)\ < 1. t

Таким образом, условие сильной р-экстремальности выполняется: p(t,v,x(t,u)) > 0, t Е (0,1], \v(t)\ < 1, и управление u(t) = 1 является оптимальным.

6. Задача управления линейной по состоянию системой

Рассмотрим задачу (Р) относительно линейной по фазовому состоянию системы

х = А(и, г)х + Ь(и, г), х(г0) = х0

с общим функционалом Ф(и) и множеством допустимых управлений V.

Для управления и € V с траекториями х(г,и), ф(г,и), г € Т определим матричную функцию Ф(г,и) как решение матричной системы

ф = —А(и(г),г)тф - ФА(и(г),г) — ыхх(ф(г,и),х(г,и),и(г),г), = -<рхх(х(г1,и)).

Возьмём за основу формулу приращения второго порядка аппроксимации [7]

Ау Ф(и) = — ! Аф)И (р(г, и, х(г, у)),х(г, у),и(г),г)йг + п(и, у). т

Здесь

р(г, и, х) = ф(г, и) + Ф(г, и)(х — х(г, и)),

п(и,у) = в^ЦАх^Ц2) — !0Н(\\Ах(г)\\2)йг, Ах(г) = х(г,у) — х(г,и).

т

Остаточные величины в^, вн имеют следующий смысл (остатки квадратичных аппроксимаций):

^(х(и, и) + Ах(Ь)) — ^(х(и, и)) = {<^х(х(и,у)), Ах(и)} +

(Ax(ti), <pxx(x(ti,u))Ax(ti)) + 0^,(11 Aa;(ii)||2),

H (ф(t,u),x(t,u) + Ax(t),u(t),t) — H (ф(t,u),x(t,u),u(t),t) =

= (Hx[t,u],Ax(t)) + ^ (Ax(t), Hxx[t,u]Ax(t)) + oH(\\Ax(t)\\2).

Сильно экстремальное управление u(t) определяется соотношением (5.3). Достаточное условие его оптимальности описывается неравенством для остаточного члена n(u, v) > 0, v Е V, которое связано со свойством терминальной функции ^>(x) и функции Понтрягина H(ф(t,u),x, u(t),t) на уровне третьих производных по x. Пример 3.

$(u) = x3(1) ^ min, x = u, x(0) = 1, \u(t)\ <1, t Е T = [0,1]. Рассмотрим управление u(t) = —1. Ему соответствуют траектории

x(t, u) = 1 — t, ф(t, u) = 0, t, u) = 0, t Е T.

Следовательно, p(t, u, x(t, v)) = 0, т. е. управление u(t) является сильно экстремальным. Проверим условие оптимальности. В данном случае функция H не зависит от x, поэтому

n(u,v) = ov(\Ax(tl)\2) = (Ax(t!)f.

Остаётся заметить, что

Ax(t\) = x(t\,v) — x(t\,u) > 0, v Е V.

Таким образом, n(u,v) > 0, и управление u(t) = —1 является оптимальным.

Список литературы

1. Антипина Н. В. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума / Н. В. Антипина, В. А. Дых-та // Известия вузов. Математика. — 2002. — №12. — С. 11-22.

2. Габасов Р. Принцип максимума в теории оптимального управления / Р. Габа-сов, Ф. М. Кириллова. — М. : Книжный дом «Либроком», 2011. — 272 с.

3. Кларк Ф. Оптимизация и негладкий анализ / Ф. Кларк. — М. : Наука, 1988. — 280 с.

4. Кротов В. Ф. Методы и задачи оптимального управления / В. Ф. Кротов, В. И. Гурман. — М. : Наука, 1973. — 446 с.

5. Никольский М. С. О достаточности принципа максимума Понтрягина в некоторых оптимизационных задачах / М. С. Никольский // Вестник Моск. ун-та. Сер. 15. Вычислит. матем. и киберн. — 2005. — №1. — С. 35-43.

6. Понтрягин Л. С. Математическая теория оптимальных процессов / Л.С. Понт-рягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. — М. : Физматлит, 1961. — 388 с.

7. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. — М. : Физматлит, 2000. — 160 с.

8. Срочко В. А., Ахмеджанова Н. С. Исследование и решение одного класса билинейных задач оптимального управления / В. А. Срочко, Н. С. Ахмеджанова // Вестник Бурят. ун-та. Сер. 13. Математика и информатика. — 2005. — Вып. 2. — С. 143-148.

9. Хайлов Е. Н. Об экстремальных управлениях однородной билинейной системы, управляемой в положительном октанте / Е. Н. Хайлов // Труды МИАН. — 1998. — Т. 220. — С. 217-235.

10. Mangasarian O. L. Sufficient conditions for the optimal control of nonlinear systems / O. L. Mangasarian // SIAM J. Control Optim. — 1966. — №4. — P. 139-152.

11. Swierniak A. Cell cycle as an object of control / A. Swierniak // Journal of Biological Systems. — 1995. — Vol. 3. — №1. — P. 41-54.

Срочко Владимир Андреевич, доктор физико-математических наук, заведующий кафедрой, профессор, Институт математики,эконо-мики и информатики, Иркутский государственный университет, 664003, Иркутск, ул. К. Маркса, 1, тел.: (3952) 521276 (e-mail: [email protected])

Антоник Владимир Георгиевич, кандидат физико-математических наук, доцент, Институт математики,экономики и информатики, Иркутский государственный университет, 664003, Иркутск, ул. К. Маркса, 1, тел.: (3952) 521276 (e-mail: [email protected])

Аксенюшкина Елена Владимировна, кандидат физико-математических наук, доцент, Байкальский государственный университет экономики и права, 664015, Иркутск, ул. Ленина, 11, тел.: (3952) 284555 (e-mail: [email protected])

V. A. Srochko, V. G. Antonik, E. V. Aksenyushkina Sufficient optimality conditions based on functional increment formulas in control problems

Abstract. A typical optimal control problem with convex terminal function is considered. Sufficient optimality conditions are obtained with the help non-standard functional increment formulas. So far, these formulas didn't apply to construction of numerical methods for successive improvement of auxiliary controls. A notion of strongly extremal control is introduced for each formula. It provides the maximum for Pontryagin's function in regard to some set of trajectories. Strongly extremal controls are optimal ones in linear and quadratic problems. In common case optimality of strongly extremal controls is provided with concavity condition of Pontryagin's function with regard phase variables. Examples of effective realization obtained relations are given.

Keywords: optimal control problem; the maximum principle; sufficient optimality conditions.

References

1. Antipina N. V., Dychta V. A. Linear funtions of Lyapunov-Krotov and sufficient optimality conditions in the form of maximum principle(in Russian). Izvestia vuzov. Matematika, 2002, №. 12, pp. 11-22.

2. Gabasov R., Kirillova F. M. The maximum principle in optimal control theory (in Russian), Moscow, Librokom, 2011, 272 p.

3. Clark F. Optimization an non-smooth analysis (in Russian), Moscow, Nauka, 1988, 280 p.

4. Krotov V. F., Gurman V. I. Methods and problems of optimal control (in Russian), Moscow, Nauka, 1988, 446 p.

5. Nikolsky M. S. On sufficiency of Pontryagin's maximum principle in some optimization problems (in Russian), Vestnik Moskovskogo universiteta. Seria 15, 2005, №1, pp. 35-43.

6. Pontryagin L. S., Boltiansky V. G., Gamkrelidze R. V., Mischenko E. F. Mathematical theory of optimal proccesses (in Russian), Moscos, Fizmatlit, 1961, 388 p.

7. Srochko V. A. Iteration methods for solving of optimal control problems (in Russian), Moscos, Fizmatlit, 2000, 160 p.

8. Srochko V. A., Ahmedzhanova N. S. Analysis and solution of one bilinear optimal control problem (in Russian), Vestnik Buriatskogo universiteta. Seria 13, 2005, issue 2, pp. 143-148.

9. Khailov E. N. On extremal controls in homogeneous bilinear system (in Russian), Trudy MIAN, 1998, vol. 220, pp. 217-235.

10. Mangasarian O. L. Sufficient conditions for the optimal control of nonlinear systems, SIAM J. Control Optim., 1966, №4, pp. 139-152.

11. Swierniak A. Cell cycle as an object of control, Journal of Biological Systems, 1995, vol. 3, №1, pp. 41-54.

Srochko Vladimir Andreevich, Doctor of Sciences (Physics and Mathematics), chairman, professor, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003, tel.: (3952) 521276 (e-mail: [email protected])

Antonik Vladimir Georgievich, Candidate of Sciences (Physics and Mathematics), associate professor, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003, tel.: (3952) 521276 (e-mail: [email protected])

Aksenyushkina Elena Vladimirovna, Candidate of Sciences (Physics and Mathematics), associate professor, Baikal State University of Economics and Law, 11, Lenin St., Irkutsk, 664015, tel.: (3952) 284555 (e-mail: [email protected])

Достаточные условия оптимальности в задачах управления на основе формул приращения функционала Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Срочко Владимир Андреевич, Антоник Владимир Георгиевич, Аксенюшкина Елена Владимировна

Похожие темы научных работ по математике , автор научной работы — Срочко Владимир Андреевич, Антоник Владимир Георгиевич, Аксенюшкина Елена Владимировна

Sufficient Optimality Conditions Based on Functional Increment Formulas in Control Problems

Текст научной работы на тему «Достаточные условия оптимальности в задачах управления на основе формул приращения функционала»