УСЛОВИЯ И МЕТОДЫ УЛУЧШЕНИЯ УПРАВЛЕНИЯ В КВАДРАТИЧНЫХ СИСТЕМАХ С ОГРАНИЧЕНИЯМИ

Трунин Дмитрий Олегович

Научная статья УДК 517.977

DOI: 10.18101/2304-5728-2021-3-28-38

УСЛОВИЯ И МЕТОДЫ УЛУЧШЕНИЯ УПРАВЛЕНИЯ В КВАДРАТИЧНЫХ СИСТЕМАХ С ОГРАНИЧЕНИЯМИ

кандидат физико-математических наук, доцент, Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а [email protected]

Аннотация. Рассмотрен новый подход к нелокальному улучшению допустимых управлений в классе квадратичных по состоянию и линейных по управлению задач оптимального управления с терминальными ограничениями. Рассматриваемый подход позволяет избежать трудоемкой операции параметрического изменения для улучшения управления, что в конечном итоге приводит к повышению эффективности разработанных процедур оптимизации. Нелокальность улучшения управления достигается путем решения специальной системы функциональных уравнений, эквивалентной краевой задаче улучшения, для решения которой предлагается итерационный алгоритм с выполнением всех терминальных ограничений на каждой итерации. На каждой итерации предлагаемого итерационного алгоритма решаются обычные задачи Коши, в отличие от методов, требующих решения специальных задач Коши с разрывной правой частью по переменным состояния, что существенно упрощает реализацию предлагаемой процедуры. Кроме того, начальное приближение итерационного процесса может не быть допустимым управлением. В рамках предлагаемого подхода построены новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. В работе приведены соответствующие иллюстрирующие примеры.

Ключевые слова: квадратичная управляемая система; терминальные ограничения; задача улучшения управления; функциональные уравнения; условия оптимальности; итерационный алгоритм.

Благодарности. Работа выполнена при финансовой поддержке РФФИ, проект 18-41-030005, и Бурятского госуниверситета, проект 2021 г.

Для цитирования

Трунин Д. О. Условия и методы улучшения управления в квадратичных системах с ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2021. № 3. С. 28-38.

Введение

В работах [1; 2] предложены методы нелокального улучшения управ -лений в классе линейных и полиномиальных по состоянию задач оптимального управления со свободным правым концом. Эти методы не содержат трудоемкую операцию изменения управления в малой окрестности текущего приближения. Указанные особенности методов являются существенными факторами для повышения эффективности решения задач рассматриваемого класса.

В статьях [3; 4] методы нелокального улучшения [1; 2] обобщаются для соответствующего класса задач оптимального управления с терминальными ограничениями. Для улучшения допустимого управления с сохранением всех терминальных ограничений требуется решить специальную краевую задачу. Для решения указанной краевой задачи применяется известный в математике подход возмущений.

В данной статье условие нелокального улучшения интерпретируется как специальная система функциональных уравнений, эквивалентная краевой задаче улучшения. Структура данной системы позволяет применить к ее решению известный в вычислительной математике [6] аппарат теории и методов неподвижных точек.

1 Задача улучшения управления

Рассматривается задача оптимального управления

х = A(x,t)u + b(x,t), t eT = [t0, t1 ], (1)

x(t0) = x0, u(t) e U, (2)

F(u) = {c,x(t1)) + J[(F1 (x,t),u) + F2(x,t)® min, (3)

*0

*10i) = x/. (4)

Здесь функции A(x,t), b(x,t), F1(x,t) и F2(x,t) квадратичны по x и непрерывны по t на множестве Rn х T ; c e Rn — заданный вектор, причем c1 = 0 ; U с Rr — выпуклое компактное множество; интервал времени T и конечное состояние x11 заданы.

В задаче (1)-(4) определим множество доступных управлений

V = {u e PCr (T): u (t) eU, t e T }.

Для доступного управления v eV обозначим x(t, v), t eT — решение задачи Коши (1), (2) при u = v(t), t eT .

Определим множество допустимых управлений

W = {u eV: x1(t1, u) = x11}.

Введем в рассмотрение функцию Понтрягина с сопряженной переменной p e Rn

Н (р, х, и, г) = Н о (р, х, г) + (Н (р, х, г), и), где Но(р,х,г) = (р, Ъ(х,0)-^(х,г), Н1(р,х,г) = А(х,г)Т р-^(х,г).

Рассмотрим регулярный функционал Лагранжа:

Ь(и,Л) = Ф(и) + Л(х1(г1) - х11), Ле Я.

Пусть (и0,V) — доступные управления. Введем в рассмотрение модифицированную сопряженную систему

р = -Нх (р, х(г, и0), и °(0, 0 - 2 Нхх (р, х(г, и0), и 0(0, г) (х(г, V) - х(г, и0)), (5)

А(0 = -Л, (6)

р, (О = -с,, , = 2,п. (7)

Обозначим через р(г,и0,v,Л), г еТ — решение модифицированной сопряженной системы (5)-(7).

Имеет место следующая точная формула приращения функционала Лагранжа [2]

А^(и0,Л) = -{Т(Н1(р(г,и0, V, Л), х(г, V), г), v(t) - и°(0)Л.

Для доступного управления и0 е V и фиксированного параметра проектирования а > 0 образуем вектор-функцию

иа(р,х,г) = Ри (и°(0 +аН1(р,х,0), р е Яп, х е Яп, а> 0, где Ри — оператор проектирования на множество и в евклидовой норме.

Поставим задачу улучшения для управления и0 еW: найти управление V еW со свойством

Ф^) <Ф(и0) (Д„Ф(и0) < 0).

Показано [5], что для нелокального улучшения управления и0 е W можно решить специальную краевую задачу х = А( х, г)иа( р, х,г) + Ъ(х, г), г е Т,

р = -Нх (р, х(г, и0), и °(0, г) -1На (р, х (г, и0), и 0(г), г)( х - х(г, и0)),

2 (8)

х(г0) = х , х1 ) = х1 ,

р, ( ) = -с,, = 2, п.

Пусть пара (х(г),р(г)), г еТ — решение краевой задачи (8). Сформируем выходное управление

V(t) = иа(р(г),х(0,г), г еТ.

Имеет место оценка улучшения

AvФ(u0)< — П^)-и°(0||2Л . (9)

аТ" 11

Из оценки (9) следует, что, если управление V отличается от управления и0, то обеспечивается строгое улучшение целевого функционала.

На основе оценки (9) в [5] также показано, что неединственность решения краевой задачи улучшения (5) позволяет строго улучшить допустимое управление, удовлетворяющее регулярному принципу максимума. При этом принцип максимума можно сформулировать следующим образом.

Теорема 1. Пусть управление и0 еЖ является оптимальным в регулярной задаче (1)-(4). Тогда и0 еЖ является выходным управлением краевой задачи (5) для некоторого а > 0 .

Указанная оценка (9) позволяет сформулировать усиленное необходимое условие оптимальности в регулярной задаче (1)-(4).

Теорема 2. Пусть управление и0 еЖ является оптимальным в регулярной задаче (1)-(4). Тогда для всех а > 0 управление u0 еЖ является единственным выходным управлением краевой задачи (5).

Действительно, в случае существования при некотором а > 0 выходного управления v Ф u в силу оценки получаем строгое улучшение ЛvФ^0) < 0, что противоречит оптимальности управления u0 еЖ .

Предлагаемые в настоящей работе нелокальные методы оптимизации основываются на следующем утверждении.

Теорема 3. Краевая задача (8) эквивалентна специальной системе функциональных уравнений с некоторым 1 е R :

v(t) = ua(p(t,uа > 0, t еT,

X(tl, v) =

Действительно, пусть пара (x(t),p(t)), t еT — решение краевой задачи (8). Построим выходное управление

v(t) = ua(p^),x(t),t), t еT .

Тогда

x(t) = x(t,v), p(t) = p(t,u0,v,1), t е T

при 1 = -Pl(tl) .

Следовательно, управление v(t), t еT удовлетворяет системе уравнений (10) с указанным 1 е R .

Обратно, пусть управление v(t), t еT — решение системы (10) при

некотором 1е R . Тогда пара (x(t, v), p(t,u0, v,1)), t еT, очевидно, удовлетворяет краевой задаче (8).

Система уравнений (10) рассматривается как задача о неподвижной точке в пространстве управлений с дополнительным уравнением. Это позволяет применить к ее решению аппарат теории и методов неподвижных точек [6].

2 Итерационные методы

Для решения системы (10) модифицируется известный алгоритм метода простой итерации [6] в следующей неявной форме при к > 0 :

/+1(0 = ^(р^УУЛ^М^Ш tет, Х(^, ук+1) = х1.

В качестве начального приближения итерационного процесса (11) выбирается управление V0 е V.

Для реализации предлагаемого неявного итерационного процесса на каждой итерации рассматривается вспомогательная краевая задача:

хк+1 = Л(хк+1,t)ua(pk+1,хк+1,t) + Ь(хк+1,t), t е Т = [^, t1 ],

хк+ЧО = х0, Xlk+1(t1 ) = х1, (12)

р к+1 =- Их (рк+1, х (t, u0), u 0(t), t) -

- | И 1 (рк+1, х u0), u), t )(x(t, vk) - х^, u0)),

pIk+1(tl) = -с,, I = 2п. К решению задачи (12) применяется следующий подход. Положим р1 (^) = -Л, где Л е R — неизвестный параметр (множитель

Лагранжа), подлежащий определению. Обозначим через рЛ^), t е Т решение задачи Коши:

р = -Их(р,х^,u0),u),t) -

1 (13)

- 12 И 1 (р, ха, u0), u 0(t), t)(x(t, vk) - х^, u0)),

р1 (tl) = -Л, р, (tl) = -ег, I = 2,п. Пусть хЛ(:), t е Т решение специальной задачи Коши:

х = Л(х,tрЛ(t),х,t) + Ь(х,t), t еТ, x(t0) = х0. Тогда решение задачи (12) сводится к решению уравнения относительно параметра Л:

хЧо = х1. (14)

Пусть (хк+1(t),рк+1(t)), t еТ — решение вспомогательной краевой задачи (12) с параметром Лк, удовлетворяющим уравнению (14). Тогда

рк) = р^, vk ,Лк),

где Лк =-Plk+1(tl).

Следующее приближение управления сформируем по правилу: vk+1 ^) = ^(рк+1 (t),хк+1 (0,t), t еТ. Понятно, что хк+1 ^) = х(t,ук+1), t еТ.

Таким образом, реализация неявного процесса (11) на каждой итерации сводится к решению уравнения (14).

Другая модификация алгоритма метода простой итерации для решения системы (10) имеет более привычную стандартную явную форму при к > 0 :

/+1(0 = иа(р(г,и°У,Лк),х(гУ)Л геТ,

х (¿1, V+1) = х}.

В качестве начального приближения итерационного процесса (15) выбирается управление V0 е V.

Для реализации предлагаемого явного итерационного процесса (15) предлагается подход, аналогичный указанному выше.

Положим р1 (г1) = -Л, где Л е Я — неизвестный параметр (множитель

Лагранжа), подлежащий определению. Обозначим рЛ(г), г е Т решение задачи Коши:

р = - Нх (р, х(г, и0), и 0(г), г) -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 (16)

- ^ Н» (р, х(г, и0), и 0(г), г)(х(г, vk) - х(г, и0)),

р1 (^) = -Л, р, (^) = -с,, , = 2,п.

Сформируем управление

vЛ(t) = иа(рЛ(г),х(г,vk),г), г еТ.

Для полученного управления находится решение х(г, vЛ), г е Т обычной задачи Коши

х = А( х, ^(г) + Ъ( х, г), г еТ, х(г0) = х0.

Множитель Лагранжа Л е Я на каждой итерации процесса (15) выбирается из условия выполнения терминального ограничения:

хД^, V1) = х1. (17)

Пусть Лк — решение уравнения (17). Сформируем выходное управление

vk+1(г) = vлk (г), г е Т.

Отметим, что в процессах (11), (15) предполагается возможность выполнения терминального ограничения на каждой итерации процесса последовательных приближений управления. Начальное приближение итерационных процессов может не удовлетворять терминальному ограничению, что является важным для практической реализации алгоритмов.

Сходимость итерационных процессов можно обосновать с помощью принципа возмущений аналогично [2].

Итерационные процессы (11), (15) применяются до первого улучшения управления и0. Далее для полученного управления строится новая задача улучшения. Критерием остановки итераций улучшения управления является отсутствие улучшения управления по целевому функционалу.

Таким образом, формируются итерационные методы построения релаксационных последовательностей допустимых управлений, т. е. удовлетворяющих терминальному ограничению.

3 Примеры

Пример 1.

x = u, t e T = [0, 1], \u(t)| < 1, t e T,

x(0) = 0,

1

F(u) = —Jx2dt ® min,

0

x(1) = 0.

Рассмотрим u0(t) ° 0, t e T . При этом x(t,u0) ° 0, t e T, F(u0) = 0. В данном случае имеем

H = pu + x2, H0 = x2, H1 = p. Положим a = 1. Тогда отображение ua принимает вид

1, P > 1, ua(P) = |-1, P<-1,

p, -1 < p < 1. Краевая задача улучшения (8) имеет вид

x = ua(p), p = -x, t eT, x(0) = x(1) = 0.

Нетрудно видеть, что пара p(t) = 0, x(t) = x(t,u ) = 0, t e T является

решением краевой задачи, т. е. допустимое управление u0 удовлетворяет регулярному принципу максимума с 1 = 0.

В качестве начального приближения итерационного процесса (15) рассмотрим управление v0( t) 1, t e T , которому соответствует фазовая траектория x(t,v0) = — t, t e T .

Модифицированная сопряженная система имеет вид

p = t, p(1) = — 1. Решением этой системы является функция

t2 1

pa(t) =--1 —, t eT .

2 2

Предположим |pa(t)| < 1, t e T . Тогда соответствующая задача Коши для фазовой системы принимает вид

t2 „ 1

которая имеет решение

x =--1 —, x(0) = 0,

2 2

xÄ(t) = 6 — + 2 11, t e T .

Условие

х1 (1) = 0,

эквивалентное условию

I-1-1 = о,

6 2

определяет значение множителя Лагранжа При этом получаем

я=-1.

3

р1«) = £ -1, t еТ 2 6

(условие \р1(t) £ 1, t е Т выполняется).

Отсюда получаем соответствующее выходное управление

у^) =

и значение целевого функционала

е 1 у(о = 2 -t еТ

Ф(у) = - —. 945

Таким образом, имеет место строгое улучшение исходного допустимо-

я

Ф(у)< Ф(и0).

го управления и0, удовлетворяющего регулярному принципу максимума:

Пример 2.

х = и, t е Т = [0, 2], х(0) = 0, \и^)| £ 2, t е Т,

2

1 Г

Ф(и) = — I х~М ® Ш1П, 9

20 х(2) = 2.

4

Рассмотрим и0(t) ° 1, t е Т . Тогда х^,и0) = t, t е Т, Ф(и0) = —. Имеем

Н = ри -1 х2, Н0 =-1 х2, Н1 = р.

Положим а = 1. Тогда отображение иа принимает вид

'2, р > 2, иа(р) = <|-2, р < -2,

ар, - 2 £ р £ 2.

В качестве начального приближения итерационного процесса (15) рассмотрим управление у0^) ° 0, t е Т . Тогда х^,у0) ° 0, t е Т . Модифицированная сопряженная система имеет вид

Ее решение

р = 2, р(2) = -1

12

р1^) = -1-1, t еТ .

Предположим |p1(t) £ 2, t е Т . Тогда соответствующая задача Коши для фазовой системы примет вид

t2

х =--1-1, х(0) = 0 .

4

Эта задача имеет решение

(3

хл(0 ~-(1 +1)t, t еТ .

Условие

х1 (2) = 2,

эквивалентное условию

2

3 - 2 (1 +1) = 2, определяет значение множителя Лагранжа

При этом имеем

я=-5.

3

р^) = £ + t еТ

(условие ¡р1^) £ 2, t е Т выполняется).

Отсюда получаем соответствующее выходное управление

у^) =

и значение целевого функционала

е 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у(t) = - + 2, t е Т 4 3

956

Ф(у) =-.

945

Таким образом, выполняется строгое улучшение исходного допусти -

Ф(у)< Ф(и0).

мого управления и0:

Заключение

В работе для рассматриваемого класса задач с ограничениями для регулярного случая получены следующие результаты.

1. Получены необходимые условия оптимальности управления в терминах специальной краевой задачи.

2. Построено новое условие нелокального улучшения допустимого управления в форме задачи о неподвижной точке, эквивалентное специальной краевой задаче.

3. Сконструированы нелокальные методы оптимизации в рассматриваемом классе задач.

Предлагаемые методы характеризуются следующими свойствами:

1) отсутствие процедуры варьирования управления в малой окрестности улучшаемого управления;

2) выполнение свойства допустимости выходного управления на каждой итерации улучшения;

3) возможность строгого улучшения допустимого управления, удовлетворяющего регулярному принципу максимума, в отличие от стандартных градиентных методов;

4) решение на каждой итерации предлагаемых итерационных процессов задач Коши с непрерывной правой частью, в отличие от методов, требующих решения специальных задач Коши с разрывной по переменным состояния правой частью.

Литература

1. Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.

2. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с. Текст: непосредственный.

3. Трунин Д. О. Об одном подходе к нелокальному улучшению управлений в квадратичных по состоянию системах с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2017. № 2. С. 40-45. Текст: непосредственный.

4. Трунин Д. О. Об одной процедуре нелокального улучшения управлений в квадратичных по состоянию системах с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2018. № 2. С. 42-49. Текст: непосредственный.

5. Трунин Д. О. Проекционная процедура нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с терминальными ограничениями // Вестник Бурятского государственного университета. 2009. Вып. 9. С. 52-57. Текст: непосредственный.

6. Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.

Статья поступила в редакцию 15.09.2021; одобрена после рецензирования 15.10.2021; принята к публикации 29.10.2021.

CONDITIONS AND METHODS FOR IMPROVING CONTROL

IN QUADRATIC SYSTEMS WITH CONSTRAINTS

Dmitry O. Trunin

Cand. Sci. (Phys. and Math.), A/Prof.,

Dorzhi Banzarov Buryat State University

24a Smolina St., Ulan-Ude 670000, Russia

[email protected]

Abstract. A new approach to the nonlocal improvement of admissible controls in the class of quadratic in state and linear in control optimal control problems with terminal constraints is considered. The approach under consideration allows avoiding the time-consuming operation of parametric changes to improve control, which ultimately leads to an increase in the efficiency of the developed optimization procedures. The nonlocality of control improvement is achieved by solving a special system of functional equations equivalent to the boundary value improvement problem, for the solution of which an iterative algorithm is proposed with the fulfillment of all terminal constraints at each iteration. At each iteration of the proposed iterative algorithm, the usual Cauchy problems are solved, in contrast to the methods requiring the solution of special Cauchy problems (with the right-hand side discontinuous in state variables), which significantly simplifies the implementation of the proposed procedure. In addition, the initial guess of the iterative process may not be an admissible control. Within the framework of the proposed approach, new necessary conditions for optimality are constructed that strengthen the maximum principle in the class of problems under consideration. The work contains the corresponding illustrative examples.

Keywords: quadratic control system; terminal constraints; control improvement problem; functional equations; optimality conditions; iterative algorithm.

For citation

Trunin D. O. Conditions and Methods for Improving Control in Quadratic Systems With Constraints // Bulletin of Buryat State University. Mathematics, Informatics. 2021. N. 3. Pp. 28-38.

The article was submitted 15.09.2021; approved after reviewing 15.10.2021; accepted for publication 29.10.2021.

УСЛОВИЯ И МЕТОДЫ УЛУЧШЕНИЯ УПРАВЛЕНИЯ В КВАДРАТИЧНЫХ СИСТЕМАХ С ОГРАНИЧЕНИЯМИ Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович

CONDITIONS AND METHODS FOR IMPROVING CONTROL IN QUADRATIC SYSTEMS WITH CONSTRAINTS

Текст научной работы на тему «УСЛОВИЯ И МЕТОДЫ УЛУЧШЕНИЯ УПРАВЛЕНИЯ В КВАДРАТИЧНЫХ СИСТЕМАХ С ОГРАНИЧЕНИЯМИ»