Научная статья на тему 'ОДИН ПОДХОД К УЛУЧШЕНИЮ УПРАВЛЕНИЯВ СИСТЕМАХ С ОГРАНИЧЕНИЯМИНА ОСНОВЕ КРАЕВОЙ ЗАДАЧИ'

ОДИН ПОДХОД К УЛУЧШЕНИЮ УПРАВЛЕНИЯВ СИСТЕМАХ С ОГРАНИЧЕНИЯМИНА ОСНОВЕ КРАЕВОЙ ЗАДАЧИ Текст научной статьи по специальности «Математика»

CC BY
18
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
динамическая управляемая система / терминальное ограни-чение / улучшение допустимого управления / краевая задача / итерационный метод / dynamic controlled system / terminal constraint / admissible control im-provement / boundary value problem / iterative method

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович

Рассмотрены нелинейные по состоянию задачи оптимальногоуправления при наличии дополнительного ограничения на фазовую траекториютерминального типа. Для рассмотренных задач предложен новый подход к улуч-шению допустимых управлений на основе точной формулы приращения функ-ционала Лагранжа с помощью решения специальной краевой задачи, котораяявляется существенно более простой, чем краевая задача принципа максимума.Для ее решения предлагается специальный итерационный процесс на основе по-следовательного решения задач Коши и определения вспомогательного множи-теля из условия выполнения функционального ограничения. В отличие от боль-шинства стандартных численных методов задач оптимального управления(игольчатой линеаризации, условного градиента) предлагаемый подход не ис-пользует операцию изменения по малому параметру в окрестности текущегоприближения. Кроме того, он обладает возможностью строгого улучшения неоп-тимальных экстремальных управлений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ONE APPROACH TO IMPROVING CONTROL IN SYSTEMS WITHCONSTRAINTS BASED ON A BOUNDARY VALUE PROBLEM

State-nonlinear optimal control problems are considered in the presenceof an additional constraint on the phase trajectory of terminal type. For the consideredproblems, a new approach to improving admissible controls is proposed based on theexact formula for the increment of the Lagrange functional by solving a special bound-ary value problem, which is significantly simpler than the boundary value problem ofthe maximum principle. To solve it, a special iterative process is proposed based on thesequential solution of Cauchy problems and the determination of an auxiliary factorfrom the condition of fulfilling the functional constraint. Unlike most standard numeri-cal methods for optimal control problems (needle linearization, conditional gradient),the proposed approach does not use the operation of changing a small parameter in thevicinity of the current approximation. In addition, it has the ability to strictly improvenon-optimal extremal controls.

Текст научной работы на тему «ОДИН ПОДХОД К УЛУЧШЕНИЮ УПРАВЛЕНИЯВ СИСТЕМАХ С ОГРАНИЧЕНИЯМИНА ОСНОВЕ КРАЕВОЙ ЗАДАЧИ»

УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ

Научная статья УДК 517.977

Б01: 10.18101/2304-5728-2023-3-70-77

ОДИН ПОДХОД К УЛУЧШЕНИЮ УПРАВЛЕНИЯ В СИСТЕМАХ С ОГРАНИЧЕНИЯМИ НА ОСНОВЕ КРАЕВОЙ ЗАДАЧИ

© Трунин Дмитрий Олегович

кандидат физико-математических наук, доцент, Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а [email protected]

Аннотация. Рассмотрены нелинейные по состоянию задачи оптимального управления при наличии дополнительного ограничения на фазовую траекторию терминального типа. Для рассмотренных задач предложен новый подход к улучшению допустимых управлений на основе точной формулы приращения функционала Лагранжа с помощью решения специальной краевой задачи, которая является существенно более простой, чем краевая задача принципа максимума. Для ее решения предлагается специальный итерационный процесс на основе последовательного решения задач Коши и определения вспомогательного множи -теля из условия выполнения функционального ограничения. В отличие от большинства стандартных численных методов задач оптимального управления (игольчатой линеаризации, условного градиента) предлагаемый подход не использует операцию изменения по малому параметру в окрестности текущего приближения. Кроме того, он обладает возможностью строгого улучшения неоптимальных экстремальных управлений.

Ключевые слова: динамическая управляемая система, терминальное ограничение, улучшение допустимого управления, краевая задача, итерационный метод.

Для цитирования

Трунин Д. О. Один подход к улучшению управления в системах с ограничениями на основе краевой задачи // Вестник Бурятского государственного университета. Математика, информатика. 2023. № 3. С. 70-77.

Введение

В работах [1-4] построены специальные методы улучшения допустимых управлений для задач оптимального управления со свободным правым концом (как линейных, так и нелинейных по фазовому состоянию) на основе точных формул приращения функционала с использованием модификации сопряженной системы.

В работе [5] предложены процедуры улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления при

наличии дополнительных ограничений на фазовую траекторию терминального типа на основе специальной задачи о неподвижной точке.

В данной статье для нелокального улучшения допустимых управлений для задач с ограничениями предлагается подход, основанный на решении специальной краевой задачи.

1 Постановка задачи

Рассматривается задача оптимального управления

х = A(x,t)u + Ь(х,0, t е T = ^ ], х(^) = х', u (О еи с Rr, t еТ, (1) Ф0(и) = р(х(^)) +1 ((Л(х,0,и) + g(х,t))Л ® шш, (2) ФДи) = Х( x(tl) ) = 0. (3)

Используются стандартные обозначения x(t) е Rn — состояние, и(0 е Rr — управление, t0, t1 — заданные числа, t0< t1, х' е Rn — заданный вектор; и с Rr — выпуклый компакт в Яг . Определим множество (доступные управления)

V = {и е РСГ (Т): и ^) еи, t е Т }.

Для управления V еV обозначим через x(t, V), t еТ соответствующую ему фазовую траекторию.

Множество допустимых управлений

Ж = {и еV: с(х(^,и)) = 0}. Функция Понтрягина имеет вид

И(р, х,и,t) = Н0(р,х, t) + (Я1 (р,х, t),и),

где

Н0 (р, х, t) = (р,Ь(х, t)) - g(х, t), Н1 (р, х, t) = А(х, t)Т р - Л(х, t). Функционал Лагранжа

Ь(и,1) = Ф0(и) + 1Ф1(м), 1 е R. Нетрудно видеть, что для допустимого управления и

Ь(и,1) = Ф0(и).

Пусть и0 е V , V е V. Формула приращения:

\Ь(и°,1) = -{т(Н1(р^,и0,V, 1),х^,V),t),v(t) - и0(0)Л , (4)

где р(^и0,VI), t е Т — решение модифицированной сопряженной системы [3].

Пусть и0 е Ж. Для этого управления поставим задачу: найти управление V е Ж такое, что

Ф0М <Ф0(и0).

2 Подход улучшения

Для фиксированного параметра а > 0 определим вектор-функцию

иа(р,х,г) = Ри (и °(0 + аИ1(р,х,0), р е Я", х е Л", а> 0, г еТ,

где Ри — оператор проектирования на множество и . Имеет место оценка [1]

Г (Я1(р, х, 0, иа(р, х, г) - и 0(0) Ж > — Г ||иа(р, х, г) - и °(о||2 Ж . (5)

1т \ 'ат" 11

Тогда из (4) и (5) следует оценка приращения функционала

Д„Ь(и0,1) <- — Г ||иа(р, х,г) - и°(о||2 Ж. (6)

ат" 11

На основе формулы приращения (4) для улучшения допустимого управления и0 предлагается следующий подход. Рассмотрим краевую задачу улучшения

х = А(х,г)иа(р,х,г) + Ь(х,г), г е т = [г0, г1 ], х(г0) = х*,

р = -Их (р, х(г, и0), и ), г)- г (г), (ях (р, х(г, и0), и 0(г), г), х(г) - х(г, и+ (г (г), х(г) - х(г, и0)) = = И (р, х(г), и 0(г), г)-И (р, х(г, и0), и 0(г), г),

р(г1) = - (^ и 0)) - ¿Сх (х(г1, и 0) ) - Р {<рх (х(^,и0)) + ЛСх (х(^1,и0)),х(<!) - х(^1,и0)} + (р,х(О - х(^,и0)) =

= р( х(^1))-ч>[ х(^1, и0) ) + 1(с( х(^1) )-с( х(^1, и0))).

С( х(0 ) = 0.

Пусть (1,хд(г), рд(0), г е т — решение задачи (7). Сформируем управление

v(t) = иа(рд(г), хд(0, г), г еТ. Выходное управление V является допустимым и обеспечивает невозрастание функционала Лагранжа

Ь^, 1) < Ь(и0,1) . В силу допустимости управлений и0, V имеем

^ Ф 0(и0) < — ) - и 0(0||2 Ж.

ат11 11

К решению задачи (7) применяется специальный итерационный процесс с индексом к > 0

хк+1 (г) = А(хк+1 (г),г)иа(рк+1 (г),хк+1 (г),г) + Ь(хк+1 (г),г), г еТ = [г0, г,],

х(г0) = х ,

рк+1 (г) = - Их (рк+1 (г), х(г, и0), и 0(г), г)-г (г), 72

(Их (рк^),х^,и0),и),t),хк(t) -x(t,и°)) + (г^),хк(t) -х^,и°)) = = И ( рк ^), х (t), и V), t)-И (рк ^), х^, и0), и 0(t), t),

(8)

р (0 = -Рх (x(tl, и 0))- ¿Хх (x(tl, и 0))- я рх (х^1,и0)) +1Хх (x(tl,и0)),хк(tl) - x(tl,и0)) + (я,хк(tl) - x(tl,и0)) = = р( хк (О )-р( x(tl, и0) ) + 1(х( хк (tl) )-х( x(tl, и0))).

Х( хк+1(tl) ) = 0. Задается начальное приближение (x0(t), р0^)) , t е Т .

На к-й итерации процесса (8) находится решение рк+1(^1), t еТ вспомогательной задачи Коши

рк+1(t) = -Их (рк+1(t),х^,и0),и V),t)-г^),

(Их (рк^),x(t,и0),и0(t),t),хк(t) -х^,и0)) + (г^),хк(t) -х^,и0)) = = И ( рк ^), х ^), и 0(t), t)-И (рк ^), x(t, и0), и 0(t), t),

р(0 = -Рх (x(t1, и 0)) - ^Хх (x(t1, и 0) ) - Я рх (х(^,и0)) +1Хх (x(tl,и0)),хк(tl) - x(tl,и0)) + (я,хк(tl) - x(tl,и0)) =

= р( хк (О )-р( x(tl, и0) ) + а(х( хк (tl) )-х( x(tl, и0))). Затем находится решение хк+1 (t, 1), t еТ специальной задачи Коши

хк+1 (t) = А(хк+1 (t),фа(рк+1 (t, 1),хк+1 (t), t) + Ь(хк+1 (t), t), t е Т, x(t0) = х'.

Значение вспомогательного множителя 1 е R (множитель Лагранжа) определяется из условия

Х( хк+4^, А) ) = 0.

Формируется управление

V(t) = иа(рк,1),хк+1(t, 1),t), t е Т. Условие окончания итерационного процесса (8)

Ф0М <Ф0(и0)

(улучшение управления и0).

В итоге, на основе итерационного процесса (8) формируется метод последовательных улучшений допустимых управлений в исходной задаче

(1)-(3).

3 Примеры

Пример 1.

х = и, t е Т = [0, 2], х(0) = 1, \и(t)| < 1,

2

Ф0(и) = | х2Л ® шт,

0

х(2)=1.

Рассмотрим и0(') ° 0, t е Т, х(t,и0) ° 1, Ф0(и0) = 2. Функция Понтрягина

И = ри - х2, И0 =-х2, И1 = р. Сопряженная система

р = х(',V) + х(',и0), р(2) = -1. Положим а = 1. Тогда отображение и" принимает вид

1, р > 1, и"(р) = |-1, р<-1,

р, -1 < р < 1.

Предположим |р(')| < 1, t е Т.

Тогда краевая задача улучшения (7) принимает вид

х = р, р = х +1, t е Т, х(0) = 1, р(2) = -1. Итерационный процесс (8) принимает вид

х = р, р = хк (t) +1, t е Т, х(0) = 1, р(2) = -1. Для начального приближения возьмем функцию x0(t) ° 0, t е Т . Тогда

' 2

р'(М) ='-(1 + 2), х1(',1) = —-(1 + 2)' +1, ' еТ .

Значение множителя Лагранжа 1 е R определяется условием

х1 (2,1) = 1,

откуда

1 = -1.

Тогда

р!(0 =' -1, ' е Т (условие |рЧ')| < 1, ' е Т выполнено). Выходное управление

v(t) =' -1,

14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Fq(v) = -< Фо(н°) = 2.

Пример 2. Данный пример иллюстрирует строгое улучшение неоптимального экстремального управления.

x = u, t е T = [0, я], x(0) = 0, \u(t)| < 2, t e T,

F0(u) = -j x2dt ® min,

0

Ф1 (u) = x(p) = 0.

Рассмотрим u0(t) ° 0, t e T . При этом x(t,u0) ° 0, t e T, F0(u0) = 0. В данном случае имеем

H = pu + x2, H0 = x2, Hj = p. Положим a = J. Отображение ua

'2, p > 2,

ua( p) = i

Краевая задача

-2, p<-2, p, |p| < 2.

х = иа(р), р = -х - х(г,и0), г е Т, х(0) = х(р) = 0.

Предположим |р(г)| < 2, г е Т. Тогда итерационный процесс (8) принимает вид

х = р, р = -хк(г), г еТ, х(0) = 0 , р(р) = -1. Для начального приближения возьмем функцию х°(г) ° 1, г е Т . Тогда

г 2

р1(г,1) = -г + (р-1), х1(г,1) = — + (р-1)г, геТ.

Значение множителя Лагранжа 1 е Я определяется условием

х1(р,1) = 0,

откуда

1 = Р.

2

Тогда

p\t) = -t + яя, t е T

(условие |р:(0| < 2, ' е Т выполнено).

Таким образом, выходное управление V имеет вид

v(t) = -' + — , ' е Т 2

и строго улучшает исходное

Фo(v) = -1—200 »-2.55 < Фс(и°) = 0.

Заключение

Особенности предлагаемого подхода:

1. Улучшение допустимых управлений без процедуры изменения по малому параметру в окрестности текущего приближения(нелокальность улучшения).

2. Возможность строгого улучшения экстремальных управлений (в частности, особых), удовлетворяющих тем или иным стандартным необходимым условиям оптимальности (принцип максимума, дифференциальный принцип максимума).

Эти особенности обуславливают повышенную эффективность предлагаемого подхода в сравнении со стандартными численными методами оптимального управления (игольчатой линеаризации, условного градиента).

Литература

1. Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с.

2. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.

3. Булдаев А. С., Моржин О. В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. Сер. Математика. 2009. Т. 2, № 1. С. 94-106.

4. Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского государственного университета. Математика, информатика. 2020. № 1. С. 35-53.

5. Трунин Д. О. Условия и методы улучшения управлений в нелинейных системах с ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2022. № 2. С. 50-61.

Статья поступила в редакцию 15.09.2023; одобрена после рецензирования 25.09.2023; принята к публикации 27.09.2023.

ONE APPROACH TO IMPROVING CONTROL IN SYSTEMS WITH

CONSTRAINTS BASED ON A BOUNDARY VALUE PROBLEM

Dmitry O. Trunin

Cand. Sci. (Phys. and Math.), A/Prof.,

Dorzhi Banzarov Buryat State University

24a Smolina St., Ulan-Ude 670000, Russia

[email protected]

Abstract. State-nonlinear optimal control problems are considered in the presence of an additional constraint on the phase trajectory of terminal type. For the considered problems, a new approach to improving admissible controls is proposed based on the exact formula for the increment of the Lagrange functional by solving a special boundary value problem, which is significantly simpler than the boundary value problem of the maximum principle. To solve it, a special iterative process is proposed based on the sequential solution of Cauchy problems and the determination of an auxiliary factor from the condition of fulfilling the functional constraint. Unlike most standard numerical methods for optimal control problems (needle linearization, conditional gradient), the proposed approach does not use the operation of changing a small parameter in the vicinity of the current approximation. In addition, it has the ability to strictly improve non-optimal extremal controls.

Keywords: dynamic controlled system, terminal constraint, admissible control improvement, boundary value problem, iterative method.

For citation

Trunin D. O. One Approach to Improving Control in Systems with Constraints Based on a Boundary Value Problem // Bulletin of Buryat State University. Mathematics, Informatics. 2023. N. 3. P. 70-77.

The article was submitted 15.09.2023; approved after reviewing 25.09.2023; accepted for publication 27.09.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.