Научная статья на тему 'МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА В ЗАДАЧЕ НАХОЖДЕНИЯ ГЛОБАЛЬНОГО МИНИМУМА КУСОЧНО-АФФИННОГО ЦЕЛЕВОГО ФУНКЦИОНАЛА В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ'

МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА В ЗАДАЧЕ НАХОЖДЕНИЯ ГЛОБАЛЬНОГО МИНИМУМА КУСОЧНО-АФФИННОГО ЦЕЛЕВОГО ФУНКЦИОНАЛА В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
25
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕГЛАДКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / КУСОЧНО-АФФИННАЯ ФУНКЦИЯ / КОДИФФЕРЕНЦИАЛ / ПАРАМЕТРИЗАЦИЯ УПРАВЛЕНИЯ / МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА

Аннотация научной статьи по математике, автор научной работы — Фоминых Александр Владимирович, Карелин Владимир Витальевич, Полякова Людмила Николаевна, Мышков Станислав Константинович, Трегубов Владимир Петрович

Рассматривается задача оптимального управления объектом, описываемым линейной нестационарной системой и с кусочно-аффинным функционалом качества. Изучается задача в форме Майера как со свободным, так и с частично закрепленным правым концом. Допустимыми считаются кусочно-непрерывные и ограниченные управления, лежащие в каждый момент времени в некотором параллелепипеде. Производятся стандартные дискретизация исходной системы и параметризация управления, приводятся теоремы о сходимости решения построенной дискретной системы к искомому решению непрерывной задачи. Далее для исследования полученной дискретной системы используется аппарат кодифференциального исчисления и применяется метод модифицированного кодифференциального спуска, который гарантированно находит глобальный минимум данной задачи за конечное число шагов. Разрабатываемый алгоритм демонстрируется на примерах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Фоминых Александр Владимирович, Карелин Владимир Витальевич, Полякова Людмила Николаевна, Мышков Станислав Константинович, Трегубов Владимир Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE CODIffERENTIAL DESCENT METHOD IN THE PROBLEM OF fiNDING THE GLOBAL MINIMUM OF A PIECEWISE AffiNE OBJECTIVE FUNCTIONAL IN LINEAR CONTROL SYSTEMS

The article considers the problem of optimal control of an object described by a linear nonstationary system and with a piecewise affine quality functional. The problem is examined in Mayer’s form with both free and partially fixed right endpoints. Piecewise continuous and bounded controls that lie in some parallelepiped at each moment of time are admissible. The standard discretization of the original system and the control parametrization are used, some convergence theorems of the discrete problem solution to the continuous problem solution are presented. Further, for the obtained discrete system, the necessary and sufficient minimum conditions are written out in terms of the codifferential, the method of the modified codifferential descent is applied to it, which guarantees to find the global minimum of this problem in a finite number of steps. The proposed algorithm is illustrated with examples.

Текст научной работы на тему «МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА В ЗАДАЧЕ НАХОЖДЕНИЯ ГЛОБАЛЬНОГО МИНИМУМА КУСОЧНО-АФФИННОГО ЦЕЛЕВОГО ФУНКЦИОНАЛА В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ»

УДК 517.977.1 Вестник СПбГУ. Прикладная математика. Информатика ... 2021. Т. 17. Вып. 1 МЯС 49М

Метод кодифференциального спуска в задаче нахождения глобального минимума кусочно-аффинного целевого функционала в линейных системах управления*

А. В. Фоминых, В. В. Карелин, Л. Н. Полякова, С. К. Мышков, В. П. Трегубое

Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9

Для цитирования: Фоминых А. В., Карелин В. В., Полякова Л. Н., Мышков С. К., Трегубое В. П. Метод кодифференциального спуска в задаче нахождения глобального минимума кусочно-аффинного целевого функционала в линейных системах управления // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2021. Т. 17. Вып. 1. С. 47-58. https://doi.org/10.21638/1170l/spbu10.2021.105

Рассматривается задача оптимального управления объектом, описываемым линейной нестационарной системой и с кусочно-аффинным функционалом качества. Изучается задача в форме Майера как со свободным, так и с частично закрепленным правым концом. Допустимыми считаются кусочно-непрерывные и ограниченные управления, лежащие в каждый момент времени в некотором параллелепипеде. Производятся стандартные дискретизация исходной системы и параметризация управления, приводятся теоремы о сходимости решения построенной дискретной системы к искомому решению непрерывной задачи. Далее для исследования полученной дискретной системы используется аппарат кодифференциального исчисления и применяется метод модифицированного кодифференциального спуска, который гарантированно находит глобальный минимум данной задачи за конечное число шагов. Разрабатываемый алгоритм демонстрируется на примерах.

Ключевые слова: негладкая задача оптимального управления, кусочно-аффинная функция, кодифференциал, параметризация управления, метод кодифференциального спуска.

1. Введение. Несмотря на большое количество теоретических исследований негладких задач теории оптимального управления в различных постановках (в том числе получение принципа максимума для таких задач) [1-7], практическая сторона до сих пор остается плохо развитой в силу затруднения применения, как правило, сложно устроенных условий оптимальности при построении численных методов для решения конкретных задач. В некоторых работах численные методы основаны на предварительном процессе сглаживания целевой функции. Например, в [8, 9] рассматривается минимаксная задача управления, и с помощью специально построенной гладкой штрафной функции она сводится к классической непрерывно дифференцируемой задаче. В работе [10] субдифференцируемая штрафная функция строится для учета терминальных ограничений и ограничений на управления, после чего также используется процесс сглаживания субдифференциала.

В данной статье изучается задача управления линейной системой как со свободным, так и с частично закрепленным правым концом. Описывается целевой функционал в форме Майера, который предполагается не гладким, а лишь кусочно-аффинным

* Работа выполнена при финансовой поддержке Российского научного фонда (проект № 20-7110032).

© Санкт-Петербургский государственный университет, 2021

(см. определение в п. 4) по фазовым координатам, и для его минимизации используется аппарат кодифференциального исчисления, разрабатываемый в научной школе В. Ф. Демьянова [11—15]. В работе [16] были получены условия глобального минимума разности полиэдральных функций в терминах кодифференциала. Еще в статье [17] было замечено, что метод кодифференциального спуска имеет свойство «перепрыгивать» локальные минимумы в некоторых случаях. Недавно М. В. Долгополиком [18] в конечномерном случае был предложен модифицированный метод кодифферен-циального спуска, который находит глобальный минимум кусочно-аффинной функции за конечное число шагов.

В настоящей статье с помощью техники параметризации управления, разрабатываемой в научной школе К. Л. Тео [19, 20], исходная задача сводится к конечномерной задаче минимизации некоторой функции параметров управления. Линейная структура системы позволяет сохранить кусочную аффинность этой функции по параметрам управления, потому для ее минимизации можно применять упомянутый модифицированный метод кодифференциального спуска [18].

2. Постановка задачи. Рассмотрим линейную систему обыкновенных дифференциальных уравнений

x(t)= A(t)x(t)+ B(t)u(t) (1)

с начальной точкой

x(0) = xo. (2)

В формуле (1) A(t), B(t) — вещественные непрерывные матрицы размерностей n х n и n х m соответственно, заданные на временном промежутке [0,T], где T > 0 — известный конечный момент времени; x(t) — n-мерная непрерывная вектор-функция фазовых координат с кусочно-непрерывной и ограниченной на [0, T] производной; u(t) — m-мерная вектор-функция управлений, которая предполагается кусочно-непрерывной и ограниченной на [0,Т].

Будем использовать следующие обозначения: Cn[0,T] — пространство n-мерных непрерывных на [0,Т] вектор-функций с производной из пространства Pn[0,T]; Pn[0,T] — пространство кусочно-непрерывных и ограниченных на [0,T] n-мерных вектор-функций; (a, Ъ) — скалярное произведение некоторых векторов a,b G Rd; co P — выпуклая оболочка множества P; o(a) — величина большего порядка малости по сравнению с числом а, т. е. o(a)/a ^ 0, если а ^ 0.

Если t0 G [0,T) — точка разрыва вектор-функции u(t), то для определенности полагаем u(to) = limu(t). В точке T положим u(T) = limu(t). Аналогично считаем,

tito t-\T

что x(to) — правосторонняя производная вектор-функции x в точке to, x(T) — левосторонняя производная вектор-функции x в точке T.

Введем множество допустимых управлений

U = {и е Рт[0,Т] I Ui^Uiit) i = T~rñ, te [0,Т]}, (3)

где щ G R, i = 1, m, — заданные числа.

Обозначим x(t,u) — решение задачи Коши (1), (2) для некоторого заданного управления u G U (будем иногда для краткости также писать просто x(t) вместо x(t,u)). При сделанных предположениях такое решение существует и единственно [21]. Требуется найти такое управление u* G U, которое доставляет минимум функционалу

f(u) = ф(x(T,u)).

Считаем, что функция ф(х) кусочно-аффинна по фазовым переменным. Соответствующую оптимальную траекторию х(Ь, и*) (она должна удовлетворять начальному условию (2)) обозначим х*(Ь). Предполагаем, что такое решение существует.

Замечание! Вместо управлений из пространства Р [0, Т] и соответственно траекторий из пространства Сп[0, Т] с производными из пространства Рп[0, Т] можно рассматривать измеримые и почти всюду ограниченные на [0, Т] управления и абсолютно непрерывные на отрезке [0, Т] траектории с измеримыми и почти всюду ограниченными на [0, Т] производными соответственно. Тогда при сделанных предположениях у описываемой задачи оптимального управления существует решение [22]. Выбор пространства управлений и траекторий в статье будем объяснять возможностью их практического построения.

Замечание2. Множество (3) допустимых управлений выбрано для простоты изложения. Можно изучать и другие ограничения на управления, лишь бы они сохраняли кусочно-аффинную структуру задачи.

3. Параметризация управления. Следуя работе [20], произведем следующую дискретизацию исходной задачи. Разобьем отрезок времени [0, Т] на 2Р равных частей Дг (где р — заданное натуральное число) точками Ьь, к = 0, 2р, ¿о = 0,..., ¿2р = Т. Рассмотрим управление, которое принимает постоянные значения на каждом из этих интервалов. Оно может быть записано в виде

иР(1) = ^ °Р'кХ1р (V, (4)

к=1

где ар'к € Ит, к = 1,2р, — вектор постоянных управлений; — индикаторная

функция множества = к = 0, 2р — 1, = [¿гр-ь^р]- Обозначим ир —

множество всех векторов ар'к, к = 1,2р, лежащих во множестве II.

Положим аР = (аРг1, ...,аР'2)' и перепишем исходную систему (1) с новым управлением иР(1):

х(ь) = Л(г)х(г) + Б(г)аР (5)

и тем же начальным условием

х(0) = х0. (6)

Обозначим х(1,аР) — решение задачи Коши (5), (6) для некоторого заданного управления аР € иР. При сделанных предположениях такое решение существует и единственно [21]. Требуется найти такое управление аР* € иР, которое доставляет минимум функционалу

7р(**) = ф(х(Т,**))- (7)

Соответствующую оптимальную траекторию х(Ь, аР*) (она должна удовлетворять начальному условию (6)) обозначим хР*(Ь). Предполагаем, что такое решение существует.

Таким образом, исходная задача построения кусочно-непрерывного управления

и*(Ь) свелась к задаче (или последовательности задач при увеличении числа р) по_2 к

строения кусочно-постоянного управления иР*(1) = 5^к=1 &Р* Х1Р (¿) (т. е. определения вектора параметров аР*). Проведенная параметризация управления позволит вычислить кодифференциал минимизируемого функционала в каждой точке аР и, благодаря этому, применить к нему метод кодифференциального спуска, тем самым получить алгоритм решения исходной задачи. Можно обосновать построенную параметризацию управления, т. е. доказать сходимость значений функционала

p(up*) ^ ф(и*) при p ^ ж. Известны также некоторые результаты по сходимости последовательности управлений up* и траекторий x(t, up*). Приведем соответствующие теоремы [20] в удобном для данной статьи виде.

Теорема 1. При сделанных предположениях верно, что

up*) ^ ^>(u*) при p ^ж. (8)

Теорема 2. При сделанных предположениях справедливо утверждение: если ир* —> И, почти всюду на интервале [0, Т], то и есть оптимальное управление исходной задачи. Тогда для любого t € [0, T] верно, что

lim ||x(t, ир*) — = 0,

p—

и по определению x(t,u) является оптимальной траекторией (возможно, не единственной) исходной задачи.

ЗамечаниеЗ. В действительности в [20] от функции ф(х) требуется более сильное условие непрерывной дифференцируемости, однако видно, что доказательства в этой работе требуемых утверждений используют лишь условие липшицевости функции ф(х) на ограниченных подмножествах Rn, которое выполнено в силу предположения о кусочной аффинности такой функции.

4. Кодифференцируемость кусочно-аффинных функций. В общем случае интуитивное понятие кусочно-аффинной функции как функции, получаемой «соединением» заданных на некоторых множествах аффинных функций (c, х) + d, где a,x € Rd, b € R, можно формализовать с помощью понятия полиэдрального разбиения [23]. При такой формализации определения кусочно-аффинной функции оказывается [23], что функция £ : Rn ^ R является кусочно-аффинной тогда и только тогда, когда найдутся такие конечные наборы (a,i,Vi) G R х Rn, i = 1 , г, и (bj,Wj) G R x Rn, j = 1, s, что

Ш = Ш + Ш = max{a® + (<*,?>} + тдп{Ьд- + (wj^)}. (9)

Здесь не будем использовать полиэдральное разбиение, а примем формулу (9) за «конструктивное» определение кусочно-аффинной функции.

Определение 1. Функция £ : Rn ^ R называется кусочно-аффинной тогда и только тогда, когда она допускает представление в форме (9).

Замечание 4. Множество кусочно-аффинных функций является линейным пространством, содержащим все аффинные функции и замкнутым относительно операций взятия конечного числа максимумов и минимумов [23], поэтому, например, функция £(с1,с2) = min{|?i|, max{|?i — 1|, |с2|}} кусочно-аффинная.

Напомним определение кодифференцируемой функции и кодифференциала.

Определение 2. Пусть имеется некоторое непустое множество £ С Rn. Функция £ : £ ^ R называется кодифференцируемой на множестве £, если для каждого с € £ существуют такие выпуклые компактные множества, гиподифференциал С R х Rn и гипердифференциал С R х Rn, что для каждого допустимого приращения Дс € Rn (т. е. co{c, с + Дс} € £) соответствующее приращение функции £ представимо по формуле

+ Д?) - £(?) = тах (а+(«,Д?» + min (b + (w, Д?» + о(Д?, ?),

{a,v)Ed£(<;) (b,w)ed£(<;)

где о(аА<;,<;)/а —> 0, если а —> 0. Пара = [ei£(s), d£(<;)] называется кодифферен-

циалом функции £ в точке с.

Заметим, что класс кодифференцируемых функций достаточно широкий: к нему, в частности, относятся любые суперпозиции конечного числа максимумов и минимумов непрерывно дифференцируемых функций. Для кодифференцируемых функций разработано богатое и конструктивное исчисление [12]. Укажем известную формулу [12] для вычисления кодифференциала кусочно-аффинной функции, записанной в стандартном виде (см. определение 1):

с£(<;) = со{(а4 + I « = 1^},

Щч) = со{(Ьз + (ги^я) - £(<;), \ ] = ТТв}.

5. Учет ограничений на управление и случай частично закрепленного правого конца. Построим штрафную функцию, которая учитывает ограничения на управление (см. формулу (3)), сохранив для нее прежнее обозначение:

Тр{ар) := Тр{ар) + Ai max jo, а\Л - йь .. ., ст^1 - йт, .. а^'2" - йь . ..,

V У - рЛ »1 р,2» V 2Р\

-erf , ■■■,Ут -<{ -«"Г j-

Заметим, что штрафное слагаемое здесь является кусочно-аффинной функцией. Известно [24], что построенная функция будет точной штрафной. Это означает следующее: существует такое число Л* < ж, что для всех Ai ^ Л* задача минимизации функции (10) на всем пространстве Rm х R2 эквивалентна минимизации функции (7) на множестве Up.

Предположим теперь, что (не умаляя общности) первые пт < п координат объекта системы (1), (2) в конечный момент времени фиксированы, т. е. наложим дополнительное ограничение

Xi(T) = XTi; i = 1,пт, пт < n, (11)

где числа х^, г = 1,ит, заданы.

Составим для учета такого ограничения штрафную функцию и также сохраним для нее прежнее обозначение:

пт

Щар) :=Ща*>) + \2^\х^Т)-хъ\. (12)

г=1

При некоторых естественных дополнительных предположениях данная функция также будет точной штрафной [25]. Это означает следующее: существует такое число Л** < то, что для всех Л2 ^ Л** задача минимизации функции (12) на всем пространстве Дт х Д2 эквивалентна минимизации функции (10) при ограничениях (11). Заметим, что штрафное слагаемое здесь является кусочно-аффинной по х функцией.

Итак, указанные ограничения на управление и на правый конец траектории не меняют структуру задачи, и с их учетом окончательно следует рассматривать задачу минимизации функционала (12) при достаточно больших значениях параметров Л1, Л2. На эти параметры существуют некоторые оценки, однако на практике нужно просто следить за тем, выполняются ли ограничения при выбранных значениях параметров, а также при необходимости производить их увеличение.

6. Кодифференцируемость функционала 7р(ар). Метод кодифферен-циального спуска. С помощью формулы Коши легко непосредственно проверить, что функция х(Т,ар) аффинна по своему аргументу ар. Действительно,

2р — 1 {к+1

х(Т, ар) = У (Т) |хо + / У-1(т)В(т)арк¿т I ,

V к=0 к )

где У(г), г € [0, Т], — фундаментальная матрица системы (1), нормированная в нуле. Отсюда и из замечания 4 следует: из сделанного предположения о том, что функция ф(х) кусочно-аффинна, вытекает кусочная аффинность функции Тр(сгр). При этом функция ф(х) может быть записана в стандартном виде (9) или каким-нибудь другим образом (см. замечание 4).

Известно [26], что производная вектор-функции х(Т, ар) как функции аргумента ар'к, к = 1,2р, дается формулой

дх(Т,арк) _ .

даР'к

= Нк (Т),

(13)

в которой матрица Нк (Т) есть решение следующего матричного дифференциального уравнения:

Нк (г) = А(г)нк (1) + 5к,ьВ(1),

te \ti-uh), 1 = к,2Р-1, *€ \ti-iM, 1 = 2р,

с начальным условием

нк(г) = 0, г € [0,1к-1),

где 6к,1, к,1 = 1, 2р, — символ Кронекера.

Пользуясь правилом суперпозиции кодифференцируемой функции и непрерывно дифференцируемой функции [12], приведем явную формулу кодифференциала функционала ^р{ир) в случае, когда функция ф{х) записана в стандартном виде:

Щар) =Щар) + Щар) = тах{а, + х{Т, ар))} + тдп{63- + {т^х(Т,ар))}, (14) где г = 1, г; ] = 1, е. Имеем равенства

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ВТр{ар) = [37р{ар),1кр{ар)1

Яр(ар) = со { <ц + (уи х(Т, ар)) - Щар),

&р(ар) = со \ ^ + {и>э,х(Т, ар)) - р(<тр),

{дх(Т, ар)У

V дар

(дх{Т, ар)\

V д^

г = 1, г

.7 = М

дх(Т, ар)

в которых производные -г-^- вычисляются по формуле (13).

дар

В общем случае (т. е. когда функция ф(х) кусочно-аффинна, но записана не в стандартном виде (14)) для вычисления кодифференциала функционала ^р{ир) нужно использовать правила кодифференциального исчисления [12] и формулу (13). Мы не приводим эти правила для краткости, однако заметим, что в данном случае (в силу

V

ш

3

того, что функция ф(х) является кусочно-аффинной) вычисления по таким правилам не представляют труда.

Замечание5. Отметим, что при вычислении по этим правилам как гипо-дифференциал <£р(ор), так и гипердифференциал <Ир(ор) кусочно-аффинной функции Тр(<7р) будут представлять собой выпуклые многогранники, заданные выпуклой оболочкой своих вершин.

Приведем модифицированный алгоритм кодифференциального спуска [18] для поиска глобального минимума функционала 7р(ар). Обозначим J(o^p) множество индексов вершин, задающих гипердифференциал сЛр(ар) функции ~ф(сгр) в точке ар, а сами вершины — как г^ (<гр), 3 € . (о~р).

1. Выберем произвольную начальную точку ар0) € Дт х Д2 и положим N := 0,

Мм = Щ0)).

2. Рассчитаем гиподифференциал и гипердифференциал (1ср(арм^), тем самым определив вершины г^)), 3 € МN.

3. Для каждого 3 € Мм вычислим вектор

€ агётт||(а,г;)||2, (а, г;) € <Мр(сгр{м)) +

и если будет а^ (&ры)) ^ 0, то положим Мм := Мм \ {3}.

4. Если Мм = 0, то процесс завершается. В противном случае найдем индекс

3(Л0 € агЕшп3.еМ1< Тр + '

Далее положим сг?лг+1) = apN) Н--—р—r«j(w)(crcлг))> Mn+i ■= MN, N := N + 1

и перейдем к шагу 2.

По предположению выше кусочно-аффинная функция ~ф(сгр) ограничена снизу и достигает глобального минимума, поэтому справедлив следующий результат, полученный в работе [18].

Теорема 3. Описанный модифицированный алгоритм кодифференциального спуска приводит к точке глобального минимума функции Тр(ор) за конечное число шагов.

7. Численные примеры. Как было отмечено при описании алгоритма, при каждом фиксированном параметре p точное решение находится за конечное число шагов. Однако для сокращения записи все результаты вычислений будут записаны с точностью до 4-го знака после запятой.

Пример 1. На отрезке времени [0,1] рассмотрим систему

x 1 = Х2 + Ul,

Х 2 = —2xi — 3x2 + U2

с начальным условием x(0) = (0,0)'.

Необходимо подобрать такое управление и (здесь не накладываем на него никаких ограничений), которое минимизирует функционал

v(u) = ф(х(1,и)) = min {max {|xl(1)|, |x2(1)|}, 1 + max {2|xl(1) — 2|, |x2(1) — 2|}} .

Поскольку по своей структуре функция р(и) неотрицательная и принимает нулевое значение при х(1) = (0, 0)', то очевидным решением (возможно не единственным) будет точка и * = (0,0)', и *) = 0.

Пусть р = 0, т. е. считаем управление постоянным на всем промежутке времени: и = и0 = а0 (см. (4)). Заметим, что у функции ц>(и) имеется локальный минимум при х(1) = (2, 2)', т. е. если взять управление (в данном примере легко вычислить его непосредственно с помощью формулы Коши) и00) = а^) ~ (0.2397, 9.0124)', ф(и0р)) = 1. Намеренно возьмем эту точку (которая является точкой локального минимума функции Тр(сгр)) как начальное приближение, чтобы показать, что алгоритм действительно находит глобальный минимум.

На первом шаге были получены следующие результаты вычислений:

Э(0) = 2, аз(0)(а00)) « -0.01215, vj{о) (а(°0)) « (0.0029, 0.1095)',

поэтому

0 ( 0.0029 0.1095 У сг?п « 0.2397+-,9.0124+ 1

(1) V -0.01215' -0.01215) '

т. е. а01) = (0,0)', и в этом примере алгоритм привел к точке глобального минимума за один шаг.

Пример 2. На отрезке времени [0,1] рассмотрим систему

х1 = (2г + 1)х1 + 15гх2 + и1, х2 = гх1 + х2 + и2

с начальным условием х(0) = (1,1)'.

Пусть во множестве V заданы границы = м2 = —4.5, й\ = йч = 4.5. Необходимо подобрать такое управление и € и, которое минимизирует функционал

и) = ф(х(1, и)) = |х1(1)| + |х2(1)\.

Рассмотрим функцию Тр(<7р) (см. (10)) со штрафным параметром Ах = 1. Как будет видно из вычислений, такой величины штрафного параметра достаточно для точного удовлетворения ограничениям ар € ир. Заметим, что в данном примере эта функция субдифференцируема, отсюда ее гипердифференциал, вычисленный в любой точке, состоит из единственной нулевой точки [12], поэтому ) = 1 для любого номера N.

Пусть сначала р = 0, т. е. считаем управление постоянным на всем промежутке времени: и = и0 = а0 (см. (4)). Возьмем точку ар0) = (0, 0)' в качестве начального приближения управления.

На первом шаге были получены такие результаты вычислений:

поэтому

Э(0) = 1, а3(0) (а00)) « -9.20088, Vj(о)(а0о)) « (9.2512, 26.1818)',

0 / 9.2512 26.1818 \'

<тЯ\ « 0+-,0+- « -1.0055,-2.8456 ';

(1) V -9.20088' —9.20088) у '

на втором шаге — следующие результаты вычислений: Э(1) = 1, а3(1) (а0!)) « -4.2497, )

поэтому

п 0.6327 0.8 У , а?,-, « -1.0055 +-, -2.8456 +- « -1.1539, -3.0338 ';

(2) ^ -4.2497' —4.2497) у '

на третьем шаге —

3(2) = 1, аК2) (^(02)) « -0.08465, ьт(*0{2)) « (0.2833, -0.1018)',

поэтому

0 ( 0.2833 -0.1018 У ,

« -1.1539 +-, -3.0338 +- « -4.5, -1.8314 ',

(3) V -0.08465' -0.08465) у у'

и, поскольку на следующей итерации получим Мз = {1}\{1} = 0 (так как aj(3) (а(3)) = 0, то алгоритм завершает свою работу), тогда найденная точка а(3) = (-4.5, -1.8314)' является точкой глобального минимума в примере.

Однако видно, что Тр{сг^) « 0.0899, а это отличается от нулевого значения данного функционала, которое, возможно, удастся достичь с помощью управлений ар € ир для больших значений параметра р (см. (8)).

Возьмем теперь р = 1, тогда по определению (см. (4)) на интервале [0,0.5) управлением будет вектор а1'1 € Я2, а на интервале [0.5,1] — вектор а1,2 € Я2. Возьмем в качестве начального приближения управление, полученное при р = 0, т. е. положим а1,) = (-4.5,-1.8314)', а(1') = (-4.5,-1.8314)', или, более кратко, а(10) = (-4.5, -0.8314, -4.5, -1.8314)'.

На первом шаге были получены следующие результаты вычислений:

3(0) = 1, aj{o) (а^)) « -0.08089, «¿(о)^) « (0, 0.0047, 0, -0.0236)',

поэтому

( 0 0.0047 0 -0.0236 У

07-, N « (—4.5 +-,-1.8314+-,-4.5+-,-1.8314+- ',

(1) V -0.08089' -0.08089' -0.08089' -0.08089У '

т. е. а^1) = (-4.5, -1.8843, -4.5, -1.5337)' и, поскольку при таком управлении имеем

(V

а1

^(<тУ) = 0, то алгоритм приводит к точке глобального минимума в этом примере.

Литература

1. Fominyh A. V. Open-loop control of a plant described by a system with nonsmooth right-hand side // Computational Mathematics and Mathematical Physics. 2019. Vol. 59. Iss. 10. P. 1639—1648.

2. Frankowska H. The first order necessary conditions for nonsmooth variational and control problems // SIAM J. Control Optim. 1984. Vol. 22. N 1. P. 1-12.

3. Ioffe A. D. Necessary conditions in nonsmooth optimization // Mathematics of Operations Research. 1984. Vol. 9. N 2. P. 159-189.

4. Mordukhovich B. Necessary conditions for optimality in nonsmooth control problems with nonfixed time // Differential Equations. 1989. Vol. 25. N 1. P. 290-299.

5. Shvartsman I. A. New approximation method in the proof of the maximum principle for nonsmooth optimal control problems with state constraints // Journal of Mathematical Analysis and Applications. 2007. Vol. 326. N 2. P. 974-1000.

6. Vinter R. B., Cheng H. Necessary conditions for optimal control problems with state constraints // Transactions of the American Mathematical Society. 1998. Vol. 350. N 3. P. 1181-1204.

7. Vinter R. B. Minimax optimal control // SIAM J. Control Optim. 2005. Vol. 44. N 3. P. 939-968.

8. Gorelik V. A., Tarakanov A. F. Penalty method and maximum principle for nonsmooth variable-structure control problems // Cybernetics and Systems Analysis. 1992. Vol. 28. Iss. 3. P. 432-437.

9. Gorelik V. A., Tarakanov A. F. Penalty method for nonsmooth minimax control problems with interdependent variables // Cybernetics. 1989. Vol. 25. Iss. 4. P. 483-488.

10. Моржин О. В. Об аппроксимации субдифференциала негладкого штрафного функционала в задачах оптимального управления // Автоматика и телемеханика. 2009. № 5. С. 24—34.

11. Demyanov V. F., Nikulina V. N., Shablinskaya I. R. Quasidifferentiable functions in optimal control // Mathematical Programming Study. 1986. Vol. 29. P. 160—175.

12. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 432 с.

13. Demyanov V. F., Tamasyan G. Sh. Direct methods in the parametric moving boundary variational problem // Numerical Functional Analysis and Optimization. 2014. Vol. 35. Iss. 7—9. P. 932—961.

14. Fominyh A. V., Karelin V. V., Polyakova L. N. Application of the hypodifferential descent method to the problem of constructing an optimal control // Optimization Letters. 2018. Vol. 12. N 8. P. 1825-1839.

15. Fominyh A. V. Methods of subdifferential and hypodifferential descent in the problem of constructing an integrally constrained program control // Automation and Remote Control. 2017. Vol. 78. Iss. 4. P. 608-617.

16. Polyakova L. N. On global unconstrained minimization of the difference of polyhedral functions // Journal of Global Optimization. 2011. Vol. 50. P. 179-195.

17. Demyanov V. F., Bagirov A. M., Rubinov A. M. A method of truncated codifferential with applications to some problems of cluster analysis // Journal of Global Optimization. 2002. Vol. 23. P. 63-80.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

18. Dolgopolik M. V. The method of codifferential descent for convex and global piecewise affine optimization // Optimization Methods and Software. 2020. Vol. 35. Iss. 6. P. 1191-1222.

19. Loxton R. C., Teo K. L., Rehbocka V., Yiu K. F. C. Optimal control problems with a continuous inequality constraint on the state and the control // Automatica. 2009. Vol. 45. P. 2250-2257.

20. Teo K. L., Goh C. J., Wong K. H. A unified computational approach to optimal control problems. New York: Longman Scientific and Technical, 1991. 356 p. (Pitman Monographs and Surveys in Pure and Applied Mathematics)

21. Васильев Ф. П. Методы оптимизации. М.: Факториал, 2002. 824 с.

22. Filippov A. F. On certain questions in the theory of optimal control //J. SIAM Control. Ser. A 1. 1962. P. 76-84.

23. Gorokhovik V. V., Zorko O. I. Piecewise affine functions and polyhedral sets // Optimization. 1994. Vol. 31. P. 209-221.

24. Dolgopolik M. V. A unifying theory of exactness of linear penalty functions // Optimization. 2015. Vol. 65. N 6. P. 1167-1202.

25. Dolgopolik M. V. Exact penalty functions for optimal control problems. II. Exact penalization of terminal and pointwise state constraints // Optimal Control Applications and Methods. 2020. Vol. 41. Iss. 3. P. 898-947.

26. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. М.: Наука, 1979. 432 с.

Статья поступила в редакцию 15 августа 2020 г. Статья принята к печати 15 января 2021 г.

Контактная информация:

Фоминых Александр Владимирович — канд. физ.-мат. наук, доц.; alexfomster@mail.ru Карелин Владимир Витальевич — канд. физ.-мат. наук, доц.; vlkarelin@mail.ru Полякова Людмила Николаевна — д-р физ.-мат. наук, проф.; lnpol07@mail.ru Мышков Станислав Константинович — канд. физ.-мат. наук, доц.; skmyshkov@mail.ru Трегубов Владимир Петрович — д-р физ.-мат. наук, проф.; v.tregubov@spbu.ru

The codifferential descent method in the problem of finding the global minimum of a piecewise affine objective functional in linear control systems *

A. V. Fominyh, V. V. Karelin, L. N. Polyakova, S. K. Myshkov, V. P. Tregubov

St. Petersburg State University, 7-9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation

* This work was supported by the Russian Science Foundation (project N 20-71-10032).

For citation: Fominyh A. V., Karelin V. V., Polyakova L. N., Myshkov S. K., Tregubov V. P. The codifferential descent method in the problem of finding the global minimum of a piecewise affine objective functional in linear control systems. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2021, vol. 17, iss. 1, pp. 47-58. https://doi.org/10.21638/11701/spbu10.2021.105 (In Russian)

The article considers the problem of optimal control of an object described by a linear nonstationary system and with a piecewise affine quality functional. The problem is examined in Mayer's form with both free and partially fixed right endpoints. Piecewise continuous and bounded controls that lie in some parallelepiped at each moment of time are admissible. The standard discretization of the original system and the control parametrization are used, some convergence theorems of the discrete problem solution to the continuous problem solution are presented. Further, for the obtained discrete system, the necessary and sufficient minimum conditions are written out in terms of the codifferential, the method of the modified codifferential descent is applied to it, which guarantees to find the global minimum of this problem in a finite number of steps. The proposed algorithm is illustrated with examples.

Keywords: nonsmooth optimal control problem, piecewise affine function, codifferential, parametrization of control, method of codifferential descent method.

References

1. Fominyh A. V. Open-loop control of a plant described by a system with nonsmooth right-hand side. Computational Mathematics and Mathematical Physics, 2019, vol. 59, iss. 10, pp. 1639—1648.

2. Frankowska H. The first order necessary conditions for nonsmooth variational and control problems. SIAM J. Control Optim., 1984, vol. 22, no. 1, pp. 1-12.

3. Ioffe A. D. Necessary conditions in nonsmooth optimization. Mathematics of Operations Research, 1984, vol. 9, no. 2, pp. 159-189.

4. Mordukhovich B. Necessary conditions for optimality in nonsmooth control problems with nonfixed time. Differential Equations, 1989, vol. 25, no. 1, pp. 290-299.

5. Shvartsman I. A. New approximation method in the proof of the maximum principle for nonsmooth optimal control problems with state constraints. Journal of Mathematical Analysis and Applications, 2007, vol. 326, no. 2, pp. 974-1000.

6. Vinter R. B., Cheng H. Necessary conditions for optimal control problems with state constraints. Transactions of the American Mathematical Society, 1998, vol. 350, no. 3, pp. 1181-1204.

7. Vinter R. B. Minimax optimal control. SIAM J. Control Optim., 2005, vol. 44, no. 3, pp. 939-968.

8. Gorelik V. A., Tarakanov A. F. Penalty method and maximum principle for nonsmooth variable-structure control problems. Cybernetics and Systems Analysis, 1992, vol. 28, iss. 3, pp. 432-437.

9. Gorelik V. A., Tarakanov A. F. Penalty method for nonsmooth minimax control problems with interdependent variables. Cybernetics, 1989, vol. 25, iss. 4, p. 483-488.

10. Morzhin O. V. Ob approksimatsii subdifferentsiala negladkogo shtrafnogo funktsionala v zadachakh optimal'nogo upravleniia [On approximation of the subdifferential of the nonsmooth penalty functional in the problems of optimal control]. Avtomatika i telemekhanika [Automation and Telemechanics], 2009, no. 5, pp. 24-34. (In Russian)

11. Demyanov V. F., Nikulina V. N., Shablinskaya I. R. Quasidifferentiable functions in optimal control. Mathematical Programming Study, 1986, vol. 29, pp. 160-175.

12. Demyanov V. F., Rubinov A. M. Osnovy negladkogo analiza i kvazidifferentsial'noe ischislenie [Foundations of nonsmooth analysis and quasidifferential calculus]. Moscow, Nauka Publ., 1990, 432 p. (In Russian)

13. Demyanov V. F., Tamasyan G. Sh. Direct methods in the parametric moving boundary variational problem. Numerical Functional Analysis and Optimization, 2014, vol. 35, iss. 7-9, pp. 932-961.

14. Fominyh A. V., Karelin V. V., Polyakova L. N. Application of the hypodifferential descent method to the problem of constructing an optimal control. Optimization Letters, 2018, vol. 12, no. 8, pp. 18251839.

15. Fominyh A. V. Methods of subdifferential and hypodifferential descent in the problem of constructing an integrally constrained program control. Automation and Remote Control, 2017, vol. 78, iss. 4, pp. 608-617.

16. Polyakova L. N. On global unconstrained minimization of the difference of polyhedral functions. Journal of Global Optimization, 2011, vol. 50, pp. 179-195.

17. Demyanov V. F., Bagirov A. M., Rubinov A. M. A method of truncated codifferential with applications to some problems of cluster analysis. Journal of Global Optimization, 2002, vol. 23, pp. 63—80.

18. Dolgopolik M. V. The method of codifferential descent for convex and global piecewise affine optimization. Optimization Methods and Software, 2020, vol. 35, iss. 6, pp. 1191—1222.

19. Loxton R. C., Teo K. L., Rehbocka V., Yiu K. F. C. Optimal control problems with a continuous inequality constraint on the state and the control. Automatica, 2009, vol. 45, pp. 2250—2257.

20. Teo K. L., Goh C. J., Wong K. H. A unified computational approach to optimal control problems. New York, Longman Scientific and Technical Publ., 1991. 356 p. (Pitman Monographs and Surveys in Pure and Applied Mathematics)

21. Vasil'ev F. P. Metody optimizatsii [Optimization methods]. Moscow, Factorial Publ., 2002. 824 p. (In Russian)

22. Filippov A. F. On certain questions in the theory of optimal control. J. SIAM Control, Ser. A 1, 1962, pp. 76-84.

23. Gorokhovik V. V., Zorko O. I. Piecewise affine functions and polyhedral sets. Optimization, 1994, vol. 31, pp. 209-221.

24. Dolgopolik M. V. A unifying theory of exactness of linear penalty functions. Optimization, 2015, vol. 65, no. 6, pp. 1167-1202.

25. Dolgopolik M. V. Exact penalty functions for optimal control problems. II. Exact penalization of terminal and pointwise state constraints. Optimal Control Applications and Methods, 2020, vol. 41, iss. 3, pp. 898-947.

26. Alekseev V. M., Tikhomirov V. M., Fomin S. V. Optimal'noe upravlenie [Optimal control]. Moscow, Nauka Publ., 1979, 432 p. (In Russian)

Received: August 15, 2020.

Accepted: January 15, 2021.

Authors' information:

Alexander V. Fominyh — PhD in Physics and Mathematics, Associate Professor; alexfomster@mail.ru

Vladimir V. Karelin — PhD in Physics and Mathematics, Associate Professor; vlkarelin@mail.ru

Lyudmila N. Polyakova — Dr. Sci. in Physics and Mathematics, Professor; lnpol07@mail.ru

Stanislav K. Myshkov — PhD in Physics and Mathematics, Associate Professor; skmyshkov@mail.ru

Vladimir P. Tregubov — Dr. Sci. in Physics and Mathematics, Professor; v.tregubov@spbu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.