Научная статья на тему 'Позиционный принцип минимума для квазиоптимальных процессов в задачах управления с терминальными ограничениями'

Позиционный принцип минимума для квазиоптимальных процессов в задачах управления с терминальными ограничениями Текст научной статьи по специальности «Математика»

CC BY
141
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВОЗМУЩЕННЫЙ ПРИНЦИП МАКСИМУМА / ПОЗИЦИОННЫЕ УПРАВЛЕНИЯ / ТЕРМИНАЛЬНЫЕ ОГРАНИЧЕНИЯ / МОДИФИЦИРОВАННЫЕ ЛАГРАНЖИАНЫ / PERTURBED MAXIMUM PRINCIPLE / FEEDBACK CONTROLS / TERMINAL CONSTRAINTS / MODIfiED LAGRANGIANS

Аннотация научной статьи по математике, автор научной работы — Дыхта Владимир Александрович

В серии работ автора были получены нелокальные необходимые условия оптимальности для задач со свободным концом, усиливающие принцип максимума и объединенные одним названием позиционный принцип минимума. Данная статья направлена на распространение этих условий оптимальности для задач с терминальными ограничениями. Предлагается схема доказательства этого обобщения, основанная на «снятии» ограничений методом модифицированной функции Лагранжа с квадратичным штрафом. Реализация этой схемы требует необходимых условий оптимальности для приближенно оптимальных (квазиоптимальных) процессов в аппроксимирующих задачах оптимального управления. Поэтому в первой части работы позиционный принцип минимума распространяется на квазиоптимальные процессы для задачи со свободным правым концом (усиливая так называемый возмущенный ε-принцип максимума); во второй части этот результат используется для вывода приближенного позиционного принципа минимума в гладкой задаче с терминальными ограничениями. В расширенной трактовке итоговое утверждение совершенно естественно: если в экстремальной задаче ограничения «снимаются» последовательностью ослабленных аппроксимирующих задач со свойством глобальной сходимости, то абсолютный минимум в допустимой точке исходной задачи имеет место тогда и только тогда, когда для всех ε > 0 эта точка ε-оптимальна во всех аппроксимирующих задачах с достаточно большим номером. Применительно к задаче оптимального управления с терминальными ограничениями позиционный ε-принцип служит именно для реализации сформулированного утверждения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Feedback Minimum Principle for Quasi-Optimal Processes of Terminally-Constrained Control Problems

In a series of previous works, we derived nonlocal necessary optimality conditions for free-endpoint problems. These conditions strengthen the Maximum Principle and are unified under the name “feedback minimum principle”. The present paper is aimed at extending these optimality conditions to terminally constrained problems. We propose a scheme of the proof of this generalization based on a “lift” of the constraints by means of a modified Lagrange function with a quadratic penalty. Implementation of this scheme employs necessary optimality conditions for quasi-optimal processes in approximating optimal control problems. In view of this, in the first part of the work, the feedback minimum principle is extended to quasi-optimal free-endpoint processes (i.e. strengthen the so-called ε-perturbed Maximum Principle). In the second part, this result is used to derive the approximate feedback minimum principle for a smooth terminally constrained problem. In an extended interpretation, the final assertion looks rather natural: If the constraints of the original problem are lifted by a sequence of relaxed approximating problems with the property of global convergence, then the global minimum at a feasible point of the original problem is admitted if and only if, for all ε > 0, this point is ε-optimal, for all approximating problems of a sufficiently large index. In respect of optimal control with terminal constraints, the feedback ε-principle serves exactly for realization of the formulated assertion.

Текст научной работы на тему «Позиционный принцип минимума для квазиоптимальных процессов в задачах управления с терминальными ограничениями»



Серия «Математика»

2017. Т. 19. С. 113-128

Онлайн-доступ к журналу: http://isu.ru/izvest.ia.

УДК 517.97 MSG 49J15

DOI https://doi.org/10.26516/1997-7670.2017.19.113 Позиционный принцип минимума для квазиоптимальных процессов в задачах управления с терминальными ограничениями *

В. А. Дыхта

Институт динамики систем и теории управления имени, В. М. Матросова

Аннотация. В серии работ автора, были получены нелокальные необходимые условия оптимальности для задач со свободным кондом, усиливающие принцип максимума. и объединенные одним названием — позиционный принцип минимума.. Данная статья направлена, на. распространение этих условий оптимальности для задач с терминальными ограничениями. Предлагается схема, доказательства, этого обобщения, основанная на. «снятии» ограничений методом модифицированной функции Ла.гра.нжа. с квадратичным штрафом. Реализация этой схемы требует необходимых условий оптимальности для приближенно оптимальных (квазиоптимальных) процессов в аппроксимирующих задачах оптимального управления. Поэтому в первой части работы позиционный принцип минимума, распространяется на. квазиоптимальные процессы для задачи со свободным правым концом (усиливая так называемый возмущенный е-принцип максимума); во второй части этот результат используется для вывода, приближенного позиционного принципа, минимума, в гладкой задаче с терминальными ограничениями. В расширенной трактовке итоговое утверждение совершенно естественно: если в экстремальной задаче ограничения «снимаются» последовательностью ослабленных аппроксимирующих задач со свойством глобальной сходимости, то абсолютный минимум в допустимой точке исходной задачи имеет место тогда, и только тогда., когда, для всех е > О эта. точка, е-оптимальна. во всех аппроксимирующих задачах с достаточно большим номером. Применительно к задаче оптимального управления с терминальными ограничениями позиционный е-принцип служит именно для реализации сформулированного утверждения.

Ключевые слова: возмущенный принцип максимума., позиционные управления, терминальные ограничения, модифицированные лагранжианы.

СО РАН

* Работа, выполнена, при частичной поддержке РФФИ (проект № 14-01-00699), Комплексной программы фундаментальных исследований СО РАН П2П/1.1-2 и Со-

1. Введение

В работах [5]- [8] получены различные варианты необходимого условия оптимальности, названного позиционным принципом минимума, для задач со свободным правым концом траекторий. Поскольку это условие существенно усиливает классический принцип максимума Пон-трягина и некоторые его негладкие аналоги, а также показало свою эффективность в примерах с особенностями, то естественно встал вопрос о распространении позиционного принципа минимума на более сложные задачи с терминальными ограничениями. В этом направлении и выполнена данная работа.

Априори было ясно, что указанное обобщение будет весьма нетривиальным. Дело в том, что доказательство позиционного принципа минимума для простейшей задачи оптимального управления со свободным правым концом (см. разд. 2) основано на нелокальных вариациях разрывного позиционного управления. Этот класс не параметризован какими-либо малыми параметрами и, как следствие, проварьирован-ные траектории (решения разрывных систем) не обладают близостью к исследуемой траектории. В такой ситуации традиционная техника вариационного анализа становится абсолютно непригодной, да в простейшей задаче она и не нужна. Но в задаче с терминальными ограничениями данное обстоятельство создает проблемы.

Естественно попытаться «снять» терминальные ограничения подходящим методом штрафа, обладающим свойством глобальной сходимости к оптимальному решению (ибо позиционные вариации нелокальны); точнее — аппроксимировать рассматриваемую задачу последовательностью ослабленных, простейших задач, выписать в них позиционный принцип минимума, а затем получить желаемый результат предельным переходом при стремлении параметра штрафа к оо. Такой подход применялся во многих работах для доказательства принципа максимума в весьма сложных задачах (с концевыми и фазовыми ограничениями, с дифференциальными включениями и т. д.). Укажем, например, [1; 14; 15], а также [11], где использовался так называемый метод параметризации целевой функции (функционала), который является методом штрафа в завуалированной форме. Однако в этих работах существенно эксплуатировался тот факт, что принцип максимума является необходимым условием локального минимума (сильного, а точнее — понтрягинского); для нашей цели требуются соответствующие модификации.

В статье предлагается схема доказательства позиционного принципа минимума для гладкой задачи с терминальными ограничениями, осно-

вета по грантам Президента Российской Федерации для государственной поддержки ведущих научных школ Российской Федерации (НШ-8081.2016.9).

ванная на модифицированном лагранжиане с квадратичным штрафом. В ходе реализации этой схемы пришлось фактически доказать принцип максимума в двух вариантах: классическом и расширенном [11, теорема 9.2] (без этого нельзя связать целевой результат с фундаментальным). Кроме этого, возникла необходимость характеризации приближенно оптимальных процессов (минимизирующих последовательностей) в аппроксимируемых задачах. Единственно известный в этом плане результат — это возмущенный принцип максимума [16], или, иначе, е-принцип максимума (см. также [12; 11]). Но для целей данной статьи нужно было усилить это необходимое условие до позиционного е-принципа минимума. Поэтому мы обращаемся к этому усилению в разделе 2.

Итоговый результат статьи — это позиционный е-принцип минимума для аппроксимирующих задач с достаточно большим параметром штрафа. Он является предварительным относительно конечной цели, но уже позволяет «встраивать» позиционный принцип в итерационные методы снятия ограничений и исследовать модельные примеры.

И еще. Если бы мой учитель — Владимир Иосифович Гурман — пробежался по этому введению, то энтузиазмом не проникся и спросил: «О чем это "копушничество", и какая сейчас-то проблема терминальных ограничений?» И, оправдываясь, пришлось бы пояснять, что работа непосредственно связана с его «одной, но пламенной любовью» — уникальными достаточными условиями Вадима Федоровича Кротова; а точнее — с обращением этих условий в необходимые в случае несколько «подправленной» линейной разрешающей функции (см. конец разд. 2). И более того, лишь рамки статьи ограничены этим случаем, а вообще-то необходимые условия с позиционными управлениями порождает любая «предкротовская» функция ([5]—[8]), так что практически применение двух типов условий оптимальности оказывается «запараллеленным». Но это — в простейшей задаче, а при наличии терминальных ограничений для сохранения этой комфортной «смычки» приходится покорпеть. После данного пояснения Владимир Иосифович, возможно, смягчился бы...

2. Необходимые условия оптимальности для квазиоптимальных процессов в простейшей задаче

В этом разделе будет рассматриваться следующая гладкая задача

(Р):

ж =/(¿, х,и), ж(£о) = хо J(x, и) = —> И .

(2.1) (2.2)

Она рассматривается на множестве Е пар функций

(т = (х, и) € АС(Т, Кп) хи,Ы:= Ь^Т, и)

при следующих предположениях:

(Н1) множество и С Кт компактно;

(Н2) вектор-функция /(¿,ж,-и) непрерывна вместе со своей производной х, и) на Т х Кп х [7;

(Н3) выполняется условие сублинейного роста \/(1;,х,и)\ < с(1 + |ж|) на Т х Кп х и (с > 0);

{НА) функция 1{х) непрерывно дифференцируема. Отметим, что из (Н1) — (Н3) следует нелокальная продолжимость решений системы (2.1), (2.2) с управлениями из Ы и предкомпактность множества этих решений в пространстве С (Т, Кп).

Квазиоптимальными (или субоптимальными) называют допустимые процессы, на которых значение задачи реализуется достаточно точно, т.е. ,1{(т) близко к

Л := т!{7((т) | <7 € £}.

Более точно, процесс а С Е называют е-оптимальным, если выполняется неравенство

,1(а) < ,1* + е,

где е > 0. Для любого е > 0 всегда существует некоторое множество е-оптимальных процессов. Члены любой минимизирующей последовательности {сгк} являются е^-оптимальными для некоторой последовательности {£&} —> +0 и наоборот: по любой такой последовательности можно указать минимизирующую последовательность процессов. Эти свойства особенно важны для задач оптимального управления, в которых оптимального процесса не существует.

Необходимые условия для е-оптимальных процессов впервые были получены И. Экландом [16] в форме е-принципа максимума с помощью знаменитого вариационного принципа Экланда; его открытие породило целое направление в нелинейном анализе.

Изложим е-принцип максимума для задачи (Р). Введем функцию Понтрягина Н(1;,х,ф,и) = ф ■ f(t, х,и), сопряженную систему

ф = -НХЦ, х, ф, и), ф{и) = 1х{х{и))

и экстремальное отображение

ие(1,х,ф) = А^тш Н(1,х,ф,и). (2.3)

иеи

Тогда для оптимального процесса а = (х,й) необходимо выполняется включение

где i¡){t) — решение сопряженной системы, соответствующее а (котра-ектория для а). Это и есть принцип максимума Понтрягина (ПМ) для <т, т. е. условия его экстремальности.

Пусть теперь а = (х, и) — некоторый процесс, ip — соответствующая ему котраектория, и е > 0. Назовем а е-экстремалью, если выполняется следующее условие e-минимума функции Понтрягина:

H{t,x{t),^{t),u{t)) < mmH(t,x(t),ip(t),u) + е, teT. (2.4)

u£U

(Все соотношения, содержащие измеримые функции, считаются выполненными почти всюду по мере Лебега).

Возмущенный ПМ, полученный Экландом, можно сформулировать следующим образом:

Ve > 0 найдется е-оптималъный процесс а, ч

который является е - экстремалью.

Обратим внимание, как осторожно сформулирован этот е-ПМ: не любой e-оптимальный процесс есть е-экстремаль, а только «избранные». Для ясности уточним это обстоятельство.

Экланд ввел на множестве управлений U метрику

р(и, v) = mes {t £ T \ u(t) ф v(t)},

соответствующую сходимости по мере (и, что удивительно, не обнаруженную в анализе). Уточнение состоит в следующем:

V е-оптимали а = (х, и), (VA > 0) 3<т = (х, и) : J{(t) < J{a),

p(u,v) < А и a есть е-экстремалъ.

Грубо говоря, в любой близости от е-оптимали (в смысле метрики р) находится другая е-оптималь, которая е-экстремальна.

При исследовании фиксированной е-оптимали а необходимость перехода к другой, конечно, неудобна. Поэтому приведем еще одно возможное уточнение, свободное от этого перехода [12]:

= 5(е) : условие е-минимума (2.4) для а выполняется на некотором подмножестве T¿ С Т, mes T¿ = (t\ — ¿o) — S, ô(e) —> 0 при £ ->■ +0.

Поскольку при доказательстве позиционных условий оптимальности систематически приходится сталкиваться с квазиоптимальными процессами, то приведенные уточнения полезно иметь ввиду.

Обратимся к выводу позиционного усиления возмущенного ПМ для е-оптимали а.

Шаг 1. Определим класс позиционных вариаций управления. Для этого введем вектор-функцию

p(t, х) = ip(t) + lx{x) - lx{x{t))

и многозначное отображение Upe(t,x) = {и € U | H(t,x,p(t,x),u) < ттЯ(£,ж,р(£,ж),-и) + е}. (2.6)

u£U

Пусть Vpe — множество всех его селекторов, т. е. однозначных функций v : Т х Кп —>■ Upe(t,x), трактуемых как позиционные управления. Для любого v € Vpe обозначим через X(v) множество соответствующих ему решений на Т системы

х = f(t, х, v(t, х)), ж (¿о) = х0,

вообще говоря, разрывной. Множество X(v) является объединением всех решений Каратеодори, если v — борелевская функция, и конструктивных движений Красовского - Субботина [10] — равномерных пределов соответствующих ломаных Эйлера. В предположениях (Н1) — (Н3) такое определение множества X(v) корректно.

Заметим, что если х( ) € X(v) — решение Каратеодори, то u(t) := v(t,x(t)) € U и пара а = (х,и) € Е. Если же х(-) — конструктивное движение, то оно является решением овыпукленной системы

х £ со f(t, х, U), x(to) = Хо, (2.7)

и имеется последовательность ак = {хк,ик} С Е с кусочно постоянными управлениями такая, что хк —> х равномерно на Т и, следовательно, i(®fc(ti))

Тем самым описан класс вариаций управлений и траекторий, или множество пар сравнения с а по функционалу.

Отметим, что если а — е-экстремаль, то существует селектор v € Vpe такой, что х € X(v) и является решением Каратеодори. Этот факт доказывается точно также,как его аналог в теореме 1 из [7].

Шаг 2. Во множестве траекторий сравнения не должно быть нарушающей е-оптимальность а. Точнее говоря, выполняется условие

l(x(h)) < l(x(ti))+e Уж(-) € U X(v) (2.8)

v&Vps

Но, с учетом замечания в конце шага 1, х содержится в объединении из формулы (2.8), если а — е-экстремаль. Отсюда получаем следующее необходимое условие квазиоптимальности.

Теорема 1. Пусть а = (х,и) — е-оптимальный процесс в задаче (Р). Тогда:

а) выполняется условие (2.8);

б) траектория х е-оптимальна в задаче

l(x(ti)) ->■ inf, х(-) € U Х(у). (2.9)

veVps

Строго говоря, здесь вариационное условие б) сильнее а), и собственно оно является позиционным е-принципом минимума. Но поскольку мы не располагаем сколь-нибудь эффективным способом непосредственной проверки условия б) (т.е. приближенного решения задачи (2.9)), то в достаточной степени конструктивное условие а) включено в теорему. Ситуация, в общем, вполне аналогичная с точным позиционным ПМ, который формально получается из теоремы 1 при е = 0.

Если бы Владимир Иосифович рискнул ознакомиться с этим разделом, то непременно спросил: «Откуда ты взял этот позиционный ПМ и как работать с его е-вариантом?» И я бы пояснил, что вообще-то сначала позиционный ПМ появился из анализа кротовиана (термин А. А. Милютина), т. е. обобщенного лагранжиана Кротова (Ь) с функцией

<£>(£, х) = - 1х(х(г))) ■ (х - х(г)) + 1(х) - 1(х(£)),

и лишь затем появилось «рафинированное» доказательство, использующее только конструкции ПМ и воспроизведенное выше на уровне е-принципа. Что же касается работы с е-принципами, то надо различать две ситуации. Если речь идет об аналитическом решении задач, то особого оптимизма возмущенные принципы не вызывают — гораздо удобнее работать со скользящими режимами (если они возникают, то в ходе применения вариационных условий обнаруживаются почти автоматически и предварительного расширения задачи не требуется). Но если говорить о численных методах, то в их палитре что-то не просматриваются специализированные процедуры со скользящими режимами, а тогда приближенные принципы естественны и теорема 1 допускает конструктивную реализацию. Сказанное (и даже сверх того) можно подтвердить, разобрав интересный пример Дж. Варги (см. [5] и [8, с. 18-20]):

х = и, х(0) = 0, |«| < 1,

1

■] = J((£ — а)х2 — и2) (М —>• т^ а > 0. о

3. Схема доказательства позиционного ПМ в задачах с терминальными ограничениями

Рассмотрим задачу (Ро), которая отличается от задачи (Р) наличием «жесткого» терминального ограничения

д(х(и)) = (д ... ,да(х(и))) = 0.

Предполагается, что вектор-функция д(х) непрерывно дифференцируема, сохраняются допущения (Н1) — {НА) и множество Р> допустимых пар а в задаче (Ро) не пусто. Более того, чтобы гарантировать существование оптимального процесса в этой задаче примем условие Филиппова: множество скоростей /(¿, х, II) выпукло на Т х Кп.

Обозначим через <5 множество достижимости системы (2.1), (2.2) в момент времени ¿1 и введем в рассмотрение вспомогательную конечномерную задачу (К) :

1{х) —> тт, д(х) =0, г £ С}.

Поскольку при сделанных предположениях множество <5 компактно, то задача (К) имеет оптимальные точки (в глобальном смысле). Она естественным образом связана с задачей (Ро)) и теоретически эквивалентна ей.

Дальнейшее изложение разобьем на 6 шагов.

1. Для анализа задачи (К) применим метод с модифицированной функцией Лагранжа [13], который в [2] называется методом множителей, а в действительности представляет собой комбинацию методов множителей и внешнего штрафа. Введем функцию

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М(г,Х,1)=1(г) + Х-д(г) + ^\д(г)\2, (3.1)

где 7 > 0 — штрафной параметр, и рассмотрим последовательность задач

геЯ, к = 1,2,..., (3.2)

аппроксимирующих задачу (К) при подходящем выборе последовательностей {А'0}, {7к}- Ясно, что при любых (А, 7) задача

М(г, А, 7) —>■ тт, (3.3)

имеет некоторое решение г = г(Х, 7) и, следовательно, каждая к-задача из (3.2) имеет некоторое оптимальное решение гк.

Известно [2], теорема 2.1, что если последовательность {А'0} ограничена, а последовательность чисел {7^} строго возрастает, и 7*. —>■ оо, то любая предельная точка последовательности {гк} оптимальна в задаче (К). Отсюда следует, что, в принципе, задача оптимального управления (Ро) может быть аппроксимирована следующей задачей без терминальных ограничений:

М(х(Ь), А, 7) ->■ тт, (х(-), «(•)) € Е, (3.4)

где Е по-прежнему означает множество процессов системы (1.1), (1.2). Эта ослабленная задача (с частично снятыми ограничениями) может

решаться любыми аналитическими или численными методами, в том числе с использованием неравенств Гамильтона - Якоби. Как показывают примеры, последние часто позволяют упростить задачу (3.4) (точнее — семейство по (Л, 7) этих задач) и получить приемлемое решение, даже не устремляя параметр 7 к бесконечности.

2. Однако для вывода необходимых условий оптимальности данного процесса а = (ж, й) € Р> в задаче (Ро) модифицированный лагранжиан (3.1) следует заменить на

5(2, А, 7) =М(2,Л,7) +

т. е. добавить стабилизирующее слагаемое, обеспечивающее сходимость к интересующей нас точке = ж(^).

Для задачи (К) соответствующая последовательность аппроксимирующих задач

к) -»• тш, х£Я,к = 1,2,... (3.5)

будет иметь некоторые решения гк, к = 1,2,... . При этом выполняются следующие свойства:

(а) существуют последовательности {Ай} —> Л, {7^} ^ +оо такие, что гк -»• г, д(гк) -»• 0, 7к\д(гк)\2 -»• 0;

(б) в(гк, Хк, 7к) —> и, следовательно, Уе > 0 точка г е-оптимальна в последовательности задач (3.5) при достаточно больших к.

3. Адаптируем эту схему для задачи (Ро)-

Определим для нее функционал (обобщенный лагранжиан)

Ф(<7,А,7) =ад*1),7,Л) + ^ У \х(1)-х(1)\2(И

т

и последовательность аппроксимирующих задач

Ф(я,\к,1к) ^тт, я (3.6)

для некоторых последовательностей {Ай} —> А и {7^.} ^ +оо.

При сделанных предположениях компактности и выпуклости множества скоростей управляемой системы в каждой из к-задач в (3.6) существует оптимальный процесс ак = (жк,ик). Не ограничивая общности, последовательность траекторий {хк(-)} можно считать равномерно сходящейся к функции ж°(-), которая вместе с некоторым управлением и°(-) образует пару <т° € Е. Покажем, что в действительности <т° € Р> и сс^ —

Из неравенства

Н<7к,\к,7к) <ть)) Ук (3.7)

предельным переходом получаем '"/к\9(%к^1))\2 0 (иначе ограниченность для Ф(...) сверху нарушается) и, следовательно, д{жfc(íl)) —>

д(х°(1\)) = 0 в силу непрерывности функции д. Поскольку для траектории х° выполнены терминальные ограничения, то <т° = (х°,и°) € -О и 1)) > ¿(^(¿1)), так как траектория х оптимальна в задаче (Ро).

Вновь переходя к пределу при к —> оо в неравенстве (3.7), с учетом уже полученных предельных равенств получим

+ ^\х°(и))-х(и)\2 + ^ I \х°(и))-х(и)\2М<1(х(и)).

т

Но это возможно только при ж°(£) = ж(£).

Тем самым доказана следующая аппроксимационная лемма.

Лемма 1. Существуют последовательности {Аь} -> А и {7^} ^ +оо такие, что:

(а) оптимальные процессы ак = (хк,ик) в задачах (3.6) имеют траектории хк —> х в пространстве С (Т, Кп);

б) Уе > 0 процесс а = (х,и) е-оптимален в последовательности задач (3.6) при достаточно больших к.

Содержательный смысл этой леммы состоит в следующем: если зафиксировать А, то при достаточно большом 7 в любой (сколь угодно малой) С-окрестности траектории х(-) инфимум функционала а —>■ Ф(<т, А, 7) на множестве Е не может быть значительно меньше ¿(ж(£ 1)) = Да).

4. Дальнейшая стратегия вывода необходимых условий состоит в выписывании классического ПМ для пары ак в /г-задачах и перехода в них к пределу (это приведет к ПМ для а в задаче (Ро)), а затем — в аналогичной процедуре относительно позиционного ПМ. Уже в первой процедуре (локальной в сравнении с последующей) возникает особенность: поскольку у нас нет никакой информации о сходимости последовательности управлений {ик}, то предельный переход в сопряженной системе к-задач изолированно от фазовой системы оказывается невозможен. Он может быть сделан только в совместном дифференциальном включении для (хк,1рк)1 связанном с экстремальным многозначным отображением (2.3). В итоге и для предельных функций (х,ф) получается дифференциальное включение вида (см. [11, с. 151])

(х(г),е соЩ,х(г),гр(г)), г е т, (з.8)

где

П(г,х,1р) = {(у,и))\у = /(г,х,и),

(3.9)

уи = —Нх(Ь,х,'ф,и), и € х, ф)}.

Используя описание овыпукленной управляемой системы по Гамкре-лидзе [3], включение (3.8), (3.9) можно записать и в виде двух обычных систем — для х и ф — с «размноженным» числом управлений.

Необходимость перехода к овыпуклению систем и скользящим режимам (необычная для задач с условием выпуклости Филиппова) обусловлена структурой лагранжиана Ф. Действительно, если в него добавить еще одно стабилизирующее слагаемое

J \u(t) -u(t)\2dt (3.10)

т

с произвольно фиксированным параметром 5 > 0, как, например в [1], то для последовательности управлений {ик} из решений соответствующих аппроксимирующих задач можно вывести их сходимость к и в ¿2 и почти всюду на Т. Это свойство значительно облегчило бы обсуждаемые предельные переходы, но с точки зрения позиционного ПМ введение стабилизатора (3.10) нежелательно. Дело в том, что тогда экстремальные отображения Ue(t,x,ip) типа (2.3) в исходной задаче (Ро) и в аппроксимирующих fc-задачах оказались бы различными, а это сопряжено с дополнительными трудностями.

5. Детализируем описанную выше процедуру вывода ПМ. Напомним, что в задаче (Ро) ПМ для процесса а содержит условие трансверсальности

Í}{t1)=Lx(x(t1),n), (3.11)

где /л = (a, fi) € R+ х Rd, \¡i\ = 1 — множитель Лагранжа, а

L(x, ¡j) = al(x) + /Зд(х)

— терминальная функция Лагранжа.

Выпишем условия ПМ для ак в fc-задаче:

фк = -Hx(t, хк,грк,ик) + (хк - х), (3.12)

= lx(xk(t\)) + g'x(xk(ti))\k+

+ lkglx{xk{tlmxk{tl)) + {xk{tl)-x{tl)), uk{t) € ue{t,xk{t),ÍJk{t)), te Т.

Поскольку при к —> оо "предмножители Лагранжа"

mk := \к + r)kg(xk(t\)), к = 1,2,...

в (3.13) ведут себя непонятно, то для перехода к пределу делается вспомогательная нормировка — фк заменяется на фк = фк/(1к, где

dfc=(l + |mfc|2)1/2-

Тогда, если ввести обозначения ак = 1/(4, (Зк = mk/dk, ¡лк = (ак,(Зк), то \цк\ = IVA;, условие трансверсальности для фк примет вид

фк{и) = Ьх(хк(Ь),/1к) + d~kl (хк{и) - xih)) , (3.14)

а соответствующая сопряженная система будет отличаться от (3.12) лишь множителем 1/йк при (хк — ж).

Поскольку жй(£) —> ж(£) равномерно на Т, а \/лк\ = 1, то после нормировки оказывается возможным сделать предельный переход по некоторой подпоследовательности к1 —> оо в условии трансверсальности (3.14) и в совместной системе для (хк,фк)\ для обоснования последнего удобно воспользоваться теоремой 3.1.7 из [9] о предельном переходе в "возмущенном" дифференциальном включении.

В результате, если заменить к1 на к, мы получим существование вектора Д, |Д| = 1, и абсолютно непрерывной функции ф(-) на Т таких, что

фк(Ь) —> ф(Ь) равномерно на Т,

/ = (ак,/Зк) -»• Д = (а,Р),

и (ж,ф) удовлетворяют включению (3.8), (3.9) с условием трансверсальности (3.11) при /л = Д. Тем самым будет доказан вариант ПМ, названный в [11, теорема 9.2] расширенным ПМ.

6. Теперь, основываясь на аппроксимационной лемме 1, выпишем конструкции е-позиционного ПМ для процесса а в /г-задаче (3.6). Обозначив через г]к сопряженную переменную, будем иметь:

цк = —НХ(Ь, ж, г]к, и),

г]к(Ь) = Мх(х(Ь), \кпк) = 1х(х(и) + д'(х(Ь))тк, рк(г, ж) = Г]к(1) + Мх(ж, Хк, ъ) + ж - х(ь) - 1Х( ик(Ь, ж) := ирке^,х). Здесь лагранжиан М определен равенством (3.1),

тк = \к+ ~1кд(х(и)),

многозначное е-экстремальное отображение ик(1, ж) определено формулой (2.6) с заменой р на рк.

Приведенные формулы позволяют выписать условия е-ПМ в к-задаче; более того, предельным переходом вдоль некоторой последовательности {ек} —> +0 можно вывести классический ПМ по схеме шага 5). Таким образом, рамки рассматриваемой схемы в целом охватывают относительно элементарные доказательства двух вариантов принципа максимума для задач с терминальными ограничениями. На взгляд автора, даже самое последнее корректное и предельно упрощенное доказательство ПМ на пакете игольчатых вариаций [16] технически сложнее. (Правда, в данной схеме предварительно надо знать е-ПМ для задачи со свободным концом, но в альтернативной схеме взамен требуется иметь теорему о продолжении функции, определенной на Л™ и дифференцируемой в нуле, на все пространство.)

Естественно, возникает вопрос: как соотносятся между собой классический и расширенный ПМ? Автору не встречалось обсуждение этого вопроса в литературе, но представляется, что в предположении выпуклости множества скоростей классический ПМ сильнее расширенного. Действительно, если а удовлетворяет классическому ПМ с некоторой траекторией ф, то с ней он удовлетворяет и расширенному, т. е. овы-пукление в сопряженной системе просто расширяет множество экстремалей. Заметим, однако, что на пути к позиционному ПМ возникает именно расширенный ПМ.

Но вернемся к приближенному позиционному ПМ. Мы не будем давать его детализированную формулировку ввиду очевидности, а воспользуемся леммой 1 и приведем в следующей редакции.

Условие Л^(Фд7). Из оптимальности процесса а = (х,и) в задаче (Ро) следует, что для любых е > О, Л € КЛ процесс а удовлетворяет позиционному е-принципу минимума в задаче

Фл7(о") := Ф(сг, Л, 7) ->• тт, сгбК

при всех достаточно больших 7 > 0.

Это необходимое условие глобальной оптимальности представляется совершенно естественным, если не сказать очевидным (но после его вывода). Тем не менее, если проанализировать схему доказательства, то нетрудно понять, что по содержательному смыслу данный ответ выходит за рамки гладкой задачи (Ро) с терминальными ограничениями-равенствами.

Действительно, допустим, что в некоторой гипотетической задаче (Р*) терминальные ограничения "снимаются" посредством некоего обобщенного лагранжиана М.(сг,...) по образцу шага 1), причем для вспомогательной ослабленной задачи, аналогичной (3.3), вариант позиционного ПМ известен. Тогда реализация предложенной схемы приведет к некоторому аналогу условия ..).

На этом мы прервем изложение, оставив проблему точного позиционного ПМ для будущих исследований. Дело в том, что во втором предельном переходе, упомянутом на шаге 4), возникают трудности с формированием функционала в вариационной присоединенной задаче в позиционном ПМ (т. е. с предельным переходом в М по последовательности множителей /лк —> /л и —> оо).

Наверное, в этом месте Владимир Иосифович с сомнением сказал бы: «А стоило ли год копья ломать, да еще на будущее оставить?»

4. Заключение

В статье предложена схема доказательства позиционного принципу минимума для задач оптимального управления с терминальными

ограничениями. Эта схема реализована вплоть до завершающего шага и включает в себя позиционное обобщение возмущенного принципа максимума для задач со свободным правым концом, два элементарных доказательства принципа максимума для задачи с терминальными ограничениями. Итоговый результат — это необходимое условие оптимальности в форме позиционного е-принципа минимума в последовательности задач со свободным правым концом траекторий, глобально аппроксимирующих рассматриваемую посредством лагранжиана с квадратичным штрафом.

Рискну выразить сдержанный оптимизм относительно доводки этих результатов до логического конца и внедрения их в регулярные методы улучшения управления, которым пристальное внимание уделяли выдающиеся и самобытные российские математики Вадим Федорович Кротов и Владимир Иосифович Гурман.

Список литературы

1. Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи / А. В. Арутюнов. - М. : Факториал, 1997. - 256 с.

2. Бертсекас В. Условная оптимизация и методы множителей Лагранжа : пер. с англ. / В. Бертсекас. - М. : Радио и связь, 1987. - 400 с.

3. Гамкрелидзе Р. В. Основы оптимального управления / Р. В. Гамкрелидзе. -Тбилиси : Изд-во Тбилис. ун-та, 1977. - 231 с.

4. Дмитрук А. В. О доказательстве принципа максимума с помощью игольчатых вариаций / А. В. Дмитрук, Н. П. Осмоловский // Фундам. и прикл. математика. - 2014. - Т. 19, № 5. - С. 49-74.

5. Дыхта В. А. Вариационные условия оптимальности с позиционными управлениями спуска, усиливающие принцип максимума / В. А. Дыхта // Изв. Иркут. гос. ун-та. Сер. Математика. - 2014. - Т. 8. - С. 86-103.

6. Дыхта В. А. Вариационные необходимые условия оптимальности с позиционными управлениями спуска в задачах оптимального управления / В. А. Дыхта // Докл. Акад. наук. - 2015. - Т. 462, № 6. - С. 653-656.

7. Дыхта В. А. Позиционные усиления принципа максимума и достаточные условия оптимальности / В. А. Дыхта // Тр. Ин-та математики и механики УрО РАН. - 2015. - Т. 21, № 2. - С. 73-86.

8. Дыхта В. А. Неравенства Гамильтона - Якоби и вариационные условия оптимальности / В. А. Дыхта, О. Н. Самсонюк. - Иркутск : Изд-во ИГУ, 2015. -150 с.

9. Кларк Ф. Оптимизация и негладкий анализ / Ф. Кларк. - М. : Наука, 1988. -280 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Красовский Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский,

A. И. Субботин. - М. : Физматлит, 1974. - 456 с.

11. Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и управления / Б. Ш. Мордухович. - М. : Наука, 1988. - 360 с.

12. Плотников В. И. О построении минимизирующих последовательностей /

B. И. Плотников, В. И. Сумин // Дифференц. уравнения. - 1983. - Т. 19, № 4. -

C. 581-588.

13. Поляк Б. Т. Введение в оптимизацию / Б. Т. Поляк. - М. : Наука, 1983. - 384 с.

14. Clarke F. Necessary condition in dynamic optimization / F. Clarke // Memoirs of the Amer. Math. Soc. - 2005. - Vol. 13, N 816. - 113 p.

15. Clarke F. H. Nonconvex duality in optimal control / F. H. Clarke, C. Nour // SIAM J. Control Optim. - 2005. - Vol. 43. - P. 2036-2048.

16. Ekeland I. Nonconvex minimization problems / I. Ekeland // Bull. Amer. Math. Soc. - 1979. - Vol. 1, N 3. - Pp. 443-474.

Дыхта Владимир Александрович, доктор физико-математических наук, профессор, заведующий отделением, Институт динамики систем и теории управления имени В. М. Матросова СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952)453036 (e-mail: [email protected])

V. A. Dykhta

Feedback Minimum Principle for Quasi-Optimal Processes of Terminally-Constrained Control Problems

Abstract. In a series of previous works, we derived nonlocal necessary optimality conditions for free-endpoint problems. These conditions strengthen the Maximum Principle and are unified under the name "feedback minimum principle". The present paper is aimed at extending these optimality conditions to terminally constrained problems. We propose a scheme of the proof of this generalization based on a "lift" of the constraints by means of a modified Lagrange function with a quadratic penalty. Implementation of this scheme employs necessary optimality conditions for quasi-optimal processes in approximating optimal control problems. In view of this, in the first part of the work, the feedback minimum principle is extended to quasi-optimal free-endpoint processes (i.e. strengthen the so-called e-perturbed Maximum Principle). In the second part, this result is used to derive the approximate feedback minimum principle for a smooth terminally constrained problem. In an extended interpretation, the final assertion looks rather natural: If the constraints of the original problem are lifted by a sequence of relaxed approximating problems with the property of global convergence, then the global minimum at a feasible point of the original problem is admitted if and only if, for all e > 0, this point is e-optimal, for all approximating problems of a sufficiently large index. In respect of optimal control with terminal constraints, the feedback e-principle serves exactly for realization of the formulated assertion.

Keywords: perturbed Maximum Principle, feedback controls, terminal constraints, modified Lagrangians.

References

1. Arutyunov A.V. Optimality Conditions: Abnormal and Degenerate Problems. Mathematics and Its Applications, Dordrecht, Boston, London, Kluwer Academic Publishers, vol. 526, 2000, 300 p. https://doi.org/10.1007/978-94-015-9438-7

2. Bertsecas D.P Constrained Optimization and Lagrange Multiplier Methods. Athena Scientific, 1996. 410 p.

3. Gamkrelidze R.V. Principles of Optimal Control Theory. Mathematical Concepts and Methods in Science and Engineering, New York Plenum Press, vol. 7, 1978. 175 p. https://doi.org/10.1007/978-l-4684-7398-8

4. Dmitruk A.V., Osmolovskii N.P. On the Proof of Pontryagin's Maximum Principle by Means of Needle Variations. Journal of Mathematical Sciences, 2016, vol. 218, no 5, pp. 581-598. https://doi.org/10.1007/sl0958-016-3044-2

5. Dykhta V.A. Variational Optimality Conditions with Feedback Descent Controls that Strengthen the Maximum Principle. The Bulletin of Irkutsk State University, 2014, vol. 8, pp. 86-103.

6. Dykhta V.A. Variational Necessary Optimality Conditions with Feedback Descent Controls for Optimal Control Problems. Doklady Mathematics, 2015, vol. 91, no 3, pp. 394-396. https://doi.org/10.1134/S106456241503031X

7. Dykhta V.A. Positional Strengthenings of the Maximum Principle and Sufficient Optimality Conditions. Proceedings of the Steklov Institute of Mathematics, 2016, vol. 293, suppl. 1, pp. S43-S57. https://doi.org/10.1134/S0081543816050059

8. Dykhta V. A., Samsonyuk O. N. Neravenstva Gamil'tona-Yakobi i variatsyonnye usloviya optimal'nosti [Hamilton-Jacobi inequalities and variational optimality conditions], ISU, Irkutsk, 2015. 150 p.

9. Clarke F. Optimization and nonsmooth analysis. Montreal, Université de Montreal, 1989. 312 p.

10. Krasovskii N.N., Subbotin A.I. Game-Theoretical Control Problems. Springer-Series in Soviet Mathematics. New York, Springer-Verlag, 1988. 517 p. https://doi.org/10.1007/978-l-4612-3716-7

11. Mordukhovich B.S. Metody approksimacij v zadachah optimizacii i upravlenija [Approximation Methods in Problems of Optimization and Control]. Moscow, Nauka, 1988, 360 p.

12. Plotnikov V.I., Sumin M.I. O postroenii minimizirujushhih posledovatel'nostej [Construction of minimizing sequences], Differ. Uravn., 1983, vol. 19, no 4, pp. 581-588.

13. Polyak B.T. Introduction to Optimization. New York, Optimization Software, 1987. 464 p.

14. Clarke F. Necessary condition in dynamic optimization. Memoirs of the Amer. Math.Soc., 2005, vol. VI. 13, no 816. 113 p.

15. Clarke F.H., Nour C. Nonconvex duality in optimal control. SI AM J. Control Optim., 2005, vol. 43, pp. 2036-2048. https://doi.org/10.1137/S0363012903429554

16. Ekeland I. Nonconvex minimization problems. Bull. Amer. Math. Soc., 1979, vol. 1, no 3, pp. 443-474. https://doi.org/10.1090/S0273-0979-1979-14595-6

Dykhta Vladimir Aleksandrovich, Doctor of Sciences (Physics and Mathematics), Professor, Chief of Department, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, tel.: (3952)453036 (e-mail: [email protected])

i Надоели баннеры? Вы всегда можете отключить рекламу.