Научная статья на тему 'Устойчивый секвенциальный принцип Лагранжа в выпуклом оптимальном управлении с поточечными фазовыми ограничениями и его приложения'

Устойчивый секвенциальный принцип Лагранжа в выпуклом оптимальном управлении с поточечными фазовыми ограничениями и его приложения Текст научной статьи по специальности «Математика»

CC BY
85
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫПУКЛОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / МИНИМИЗИРУЮЩАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / ПРИНЦИП ЛАГРАНЖА / ПРИНЦИП МАКСИМУМА / ФАЗОВЫЕ ОГРАНИЧЕНИЯ / ДВОЙСТВЕННОСТЬ / РЕГУЛЯРИЗАЦИЯ / CONVEX OPTIMAL CONTROL / MINIMIZING SEQUENCE / LAGRANGE PRINCIPLE / MAXIMUM PRINCIPLE / STATE CONSTRAINTS / DUALITY / REGULARIZATION

Аннотация научной статьи по математике, автор научной работы — Сумин Михаил Иосифович

Обсуждаются устойчивый секвенциальный принцип Лагранжа в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями и его возможные приложения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сумин Михаил Иосифович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE STABLE SEQUENTIAL LAGRANGE PRINCIPLE IN THE CONVEX OPTIMAL CONTROL WITH POINTWISE STATE CONSTRAINTS AND ITS APPLICATIONS

The stable sequential Lagrange principle for the convex optimal control with pointwise state constraints and its possible applications are discussed.

Текст научной работы на тему «Устойчивый секвенциальный принцип Лагранжа в выпуклом оптимальном управлении с поточечными фазовыми ограничениями и его приложения»

УДК 517.977

УСТОЙЧИВЫЙ СЕКВЕНЦИАЛЬНЫЙ ПРИНЦИП ЛАГРАНЖА В ВЫПУКЛОМ ОПТИМАЛЬНОМ УПРАВЛЕНИИ С ПОТОЧЕЧНЫМИ ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ И ЕГО ПРИЛОЖЕНИЯ

© М.И. Сумин

Ключевые слова: выпуклое оптимальное управление; минимизирующая последовательность; принцип Лагранжа; принцип максимума; фазовые ограничения; двойственность; регуляризация.

Обсуждаются устойчивый секвенциальный принцип Лагранжа в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями и его возможные приложения.

Введение. Задача оптимального управления, рассматриваемого ниже вида была предметом исследований в огромном числе публикаций. Большая часть из них, прежде всего, посвящалась выводу необходимых условий оптимальности при различных естественных дополнительных предположениях и условии точного задания исходных данных. В данной работе мы подойдем к изучению этой задачи с несколько другой стороны. В случае неточного задания ее исходных данных, при исследовании и решении этой задачи на основе приближенных методов и применения ЭВМ необходимо учитывать ее возможную неустойчивость и, как следствие, наследуемую неустойчивость классических условий оптимальности. Здесь в целях преодоления указанной неустойчивости ограничения задачи трактуются как ограничения в пространстве L2(X), что приводит к получению в рамках идеологии двойственной регуляризации [ 1 ] т. н. устойчивого секвенциального принципа Лагранжа, представляющего одновременно и регуляризирующий алгоритм решения задачи.

Постановка задачи. Рассматривается выпуклая задача оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства, понимаемыми как ограничения в гильбертовом пространстве H = L2(X),

Г т

(P2) f2 (u) = ({F2 (t)x2 [u](t),x2 [u](t)} + {G2 (t)u(t),u(t)))dt min, u €D С L2(0,T),

J 0

9i(u)(t) = {p2(t),x2[u](t)} = h(t), 92(u)(t) = vi{t,xs[u](t)) ^ 0 при п.в. t € X,

где f2 : L2(0,T) ^ R1 — непрерывный выпуклый функционал с измеримыми по Лебегу ограниченными матрицами F2, G2, ф\, h2 € L^(X), : х х Rn R1 — непрерывная

функция, выпуклая по x при t € X, D = {u € L2(0,T): u(t) € U при п.в. t € (0,T)}, U С

° 2

С Rm — выпуклый компакт, X С [0,T], X = cl X, x2[u](t), t € [0, T] — решение задачи Коши x = A2(t)x + B2(t)u(t), x(0) = x0 € Rn, t € [0,T] с измеримыми по Лебегу ограниченными матрицами A2, B2. Верхний индекс 5 € [0, $о], ^0 > 0 —некоторое фиксированное число, в исходных данных задачи (P2 ) означает, что эти данные соответствуют либо ситуации их точного задания ( 5 = 0 ), либо являются возмущенными ( 5> 0 ). Обозначим через L2(u, X, ц) = f2(u) + {X, gi(u) — h) + {ц, (u)} регулярный функционал Лагранжа

задачи ( P2 ). Введем множества: D°£ = {u €D : \\g0(u) — h°\\2,x ^ e, min \\g0(u) — z\2,x ^

z€U-

^ e}, H- = {z € L2(X): z(t) ^ 0при п.в. t € X}, H+ = —H-, D00 = D°. Определим двойственную задачу V2(X, ц) = inf L2(u, X, ц) ^sup, (X, ц) €Hx H+, а также множества U0 =

u£V

= Argmin{f0(z) : u € D0}, U2[X, ц] = Argmin{L2(u, X, ц) : u €D} и элемент (X2,a,^2,a) = = argmax{V2(X,ц) — a||X||2 — аЦцЦ2, (X,ц) €Hx H+ }. Условия на отклонения возмущенных ( 5 > 0 ) входных данных F2,G2,^21,h2,ф22,А2,B2, x0 от невозмущенных

2698

F°, G0, ф2, h0, ф0, A0, B0, x0 таковы, что \f2 (u) — f0(u)\ < C5, ||g2 (u) — g0(u)||2,x < C5,

Ilg2(u) — g0(u)\\2,X ^ C5, где C> 0 не зависит от u €D и 5.

Устойчивый секвенциальный принцип Лагранжа. Формулируемая ниже теорема представляет собою необходимые и достаточные условия на элементы минимизирующих приближенных решений (МПР) в смысле Дж. Варги в задаче (P0 ).

Теорема 1. Пусть 5к 0, k ж — произвольная сходящаяся к нулю последовательность неотрицательных чисел. Для того, чтобы в задаче (P0) существовало МПР ( и, следовательно, каждая его слабая предельная точка принадлежала множеству U0 ), необходимо и достаточно, чтобы существовала последовательность (Xk, цк) €Hx xH+, k = 1, 2,..., такая, что при k -^ж имеют место соотношения 5к ||(Xk, цк )||^- 0, u2k [Xk, цк] €D0£', ek 0, {(Xk ,цк), (gf' (u2 [Xk, цк]) — h2' ,g2 (u2 [Xk, цк]))} ^ 0 для некоторых элементов u2' [Xk, цк] € U2' [Xk, цк]. При этом u2' [Xk, цк], k = 1,2,... — искомое МПР. Как следствие указанных соотношений, выполняется и предельное соотношение V°(Xk, цк) ^ sup V°(X,^). В качестве одной из возможных последовательностей

(Xk, цк) € H х H+, k = 1,2,... выступает, например, последовательность (Xk, цк) = (X2',а(2к, ц2'>а(2к)), k = 1, 2,..., вырабатываемая соответствующей версией метода двойственной регуляризации [ 1 ] при выполнении условия согласования 5к/а(5к) ^ ^ 0, а(5к) ^ 0, k ^ ж.

Приложения устойчивого секвенциального принципа Лагранжа. За счет учета возможного неточного задания исходных данных приведенная выше теорема может применяться для практического решения выпуклых задач оптимального управления вида (P0 ). При некоторых дополнительных естественных предположениях дифференцируемости ф2 по x она трансформируется в устойчивый секвенциальный принцип максимума Понтрягина [ 1, 2 ]. Одновременно из него в результате соответствующего предельного перехода [ 1 ] в важном частном случае ^2(t) = h2(t) = 0, t € X (ограничение-равенство отсутствует) получается и традиционный для такого рода задач классический принцип максимума Понтрягина, использующий в своей записи меры Радона.

ЛИТЕРАТУРА

1. Сумин М.И. Параметрическая двойственная регуляризация для задачи оптимального управления с поточечными фазовыми ограничениями // Журн. вычисл. матем. и матем. физ. 2009. Т. 49. № 12. С. 20832102.

2. Сумин М.И. Регуляризованный секвенциальный принцип максимума Понтрягина в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями // Известия института математики и информатики УдГУ. 2012. Вып. 1 (39). С. 130-133.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке РФФИ (коды проектов 12-01-00199-а, 13-07-97028-р_поволжье_а) и Минобрнауки РФ в рамках государственного задания на оказание услуг в 2012-2014 гг. (шифр заявки 1.1907.2011).

Sumin M.I. THE STABLE SEQUENTIAL LAGRANGE PRINCIPLE IN THE CONVEX OPTIMAL CONTROL WITH POINTWISE STATE CONSTRAINTS AND ITS APPLICATIONS

The stable sequential Lagrange principle for the convex optimal control with pointwise state constraints and its possible applications are discussed.

Key words: convex optimal control; minimizing sequence; Lagrange principle; maximum principle; state constraints; duality; regularization.

2699

i Надоели баннеры? Вы всегда можете отключить рекламу.