УДК 517.977.52, 517.977.58, 517.983.54, 519.853
ПАРАМЕТРИЧЕСКАЯ ДВОЙСТВЕННАЯ РЕГУЛЯРИЗАЦИЯ И ПРИНЦИП МАКСИМУМА В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ 1
© М. И. Сумин
Ключевые слова: оптимальное управление; поточечные фазовые ограничения; минимизирующая последовательность; метод возмущений; двойственность; регуляризация; принцип максимума Понтрягина.
Аннотация: Доклад посвящен применению метода двойственной регуляризации в параметрической линейно-выпуклой задаче оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства; обсуждается так называемый регуляризованный принцип максимума Понтрягина.
Постановка задачи. Рассматривается параметрическая линейно-выпуклая задача оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства, понимаемыми как ограничения в гильбертовом пространстве H = L2(X)
(Pp,r) 9o(u) = i ((F (t)x[u](t),x[u](t)) + (G(t)u(t),u(t)))dt ^ min, u eD С L2(0,T),
J 0
gi(u)(t) = (pi(t), x[u](t)) = h(t) + p(t), g2(u)(t) = p2(t,x[u](t)) ^ r(t) при п.в. t e X.
Здесь: p e H, r e H - параметры, go : L2(0,T) ^ R1 - сильно выпуклый функционал с постоянной к, F, A : [0,T] ^ Rnxn, B : [0,T] ^ Rnxm, G : [0,T] ^ Rmxm _ измеримые по Лебегу ограниченные матрицы, pi, h e L^(0,T) - заданные функцпп, p2 : [0,T] x Rn ^ R1 - выпуклая no x, непрерывная вместе с градиентом VxР2 функция, D = {u e L2(0,T) : u(t) e U при п.в. t e
О
e (0,T)}, U С Rm - выпуклый компакт, X С [0,T], X = cl X, x[u](t), t e [0,T] - решение задачи Коши
x = A(t)x + B(t)u(t), x(0) = x0 e Rn, t e [0,T].
Обозначим единственное решение задачи (Pp,r), если оно существует, через uР,r.
Параметрическая двойственная регуляризация и принцип максимума Понтрягина. Двойственная регуляризация [1] для задачи (Pp,r) заключается в непосредственном решении двойственной к (РР,r) и регуляризованной по Тихонову задачи
Rp;, r (X,ß) = Vp, r (X,ß) - a\\(X,ß)\\2 ^ sup, (X,ß) eHxH+, (1)
Vp,r(X,ß) = min Lp,r(u,X,ß), Lp,r(u,X,ß) = go(u) + (X,gi(u) - h - p) + (ß,g2(u) - r),
ubD
u[X,ß] = argmin{Lpir (u,X,ß) : u e D}, (X^, ß^ r) = aigmax{R<ar (X, ß) : (X, ß) eHx H+}, H+ = {z e L2(X) : z(t) ^ 0ири п.в. t e X},
в результате чего происходит аппроксимация в метрике L2(0,T) при а ^ 0 решения ulp,r элементами u[Xa,r, ßa,r]■ Наличие параметра (p,r) e H x H в исходной задаче позволяет исследовать зависимость от него свойств сходимости двойственного алгоритма (1): связь с дифференциальными
1 Работа выполнена при поддержке РФФИ (код проекта 07-01-00495) и аналитической целевой ведомственной
программы «Развитие научного потенциала высшей школы (2009-2010 годы)» Минобрнауки РФ (регистрационный №2.1.1/3927).
свойствами функции значений (5-функции) ß(p,r) = {9o(Vp,,r),если задача
(Pp,r) разрешима; +œ в противоположном случае}, разрешимостью двойственной задачи, принципом Лагранжа и принципом максимума Понтрягина.
Важнейшее преимущество рассмотрения ограничений задачи (Pp,r), как ограничений в Ь2(Х), заключается, прежде всего, в том, что это приводит к устойчивому к ошибкам исходных данных алгоритму ее решения [1]. В то же время, при определенных условиях на исходные данные эти ограничения можно, естественно, трактовать и как ограничения в L^(X) (p, r G L^(X) ) и C(X) (pi, h, p, r G C(X)). При этом понятия оптимальности управления в указанных частных случаях эквивалентны понятию оптимальности для случая, когда «те же» ограничения рассматриваются в L2(X).
Как и в [1], [2], алгоритм (1) для решения задачи (Pp,r) ведет себя двояко в зависимости от того, разрешима или нет двойственная к (Pp , r) задача. В первом случае семейство двойственных переменных (\a,r, ß0>, r ), а ^ 0 ограничен о в H х H, во втором - нет. Однако в обоих случаях «параллельно» с построением минимизирующего приближенного решения в смысле Дж. Варги алгоритм (1) ведет и к соответствующим необходимым условиям - так называемому регуляризо-ванному принципу Лагранжа в недифференциальной форме [2] в задаче (Pp,r) и, соответственно, регуляризованному принципу максимума Понтрягина. Главное отличие последних от их классических аналогов заключается в том, что, во-первых, они записываются в терминах минимизирующих последовательностей (а не оптимальных управлений), а во-вторых, выполняются в любой задаче (Pp,r), имеющей решение (как известно, эти классические аналоги в задачах (Pp,r) с ограничениями в L2(X) могут не быть справедливыми).
В докладе центральное внимание уделяется обсуждению регуляризованных принципа Лагран-
Pp r
применения для решения задач оптимизации, оптимального управления, а также некорректных обратных задач. Показывается также, что, если в задаче отсутствует ограничение-равенство ((Pp,r)=(Pr)), а ограничение-неравенство понимается как ограничение в C(X), r G C(X), то ре-гуляризованный принцип максимума после некоторой естественной перенормировки множителя
а и
цг, в независимости от того, разрешима или нет двойственная задача, приводит к невырожденному классическому принципу максимума Понтрягина для управления u°, в записи которого участвует традиционная в таком важном частном случае мера Радона. Кроме того, обсуждается
Pp r
алгоритмов решения и нелинейных задач оптимального управления с фазовыми ограничениями [3J. Рассматриваются иллюстративные примеры.
ЛИТЕРАТУРА
1. Сумин М.И. Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности // Журн. вычисл. матем. и матем. физ. 2007. Т. 47. № 4. С. 602-625.
2. Сумин М. И. Метод возмущений и двойственная регуляризация в линейно выпуклой задаче математического программирования // Проблемы динамического управления: сб. науч. тр. факультета ВМиК МГУ им. М.В. Ломоносова/ под ред. Ю.С. Осипова, A.B. Кряжимского. Вып. 3. М.: Издательский отдел факультета ВМиК МГУ, 2008. С. 200-231.
3. Сумин М.И. Регуляризованный двойственный метод решения нелинейной задачи математического программирования // Журн. вычисл. матем. и матем. физ. 2007. Т. 47. № 5. С. 796-816.
Abstract: The report is devoted to application of the dual regularization method in parametric linearconvex optimal control problem with equality and inequality pointwise state constraints; so-called regularized Pontryagin maximum principle is discussed.
Keywords: optimal control; pointwise state constraints; minimizing sequence; perturbation method; duality; regularization; Pontryagin maximum principle.
Сумин Михаил Иосифович Mikhail Sumin
д. ф.-м. н., профессор doctor of phys.-math. sciences, professor
Нижегородский государственный университет Nizhniy Novgorod State University Россия, Нижний Новгород Russia, Nizhniy Novgorod
e-mail: [email protected] e-mail: [email protected]
УДК 517.95
УСЛОВИЯ СОХРАНЕНИЯ ГЛОБАЛЬНОЙ РАЗРЕШИМОСТИ ВОЛЬТЕРРОВЫХ ОПЕРАТОРНЫХ УРАВНЕНИЙ И ИХ ПРИМЕНЕНИЕ В ТЕОРИИ РАСПРЕДЕЛЕННЫХ УПРАВЛЯЕМЫХ СИСТЕМ 1
© В. И. Сумин, A.B. Чернов
Ключевые слова: вольтерровы операторные уравнения; условия сохранения глобальной разрешимости.
Аннотация: Дается обзор полученных авторами достаточных условий сохранения глобальной разрешимости вольтерровых операторных уравнений, а также возможностей их конкретного применения к различным управляемым начально-краевым задачам для нелинейных уравнений с частными производными.
В [1] было предложено для изучения распределенных оптимизационных задач использовать функциональные уравнения вида
z(t) = f (t,A[z](t),v(t)), t e п с Rn, z e L'm = (Lp(n))m, (1)
где f (.,.) : П x Rl x Rs ^ Rm, v(.) : П ^ Rs — управляющая функция, A[.] : L^ Llq — оператор, вольтерров на некоторой системе T измеримых подмножеств П в том смысле, что У И e T значения A[z](t), t e И^ ^е от значений z(t) t e П\И. Приведенное определение [1] воль-
терровости функционального оператора является непосредственным многомерным обобщением известного определения А.Н. Тихонова функционального оператора типа Вольтерра и означает, что У И e T Ph A = Ph APh , где Ph — оператор умножения на характеристическую функцию И с п И e T
A
во-первых, ввиду того, что к ней естественным образом приводятся разнообразные управляемые начально-краевые задачи для самых различных нелинейных уравнений с частными производными, а во-вторых, потому, что такое описание распределенных управляемых систем адекватно
1 Работа выполнена при поддержке РФФИ (код проекта 07-01-00495) и аналитической целевой ведомственной программы «Развитие научного потенциала высшей школы (2009-2010 годы)» Минобрнауки РФ (регистрационный №2.1.1/3927).