Научная статья на тему 'Об устойчивой секвенциальной теореме Куна–Таккера в выпуклом программировании в равномерно выпуклом пространстве и ее приложении'

Об устойчивой секвенциальной теореме Куна–Таккера в выпуклом программировании в равномерно выпуклом пространстве и ее приложении Текст научной статьи по специальности «Математика»

CC BY
122
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫПУКЛОЕ ПРОГРАММИРОВАНИЕ / СЕКВЕНЦИАЛЬНАЯ ОПТИМИЗАЦИЯ / ПАРАМЕТРИЧЕСКАЯ ЗАДАЧА / ТЕОРЕМА КУНА–ТАККЕРА В НЕДИФФЕРЕНЦИАЛЬНОЙ ФОРМЕ / ДВОЙСТВЕННАЯ РЕГУЛЯРИЗАЦИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / НЕУСТОЙЧИВЫЕ ЗАДАЧИ / KUHN–TUCKER THEOREM IN NONDIFFERENTIAL FORM / CONVEX PROGRAMMING / SEQUENTIAL OPTIMIZATION / PARAMETRIC PROBLEM / DUAL REGULARIZATION / OPTIMAL CONTROL / UNSTABLE PROBLEMS

Аннотация научной статьи по математике, автор научной работы — Горшков Андрей Александрович

Обсуждаются устойчивая к ошибкам исходных данных секвенциальная теорема Куна– Таккера в недифференциальной форме для параметрической задачи выпуклого программирования в рефлексивном пространстве и возможности ее приложения при решении неустойчивых задач оптимального управления, обратных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON STABLE SEQUENTIAL KUHN–TUCKER THEOREM IN CONVEX PROGRAMMING IN REFLEXIVE SPACE AND ITS APPLICATION

The stable with respect to the errors in the initial data sequential Kuhn–Tucker theorem in nondifferential form for parametric convex mathematical programming problem in reflexive space and the possibility of its application for solving unstable optimal control and inverse problems are discussed.

Текст научной работы на тему «Об устойчивой секвенциальной теореме Куна–Таккера в выпуклом программировании в равномерно выпуклом пространстве и ее приложении»

A problem of calculating the optimal guaranteed result and constructing the corresponding op-timal feedback strategies is considered for a linear dynamical system controlled under disturbances is considered. The Euclidian norm of a set of motion deviations at given instants of time from given target points is optimized. Stability properties of a solving procedure based on constructing upper convex hulls of auxiliary functions from the method of stochastic program synthesis are investigated.

Key words: optimal control; differential games; stability.

УДК 519.85, 517.97

ОБ УСТОЙЧИВОЙ СЕКВЕНЦИАЛЬНОЙ ТЕОРЕМЕ КУНА-ТАККЕРА В ВЫПУКЛОМ ПРОГРАММИРОВАНИИ В РАВНОМЕРНО ВЫПУКЛОМ ПРОСТРАНСТВЕ И ЕЕ ПРИЛОЖЕНИИ

© А.А. Горшков

Ключевые слова: выпуклое программирование; секвенциальная оптимизация; параметрическая задача; теорема Куна-Таккера в недифференциальной форме; двойственная регуляризация; оптимальное управление; неустойчивые задачи.

Обсуждаются устойчивая к ошибкам исходных данных секвенциальная теорема Куна-Таккера в недифференциальной форме для параметрической задачи выпуклого программирования в рефлексивном пространстве и возможности ее приложения при решении неустойчивых задач оптимального управления, обратных задач.

Постановка задачи. Рассматриваем параметрическую задачу выпуклого программирования

(Pp, r) f 5 (z) inf) A z = b5 + p, g5 (z) ^ r, z €V C Z, p € B, r € Rm — параметры,

где f5 : V ^ R1 — липшицев строго равномерно выпуклый функционал; A5 : V ^ B — линейный непрерывный оператор; b5 — заданный элемент; g5 = (gf ,...,g^m): V ^ Rm — векторный функционал с выпуклыми липшицевыми компонентами gi, i = 1,... ,m, V C C Z — ограниченное выпуклое замкнутое множество; Z — равномерно выпуклое банахово пространство; B — рефлексивное банахово пространство; 5 € [0, 50], 50 > 0 — некоторое фиксированное число. Верхний индекс 5 характеризует ошибку задания исходных данных задачи, при этом (Pp0rr ) обозначает невозмущенную (исходную) задачу. Будем считать, что выполняются следующие оценки \f5(z) — f°(z)\, \g5(z) — g°(z)\^ K5, V z €V, \\A5z — — A°z\\ ^ K5(1 + ||z||) Vz € Z, ||h5 — h01| ^ K5 с некоторой не зависящей от 5 постоянной K> 0. Обозначим: V0£r = {z €V: \\A0z — b0 — p\\ ^ e, g0(z) ^ ri + e, i = 1,... ,m}, e ^ 0. Определим выпуклую полунепрерывную снизу функцию значений в0 : B х Rm ^ R1 U {+^}

задачи ( PPr ): fi°(p,r) = lim e£.(p,r), fi£!(p,r) = inf f°(z), @e(p,r) = +гс>, если VP£r =

£^+0 zev°^r

= Примем обозначение Lp,r(z,A,y>) = f5(z) + (A, A"5z — b5 — p) + {^,gs(z) — r) и определим

двойственную задачу Vpr(A, л) = inf LP r(z, A, л) ^ sup, (A, л) € B* х R+m, а также элемен-

p’ z£V p’

ты z* r = argmin{f0(z) : z € V0,r}, z5[A, л] = argmin{Lp,r(z, A, л) : z € V}. Обозначим через (A'P’^T, Лр’а) произвольную точку в B* х Rm, дающую на этом множестве максимум функционалу R^a(A, л) = Vp>r(A, л) — ®I|A||2 — а\л\2, (A, л) € B* х Rm.

2487

Устойчивая секвенциальная теорема Куна—Таккера. Формулируемая ниже теорема представляет собою один из возможных вариантов необходимых и достаточных условий на элементы минимизирующих приближенных решений (МПР) в смысле Дж. Варги в задаче (Pp0r ). В ней на случай, когда Z — равномерно выпуклое, B — рефлексивное пространства, распространяется устойчивая секвенциальная теорема Куна-Таккера, доказанная в [1] для полностью аналогичной задачи в случае гильбертовых Z, B.

Теорема 1. Пусть 5к 0, k -^ж — произвольная сходящаяся к нулю последовательность неотрицательных чисел. Для того чтобы в задаче (Pp r) существовало МПР ( и, следовательно, сходилось к элементу z*,r ), вне зависимости от факта пустоты или непустоты субдифференциала df0(p,r) для нее, необходимо и достаточно, чтобы существовала последовательность (Ak, лк) € B* х Rm, k = 1, 2,..., такая, что 5к||(Ak, лк)\\ ^ ^ 0, k ^ ж, и выполняются при ек ^ 0, k ^ ж соотношения

/к A,лк] € Vpr , (A,лк), Az&k A,лк] — b&k — p,g&k(z&k A,лк]) — r)) ^ 0, k ^ ж. (1)

Последовательность z5 A, лк ], k = 1, 2,..., является искомым МПР, при этом имеет место сходимость z5 A, лк] ^ z*,r, k ^ж. Как следствие соотношений (1), выполняется предельное соотношение Vf°r A, лк) ^ sup Vp°r (A,v)= f°(p,r). Одновременно,

(\,^)&B*xRrm

каждая слабая предельная точка последовательности (Ale, лк) € B* х Rm, k = 1, 2,..., если таковые существуют, является решением двойственной задачи VPr(A, л) max, (A, л) € € H х Rm. В качестве последовательности A, лк) € B* х R+™, k = 1, 2,... может быть

к к 5к aifik) 5k a($k)

взята, например, последовательность (Aк, лк) = (Ap,r , лР,г ), k = 1, 2,... при условии согласования 5к/а(5к) ^ 0, а(5к) ^ 0, k ж, вырабатываем,ая соответствующей версией метода двойственной регуляризации [1].

Приложение устойчивой секвенциальной теоремы Куна—Таккера. Теорему 1 естественно рассматривать как инструмент практического решения задач выпуклого программирования и сводящихся к ним задач оптимального управления, обратных задач. Для всех этих задач характерными свойствами являются их неустойчивость по отношению к ошибкам исходных данных и отсутствие априорной информации о пустоте или непустоте df 0(p,r) или, другими словами, о существовании вектора Куна-Таккера для них (разрешимости или неразрешимости соответствующей двойственной задачи) (см., например, [1]). Одной из таких задач является выпуклая задача оптимального управления с функциональными ограничениями для линейного параболического уравнения в дивергентной форме. Ее особеннстью является то, что функционалы, задающие ограничения типа равенства и неравенства, определяются посредством значений решений параболического уравнения в некотором дискретном наборе точек, возможно и граничных, области изменения независимых переменных начально-краевой задачи. Такая постановка предполагает естественную регулярность решений параболического уравнения, что и обеспечивается за счет применения соответствующего равномерно выпуклого пространства Z, в роли которого выступает лебегово пространство Lp с достаточно большим конечным p > 2.

ЛИТЕРАТУРА

1. Сумин М.И. Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве // Журн. вычисл. матем. и матем. физ. 2011. Т. 51. № 9. С. 1594-1615.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке РФФИ (проект № 12-01-00199-а) и Минобрнауки РФ в рамках государственного задания на оказание услуг в 2012-2014 гг. (шифр заявки 1.1907.2011).

2488

Gorshkov A.A. Gorshkov A.A. ON STABLE SEQUENTIAL KUHN-TUCKER THEOREM IN CONVEX PROGRAMMING IN REFLEXIVE SPACE AND ITS APPLICATION

The stable with respect to the errors in the initial data sequential Kuhn-Tucker theorem in nondifferential form for parametric convex mathematical programming problem in reflexive space and the possibility of its application for solving unstable optimal control and inverse problems are discussed.

Key words: convex programming; sequential optimization; parametric problem; Kuhn-Tucker theorem in nondifferential form; dual regularization; optimal control; unstable problems.

УДК 517.929.8

ОБ АСИМПТОТИЧЕСКИХ СВОЙСТВАХ РЕШЕНИЯ ОДНОЙ НЕОДНОРОДНОЙ СИСТЕМЫ С ЛИНЕЙНЫМ ЗАПАЗДЫВАНИЕМ (С Б.Г. Гребенщиков, А.Б. Ложников

Ключевые слова: линейное запаздывание; асимптотические свойства решений. Рассматривается асимптотическое поведение решения и его производной неоднородной системы дифференциальных уравнений с постоянными коэффициентами и с линейным запаздыванием.

Рассматривается неоднородная система m -го порядка с линейным запаздыванием

x'(t) = Ax(t) + Bx(^t) + f (t), t ^ t0 > 0, л = const, 0 < л < 1. (1)

Здесь A и B — постоянные матрицы размерности m х m, причем собственные значения A матрицы A имеют отрицательную вещественную часть, собственные значения р матрицы A-1B меньше единицы по модулю; непрерывно дифференцируемая вектор-функция f (t)

m

ограничена при t ^ t0, причем lim \\f' (t)\\ =0, где \\f (t)\\ = ^\fi(t)\, fi(t) — элементы

i=i

вектор-функции f (t). Норму матрицы определяем в соответствии с нормой вектора. На начальном множестве t € [лt0,t0] x(t) = ф(Ь), где ф(Ь) — непрерывная вектор-функция.

Отметим, что система первого порядка, описывающая простейшую схему колебаний токоприемника в момент прохождения эластичной опоры, рассматривалась в работе [1].

При условиях, сформулированных выше, справедливы следующие утверждения:

1) lim \\x' (t)\\ =0; 2) Решение системы (1) ограничено при 0 <t0 ^ t< ж.

Схема доказательства. Пусть t>t0/л-1. Продифференцируем обе части системы (1) по t. Получаем систему

x''(t) = Ax'(t) + fiBx' (pt) + f' (t).

Данная система — система с постоянными коэффициентами, матрица /j.A-1B имеет собственные значения меньше единицы по модулю при любом л, f (t) — исчезающая вектор-функция. Как следует из работ [2], [3], ее решение x' (t) есть также исчезающая вектор-функция, т. е. lim ||x (t)|| = 0.

Разрешим систему (1) относительно вектор-функции x(t). Имеем неоднородную разностную систему

x(t) = —A-1Bx(^t) — A-1f (t) + A-lx' (t). (2)

2489

i Надоели баннеры? Вы всегда можете отключить рекламу.