Научная статья на тему 'Свойства конуса критических направлений в задачах оптимального управления'

Свойства конуса критических направлений в задачах оптимального управления Текст научной статьи по специальности «Математика»

CC BY
83
14
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Арутюнов А. В., Черникова Н. К.

В работе изучается конус критических направлений, возникающий при исследовании задач оптимального управления с геометрическими ограничениями на управляющий параметр. Получена формула для замыкания указанного конуса

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Свойства конуса критических направлений в задачах оптимального управления»

УДК 519.3

А. В. Арутюнов, Н. Ю. Черникова

СВОЙСТВА КОНУСА КРИТИЧЕСКИХ НАПРАВЛЕНИЙ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ1

(кафедра системного анализа факультета ВМиК)

При теоретическом и численном исследовании задач оптимального управления большую роль играют необходимые условия второго порядка. Они заключаются в том, что максимум некоторого семейства квадратичных форм неотрицательно определен на конусе (конусе критических направлений) /С, лежащем в бесконечномерном пространстве. Например, для задач оптимального управления с геометрическими ограничениями на управления конус /С определяется конечным числом поточечных линейных неравенств в пространстве то-мерных вектор-функций L™[io,ii]- При этом указанная функция максимума непрерывна и поэтому ее неотрицательность естественно рассматривать на замыкании конуса /С. Таким образом, возникает проблема описания замыкания конуса /С, исследованию которой применительно к задачам оптимального управления и посвящена эта заметка. Начнем с абстрактных построений.

Пусть X — нормированное пространство и С С X — выпуклый замкнутый конус. Даны отображения F\ : X —у Rfcl, F2 : X —У Жк2 и функция / : X —> R1 (к\ и к2 заданы). Рассмотрим следующую экстремальную задачу:

/(ж) —^ min, ж £ С, F\ (ж) ^ 0, F2(x) = 0. (1)

(Как обычно, вектор из Rfcl считается неотрицательным, если все его координаты неотрицательны.)

Приведем для задачи (1) необходимые условия второго порядка. Пусть жо £ X является локальным минимумом в задаче (1). Будем предполагать, что отображения / и F\, F2 дважды непрерывно дифференцируемы в окрестности точки Положим к = к\ + к2> и пусть F = (F\, F2) : X —> Y = Жк.

Обозначим через Тс(жо) касательный конус к конусу С в точке xq. Он, как известно, имеет вид Тс(хо) = cl(C + spanjso}), где span обозначает линейную оболочку, a cl — замыкание множества. Пусть X* — пространство, топологически сопряженное к X, а С0 = {ж* £ X* : (ж*, х) ^ 0 Ух £ С} — полярный конус к конусу С. Тогда, как известно, N(xo,C) = {ж* £ С0 : (ж*,жо) = 0} — нормальный конус к конусу С в точке xq.

Рассмотрим функцию Лагранжа

С(х, А) = А0/(ж) + (X1iF1(x)) + (X2iF2(x)).

Здесь А = (Ло, Ai, Л2), где Ао £ К1, Ai £ А2 £ Шк2 — множители Лагранжа. Обозначим через

А = А(жо) множество нормированных множителей Лагранжа А, отвечающих точке жо в силу принципа Лагранжа:

|§(Жо,А)е-ЛГ(яо,С),

.Ао ^ 0, Ai ^0, (А1,^1(жо)) = 0, |А| = 1. 1 >

(В западной литературе функцию Лагранжа С часто называют обобщенным лагранжианом.) Определим конус /С = /С(жо) по формуле

Г /дf \ dF dF

/С(ж0) = <h £ С + 8рап{ж0} : (j^(xo),h)<:0, -^-(xo)h = 0, -^-(x0)h iC 0 Vj : Fhj(x0) = О

Здесь Fij — координаты вектор-функции F\. Конус /С, очевидно, непустой (0 £ /С) и выпуклый.

Опуская неактивные индексы ограничений типа неравенств, для удобства формулировок далее будем считать, что Fi(xo) = 0.

Положим N = С П (—С) (и значит, N — максимальное линейное подпространство, лежащее в С). Рассмотрим множество тех множителей Лагранжа А £ Л, для каждого из которых существует такое (зависящее от А) линейное подпространство П С N, что

dF З2 С

codimjv П < к, ПС Кег ——(ж0), )> Ж1 ^ 0, \/ж £ П. (3)

ох охг

1 Работа выполнена при финансовой поддержке РФФИ, грант № 05-01-00193.

Здесь сосЦтдг означает коразмерность относительно подпространства N. Множество таких множителей Лагранжа обозначим через Аа = Ла(жо).

Теорема 1 (экстремальный принцип). Пусть в рассматриваемой задаче (1) точка жо является локальным минимумом. Тогда множество Ла(жо) непусто и, более того, имеет место соотношение

д2С

тах— (ж0, А)[/г,/г] ^ 0 У/г 6 К, = /С(ж0). (4)

А£Ла ох

Теорема 1 доказана в [1]. Она дает для задачи (1) необходимые условия минимума второго порядка, которые справедливы без априорных предположений нормальности точки жо (условия регулярности Робинсона) (подробности см. в [1, 2, 3]).

В условии (4) важную роль играет структура конуса /С(жо). Дело в том, что он, вообще говоря, может оказаться незамкнутым. Это является следствием того, что если конус С не является конечно-гранным (т.е. не описывается конечным числом линейных неравенств), жо принадлежит границе С и Жо ф 0, то конус С + зрап{жо}, участвующий в определении /С, не обязан быть замкнутым. В то же время справедлива

Лемма 1. Множество Ла(жо) компактно, а функция и : X —> М1, ш(ж) = тах ^^-(жо, А)[ж, ж]

А£Ла

полунепрерывна сверху.

Доказательство. Докажем замкнутость Ла. Пусть {А^} С А, A¿ —> А, г —> оо. Докажем, что А Е Ла. Действительно, пусть замкнутые линейные подпространства Щ отвечают Аi в силу определения множества Ла. Тогда для всех г имеет место

Iii С N, Iii С Кег (жо), codimjv Щ ^ /г, д (жо, А)[ж, ж] ^ 0 Уж G Пi

9F, ч „ , д2С

— (ж0), codimjv Iii ^ к, —

В силу теоремы 4.4 из [2, гл. 1] существует такое замкнутое подпространство П С N, что codimjv П ^ к и для Уж G П : G Ilj Уi, и, кроме того, ж является предельной точкой последовательности {xi}.

Отсюда уже непосредственно вытекает, что П С Кег4^(жо), А)[ж, ж] ^ О Уж G П и, следова-

тельно, А G Аа. Компактность Ла доказана.

Пусть hi —> /г, i —> оо. Возьмем Аi G Аа, на котором реализуется максимум по А G Аа функции А —т- ^§-(жо,А)[hi,hi]. Переходя к подпоследовательности, будем считать, что Аi —> А. Тогда А G Ла => и(h) ^ |^#(ж0,А)[h,h], С другой стороны, uj(hi) |^#(ж0,А)[h,h] => и(h) ^ lim uj(hi).

i—»oo

Полунепрерывность сверху функции uj, а вместе с ней и лемма доказаны.

Из леммы 1 вытекает, что неравенство в (4) справедливо для всех h G с1/С(жо). В связи с этим возникает естественный вопрос: верно ли, что

Г / д f \ dF dF Л

с1/С(ж0) =£{х0) = lh G с1(С + 8рап{ж0}) : ( -±{x0),h\ ^ 0, —L(xo)h^0, -^-(x0)h = o\. (5)

Следующий пример дает на этот вопрос, вообще говоря, отрицательный ответ. Пример. В R3 рассмотрим выпуклое множество {ж = (ж!,ж2,жз) : Ж2 ^ х\, Ж3 = 1}, и пусть С — его замкнутая коническая оболочка. Рассмотрим задачу

/(ж) = Ж2 — х\ —> min, ж G С, жз — 1 = 0.

Непосредственно проверяется, что жо = (0, 0,1) — решение этой задачи и JC(xq) = {0}. В то же время h = (1, 0, 0) G К(х0) и, значит, (5) нарушается. Отметим также, что в этом примере А)[h, h] < 0

УА G Аа, так как Ао > 0 УА G Ла.

Хотя в общем случае (5) нарушается, тем не менее в некоторых важных приложениях, а именно для конусов С С L™[to,ti], возникающих в задачах оптимального управления с ограничениями на управления (см. [4]), условие (5) выполняется всегда. Обоснование этого утверждения (оно составляет основную цель настоящей заметки) основано на следующем простом факте.

Л е м м а 2. Пусть заданы выпуклый конус М С X и линейный непрерывный оператор А : X —> Rs. Тогда, если А(М) = Rs, то имеет место

с1МП Кег А = с\(МП Кег А). (6)

Доказательство. Включение clMflKerA D cl(MflKerA) очевидно. Докажем обратное включение. Пусть жо G cl М П Кег А. Тогда Axq = 0 и С М : Х{ —> жо, г —> оо. Положим

Уг = Ах{. Тогда у1 —т- Ах о = 0, г —т- оо. Поэтому, учитывая предположение А(М) = по теореме Банаха для конусов (см. [5, с. 484-485]) получаем, что 3{Д^} С М : AД¿ = — А^ —О, г —оо. Положим XI = ж^+Д^. Тогда ж¿ £ М, Ах1 = 0 => ж¿ £ МПКег А. Кроме того, ж¿ —> жо, г —> оо => жо £ с1(МПКег А). Лемма доказана.

Замечание. Утверждение леммы очевидно остается в силе, если А(М) является линейным подпространством в

Перейдем к описанию конуса критических направлений /С, возникающего при исследовании задач оптимального управления с ограничениями типа неравенств на управления. Пусть заданы q £ [2, +оо] и натуральные к, то, га, во ^ 5. Обозначим через Ь пространство определенных на отрезке [0,1] то-мер-ных вектор-функций и(-), лежащих в пространстве 0,1]. Пространство Ь наделяется нормой из Пусть заданы функции £ , I = 1, к + в, и векторы a¿ £ М", i = 1, е. Положим

С- = {и £ Ь : «С О = ТД}, 1 = Мпх1, С = 1"хС_,

где означает "для почти всех На X определим линейные функционалы : = (а^,^) +

1 _

+ /(^+¿(0^(0) ^ з = мо

Пусть задана функция щ £ С_. Указанный выше конус критических направлений имеет вид

/С = {(£, и) е X \ и £ С_ + span{M0}, и) ^ 0, j = 1, s0, и) = 0, j = s0 + 1, s}. Положим

Г, = {i £ [0,1] : (rj(t), uo(t)) = 0}, j = M?. Теорема 2. Имеет место

с1К = {(£,и) еХ: 0ШеТ3, з = 1, к,1^,и) <С О, ¿ = М„, /,(е,и) = о, ^ = 50 + 1, в}.

(7)

Доказательству теоремы предпошлем две леммы. Вначале введем следующие обозначения. Для р £ [/г, к + в] положим

i?p = {и £ L : (r-j(t), u(t)) ^ 0 Vi, j = 1, к, (rj(t), u(t)) = 0 Vi, j = к + l,p},

Rp = {ueL: (rj(i),ti(i)) ^ 0 Vi £ Tj, j = l,k, (rj(t),u(t)) = 0 Vi, j = к + 1, p}.

Отметим, что R& = C_.

Лемма 3. Пусть щ £ i?p. Тогда

cl (Др + span{M0}) = Rp. (8)

Доказательство. В (8) включение С очевидно. Докажем обратное включение. Возьмем и £ L: (rj(t), m(î)) ^ 0 Vi £ Tj, j = 1, /г, (rj(t), m(î)) = 0 Vi, j = /г + Для j £ {1,..., /г} и натуральных г положим

к

Tjti = {t : -1/г iC (rj{t),u0{t)) < 0} U {i : |й(*)| > г}, Гг = (J Т^.

i= 1

В силу непрерывности меры Лебега mes имеем

mesTi —т- 0, г —> оо. (9)

Положим

Тогда в силу (9) tij и, г —> оо. Покажем, что щ £ Rp + spanj^o} Уг. Действительно, положим

й = max ess sup \(rj(t), u(t))\ , a = ia.

Пусть j £ {1 Тогда для t Т{ имеем (rj(t),uo(t)) < —1/г (rj(t),Ui(t) + auo(t)) =

= (rj(t),u(t)) + a(rj(t),uo(t)) ^ a — a = 0, а для t £ Tj по построению ^¿(i) = 0, откуда

(rj(t), Ui(t) +сгао (t)) ^ 0, так как по условию щ G Rp■ Если же j G {к +1,..., fc + s}, то (rj(t), uo(t)) = О, (rj(t),u(t)) = 0 Vi => (rj(t),Ui(t) + auo(t)) = 0 Vi. Лемма доказана.

1

Пусть r G L™. Определим на L линейный функционал l: l(u) = f (r(t), u(t)) dt.

о

Лемма 4. Пусть щ G R = i?p и

/(и) ^ 0 Vu е Д + span{M0}. (10)

Тогда имеет место

cl (R П Ker l + span{M0}) = с1(Д + span{M0}) П Ker l. (11)

Доказательство. Положим J(t) = {j : 1 ^ j ^ k, t G Tj},

R(t) = {y G Mm : (r3(t), y) ^ 0 Vj G J(i), (r^i), y) = 0, j = TT^p}.

Тогда очевидно

Rp = {и G L : u{t) G R{t) Vi}. (12)

Из (10) вытекает, что l(u) (0 VuE cl(i2 + span{îio}). Поэтому в силу (12) и леммы 3

1

J(r(t),u(t))dt<^ 0 Vu G L : u(t) G R(t) Vi. (13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о

Покажем, что r(i) G R°{t) Vi. Действительно, в силу теоремы 1.7.6 из [6] многозначное отображение t —> {и G i?(i) : |и| ^ 1} измеримо. Поэтому в силу теоремы 1.7.8 из [6] это многозначное отображение имеет счетное множество таких измеримых однозначных ветвей что множество

U Ui(t) всюду плотно во множестве {и G R(t) : |и| ^ 1} для почти всех t. Отсюда в силу (13) i

вытекает, что r(t) G R°(t) Vi. Следовательно, в силу (12) для произвольного и G Rp имеет место /(и) = 0 (r(t), u(t)) = 0 Vi. Таким образом, учитывая, что R С Rp, имеем

{и G R : (r(t),u(t)) = 0 Vi} = i? П Ker /, {u G Rp : (r(i), u(i)) = 0 Vi} = Др П Ker(14) Положим rp+i = г. Из (10) следует, что 1(ио) = 0. Учитывая это, имеем

cl((i? + span{îio}) П Ker /) = cl(i? П Ker l + span{îio}) ==

= : (rj(t),u(t)) iC 0 Vi, j = IД (rj(t),u(t)) = 0 Vi, j = k + l,p+l} + span{Mo}^ =

(=' {u : (rj{t),u{t)) ^ 0 Vi G Tj, j = M?, (^-(i), «(i)) = 0 W, j = fc + l,p+l} =

= {и G Rp : (r(i),u(i)) = 0 Vi} = Rp П Ker l = cl(i2 + span{M0}) П Ker l.

Q H <C) MA\ И о TT

Здесь равенства = и = вытекают из (14), а равенства = и = вытекают из леммы 3. Лемма доказана.

Перейдем непосредственно к доказательству теоремы 2. Во-первых, для каждого (£, й), удаляя из системы неравенств lj(^,u) ^ 0 соответствующие им неактивные индексы (т.е. j: lj(^,u) < 0), будем считать, что so = 0. Иными словами, можно считать, что в определении конуса /С неравенства lj(Ç,u) ^ 0 отсутствуют. Далее, для простоты при доказательстве ограничимся лишь случаем п = 0 К" = {0}, С = С- (доказательство в общем случае проводится аналогично). Докажем формулу

cl (С + span{M0}) Р) Ker/j = cl((C + span{M0}) Р) Ker/j). (15)

i i

Учитывая, что С = перепишем (15) в эквивалентном виде:

к + span{M0}) Ker lj = cl((Rk + span{M0}) Ker lj). (16)

i i

Для доказательства (16) рассмотрим два случая. Положим М = R& + spanjiio} и определим линейный оператор А : L —> Rs по формуле (Au)j = lj(u), j = l,s. Очевидно, A(M) — выпуклый конус.

Пусть вначале А(М) = Rs. Тогда (16) вытекает из леммы 2. Рассмотрим второй случай: А(М) ф Rs. Тогда по теореме отделимости, примененной к выпуклому конусу А(М), существуют

s

такие неравные одновременно нулю A j, что для I = A jlj выполняется (10) при R = RНе теряя

з=1

общности, будем считать, что I = 1\. Имеем

cl(i?& + spanjiio}) P|Ker/j= ( c\(Rk + spanjiio}) П Kerl\ p| Ker 13 = i ^ ' 2

=' cl(i?fc П Ker l\ + spanjiio}) P Ker lj = cl(i?fc+i + spanjiio}) pKer/j,

2

(*)

где равенство = вытекает из леммы 4. Итак, доказано, что

cl(Rk + span{M0}) Р Ker/j = cl((ßfc+i + span{M0}) pKer/j).

1 J>2

Кроме того, щ G Таким образом, доказательство (16) сведено к доказательству аналогичного

равенства, но уже для Rk+i и с количеством линейных функционалов lj на единицу меньшим, чем в (16), т.е. этих функционалов остается s — 1 штук. Повторяя проведенные рассуждения не более чем s — 1 раз, завершаем доказательство (16), а вместе с ним и (15). Справедливость (7) вытекает из (15) и леммы 3 при р = к. Теорема доказана.

СПИСОК ЛИТЕРАТУРЫ

1. Арутюнов A.B. Необходимые условия экстремума и теорема об обратной функции без априорных предположений нормальности // Тр. матем. ин-та РАН. 2002. 236. С. 33-44.

2. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М., 1997.

3. Bonnans J.F., Cominetti R., Shapiro A. Second order optimality conditions based on parabolic second order tangent sets // SIAM J. Optim. 1999. 9. N 2. P. 466-492.

4. Арутюнов А. В., Верещагина Ю. С. О необходимых условиях второго порядка в задачах оптимального управления // Диф. ур-ния. 2002. 38. № 1. С. 1443-1450.

5. Арутюнов A.B. Накрывание нелинейных отображений на конусе в окрестности анормальной точки // Матем. заметки. 2005. 77. Вып. 4. С. 483-497.

6. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М., 1977.

Поступила в редакцию 10.10.05

i Надоели баннеры? Вы всегда можете отключить рекламу.