Научная статья на тему 'Гладко-аппроксимативно-выпуклый принцип и его приложения'

Гладко-аппроксимативно-выпуклый принцип и его приложения Текст научной статьи по специальности «Математика»

CC BY
87
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Тихомиров Владимир Михайлович

Доказывается принцип Лагранжа для гладкой аппроксимативно-выпуклой задачи, затем этот принцип прилагается к разнообразным классам экстремальных задач. В приложении доказываются те факты анализа (за исключением теоремы отделимости, изложенной во многих учебниках), на которых основывается принцип Лагранжа. Читателю предоставляется возможность освоить результаты важной главы теории экстремума от истоков до наших дней, фактически не прибегая к дополнительным источникам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Гладко-аппроксимативно-выпуклый принцип и его приложения»

Владикавказский математический журнал Октябрь-декабрь, 2005, Том 7, Выпуск 4

УДК 517.5

ГЛАДКО-АППРОКСИМАТИВНО-ВЫПУКЛЫЙ ПРИНЦИП И ЕГО ПРИЛОЖЕНИЯ

В. М. Тихомиров

Дорогому Семену Самсоновичу к его шестидесятилетию

Доказывается принцип Лагранжа для гладкой аппроксимативно-выпуклой задачи, затем этот принцип прилагается к разнообразным классам экстремальных задач. В приложении доказываются те факты анализа (за исключением теоремы отделимости, изложенной во многих учебниках), на которых основывается принцип Лагранжа. Читателю предоставляется возможность освоить результаты важной главы теории экстремума от истоков до наших дней, фактически не прибегая к дополнительным источникам.

Введение

Ключ к решению весьма многих конкретных задач на максимум и минимум дает универсальный прием, называемый нами принципом Лагранжа. Согласно этому принципу, если задачу удается формализовать, как задачу с равенствами и двумя типами переменных, по одному из которых отображение является гладким, а по другому имеет выпуклый (или «почти выпуклый» — «аппроксимативно-выпуклый») образ, то для получения необходимых условий экстремума нужно составить функцию Лагранжа и поступать с ней (цитируя Лагранжа) «как если бы переменные были независимы». Иначе говоря, по гладким переменным надо применить теорему Ферма, а по выпуклым — условие минимума. Многие классы экстремальных задач (включая гладкие и выпуклые задачи математического программирования, задачи классического вариационного исчисления и оптимального управления) допускают гладко-выпуклую или гладко-аппроксимативно-выпуклую формализацию, так что необходимые условия экстремума для всех перечисленных классов задач непосредственно следуют из доказываемого ниже принципа Лагранжа для гладкой аппроксимативно-выпуклой задачи. Само доказательство опирается в существенном лишь на два основополагающих факта анализа — обобщенную теорему о неявной функции (см. Приложение) и теорему отделимости выпуклых множеств.

Структура работы такова: сначала доказывается принцип Лагранжа для гладкой аппроксимативно-выпуклой задачи, затем этот принцип прилагается к разнообразным классам экстремальных задач, а в Приложении доказываются те факты анализа (за исключением теоремы отделимости, хорошо изложенной во многих учебниках), на которых основывается принцип Лагранжа. Так что читателю предоставляется возможность освоить результаты важной главы теории экстремума от истоков до наших дней, на небольшом числе страниц, фактически не прибегая к дополнительным источникам.

© 2005 Тихомиров В. М.

1. Принцип Лагранжа для гладко-аппроксимативно-выпуклой задачи

Пусть X и Y нормированные пространства, U — топологическое пространство, U — окрестность точки ж £ X, /о : U ^ R и F : U xU ^ Y. Рассмотрим задачу:

/о (ж) ^ min; F(ж, u) = 0. (P)

Функцию Лагранжа задачи (P) определим равенством

£((ж, u), А) = Ао/о(ж) + (y*, F(ж, u)),

где у* — элемент пространства Y*, сопряженного с Y, (y*, у) — действие функционала у* на элемент у £ Y, А = (Ао, у*) — набор множителей Лагранжа.

Говорят, что функция /о : U ^ R дифференцируема в точке ж и пишут /о £ D1(;r), если существует такой элемент ж* сопряженного пространства X*, что /о (ж + ж) = /о(ж) + (ж*, ж) + о(ж) для всех ж, удовлетворяющих условию ж + ж £ U. Элемент ж*, определяемый единственным образом, называется производной /о в точке ж и обозначается /о(ж). Говорят, что отображение F : U ^ Y дифференцируемо в точке ж и пишут F £ D1(i), если существует такой линейный непрерывный оператор Л : X ^ Y, что F(ж + ж) = F(ж) + Лж + г(ж) для всех ж, удовлетворяющих условию ж + ж £ U, и при этом ||г(ж)||у/||ж||х ^ 0 при ж ^ 0. Оператор Л, определяемый единственным образом, называется п'pои.зводной F в точке ж и обозначается F'(ж). Говорят, что отображение F : U ^ Y строго дифференцируемо в точке ж и пишут F £ SD 1(ж), если существует такой линейный непрерывный оператор Л : X ^ Y, что для любого е > 0 найдется число 5 > 0, для которого ||F(ж2) — F(ж1) — Л(ж2 — ж1)|у ^ е||ж2 — ж1|х, если ||ж» — ж||х <5, i = 1, 2. Очевидно, что из строгой дифференцируемости F в ж следует дифференцируемость F в этой точке и Л = F'(ж).

Скажем, что отображение F : U xU ^ Y строго дифференцируемо по ж равномерно по u в точке (ж, ж), если отображение ж ^ F(ж, ж) дифференцируемо в точке ж и при этом для всякого е > 0 найдутся такие число 5 > 0 и окрестность W точки ж, что ||F (ж2,и) — F (ж1,и) — FX (ж, ж)(ж2 — ж1)|у ^ е||ж2 — ж1|х, если только ||ж» — ж||х <5, i = 1, 2 и u £ W.

Будем говорить, что в точке (ж, u) осуществим (е, а)-микс («перемешивание»») управления u с управлением v (пишем mix (а, е, u, v)), если найдется такое семейство управлений {ue)Q,)U)V}, е > 0, а £ [0,1], что F(ж, ue,a,u,v) стремится к (1 — a)F(ж, u) + aF(ж, v) при е ^ 0, а само ue,a,u,v при a ^ 0 стремится к u (равномерно по е).

Это определение мотивировано следующим важным примером микса ue,a,u,v (•) управлений u(-) и v(^) — кусочно непрерывных или измеримых вектор-функций, определенных на отрезке [¿о,^]: отрезок делится на одинаковые отрезки длины е (кроме последнего, длина которого ^ е), а затем каждый отрезок делится на две части, длины которых пропорциональны 1 — а и а, и на первом отрезке деления ue,a,u,v(•) берется равным u(-), на втором — v(-).

Скажем, что отображение F в задаче (P) гладко-аппроксимативно-выпукло в точке (ж, ж), если отображение F строго дифференцируемо в точке ж равномерно по u, и для любых ж £ U, u, v £ W в точке (ж, u) возможно осуществить микс управления u с любым управлением v £ U.

Элемент (ж, ж) называется сильным локальным минимумом в задаче (P), если существует такое число е > 0, что /о(ж) ^ /о (ж) для всякой пары (ж, u), для которой F(ж, u) = 0 и ||ж — ж||х < е.

Теорема (Принцип Лагранжа для гладко-аппроксимативно-выпуклой задачи). Пусть X и Y — банаховы пространства, U — топологическое пространство, fo € D1 (ж), отображение F гладко-аппроксимативно-выпукло, а Fx(ü, ^X — замкнутое подпространство Y конечной коразмерности. Тогда, если (й, й) — сильный локальный минимум задачи (P), то в точке (й, й) верен принцип Лагранжа, т. е. найдется ненулевой набор множителей Лагранжа А = (Ao,y*) такой, что удовлетворяются условия стационарности:

Lx((ü, й), А) = 0 ^ Aof0(й) + (Fx(й, й))*у* = 0 (1)

и условие минимума:

min Д(й,и),А) = Д(й,й),А) ^ min(y*, F(ü, и)) = 0. (2)

u u

Отображение F (в задаче (P)) назовем гладко-выпуклым в точке (й, й), если отображение ж ^ F(ж, й) строго дифференцируемо в точке й, а подмножества F(ж, U) (образ U при отображении и ^ F-g^u)) выпуклы для всех ж € U. Очевидно, что гладко-аппроксимативно-выпуклое отображение гладко-выпукло, и потому верно

Следствие (Принцип Лагранжа для гладко-выпуклой задачи). Пусть X и Y — банаховы пространства, U — топологическое пространство, fo £ D1(ü), a отображение F гладко-выпукло и при этом подпространство Fx (й, й)Х замкнуто и имеет конечную коразмерность. Тогда, если (й, й) — сильный локальный минимум задачи (P), то в точке (й, й) верен принцип Лагранжа, т. е. найдется ненулевой набор множителей Лагранжа А = (Ao, у*) такой, что удовлетворяются соотношения (1) и (2).

Замечание. Из приводимого далее доказательства следствия можно усмотреть, что топология U не используется, так что можно в формулировке следствия считать, что U — просто некоторое множество.

< При доказательстве используются обобщенная теорема о накрытии — вариант теоремы об обратном отображении (и ее следствие — теорема Люстерника о касательном пространстве), лемма об аннуляторе ядра регулярного оператора и теоремы отделимости (конечномерная и бесконечномерная). Доказательства этих фактов (кроме теорем отделимости) приведены в конце работы.

Переходим к самому доказательству. Обозначим Fx(ü, й) через Л и ЛХ через Yi. Сначала докажем теорему в простейшем — регулярном случае, когда ЛХ = Y. Пусть ж £ КегЛ. Тогда по теореме Люстерника существует отображение t ^ r(t) окрестности нуля из R в Y такое, что F(й + tж + г(^,й) =0 и r(t) = o(t) при t ^ 0. Значит, в силу того, что (й, й) — сильный минимум, при малом t выполняется неравенство fo(й+tж+r(t)) ^ Л(й), откуда следует, что f (й),ж) = 0, и значит, по теореме об аннуляторе ядра регулярного оператора найдется элемент у* £ Y* такой, что

f (й) + Л*у* = 0. (i)

Пусть теперь v € U. Из-за регулярности отображения ж ^ F(ж,й), найдется элемент ж(^) такой, что

Лж^) + F (й, v) = 0. (ii)

Определим отображение Ф : X х R ^ Y по формуле:

Ф(ж, а) = (1 — a)F (й + ж, й) + aF (й + ж, v).

Из условия гладкости в теореме функция Ф строго дифференцируема в точке (0, 0) и Ф'(0, 0)[(ж, а)] = Лж + aF(ж, v). Мы видим, что элемент (x(v), 1) £ КегФ'(0, 0) и значит (снова по теореме Люстерника) найдутся такие p(t) = o(t) и a(t) = o(t), что

0 = Ф(ж + tx(v) + p(t),t + a(t))

= (1 - t - a(t))F(ж + tx(v) + p(t), ж) + (t + a(t))F(ж + tx(v) + p(t), v).

Теперь завершим доказательство следствия в регулярном случае, а затем вернемся к общей ситуации. По условию следствия множество F(ж + tx(v) + p(t),U) выпукло, из чего следует существование такого элемента u(t), что F(ж + tж(v) + p(t),u(t)) = 0. Следовательно, пара (ж + tж(v) + p(t),u(t)) допустима и значит, /о(ж + tж(v) + p(t)) ^ /о(ж) (в силу того, что (ж, ж) — локальный минимум), т. е.

(/о(ж),ж(^) ^ 0, (iii)

и тогда

(iii) (i) Ы (ii)

0 < (/0(ж),ж^)) = -(Л*у*, ж^)) =-(y*, Лж(v)) = (y*, F(S,v)). (iv)

Это означает, что в регулярном случае следствие доказано (ибо (i) — это условие стационарности, а (iv) — принцип минимума). Вернемся к общему случаю.

Построим в точке (ж + tж(v) + p(t),u) микс u£)t+a(t),u,v управления п(-) с управлением v(-) и подберем е и t столь малыми, чтобы {uei+a(i) g)V} £ W, a ||F(ж + tж(v) + p(t), ue i+a(i))g v ||y ^ p(t). Применив теперь обобщенную теорему о накрытии, получаем, что

F(ж + tж(v) + pi (t), u£tt+a(t),u,v) = 0,

причем

llpi (t)|x = ||p(t) + ^(ж + tж(v)+ p(t), 0, U£,t+a(t),v)||x < (1 + C)p(t) = o(t).

Таким образом, ж + tж(v) + pi(t) — допустимый элемент, и значит, /о(ж + tж(v) + pi(t)) ^ /о(ж) и, следовательно, (/(ж),ж^)) ^ 0, и далее идет выкладка (iv), завершающая доказательство теоремы в регулярном случае.

Доказательство в общем случае (когда ЛХ = Y) есть модификация проведенного рассуждения. Обозначим фактор-пространство Y/Yi через Z и пусть п : Y ^ Z — каноническое отображение. Согласно условию, Z — конечномерное пространство. Отметим, что из гладкой аппроксимативной выпуклости следует, что множество А = cl F(ж, U) (замыкание множества F(ж, U) = {y £ Y : y = F(ж, u), u £ U}) выпукло.

Имеются две возможности: либо внутренность пА не содержит 0z (вырожденный случай), либо int пА содержит 0z (невырожденный случай). (Отметим, что пА содержит 0z, ибо F(ж, ж) = 0.)

Рассмотрим сначала вырожденный случай. Тогда по конечномерной теореме отделимости существует такой нетривиальный элемент z* £ Z*, что

(z*,z) ^ 0 для любого z £ ^F(ж,U)). (v)

Положим y* = п*z*. Тогда y* = 0, так как оператор п сюръективен, а z* = 0. Положим А = (0, y*). Тогда для любого u £ U будем иметь:

т, т, (v)

(y*, F(ж, u)) = (п*z*, F(ж, u)) = (z*, ^F(ж, u))) ^ 0, (vi)

Сх{(x, и), А) = (y*,Лж) = (п*z*, Лж) = ^*,п(Лж)) d = * 0. (vii)

Соотношение (vi) — условие минимума, а (vii) — условие стационарности для лагранжиана с А = (0,y*). Принцип Лагранжа в вырожденном случае доказан.

Осталось рассмотреть невырожденный случай. Выберем конечное множество векторов {zj}j=i из n(F(ж,U)), выпуклая коническая оболочка которых равна Z. Пусть Zj = n(F(ж, Vj)) для некоторых Vj 6 U, 1 ^ j ^ m. Представляя вектор 0z как линейную комбинацию векторов Zj, 1 ^ j ^ m, с положительными коэффициентами ^j=i 0 jZj = 0, будем иметь n(^j=i PjF(ж, Vj)) = 0. Значит, существует элемент £ 6 X, для которого Л£ + ^j=i 0 jF(ж, Vj) = 0. Выберем теперь произвольный элемент v 6 Yi П F(ж, U). Тогда существует xv 6 X такой, что Лж^ + F(ж, v) = 0. Кроме того, выберем число 6 > 0 и определим отображение Ф5 : X х R х Rm ^ Y по формуле

(/ m \ m \

1 - а I 1 + 6 ^ j - e F(ж + ж, ж)

(m \ m

F(ж + ж, v) + 6 ^ (3jF(ж + ж, Vj) + ^ 0jF(ж + ж, Vj). j=i / j=i

Заметим, что это выражение представляет собой линейную комбинацию векторов F(ж + ж, ж), F(ж + ж, v), {F(ж + ж, Vj)}j=i с суммой коэффициентов, равной единице. Более того, эти коэффициенты неотрицательны, если при а > 0 числа в, • • •, вт достаточно малы. При этом строго дифференцируемо в точке (0, 0, 0) в силу строгой дифференцируемо-сти отображения F. Производная в (0, 0, 0), как нетрудно понять, дается формулой:

m

Ф'5((0,0, 0))[(ж, а, в)] = Лж + a(F(ж, v) - 6Л£) + ^вF(ж, Vj)•

j=i

Мы видим, что Ф5 сюръективное отображение и (ж^ + 6£ , 1, 0) 6 КегФ^(0, 0, 0). Применим теорему Люстерника о касательном пространстве. Из нее следует, что

Ф5 (¿(ж* + 60 + rV£ (t), t + pV£ (t), pv£ (t)) = 0

для некоторых о^)-отображений rve, pve, Де. Теперь, совершив в точке (ж+tж(v)+p(t), ж) микс mix (е, (t + pvs(t), (t)), v, Vi, • • •, vm) = u£st, выбрав e, 6 и t достаточно малыми и применив обобщенную теорему о накрытии, приходим к тому, что F (ж + t^v + 6£) + rvs(t), u£5t) = 0, где rv5(t) = o(t). Итак, построен допустимый элемент в задаче (P), причем при t ^ 0 вектор ж^) = ж + tжv + 6£ + rve5(t) сходится к ж. Значит, из локальной минимальности (ж, ж) получаем, что (/((ж),жv) ^ 0. Доказана следующая импликация:

Лжv + F(£,v) = 0 ^ (/((ж)^) ^ 0^

Возьмем теперь v = ж. Тогда /((ж) 6 (КегЛ)^. По теореме о ядре регулярного оператора /((ж) + Л*у* = 0 для некоторого y* 6 Yi*. Возьмем произвольный элемент v 6 Yi П ЛХ. Тогда получим

(y*,F(í,v)> = -(y*,Лжv) = -(Л*у0*^) = (/(ж)^) ^ 0^

Из определения конечной коразмерности Yi следует, что существуют линейно независимые элементы {y*}n=i такие, что подпространство Yi определяется равенствами

(у*, у) =0, 1 ^ г ^ п. Пусть У0 = {у : (у*, у) =0, 0 ^ г ^ п} и п0 — каноническое отображение из X в У0. Рассмотрим полупространство П = {у £ У1 : (у*, у) < 0}. Тогда п0(П) = {((,..., 0) : ( < 0}, п0(Р(ж,и) = {(п0, Пъ • • •, Пп) : П0 ^ 0}. Эти множества отделимы (из-за того, что они не пересекаются), и согласно теореме отделимости, найдется вектор (а0, од,..., ап), а0 = 1, такой, что £П=0 ^ 0 для любого п £ п0(Р(ж, и). Положим (у*, у) = £¿=0 аг(у*,у). Так как вектор (1,у*) удовлетворяет требованиям теоремы, то доказательство закончено. >

2. Приложения к конкретным классам задач

2.1. Принцип Лагранжа в математическом программировании. При выводе первых четырех теорем используется лишь следствие основной теоремы — гладко-выпуклый принцип.

Теорема 1. Пусть X и У1 — банаховы пространства, V — окрестность точки ж £ X, /г : V ^ Ж, 0 ^ г ^ т, Т : V ^ У1 и при этом выполнены требования гладкости: /г £ (ж), Т £ (ж, У!) и слабой регулярности: предполагается, что образ X при отображении Т' (ж) замкнут. Тогда, если ж является локальным минимумом задачи математического программирования:

/0(ж) ^ шш; /г(ж) < 0 (1 < г < т), Т(ж) = 0, (Р1)

то для точки ж верен принцип Лагранжа, т. е. для функции Лагранжа £(ж, А) = £1=0 ^г/г(ж) + (у*, Т(ж)) существует не равный нулю набор множителей Лагранжа А = (^0, №, • • •, ^т, у*) £ х У*, обладающих свойствами неотрицательности (^ ^ 0,

0 ^ г ^ т), дополняющей нежесткости (^¿/¿(ж) = 0, 1 ^ г ^ т) и стационарности:

п

£х(ж,А)=0 ^ Рг/г(ж) + (Т'(ж))*у* = 0.

¿=0

< При доказательстве, помимо гладко-выпуклого принципа и леммы о нетривиальности аннулятора, используется еще и лемма о замкнутости образа (см. Приложение).

Переходим к доказательству теоремы. Возможно одно из двух: или F'(i)X = Yi (вырожденный случай) или оператор F(ж) сюръективен. В вырожденном случае из леммы об аннуляторе следует, что существует y* £ (Kery* = 0. Положив А = (0,..., 0, y*), приходим к утверждению теоремы. В невырожденном случае следует положить Y = Yi х Rm, F(ж, u) = (/1(ж) + ui,..., /m(ж) + um), u = (ui,..., um), U = R^ и применить гладко-выпуклый принцип (воспользовавшись леммой о замкнутости). Из условия стационарности в гладко-выпуклом принципе получим условие стационарности в теореме 1, а из принципа минимума в гладко-выпуклом принципе получим условия неотрицательности и дополняющей нежесткости. >

2.2. Принцип Лагранжа в выпуклом программировании.

Теорема 2. Если w — решение (абсолютный минимум) задачи выпуклого программирования

/о(ад) ^ min; /i(w) ^ 0 (i = 1,...,m), ж £ А, (P2)

где /i — выпуклые функции на векторном пространстве W и А — выпуклое подмножество W, то найдется ненулевой набор множителей Лагранжа l = (1о, li,..., lm) £ (Rm+1)/ такой, что выполняются:

a) условие неотрицательности: l» ^ 0, 0 ^ i ^ m;

b) условие дополняющей нежесткости: /¿/¿(ж) =0, i = 1,..., m;

c) условие минимума (для функции Лагранжа L(w, l) = /¿(w))

min L(w, l) = L(w, l). wgA

Если для допустимой точки w выполнены условия a)-c) и lo = 0, то w — решение задачи (P2 )•

< Произведем редукцию задачи (P2) к задаче (P) для пары (/, F), положив

X = R, U = A х Rm+1, u = (w,a), w G A, а = (ao,..., ат)т, /(ж) = Ж, F(ж, u) = (^o(x,u),^i(u), . . . ,^m(u)), ^o(x,u)= /0(w) - ж + ao, ^¿(u) = /¿(w) + а», 1 ^ i ^ m.

Выполнение условий принципа Лагранжа для гладко-выпуклых задач проверяется (в силу условий выпуклости) тривиально. Применение теоремы 2 приводит к требуемому результату. >

2.3. Принцип Лагранжа для ляпуновских задач. Пусть А — промежуток числовой прямой (конечный или бесконечный), U — топологическое пространство, /» : Ахи ^ R, 0 ^ i ^ m, — непрерывные функции, Z — векторное пространство, g» : Z ^ R — функции, выпуклые для 0 ^ i ^ m' и аффинные для m' + 1 ^ i ^ m, A — выпуклое множество, V — совокупность измеримых отображений из А в U. Элемент V х A обозначим w и положим G»(w) = /д /¿(t, u(t)dt + g»(z). Задачу

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Go(w) ^ min; Gi(w) ^ 0 (1 ^ i ^ m'), Gi(w) = 0 (m' + 1 < i < m), z G A (P3)

назовем ляпуновской.

Теорема 3. Пусть в задаче (P3) все функции /» непрерывны, а функции g» выпуклы при 0 ^ i ^ m' и аффинны при m' + 1 ^ i ^ m. Тогда, если w = («(•),?) доставляет абсолютный минимум в (P3), то в этой точке выполнен принцип Лагранжа, т. е. для функции Лагранжа L(w,A) = m=o ^¿G»(w) (А = (po,..., ßm)), выполнены условия a) неотрицательности, b) дополняющей нежесткости по неравенствам, с) минимума: min^guxA L(w, А) = L(w, А).

< При доказательстве, помимо гладко-выпуклого принципа, применяется теорема Ляпунова [1, п. 4.3.2]. Произведем редукцию задачи (P3) к (P), положив X = R, U = V х A х R+, u = (u(-), z, а), а = (ao,... ,am), /o(x) = ж, F(ж,и) = (^(ж, u), ^i(u),..., ^m(u)), ^o(x, u) = Öo(u(-),z) — ж + a0, ^¿(u) = £¿^(0^) + a¿. Выполнение условий принципа Лагранжа для гладко-выпуклых задач проверяется (с учетом теоремы Ляпунова) тривиально. Применение теоремы приводит к требуемому результату. >

2.4. Пpинцип Лагpанжа для задачи Лагранжа ваpиационного исчисления.

Пусть А = [to, t1 ] — фиксированный отрезок, z = (ж^),^-)) G C 1(А, Rn) х C(А, Rr). Определим функционалы

^(z) = / /¿(^(t^uft)) dt + ^¿(ж(й),ж(^)), i = 0,1,..., m, д

где / : R х Rn х Rr ^ R, / = /¿(t, ж, u), : Rn х Rn ^ R, ^ = ^¿(fo, fi), f G Rn, i = 0,1.

Задачей Лагранжа (с фиксированным временем) называется следующая экстремальная задача:

Во(г) ^ min;

B(z) < 0 (i = 1,...,m/),

B(z) =0 (i = m/ + 1,...,m), ( 4)

ж(4) - <(i, ж(4), u(i)) = 0.

Функционалы Bi(z) называются функционалами Больца, а соотношение ж(4) — <(i, ж^), u(i)) = 0 называется дифференциальной связью. Эту задачу будем рассматривать в банаховом пространстве Z = C 1(А,Rn) х C(А,Rr); локальный экстремум в этом пространстве называется слабым.

Теорема 4. Пусть в задаче Лагранжа все функции ^ непрерывно дифференцируемы в окрестности точки (ж (¿о), z(ii)), все функции / и отображение < непрерывны вместе со своими производными /ix, /iu, , в окрестности множества {(i, ж, u) : t £ [¿о, ii], ж = z(i), u = u(i)| (условия гладкости). Тогда, если допустимая точка z = (ж (•),«(•)) £ Z доставляет слабый минимум в задаче (P4), то в этой точке выполнен принцип Лагранжа, т. е. для функции Лагранжа

L = L^^^^^Xi)) dt + l(ж(iо),ж(il)), Ja

где L = £ ™о Mi/i + ^(¿)(ж — <), l = £™о ßi^i, выполнены условия:

a) неотрицательности (ß ^ 0, 0 ^ i ^ m),

b) дополняющей нежесткости (ßiBi(z) = 0, 1 ^ i ^ m),

c) уравнения Эйлера по ж и по u (g = £™о ui/i) :

d - -

——Li(i) + Lx(i)=0 ^ —p = p<x(i) — Ао5ж(^ = 0,

L«(i) = 0 ^ p(i)<«(i) = АоZu(i).

< В доказательстве, помимо теоремы 1 и леммы о замкнутости, будет использована теорема (глобальная) существования и единственности решения задачи Коши для линейного уравнения. Полагая F (z)(-) = ж(-) — <(•, ж(-), u(^)), B(z) = (Bl(z),..., Bm(z)), F = (F, B) : Z ^ C(А, Rn) х Rm, /о = Во, представим задачу в виде

/о (z) ^ min; F(z) = 0. (i)

Если выполнены условия гладкости теоремы, то все функционалы Больца и отображение F дифференциальной связи непрерывно дифференцируемы в Z в окрестности точки z (а значит, строго дифференцируемы в этой точке). При этом F/(z)z = (F/(z)z,B/(z)z) для всех z = (ж(ОХО) £ Z, a F/(z)z = ж(-) — А(-)ж(-) — £(>(•), где A(i) = <zx(i) := <x(i, z(i), z(i)), B(i) = <u(i) = <«(i, z(i), z(i)). По теореме существования для линейных систем отображение F/(z) сюръективно (даже уравнение ж(-) — А(^ж^) = y(i) разрешимо для любой вектор-функции y(^) £ C(А, Rn)). Отображение B/(z) конечномерно, следовательно, по лемме о замкнутости образа выполнен гладко-выпуклый принцип, и значит, в силу этой теоремы принцип Лагранжа для задачи

(г) верен. Функция Лагранжа этой задачи имеет вид:

т

Дж(-), <)), р, V) = £ ^¿(г) + (V, Р(г))

¿=0

= У £(4, ж(4), и(4), р) ^ + 1(ж(40), «(¿1), р) + (V, ж(-) — ж(-), п(-))),

¿0

где £ = "=0 Рг/¿, 1 = "=0 Рг^г, р = (ро,..., Рт) € (Жт+1)', а V — линейный функционал на пространстве С (А, Ж").

Применим теорему 1 (следствие гладко-выпуклого принципа). Согласно ей существует нетривиальный набор множителей Лагранжа (р, V) такой, что выполнены условия неотрицательности, дополняющей нежесткости и стационарности: = 0, £•«(•) = 0.

Для любого ж(-) имеем:

(Дх0),ж(-)) = / (4)ж(4) ^ + Г&«(¿0) + 4 «(¿1) + (V, ж(-) — А(-)ж(-)) = 0. (гг)

Проанализируем это условие. Пусть Ж0 € Ж" и у(-) € С (А, Ж") выбраны произвольно, ж(-) найдено из условий: ж(4) = А(4)ж(4) + у(4), ж(40) = ж0, а р(-) из условий: р(4) = -А*(ф(4) + р(*1) = -4. Тогда

г ¿1 ^

)ж(^1) - р(^0)ж(^0) = J

По

= / 1ф(4)ж(4) + р(4)ж(4)) ^ = / "(Д^ж^Н р(4)у(4))

,/ ¿о ^ ¿0

откуда

Г ¿1

/ Рж(4)ж(4) ^ = - р(4)у(4) ^ + р^ж^) - р(*0)ж0-,/¿0 ^ ¿0

Подставляя это выражение в (г), и учитывая уравнение у (4) = ж(4) - А(4)ж(4), а также граничные значения, будем иметь

- /1 р(4)у(4) ^ + 4 - Р(40)ж0 + (V, у(')) = 0, (ж0,у(-)) € Ж" х С (А, Ж"),

■П0

откуда (V, у(-)) = /<01 р(4) ■ у(4) р(^0) = ¿£0. Наконец, из найденного выражения для V и из стационарности по п(-) получаем:

(£„(•), «(•)) = / 1 (¿) ■ и(4) ^ - (V, В(4)и(4))

■П0

1 -

= (£и(4) - В *(4)р(4))п(4) ^ = 0, п(-) € С (А, Жг),

откуда следует, что В*(4)р(4) =

В заключение заметим, что если р = 0, то Рж(-) =0 и = 0, а тогда и р(-) = 0. Поэтому нетривиальность набора множителей Лагранжа эквивалентна условию р = 0. >

2.5. Пpинцип Ла^анжа для задач оптимального управления. Ограничимся здесь (чтобы избежать несущественных технических осложнений) частным случаем задачи оптимального управления, а именно, простейшей задачей оптимального управления, близкой к той, что рассматривалась в монографии Понтрягина и его учеников:

Гfl

J(ж(-)) = / /(i, ж(^) di ^ min; Jto

п0 (P5)

ж = <(i,ж,u(i)), ж(i0)= жо, ж(il) = ж1, u(i) £ U.

На этом примере вполне можно продемонстрировать применимость гладко-аппроксимативно-выпуклого принципа к задачам оптимального управления.

В задаче (P5) < : V х U ^ Rn и / : V ^ R, где V — открытое множество в R х Rn и U — компакт в Rr. Функцию / и отображение < будем предполагать непрерывными. Для простоты будем рассматривать кусочно непрерывные управления (переход к измеримым управлениям требует преодоления лишь некоторых технических трудностей). Пара (ж^),^-)) допустима в задаче (P5), если ж(-) — кусочно непрерывно дифференцируемая функция, u(-) — кусочно непрерывна, в точках непрерывности u(-) выполняется равенство ж^) = <(i, ж^), u(i)) и включение u(i) £ U и, кроме того, (¿,ж^)) £ V для всех i £ [¿о,¿i]. Допустимый процесс (;?(•),«(•)) называется оптимальным,, если существует такое число е > 0, что для всякого допустимого процесса (ж(-), u(-)), для которого 11ж(•) — ж(0||с([to,tl]) < е, выполнено неравенство J(ж(^)) ^ J(#(•)).

Теорема 5. Пусть в задаче (P5) функция / и отображение < непрерывны на V вместе со своими частными производными /х и <x (условие гладкости). Тогда, если (ж(-), «(•)) — оптимальный процесс, то выполнен принцип Лагранжа, т. е. найдутся такое число Ао ^ 0 и кусочно непрерывно дифференцируемая функция p(-), не равные нулю одновременно, что для функции Лагранжа L = J^1 L(i, ж(i), Ж(i)) di, где L^^^u) = Ао/(i, ж) + р(ж — <(i, ж, u)), выполнено уравнение Эйлера по ж:

d

——Li (i) + Lx(i) = 0 ^ —p = p<x(i) — Ао/Ж(^ = 0 и условие минимума по u:

min L(i, z(i), z(i), u) = L(i, z(i), z(i), u(i))

в точках непрерывности u(^).

< Пусть X = Y = C([¿о, ¿l]) х Rr, U состоит из таких кусочно непрерывных управлений, что в точках непрерывности u(t) £ U. Это множество будем рассматривать в пространстве Li ([¿о, ¿l], Rr). Тогда исходную задачу можно записать в виде

/о(ж(0) ^ min; F(ж(-), u(^) = 0,

где /о(ж(0) = J(ж(^)), F(ж^),^-)) = (ж(i) —жо — Jt0 <(т, ж(т),u(r)) dr, ж(il)—жl). Покажем, что все условия теоремы о гладко-аппроксимативно-выпуклом принципе удовлетворяются:

a) пространства X и Y банаховы и топология в clU была введена;

b) дифференцируемость отображений, более общих чем /о, доказана в предыдущем пункте, где рассматривалась задача Лагранжа;

c) непрерывность отображения u(-) ^ fto <(т, ж(т), u(t)) dr в Li ([¿о, ¿l], Rr)

и

^ строгая дифференцируемость отображения Т равномерная по п(-) легко проверяется, если учесть, что близость кусочно непрерывных функций в ¿1 влечет равномерно малую близость этих функций, за исключением множества малой меры;

е) замкнутость и конечная коразмерность были доказаны при рассмотрении задачи Лагранжа;

£) свойство микса, построенного в начале статьи, проверяется без труда. Применение принципа Лагранжа проходит по той же схеме, что и для задачи Лагран-жа. >

Библиографический комментарий. Автором с середины шестидесятых годов руководила мысль выделить истинную суть необходимых условий экстремума во всей совокупности задач теории экстремума. Эта суть виделась мне в сочетании гладкости и выпуклости. Гладко-выпуклый принцип был впервые опубликован в книге Иоффе и Тихомирова [1] (см. также [2]). Там же был доказан некий вариант гладкого аппроксимативно-выпуклого принципа, приспособленного к задачам оптимального управления, но он оказался слишком громоздок. В той форме, которая излагается здесь, гладкий аппроксимативно-выпуклый принцип публикуется впервые. Идеология принципа Лагранжа разрабатывалась также в [3] и [4]. Прокомментируем следствия из гладко-аппроксимативно-выпуклого принципа.

Теорема 1 обобщает правило множителей Лагранжа, когда рассматривается гладкая конечномерная задача с ограничениями типа равенств (сам результат был сформулирован Лагранжем в [5] (1797 г.)), а также конечномерный вариант, с равенствами и неравенствами, доказанный впервые, по-видимому, Джоном в [6] (1948). В приведенной выше форме теорема была впервые доказана Дубовицким и Милютиным в [7].

Теорему 2 называют теоремой Каруша — Куна — Таккера. Каруш опубликовал доказательство этой теоремы в [8] (1939), но эта публикация осталась незамеченной. Теорема была передоказана Куном и Таккером в [9] (1951).

Я затрудняюсь точно сказать, кто впервые доказал теорему 3.

Теорема 4 имеет очень долгую историю. Ее изначальный вариант — уравнение Эйлера для простейшей задачи — был получен Эйлером (это уравнение заведомо содержится в [10]). Затем рассматривались изопериметрические задачи (их впервые рассматривал сам Эйлер), задачи со старшими производными (их также изучал Эйлер, а более детально — Пуассон), задачи с подвижными концами (их подробно исследовал Кнезер) и многие др. Большинство задач, попавших в многочисленные учебники по вариационному исчислению, являются следствием рассмотренной нами задачи Лагранжа. Долгое время правило множителей Лагранжа применялось к таким задачам без обоснования. Первым, за кем было признано обоснование правила множителей для задачи, сходной с задачей Лагранжа, был Майер [11] (1886), затем эту же теорему доказывали Турксма, Гильберт [12] и др. Важную роль сыграл учебник Кнезера (1900). В 1902 году Хан писал: «Метод множителей, носящий имя Лагранжа, долгое время был лишен доказательства. Первым доказательством мы обязаны Майеру. Наконец, в учебнике Кнезера доказательство Майера получило такое изложение, которое способно устоять перед всякой критикой».

Класс задач оптимального управления был определен Понтрягиным в середине пятидесятых годов прошлого столетия. Первое доказательство необходимого условия для достаточно общей задачи оптимального управления, получившее название принципа максимума Понтрягина, было получено Болтянским в 1960 году.

ПРИЛОЖЕНИЕ

Г. Г. Магарил-Ильяев, В. М. Тихомиров

Теорема (отделимости). Пусть A и B — непустые выпуклые подмножества нормированного пространства X, причем внутренность одного из них, скажем, A непуста и int A П B = 0. Тогда найдется ненулевой элемент x* £ X* такой, что supx A(x*,x) < infXgB (x*,x).

Лишь это утверждение мы оставляем без доказательства (доказательство см., например, в [14]).

Пусть X0 С X. Множество {x* £ X* : (x*,x) = 0, x £ X0} называют аннулятором X0 и обозначают X^.

Следствие 1 (Лемма о нетривиальности аннулятора). Пусть X — нормированное пространство и X0 — замкнутое подпространство X, не совпадающее с X. Тогда аннулятор X0 содержит ненулевой элемент.

<] По условию найдется ж € X\Хо. Функционал, отделяющий шар с центром в ж, не пересекающийся с Хо, будет искомым. >

Далее доказываются несколько утверждений о существовании обратных отображений и неявных функций. Основной (и по сути дела единственный) инструмент доказательства — это метод Ньютона последовательных приближений. Первое из этих утверждений равносильно теоремам Банаха об открытом отображении и обратном операторе.

Ниже будем пользоваться следующими обозначениями. Если X — нормированное пространство, то Ц (ж; X) и В (ж; X) обозначают соответственно открытый и замкнутый шары в точке ж радиуса 5; с1 А обозначает замыкание множества А.

Лемма (о правом обратном). Пусть X, У — банаховы пространства и Л : X ^ У — линейный непрерывный сюръективный оператор. Тогда существуют отображение Д : У ^ X и константа 7 > 0 такие, что Л(Д(у)) = у и ||Д(у)||х ^ т||у||у для всех у € У.

< Сначала воспользуемся теоремой Бэра (см. [14]) для построения «почти» обратного к Л. Так как Л — сюръективный оператор, то УпбМ Л(Цп(0; X)) = У. По теореме Бэра существуют такие N € ММ, у0 € У и г > 0, что Вг (у0; У) С с1(Л(Ц^(0; X))). Поскольку множество (0; X)) выпукло и центрально

симметрично, то нетрудно проверить, что этим свойством обладает и его замыкание. Отсюда легко следует, что В (0; У) С с1(Л(Ц^(0; X))).

Пусть у € У, у = 0. Тогда (г/||у||у)у € В(0; У) и поэтому найдется такой элемент ж (у) € ^(0; X),

что

-у - Лж(у)

||у||

Положим Д1 (у) = (||у||у/г)ж(у) и Д1(0) = 0. Тогда

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< г. (1)

^ 2

||Д1(у)||х < ^N = 71||у||у (2)

и (с учетом (1))

||у - ЛД1(у)||у = |у|

г

-у - Лж(у)

< ^. (3)

||у||

Для построения правого обратного к Л используем метод Ньютона. Пусть у € У. Рассмотрим последовательность

ж„ = жп_1 + Д,(у - Лжп-1), п € М, жо =0 (4)

и покажем, что она фундаментальна. Действительно, используя последовательно (4) (после применения к обеим частям этого равенства оператора Л) и (3) , а затем итерируя процедуру, будем иметь

||у - ЛжЩу = ||у - Лжп-1 - ЛДДу - Лжп-1)|у < 1 ||у - Лжп-1||у < .. .< 2П||у|к. (5)

Тогда в силу (4), (2) и (5)

||жп+1 - жп|х = ||Д1 (у - Лжп)|х < 71 |у - Лжп||у < 71|п||у (6)

2п

и, следовательно, для любых п, т € N

||жп+т - жп|х < ||жп+т - жп + т-1||х + ... + ||жп+1 - жЩх

-+1-Т + ... + -1 71»у»У < ^0

V 2п+т-^ 2п / ,1И2п

при п ^ то, т. е. последовательность {жп} фундаментальна.

Положим Д(у) = жп. Переходя к пределу в (5), получаем, что Л(Д(у)) = у. Далее, используя

(6), имеем

||жп||х < ||жп - жп-1|х + ... + ||ж1||х < ^2П-1 + ... + 1) Т1||у|к < 271 ||у||у.

Переходя здесь к пределу, получаем, что ||Д(у)|х ^ т||у||у, где 7 = 271. [>

Следствие 2 (Теорема Банаха об открытом отображении). Пусть X, У — банаховы пространства, Л — линейный непрерывный сюръективный оператор. Тогда Л — открытое отображение.

< Пусть О — открытое подмножество X. Покажем, что Л(О) открыто. Действительно, пусть у0 € У и ж0 € О такое, что Лж0 = у0. Существует такое г > 0, что Ц(ж0; X) С О. Пусть Д — правый обратный к

Л с соответствующей константой 7. Возьмем р > 0 столь малым, что р7 < г. Тогда для всех у € ир(у0; У) имеем ||Л(у)||х ^ 7||у||у < г, т. е. шар ир(у0; У) содержится в множестве Л(С) и значит, оно открыто. [>

Следствие 3 (Теорема Банаха об обратном операторе). Пусть X, У — банаховы пространства, Л — линейный непрерывный биективный оператор. Тогда обратный оператор к Л непрерывен.

< Пусть Л-1 — обратный оператор к Л. Линейность его доказывается элементарно. Проверим непрерывность. Согласно теореме существует правый обратный Л к Л. Тогда Л(Л(у)) = Л(Л- (у)) = у или Л(Л(у) — Л-1у) = 0 для любого у € У. Но Л — инъективный оператор и поэтому Л-1 = Л. Из оценки для Л следует непрерывность Л-1 в нуле и тем самым всюду. >

Следствие 4 (Лемма о замкнутости). Пусть X, У и Z — банаховы пространства, А : X ^ У, В : X ^ Z — линейные непрерывные операторы, подпространство 1т А замкнуто в У, подпространство В(Кег А) замкнуто в Z и С : X ^ У х Z, Сх := (Ах, Вх). Тогда С — линейный непрерывный оператор и подпространство 1т С замкнуто в У х Z.

< То, что оператор С линеен и непрерывен очевидно. Обозначим у = 1т А. Это — банахово пространство и значит, существует правый обратный Л : У ^ X к А : X ^ У, т. е. (А о Л)у = у и ||Лу||х ^ 7||у||у (у € У). Пусть пара (у, г) принадлежит замыканию 1тС и {хп}пем — такая последовательность, что у = ИтАхп € У,2 = ИтВхп. Положим Нп : = Л(Ахп — у). Тогда ЦЬЩх = ||Л(Ахп — у)||х ^ 7||Ахп — у||у ^ 0 и, очевидно, А(хп — ^п) = у. Поэтому В^п ^ 0 и обозначив гп = В(хп — ^п), получаем Итгп = ИтВ(хп — Ь.п) = ИтВхп = 2, т. е. г принадлежит замыканию множества Н = {£ = Вх : Ах = у}. Это множество, как легко понять, является сдвигом подпространства В(Кег А), следовательно, замкнуто. Это означает, что существует х € X, для которого Ах = у, Вх =

т. е. (у, г) € 1т С. >

Следствие 5 (о ядре регулярного оператора). Пусть X и У — банаховы пространства, А : X ^ У — линейный непрерывный сюръективный оператор. Тогда аннулятор ядра этого оператора совпадает с образом сопряженного оператора: (Кег А)± = 1т А*.

< Включение 1т А* С Кег А)х проверяется без труда. Пусть х* € (Кег А)х. Образ оператора М : X ^ У х К, Мх = (Ах, (х*,х)), замкнут по лемме о замкнутости и не совпадает с У х К (ибо (0, 1) = 1т М). Значит, по лемме о нетривиальности аннулятора существуют в = 0 и у* € У * такие, что (у*, Ах) + в(х*, х) = 0 для любого х и значит, х* € 1т А*. >

Теорема (Обобщенная теорема о неявной функции). Пусть X — топологическое пространство, У и Z — банаховы пространства, Ш — окрестность точки (ас, 2/) € X х У и Е : Ш ^ Z. Если

1) Е(ас, //) = 0;

2) отображение х ^ Е(х, у) непрерывно в точке а/;

3) отображение у ^ Е(а/, у) дифференцируемо в точке у и при этом для каждого е > 0 найдутся такие окрестности и(е) и V(е) точек х и у соответственно, что и(е) х V(е) С Ш и для всех х € и(е) и у1,у2 € V(е) справедливо соотношение

||Е(х,у1) — Е(х, у2) — Еу(х, х)(у1 — у2)|и < е||у1 — ; (*)

4) 1т Ру (х, у) = Z,

то существуют окрестности и и V точек х и у соответственно, отображение <£> : и ^ V и константа К > 0 такие, что Е(х, <^(х)) =0 и ||у(х) — у||у < К||Е(х, у)||.г для всех х € и.

< Обозначим Л = Еу(а/, у). Этот оператор удовлетворяет условиям теоремы 1. Пусть Л — правый обратный к Л и 7 > 0 такое, что ||Л(г)||у < т||г||.г для всех 2 € Z.

Пусть е = 1/27 и соответствующие ему (согласно условию 3) теоремы) окрестности и (7) и V (7) точек х и у. Пусть, далее, 5 > 0 такое, что и (у; У) С V(7). В силу условия 2) можно считать, что ||Е(х, у)||.г < 5/87 для всех х € и(7).

Положим и = и(7), V = и (у; У) и пусть х € и. Рассмотрим последовательность

уп = уп-1 — Л(Е(х, уп-1)), п € М, уо = у. (7)

Покажем, что уп € и^/4(у; У). Доказываем по индукции. Ясно, что у0 € и^/4(у; У). Пусть уп € и^/4(у; У), п = 0, 1,... , N. Покажем, что и ум+1 из этой окрестности. Из (7) следует, что

Л(ум — ум-1) = —Е(х, ум-1). (8)

Используя последовательно (8) (с оценкой для правого обратного), (8), (*) и затем итерируя процедуру, будем иметь

||ум+1 — ум||у < т||Е(х, ум)||. = т|Е(х, ум) — Е(х, ум-1) — Л(ум — ум-1)||.

1 1 (9)

< 2^ум — ум< ... < 2м ^ — у||у.

Теперь по неравенству треугольника, (9) и (7) (снова с оценкой для правого обратного) получаем, что

( 1 \ 5 5

||ум+1 - £||у < ||ум+1 - ум||у + ... + ||у1 - £||у <(+ ... + Ч ||у1 - ^ (ж,г/)|2 < 27 — = 4,

т. е. ум+1 € ^/4(2/; У) и значит, уп € ^/4(2/; У) для всех п = 0, 1,...

Последовательность {уп} фундаментальна. Действительно, по неравенству треугольника и (9)

||уп+т - уп||у < ||уп+т - уп+т-1||у + ... + 11уп+1 - уп||у

< (2п+1т-1 +... + 2п) Ь -2||у < ^ -^ ^0

при п ^ то.

Положим у(ж) = Ишп—То уп. Ясно, что у(ж) € ^5/2(2/; У). Покажем, что функция у ^ Е(ж, у) непрерывна на (ж; У). Пусть у € Ц5/2(/; У) и е > 0. Тогда, если у € (у; У), где 50 = ш1п{5/2, £7, е/2||Л||}, то легко видеть, что у € и(/; У) и мы имеем, используя (*):

||Е(ж,у)-Е(ж,у)||. = ||Е(ж,у)-Е(ж,у)-Л(у-у)+Л(у-у)||г < (27)-1|у-у|у + ||Л||||у-у||у < е/2+е/2 = е. В силу доказанного и (8)

||Е(ж, ^(ж))||я = Иш ||Е(ж, уп)||я = Иш ||Л(уп+1 - уп)||. = 0,

п—п—

т. е. Е(ж, у(ж)) = 0.

Далее по неравенству треугольника

||уп - /||у < ||уп - уп-1|у + ... + ||у1 - /||у < 27ЦЕ(ж,г/|2.

Переходя здесь к пределу, получаем, что ||у(ж) - у||у ^ К||Е(ж, г/)||.г, где К = 27. >

Следствие 6 (Теорема о поправке). Пусть X, У — банаховы пространства, и — окрестность точки ж € X, отображение Е : и ^ У строго дифференцируемо в ж и 1шЕ'(а;) = У. Тогда найдутся окрестности и0 и У0 точек ж и нуля в X соответственно, и0 + У0 С и, отображение <£> : и0 ^ V] и константа К > 0 такие, что Е(ж + у(ж)) = Е(ж) и ||у(ж)||х < К||Е(ж) - Е(ж)||у для всех ж € и0.

< Пусть и1 и такие окрестности точки ж и нуля в X, что и1 + У С и. Рассмотрим отображение Ф : и1 х У ^ У, Ф(ж, у) = Е(ж + у) - Е(ж). Проверим выполнение условий теоремы. Ясно, что Ф(ж, 0) = 0 и отображение ж ^ Ф(ж, 0) = Е(ж) - Е(ж) непрерывно в ж. Так как Фу (ж, 0) = Е'(ж), то выполняется условие 4) теоремы о неявной функции. Проверим условие 3). В силу строгой дифференцируемости Е в ж для любого е > 0 найдутся окрестности и2 С и1 и У2 С У1 точки ж и нуля в X такие, что для любых ж € и2 и у1,у2 € У2 справедливо неравенство

||Ф(ж,у1) - Ф(ж,у2) - Фу (ж, 0)(у1 - у2)||у < е|у1 - у2 ||х,

т. е. выполнено условие 3) теоремы и теперь утверждение следствия сразу следует из утверждения теоремы о неявной функции. [

Пусть М — подмножество нормированного пространства X и ж € М. Элемент Н € X называется касательным вектором к М в точке ж, если существуют е > 0 и отображение г : (-е,е) ^ X такие, что ж + ¿Н + г(£) € М для всех £ € (-е, е) и г(£) = о(£) при £ ^ 0.

Множество всех касательных векторов к М в точке ж обозначим Т^М.

Следствие 7 (Теорема Люстерника). Пусть X, У — банаховы пространства, и — окрестность точки ж € X, отображение Е : и ^ У строго дифференцируемо в ж, 1шЕ'(ж) = У и М = {ж € X : Е(ж) = Е(ж)}. Тогда Т2М = Кег Е'(ж).

< Пусть Н € Т^М и г(-) из определения касательного вектора. В силу дифференцируемости Е в ж имеем для всех достаточно малых

Е (ж + № + г(£)) = Е (ж) + <Е'(ж)Н + ) = Е (ж). (10)

Отсюда легко следует, что Е'(ж)Н = 0, т. е. Т^М С КегЕ'(ж).

Докажем противоположное включение. Ясно, что выполнены условия теоремы о поправке и пусть окрестности и0, У0, отображение <£> и константа К из этой теоремы. Пусть далее Н € Кег Е' (ж) и е > 0 таково, что если £ € (-е,е), то ж + ¿Н € и0. Положим г(£) = у(ж + ¿Н). Согласно теореме о поправке (и учитывая (10)) ||г(г)||х < К||Е(ж + ¿Н) - Е(ж)||у = К||о(г)||у = о(^) и Е(ж + № + г(^) = Е(ж), т. е. Н € Т2М. >

Литература

1. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач.—М.: Наука, 1974.—479 с.

2. Магарил-Ильяев Г. Г, Тихомиров В. М. Выпуклый анализ и его приложения.—М.: УРСС, 2003.— 175 с.

3. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление.—М.: Наука, 1979.—429 с.

4. Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по оптимизации.—М.: Наука, 1984.

5. Lagrange. Théorie des fonctions analytique.—Paris, 1797.

6. John F. Extremum problems with inequalities as subsistary conditions. (In Studies and Essais. Courant Anniversary Volume) N.Y., Interscience, 1948.—P. 187-204.

7. Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при наличии ограничений // Журн. вычисл. мат. и матем. физики.—1965.—Т. 5, № 3.—С. 395-453.

8. Karush W. E. Minima of functions of several variables with inequalities as side conditions. Chicago: Univ. of Chicago, 1939.

9. KuhnH. W., Tucker A. W. Nonlinear programming.—Berkeley: Univ. of California Press, 1951.—P. 481492.

10. Euler L. Methodus inveniendi lineas curvas proprietate maimi minmive gaudentes.—Geneva: Lausanne, 1744.

11. Kneser A. Lehrbuch der Variationsreichnung.—Draunschveig, 1900.

12. Гильберт Д. О вариационном исчислении. Избр. труды.—М.: Факториал, 1998.

13. Понтрягин Л. С. и др. Математическая теория оптимальных процессов.—М.: Физматгиз, 1961.

14. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа.—М.: Наука, 2004.—542 с.

Статья поступила 20 сентября 2005 г.

Тихомиров Владимир Михайлович, д. ф.-м. н. г. Москва, Московский государственный университет им. В. М. Ломоносова

i Надоели баннеры? Вы всегда можете отключить рекламу.