2014
УДК 519.853
Доклады БГУИР
№ 5 (83)
УСЛОВИЯ РЕГУЛЯРНОСТИ В ЗАДАЧАХ НЕЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Л. И. МИНЧЕНКО, А. Е. ЛЕЩЕВ
Белорусский государственный университет информатики и радиоэлектроники П. Бровки 6, Минск, 220013, Беларусь
Поступила в редакцию 22 января 2014
Условия регулярности играют важную роль в задачах нелинейного программирования, поскольку гарантируют выполнение необходимых условий оптимальности Куна-Таккера. Среди условий регулярности наиболее известным и широко применяемым является условие Мангасаряна-Фромовица. В то же время, несмотря на сравнительную эффективность условий Мангасаряна-Фромовица, существуют достаточно широкие классы задач оптимизации, в которых это условие не выполняется, однако для которых можно указать более слабые условия регулярности, гарантирующие справедливость необходимых условий Куна-Таккера. Целью данной статьи является исследование задач оптимизации, удовлетворяющих ослабленным условиям регулярности.
Ключевые слова: оптимизация, нелинейное программирование, условия регулярности.
Введение
Пусть h i=1> ■■■> Р - непрерывно дифференцируемые функции из Rm в R. Введем непустое множество допустимых точек
C = {y е Rm | h(y) < 0 i е I , h(y) = 0 i е I0}, где /={1, ..., я}, h={s+1,..., p} или /0=0, и рассмотрим задачу NLP минимизации непрерывно дифференцируемой целевой функции f (y) на множестве С.
Пусть I(y) = {i е 11 h (y) = 0} - множество индексов активных в точке y е C ограничений типа неравенства. Для задачи NLP определим в точке y е C множество множителей Лагранжа
A(y) = {Яе Rр | Vf(y) + Щ (y) = 0, Я, > 0 i е I(y), X, = 0 i е I \ I(y)}.
i=i
Известно, что основным необходимым условием оптимальности для задачи NLP является условие Куна-Таккера: если точка y е C является локальным решением задачи NLP, то в данной точке существуют множители Лагранжа, то есть A(y) ^ 0 . Проверка выполнения условия Куна-Таккера позволяет исключить из рассмотрения неоптимальные допустимые точки. Ключевое значение условия Куна-Таккера заключается также в том обстоятельстве, что на его основе строятся многочисленные вычислительные алгоритмы для нахождения оптимальных точек. Однако условие Куна-Таккера справедливо только при выполнении некоторых дополнительных требований к структуре ограничений множества допустимых точек C, так называемых условий регулярности (constraint qualifications or regularity conditions). Таким образом, условие Куна-Таккера теряет свой смысл в исследовании задачи оптимизации NLP , если в данной задаче не выполнены условия регулярности.
Наиболее общие условия регулярности формулируются в терминах касательных конусов к множеству допустимых точек. Введем касательный и контингентный конусы
(называемые также в литературе соответственно нижним и верхним касательными конусами) к множеству С в точке y бС :
TC (y) = {y g Rm | Зчисло t0 > 0 и функция o(t) такие,
что o(t)/1 ^ 0 при t ^ 0 и y + ty + o(t) gC Vt g[0, t0]},
Tc{y) = {y^Rm\^h^ç> u Ук^у такие,что y + tkyk&C k = 1,2,...}, и касательный конус Кларка
TC (y) = {y g Rm | Vtk i 0 и Vyk ——y
3 последовательность yk ^y такая, что yk + tkyk gC Vk = 1,2,...}. В точке y G С также построим множество
Гс (y) = {y g RmKVhi(y), y)< 0 i g I ( y), (Vht(y), y) = 0, i g ¡0},
которое будем называть линеаризованным касательным конусом к множеству С в данной точке. Известно, что все введенные выше касательные конусы замкнуты и
rcc/(/)Crc(/)efc(/)erc(/).
Говорят, что в точке у е С выполнено условие регулярности Абади (Abadie), если Тс (у) = Гс (у). Хотя условие Абади имеет весьма общий характер и накладывает на
ограничения множества С сравнительно нежесткие требования, это условие практически не проверяемо. Одним из наиболее известных простых в проверке условий регулярности является условие линейной независимости в точке y g С градиентов Vhz- (y) i GI(y) ^ I0 всех
активных в этой точке ограничений (будем обозначать его как LICQ). К достоинствам данного условия регулярности относится также простота множества множителей Лагранжа в случае его выполнения в точке y, именно Л(у) = {À,} . Недостатком условия LICQ является его жесткий характер, данное условие может не выполняться уже в достаточно простых задачах. Более общий характер носит условие регулярности Мангасаряна-Фромовица (MFCQ) , выполнение которого в точке y G С требует, чтобы в этой точке система векторов Vh. (y) i GI0 была
линейно независимой и существовал вектор y0 такой, что (Vh (У), У° ) = 0, i GI0, (Vh, (y), y0 )< 0, i g I(y).
При выполнении условия MFCQ в точке y G С множество Л(у) ограничено и замкнуто. Введем множество вырожденных множителей Лагранжа в точке y G С :
\(y) = {^G R'| £ l,Vh, (y) = 0, Xt > 0 i G I(y), Xt = 0 i G I \ I ( y)} .
i=1
Известно, что условие регулярности Мангасаряна-Фромовица (MFCQ) в точке
y G С равносильно требованию Л (У) = {0}. Несмотря на широкую общность условия MFCQ
и то, что оно достаточно удобно для проверки, существуют целые классы задач нелинейного программирования, в которых это условие не выполняется и для которых требуются условия регулярности более слабые в отношении жесткости требований к ограничениям задачи. Дальнейшая цель данной статьи - предложить слабые условия регулярности, обобщающие условие MFCQ, и исследовать взаимосвязь данных условий.
Ранговые условия регулярности
В литературе известны условия регулярности независимые от MFCQ и имеющие природу отличную от MFCQ. В частности, к ним относятся условие постоянного ранга (CRCQ) и обобщающее его условие ослабленного постояннного ранга (RCRCQ) [1-4]. Говорят, что в
точке y0 G С выполняется условие регулярности постоянного ранга (CRCQ), если для любого
множества индексов J = K ^ S, где K С I(y°), S С I0, система векторов { Vh. (y), i е J }
имеет постоянный ранг в некоторой окрестности этой точки.
Впервые условие регулярности постоянного ранга CRCQ было предложено при изучении дифференцируемости по направлениям функции оптимального значения в задаче нелинейного программирования с возмущениями параметров. В дальнейшем это условие использовалось в исследовании задач с равновесными ограничениями (equilibrium constraints) , двухуровневой оптимизации (bilevel optimization) , теории вариационных неравенств, необходимых условий второго порядка. Легко видеть, что данное условие, как и MFCQ, является обобщением условия регулярности LICQ. В то же время, примеры показывают, что условия CRCQ и MFCQ независимы друг от друга, то есть выполнение одного из них не влечет выполнение другого.
В работах [1-4] получено ослабленное условие постоянного ранга (RCRCQ), которое слабее в своих требованиях по сравнению с CRCQ и существенно легче для проверки. Говорят,
что в точке y° е C выполняется ослабленное условие постоянного ранга (RCRCQ), если для любого множества индексов K СI(y°) система векторов {Vh. (y), i е K ^I0} имеет
постоянный ранг в некоторой окрестности точки y .
Таким образом, в отличие от CRCQ в условии RCRCQ рассматривается существенно меньшее множество различных систем градиентов Vh. (y). Отметим, что на RCRCQ
переносится справедливость основных приложений CRCQ. В частности, при выполнении условия RCRCQ в работе [4] были доказаны теоремы о дифференцируемости по направлениям функции оптимального значения в задаче с возмущениями параметров и получены сильные достаточные условия оптимальности второго порядка. Большой интерес в свое время вызвала работа L. Qi и Z. Wei, в которой для доказательства сходимости численных алгоритмов оптимизации было введено условие постоянной положительно-линейной зависимости (CPLD), обобщающее одновременно условие регулярности Мангасаряна-Фромовица и условие постоянного ранга.
Говорят, что допустимая точка y0 удовлетворяет условию CPLD, если она удовлетворяет условию регулярности Мангасаряна-Фромовица или, в противном случае, для всех подмножеств индексов J СI(y0), J2 СI0, и чисел Яг i е J ^ J2 таких, что
я, >0 i е Ji и 2 я,Vhi(y0) = 0, >0,
ieJl wJ2 ieJl ie^2
система векторов Vht (y) i е Ji ^ J2 является линейно зависимой при всех y из некоторой -1,0
окрестности y .
L.Qi и Z.Wei выдвинули предположение, что CPLD должно быть условием регулярности, т.е. гарантировать существование множителей Лагранжа в точках локального минимума задачи NLP. Позже R.Andreani, J.M.Martinez и M.Schuverdt доказали справедливость данной гипотезы. Различные аспекты приложений RCRCQ и CPLD и их связь с другими условиями изучались в [5-9].
Хотя условие CPLD обладает широкой общностью, его выполнение не влечет за собой выполнение RCRCQ и возникает вопрос о его соотношении с известными ранее условиями регулярности ослабленного постоянного ранга. Позже на основе развитого в [3-4] метода было получено новое условие, названное ослабленным CPLD (или RCPLD). Однако в работе [10] было предложено и обосновано новое условие регулярности, названное ослабленным (обобщенным) условием Мангасаряна-Фромовица (RMFCQ). RMFCQ представляет собой условие не только более слабое по отношению к MFCQ, но и относительно CRCQ и RCRCQ, а также CPLD и RCPLD. Условие RMFCQ также обладает значительным преимуществом в практическом применении по сравнению с CRCQ, RCRCQ, CPLD и RCPLD , сохраняя при этом их основные достоинства, к которым, в первую очередь, относится хорошая обусловленность
(сохранение условия регулярности и в некоторой окрестности исследуемой точки) и наличие эффективных оценок расстояния до множества допустимых точек.
Отметим, что несколько позже условие регулярности, RMFCQ было независимо введено в работе [11] под названием CRSC (constant rank of the subspace component condition). Следуя [10], дадим определение условия RMFCQ и исследуем некоторые свойства точек, в которых RMFCQ выполняется.
Представим множество индексов I(y) в точке y G С в виде разбиения на два
множества I(y) = Ia (y) u I + (y), где Ia (y) ОI + (y) = 0 и множество Ia (y) состоит из тех и
только тех индексов i GI(y), для которых (Vht (y), y) = 0 для всех y е^ (y), а
I + (У) = I(y)\Ia(y).
Определение 1. Будем говорить, что в точке y° G С выполнено ослабленное условие регулярности Мангасаряна-Фромовица RMFCQ, если система векторов {Vht(y), i G I0 u Ia(y)} имеет постоянный ранг в некоторой окрестности этой точки. Непосредственно из определения индексного множества Ia (y) вытекает следующая лемма.
Лемма 1. Пусть y° G С. Тогда существует вектор y0, такой, что (Vh,(y0), У0 ) = 0 i GI0 uIa(y°), (Vh, (y0), y°)< 0 i GI+ (y0).
Доказательство. В случае если I+ (y) = 0, оно будет выполнено тривиально. Пусть I+ (y) Ф0. Пусть i GI+ (y). Тогда (Vht (y), y)< 0 для всех y еГс (y). С другой стороны i £ Ia (y), следовательно, найдется вектор У еГС (y) , такой, что (Vht (y), y1 )< 0 . Построим вектор y0 = £ tiyl , где все t. > 0. Тогда y0 еГС (y) , и для любого k GI+ (y).
ieI + ( У )
Получим {Vhk (y), y0) = £ t,(Vhk (y), y) = £ t,(Vhk (y), y) + tk{Vhk (y), yk) < 0.
ieI +( y) ieI +( y)\k
Из леммы 1 следует, что для любой точки y0 G С имеет место Утверждение 1. Пусть y0 G С . Тогда г1Гс(y°) = {y е Rm I (Vh,(y0), y) = 0 i g I0 uIa(y0), (Vh,(y0), y) < 0 i g Г (y0)}, aff Гс(y0) = {y g Rm I (Vh,(y0),y) = 0 i g I0 uIa(y0)}.
Будем называть ограничения с индексами i G Ia (y) существенно активными для множества Г (у) .
Следующая лемма получается незначительной модификацией теоремы 17.7 [12]. Лемма 2 . Пусть y е С. Для того чтобы i G Ia (y) достаточно, чтобы существовал вектор ХеЛ^ (y) такой, что \> 0. Если Ia (y) Ф0, то данное условие является и необходимым.
Пусть y0 е С . Рассмотрим индексное множество I# такое, что Ia(y0) ^I# ^I(У°). Введем множество С# = {y g Rm | h. (y) < 0 i g I# , h. (y) = 0 i g I0} . И его линеаризованный касательный конус в точке y° е С
(у0) = е Ят\(Щ (у"), у)< 0 I е Г, (Щ (у"), у) = 0, I е 10].
Обозначим через 1а#{ У0) множество индексов всех существенно активных ограничений для Гс (. Иными словами, пусть
1а#(у°) = {I е 1#\ (УН,(у0),у) = 0 Чу еГся(у0)}.
Лемма 3. Пусть 1а (у0) с 1 # с 1(у0). Тогда 1а (у0) = 1а#(у°).
Доказательство. Покажем, что 1а(у°) с 1а#(у°) . Действительно, если 1а(у0) = 0, то данное включение выполняется. Пусть 1а(у0) ^0 и / € 1а(у0) . Тогда по лемме 2 существует вектор X € Л0 (у ) такой, что X,> о , при этом Xу = 0 как для всех у € 1 \ 1 (у0), так и для у € 1 (у0)\ 1а (у°) (иначе в силу леммы 2 эти ограничения были бы тоже существенно активными для Гс(у0), что невозможно в виду определения множества 1а(у°)). Тогда
существует вектор Х€Л#(у0) = {Х€ Rр | ^ Х^^(у) = 0, Х^. > 0 у € 1#} такой, что
Т#
je/0 и/#
Хг- > 0. В таком случае по лемме 2 i Е /а#(у0) . Таким образом, /а(у°) С/а#(у°) . Обратно, поскольку Гс (у0) эГс (у0), то все существенно активные ограничения для Гс (у0) останутся существенно активными и для Гс(у0) . Следовательно, /а(у0) 3/а#(у°) . Лемма 4 ([10,11]). Если в точке у0 Е С выполнено условие RMFCQ, то
1) Тс (у0) = Гс (у0);
2) условие RMFCQ выполняется и в некоторой окрестности этой точки на C ;
3) существует окрестность У(у°) точки у0 такая, что Й.(у) = 0 при i Е /а(у0) для всех точек у еС П У(у° ) .
Лемма 5. Пусть условие RMFCQ выполнено в точке у0 Е С . Тогда для всех у e С из некоторой окрестности у° справедливо включение /а(у0) С/а(у).
Доказательство. Пусть в точке у0 Е С выполнено условие RMFCQ. Тогда в силу леммы 4 оно выполнено и для любой точки у e С из достаточно малой окрестности точки у0 , причем Tc (у) = ГС (у) . Принимая во внимание определение касательного конуса Tc (у) , получим у + fp + o(t) еС при достаточно малых t >0 для любого у еГс(у). Отсюда по лемме 4 Й(у + ty + o(f)) = 0, h(у) = 0 и, следовательно, (УЙ.(у),у) = 0 при всех i Е /а(у°) . Последнее означает, что /а(у0) П/(у) С/а(у) . Но поскольку Й.(у) = 0 для всех i Е /а(у0), то /а(у0) С/(у) и, следовательно, /а(у0) С /(у), что означает /а(у0) С/а(у)
Пусть X a R". Рассмотрим многозначное отображение (]: х i—> (j(x) , ставящее в соответствие каждому X Е X множество G(x) С Rm . Следуя [13], определим топологические нижний и верхний пределы многозначного отображения G .
Нижним топологическим пределом многозначного отображения G в точке X0 e clX на множестве X называется множество
liminf G(x) = {у e Rm | Vxk ^ x0, xk e X, найдется
x ——x0
последовательность yk eG(xk) k = 1,2,... такая,что yk ^y}.
Верхним топологическим пределом многозначного отображения G в точке x0 e clX на множестве X называется множество
lim sup G(x) = {у e Rm | существуют последовательность xk ^ x0, xk e X,
X 0 x-> x
и последовательность yk eG(xk) k = 1,2,... такая,что yk ^y}.
Многозначное отображение G называется полунепрерывным снизу (п.н.сн.) в точке х0 е clX на множестве X , если liminf G(х) з G(х°). Многозначное отображение G
х —х 0
называется полунепрерывным сверху (п.н.св.) в точке х0 е clX на множестве X, если lim sup G(х) е G(х0) .
Пусть K^Rm выпуклый конус. Обозначим K*={yeRm\ (у,у)< О Vy е К) конус двойственный к конусу K.
Рассмотрим многозначное отображение K(-), ставящее в соответствие каждой точке
y е C конус K(y) е К", и многозначное отображение K (•), ставящее в соответствие каждой
точке y е C конус K (у).
Лемма 6. Пусть многозначное отображение K() п.н.сн. в точке у° е C на
множестве Y а С. Тогда отбражение К (•) п.н.св. в данной точке на данном множестве.
Доказательство. Возьмем любой вектор у G К(у°) . Пусть у е lim sup К* (у) . Тогда
г ч о
У->У
найдутся последовательности yk —> у" такая, что ук £ Y при всех к = 1,2,...,и ук —>у такая, что ук е К (ук ) к = 1,2,... .С другой стороны, поскольку у е К(у°), из полунепрерывности снизу многозначного отображения K(■) в точке у0 е C на множестве Y следует, что существует последовательность yk е K(yk) k = 1,2,... такая, что yk ^у . В таком случае (У ,ук)<0 при всех к = 1,2,.... откуда (у,у)< 0 для любого у еК(у°) . Следовательно, уеК*(у°)ш limsup^OO <=£*(/).
Y . 0
y->y
Условие ^-регулярности
При исследовании задач оптимизации важную роль играет также следующее условие, являющееся достаточно общим условием регулярности, и одновременно обладающее полезным в практическом плане свойством, которое позволяет оценить расстояние до множества допустимых точек. Условию R-регулярности (или error bound property во многих публикациях) и его приложениям посвящено большое число исследований [13-17].
Пусть lyl — евклидова норма вектора y, dc(y) = inf |v — y|. Через Vs(y) будем
vеC
обозначать окрестность точки y радиуса 5 .
Определение 2. Следуя [13-17], будем говорить, что множество C R-регулярно в точке y0 еC (или в данной точке имеет место error bound property), если найдутся число а> 0 и окрестность V(y°) = Vs(y0) точки y°, такие, что dc (y) < а max{0, ht (y) i е I, \ht (y)| i е I0} для всехy е V(y0).
В работах [3, 4] при дополнительных предположениях на ограничения задачи получено двойственное описание определения R-регулярности в терминах множителей Лагранжа. Докажем его справедливость, не прибегая к дополнительным предположениям о виде ограничений.
Пусть V е Rm, V £ C. Обозначим через Пс (v) множество точек из С, ближайших к точке V. Очевидно, эти точки являются решениями задачи нелинейного программирования
fv(y) ^min, y е C, где fv(y) = \y — V . Обозначим Ц(y,X) = f (y) + JXlhl(y), где
i=i
X > 0 i е I .
Пусть
Av(у) = (Xe Rp| Vf (у) + £XVh(у) = 0, X, >0 i e /(у), X, = 0 i e /\/(у)},
i=1
AM (у) = (XeAvOOl ¿М < M}.
i=1
Теорема 1. Следующие утверждения равносильны:
a) множество С Л-регулярно в точке у0 Е С;
b) существуют числа M > 0 и 8 > 0 такие, что
AM (у) = (XeAv (у) £ |X;.| < M} для всех v eVs (у0)\С и всех у = у(у) еЦ (v).
i=i
Доказательство. 1) (а) ^ (b) . Возьмем а> 0 и 8> 0 из определения ^-регулярности. Пусть v eV5(у0)\С и у = у(у) еЦ(v) . Тогда в силу предложения 2.4.3 [18] у = у(^ является решением следующей задачи: f (z) + dc (z) ^ min, z e Rm.
Положим M = а, AM (у) = (X e Rp | XД (у) = 0, X, > 0 i e /, £ |XJ < M}.
i=1
Возьмем положительное число S такое, что 8 < 8 , V(у) С V(у0) и Д(z) < 0 для всех z e Уе(у) и всех i e /(у) . Тогда
fv(у) < fv(z) + de(z) < fv(z) + аmax {0, Д(z) i e /, Д(z)| i e /0 } = = fv (z) + M max {0, Д (z) i e /(у), Д (z)| i e /0 } =
= fv(z) + max{£Xh(z)| XeAm(у)} =
i=1
= max(L (z, X)| XeAm (у)},
для всех z Е VS(у).
Поскольку L(у, X) = f (у), функция Q(z) = max(Lv (z, X)| XeAM (у)} имеет локальный минимум в точке у и, следовательно, ее производная по направлениям неотрицательна в данной точке, то есть Q (у; у) > 0 для всех у Е Rm. Принимая во внимание [13], что О'(у; у) = max«VL (у, X), у) | XeAm (у)}, получаем
8 (у | VLv (у, AM (у))) > 0 для всех у Е Rm , где через 8* (у | A) обозначена опорная функция множества A. Данное неравенство означает, что 0 eVLv (у, AM (у)) или иными словами
AM (у) .
2) (b) ^ (а) . Если у0 eint С, утверждение (a) верно. Пусть у0 ebdC . Возьмем v Е V(у°)\С и у = у(у) еЦ(v) . Тогда у = у(у) Е V8(у0) и существует вектор XeAv(у)
такой, что
p
у - v
£XlVhl(у) = 0, Xi > 0 i е /(у), Xi = 0 i е /\/(у) .
|у - V ~
Отсюда следует, что найдется число 8 > 0 такое, что 8 < 8 и для всех V € V (у° ) \ С и соответствующих у = у(у) € ^^(V) справедливо следующее:
|y - v| = <22 я, Vh (y), V - y><£ я, (h (v) - h (y) + o(| v - y|)) =
i=i i=i
= 22 Я Д (v) + (22 Я, )o(|v - y|)) < 22 ЯД (v) +1 |v - y|.
i=i i=i i=i 2
Следовательно,
dc(v) = |v-y| < max(0,h(v) + (v)| < 2M(£max(0,h(v) + h(v)|).
ieI ieI0 ieI ieI0
Из последнего неравенства следует, что dc (v) < 2Mp max{0, h (v) i е I, (v)| i е I0} для всех v е Vff(y0) .
Теорема 2. Пусть множество С R-регулярно в точке у° еС. Тогда Тс (У°) = Тс(у°) = Тс(у0) = Гс(у0).
Доказательство. Пусть y еГс(y0) и y ^ 0 . Из R-регулярности множества C в точке y0 е C следует его R-регулярность в некоторой 50 -окрестности этой точки на множестве C. Возьмем число 5 такое, чтобы 0 <5< 2 и при всех i £ I (y°) выполнялось неравенство h (y) < 0 для всех y е V2S (y0) . Положим t0 =5 y\ 1. Тогда при всех i £ I (y0) выполняется неравенство h(y + tP) < 0 для всехy eV(y°) и всех t е[0, t0]. В таком случае при всех y е V (y° ) ^ C и всех t е [0, t0 ] в силу R-регулярности множества C справедливо неравенство dC(y + ty)-dC(y) <amax{0, hi(y + ty) i e I, \ht(y + ty)\ i e I0} = = a max{0, h, (y + ty) i e I(y0), (y + ty)| i e I0} =
= amax{0, h, (y) + t<Vh, (y),y> + ty, i e I(y0), fa(y) + t<Vh, (y),y> + ty,| i e I0} <
< ta max{0, <Vh,(y),y> i e I(y0), |<Vh,(y),y>| i e I0} + ty,
где
У, =<Vh,(y + T,ty)-<Vh,(y),y>, x, e (0,i), y = max{|y,| i e I0 uI(y0)}. Из данного неравенства следует £(y) = limsup t(y + ty) - dC (y)] <
y-> y
a
C -0 t^0
<amax{0, <Vh,(y),y> i eI(y0), |<Vh,(y),y>| i eI0} = 0.
Таким образом, для любых последовательностей tk ^ 0 и y ->y справедливо
k
lim i-d (yk + tky) = 0.
k
Последнее означает, что существует последовательность V ^ 0 такая, что
y + tky + tkvk е C при всех k = i,2,... . Отсюда следует, что y eTCC(y0) . Таким образо
м,
Гс(у0) с ТС(у0) и, поскольку обратное включение всегда справедливо, следовательно, Гс (у°) = (у0) и утверждение теоремы справедливо.
Лемма 7. Пусть множество С R-регулярно в точке у0 € С. Тогда 11Ш1пГ Гс (у) = Гс (у0).
с . 0
у-> у
Доказательство. Поскольку условие R-регулярности остается справедливым и в окрестности точки у0 на множестве С, то в силу теоремы 2 Гс (у) = ТС (у) для всех у из
данной окрестности. С другой стороны известно [13], что Нтт£ Тс (у) = Тс (у ) . С учетом теоремы 2 получаем требуемое утверждение.
г«/, ,0^
lc (-----
y ——■ y 0
Ослабленное условие Мангасаряна-Фромовица и ^-регулярность
Докажем, что выполнение условия RMFCQ влечет наличие ^-регулярности в
исследуемои точке.
Теорема 3. Пусть множество C удовлетворяет в точке y° e C условию RMFCQ. Тогда множество C R-регулярно в данной точке.
Доказательство. Если y0 eintC, то доказываемое утверждение верно. Пустьy0 ebdC.
1. Будем рассуждать от противного и предположим, что множество C не является R-регулярным в точке y° e C . Тогда существует последовательность vk ^ y0, vk £ C, такая что
dc(vk) >kmax{0,h,(vk) i e I,\h,(vk)| i e I0} для всех k = 1,2,... .
Пусть yk = y(vk) еПс(vk), vk = (vk -yk)|vk -yk. Тогда yk ^y0, |vk| = 1. Ввиду конечности индексного множества I можно извлечь из последовательностей {vk} и {yk} подпоследовательности, на которых I(yk) ^ I(y0) и множество индексов I(yk) постоянно. Поэтому, для простоты записи сохранив для этих подпоследовательностей те же обозначения {vk } и {yk }, можно положить I(yk) = I# ^ I(yQ), где I# не зависит от yk .
Без потери общности рассуждений мы можем также предположить, что vk ^v. Тогда У -yk\>km^{0,{Vh,{vk),vk-ук) i^I#\{Vh,{vk),vk-yk)\ /е/0}, где vk = yk + Tk (vk — yk), 0 < Tk < 1. Из данного неравенства следует
-j- > max{0,(Vht(vk),vk) i e /#,|<VA,.(v*),v*>| /e/0}
и, следовательно, max{0, (Vh,(y0), v) i e I#,|(Vh;. (y0), v)| i e I0} < 0.
Положив C# = {y e Rm | h (y) < 0 i e I# , h (y) = 0 i e I0}, получаем из последнего неравенства:
v eTQ (y0) , где TQ (y0) = ^y e Rm | (Vh, (y°), y)< 0 i e I#, (Vh, (y°), y) = 0, i e I0}.
2. С другой стороны, поскольку условие RMFCQ в точке y0 влечет в силу леммы 4 выполнение условия RMFCQ и в некоторой ее окрестности, то, не ограничивая общности рассуждений, можно считать, что RMFCQ выполняется и в точках yk и, следовательно, существуют множители Лагранжа Xk e Rp, для которых
= Z^fVh,(/), tf ^ 0 i e I, и tf = 0 для i e(I\I#) .
|v - y | i=i
Последнее условие можно переписать в виде
yk = 1 k^u /-,,k\ i k ^ а „• ~ T#
£ XkЩ (yk ), Xkt > 0 i e I#
0 *
ieIn uI
откуда с учетом теоремы о двойственном конусе многогранного конуса следует, что
V* е[Гс# (ук )]*.
Нетрудно видеть, что Гс (У*) = {У е Rm\(Щ (ук ), у)< 0 I е 1#, (Ук, (ук ), у ) = 0, I е Ц},
следовательно, Гс (ук) = ГС(ук) при всех к = 1,2,....
В силу леммы 4 1а(у0) с 1 #. Тогда по лемме 3 , условия которой выполнены для выбранного множества 1 # , и
согласно
# \ 7"«/-. ,0>
утверждению
1,
получаем та/-. ,0>
ri^C# (y ) = {y е Rm\<Vh, (y0), y >< 0 i e I#\Ia(y°), <Vh, (y0), y> = 0 i e I0 u Ia(y°)}. Возьмем произвольный вектор y e riTC (y0) . Данный вектор удовлетворяет системе
<Vh (y°), y> = 0, i e I0 u Ia (y0), <Vh, (y), y> < 0, i e I#\Ia (y0).
В силу условия RMFCQ для множества C в точке y° е C можно, не ограничивая общности, считать, что rank{Vh (yk ) i е I0 uIa(y0)} = rank{Vh,(y0) i e I0 uIa(y0)} = / для всех k = i,2,... . Следовательно, существует максимальная линейно независимая подсистема {V h, (y0) i е J с I0 uIa(y0)} системы {Vhi (y0) i e I0 u Ia (y0)} , которая остается максимальной линейно независимой подсистемой {Vh. (yk ) i е J СI0 u Ia (y°)} в системе векторов {Vh(yk) i eI0 uIa(y0)} . Для простоты будем считать, что J = {i,... ,/}.
Тогда система уравнений <Vh; (у0 ), y) = 0 i g /0 ^ Ia (y0 ) равносильна системе
<vh(у0),у)=о i g j .
(i)
Для определенности считаем, что базисный минор системы уравнений (1) расположен в верхнем левом углу соответствующей матрицы . Тогда систему (1) можно записать в виде
А(у0)у1 + В2(у")у2 = 0, где у = (у1,у2), у1 = &,...,у), у2 = (у^,...,ут),
B( у) =
dhi( у) у)
Зу1 Зу/
ей/ ( у) ей/ ( у)
Зу
Отсюда у1 =—Bj х(yu)B2(yu)y2. Построим вектор ук = (у1к,у2) следующим образом:
, B2(y) =
dhj( у) dhj(y)
еу/+1 fym
ей/ ( у) ей/ ( у)
0У/
/+1
0уи
—U, .о >
,0 \ —2
т^к /—1k —2k>
у1к =—Bj—j(yk )B2(yk)y2, y2k = у2. Тогда <Vh;. ( y ), yk) = 0 i g J и yk ^ у при к ^да . Кроме того, при i g I#\ Ia (у0) справедливо |<Vh- (у1 ), ук ) —<Vh; (у0), у)| ^ 0 и, следовательно, <Vh.(ук),yk)< 0 при достаточно больших k . Таким образом, для любого у g 7ïTc (у0) существует последовательность ук g^ (ук) такая, что ук ^ у . Последнее означает, что limmf Гс (у ) з пТс (у0), откуда с учетом замкнутости множеств liminf Г„ (yk) и Гс (у0)
k^œ # # k C* *
получаем liminf Гс (yk) зГс (у0) . Следовательно, многозначное отображение Гс (у)
к^да # # *
т .0 , k V т .0 Т-> Г
полунепрерывно снизу в точке у на последовательности у ^ у . В таком случае по лемме 6
ж 0 конус [Гс# (у)] двойственный к Тс (у) будет полунепрерывным сверху в точке у на
последовательности ук ^ у0 . С учетом доказанного ранее включения vk g[Tc#(ук )] и того,
что vk ^ v, отсюда следует v g [Гс# (у0)] . Но, с другой стороны, в первой части
доказательства получено включение v g^ (у0) . Поскольку |v| Ф 0, последнее невозможно.
Полученное противоречие говорит о справедливости утверждения теоремы.
Следующий пример показывает, что утверждение теоремы 3 не допускает обращения и из Л-регулярности в исследуемой точке вообще говоря не следует условие RMFCQ в этой точке.
Пример 1. Пусть С = {у G М2 \у2 -у[ < 0, -у2 - у[ <0, у1 =0}, / = (0,0). Тогда
( -3„Л ( -з„2Л
W у) =
- 3 yi 1
, Vh2(y) =
- 3 yi -1
. Щ(у) =
(1) v 0 у
V * У V * У
Поскольку Гс (у0 ) = {у Е R2 | у = у2 = 0}, то все ограничения типа неравенства
являются существенно активными в точке у .
Далее, rank{Wh (у), Vh, (у), Vh, (у)} = ranк
-Зу2 - Зу2 1 к -1 10 у
= 2,
следовательно, выполнено условие RMFCQ. С другой стороны, возьмем последовательность положительных чисел ^к^ 0. Тогда для V = (sk ,0) получим
max{0,h(vk),h(vk), \h(V)} = max{0,г\,s3,|0|}, в то время как (V) = гк . То есть, условие Л-регулярности не может выполняться.
Лемма 8. Если в точке у0 Е С выполнено условие R-регулярности, то существует
окрестность У(у°) точки у0 такая, что Ia (у) С Ia (у0) для всех у ЕУ(у°) О C .
Доказательство. Предположим противное. Тогда найдется последовательность {ук} С C такая, что ук ^ у0 и для каждого k найдется индекс ik Е Ia (ук) такой, что ik £ Ia(у0). Поскольку число элементов в I конечно, не ограничивая общности можно считатьI(ук) = I# СI(у0) и Ia(у) = I#a, где I# и I#a не зависит от к . Далее, из последовательности {ik} можно выделить постоянную подпоследовательность {i0} (для простоты обозначений можно считать, что это сама {ik}, то есть ik = i0 для всех к). Таким образом, существует i0 Е I#a, но i0 £ Ia (у°) . Возьмем произвольный вектор у еГс (у0) . Тогда из леммы 7 следует, что существует последовательность ук еГс (ук) такая, что ук ^ у при к ^ да . Перейдем к пределу в системе равенств и неравенств
(Щ(ук1 ук) = 0 i Е10 uI#a, (Щ(ук), ук)< 0 i Е I#\I#a
при к ^да . Получим <Vh (у0 ), у) = 0 i Е I0 uI#a, <Vh(у0 ), у) < 0 i Е I#\ I#a, для любого
у еГс(у°) . Таким образом, (Vfy (у0),у) = 0 для всех у еГс(у°) . Это означает, что
i0 Е Ia (у°) . Полученное противоречие позволяет сделать вывод о справедливости утверждения леммы.
Следствие 1. Пусть в точке у0 еС выполнено условие RMFCQ. Тогда существует
окрестность У(у°) данной точки такая, что Ia (у0) = Ia (у) для всех у ЕУ(у°) О С .
Справедливость следствия непосредственно следует из теоремы 3 с учетом лемм 5 и 8. Следует отметить то обстоятельство, что условия регулярности описывают качество ограничений, дающих описание множества допустимых точек, а не свойства самого этого множества. В этом плане их суть точнее выражается термином constraint qualifications. Выше говорилось о том, что условия MFCQ и CRCQ независимы друг от друга, то есть существуют примеры, где выполняется MFCQ и не выполняется CRCQ и обратно. В то же время в
работе [19] показано, что если условие CRCQ выполнено в точке у0 Е С, то удалением части ограничений и преобразованием некоторых ограничений из неравенств в равенства можно получить множество локально не отличающееся от С, для которого однако будет справедливо условие MFCQ в точке у° . Аналогичный характер, хотя и более сложный, имеют связи CRCQ
и RCRCQ. Если условие RCRCQ выполнено в точке у° € С, то существуют локальные диффеоморфизмы, переводящие множество С в множества с другой параметризацией, для которых в отвечающей у0 точке выполняются соответственно CRCQ и MFCQ. Следующее утверждение демонстрирует связь RMFCQ с MFCQ.
Теорема 4. Пусть условие регулярности RMFCQ выполнено в у° €С. Тогда
существует окрестность У (у0) такая, что множество С ОУ(у°) может быть записано с
помощью ограничений, для которых в точке у0 выполняется условие Мангасаряна-Фромовица.
Доказательство. Пусть RMFCQ выполнено в у0 € С. То существует окрестность У(у0) такая, что гапк{ЧД(у), I € 10 и 1а(у)} = / для всех у €СоУ(у0) . Следовательно, существует индексное множество J с 10 и 1а(у0) такое, что гапк{Ук{(у) I €/} = / во всех точках у € С О У(у0) . Положим
С = {у € К" | к(у) < 0 I € 1 \ 1а(у0), к1(у) = 0 I € 10 и 1а(у0)}И С" = {у € К" | к(у) < 0 I € 1 \ 1а(у0), к(у) = 0 I € /} .
Очевидно С ' с С. С другой стороны в силу леммы 4 можно выбрать окрестность У(у0) столь малой, что С пУ(у0) с С' пУ(у0). Следовательно, С оУ(у0) = С пУ(у0) .
Для простоты будем считать, что N = |10 и 1а(у0) и 3 = {1,...,/}. Тогда (см. [20], стр. 504-505) в системе функций к(у) I € 10 и 1а(у0) первые / уравнений функционально независимы, а остальные в некоторой окрестности точки у0 ( которую мы можем, не ограничивая общности, считать совпадающей с У(у°)) выражаются через них к (у) = ед(у),....., к (у)) I = / + 1,...., N,
где ^ (2) I = / + 1,.. ., N - гладкие в некоторой окрестности точки
г0 = (к (у0),...., к (у0)) = (0,....,0) функции. В таком случае Ог (0,.....,0) = 0 I = / + 1,...., N и
система уравнений к(у) = 0 I € 10 и 1а(у0) в окрестности У(у°) равносильна системе
к (у) = 0 I € / с дополнительными условиями ^ (к (у),....., к (у)) = 0 I = / + 1, . ., N.
Следовательно, У(у°) можно выбрать столь малой, что при у €С''оУ(у0) получаем
к (у) = 0 I € / и значит ^ (к (у),....., к (у)) = 0 I = / +1,..., N. Это означает, что у € С ' и,
следовательно, С'' О У(у° ) с С'. Поскольку С' с С'', отсюда С'' О У(у° ) = С' О У(у° ) .
Таким образом, существует окрестность У(у°) такая, что С ОУ(у0) = С'' ОУ(у0) . Тогда в
силу леммы 1 в точке у0 €С'' О У(у°) выполняется условие MFCQ . ?
Отметим, что связь условий RMFCQ и R-регулярности и их приложения и обобщения изучались в работах [21-25].
^-регулярность и ограниченное ослабленное условие Мангасаряна-Фромовица
Недавно опубликованная работа [26] посвящена доказательству интересного результата, касающегося системы решений нелинейных уравнений. Именно в [26] доказано, что из R-регулярности множества с ограничениями типа равенства
С = {у € К" | к (у) = 0 I = 1, . ., р} в точке у0 этого множества следует выполнение условия
гапк{Ук.(у) I = 1,...,р} = гапк{Ук.(у0) I = 1,...,р} для всех точек у из некоторой
окрестности точки у0 на множестве С .
Цель работы - показать, что справедливо гораздо более общее утверждение, касающееся множества допустимых точек С = {у € К" | к (у) < 0 I € 1 , к (у) = 0 I € 10} в задаче КЬР.
Определение 3. Будем говорить, что в точке у° € С выполнено ограниченное ослабленное условие регулярности Мангасаряна-Фромовица (ЯМИС), если для всех точек у из некоторой окрестности у° на множестве С имеет место равенство
гапкфк (у) I € 10 и 1а (у0)} = тапкфк (У° ) I € 10 и 1а (у0)}.
Следующий пример показывает, что условия RMFCQ и КМ^, вообще говоря, не совпадают.
Пример 2. Пусть С = {у € Я2 | у2 = 0, у2еу? < 0} , у0 = (1,0) . Тогда Гс(у0) = {у € Я2| у2 = 0}. Далее, к(у) = у2, Нг(у) = у^2, (^(у0),у) = 0 для любого у €ГС(у0) , и , следовательно, 1а(у0) = {2}. Тогда
гапк{Ук (у) I = 1,2} = гапк
А о „2 Л
0 2у]у2еу
Ч1 2у2ел2 ,
к П 1 / 7Л V ,.0
= 1 на множестве С .
С другой стороны, на последовательности у = (1,1/ к) ^ у получаем
гапк{Ук (ук) I = 1,2} = 2.
Пусть В = {у € Я" | у < 1}, В = {у € Я"| |у| < 1}.
Лемма 9. Пусть множество С R-регулярно в точке у €С. Тогда для любого
положительного числа 8 найдется число 8> 0 такое, что Гс (у0) О В сГс (у) + 8В при
всех у € (у0 +8В) О С.
Доказательство. Допустим противное. Тогда существуют число ц> 0 и
последовательность {ук} в С , которая сходится к у0 , причем для любого к = 1,2,... найдется
у °к € ГС (у0) О В и ^ ( у 0к ) >Д> 0 . Поскольку последовательность {у0к } ограничена,
то, не ограничивая общности, можно считать, что у0к ^ у0 , где у0 € Гс (у0) О В . Но из леммы 7 следует существование последовательности ук €ГС (ук) такой, что ук ^ у0 . Следовательно, 0<^<|уок — у^ <|уок — у0| + |ук — у^ для всех к = 1,2,..., что невозможно.
Теорема 5. Пусть множество С R-регулярно в точке у0 € С. Тогда в этой точке выполняется условие
Доказательство. Пусть множество С R-регулярно в точке у0 € С. Тогда в силу леммы 2 для любого вектора у €ГС (у0) и любой последовательности ук ^ у0 такой, что ук € С, существует последовательность ук €ГС (ук) такая, что ук ^ у . Будем рассуждать от противного и предположим, что условие КМ^ не выполняется в точке у0 € С. Последнее означает, что найдется последовательность ук ^ у0, где ук € С, такая, что
гапкфк (ук ) I € 10 и 1а (у0)} > тапкфк (у0) I € 10 и 1а(у0)} для всех к = 1,2,.... (2)
Ввиду конечности индексных множеств в (2) из последовательности {^} можно извлечь подпоследовательность (для простоты обозначим ее также {^}) такую, что I(ук ) = I# = const, Ia (ук ) = I#a = const, I+ (ук ) = I#+ = const, и чтобы ранг в левой части (2) был постоянным. Тогда из (2) следует, что dim affrc (ук ) < dim affrc (у0) при всех к = 1,2,.... В то же время в силу леммы 9 для любого положительного числа S найдется целое положительное к0 такое, что Гс (у°) О B сГс (ук) + sB при всех к > к0. Но в виду
неравенства dim affrc (ук ) < dim affrc (у0) последнее невозможно, если е< d /2, где d диаметр множества Гс (у °) о{ у| = 1}.
Замечание. В частном случае, когда I = 0 (то есть С = {у Е Rm | h.(у) = 0 i Е I0}) ,
а теорема 5 содержит основной результат [26] (см. теорема 1 [26]).
Таким образом, доказанная выше теорема обобщает основной результат [26] на случай множества решений систем равенств и неравенств.
Следующий пример показывают, что обратное утверждение для теоремы 4 неверно, т.е. из RMFC не следует Л-регулярность.
Пример 3. Пусть С = {у Е R3 | у + у2 = 0, у32 < 0}, у0 = (0,0,0). В данном примере
условие RMFC выполняется, однако
Гс(у°) = {уеЯ3| y1 + y2=0}*fc(y°) = {yetf3| у1 + у2 = 0, у3=0}.
Следовательно, в исследуемой точке не выполнено условие регулярности Абади. Поскольку известно, что условие Абади справедливо при выполнении условия Л-регулярности,
отсюда можно сделать вывод, что множество С не Л-регулярно в точке у0 .
Заключение
Для задачи нелинейного программирования доказан двойственный критерий выполнения условия ^-регулярности в терминах множителей Лагранжа без какого-либо рода дополнительных предположений о структуре ограничений. Доказано совпадение касательных
конусов Т^1 (у0 ) = Тс (у°) = Тс (у°) =ГС (У°) в допустимых точках, в которых множество С R-
регулярно. Без дополнительных предположений относительно ограничений доказано, что выполнение в допустимой точке ослабленного условия Мангасаряна-Фромовица влечет за собой выполнение условия ^-регулярности. Доказано, что из условия ^-регулярности в допустимой точке следует ограниченное ослабленное условие Мангасаряна-Фромовица. Таким образом, справедливо следующая взаимосвязь условий регулярности в точках множества С: LICQ ^MFCQ ^CPLD ^RCPLD ^RMFCQ, LICQ ^ CRCQ ^ RCRCQ ^ RCPLD ^ RMFCQ, RMFCQ ^ R ^ RMFC.
REGULARITY CODITIONS IN NONLINEAR PROGRAMMING PROBLEMS
L.I. MINCHENKO, A.E. LESCHOV Abstract
Weak regularity conditions are studied. Necessary and sufficient conditions of ^-regularity are obtained. The relations between different types of regularity conditions are investigated.
Список литературы
1. Минченко Л.И., Стаховский С.М. // Докл. НАН Беларуси. 2009. Т 53, №5. С. 26-51.
2. Минченко Л.И., Волосевич А.А., Стаховский С.М. // Докл. БГУИР. 2009. № 6. С. 81-87.
3. Minchenko L.I., Stakhovski S.M. // Optimization. 2011. Vol. 60, № 4. P. 429-440.
4. Minchenko L., Stakhovski S. // SIAM Journal on Optimization. 2011. № 21. P. 1314-1332.
5. Сиротко С.И., Стаховский С.М., Минченко Л.И. //Докл. БГУИР. 2009. №4. С. 87-92.
6. Минченко Л.И., Стаховский С.М. //Вести НАН Беларуси. Сер. физ.-матем. наук. 2010. № 1. С. 101-107.
7. Актанорович С.В., Минченко Л.И, Тараканов А.Н. // Докл. БГУИР. 2010. № 4. С.85-88.
8. Минченко Л.И., Волосевич А. Н., Тараканов А.Н. // Докл. БГУИР. 2009. № 8. С. 64-68.
9. Актанорович С.В., Минченко Л.И., Тараканов А.Н. // Докл. БГУИР. 2012. № 5. С. 103-109.
10. Минченко Л.И., Стаховский С.М. // Докл. БГУИР. № 8. 2010. С.104-109.
11. AndreaniR., Haeser G., SchuverdtM.L. et. al. // SIAM J. on Optimization. 2012. Vol. 22, № 3. P. 1109-1125.
12. Гороховик В.В. Конечномерные задачи оптимизации. Минск, 2007.
13. Luderer B., Minchenko L., Satsura T. Multivalued analysis and nonlinear programming problems with perturbations. Dordrecht, 2002.
14. Minchenko L.I., Tarakanov A.N. // J. Optimiz. Theory and Appl. 2011. Vol. 148, № 3. P. 571-579.
15. Kruger A., Minchenko L., Outrata J. // Positivity. 2013. № 17. P. 1-17.
16. Minchenko L.I., Tarakanov A.N. // Optimization. 2013. DOI: 10.1080/02331934.2012.754441.
17. Минченко Л.И., Актанарович С.В., Тараканов А.Н. // Докл. НАН Беларуси. 2010. № 6. С. 18-23.
18. Кларк Ф. Оптимизация и негладкий анализ. М., 1988.
19. Lu S. // Math. Program. 2009. № 126. P. 365-392.
20. Зорич В.А. Математический анализ. Ч.1. М., 1981.
21. Актанорович С.В., Богданов С.А., Лещев А.Е. и др. // Докл. БГУИР. 2013. № 2. С. 5-9.
22. Минченко Л.И., Лещев А.Е. // Докл. НАН Беларуси. 2013. Т. 57, № 4. С. 38-42.
23. Минченко Л.И., Лещев А.Е. // Докл. НАН Беларуси. 2013. Т. 57, № 6. С. 28-34.
24. Minchenko L. On // Int. Conference «Constructiv nonsmooth analysys and applications», S.-Peterbourg, June 18-23, 2012. P. 119-121.
25. Minchenko L. // Abstracts of 25th Europian conference on Operational Research (EURO-2012), Vilnius, July 8-11, 2012. P. 311.
26. BehlingR., Iusem A. The // Math. Program. Ser. A. 2013. № 137. P. 155-165.