Сер. 10. 2012. Вып. 1
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
ПРИКЛАДНАЯ МАТЕМАТИКА
УДК 519.3+519.7 М. Э. Аббасов
НАХОЖДЕНИЕ СТАЦИОНАРНЫХ ТОЧЕК ФУНКЦИЙ, ДОПУСКАЮЩИХ НЕОДНОРОДНЫЕ АППРОКСИМАЦИИ ПРИРАЩЕНИЯ*)
1. Введение. Во второй половине XX в. начал формироваться негладкий анализ -самостоятельный раздел математики, являющийся продолжением классического гладкого анализа.
Первая попытка решения негладких задач (нахождение полинома наилучшего приближения) принадлежит П. Л. Чебышеву. Дальнейшее развитие этой области привело к появлению выпуклого анализа и теории минимакса. Основным инструментом для изучения выпуклых функций и функций максимума оказалось понятие субдифференциала [1, 2]. Субдифференциалы позволили получать аппроксимации первого порядка функции в окрестности заданной точки. Б. Н. Пшеничный ввел понятия семейства верхних выпуклых аппроксимаций (в.в.а.) и нижних вогнутых аппроксимаций (н.в.а.) [3], а А. М. Рубинов - понятие исчерпывающего семейства в.в.а. и н.в.а. Дальнейшее развитие негладкого анализа привело к понятиям экзостеров, а затем и коэкзостеров, введенных В. Ф. Демьяновым и А. М. Рубиновым [4-6].
Верхние и нижние экзостеры. Необходимые условия экстремума. Будем говорить, что функция f : R" —> R имеет верхний экзостер в точке x, если существуют выпуклые компакты Сш(x) из R", ш Е П, такие, что справедливо разложение
f (x + Д) = f (x) + min max (v, Д) + ox(A), (1)
шЕП veo^(x)
где lim ——-- = 0 для любого Д G 1"; Q, - множество индексов из некоторого про-
а|0 а
странства. Семейство множеств E* (x) = {Сш (x)| ш Е П} называется верхним экзосте-ром функции f в точке x.
Аббасов Меджид Эльхан оглы — аспирант кафедры математической теории моделирования систем управления факультета прикладной математики—процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук, проф. В. Ф. Демьянов. Количество опубликованных работ: 8. Научные направления: методы оптимизации, негладкий анализ. E-mail: [email protected].
*) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00360).
© М. Э. Аббасов, 2012
Будем говорить, что функция f имеет нижний экзостер в точке x, если существуют выпуклые компакты Сш(x) из R", ш Е О, такие, что справедливо разложение
f (x + Д) = f (x) + max min (v, Д) + ox(A), (2)
шео wec^(x)
здесь также lim ——-- = 0 для любого Д G R™, О - множество индексов из некоторого а
го пространства. Семейство множеств E*(x) = {Сш (x)| ш Е О} называется нижним экзостером функции f в точке x.
С помощью экзостеров удается выразить необходимые условия минимума и максимума [5, 7]. При этом необходимые условия минимума выражаются с помощью верхнего экзостера, а необходимые условия максимума - нижнего. В [5] было показано, что если функция f достигает минимума на R" в точке x* и известен ее верхний экзостер E* (x*), то необходимое условие минимума в случае отсутствия ограничений имеет вид
0n Е С У С Е E*(x*).
Если существует такое S > 0, что
Bs С С У С Е E*(x*),
где Bs = {x Е R" | ||x|| < S}, то x* - точка строгого локального минимума функции f.
Если x** - точка максимума функции f на R" и известен ее нижний экзостер E*(x**), то необходимое условие безусловного максимума выражается так:
0„ е С у С е E* (x**).
Если найдется такое S > 0, что
Bs С С У С Е E*(x**),
то x** - точка строгого локального максимума функции f.
Таким образом, используя эти инструменты, можно строить численные методы для нахождения точек, подозрительных на локальный минимум или максимум. При этом, как видно из (1) и (2), аппроксимации, построенные с помощью экзостеров, являются положительно однородными. Данный факт дает возможность исследовать только те направления, которые принадлежат единичной сфере S(A) = {Д Е R"| ||Д|| = 1}. Однако, как оказалось, экзостерное точечно-множественное отображение является разрывным в метрике Хаусдорфа, а это приводит к тому, что численные методы, построенные с применением экзостеров, могут сходиться к нестационарным точкам [2]. Потому более предпочтительными явились бы непрерывные аппроксимации. В результате борьбы за непрерывность пришлось пожертвовать положительной однородностью.
Проследим, каким образом понятие кодифференцируемых функций приводит к коэкзостерам, дающим неоднородные аппроксимации приращения.
Кодифференцируемые функции. Пусть X С R" - открытое множество. Будем говорить, что функция / : X —> R кодифференцируема в точке ж, если существуют такие выпуклые компакты df(x) С Rn+1 и df(x) С Rn+1, что
f(x + A)=f(x)+ max [а+(>,Д)]+ min [b + (w, Д)] + ож(Д), (3)
[a,v]edf (ж) [b,w]edf(x)
где
lim °ж(аА) = о для любого ДеГ.
а|0 а
Здесь и далее a,b G R; v,w G R"; (v, Д) ((w, Д)) означает скалярное произведение v на Д (w на Д); [a, v] ([b, w]) - вектор из Rn+1, у которого на первой позиции стоит число a (b), а остальные n позиций совпадают с элементами вектора v (w). Пара Df (x) = [df(x), df(x)] называется кодифференциалом функции / в точке х. Будем считать, что функция f непрерывно кодифференцируема в точке x, если она кодифференцируема в некоторой окрестности точки x и существует непрерывное (по Хаусдорфу) в этой точке кодифференциальное отображение Df(x) = [df(x),df(x)]. Из (3) имеем
f(x + A)=f(x)+ max min [а + b + (v + w, Д)] + ox(A) =
[a,v]edf(x) [b,w]edf(x)
=f (x)+ max min [b + (w, Д)] + ox(Д), (4)
ceE{x) [b,w]ec
где
lim = о для любого ДеГ,
a|0 а
R(f(x)) = {ОсГ+1| С = [a,v] + df(x), [a,v] Gdf{x)}. Аналогично находим
f(x + A) = f(x)+ min max [a + b + (v + w, Д)] + ox(A) =
[b,w]edf(x)
= f(x) + nun max [a + (v, Д)] + ox(A), (5)
ceE(x) [«,»]ec
здесь
lim = о для любого ДеГ,
a|0 а
E(f(x)) = {С С Rn+1| С = [b,w] + df(x), [b,w} G~df{x)}.
Кодифференциалы были введены в [6]. В этой работе также были получены необходимые условия минимума. Разложения (2) и (3) приводят к следующему обобщению понятия кодифференциала.
Верхние и нижние коэкзостеры. Необходимые условия экстремума. Будем говорить, что у функции f : R" —> R существует верхний коэкзостер в точке x, если имеет место разложение
f (x + Д)=f (x) + min max [a +(v, Д)] + Ох(Д), (6)
uen [a,v]eö^(x)
в котором
lim = о для любого ДеГ,
a|0 а
Q - множество индексов из некоторого пространства. Множества Cu (x) для любого ш £ il - выпуклые компакты в Rn+1. Семейство Е(х) = {Сш(ж)| и> G называется верхним коэкзостером функции f в точке x.
Будем говорить, что у функции f существует нижний коэкзостер в точке x, если справедливо разложение
f (x + A) = f (x) + max min [b + (w, A)] + ox(A),
шеп [b,w]ec^(x)
где
lim = о для любого ДеГ,
a|0 а
Q - множество индексов из некоторого пространства. Множества Сш (x) для любого lü G Q - выпуклые компакты в Rn+1. Семейство Е_(х) = {Сш^)] ш е il} называется нижним коэкзостером функции f в точке x.
Впервые понятие коэкзостера было введено в [4]. В [7] были получены необходимые условия экстремума в терминах коэкзостеров.
Теорема 1. Пусть у функции f существует верхний коэкзостер в точке x*. Для того чтобы x* была точкой минимума функции f на R", необходимо, чтобы
0"+1 е С у С е Eü(x*),
где
Е°(х) = {С £ Ё(х) I max а = 0}.
[a,v]ec
Аналогично формулируется необходимое условие максимума.
Теорема 2. Пусть у функции f существует нижний коэкзостер в точке x**. Для того чтобы x** была точкой максимума функции f на R", необходимо, чтобы
0"+1 е С УС Е Eo(x**),
где
Е«(х) = {С £ Е(х) | min Ъ = 0}.
[b,w]ec
2. Метод минимизации. Пусть для функции f (x) имеет место разложение (4). Выберем некоторые ¡л > 0, е > 0. Пусть построено xk. Если в точке xk выполнено
необходимое условие минимума 0n+i е Сш (xk) для любых ш Е Q : max a = 0,
[a,v]eC^(xk)
то xk - стационарная точка и процесс завершается. В противном случае существует
ш Е Q, такое что max a = 0, но 0n+i Е Сш (xk). Определим
[a,v]eca (xk)
Qß(xh ) = {ш е Q: max a < ¡л, 0„+i Е Сш (xk)},
[a,v]eC^(xk)
dk = max _ min ||z||, (7)
^■цЕ(хк) = {w G П : max a ^ /л, _ min ||z|| ^ dk — e}.
[a,v]EC^(xk) ~хЕСш(хк)
Очевидно, множество Qße (xk) не пусто, так как ему всегда принадлежит индекс множества, на котором достигается максимум dk из (5). Для каждого ш е Qße (xk) строим
_ min ||z|| = ||zfcü||, = {щш\ZkSj}, rik'to £ R, G R™,
zec^(xk)
и определяем следующую итерацию так:
f (xk+i)=_ min min f (xk - az^) = f (xk - akzk),
шen^E(xk) a>0
xk+i = xk - ak zk.
При этом
f (xk+1) < f (xk). (8)
3. Сходимость метода.
Теорема 3. Пусть .множество P = {x G R"| f (x) ^ f (xo)} ограничено, x* - предельная точка последовательности {xk}, функция o(A) = o(x, A) удовлетворяет усло-o(x, a A)
вию lim- = 0 равномерно из некоторой окрестности ж по А из Ь = {Д G
R", ||Д|| = 1}. Предположим также, что отображение Сш(x) непрерывно в метрике Хаусдорфа для любого q G О. Тогда x* - стационарная точка.
Доказательство. По предположению множество P ограничено, а тогда оно и замкнуто в силу непрерывности f. Существование предельных точек последовательности {xk} следует из того, что вся эта последовательность принадлежит P. Пусть xks ^ x*, а утверждение теоремы неверно и точка x* не является стационарной, тогда
найдется Q G О такое, что max a = 0, 0„+i G Ca (x*). В силу того, что отображе-
[a,v]eca (x*)
ние Ca (x) непрерывно в метрике Хаусдорфа, существует Ni > 0 такое, что для любого s ^ Ni будет выполнено Q g Qße(xi~s). Ищем
min ||z|| = ||z*||, z* = {r]*;z*}, ry* G R, z* G R™,
zECa(x*)
min ||z|| = pfcsa||, zksq = {r]ksu,;zksQ}, g R,zksSj g R™.
Для любого ~z g Ca{xks) имеем (z, -zksa) < -\\~ZksCj\\2, откуда
([a,w], [~r]ksQ, ~zksoj\) < -||^fcsa||2,
-(v,zksSj) < -\\zksSl\\2 +arjksQ. При s ^ Ni приходим к следующей цепочке неравенств:
f (xks + i) = _ min min f (xks - azksа) < min f (xks - azksa) =
аЕПре (xks ) a>0 a>0
= f (xks) + min { min max [a - a(v,zksa)] + oa (a)} <
a>0 uen[a,v]ec^(xks )
< f (xks) + min { max [a - a(v,zksa)] + oa (a)} <
a>0 [a,v]eCa(xks )
u, -r u.uiih.— и. 11 ^ h.i121
a>0 [a,v]ECa(xks )
< f(xks) +min{(l + ar]ksa) max a - a||zfcsa||2 + oa(a)}.
a>0 [a,v]eca (xks )
Вследствие непрерывности отображения Ca (ж) получаем lim zkgа = z*, следователь-
s—s
но, найдется N2 > 0 такое, что для любого s ^ N2 будет выполнено ||zfcsa||2 > |||^*||2«, где а > 0 удовлетворяет неравенству од (5) < |5||z*||2. Существование такого а гарантируется условием теоремы. Кроме того, так как lim max a = 0, то найдется
s—TO [a,v]eClo (xks )
N3 > 0 такое, что для любого s ^ N3 будет выполнено
^/(zfcj+min { max [а + аащзй - a\\zksCj\\2} + ой{а)} ^
{1 + ащзй) max а < ]ra\\z*\\2. [a,v]eca (xks ) 4
Окончательно при s ^ ma^ N1, N2, N3} будет справедливо неравенство
f(xka+1) ^f{xks)-\a\\z*\\\ (9)
откуда, учитывая, что последовательность f (xk) монотонно убывает (см. (6)), а на некоторых членах подпоследовательности xks убывает «гарантированно» (см. (7)) и таких членов бесконечное число, имеем
f (xk) —► -ж.
Но непрерывная функция f (x) ограничена на замкнутом, ограниченном множестве P. Получаем противоречие.
Замечание 1. Рассмотрение множества ¡л > 0, связано c тем, что при использовании Qo метод может сойтись к нестационарной точке. Такой отрицательный пример был приведен в [2].
Замечание 2. Рассмотрение множества позволяет значительно сократить вычислительные затраты за счет использования лишь направлений, достаточно близких к направлению наискорейшего спуска.
Литература
1. Рокафеллар Р. Выпуклый анализ / пер. с англ. А. Д. Иоффе, В. М. Тихомирова. М.: Мир, 1973. 469 с. (Rockafellar R. Convex analysis)
2. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. М.: Наука, 1972. 368 с.
3. Пшеничным Б. Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980. 320 с.
4. Demyanov V. F. Exhausters and convexificators — new tools in nonsmooth analysis // Quasi-differentibility and related topics / eds.: V. F. Demyanov, A. M. Rubenov. Dordrecht: Kluwer Acad. Publ., 2000. P. 85-137.
5. Demyanov V. F. Exhausters of a positively homogeneous function // Optimization. 1999. Vol. 45. P. 13-29.
6. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 432 с.
7. Аббасов М. Э., Демьянов В. Ф. Условия экстремума негладкой функции в терминах экзостеров и коэкзостеров // Труды Ин-та математики и механики Уральск. отд. РАН. 2009. Т. 15. С. 10-19.
Статья рекомендована к печати проф. В. Ф. Демьяновым. Статья принята к печати 20 октября 2011 г.