Владикавказский математический журнал октябрь-декабрь, 2006, Том 8, Выпуск 4
УДК 519.3
НЕКОТОРЫЕ МЕТОДЫ МИНИМИЗАЦИИ МАКСИМУМА КВАДРАТИЧНЫХ ФУНКЦИЙ1
Л. Н. Полякова
Светлой памяти Александра Моисеевича посвящается
В работе рассматриваются несколько алгоритмов минимизации функции максимума от квадратичных функций в евклидовом пространстве К". Показывается, что данную задачу можно свести к нахождению точки с наименьшей евклидовой нормой, принадлежащей пересечению квадрик. Описывается метод минимизации функции максимума на К" с постоянным шагом, аналогичный градиентному методу минимизации с постоянным шагом сильно выпуклой функции. Доказывается геометрическая скорость сходимости генерируемой последовательности к точке минимума.
1. Введение
Класс функций максимума от непрерывно дифференцируемых функций является одним из наиболее исследованных среди негладких функций (см., например, [1, 2]). Напомним некоторые свойства таких функций. Пусть
f (x) = max fi(x), fi(x) = 1 (Aix,x) + (bi,x) + Ci, i e I1 =0 U I, I = 1,... ,m, x e rn, ie/i 2
где Ai — симметричные матрицы размера n x n, bi e rn, Ci e r, i e Ii.
В каждой точке x e rn функция f непрерывна и дифференцируема по любому направлению g e rn, при этом ее производная по направлению имеет вид (см, например, [1])
f(x,g) = max,(v,g}, df (x) = co I N (Aix + bi), Rf (x) = {i e Ii | fi(x) = f (x)}.
vedf (x) U-M*)
Здесь через co{X} обозначена выпуклая оболочка множества X. Множество df (x*) называется субдифференциалом функции f в точке x*. Рассмотрим оптимизационную задачу: найти
inf f(x). (1)
© 2006 Полякова Л. Н.
1 Работа выполнена при поддеpжке Российского Фонда фундаментальных Исследований (Гpант РФФИ №06-01-00276).
Для нее сформулируем необходимые условия минимума.
Теорема 1. [1] 1) Для того чтобы точка ж* £ Ж" была точкой минимума функции / на Ж", необходимо, чтобы выполнялось включение
0" £ д/(ж*). (2)
2) Для того чтобы точка ж* £ Ж" была точкой минимума функции / на Ж", необходи
т
мо, чтобы нашлись такие неотрицательные коэффициенты г £ 1\, ^ = 1, чтобы
¿=0
выполнялись условия
тт
^ Аж* = - ^ (3)
¿=0 ¿=0
^ (/¿(ж) - /(ж)) = 0, г £ 1\. (4)
Точка ж* £ ж", для которой выполняется условие (2) или условия (3), (4) называется стационарной точкой функции / на ж". Из условия (4) следует, что если в стационарной точке г £ й/(ж*), то ^ = 0.
Пусть точка ж* £ ж" — стационарная точка функции / на ж" и числа г £ /1, таковы, что для них в ж* выполнены соотношения (3), (4). Введем множество
т
М/(ж*) = = (^,К,...,Кт) £ жт+1 | ^ ^ 0, г £ д = 1}.
¿=0
Если все матрицы А, г £ /, — неотрицательно определенные, то функции /¿, г £ /1, являются выпуклыми, и тогда необходимые условия минимума, сформулированные в теореме 1, являются также достаточными условиями. Если все матрицы А, г £ /1, — положительно определенные, то решение задачи (1) единственно.
Рассмотрим невырожденное преобразование ж = Ду. В результате такого преобразования квадратичные формы (Аж,ж), г £ /1, будут приведены к квадратичным формам (Ау,у), г £ /1. Причем матрицы А, А связаны соотношениями
А = (Дт)-1 АД-1, А = ДтАД г £ /1,
где через обозначена транспонированная матрица. Определим функцию
<(у)=шах<(у), У £ ж", ¿б/
где
<(у) = 2 (Ау,у) + (ь,у) + , Ьг = Дт£ ж", г £ /1. Рассмотрим оптимизационную задачу: найти
1пХ <(у). (5)
Множество д<(у) = со < и (Ау + Ь^ > есть субдифференциал функции < в точ-
^¿бЯ^(у) ]
ке у £ ж". Нетрудно видеть, что при таком преобразовании й/ (ж) = й^(у).
Пусть точка y* £ rn является решением задачи (5), тогда необходимо, чтобы
0n £ co i U (Ay* + 6i) i . [¿еДДг) )
Лемма 1. 1. Если точка x* £ rn является стационарной точкой функции f на rn, то у* = D-1x* есть стационарная точка функции р на rn.
2. Если точка у* £ rn является стационарной точкой функции р на rn, то x* = Dy* есть стационарная точка функции f на rn.
3. В обоих случаях справедливо равенство Mf (x*) = M^(y*).
< Докажем первое утверждение леммы. Пусть x* £ rn — стационарная точка функции f на rn. Тогда выполнено включение (2), т. е.
0n £ co i U (A¿x* + bi) i = co i U (AiDy* + b)
[ieRf (x*) ) [ie-Mr)
= coi U (DT )-1 {Ai y* + bi)| .
Отсюда следует, что 0„ £ co ^ (J (Aiy* + bi) > = dp(y*).
{ieR<p(y*) )
Второе утверждение леммы доказывается аналогично.
Из доказательства также следует справедливость равенства Mf (x*) = Mv(y*). > Из линейной алгебры известно (см., например, [3, 4]), что любую квадратичную форму с положительно определенной матрицей можно привести невырожденным преобразованием к нормальному виду.
В дальнейшем будем предполагать, что матрица Ао — положительно определенная. Тогда инфимум в задаче (1) достигается. Предположим, что невырожденное преобразование x = Dy приводит квадратичную форму (Aox, x) к нормальному виду. В этом случае, Ао = E, где через E обозначена единичная матрица размера [n х п]. Затем рассмотрим преобразование y = z — bo и квадратичные функции
^o(z) = 1 (z,z) + Со, ф (z) = 2 (Aiz,z) + (bi,z) + Ci, i £ I,
где
Co = co — 2 ||bo||2, bi = (bi,z) — 2 (Aiz,bi), Ci = Ci + 1 (Ai bo,6o) — (bi, bo), i £ I.
Обозначим ^(z) = max ^i(z). Рассмотрим оптимизационную задачу: найти ieli
min ^(z).
Если точка z* £ rn является стационарной точкой функции ф на rn, то несложно показать, что y* = z* — bo есть стационарная точка функции р на rn, а x* = D-1 y* — стационарная точка функции f на rn.
Таким образом, для того чтобы решить задачу (1), необходимо уметь минимизировать функцию
¡ (ж) = тах ¡г (ж),
¿6/1
где
¡о(ж) = 2 (ж, ж), ¡г (ж) = 2 (АгЖ,ж) + (Ь»,ж) + С», Ж £ ж",
Аг, — симметричные матрицы размера [п х п], Ьг £ ж", С» £ ж, г £ I.
Если матрицы А», г £ I, — положительно определенные, то решение задачи (1) существует и единственно. В дальнейшем будем предполагать, что в точке минимума ж* функции ¡ на ж" все функции ¡¿, г £ II, активны, т. е. выполнено равенство (ж*) = II. Тогда задача (1) эквивалентна задаче условной оптимизации: найти
тт 1 (ж, ж),
хбХ 2
где
X = |ж £ ж" | 1 (А*ж,ж) + (Ьг, ж) + Сг = 1 (ж, ж), г £ ^ .
Множество X может быть записано в виде
X = {ж £ ж" | ¡г(ж) - ¡о(ж) = 0, г £ I}. Пусть задана квадратичная функция
д(ж) = 1 (Аж, ж) + (Ь, ж) + с, множество X(д) = {ж £ ж" | д(ж) = 0} называется квадрикой. Если обозначить через
9г(ж) = ¡г(ж) - ¡о(ж), г £ I,
то множество X есть пересечение квадрик, определяемых квадратичными функциями дг, г £ I. Поэтому задача минимизации функции ¡ на ж" сводится к нахождению точки из множества X, имеющей наименьшую евклидову норму.
2. Минимизации максимума двух квадратичных функций
Рассмотрим случай минимизации функции максимума от двух квадратичных функций в предположении, что матрица Ао положительно определена. Из линейной алгебры известно, что существует невырожденное преобразование ж = ^у, приводящее квадратичную форму (А1ж, ж) к каноническому виду, а форму (Аож, ж) — к нормальному виду. Таким образом, можно считать, что функции ¡о и ¡1 имеют вид
¡о(ж) = 1 (ж,ж), ¡1(ж) = 2(©ж,ж) + (Ь,ж) + с, ж,Ь £ ж", с £ ж,
где матрица © — диагональная матрица (© = diag {^}, ] £ J = 1..п), полученная в результате соответствующего невырожденного преобразования, и ¡(ж) = тах{^(ж), ¡1 (ж)}.
Отметим тот факт, что если в результате преобразования оказалось, что число с ^ 0, то решение задачи (1) есть нулевая точка. Поэтому будем считать с > 0. Рассмотрим
множество точек ж*, которые являются стационарными для функции /1 на ж", т. е. точки, для которых
©ж* + Ь = 0", (6)
и выполнено неравенство /о(ж*) < Д(ж*). Если все числа 9^- > 0, * £ J, то функция /1 сильно выпукла и точка ж* = —©-1Ь1 будет единственным решением задачи (1). Если среди чисел 9^ есть отрицательные, то может оказаться, что точка ж* = —©-1Ь являющаяся решением системы (6) не есть точка локального минимума функции / на ж".
Предположим, что числа 9j ^ 0 при любом * £ J. Нас будет интересовать случай, когда (ж*) = {0,1}. Тогда если точка ж* £ ж" является решением задачи (1), то необходимо, чтобы нашлось положительное число "*, для которого справедливо равенство
©ж* + Ь = —"*ж*. (7)
Уравнение (7) можно переписать в виде (© + "*Е) ж* = —Ь. Отсюда имеем
ж* = — (© + "*Е)-1 Ь. (8)
ной,
Так как матрица © + "*Е диагональная, то и обратная к ней также будет диагональ-
(© + "*Е)-1 = {¿"Ы • *£
Следовательно, *-ая координата вектора ж* будет равна величине ж* = — 9 +—*, где Ьj
Ь;
*-ая координата вектора Ь. Покажем, что нахождение числа "* сводится к нахождению корня многочлена с действительными коэффициентами степени 2п.
Зафиксируем произвольное число " £ Ж, ж* = — -—j—. Подставляя в выражение (8)
9j + "
значение ж*, получим уравнение
Е
j=l
(9j — 1)Ь2 Ь2
+ с = 0. (9)
2(9,- + ")2 9j + "
Если обозначить через pj (") =2" + 9j + 1, * £ J, то уравнение (9) можно записать в виде
™ р (")Ь2 с = 0
^ 2(9^ + ")2 С и'
Пусть
Р (") = £ Р (")Ь? П (9к + ")2 — 2с П (9* + ")2. ^'=1 k=1,k=j к= 1
Очевидно, что многочлен Р(") является многочленом степени 2п, и, в силу нашего предположения, имеет единственный положительный корень "*.
Заметим также, что если точка ж* £ ж" является решением задачи (1), то необходимо и достаточно, чтобы нашлось такое положительное число V*, чтобы выполнялись равенство
V* (©ж* + Ь) = —ж*.
Из этого уравнения следует, что ж* = —V* (V*© + Е)-1 Ь. (В нашем случае, V* = —).
Пусть V £ Ж и ^'-ая координата вектора ж* равна величине ж* =--0- + 1 . Подставляя
в выражение (8) значение ж*, получим уравнение
)
+ с = 0. (10)
п
Е
j=i
(0, - 1)v262 vb2
2(v0, + 1)2 v0, + 1
Если обозначить через в^ (V) = V2(1 + ) + 2v, ] £ то уравнение (10) можно записать в виде
У (V)Ь2 - с = 0
= 2(v0j + 1)2 C
Нахождение нужного нам числа v* также сводится к определению единственного положительного корня многочлена S (v) степени 2n следующего вида
n n n
S(v) = £ Sj (v) П (v0j + 1)2 - 2^(v0fc + 1)2.
j=1 k=1,k=j k=1
Остановимся на одном варианте определения преобразования D (см., например, [3]). Рассмотрим спектральное разложение матрицы A00: Ao = QoЛQT, где Qo — ортогональная матрица, матрица Л — диагональная матрица, на главной диагонали которой стоят собственные числа А, матрицы Ao, расположенные в порядке невозрастания, т. е.
Л = diag {А,}, А1 ^ А2 ^ ... ^ Ап > 0.
Невырожденное преобразование x = S^)Qfу, где S(Л) = (^Л) = diag , при-
водит квадратичную форму (AoX,x) к нормальному виду (y, у), а квадратичную форму (A1X, x) — к виду (AI1 у, у). Заметим, что
A1 = QoS (Л^^Л^Т.
Рассмотрим спектральное разложение матрицы A1: A1 = Q1©QT, где матрица Q1 — ортогональная, а © — диагональная матрица, на главной диагонали которой находятся собственные числа 0,, j £ J, матрицы A1, расположенные в порядке невозрастания, т. е.
© = diag {0,}, 01 ^ 02 ^ ... ^ 0п > °.
Тогда невырожденное преобразование у = Qf z, приводит квадратичную форму (у, у) к виду (z,z), а квадратичную форму (A1 у, у) к виду (©z,z).
Таким образом, невырожденное преобразование у = Dx, где D = S^)Qf Qf приводит к нормальному виду квадратичную форму (Aox, x), а форму (A1x, x) — к каноническому виду.
3. Минимизация функции максимума на плоскости
В двумерном случае при минимизации функции максимума мы сталкиваемся с тремя вариантами:
1) точка минимума функции максимума совпадает с точкой минимума одной из функций;
2) в точке минимума активны две функции;
3) в точке минимума активны три функции.
Если оказалось, что в точке минимума активны более трех функций, то нулевая точка должна содержаться в выпуклом многоугольнике, натянутом на градиенты активных функций в этой точке. Но в двумерном случае, как следует из теоремы Каратеодори, для представления любой точки из выпуклой оболочки, натянутой на конечный набор векторов, в виде выпуклой комбинации этих векторов достаточно не более трех точек. Стало быть, в точке минимума можно рассматривать не более трех активных функций.
Если в точке минимума функции максимума активны две функции, то задача минимизации может быть сведена к нахождению положительного корня многочлена четвертой степени. Рассмотрим Пример 1. Пусть
¡(ж) = тах{^(ж), ¡1 (ж)}, ж = (жьж2) £ ж2,
где
¡о (ж) = 2 (ж, ж), ¡1 (ж) = 2 (©ж, ж) + (Ь, ж) + с.
© = diag {4, 6}, Ь = (-3, -4) £ ж2, с = 2.5.
Найдем точку минимума функции ¡(ж). Так как коэффициент с > 0, то нулевая точка
не является точкой минимума функции ¡ на ж2. Точка ж* - ( 4 , 4 ж2 есть точка
минимума функции ¡1 на ж2. В ней ¡о(ж*) = 2Ц, ¡1(ж*) = 24. Следовательно, точка ж* также не является точкой минимума функции ¡. Таким образом, функция ¡ достигает минимума в точке ж*, для которой (ж*) = {0,1}. Тогда
Р1^) = 2^ + 5, р1(^) = 2^ + 7, Р= 9(2^ + 5)(6 + ^)2 + 16(2д + 7)(4 + ^)2 - 5(4 + ^)2(6 + ^)2 = 5/ + 50^3 + 1П^2 - 196^ - 532 = (^ - 2)(5^3 + 60^2 + 231^ + 266).
Многочлен 5^3 +60^2 + 231д+266 не имеет положительных корней, поэтому число =2 является единственным положительным корнем многочлена Ри точкой минимума функции ¡ на ж2 будет точка ж* = (1,1).
Рассмотрим задачу минимизации на плоскости функции максимума от трех квадратичных функций:
¡о (ж) = 1 (ж, ж), ¡1 (ж) = 2 (Лж, ж) + (Ь1,ж) + с1, ¡2 (ж) = 2 (Аж, ж) + (Ь2 ,ж) + с2,
где матрица Л — диагональная, матрица А — симметричная, ж, Ь1 Ь2 £ ж2, с1, с2 £ ж. Предположим, что в точке минимума ж* активны три функции. Тогда точку минимума следует искать среди решений системы нелинейных уравнений:
{2 (Лж, ж) + (Ь1, ж) + с1 = 1 (ж, ж), 2(Аж,ж) + (Ь2,ж) + с2 = 1 (ж, ж).
Среди этих точек выбирается точка ж*, для которой нулевая точка содержится в треугольнике, натянутом на векторы ж*, Лж* + Ь1, Аж* + Ь2.
Следует отметить тот факт, что если найденная точка минимума не является точкой минимума ни одной из функций ¡р, р = 0,1, 2, то она будет точкой строгого локального минимума функции ¡.
Пусть
4. Минимизация функции максимума квадратичных функций с постоянным шагом
/ (ж) = max /¿(ж), /¿(ж) = 1 (А»ж,ж) + (6», ж) + с», i е I = {1,...,s}, »6/ 2
где матрицы A» — положительнно определенные, ж, 6» е rn, c» е r, i е I. Известно, что
функция / является сильно выпуклой на rn. В качестве константы сильной выпуклости
можно взять константу m = min т, где m» — наименьшее собственное число матрицы A».
¿6/ 2
Т. е.,
/(Аж1 + (1 - Л)ж2) < А/(ж1) + (l - А)/(ж2) - mA(1 - А)||ж1 - ж2||2, V А е [0,1], Vж1,ж2 е rn, i е I.
Рассмотрим задачу: найти
min f(ж). (11)
Решение задачи (11) существует и точка минимума функции / на rn единственна.
Обозначим через M = max{1, max M»}, где M» — наибольшее собственное число мат-
¿6/
рицы A». Тогда справедливо неравенство
(А»ж,ж) < M||ж||2 Vж е rn, Vi е I. (12)
С каждой точкой ж е rn свяжем оптимизационную задачу: найти
min max {(/¿(ж) - /(ж))М + (/(ж), w) + 2IN2) . (13)
w6Rn »6/ ^ 2 J
Этот минимум достигается в единственной точке ад(ж) е rn. Обозначим через
1
р(ж) = max <| (/(ж) - / (ж))М + (/(ж), w(x)) + ^||w(x)||2
гб/ ^ 2
Из необходимых условий минимума задачи (13) следует существование коэффициен-
тов
таких, что
А»(ж) ^ 0, i е I, £А(ж) = 1,
»=1
ад(ж) = А» (ж)/(ж) = £ А»(ж)(А»ж + 6»), =1 =1
s 1
р(х) = £ Аг(ж)(/(ж) - /(ж))М - 2 |Иж)||2 < 0.
¿=1
Несложно доказать утверждения:
Лемма 2. 1) Функция р(ж) тогда и только тогда равна нулю, когда точка ж является точкой минимума функции / на Ж".
2) Если вектор ад (ж) = 0П, то р(ж) = 0.
Таким образом, если точка ж* — точка минимума функции / на Ж", то ад(ж*) = 0П.
В дальнейшем будет показано, что если точка х не есть точка минимума функции / на ж", то направление ю(х) является направлением спуска функции / в точке х.
Опишем метод минимизации функции / на всем пространстве ж".
Выберем произвольную точку хо £ ж". Если точка хо есть точка минимума функции / на ж", то процесс останавливается.
Пусть уже найдена точка хк £ ж". Если точка хк является точкой минимума функции / на ж", то процесс закончен. Предположим, что точка хк не является точкой минимума функции / на ж". Найдем направление спуска ю(хк), т. е., решим оптимизационную задачу (13) при х = хк. Тогда найдутся такие коэффициенты
5
\г(хк) = \к > 0, г £ I, \к = 1,
что справедливо
ю(хк) = - \'к¡¡(хк), ю(хк) = 0",
г=1
5 1 р(хк) = Хг(хк)(Мхк) - ¡'(хк))М - -\\т(хк)||2 < 0.
Положим а = м, хк+1 = хк + аю(хк).
Лемма 3. В каждой точке хк выполняется неравенство
¡(хк+1) - ¡(хк) < МР(хк)' (14)
< В силу свойств функций ¡г справедливо
«2
¡г(х + аю) = ¡г(х) + а{Ц(х),ю) + — {Лгю,ю) vг £ I, vх £ ж", ю £ ж", Vа. Тогда из (12) для любого г £ I имеем
&2
¡г (хк + &т(хк )) - ¡ (хк ) ^ ¡г(хк ) - ¡ (хк ) + &Ц(хк ),ю(хк )) + — М\\ю(хк )\\2
= ¡г(хк) - ¡ (хк ) + М ¡''(хк ),ю(хк)) + -ММ\\ю(хк ^^
Отсюда вытекает неравенство
тах ¡г(хк + аю(хк)) - ¡(хк) = ¡(хк+1) - ¡(хк)
г€I
^ тах{ ¡г (хк) - ¡ (хк) + М {И(хк ),ю(хк)) + 2М\\ю(хк ^^
= Мт!/!^^) - ¡(хк))М + {0>(хк),ю(хк)) + -У^к^2 | = МР(хк) < 0 >
Неравенство (14) показывает, что процесс является релаксационным, следовательно, последовательность ^(хк)} является сходящейся.
Следствие 1. Если последовательность {ж*} бесконечна, то р(ж*) ^ 0 при А ^
Так как для любой сильно выпуклой функции множество
Джо) = {х £ Ж" | / (ж) < / (же)}
компактно, то последовательность {ж*}, генерируемая этим методом принадлежит лебегову множеству Джо).
Лемма 4. Для данного метода в каждой точке ж* справедливо неравенство
р(ж*) < т (1 (ж*) - 1 (ж*)). (15)
< Для точек ж*, ж* и для каждого индекса г £ I верно неравенство
/¿(ж*) - /¿(ж*) ^ (/(ж*),ж* - ж^) + — Уж* - ж^У2, г £ I. Тогда, умножая это неравенство на т, получим
2
(/•(ж*),т(ж* - ж^)) ^ т(/(ж*) - /¿(ж*)) - — Уж* - ж^||2, г £ I. Положим в (13) ш = т(ж* - ж*). Тогда имеем
) ^ шах| (/¿(ж*) - /(ж*))М + (/• (ж*), т(ж* - ж^)) ¿6/
1 Г
+ "ГТ Уж* - ж*^ ша^ (/¿(ж*) - /(ж*))т + т(/(ж*) - /¿(ж*))
— J ¿6/
^ тшах/(ж*) - /(ж*)} ^ т(/(ж*) - /(ж*)). > ¿6/
Следствие 2. Из формул (14) и (15) вытекает неравенство
т
/(ж*+1) - /(ж*) < м(/(ж*) - /(ж*)). (16)
Следовательно, последовательность {ж*} является сходящейся и ее предельной точкой является точка минимума функции / на Ж".
Теорема 2. В данном методе при произвольной начальной точке жо £ Ж" последовательность {ж*} сходится к точке минимума ж* функции / со скоростью геометрической прогрессии:
/(ж*+1) - /(ж*) < д(/(ж*) - /(ж*)),
т
где д = 1 - м, и существует положительное число Ц, что справедливо неравенство
Уж* - ж*У < .
< Из (16) получим
т
/(ж*+1) - /(ж*) < /(ж*) - /(ж*) + м(/(ж*) - /(ж*))
= (1 - т) (/(ж*) - /(ж*)) = 9(/(ж*) - /(ж*)).
Следовательно, для каждого фиксированного к > 0 имеем
/(ж*) - /(ж*) < д*(/Ы - /(ж*)). Поскольку точка ж* есть точка минимума функции / на ж", то
\ m IU ™*И2
Поэтому Обозначим через
f (жк) - f (Ж*) ^ — ||Xfc - ж
о
||жк - Ж*||2 < -(f (xfc) - f (x*))qk.
m
q=\/ m(f (жо) - f (ж*)),
тогда
l|xfc - ж*| ^m2(f(ж^) - f(x*))qk < Q(Vq)fc. >
2
m
Рассмотрим более подробно вычислительный аспект решения задачи (13). Для того чтобы найти направление ), необходимо решить задачу квадратичного программирования
min |(G(xfc)А,А) + M(q(xk),А)|, АеЛ
где
s
Л = {А = (Ai,..., As) g rs | ^ А = 1, А ^ 0, i g I},
¿=1
G(xk) — матрица Грама векторов /¿(xk), т. е.,
/(Л(xk),/1 Ы) ... (/1 G(xk) = I
\(/S(xfc),/i (xk)) ... (/s (Xk),/S(xfc))/
и
q(xk) = (qi (xk),..., qs(xk)) G rs, q»(xk ) = / (xk) - /i(xk), i g I. Таким образом, необходимо определить коэффициенты Ai, i G I, и выразить через них
s
вектор w(xk) по формуле w(xk) = - Ak/¿(xk).
¿=1
Пример 2. В качестве тестовой функции была рассмотрена функция максимума [5]
»10
f (ж) = max f¿ (ж), ж G Ri0, I = 1,..., 5, ¿е/
где
/¿(ж) = (Аж,ж) + (Дж), G R10, i G I, a¿(j, k) = ej/k cos(j ■ k) sin i, j < k, a¿(j,k) = a¿(k,j), j > k, | sin i | ■ i . . ,..
bi(j) = ej/i sin (i ■ j), j, k G 1 : 10.
Матрицы i G I, являются положительно определенными и в таблице 1 приведены, соответственно, максимальное (Amax) и минимальное (Amin) собственные числа матриц
2 А», значение каждой из функций /», г £ I, в точке минимума и норма градиента этих функций в точке минимума.
Для данной функции М = 36.32, т = 0.67. Точка ж* = (-0.0546, -0.0241, -0.0057, 0.0231, 0.0558, -0.2434, 0.0685, 0.1321, 0.0772, 0.0336)т £ ж10 — точка минимума функции /(ж) на , /(ж*) = -0.72576 — решение задачи, ||ш(ж*)|| = 0.000092, й(ж*) = {2, 3,4, 5}, где
Д(ж*) = {г £ I | /(ж*) = /(ж*)}.
Таблица 1
i 1 2 3 4 5
^max 53.947 59.585 9.470 55.017 72.613
^min 14.301 16.661 2.754 19.337 25.919
/i(x*) -311.19750 -0.725756 -0.725756 -0.725756 -0.725756
11/(ж*)|| 12805.888 155.679 37.765 14.479 5.934
Из таблицы видно, что первая функция не является активной в оптимальной точке, но поскольку ее градиент в ж* достаточно большой, то в точке ж*+а/ (ж*) при небольших а она становится активной.
Очевидно, что в большинстве случаях заранее не известно число M. Поэтому можно использовать данный алгоритм при различных M, начиная с заведомо большого. Для данного примера оптимальная точка ж* была получена при M = 145.28 за 85 шагов, при M = 72.64 за 38 шагов, при M = 36.32 за 19 шагов, при M = 18.16 за 11 шагов. При M = 9 и меньше алгоритм не сходился. Задача считалась решенной, если выполнялось условие ||w(xk)|| < 10-4.
Литература
1. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс.—М.: Наука, 1972.—368 с.
2. Пшеничный Б. Н. Метод линеаризации.—М.: Наука, 1983.—136 с.
3. Гантмахер Ф. Р. Теория матриц.—М.: Наука, 1967.—552 с.
4. Мишина А. П., Проскуряков И. В. Высшая алгебра. СМБ.—М.: Физматгиз, 1962.—300 с.
5. Lemarechal C. An extension of Davidon methods to nondifferentiable problems // Mathematical programming.—1975.—Study 3.—P. 95-100.
Статья поступила 18 декабря 2006 г. Полякова Людмила Николаевна
Санкт-Петербург, Санкт-Петербургский государственный университет E-mail: [email protected]