Научная статья на тему 'МДМ-методу - 40 лет'

МДМ-методу - 40 лет Текст научной статьи по специальности «Математика»

CC BY
301
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТОЧКА МНОГОГРАННИКА / БЛИЖАЙШАЯ К НАЧАЛУ КООРДИНАТ / ИТЕРАТИВНЫЙ АЛГОРИТМ / ВЫЧИСЛЕНИЕ МИНИМУМА / КВАДРАТИЧНАЯ ФОРМА

Аннотация научной статьи по математике, автор научной работы — Малоземов Василий Николаевич

МДМ-метод (метод Малоземова-Демьянова-Митчелла) используется для нахождения точки многогранника, ближайшей к началу координат. Многогранник определяется как выпуклая оболочка данных точек в n-мерном пространстве.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МДМ-методу - 40 лет»

Вестник Сыктывкарского университета. Сер Л. Вып.15.2012

УДК 519.6 МДМ-МЕТОДУ — 40 ЛЕТ В. Н. Малозёмое

МДМ - метод (метод Малоземова -Демьянова -Митчелла) используется для нахождения точки многогранника, ближайшей к началу координат. Многогранник определяется как выпуклая оболочка данных точек в п -мерном пространстве.

Ключевые слова: точка многогранника, ближайшая к началу координат, итеративный алгоритм, вычисление минимума, квадратичная форма.

1.

Пусть в пространстве Мп заданы т точек,

Н = Ы«.

Обозначим через С выпуклую оболочку множества Н.

Ставится задача: найти точку из С, ближайшую (в евклидовой норме) к началу координат. Задачу можно записать так:

|Ы|2 тт . (1)

Задача (1) имеет решение и оно единственно. Обозначим его г>*.

Вопрос о нахождении г;* возник как вспомогательная задача в оптимальном управлении [1] и негладкой оптимизации [2]. В 1971 году в работе [3] был предложен простой итерационный метод для решения задачи (1), который в дальнейшем получил название “МДМ-метод” (см., например [4,5]). В данной статье я возвращаюсь к анализу МДМ-метода с современных позиций.

© Малозёмов В. Н., 2012.

Отметим прежде всего, что при всех V £ С выполняется неравенство

{V, V*) > (г;*, г;*}. (2)

Действительно, зафиксируем V Е С. В силу выпуклости множества С точка V* + — г>*) при всех £ Е (0,1) принадлежит (7, поэтому

< (г;*+£(г;-г;^,г;* + £(г;-г;*)) = + 2£(г;*, г; —г;*) +£2||г; —г;* ||2.

Отсюда следует, что

(г;*, г; - г;*) + |£||г; - г;*||2 > 0.

В пределе при £ —^ +0 получим неравенство, равносильное (2). Неравенство (2) равносильно также следующему неравенству

\\ъ — ^*||2 < 1М12 — ||^*||2 е (з)

з.

Обозначим через А матрицу со столбцами а1;..., ат. Тогда любой вектор V из выпуклой оболочки С множества Н допускает представление

т

у = Ар, р> О, ^2р[г] = 1. (4)

г=1

Первичным в этой формуле является вектор коэффициентов р. Носитель вектора р обозначим М+(р), так что

М+(р) = {г Е 1 : т \ р[г] > 0}.

Введём величину

Д(р) = тах {а^у) — тт(а^г?);

геМ+(р) г£1:т

где V = Ар. Вектор р удовлетворяет условиям, указанным в формуле (4). Множество таких векторов обозначим Р.

Лемма 1. При любом V = Ар, р Е Р} справедливо неравенство

Доказательство. Согласно (2) имеем

■у||2 - 2(г;,г;*) + ||г;*||2 < ||г;||2 - (г;,г;*)

т

геМ+(р)

1=1

< тах (а*, г;} — тт(аг,г;) = Д(р).

1^М+(р) г£1 :т

Лемма доказана.

Из (5) следует, в частности, что

А(р) >0 \/р € Р.

(6)

Лемма 2. Равенство в (6) достигается тогда и только тогда, когда вектор V = Ар является решением задачи (1).

Доказательство. Неравенство (5) гарантирует оптимальность вектора V = Ар в случае Д(р) = 0.

Наоборот, возьмём решение V* = Ар* задачи (1) и покажем, что Д(р*) =0. Пусть

(коэффициент при а# передали вектору а,^). Очевидно, что € С. Имеем

(£*,«*) = (г»*, г»*} -р*[г'](а*/ - = (г;*, г»*} - р*[г']Д(р*).

В силу (2) и положительности получаем Д(р*) < 0. Вместе с неравенством (6) это приводит к равенству Д(р*) = 0.

Лемма доказана. □

Д(р*) = (а# -

где г* Е М+(р*), г" € 1 : т. Введём вектор

Обратимся к МДМ-методу. Возьмём начальное приближение у0 Е С. Пусть уже имеется к-е приближение Ук = Арк, р& Е Р. Опишем построение Ук+1.

Найдём индексы гк Е М+(р&) и гк Е 1 : т, такие, что

тах (сц,ук) = (а,г>,ук),

ъеМ+(рк)

тт (аг, ук) = (а^,ук).

г£1:т й

Для простоты будем использовать обозначения

аг'к = ак1 аг'1 = ак-

В этом случае

^к^{рк) = ~ ак^к)-

Если Д& = 0, то, согласно лемме 2, у^ — решение задачи (1). Процесс закончен.

Пусть Ак > 0. Введём вектор

щ = щ- рк(а'к - а"),

где рк = Рк[^\- Очевидно, что у к Е С. Рассмотрим отрезок

щ{£) =щ + *(«* - ьк) =ьк- 1р'к{а!к - ак), £ € [0,1].

В силу выпуклости множества С все точки Уь{£) этого отрезка принадлежат С. Выберем £*. € [0,1] из условия

КЫ||2= тт К(0||2.

*е[о,1]

Положим У}г+1 = Ук{^к) (см* РИС.).

Рис.

Нетрудно понять, что

{РкЩ, при іфі'к,іфї'к,

(1 - ік)Рк[їк], при і = їк,

Рк К] + і к Рк Ш, при % = %"к.

Укажем явную формулу для і^. Имеем

КО)II2 = \\щ\\2 + 2фк,Щ - Ук) + Ь2\\щ - ук\\2 = = 1Ы12 - 2Ър'к Ак + г2\\щ - Ук\\2.

Абсолютный минимум У}г(і) на № достигается в точке

(7)

7 = Рк^к = р'к&к = &к , .

* "Л -«*Н2 (К)2К-<112 р'кК-<112' и

Ясно, что > 0, поэтому

£ _ [ 4, если 4 < 1,

I 1, если £& > 1.

Описание МДМ-метода завершено.

Построена последовательность ^0,^1,... точек из С. Если она конечна, то последний её элемент является решением задачи (1). Вообще говоря, последовательность {^} бесконечна. Такая ситуация возникает, когда

Д& >0 и, как следствие, ||г;^+1|| < Цг^Ц при всех к = 0,1,....

(9)

Покажем, что в этом случае последовательность {^} сходится к^ — решению задачи (1).

5.

Начнём со вспомогательных утверждений.

Лемма 3. Справедливо предельное соотношение

l\mp'kAk = 0. (10)

к^оо

Доказательство. Допустим противное, то есть что существует бесконечная подпоследовательность {р^Д^}, такая, что

PkAks > £ > 0.

Обозначим через d диаметр множества G,

d = max II и — v\\.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

G, v(zG

Согласно (7) имеем

IK(i)||2 < IKf - 2ts + t42 = IK II2 -ts- t(s - td2),

поэтому при t G [0,5/d2] будет

IK(0H2<IK||2-te.

Положим i* = min{l, e/d2}. Тогда

|K+1||2 = min |K(t)||2< |K(i*)||2 <\М2-ие.

te[ 0,1]

Неограниченное число указанных понижений в монотонно убывающей последовательности {||^||2} противоречит неотрицательности её элементов. Лемма доказана. □

Лемма 4. Справедливо предельное соотношение

lim Ak = 0.

к^оо

Доказательство. Допустим противное:

lim Ak = А' > 0.

к^оо

В этом случае для достаточно больших к > к$ будет выполнятся неравенство

д* > Д'/2. (11)

Отсюда и из (10) следует, в частности, что

р'к —)■ 0 при к оо.

Далее, согласно (8) и (11)

Д'

так что 4 —^ +ос при к —^ ос. На основании определения заключаем,

что = 1 при Л: > Л:! > Л:0* Это приводит к соотношению

«к+1 = & > Ь- (12)

Рассмотрим последовательность

^15 ^1 + 1; ^1+2} • • • • (^З)

Соотношение (12) показывает, что компоненты РкЩ вектора опре-

деляющего г>*., получаются путём перераспределения значений г Е 1 : т, поэтому в последовательности (13) может быть лишь конечное число попарно различных элементов. Но это противоречит неравенству К+1II ||||, справедливому при всех к — 0,1,2,....

Лемма доказана. □

Теперь легко доказать утверждение о сходимости МДМ-метода.

Теорема 1. При выполнении условия (9) последовательность {г^}, построенная МДМ-методом} сходится к V*.

Доказательство. Согласно лемме 4 существует подпоследовательность {Д&3}, сходящаяся к нулю. По лемме 1 соответствующая подпоследовательность сходится к г>*. В частности, ||^|| -^ ||^*|| при 5 —^ ос.

В силу (9) вся последовательность {||^||} строго убывает, поэтому 11^11 ||^*|| ПРИ к —^ ос. Остаётся сослаться на неравенство (3). Теорема доказана. □

Отметим, что v* = О тогда и только тогда, когда О G G. В этом пункте считаем, что v* 7^ О.

Введём гиперплоскость

L = {х | (u*,а;) = (и*,?;*)}.

Теорема 2. ifcym v* 7^ О, то; начиная с некоторого номера, все точки последовательности {v^} принадлежат L.

Доказательство. Обозначим М = 1 : т,

Ai/q = G ]\/f | G = Ad \

Согласно (2)

(аьг;*) > (г;*, г;*), г G 1 : т,

поэтому при г G М\

(ahv*) > (г;*, г;*).

Положим

г = min(a^*) — (г;*,г;*) > 0.

«GMi

Очевидно, что

('a-i,v*} > + т, i G Mi. (14)

Воспользуемся теоремой 1, в силу которой найдётся индекс &0, такой,

что при к > ко

maxi(ai,vk) - {a,i,v*)\ < j.

При тех же к и г G Mq

< («*,«*) + \ = (w*, W*) + ^ (15)

в то время как при i G Mi согласно (14)

(ai,vk) > (а*, г»*} - f > («*,«*) + х- (16)

Значит, при к > ко

тт(щ,ук) = тт(щ,ук). (17)

i€l:m ieM о

Запишем представление

vk=^2 Pk[i\ai + X РкЩа-i-

ieMo ieM 1

Покажем, что в последовательности

Кк0, Кк0 + 1, Уко+2, ■ ■ ■ (18)

встретится элемент ук, у которого РкЩ = 0 при всех г £ М\.

Допустим противное. На основании (15) и (16) получим

шт (а,г,ук) < (г;*, г;*) +

гЕ1 :т

тах (а,г,ук) > («*,«*) + Ч.

гем+(рку 4

Отсюда следует, что

А к > т/2, & > &0- (19)

Далее, в силу определения Мо и г имеем

т

{Ук - «*,«*) = (53Ы*Ка* - г»*),?;*) =

г=1

= Рк[*](о* - «*,«*) > Т 53 РкИ-

геМх геМх

Левая часть этого неравенства стремится к нулю при к —^ ос, поэтому

/с—>■ оо

г^Мх

Выберем столь большое А4 > /со, чтобы при к > к\ выполнялось неравенство

г

Ей и <2^-

На основании (8) и (19) получим

Л/2 г

4 “ ЪР Е,;см, Р*И “ 1-

Значит, £*. = 1 и при к > . Как установлено при

доказательстве леммы 4, отсюда следует, что в последовательности ^х+Ъ ^х+2? * * * может быть лишь конечное число попарно различных элементов. Это противоречит строгому убыванию ||^||*

Итак, в последовательности (18) встретится элемент г>*., имеющий представление

= 53 Рк> о, 53 = 1- (2°)

геМо

В частности, ик принадлежит гиперплоскости Ь. Согласно описанию МДМ-метода и соотношению (17) последующие элементы последовательности эту плоскость не покинут.

Теорема доказана. □

7.

Лемма 4 допускает усиление.

Теорема 3. Справедливо предельное соотношение

lim Ак = 0.

к^оо

Доказательство. В случае v* = О (когда vk —> О) утверждение очевидно. Действительно,

Afc < таx(ahvk) - min (ahvk).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i£l:m i£l:m

Правая часть этого неравенства стремится к нулю при к ос. Остаётся учесть неотрицательность Д&.

Пусть v* ф О. Согласно (20) при больших к

max (ai}Vk) < max(a^v^).

ieM+(pk) ieMo

Принимая во внимание (17), приходим к неравенству

Afc < таx{ahvk) - тт(щ,ук).

ieM0 ieM0

В силу теоремы 1 И определения Мо имеем

lim Гтах(аг,г^) — min(a^^)l = тах(а«,г?*) — min(а«,г?*) = 0.

к^оо lieM0 ieM0 J ieM0 ieM0

Остаётся учесть неотрицательность Д&.

Теорема доказана. □

8.

МДМ-метод позволяет за конечное число шагов строго отделить начало координат от С в случае, когда О ^ С.

Теорема 4. Условие О ^ С выполняется тогда и только тогда, когда при некотором к

< \\vkW2. (21)

Неравенство (21) гарантирует, что гиперплоскость

(ук,х) - {ик,а%} = 0 (22)

строго отделяет начало координат от множества С.

Доказательство. Пусть О ^ С. Справедливость неравенства (21) при некотором к следует из того, что Ак —> 0 и ук —^ г?*, ф О.

Наоборот, на основании (21) и (5) получаем

К-г;*||2< Ы|2.

Такое неравенство возможно только при V* ф О.

Перепишем неравенство (21) в развёрнутом виде

К - ак^к) < {Ук,Ук}.

Отсюда следует, что

-(ак^к) < (Ък,пк - а!к).

Так как

< (а'к,ък),

геМ+(рк)

ТО

-{а'',ук)< 0. (23)

Вместе с тем, при всех V Е С

т

= ^2р[г]Ы,аг) > (а'к^к),

г=1

так что

(ук,у) - (ук,а'к) > 0. (24)

На основании (23) и (24) заключаем, что гиперплоскость (22) строго

отделяет начало координат от множества С.

Теорема доказана. □

Литература

1. Gilbert Е. G. An iterative procedure for computing the minimum of quadratic form on a convex set // J. SIAM Control. 1966. Vol. 4. No. 1. P. 61-80.

2. Demyanov V. F. Algorithms for some minimax problems // J. Computer and System Sciences. 1968. Vol. 2. No. 4. P. 342-380.

3. Митчелл Б. Ф., Демьянов В. Ф., Малоземов В. Н. Нахождение ближайшей к началу координат точки многогранника // Вестник ЛГУ. 1971. № 19. С. 38-45.

4. Barbero A., Lopez J., Dorronsoro J. R. An accelerated MDM algorithm for SVM Training // European Symposium on Artificial Neural Networks — Advances in Computational Intelligence and Learning. Bruges (Belgium), 23-25 April 2008. P. 421-426.

5. Lazaro J. L. On the relationship among the MDM, SMO and SVM-Light algorithms for Training Support Vector Machines // Master’s thesis. Universidad Autonoma de Madrid. Madrid, 2008.

Summary

Malozemov V. N. On the fortieth anniversary of MDM-method

MDM-method (Malozemov -Demyanov -Mitchell method) is used for the finding the point of a polyhedron which is closest to the origin. The polyhedron is defined as the convex hull of the given points in n -dimensional space.

Keywords: point of a polyhedron which is closest to the origin, interative procedure, computing the minimum, quadratic form.

Санкт-Петербургский государственный университет

Поступила 20.05.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.