Научная статья на тему 'Идентификация нескольких множеств в многомерном пространстве'

Идентификация нескольких множеств в многомерном пространстве Текст научной статьи по специальности «Математика»

CC BY
74
21
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Зубова О. А.

Изложен алгоритм построения оптимального в смысле некоторого оценочного функционала решения задачи идентификации нескольких множеств в многомерном пространстве при помощи двух параллельных гиперплоскостей. Доказана теорема о сходимости предложенного алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The identification ofseveral sets in the multidimensional space

In order to evaluate the precision of a decision rule two surrogate functionals are suggested and considered. Necessary conditions for optimality in the sense of these two functionals are deduced. Reasoning from the mentioned conditions the algorithm for constructing an optimal decision rule is built. The theorem of algorithm convergence is proved.

Текст научной работы на тему «Идентификация нескольких множеств в многомерном пространстве»

УДК 519. 3 Вестник СПбГУ. Сер. 10, 2007, вып. 4

О. А. Зубова

ИДЕНТИФИКАЦИЯ НЕСКОЛЬКИХ МНОЖЕСТВ В МНОГОМЕРНОМ ПРОСТРАНСТВЕ *>

1. Постановка задачи. Пусть в пространстве Г1'г заданы три множества точек А, В и С:

А = {«г | г- е / =г:

В = 1 • ^ т 1 з е 7 =

С = < (с*| к 6 Я <ШГ

(1)

Рассмотрим задачу разделения множеств (1) при помощи двух параллельных гиперплоскостей, задаваемых уравнениями

г (х,¡х) = 0, г (х, /2) = 0, где г (х, I,) = (х, I) + (¿¿;

и = I,х б в.", си е И, ||/|| = 1, I = 1 : 2.

Положим П {/ = [й1,с12,1] | I е Нп,||*|| = Мь<*2 € и], П С К"+2. Задача

идентификации заключается в построении определенного решающего правила (РП),

которое позволит отнести любую точку у 6 У = Л и .В У С к тому или иному множеству. Будем искать РП следующего вида:

если г (у, 11) ^ 0, то считаем, что у £ А,

если г(у,11) > 0, г (у,/2) < 0, то считаем, что у £ В, (2)

если г (?;,/о) ^ 0, то считаем, что у & С.

Заметим, что РП вида (2) однозначно определяется набором параметров I = [сД, (1-2, /] 6 11"+2.

Для того чтобы оценить, насколько точно РП (2) идентифицирует точки множеств Л, В и С, введем два функционала - ^ (/) и Р2 (I):

МО = ^тах|о,г (агЛ)} + ^тах|о,г (Ь,-,/2) , -г (^Л)} +

геГ ]€■/

^тах{о ,-г(ск,12)}, (3)

тах|о,г (а.,Г1)}) + ]Г(тах{о,г (Ь^12) , -г (^,¿1)}) +

МП

кек 1 2

1-ге/

+

кек

(4)

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 06-01-00276). © О. А. Зубова, 2007

Оба функционала, F\ и выпуклые. Более того, функционал F2 является гладким. Заметим также, что Fi(l) ^ 0, F2(l ) ^ О при любых 1 Е Rn+2 и на множестве fí F\ (l) -> +00, F?(l) +00 при max{|c¿i|, |d2|} +°о.

Функционал (3), как и функционал (4), условно говоря, является величиной ошибки в случае некорректной идентификации, а именно: Fi (I ) есть сумма расстояний от неверно идентифицированных точек до соответствующих гиперплоскостей, a F2 (I) -половина суммы квадратов этих расстояний. Потому будем считать РП (2) тем лучше, чем меньше значение F\ или F2 для заданного набора параметров I.

Определение. Набор параметров I* = [dl,d,2,l*] называется оптимальным в смысле функционала F, если

F( Г) = infFÍ П. ie п

РП вида (2), соответствующее такому набору параметров Г, называется оптимальным в смысле функционала F.

2. Исследование функционала F\[l). Рассмотрим задачу условной минимизации:

Fx(í)-> rnin. (5)

Введем штрафную функцию Фх (I)

Фх(/) = F1(Í)+\<f>(l), ф{1) = |1 - ||/|||, А ^ 0. (6)

При достаточно больших Л > 0 задача (7) сводится к задаче безусловной минимизации функции Фх (I) на всем пространстве R"+2(cm. [1]).

Функция Фх (/) является квазидифференцируемой (см. [2]). Напомним, что функция f{x) : Rm —> R называется квазидифференцируемой в точке € Rm, если она дифференцируема по любому направлению g G Rm в этой точке и существуют выпуклые компактные множества df(x0), df(x0) С Rm такие, что

f'(x,g)= max (v,g)+ min {v, g).

vedf(xo) vedf(xo)

Множество Df(xo) = [df(xo), df(xo)] называется квазидифференциалом функции f в точке Хо, множество df(x0) - субдифференциалом функции f в точке Хо, а множество df{x0) - супердифференциалом функции f в точке Xq.

Найдем квазидифференциал функции Фх (/). Согласно формуле (6), справедливы равенства

ЗФх ( í) = fiFi(í) +Хдф(1), 9Фх (í) = dFi(í) + Хдф (I).

Вычислим суб- и супердифференциалы функций Fi[l) и ф(1) (см. [2]):

fiFi(í) = 5:11,0.a,]+ £»{[1,0,0,], [0,0,0«]}+ ]Г [-1.0,-У +

iei+ ieh jeJ\-

+ Y1 [0,-l,-c*]+ 53 co{[0,-l,-Cfc],[0,0,0n]}+ Y, [O.iA'H (7)

keKo k&K„ j€J?+

+ 53 co{[-1, o, -6j], [0,0,0„]} + co{[0,l,6j],[0,0,0„]},

jeJ Ю jeJ2o

dFi (/) = {[0,0,0„]}, дф(1) = co{[0,0,/],[0,0,-/]}, дф{1) = {[0,0,On]}, (8)

I0 = {iel\ r(x,h) = 0}, 1+ = {г e I | r(x,h) > 0}, Jio = {j eJ | r(®,Zi) = 0}, = {j 6 J | r(x,¿i) < 0}, J20 = {j £J\ r(x,l2) = 0}, J2+ = {j € J | r(®,i2) > 0}, Äo = € Ä" | r(®,i2) = 0}, = {A: € tf | r(®,/2) < 0}.

Необходимым условием минимума функции Ф1 (l) в точке Г € Rn+2 является выполнение следующего включения:

-ЭФ^Г ) С ). (9)

Пусть множества /о, Jio, J20 и Ä"o пустые, т. е. ни одна точка множества Y не попала ни на одну разделяющую гиперплоскость. Тогда из формул (7) и (8) получим

2*1 ( 0 = £ [1,0,*]+ ¿2 [-1,0,-6;]+ £ [0,1, у +

¿6/+ j€Ji-

+ [0,-1, -ck] + Асо{[0,0,/], [0,0, -/]}, (10)

кек_

= {[0,0,0„]}. Подставив в (9) выражение (10), находим

{[0,0,0*]} е ^[1,0,*]+ [-1,0,-6,]+ 53 to.i,bj) +

¿6/+ jeJ 1- j€J2+

+ [0,-1,-с,]+ Лсо{[0,0,/], [0,0,-/]}. (11)

Распишем условие (11) покоординатно. По первой и второй координатам имеем

|/+| = | Ji-\,\K-\ = \ J2+|,

где | |, | Ji_ |, | J2-(- |, | К- | - количество элементов множеств I+, Ji_ , J2+ и соответственно. По последним гг координатам выражение (14) эквивалентно следующему соотношению:

at - J2 bi + £ bi - Е = <"Г> (12)

¿6/+ jeJi- j€J2+

где ц = [—Л, А].

Таким образом, в случае пустоты множеств 7о, Jio, J20 и Ко доказана следующая лемма.

Лемма 1. Для того чтобы РП было оптимальным, в смысле функционала , необходимо, чтобы, во-первых, количество неверно идентифицированных точек множества А было равно количеству точек множества В, ошибочно идентифицированных как точки множества А, а количество неверно идентифицированных точек множества С было равно количеству точек множества В, ошибочно идентифицированных как точки множества С, и, во-вторых, вектор из левой части равенства (12) был параллелен вектору нормали I*.

Следует заметить, что в общем случае, когда множества /о, Jlo, ^20 и Ко не являются пустыми, имеет место более громоздкая геометрическая интерпретация условия оптимальности, полученного выше.

3. Исследование функционала Р2( I). Найдем необходимое условие оптимальности в смысле функционала ^ (I). Для этого решим задачу:

(/) —> тт. (13)

Построим штрафную функцию Ф2(1)'-

ф2(?) =^(г) +\ф{1). (14)

При достаточно больших Л > 0 задача (13) сводится к задаче безусловной минимизации функции Ф2( I) на всем пространстве Г1п+2(см. [1]).

Если агц гшпф2 (/ ) = [(I**, (й*, Г*} I**, то тогда выполняется следующее пеобхо-димое условие минимума функции Ф2 на Р1"+2:

-дФ2 (I** ) С д_Ф2 ( Г* ). (15)

Определение. Точка Г* € Г1'1+2, удовлетворяющая условию (15), называется т}-стационарной точкой функции Ф_> (I, ) в пространстве Кп+2.

Пусть множества /о, Л о, </20 и Ко пустые. Найдем суб- и супердифференциалы функции Ф>( / ) ~ множества ЗФ2( I ) и 5Фг( I ). Для этого получим аналогичные множества для функций Р2[1) (см. [3]) и ф[ I). Из (14) имеем

дФ2{1) = £ г (,а„¿О [1,0,«,] + £ г (МО I"1'0. ~Ъз\ + Е (М~0 ЪЪЛ +

+ Е г (ск'г"а) [0,-1,-с^] +Лсо{[0,0,/],[0,0,-/]}, дФ2(1) = {[0,0,0„]}. (16) Из (15) и (10) находим

X г- (МГ) = Е г (МГ) ' Е Г (МГ) = Е г (С*>'~Г) > (17)

1£1+ jeJl- ¿£¿2+ квК-

Е г (МГ) а, - Е г (М~Г) ^ + Е г МП М Е г (■сь'Г) <* = цГ, (18)

1'€/+ j£J 1- jeJ2+ кек_

где /í 6 [—Л, А].

Таким образом, доказана

Лемма 2. Для того чтобы РП было оптимальным в смысле функционала Fo, необходимо, чт,обы, во-первых, сумма расстояний от неверно определенных точек множества А до разделяющей гиперплоскости г (ж, /**) =0 была равна сумме расстояний от точек множества В, ошибочно идетпифицированных как точки множества А, до этой гиперплоскости, а сг/мма расстояний от неверно определенных точек множеств С до разделяющей гиперплоскости г (ж,/") = 0 была равна сумме расстояний от точек множества В, ошибочно идетпифицированных как точки множества С, до этой гиперплоскости, и, во-вторых, вектор из левой части уравнения (18) был параллелен вектору нормали Г*.

4. Алгоритм построения оптимального РП. Представим субдифференциал функции Ф2\1) 13 таком виде (см. (16)):

0Ф2(l) = {s(l) = [вьва.взЛ £ Rn+2i ц е [—А,А]}.

Здесь

si = £ Т (aiJi) ~ X г (МО 's'2 = Y1 г ~ r > s3ß = S + ßl,

ie¡+ j€J i- jeJi+ keK-

S = r (aith) ai - £ r(bj,li)bj+ £ r hJ ~ r{ckM)ck.

г€/+ j€J i- j£Ji+ keK_

Элемент множества дФ2 ( 0 ■ ближайший к началу координат, будет иметь вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

S(l) = [si,s2,s],

где 5 = 5- (5,0 (см- [3]).

Рассмотрим следующий алгоритм:

Io. Пусть Iq = произвольный вектор множества Q.

2°. Пусть уже построена последовательность векторов {lo, h, ■ ■ ■ ,h}- Если начало координат принадлежит субдифференциалу функции Ф2(í) в точке l¡t = [d\k,d.2k,lk]^ т.е. {0,j+2} 6 0Ф2(/*•)> т0 точка lk является стационарной, и процесс прекращается. Если это условие не выполнено, то осуществляется переход к следующему шагу.

3°. Построим вектор gk = — S[lk) = [e\k,e2k,9k]> гДе S[lk) ~ элемент множества ближайший к началу координат. Пусть а > 0. Рассмотрим вектор Iко

du- +ас\к d2k + ае2к h + <*9к Wh + agkW \}lk + agkW'\\1к + адк\\

Точка Ika является проекцией точки + адк на множество Г!.

Найдем такое значение параметра а, при котором функция Ф2 [1ка) достигает своего минимального значения:

штФ 2 {ka) = Ф-2 ( 1как ) •

а> О

Положим 1к+1 = hak- Перейдем к шагу 2°.

h-n =

1

к + ад kW

-jílk +адк) =

Заметим, что при любых а вектор 1ка ■ а следовательно, и вектор lk+i принадлежат множеству Г2 по построению, т. е. описанный метод является методом проекции градиента.

В результате выполнения вышеприведенного алгоритма будет построена последовательность {Ik}- При этом F2[lk+1) < F2(lk ) для Vfc. Если такая последовательность конечна, то последняя полученная точка по построению является стационарной. В противном случае справедлива следующая теорема.

Теорема. Всякая предельная точка последовательности является стационарной точкой функции Ф2(1) в пространстве Rn+2.

Доказательство. Существование предельной точки последовательности

{1к} вытекает из ограниченности множества G( 10 ) deJ {/ € R»+2|F2([) ^ F2(Г0)}, сходимость последовательности к стационарной точке - из сходимости метода проекции градиента (см. [4]).

Автор благодарит рецензента за полезные замечания. Summary

Zubova О. A. The identification of several sets in the multidimensional space.

In order to evaluate the precision of a decision rule two surrogate functionals are suggested and considered. Necessary conditions for optimality in the sense of these two functionals are deduced. Reasoning from the mentioned conditions the algorithm for constructing an optimal decision rule is built. The theorem of algorithm convergence is proved.

Литература

1. Демьянов В. Ф. Условия экстремума и вариационное исчисление. М.: Высшая школа, 2005. 335 с.

2. Демьянов В. Ф., Васильев Л. В. Недифференцируемая оптимизация. М.: Наука, 1981. 384 с.

3. Зубова О. А. Применение квазидифференциального исчисления к решению задач идентификации. СПб.: Изд-во НИИ химии С.-Петерб. ун-та, 2005. 18 с.

4. Карманов В. Г. Математическое программирование. М.: Наука, 1980. 256 с.

Статья рекомендована к печати членом редколлегии проф. В. Ф. Демьяновым. Статья принята к печати 24 мая 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.