Научная статья на тему 'Вычислительная сложность задач комитетной полиэдральной отделимости в пространствах фиксированной размерности'

Вычислительная сложность задач комитетной полиэдральной отделимости в пространствах фиксированной размерности Текст научной статьи по специальности «Математика»

CC BY
24
6
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Хачай М.Ю., Поберий М.И.

В работе показано, что задача о минимальном аффинном разделяющем комитете (MASC), тесно связанная с процедурой обучения распознаванию в классе полиэдральных решающих правил, остается труднорешаемой, даже будучи сформулированной в пространстве произвольной фиксированной размерности n > 1, причем труднорешаемость задачи не обусловлена вырожденностью разделяемых множеств.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper presents new results on computational complexity of the known Minimum Affine Separating Committee (MASC) combinatorial optimization problem that is closely connected with the problem of optimal learning for perceptrons. It is proved that the MASC problem remains intractable being formulated in Qn within arbitrary n > 1. Actually, it is proven that the MASC problem is intractable even if the sets A and B used in its setting being in a general position.

Текст научной работы на тему «Вычислительная сложность задач комитетной полиэдральной отделимости в пространствах фиксированной размерности»

УДК 519.8

ВЫЧИСЛИТЕЛЬНАЯ СЛОЖНОСТЬ ЗАДАЧ КОМИТЕТНОЙ ПОЛИЭДРАЛЬНОЙ ОТДЕЛИМОСТИ В ПРОСТРАНСТВАХ ФИКСИРОВАННОЙ РАЗМЕРНОСТИ © Хачай М.Ю., Поберий М.И.

Институт математики и механики УрО РАН ул. С. Ковалевской, 16, г. Екатеринбург, 620219, Россия е-ма1ь: mkhachay@imm.uran.ru

Abstract. The paper presents new results on computational complexity of the known Minimum Affine Separating Committee (MASC) combinatorial optimization problem that is closely connected with the problem of optimal learning for perceptrons. It is proved that the MASC problem remains intractable being formulated in Q" within arbitrary n > 1. Actually, it is proven that the MASC problem is intractable even if the sets A and В used in its setting being in a general position.

Введение

Комбинаторная задача о минимальном аффинном разделяющем комитете (MASC) возникает при оптимальном обучении распознаванию образов в классе комптетных кусочно-линейных решающих правил. К сожалению, в общем случае задача является труднорешаемой. До последнего времени открытым оставался вопрос о вычислительной сложности задачи при дополнительных ограничениях, например, при фиксированной размерности пространства. В настоящей работе показывается, что задача MASC остается NP-трудной и при этом дополнительном условии, причем ее труднорешаемость не обусловлена вырожденностью обучающих множеств.

1. Задача о минимальном аффинном разделяющем комитете

Конечная последовательность функций Q = (fi, ■ ■ ■, fq), fi( X ^ — щ сс dj, называется аффинным комитетом, разделяющим множества А, В С К", если выполнено условие

\{геЩ: fi(a) > 0}| > | (а е А), |{*GN, : fi(b) < 0}| > | (be В).

При этом q называется числом элементов (членов) комитета Q.

Как известно [1], множества А и В отделимы аффинным комитетом тогда и только тогда, когда А П В = 0. Тем не менее, по ряду причин особый интерес представляют разделяющие комитеты с наименьшим (для заданных множеств) числом элементов, называемые минимальными.

Задача «Минимальный аффинный разделяющий комитет» (MASC). Заданы множества А, В С Q", А = {oi,...,omi} и В = ..., Ьт,2}. Требуется указать аффинный комитет с наименьшим числом элементов, разделяющий множества А и В.

Теорема 1 ([2, 3]). Задача MASC - NP-трудна и остается труднорешаемой при условии A U В С {х е {0,1, 2}п : ЦжЦг < 2} .

Традиционный подход к исследованию /V/-трудных задач комбинаторной оптимизации предполагает, в частности, разработку полиномиальных приближенных алгоритмов решения задачи MASC. В работе [3] описан приближенный алгоритм решения данной задачи, обладающий точностью О , Известно также несколько «отрицательных» результатов, касающихся аппроксимируемости задачи.

Теорема 2 ([3]). Задача MASC не принадлежит классу Арх при условии Р ф NP.

Теорема 3 ([4]). Условие NP <ф_ DTIME(2poly(logn^) влечет существование константы D > О 'такой, что точность произвольного полиномиального приближенного алгоритма задачи MASC оценивается снизу D log log log m.

В данной работе исследуется вычислительная сложность задачи MASC при важном дополнительном ограничении, получаемом фиксацией размерности пространства.

2, Труднорешаемость задачи MASC на плоскости

Известно, что многие /V/-трудные в общем случае задачи комбинаторной оптимизации становятся полиномиально (или псевдополиномиально) разрешимыми при дополнительных ограничениях: при фиксации размерности пространства, числа ограничений и,т.п. Например, общая задача целочисленного линейного программирования, сформулированная в пространстве фиксированной размерности - полиномиально разрешима.

Известно также [см., напр., [5]], что задача MASC, заданная в одномерном пространстве также может быть решена за полиномиальное время. До настоящего времени открытым оставался вопрос о вычислительной сложности данной задачи в пространствах большей размерности, В данном разделе показывается, что задача MASC становится NP-трудной, будучи сформулированной в пространстве Q" при произвольном фиксированном п > 1. Для обоснования этого факта, очевидно, достаточно показать труднорешаемость задачи на плоскости.

Задача о комитетной отделимости конечных множеств на плоскости (PASC). Заданы множества А, В С Q2, А = {щ,..., omi} и В = {Ь\,..., bni2}, и число i е N. Существует ли аффинный комитет (.). разделяющий множества А и В и состоящий из не более чем t элементов?

Нетрудно убедиться в том, что задача PASC принадлежит классу NP. Цель данного раздела состоит в обосновании полиномиальной сводимости к ней известной /V/-по. шин задачи о покрытии конечного множества точек плоскости множеством прямых (PC) и, как следствие, принадлежности задачи PASC классу NP-полных задач,

Множество прямых Ь = ... ,18}, Ц = {х е К2 : с^х = с^-}, где с^- ф 0, называется покрытием множества Р = {р\,... ,Рк} С К2, если для каждой точки р Е Р найдется прямая I = 1(р) е I такая, что рЕ\.

Задача о покрытии прямыми конечного множества на плоскости (РС). Заданы множество Р = {р\ -, ■ ■ ■ -,Рк} С й2 и число в Е N. Существует ли покрытие Ь множества Р, не превосходящее по мощности в ?

Теорема 4 ([6]). Задача РС ЫР-полна в сильном смысле.

Договоримся использовать следующие обозначения:

для круга радиуса е с центром в хо~, aff(P) - для аффинной оболочки множества Р и dim - размерности аффинного (линейного) многообразия. Для дальнейших построений нам потребуется следующее утверждение, приводимое, ввиду его важности для дальнейших построений, с доказательством.

Лемма 1 ([6]). Пусть заданы, множество Р = {pi,... С Z2, числа

и непустое подмножество .1 С Для существования прямой I = /(/) 'такой, что

необходимо и достаточно выполнения условия dimaff({pj : j Е ,J}) < 1.

Доказательство. Справедливость утверждения леммы при \,J\ < 2 очевидна, поэтому далее при доказательстве полагаем, что \,J\ > 3. Достаточность может быть доказана непосредственной проверкой. Остановимся на доказательстве необходимости. Пусть I - произвольная прямая, удовлетворяющая условию (2.1) для некоторого подмножества J. Предположим, от противного, что точки pj, j Е J не лежат на одной прямой. Тогда найдутся числа ./1 ../_<. ./V, Е J (без ограничения общности, полагаем j 1 1. /'•_, 2 и j3 = 3) такие, что dim afF({pi,Рг,Рз}) = 2. По условию, для подходящих векторов Wj = выполняются соотношения

В(хо, е) = {х Е R2 : \\х — яо|| < е}

В{Р]1е)Г)1ф0 (jEJ)

(2.1)

Pj + Wj Е B(pj, е) П I (j 6 {1, 2, 3}). Введя обозначение pj = [xj, yj}T, имеем, по выбору Wj,

1 1 1

A = x\ Х2 + Ь ^3 + 6 = 0.

vi + m y2 + m уз + m

С другой стороны, |A| > |A0| — 12 ре — бе2, где

1 1 1

Ао = хг х2 х3 > 1 Vi У2 Уз

в силу целочислеппости и предположения о неколлинеарности точек Р\,Р2 и от-

| Д | > 1 - 12ре - бе2 > 1 - 6(2р + 1)е > О,

по выбору е. Найденное противоречие завершает доказательство необходимости условия и леммы в целом, □

Пусть далее условие частной задачи PC задается множеством Р = {р\,... .pk} С Z2 и числом s е N. Определим числа р и е по формулам

1

р = шах{||р||2 : р £ Р}, e=6(2^Tl)Tl'

Зафиксируем вектор а, 11ст112 = 1, так, чтобы для любого {'Lj} £ N^ отрезки [pi — ea.pi + еа] и [p.j — ea.p.j + еа] не лежали па одной прямой. Сопоставим исходной задаче PC частную задачу PASC с условием: А = Р. В = (Р — еа) U (Р + ест) и f = 2s + 1 (см. Рис, 1),

о • о

ошю

о»о

О 00

Рис. 1, К схеме сведения задачи PC к задаче PASC

Легко убедиться в том, что описанные выше действия могут быть произведены за время, ограниченное сверху полипомом от длины записи условия задачи PC, Для завершения обоснования полиномиальной сводимости достаточно показать, что задача PC и поставленная ей в соответствие задача PASC имеют положительные или отрицательные ответы одновременно. Другими словами, что множество Р обладает покрытием из не более чем s прямых тогда и только тогда, когда соответствующие ему множества А и В отделимы аффинным комитетом, число элементов которого не превосходит 2s + 1.

Теорема 5. Множество Р = {р\, ■ ■ ■ ,Рк} С Z2 обладает покрытием из s прямых прямых тогда и только тогда, когда множества А = Р и В = (Р — еа) U (Р + еа) отделимы аффинным комитетом из 2s + 1 элемента.

Доказательство.

1, Пусть L = {1\..... ls} - покрытие множества Р. Каждой прямой

lj = {:r е R2 : г] .г = dj}

сопоставим подмножества A(j) = P(j) = Pnlj и B(j) = (P(j) —еа) U (P(j) +£<т). Без ограничения общности можно полагать, что A(j) ф 0, и для каждой точки а е A(j)

справедливо неравенство

{с] (а — с а) — (/, ) (с] (а + ест) — (/, ) < 0. Зафиксируем число 0 < <5, < е и зададим функции /2-М и /2у формулами

/2.7-1 (-с) = г] .г - <!, + <\г /л(.г) = г] .г + <\, + Л,-

так, чтобы выполнялись неравенства

/2.7-1 (« - ео") • /2.7 (« - ео") < О,

/2.7-1 (« + £0") • /2.7 (« + £0") < О,

(а ( .!(./)).

(2.3)

(2.4)

(2.5)

В силу справедливости неравенства (2.3), такое построение возможно. Очевидно, что наряду с неравенствами (2.5), по выбору е, также будут выполнены неравенства

/2.7-1 («) > 0, /2у(а) > 0, (а е .И/)).

/2.7-1 (.г) • /2.7-(.г) < о, (.Г е л и в \ (Ли) и Ни)).

По построению, последовательность функций (/1,..., /2.,) обладает свойством

|{/г : /к(а) > 0} > 5 + 1, (аеЛ), |{к: Д.(6)<0} = 5, (ЬеВ)

Дополнив ее произвольной аффинной функцией /0, удовлетворяющей условиям

/о(;г) < 0, (.г ( .1,.)/Л. (2.6)

непротиворечивым ввиду конечности множества Л и В, получим искомый комитет

Я = (/о- /1 - • • • - /2.5+1), разделяющий множества Л и В (см. Рис. 2).

Рмс. 2. Построение разделяющего комитета но заданному покрытию

2. Множество Р. очевидно, обладает покрытием, состоящим из не более чем [|] прямых. Обозначим через я мощность его минимального (по числу элементов) покрытия. Покажем, что сопоставленные множеству Р согласно описанной выттте схеме множества Л и В не могут быть отделимы аффинным комитетом с числом элементов д < 2,§ + 1.

Пусть Q = (fi,..., fq), fi(x) = cf(x) — di, - произвольный комитет аффинных функций, разделяющий множества А и В. По определению комитета, для каждой точки <i (г Л найдутся подходящие номера ц = ¿1(0) и i-, М") такие, что

/г1(о)> 0, (о + ест) < 0, (2.7)

/г2(о) >0, fi2(a-ea) <0. (2.8)

Введем следующие обозначения: для а Е А через Д(а) обозначим множество всех номеров ii, удовлетворяющих условию (2.7), аналогично, обозначим через /2(0) обозначим множество номеров г2, удовлетворяющих условию (2.8). Далее, определим множества Д и /•_» равенствами

h = \Jh(a), I2 = U^(a).

чЕА ЧЕА

11о- [оказанному. I\. /•_. / 0. п. и силу (2.7)-(2.8), справедливы неравенства

cja < 0 (г G Д), cja > 0 (iE Д),

следовательно, Д П Д = 0.

Для произвольного номера г G Д введем обозначение А'(г) = {а 6 А : г G Д(о)}-По построению, для каждого о G ^А'(г) прямая fi(x) = 0 пересечет отрезок [а, а + ест]. Следовательно, в силу утверждения 1, и по выбору е, dim aff[А'(г)) = 1. Поскольку IJ А'(г) . 1 Р. то |Д| > s, по выбору s. Аналогично обосновывается неравен-ieh

ство |Д| > s. Таким образом,

q> 1Д1 + 1Д1 >2s. (2.9)

Нетрудно убедиться в справедливости более сильного неравенства q > 2s + 1. В самом деле, в противном случае комитет Q из 2s элементов путем исключения произвольного элемента может быть преобразован в аффинный комитет, разделяющий множества А и В и состоящий из 2s — 1 члена (см., напр. [5]), что противоречит (2.9). Теорема доказана. □

Следствие 1. Задача PASC NP-полна в сильном смысле. Задача ASC11, сформулированная в пространстве фиксированной размерности п > 1 - также NP-полна в сильном смысле.

Следствие 2. Задача MASC, сформулированная в Q" при произвольном фиксированном п > 1, - NP-трудна.

3. Комитетная отделимость множеств, находящихся в общем

положении

При доказательстве труднорешаемости задачи о комитетной отделимости конечных множеств на плоскости (PASC) существенно использовалась вырожденность разделяемых множеств. Аналогичный результат может быть получен и при дополнительном условии общности положения разделяемых множеств.

1 Задача об аффинном разделяющем комитете в форме задачи распознавания свойства

Будем говорить, что множество D С К", \D\ > п, находится в общем положении, если для каждого подмножества ГУ С Г) мощности n + 1 справедливо соотношение dimaff(D') = п.

В частности, конечное подмножество плоскости находится в общем положении, если никакие три его точки не лежат па одной прямой. Договоримся подзадачу задачи PASC, условие которой задается множествами Л и В так, что множество AuB находится в общем положении, называть задачей PASC-GP.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть далее условие задачи PC, по аналогии с предыдущим разделом, задано к-элемепттшм множеством Р целочисленных точек и натуральным числом s, а числа р и е определены по формуле (2.2). Зафиксируем векторы ст и т так, чтобы ЦстЦа = 1, 117"112 = 1, ст X т и для любых {г, j} С Nfc отрезки [pi — £o,Pi + ест] и \p.j — ea,pj + ест], \pi — £T,pi + er] и \p.j — £T.p.j + er] не лежали на одной прямой. Задаче PC поставим в соответствие частную задачу PASC-GP с условием А = {р ± -j^r : р Е Р}, В = {р± е(р)<т : р Е Р} и t = 2s + 1 (см. Рис. 3).

Рис. 3. Схема сведения задачи PC к задаче PASC-GP

Числа е(р) Е (0,е) и М > 0 выберем так, чтобы выполнялось условие

£(Р) ■ / \ max—— < mine р . pei> М pa'

и множество A U В находилось в общем положении.

Как и ранее, переход от задачи PC к задаче PASC-GP может быть осуществлен за полиномиальное время. Схема обоснования полиномиальной сводимости задачи PC к сопоставленной ей задаче PASC-GP в целом аналогична схеме доказательства теоремы 5.

Теорема 6. Множество Р = {р\.... ,рк} С Z2 обладает покрытием из s прямых в том и только в том случае, когда соответствующие ему множества А = {р ± : р Е Р} и В = {р ± £.(р) а : р Е Р} отделимы, аффинным, комитетом из 2s + 1 элемента.

Доказательство.

1. Рассмотрим произвольное покрытие прямыми L множества Р. Каждой прямой lj Е L сопоставим подмножество P(j) = Pillj и подмножества A(j) С А и B(j) С В, индуцируемые P(j). Для каждой точки р Е P(j) соответствующие ей элементы

р — е(р)а и р + е(р)а множества B(j) удовлетворяют неравенству, аналогичному неравенству (2.3), т.е. лежат по разные стороны от прямой lj. Выберем число S,j из условия

Ф) г ■ / \ max—— < о,- < mine и pei> М pa'

так, чтобы функции и определяемые по формулам (2.4), удовлетворяли

неравенствам

hj-1 (р ~ Ф)<г) ■ Ь](Р ~ е(р)о-) < О, hj-1 (Р + Ф)<г) ■ hj(р + е(р)а) < О, fv-Ф ~ • f-ф - > О,

м ф)

М

Ф),

(р е pU))-

hi-dP + ^r)-h:i(p+^r)> 0. По выбору е, для всех точек х Е (A U В) \ (A(j) U B(j)) выполняется

hj lUI-hjU) < 0.

(3.1)

Полученная последовательность функций (/],.... /2.,), дополненная произвольной аффинной функцией /о, удовлетворяющей условию (2.6), образует искомый комитет, разделяющий множества А и В и состоящий из 2s + 1 элемента (см. Рис. 4).

Рис. 4. Построение разделяющего комитета ио заданному покрытию

2. Пусть С) = (/],..- комитет аффинных функций, разделяющий множества А и В. По определению комитета, для каждой точки р Е Р и каждой пары точек (1,2), (2,3), (3,4) и (4,1) (см. Рис. 5) найдется подходящий член комитета, правильно классифицирующий эту пару.

Пусть /(:с) = с1 х — (.1 - член комитета, верно классифицирующий точки р — е(р)а и р + -д^т для некоторого р Е Р, т.е. такой, что

г/ £(Р) ч г £(Р) г

/(р+ мт) = Ср+мс т^(1>

/{р — с(р)а) = с1 р — е{р)с1 а — й < 0,

откуда

с2\а + ^т) > 0. (3.2)

Убедимся в том, что для произвольного р' е Р функция / не может правильно классифицировать точки р' + е(р!)а и р' — ^¡гт. В самом деле, справедливость неравенств

г/ / £(Р') \ Т / £(Р') Т 1 «

/(У - =

Др' + ф» = стр' + е(р')ст(7 ^ II < О,

влечет

^■(<7 + ^X0,

что противоречит (3.2).

м

1: ^

О • О

5 РИ1

4: Р-ТТ^Р^ м

Рис.. 5. Нумерация точек

Для каждой точки р е Р через 1\ (р) обозначим множество индексов прямых, правильно классифицирующих пару (1,2), а через hip) - индексов прямых, верно классифицирующих пару (3,4). Далее, полагаем

h = \Jll(p), 1-2 = U Ш-

По-доказаппому, множества и 12 не пусты и f]h = 0- Для произвольного i е рассмотрим множество Р'{ъ) = {р £ Р : i £ ^i(p)}- Очевидно, IJie/l Р'('0 = Р По построению, прямая /¿(;с) = 0 пересекает окрестность В(р.е) каждой точки р е Р'(г). Откуда, в силу утверждения 1 и выбора е, имеем dim aff(P'(«')) < 1. Тем самым, множество Р обладает покрытием, состоящим из 11\ | прямых, следовательно, \I\ | > s, по выбору s.

Аналогично доказывается, что |/2| > s. Таким образом,

q> \h\ + \h\ >2s. (3.3)

Проведя рассуждение, завершающее доказательство теоремы 5, получим искомое неравенство q > 2s + 1. Теорема доказана. □

Заключение

Как следует из результатов данной работы, задача о минимальном аффинном разделяющем комитете является труднорешаемой не только в общем случае, но и в пространствах произвольной фиксированной размерности, большей единицы. При этом, как следует из последнего раздела, причина труднорешаемости не связана с вырожденностью разделяемых множеств.

список литературы

1. Мазуров Вл.Д. Комитеты систем неравенств и задача распознавания // Кибернетика. 1971. №3. С. 140-146.

2. Хачай М. Ю. О вычислительной сложности задачи о минимальном комитете и смежных задач // ДАН, 2006, 406, №6, С. 742-745.

3. Хачай М. Ю. О вычислительной и аппроксимационной сложности задачи о минимальном аффинном разделяющем комитете // Таврический вестник информатики и математики. 2006, №1, С. 34-43.

4. Хачай М. Ю. Вычислительная сложность комбинаторных задач, связанных с комитетной отделимостью конечных множеств // Компьютерная оптика. 2007, т. 31, №3, С. 63-69.

5. Mazurov VI. D., Khachai M.Yu., Rybin A.I. Committee Constructions for Solving Problems of Selection, Diagnostics and Prediction // Proceedings of the Steklov Institute of mathematics. Suppl. 1, (2002), S67-S101.

6. Megiddo N., Tamir A. On the complexity of locating linear facilities in the plane // Operations research letters. 1982, vol. 1, no. 5, p. 194-197.

Статья поступила в редакцию 19.04-2008

i Надоели баннеры? Вы всегда можете отключить рекламу.