Серия «Математика»
Том 1 (2007), № 1, С. 149-160
Онлайн-доступ к журналу: http://isu.ru/izvestia
Ш
УДК 519.6
Две квадратичные задачи для построения оценок
«.» >к
и поиска максимальной клики *
А. А. Кузнецова ([email protected])
ИДСТУ СО РАН, Иркутск
Аннотация. Рассматривается задача поиска максимальной клики и ее сведение к двум непрерывным задачам. На основе непрерывного представления удается получить верхние оценки для размерности максимальной клики. Показано, в каких пределах должен варьироваться параметр, чтобы по решению непрерывной задачи можно было найти максимальную клику.
Ключевые слова: задача о максимальной клике, верхние оценки.
Как известно, многие задачи целочисленного программирования могут быть сведены к непрерывным [7], причем эти эквивалентные формулировки дают возможность не только разрабатывать новые методы решения, но и обнаружить некоторые свойства этих сложных задач. В данной работе приводится исследование задачи поиска максимальной клики в простом неориентированном графе. Импульсом для проведения подобной работы послужил результат И. Бомзе [3] по регуляризации непрерывной постановки Моцкина-Штрауса [6] в виде задачи максимизации матрицы смежности графа на каноническом симплексе.
Оказалось, что задача максимизации регуляризованной матрицы смежности на каноническом симплексе эквивалентна задаче минимизации регуляризованной матрицы смежности дополнительного графа на этом же множестве. Таким образом, все основные результаты будут приведены для двух задач, в то время как доказательство — для одной из них.
Введение
* Работа выполнена при финансовой поддержке гранта РФФИ, проект № 05-0100110.
Статья построена следующим образом. Вп.1 приводится дискретная постановка задачи, далее, в п.2 рассматриваются две квадратичные задачи, зависящие от параметра, и доказывается их эквивалентность. В п.3 показана взаимосвязь между глобальными решениями задач и размерностью максимальной клики в графе. В следующем разделе установлено в каких пределах должен изменяться параметр, чтобы по решению задач можно было находить максимальную клику. В заключении статьи рассмотрен численный эксперимент по нахождению верхних оценок.
1. Постановка задачи
Пусть дан неориентированный граф О = С(У,Е), где V = {1,...,п} — множество вершин, Е — множество ребер. Предположим, что граф является простым, т.е. не содержит петель и кратных ребер. Граф (О = О(V, Е) называется дополнительным, если его множество вершин совпадает с V, а множество ребер дополняет исходный до полного, т.е.
Е = Ш) | г = (г,]) /Е}.
Подмножество вершин С множества V называется кликой, если каждая пара вершин из С является смежной, т.е. соединена ребром в О. Если подмножество вершин С образует клику в графе О, то оно также будет являться, так называемым, устойчивым множеством в дополнительном графе О, т.е. множеством, в котором каждая пара вершин является несмежной.
Клика называется локально максимальной или максимальной по включению (тупиковой), если она не содержится в клике большей мощности. Ставится задача о нахождении клики с максимально возможным количеством вершин (ЗМК). Эта задача эквивалентна задаче определения максимального устойчивого множества в дополнительном графе О. Будем в дальнейшем обозначать произвольную локально максимальную клику (ЛМК) через С, а ее мощность через К, соответственно для максимальной клики применять обозначения С* и К*. Введем для произвольной клики С мощности К характеристический вектор г (С):
г(С) = ег, где ег обозначает стандартный базисный вектор в про-
вес
странстве Кп. Таким образом, гг(С) = 0, если г / С, и гг(С) > 0, если г / С.
Известно, что каждому графу можно поставить в соответствие квадратную матрицу смежности А = [ац] размерности п, в которой ац = 1, если (г, ]) / Е, и ац =0 в противном случае. Согласно сделанным предположениям матрица А будет симметричной с нулевыми диагональными элементами. Кроме того, нетрудно видеть, что для непустого графа О матрица смежности А не будет знакоопределенной.
Аналогично можно построить матрицу смежности A = \ац] для дополнительного графа О, которая будет обладать теми же свойствами, что и матрица А. При этом,
А + А = еет — 1п, (1.1)
где е = (1,..., 1)т — вектор размерности п, а 1п — единичная матрица размерности п.
Заметим, что подмножество вершин С будет кликой в том и только в том случае, если у подматрицы матрицы смежности А, составленной из строк и столбцов, соответствующих множеству С, нули будут только
на главной диагонали. При этом, {г(С), Аг(С)) = 1 — —, где К = 1С|. С
К
другой стороны, пересечение строк и столбцов матрицы А, соответствующих множеству С, образует нулевую матрицу тогда и только тогда, когда это множество является кликой, причем {г(С), Аг(С)) = 0.
2. Две квадратичные задачи оптимизации, порожденные исходным и дополнительным графами
Рассмотрим две квадратичные матрицы, зависящие от числовых параметров:
Ha = A + aIn, Ty = A + Yin-
Матрицы Ha и Tj при достаточно малых отрицательных значениях параметров являются отрицательно определенными, а при достаточно больших положительных — положительно определенными. При этом, со значениями a и y, лежащих в интервале (—1,1), матрицы не являются знакоопределенными.
Данные матрицы при a = 0, a = —1, a = 0-5 и y = 0, Y = 1 неоднократно использовались для постановки ЗМК, как задачи с целочисленными переменными, так и в непрерывных пространствах [4]. В этой работе будут рассматриваться следующие две квадратичные задачи:
Fa(x) = (x, Hax) Т max, x € S, (Pa)
Fj(x) = (x,TYx) l min, x € S, (DY)
где S = {x = (xi,...,xn)T I En=i xi = 1, xi > 0, г = 1,--,n} — канонический симплекс.
Далее будет установлена эквивалентность задач (Ра) и (Dj) и представлены свойства их локальных и глобальных решений.
Положим V(Pa) = max(Fa,S), V(Dj) = min(Fj,S) — значения задач, Sol(Pa) = Argmax(Fa,S), Sol(DY) = Argmin(FY, S) — множества решений задач.
Предложение 1. Пусть а + 7 = 1. Тогда значения .задач связаны тем же равенством, V(Ра) + V(О^) = 1, и множества решений задач совпадают, Бо1(Ра) = Бо1(О7).
Доказательство. Заметим, что задачи (Ра) и (О7) имеют решения при любых значениях параметров а и 7.
Пусть имеет место соотношение а + 7 = 1. Тогда для любого допу-
п
стимого х с учетом равенства (х,ввТх) = (^ хг)2 = 1 и (1-1) имеем
г=1
Ра(х) = (х, Нах) = (х, Ах) + а(х, х) = (х, еетх) — (х, х) — (х, Ах)+
+а(х, х) = 1 — (х, Лх) — ^(х, х) = 1 — (х, Т1 х) = 1 — (х).
Таким образом, если V(Ра) — максимальное значение функции Ра(-) на множестве 5, то 1 — V(Ра) будет минимальным значением функции (■) на этом же множестве, и наоборот. При этом множества решений задач совпадут. □
Замечание 1. Заметим, что матрица смежности исходного графа будет содержать значительно больше нулей, чем матрица смежности дополнительного графа, если граф разряженный, т.е. когда отношение количества ребер к максимально возможному для данной размерности близко к нулю. И наоборот, в случае плотного графа, для которого количество ребер близко к СП матрица смежности дополнительного графа будет разряженной. Поэтому с вычислительной точки зрения, предпочтительней использовать матрицу смежности исходного графа, если этот граф разряженный, и матрицу смежности дополнительного графа, если он плотный.
3. Свойства решения непрерывных задач в зависимости от
выбора параметра.
Изучим некоторые свойства глобальных решений и стационарных точек в задачах (Ра) и (О7) в зависимости от выбора параметров, а также соотношения между оптимальными значениями целевых функций и максимальными кликами в графе С. Для этого введем понятия носителя для точки х € Бпрр(х) = {г € V | х1 > 0}. Заметим, что Бирр(х) = 0 для любой допустимой точки задачи (Ра) или (О7).
Покажем, что при а < 1 в задаче (Ра) или ^ > 0 в задаче (О7) характеристические векторы клик, не являющихся максимальными, не могут быть глобальными решения соответствующих задач. Доказательство проведем для задачи (^7).
Предложение 2. Пусть y > 0 в .задаче (Dy). Тогда для любого z € Sol(Dj) выполнено неравенство \Supp(z)\ > K*, где K* — размерность максимальной клики.
Доказательство. Предположим противное. Пусть y > 0, но найдется такая точка z € Sol(DY/), что m := \Supp(z)\ < K*. Можно показать, что {x,x) > m-1 для любого x € S, \Supp(x)\ = m. Поскольку элементы матрицы A и вектора z неотрицательны, имеем
Fy(z) = Tz, z) = {Alz, z) + y{z, z) >
p
С другой стороны, для характеристического вектора z* := z(C*) максимальной клики C* размерности K* имеем:
Fy(z*) = {Tyz*, z*) = {Alz*, z*) + y{z*, z*) = Y <Y = Fy(z).
K* p
Получили противоречие c тем, что z — решение задачи.
□
Предложение 3. Пусть а < 1 в .задаче (Ра). Тогда для любого г € Бо1(Ра) выполнено неравенство \Бпрр(г)\ > К*.
Интересно узнать, когда неравенства в предложениях 2 и 3 выполняются, как равенства. Для этого необходимо привести ряд теорем. Приведенные ниже результаты показывают взаимосвязь между значениями задачи и размерностью максимальных клик.
Теорема 1 ([6]). Если V(Ра) = шах(^а,5) — .значение .задачи (Ра) при а = 0, то К* = --—-, причем среди решений задачи есть
1 V (Ра )
характеристические векторы г (С*) максимальных клик С*.
Данная теорема была доказана по индукции. Представим этот результат для задачи (О7) и докажем его более простым способом.
Теорема 2. Если V(О7) = шш(Ку,5) — значение задачи (О^) при
Y =1, то К* = ), причем среди решений задачи есть характери-
V (°7)
стические векторы г (С*) максимальных клик С*.
Доказательство. Если точка г является глобальным решением задачи (О7), то для нее согласно условиям Каруша-Куна-Таккера выполнена следующая система:
(Т1 г)г = если г^ > 0; (Т1 г)г > если г^ = 0, (3.1)
где ц — некоторое число. Учитывая, что г € Б, имеем
Е1 (г) = (г, Тг) = ^ (Т1 г)г = ц ^ г = ц.
ряет системе (3.1) с ц = Е^ (г (С*)) = —. Заметим, что для любой точки
Пусть С* — некоторая максимальная клика размерности К*, г(С*) — ее характеристический вектор. Нетрудно видеть, что г(С*) удовлетво-
1
К*
х € Б такой, что Бирр(х) — клика, Е1 (х) > Е1 (г(С*)). Пусть существует решение задачи г такое, что Бирр(г) — не клика, и Е^(г) < Е^(г(С*)). Тогда существуют две вершины к и р из Бирр(г) такие, что (к,р) € Е или акр = 1. Рассмотрим точку
г1 = г + хрвк — хрер, (3.2)
которая является допустимой в задаче и содержит на одну положительную компоненту меньше, чем г. При этом, поскольку г удовлетворяет системе (3.1), то
-Е^ (г ) — (г , Т у г ) — (г I хре хре , Т у г I хре хре ) —
= (г, Т1 г) + 2хр((Т1 г)к — (Т1 г)р) + хр(-т — 2акр + 7) = Е1 (г).
Следовательно г1 также является решением задачи (О7) и для нее выполнена система (3.1). Если Бирр(г1) не является кликой, то можно построить точку г2, являющуюся решением и содержащую на одну положительную компоненту меньше, чем г1. Поскольку допустимая точка содержит хотя бы одну положительную компоненту, построение можно продолжать до тех пор, пока не получим точку гя такую, что Бирр(гя) — клика, и Е^(г5) = Е^(г). Таким образом, гя является решением, и Е^(г) = Е^(гя) > Е(г(С*)). Получили противоречие. Следовательно,
V(О1) = Е1 (г(С*)) = —. Отсюда получаем утверждение теоремы.
К*
□
Замечание 2. Из доказательства теоремы 2 вытекает способ построения характеристического вектора г(С*), если получено решение г задачи (О7) при 7 = 1 такое, что Бирр(г) — не клика.
Замечание 3. Из теорем 2 и 1 вытекает что, при 7 = 1 в задаче (О7) или при а = 0 в задаче (Ра) существуют такие решения, что неравенства в предложениях 2 и 3 выполнены как равенства.
Следствие 1. В задаче (Ра) при а = 0 ив задаче (О^) при 7 = 1 существует решение, отличное от г(С*) тогда и только тогда, когда существуют две максимальные клики, отличающиеся только одной вершиной.
Доказательство. Докажем данное утверждение для задачи (О7) при Y = 1.
Пусть существует решение г такое, что Бпрр(г) — не клика. Тогда применяя последовательно формулу (3.2) получим точку гя такую, что Е^(г5) = Е^(г) = V(О7). При этом Бирр(гя) — не клика, но существуют две вершины к и р, такие что (к,р) / Е, а множества Бирр(гя) \ {к} и Бирр(гя) \ {р} — клики. Тогда точки гк = г + хрек — хрер и гр = г + Хкер — Хкек являются решениями задачи и следовательно, характеристическими векторами максимальных клик.
Пусть теперь в графе С(У, Е) существуют две максимальные клики С1 и С2 размерности К* такие, что СI \ {к} = С1 \ {р}. Построим точку
г(5) € Б такую, что гк = 5, где 0 < 5 < —, гр = —--5, г1 = —-,
К* К* К*
г € С1, г = к, г1 = 0 в противном случае. Тогда можно проверить, что
для точки г(5) выполнена система (3.1) о / = -—, т.е. г(5) — решение
К*
задачи (О7) при Y = 1. П
И. Бомзе [3] впервые показал, что в задаче (Ра) при а = 0.5 существует взаимно-однозначное соответствие между локальными решениями задачи и локально максимальными кликами [3], и следовательно между глобальными решениями и максимальными кликами. Это утверждение не измениться, если выбирать а из интервала ]0,1[.
Теорема 3 ([3]). Пусть дан граф С(У,Е) и ему в соответствие поставлена задача (Ра). Тогда при 0 < а < 1 следующие утверждения эквивалентны:
г) С — локально максимальная клика размерности К, г = г(С) — ее характеристический вектор;
И) г — строгий локальный максимум в задаче (Ра); т) г — локальный максимум в задаче (Ра).
Следствие 2. С* — максимальная клика в графе С(У,Е) тогда и только тогда, когда г (С*) — глобальный максимум в задаче (Ра) при 0 < а < 1.
Аналогичное утверждение можно доказать для задачи (О7).
Теорема 4. Пусть дан граф С(У, Е) и ему в соответствие поставлена задача (О^). Тогда при 0 < Y < 1 следующие утверждения эквивалентны:
г) С — локально максимальная клика размерности К, г = г(С) — ее характеристический вектор;
И) г — строгий локальный минимум в задаче (Оа); Ш) г — локальный минимум в задаче (Оа).
Следствие 3. С* — максимальная клика в графе С(У, Е) тогда и только тогда, когда г (С*) — глобальный минимум в задаче (О^) при 0 < 1.
Замечание 4. Из теорем 3 и 4 вытекает что, при 0 < а < 1 в задаче (Ра) и при 0 < ^ < 1 в задаче (О7) неравенства в предложениях 3 и 2 выполнены как равенства.
На основе данных теорем были построены приближенные методы нахождения максимальной клики [2, 5]. Однако для приближенного метода необходим способ оценивания найденного решения. Следующий результат устанавливает соотношение между значением задачи (О^), если ^ > 0, и размерностью максимальной клики.
Предложение 4. Пусть в задаче ) параметр ^ > 0, и V(О1) = шш(Е7,Б). Тогда для размерности максимальной клики справедлива следующая оценка:
7
V О)
где — ближайшее целое число, не превосходящее исходное.
(3.3)
Доказательство. Пусть С* — максимальная клика размерности К*. Нетрудно видеть, что характеристический вектор г(С*) является допустимым в задаче (О^), и Е^(г(С*)) = —. Тогда из неравенства
К*
Е1 (г(С*)) > V(О1) следует, что К* < ), но поскольку К* — це-
V )
лое число, то эту оценку можно усилить и получить искомое неравенство (3.3). □
Этот результат для задачи (Ра) выглядит следующим образом.
Предложение 5. Пусть в задаче (Ра) параметр а < 1, и V(Ра) = шах(Еа(-), Б). Тогда для размерности максимальной клики справедлива следующая оценка:
1а
[1 — V (Ра)\
(3.4)
Замечание 5. Из теорем 4,2 и 3,1 вытекает что, при 0 < ^ < 1 в задаче (О7) и при 0 < а < 1 в задаче (Ра) неравенства в предложениях 4 и 5 выполнены как равенства.
Замечание 6. Таким образом, решив задачу (Ра) или (О7) можно найти оценку сверху для размерности максимальной клики. Заметим, что при достаточно больших по модулю значениях параметров эти задачи будут выпуклыми, и для их решения применимы методы квадратичного программирования [1].
* _
Замечание 7. Наиболее известной верхней оценкой является неравенство, полученное в [8]:
K < max Xi(A), (3.5)
1<i<n
где A(A) — собственное число матрицы смежности A. Неравенство (3.5) выполнено как равенство, тогда и только тогда, когда граф полный. Кроме того, существуют другие способы оценивания размерности максимальной клики на основе собственных чисел [4]. Нахождение оценок вида (3.3), (3.4) существенно отличается от этих способов.
4. Расширенный выбор значений параметров
В теоремах 3 и 4 указаны границы варьирования параметров при которых существует взаимно-однозначное соответствие между решениями задач и кликами в графе. Тем не менее, желательно знать, в каком случае можно расширить границы для выбора параметров, поскольку при достаточно больших по модулю значений параметров задачи (Ра) и (Dy) становятся выпуклыми. Приведенные ниже две теоремы показывают, при каких значениях параметров часть утверждений из теорем 3 и 4 остаются в силе. Предпочтительнее сначала сформулировать и доказать результат для задачи (Dy ).
Теорема 5. Пусть дан граф G, C — ЛМК, z = z(C) — характеристический вектор C. Далее, пусть s = s(C) = min Si, где Si = E aij
i$C j£c
— количество вершин, несмежных с вершинами из C. Тогда для y: 0 < y < s точка z будет являться строгим локальным минимумом в задаче (Dy). Если y > s, то z € St(DY/).
Доказательство. Не умаляя общности, считаем, что C = {1,..., K}.
1 K
Нетрудно видеть, что для характеристического вектора z(C) = — /ei
K г—f
i=i
si
(Az)i = 0, i = 1,...,K; (Az)i = -i, i = K + 1,...,n. (4.1)
K
n
Рассмотрим вектор p такой, что pi > 0, i = K +1,..., n, и E pi = 0, или
i=1
K n s _Y
E pi = _ E pi. Пусть дополнительно \pi\ < r = ——, i = 1,... K. i=1 i=K+1 sK
Тогда любую точку u € B(z, r) П S можно представить, как u = z + p. Рассмотрим приращение целевой функции c u = z, т.е. p = 0.
{Tyu,u) _ {Tyz,z) = 2{Az,p) +2y{z,p) + {Ap,p) + y{p,p).
Поскольку элементы матрицы А неотрицательные, при построении оценки снизу будем учитывать только элементы а^, г = 1,..., К; ] = К + 1,... ,п. Кроме того, будем использовать соотношения (4.1) и предположения на вектор р. Итак,
1 п 1 п 1 К 1 п
{^р) = £ 8Р; (Х,р) = £ = £ = Р*
К+1 1 1 К+1
п 2 п
{АР,Р) >-2^ *Р* = - 2 53 6^ -К+1 К К+1 6
Объединяя полученные выражения, имеем:
Ти, и) - Тг, г) >
2 п 27 п 2 п в- п
--¡г 12 Р* -г12 6- + =
К К+1 К К+1 К К+1 6 1
Су п / \ п (Л п / \ п
= 212 Ы -7- 6т(6 -7Пр*+^р2 = ^[6 -1)р^12р2 >
К К+1 6 / 1 К К+1 6 1 1
> 7Eft2 > 0. 1
Пусть теперь 7 > s. Покажем, что в этом случае вектор z = z(C) не удовлетворяет условиям Каруша-Куна-Таккера. Действительно, пусть Sj = s для некоторого j > K. Тогда
(Tyzh = K = х> i = K; (Tyz)j = K< K = Х-
Таким образом, z(C) не является стационарной точкой, а следовательно, и локальным минимумом. □
Теорема 6. Пусть дан граф G, C — ЛМК, z = z(C) — характеристический вектор C. Далее, пусть s = s(C) = min Si, где Si =
ige
Y^ cTij — количество вершин, несмежных с вершинами из C. Тогда j e
для а: (1 — s) < а < 1 точка z будет являться строгим локальным максимумом в задаче (Pa). Если а < (1 — s), то z ^ St(Pa).
5. Численное построение оценок
На основе предложения 4 были найдены оценки для размерностей максимальных клик на задачах из библиотеки DIMACS. В качестве параметра y выбирали число | min Ai(A)|, где Ai(A) — собственное чис-
1<i<n
ло матрицы смежности дополнительного графа. Для решения полученной выпуклой задачи использовался пакет Xpress-MP. Кроме того, было проведено сравнение с оценкой вида (3.5). Результаты тестирования представлены в табл. I В таблице приняты следующие обозначения: graph — название файла,содержащего матрицу смежности; n — размерность графа, dens — плотность графа, т.е. отношение количества ребер графа к максимально возможному СП при данной размерности, — размерность максимальной клики, wi — оценка из [8]: wi = L max Ai(A) + 1j; W2 — оценка, полученная по формуле (3.3).
1<i<n
Таблица I. Результаты тестирования двух способов построения оценок для МК
graph n dens K wi W2
c-fat200-1 200 0.077 12 17 17
c-fat200-2 200 0.163 24 33 33
c-fat200-5 200 0.426 28 85 72
brock200_1 200 0.745 21 149 40
brock200_2 200 0.496 12 100 25
brock200_3 200 0.605 15 121 31
brock200_4 200 0.658 17 132 34
san200_0.7_ 1 200 0.700 30 140 93
san200_0.7_ 2 200 0.700 18 143 108
san200_0.9_ 1 200 0.900 70 180 113
san200_0.9_ 2 200 0.900 60 180 95
san200_0.9_ 3 200 0.900 44 180 84
sanr200_0.7 200 0.697 18 139 36
sanr200_0.9 200 0.898 < 42 179 64
keller4 171 0.649 11 111 32
MANN_a9 45 0.927 016 41 16
Как видно из таблицы, верхняя оценка, найденная на основе решения выпуклой задачи, во всех примерах оказалась меньше, чем оценка на основе максимального собственного числа, причем в некоторых случаях различие оказалось существенным (в 2-3 раза). Особенно хорошие оценки вторым способом удалось получить на разряженных и плотных графов.
Список литературы
1. Васильев Ф.П. Численные методы решения экстремальных задач. — М.: Наука, 1988.
2. Кузнецова А.А., Карпачева О.Н. Два метода локального поиска с параметрами для задачи о максимальной клике // Методы оптимизации и их приложения.: Тр. Междунар. конф. — Иркутск: ИСЭМ СО РАН, 2005. — Т. 1. — С. 527-533.
3. Bomze I. Evolution towards the maximum clique // J. of Global Optimization. — 1997. — V. 10. — P. 143-164.
4. Bomze I.M., Budinich M., Pardalos P.M., Pelillo, M. The maximum clique problem // Handbook of Combinatorial Optimization. /Ed. by D.-Z. Du , P.M. Pardalos. — Kluwer, 1999. — Suppl. Vol. A. — P. 1-74.
5. Kuznetsova A., Strekalovsky A.S. On solving the maximum clique problem // J. of Global Optimization. — 2001. — V. 21, N. 3. — P. 265-288.
6. Motzkin T.S., Straus, E.G., Maxima for graphs and a new proof of a theorem of Turan // Canad. J. Math. — 1965. — V. 17. — P. 533-540.
7. Pardalos P.M. Continuous approaches to discrete optimization problems // Nonlinear Optimization and Applications/ Eds. by G.Di. Pillo and F. Giannessi. — New York: Plenum Press, 1996. — P. 313-328.
8. Wilf H. S. The eigenvalues of a graph and its chromatic number //J. London Math. Soc. — 1967. — Vol. 42. — P. 330-332.
A. A. Kuznetsova
Two quadratic problems for estimating and searching a maximum clique
Abstract.We consider the maximum clique problem and its formulation as two continuous problems. Using these continuous formulations some upper bounds for the maximum clique cardinality are obtained. The parameter variation segment is received as well.