(3)
КОМПЬЮТЕРНЫЕ^
УДК 519.85
ЛОКАЛИЗАЦИЯ ТОЧЕК МИНИМУМА В НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ C БУЛЕВЫМИ ПЕРЕМЕННЫМИ
ГРЕБЕННИК И.В.
Рассматривается задача дискретной оптимизации на множестве булевых переменных в евклидовом пространстве. Проводится декомпозиция множества допустимых решений по семействам параллельных гиперплоскостей. На основе декомпозиции осуществляется локализация решений исходной задачи оптимизации.
Рассмотрим задачу дискретной оптимизации следующего вида:
ф(х) ^ min, (1)
х є Bk c Rk; Bk = (x|xi є {0,i}, i є Jk, Jk = {i,2,...,k}.
Отметим, что множество Bk , его свойства и некоторые задачи оптимизации на множестве Bk исследованы в [1,2].
Осуществим выпуклое (сильно выпуклое с параметром р > 0) дифференцируемое продолжение j функции (p(x) на выпуклое замкнутое множество X 3 Qk = conv Bk которое может быть получено, например, способом, описанным в [2]. Учтем, что точки множества Bk и только они удовлетворяют системе
0 < X; < 1, І Є Jk ,
k
Z(x;
I i = 1
l»2
k
4 '
Тогда задаче (1) можно поставить в соответствие эквивалентную задачу оптимизации:
ф(x)
^ min,
x є Rk,||x -c||2 = Ё,0 < x; < 1,i є Jk, (2)
Д 1,
c = (—,...,—) < 22
R
k
В работе [3] был рассмотрен способ декомпозиции множества Bk с помощью семейств гиперплоскостей. На основе сформулированного определения n-смежности элементов множества Bk строятся гиперплоскости a(n), n-смежные с данной точкой x(0) є Bk . При этом уравнение гиперплоскости a(n) имеет вид:
c1x1 + c2x2 +... + ckxk + dn - 0,
где с i =
1, если X0 = 1, . т
! 0 0, iЄJk ,
- 1, если Xi = 0,
dkn) = dk + n -1, dk получается подстановкой в (3) произвольной вершины q2,1 — смежной с x0 .
Используем полученные в [3] результаты для локализации решения задачи (2) в некотором подмножестве множества Bk.
Учтем, что множество Bk является пересечением k — мерного гиперкуба Qk и гиперсферы Sk и удовлетворяет соотношениям:
0 < x; < 1, i = 1,...,k ,
< k
Z (xi
li=1
і'2
k
4 .
(4)
Рассмотрим множества 5k_1 = Sk n a(n) (x0) и Qk_1(n) = q2 na(n)(x0), где a(n)(x0) - гиперплоскость вида (3) в R k, проходящая через вершины Qk , n — смежные с точкой х0.
Очевидно, что множество, лежащее на пересечении гиперсферы Sk и гиперплоскости a(n)(x°), представляет собой гиперсферу ?k-1 в пространстве Rk . Получим ее уравнение. Выражая из (3) переменную xk, подставим ее в уравнение гиперсферы S k :
k-1
Z (xi
i=1
ї>2
+ (-dk
1
2
1 k^1 )2
Zcixi)
ck i=1
k
4 .
Имеем:
k-1 2 k-1k-1
Z xi + Z Z cicjxixj + i=1 i=1 j=1
k-1
+ Z (
(2dn + 1)ci
1)xi + (dn)2 + dk = 0
i=1 ck
Введем следующие обозначения:
(5)
C = hi
ij J(k-1)x(k-1)
cij =
ci • cj, i * j , cicj +1, i = j
i,j є Jk-1;
D = (d1,...,dk_1); di = (2dk+ 1)ci _ ^ i є Jk4 ;
ck
P = (dk)2 + dn .
Тогда соотношение (5) может быть представлено в виде
(Cx, x) + (D, x) + P = 0 , (6)
где x є Rk 1.
РИ, 2002, № 4
99
Приведем квадратичную форму в левой части (6) к каноническому виду. Для этого найдем ее представление в базисе собственных векторов матрицы С.
Пусть ХЬХ2,..., — собственные числа матрицы
С, а e1,e2,...,ek_i — соответствующие им ортонормированные собственные векторы.
Рассмотрим матрицу T = |тД , столбцами
L 4Jk—1 х k-1
которой служат собственные векторы матрицы С. Пользуясь приемами линейной алгебры, получим искомое представление соотношения (6):
(Wx,x) + (0,x) + P = 0 ,
где
W=T 1CT=
Х1 0
0 ^ k-1
0 = TD.
Уравнение (7) можно переписать в виде
(7)
k-1 2 k-1
Е Лхг' + ^&ixi + P = 0 .
i=1 i=1
Поскольку матрица С вещественна и симметрична, то ее спектр X 2,..., ^k-1 является вещественным
k-1 Q. 2 k-1 Q2 P
[4]. Тогда Z(xi 4^ - 1<^т-
)-
урав-
нение гиперсферы Sk_1 = Sk na(n)(x0).
Получим теперь соотношения, описывающие многогранник q2_1 (n) = Qk n a(n) (x0). Выразив из (5)
переменную xk, подставим ее в систему неравенств из (4). Имеем:
0 < xi < 1> і є Jk_1 ,
1 k
dk *----E c.x. < 1 + dk .
ck i=1
Справедливо следующее утверждение.
Лемма. Точки множества X(n)(x0) и только они удовлетворяют системе соотношений
0 < x. < 1, i є Jk_1;
1 k
dk ^------1c.x. < 1 + dk;
ck і=1
k-1 a. 2 k-1 a. p
E (x. + -Ч2 = E (-y - гг ду), і=1 2X і і=1 4X:2 (k - 1)7, і
т.е. лежат на пересечении многогранника Qk 1(n) и сферы Sk_1.
Доказательство утверждения следует из цепочки соотношений, использующей закон ассоциативности и свойства идемпотентности алгебры множеств:
Sk-1 n Qk“1(n) = Sk-1 n (Ql na(n)(x0)) =
= (Sk-1 n Qk) na (n)(x0) =
= ((Sk n a(n)(x0)) n Qk) n a(n)(x0) =
= ((Sk nQ2)na(n)(x0))na(n)(x0) =
= (Sk ^ Q2) ^ (a(n) (x0) n a(n) (x0)) _
= (Sk nQ2)na(n)(x0) =
= Bk na(n) (x0) = X(n)(x0).
Рассмотрим задачу оптимизации (2). Используя представление множества X(n)(x0) в виде пересечения многогранника и гиперсферы, получаем оценку минимума функции цели <p(x) на множестве X(n)(x0). Для этого спроектируем 9(x) на подпространство Rk-1, задаваемое гиперплоскостью a(n)(x0) вида (3). Выражая из уравнения гиперплоскости a(n)(x0) переменную xk, получаем
9(x) = 9(x1,x2,...,xk) = 9(x1,...,xk_1,
1 k-1
-dk-----Ecixi) = ep(x1,x2,.. ,xk-1) .
ck i=1
Очевидно, Ep(x) — выпуклая функция, так как она является проекцией выпуклой функции <p(x). В качестве оценки минимума функции ф (а значит и ф ) на множестве X(n)(x0) рассмотрим решение задачи оптимизации функции ~(x1,x2,...,xk_1) на многограннике Qk_1 (n). Легко показать, что множество вершин многогранника q2_1(n) совпадает с множеством X(n)(x0). В связи с этим поставленная задача эффективно может быть решена одним из известных методов, основанных на линеаризации, например, методом условного градиента (Франка — Вульфа) или проекции градиента. Эффективность решения достигается благодаря простоте решения вспомогательной задачи оптимизации линейной функции на многограннике (Qk_1 (n), основанного на утверждении леммы 1 из [3].
Решение описанной задачи на многограннике Qk _1(n) является оценкой минимума функции Ep(x1,x2,...,xk_1) на множестве X(n)(x0). Однако в случае, если глобальный минимум функции ~ —
внутренняя точка многогранника Qk_1 (n), эта
оценка недостаточно эффективна. Более эффективной оценкой при этом может служить решение
задачи оптимизации функции Ep(x1,x2,...,xk) на
гиперсфере Sk _1. Но получение такой оценки для
100
РИ, 2002, № 4
Ф(х) общего вида является сложной задачей, для решения которой требуется разработка специальных методов. Для случая, когда ф(х) — квадратичная функция, методы решения этой задачи рассмотрены в работах [ 1, 2].
Предположим теперь, что функция цели в задаче (2) сильно выпукла с параметром р > 0 . Опираясь на полученные оценки минимума ф(х) на множествах X(n)(x0), попытаемся локализовать решение поставленной задачи. Рассмотрим вначале случай, когда
y = arg min ф(х) g Q2 = convBk
xeR1'
(8)
Определим точку х* области допустимых решений задачи (2), ближайшую к у . Легко показать [1], что точка х* є Bk определяется как
0, если у: < —;
1 - 1
1, если у. >—.
: 2
(9)
Очевидно, что значение ф(х*) является верхней оценкой решения задачи (2).
Построим систему множеств Х(п)(х*), n=1, 2,, k, и проведем через них гиперплоскости а(п) вида(3), n=1, 2, ..., k. Из выпуклости функции ф(х) и того факта, что глобальный минимум ф(х) не принадлежит многограннику q2 , а также способа построения семейства параллельных гиперплоскостей а(п) следует, что
ф(у) < minф(х) < minф(х) <... < minф(х)
хє^2-1(п) . (10)
х^ 1(1) xєQk 1(2)
хі =
Обозначим y(i) = arg min ф(х), i = 1,...,2.
xєQ2-1(i)
Тогда, если выполняется неравенство
ф(х*) <ф(у(j)) (11)
для какого-либо (p&Jk, то в соответствии с (10) решение задачи (2) принадлежит множеству
j-1
уО-1)(х*) = у Х(:)(х*). i=1
Покажем, при каких условиях для ф(х) будет выполнено условие (11).
Так как ф(х) сильно выпукла с параметром р > 0 , то для нее справедливы следующие соотношения [5]:
ф(х*) -ф(у) >р|| х* --|2; (12)
9(-(j)) - Ф(У) ^ p||y(j) --f . (13)
Оценим норму ||у(j) - -| . Так как точка -(j) є то оценкой нормы может быть квадрат расстояния от точки у до плоскости a(j) вида (3). Имеем
|L(j) _-I2 > (c1y1 + c2y2 + ••• + ckyk + d2)2 _
i2
(j) ^ ™(j)
(j) - -
2 2 2 cl + c2 +... + ck
1 k j = y( E ci-i + dk)2. k i=1
Используя эту оценку, а также то, что ||х * -у||2 > 0 , сложим неравенства (12) и (13):
ф(х*) +ф(уа)) - 2ф(у) >Р- у( Е ci—i + dk)2
k i=1
ф(у(j)) - ф(х*) > 2(ф(у) - ф(х*)) +
+р-т(Еci—і + dk)2. k і=1
Определим значение r, при котором ф(у(j)) -ф(х*) > 0. Имеем:
ф(х*) -ф(у)
р > 2k-
(Е ci—i + dk)2
(14)
i=1
Таким образом, если функция цели задачи (2) ф(х) является сильно выпуклой и удовлетворяет условию (14), то решение задачи принадлежит множеству y(j_1) (х*).
Итак, справедлива следующая теорема.
Теорема 1. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром р > 0, а
семейство параллельных гиперплоскостей a(n) вида (3) проведено через точки множеств X(n) (х*),
n є Jk, где х* удовлетворяет соотношению (9). Тогда для того, чтобы решение задачи (2) было
- j-1 .
локализовано внутри множества y(J_1) = у Х(:)(х*),
i=1
достаточно, чтобы выполнялось условие ф(х*) -ф(у)
р > 2k-
(Е ci—і + dik)2
i=1
где у удовлетворяет (8).
Следствие. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром
р > 0 , а гиперплоскость а(1) вида (3) проведена
через точки множества Х(1)(х*), где х* удовлетворяет соотношению (9). Для того чтобы х* была точкой минимума ф(х) на множестве Bk, достаточно, чтобы выполнялось условие
РИ, 2002, № 4
101
р
> 2k
Ф(х*) -ф(у)
k і 2 ’
(Z сіУі + dk)2
i=1
_ k(V9(x*),x* -y(1))
Pг k k ,
k * 12 (Ё cixi + dk)2
i=1
где у определяется соотношением (8).
Рассмотрим теперь случай, когда ф(х) — сильно выпуклая с параметром р > 0 дифференцируемая функция. Опираясь на предыдущие построения, докажем следующую теорему.
Теорема 2. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром р > 0 и дифференцируема, а семейство параллельных гиперплоскостей a(n) вида (3) проведено через точки множеств X(n)(x*), n є Jk, где х* удовлетворяет соотношению (9). Тогда для того, чтобы решение задачи (2) было локализовано внутри множества . j-і .
Y(j 1) = U x(i)(x*), достаточно, чтобы выполня-i—1
лось условие
^, (Vф(x*),x* —y(j)) р -k k ,
(Ё cixi + dk)2
i=1
где y(j) = arg min ф(x).
xeQk _1(j)
Доказательство. Так как фф) сильно выпукла и дифференцируема на Rk, то для любых x,y є Rk справедливо соотношение [5]:
Ф(у) - 9(x) > (Vф(x), y - x) + р||x - y2 .
Подставляя в это соотношение точки х* и y( j), где
y6) _ arg mijj) ф(x), а х* удовлетворяет (9), получаем условие, когда ф(у(^) > ф(x*). Учитывая, что 2
x - Г
(j)
можно оценить квадратом расстояния от
(j)
точки х * до гиперплоскости a(J), имеем
x - y
(j)|2 1 k * j 2
-y(j1 ^-(Ёc.x. + djk)2 .
k i=1
k
Тогда ^(x*),y(j) - x*) +£ (^ c.x* + dk)2 > 0 ,
k i=1
_ k(V9(x*),x* - y(i)) p-k k : .
(^ cix*+dk)2
i=1
Следствие. Пусть в задаче оптимизации (2) функция цели ф^) сильно выпукла с параметром р > 0 и дифференцируема, а гиперплоскость а(1) вида (3) проведена через точки множества X(1)(x*), где х * удовлетворяет соотношению (9). Для того чтобы х * была точкой минимума ф^) на множестве Bk, достаточно, чтобы
где у(1) = arg min ф^)
x.Qk-1(1)
Рассмотренный случай, когда безусловный минимум у сильно выпуклой функции ф^) не принадлежит многограннику Qk = conv Bk , является более благоприятным для локализации решения задачи (2) описанным способом. При этом точка x* є Bk, ближайшая к у и полученная по формуле (9), является естественным приближением к решению задачи (2). В силу выпуклости фф), ф^*) во многих случаях будет хорошей верхней оценкой решения задачи. Гиперплоскости a(n) отсекают точки множества Bk или его подмножеств от безусловного минимума ф^) — точки у . А после выполнения условия (11) для какого-либо j можно исключить из рассмотрения все точки множества Bk, отсеченные гиперплоскостью a(j). При выполнении условий следствий из теорем 1 и 2 точка x* становится решением задачи.
В случае же, когда у является внутренней точкой
многогранника Qk, применение описанной схемы локализации менее эффективно. В этой ситуации невозможно отсечь одной гиперплоскостью у от
точек множества Bk. Кроме того, при этом трудно указать удачное приближение к решению задачи. Одним из подходов к локализации решения задачи (2) может быть следующий. Исходя только из свойства выпуклости функции ф^) и не оценивая ее скорости роста в различных направлениях, выберем в качестве приближения к решению точку x *, ближайшую к у . Для этого воспользуемся соотношением (9). Как и в первом случае, построим систему множеств X(n)(x*), n = 1,2,...,k . При этом точка у є Q| окажется между двумя гиперплоскостями семейства a(n), например, a(s) и a(s+1). Тогда в силу выпуклости ф^), способа построения семейства гиперплоскостей a(n) и положения точки у внутри многогранника Qk относительно гиперплоскостей семейства a(n) выполняются условия:
Ф^*) > min ф^) > min ф^) >... > min ф^) > ф(у),
xeQk-1(1) xeQk_1(2) xeQk-1(s)
ф(у) < min ф^) < minф^) <... < min ф^)
xeQk_1(s+1) xeQ|_1(s+2) xeQ|_1(n) .
Если для какого-либо j є {s +1,n} выполнится неравенство (11), то в соответствии с приведенными условиями решение задачи (2) будет принадле-j j-1 .
жать множеству Y(j_1)(x*) = U X(i)(x*).
i=1
102
РИ, 2002, № 4
Отметим, что для дальнейшей локализации решения задачи (2) в случае у є q| можно воспользоваться следующим приемом. Выберем вершину Qk , смежную с x *, обозначим ее х1. Построим
систему множеств X(n)(x1), n = 1,2,...,k и воспользуемся приведенной выше схемой. Получим другое множество, содержащее решение задачи (2):
Y(t-1)(х1) = tU1X(l)(x1). i=1
Тогда решение задачи (2) принадлежит множеству Y = Y(j-1)(x*)П Y(t_1)(x1) .
Выбирая новые вершины многогранника Qk и
проводя аналогичные построения, можно продолжить процесс локализации решения исходной задачи (2).
Литература: 1. СтоянЮ.Г., Яковлев С.В., Гребенник ИВ. Экстремальные задачи на множестве размещений. X., 1991. 37с. (Препринт АН УССР/Ин-т пробл. машиностроения; 347). 2. Яковлев С.В., Гребенник И.В. О некоторых классах задач оптимизации на множествах размещений и их свойствах//Изв. вузов. Математика. 1991. №11. С.74-86. 3. Гребенник И.В. Декомпозиция множества допустимых решений и экстремальные свойства целевых функций в задачах оптимизации с булевыми переменными // Радиоэлектроника и информатика. 2001. №3. С. 93-99. 4. Кострикин А И., Манин Ю.И. Линейная алгебра и геометрия. М.: Наука, 1986. 304 с. 5. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1988. 588 с.
Поступила в редколлегию 29.04.2002
Рецензент: д-р физ.-мат. наук Новожилова М.В.
Гребенник Игорь Валериевич, канд. физ.- мат. наук, доцент кафедры системотехники ХНУРЭ. Научные интересы: дискретная оптимизация, вычислительные методы. Увлечение: волейбол. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-06.
УДК 621.327
РАЗРАБОТКА СТРУКТУРНОЙ ОРГАНИЗАЦИИ ПРОЦЕССА ОБРАБОТКИ ВИДЕОДАННЫХ
КОРОЛЕВ А.В.____________________________
Излагается структурная организация процесса обработки видеоданных, включающая организацию выявления длин серий и формирование из них массивов, кодирование длин одноцветных областей по числу двоичных серий, формирование полиадических кодов с учетом ограниченного числа двоичных серий в длинах одноцветных областей.
Введение
В работе [1] показано, что на основе последовательного выявления особенностей изображений по признакам: длина области (количество элементов в области), закрашенная одним цветом, число двоичных серий, значение динамического диапазона осуществляется сокращение избыточности. Однако конкретная организация обработки изображений не указывается. В то же время организация обработки значительно влияет на результирующее значение степени сжатия видеоинформации [2]. Поэтому для исключения избыточности изображений на основе предложенной совокупности информативных, структурных признаков требуется:
1) обеспечить наличие кодовых конструкций для сокращения избыточности по каждому признаку;
2) разработать структурную организацию обрабатываемых данных.
Первое условие (необходимое) обеспечивает устранение избыточности по каждому признаку в отдельности за счет наличия соответствующих процессов формирования кодовых комбинаций. Однако, чтобы осуществить последовательное устране-
ние избыточности различных видов, необходимо организовать соответствие для смежных матриц информативности между обрабатываемыми данными и особенностями формируемых кодов. При этом должны дополнительно учитываться особенности аппаратной реализации процессов обработки [3, 4].
1. Разработка структурной организации обработки видеоданных
Структурная организация данных должна строиться так, чтобы обеспечить наибольший коэффициент сжатия и исключить неконтролируемые потери информации. Поэтому второе условие является достаточным для обеспечения наибольшей степени компактного представления видеоданных при минимальном количестве операций и исключения неконтролируемых потерь информации.
Структурная организация обработки данных определяется следующими параметрами: числом признаков; количеством элементов, для которых присваивается код (поэлементное или блочное); видом машинного представления (равномерный или неравномерный); размером массивов данных (постоянные или переменные); типом динамического диапазона данных (регулируемый или нерегулируемый).
Определим параметры структурной организации процесса обработки для предложенной совокупности признаков, состоящей из следующих матриц информативности: << исходное изображение; длины серий; коды по числу двоичных серий; полиадические коды >>.
При выборе вида машинного представления необходимо учитывать особенности аппаратной реализации процессов обработки данных. Эти особенности состоят в том, что:
РИ, 2002, № 4
103