Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 5 (2), с. 93-96
УДК 519.6
НИЖНЯЯ ОЦЕНКА СЛОЖНОСТИ МИНИМИЗАЦИИ СТРОГО КВАЗИВЫПУКЛОЙ ФУНКЦИИ НА ЦЕЛОЧИСЛЕННОЙ РЕШЕТКЕ
© 2012 г. Н.Ю. Золотых, А.Ю. Чирков
Нижегородский госуниверситет им. Н.И. Лобачевского
zolotykh@vmk.unn.ru, chirkov@vmk.unn.ru
Поступила в редакцию 10.09.2012
Рассматривается задача минимизации строго квазивыпуклой функции, определенной на множестве {х е Z : max |х,| < г}. Предполагается, что функция задана оракулом, позволяющим по любым двум точкам хиуиз области определения определить, выполнено или нет неравенство/(х) < f(y). Доказано, что при таких ограничениях любой алгоритм минимизации требует (в худшем случае) не менее 3d-1log2(2r - 1) обращений к оракулу.
Ключевые слова: квазивыпуклая функция, сложность, целочисленная решетка, нижние оценки.
1. Минимизация квазивыпуклой функции
Пусть Р С Rd и Р — выпуклое множество. Функция /: I’ —» R называется квазивыпуклой, если для любых х,у е Р и любого а е R, такого, что 0 < а < 1, справедливо
Дох + (1 - сс)>0 < max {/(х), /О)}. Хорошо известно (см., например, [1]), что f — квазивыпуклая тогда и только тогда, когда для любого a g R множество {х: /(х) < а} выпукло. Выпуклая функция является квазивыпуклой. Обратное в общем случае не верно.
Функция /: I’ —» R называется строго квази-выпуклой, если для любых х,у е I) и любого а е g R, такого, что 0 < а < 1, справедливо
/(ах + (1 - а)>0 < max {/(х), f (у)}.
Из определения непосредственно вытекает следующее свойство строго квазивыпуклых функций.
Утверждение 1 (см., например, [1]). Пусть f — строго квазивыпуклая функция и Xj, x2, ..., xn, y,zeP, причем/(хг) <f(y) (/' = 1, 2, ..., n) иz e g у + cone {y - Xj, ..., у - x„j. Тогда/00 >f(y).
Пусть F — некоторый класс функций, ото-
бражающих Р в R. Обозначим М=.
Предположим, что с каждой функцией / g Т связан оракул, позволяющий по заданной паре точек ХЛ’ G М определить, выполнено или нет неравенство fix) < /(у). Рассмотрим задачу минимизации функции f на множестве M, т.е. задачу нахождения ее точки минимума arg miii>r.\ /(х) с помощью обращений к оракулу
функции f Если точек минимума несколько, то под решением задачи будем понимать любую из них. Предполагается, что относительно функции f известно лишь то, что она принадлежит классу F, мы не можем вычислять ее значений в точках и т. д.
Далее предполагается, что Р ограничено и, следовательно, множество М = PnZ конечно.
Эффективных алгоритмов минимизации квазивыпуклой функции на множестве M не существует [2]. Действительно, рассмотрим функцию fy, равную 0 в точке у g Ми 1 во всех остальных точках области P. Функция fy квазивыпуклая. Обращение к оракулу функции fy в любых двух точках, отличных от у, не дает никакой информации о точке минимума. Таким образом, для решения задачи минимизации функции fy в худшем случае требуется не менее |M| обращений к оракулу.
В [2] предлагаются эффективные алгоритмы минимизации строго квазивыпуклой функции при d = 2.
Далее в работе рассматриваются только строго квазивыпуклые функции.
2. Разрешающее множество
Пусть / Р —» R — строго квазивыпуклая
функция. Множество Г с М называется разрешающим для функции/ если для любой другой строго квазивыпуклой функции g: Р —> R из условий/(х) = g(x) для всех X G Т следует arg min fix) = arg min g(x).
Заметим, что если T — разрешающее для f, то
arg minxeT f (x) = arg minxeM f (x). Таким образом, разрешающее множество является «доказательством» того факта, что arg minxeT f(x) является точкой минимума arg minxeM f (x), поэтому любой алгоритм минимизации строго квази-выпуклой функции строит некоторое разрешающее множество этой функции.
В [2] охарактеризованы разрешающие множества строго квазивыпуклых функций для d = = 2 , в частности, доказано, что для любой строго квазивыпуклой функций при d = 2 существует разрешающее множество из 9 точек.
Из утверждения 1 получаем
Утверждение 2. Пусть f - строго квази-выпуклая функция и T с M. Если для любой точки z e M найдутся точки x1, x2, ..., xn, y e T, такие, что f(xi) < f(y) (i = 1, 2, ..., n) и z e y + + cone {y - x1, ..., y - xn}, то T - разрешающее множество.
3. Нижние оценки сложности минимизации
Обозначим SQC(d,r) множество всех строго квазивыпуклых функций, заданных на множестве M(d,r) = P(d,r)n Z , где P(d,r) = {x = (x1, x2, ..., xd) e Rd: max |x;| < R}.
Пусть A - алгоритм, на вход которого подаются натуральные числа d и r и оракул некоторой строго квазивыпуклой функции f e e SQC(d,r). На выходе алгоритма - точка минимума функции f Обозначим t(A, f) - число обращений к оракулу, совершаемых алгоритмом A при минимизации функции f Далее рассматриваются только такие алгоритмы. Обозначим
т( A, d, r) = max т( A, f),
f eSQC(d, r )
x(d, r) = min t( A, d, f),
A
где минимум в последнем случае берется по всем алгоритмам минимизации.
Каждому алгоритму A минимизации строго квазивыпуклой функции при заданных d и r поставим в соответствие бинарное дерево решений T. Каждой неконцевой вершине дерева T приписана пара точек x, y из M(d, r), а каждой концевой вершине (листу) - некоторая точка x из M(d, r). Каждой неконцевой вершине дерева T соответствует обращение к оракулу с вопросом «f(x) < f(y)?», а листьям - точка минимума функции f, возвращаемая алгоритмом. Ребрам приписаны метки 1 и 0 в зависимости от того, выполнено или нет неравенство f(x) < f(y). Каждый простой путь из корня в лист соответствует
работе алгоритма при некоторой функции /. Справедливы следующие утверждения.
Утверждение 3. Т(й, г) > log2 I, где I - количество листьев дерева решений, построенного по алгоритму А при заданных й и г.
Доказательство. Очевидно, что высота дерева Т равна т(й, г). С другой стороны, высота любого бинарного дерева не превосходит ^2 I.
Утверждение 4. т(й, г) > й ^2 (2г + 1).
Доказательство. Для любой точки х из М(й, г) найдется строго квазивыпуклая функция, минимум которой достигается в точке х, поэтому I > |Х(й, г)| = (2г + 1) . Требуемое неравенство следует теперь из утверждения 3.
Мы устанавливаем более сильное неравенство, чем неравенство из утверждения 4. А именно, справедлива
Теорема.
x(d, r) >
3d - і 2
log2 (2r - і) > 3d і log2 (2r - і).
Доказательству теоремы предпошлем ряд вспомогательных утверждений.
Пусть Тс М(й, г). Будем говорить, что функция g: Т —— ]& определяет строго квазивыпук-лую функцию на множестве Р(й, г), если существует функция / е SQC(d, г), такая, что для любых х, у е Т неравенство /(х) < /(у) выполнено тогда и только тогда, когда g (х) < g (у).
Обозначим Та = {х е Т: g(х) < а}. Под сопу X понимаем выпуклую оболочку точек из множества X с ]^й.
Лемма 1. Пусть Т с М(й, г) и для любого а выполнено
М(й, г) п сопу Та = Та, тогда функция g: Т — ]& определяет на Р(й, г) строго квазивыпуклую функцию.
Доказательство. Пусть |Т | = д. Упорядочим
Т’ (1) (2) (д) ^ ^ ^
точки из 1: х , х , ..., х™' так, что а1 < а2 < ... <
< ад, где а* = g(х(/)) (/' = 1, 2, ..., д - 1). В конец
(1) (2) (д) /
списка х , х , ..., х припишем (в произвольном порядке) вершины множества Р(й, г). В ре-
(1) (2) 5
зультате получим список х , х , ... , х .
Индукцией по 5 покажем, как построить строго квазивыпуклую функцию
/: сопу {х(1), х(2), ..., х(5)} — ]&,
такую, что для любых х, у е Т неравенство /(х) < /(у) выполнено тогда и только тогда, когда g(х) < g(у). Процедура основана на алгоритме [3] построения правильной триангуляции 5 = {^1, S2, ..., Sp} точечной конфигурации х(1), х(2), ..., х(5), т. е.
сопу {х(1), х(2),..., х( 5)} = иР_, S/,
причем S/ п Sj есть общая грань симплексов S/ и Sj при любых / и у. Функция / - непрерывная
кусочно-линейная, однозначно определяемая по
(1) (2) (5)
значениям в точках х , х , ... , х , а именно:
f (x) = X ak f (x (гk )), x = X C
✓*(ik )
k=і
k=і
Sak=і, ak > °
(і)
k=і
где х є 5, 5 є 5 и х(гі),х(г2),...,х(г"-1 - вершинні симплекса 5.
Если 5 = і, то положим /(х(1)) = а1. Пусть 5 = = {5}, где 5 = {х(1)}.
Если 5 > 1, то предположим, что уже построена строго квазивыпуклая функция
/: сопу {х(1), х(2), ..., х(5-1)} ^ ]& и имеется триангуляция 5 точечной конфигура-
(1) (2) (5-1) Т/Т
ции х , х , ..., х . Из условия леммы следует, что х(5) й сопу {х(1), х(2), ..., х(5-1)}. Для каждой видимой из х(5) фасеты (грани максимальной размерности) О триангуляции 5 построим новый симплекс сопу (х(1) и О) (определение видимой фасеты см. в [3]). Все построенные симплексы добавим в список 5. В качестве /(х(5)) выберем достаточно большое значение так, чтобы функция f, определяемая (1), была выпуклой. Лемма 1 доказана.
Построим семейство Т(С, г) множеств Т с с М(С, г) и семейство С(С, г) функций/Т: Т ^ ]&, такое, что С(С, г) = {/Т: Т ^ R: Т є Т(С, г)}, с помощью следующей рекурсивной процедуры.
Семейство Т(1, г) содержит все 2г - 1 множеств вида Т = {/' - 1, і, і + 1}, где |і1 < г. Положим gт(i) = 0, gт(i - 1) = 1, gт(i) = 2.
При С > 2 семейство Т(С, г) получается из Т(С - 1, г) следующим образом. Для каждого целого і, удовлетворяющего неравенству |і | < г, рассмотрим произвольную неупорядоченную тройку Ть Т2, Тз, где Та є Т(С - 1, г) (ц = 1, 2, 3). Множество ТЦ получается из Тц приписыванием к каждому вектору из ТЦ новой компоненты, равной і + ц - 2. Положим Т = 71' и Т[и ТЗ. В семейство Т(С, г) войдут все множества Т, которые можно построить таким способом. Формально:
г-1
Р (С, г) = У {Р = Р' и Р и РЗ: РЦ = {(х, і + ц- 2):
і=—г+1
хе Рц},Рц= ^(й-1,г), ц = 1,2,3}.
Лемма 2. |Т(й, г)| = (2г - 1)(3" - 1)/2. Доказательство. По построению Т(й, г) имеем
Т (1, г) = 2г -1,
| Т(й, г)| = 21 Т(й, г)|3 = (2г -1) I Т(й -1, г)|3.
/=-г+1
Теперь требуемое равенство легко доказывается индукцией по й.
Пусть на Тц задана функция gт)^ (^ = 1,2,3).
Определим функцию gт: Т — ]& следующим образом:
gт(У) = <
d-і
+ g^( x), У =(x, і - і),
gт2 (x),
У = (x, i),
2 • 3d 1 + gT3( x), y = (x, i +1).
Лемма 3. Для любого множества T e T(d, r) найдется функция f e SQC(d, r), такая, что для любого ее разрешающего множества T' справедливо T' с T.
Доказательство. Из леммы 1 следует, что для любого T e T(d, r) функция gT определяет на P(d, r) строго квазивыпуклую функцию. Переопределив значение gT только в одной (любой) точке из T, положив его равным -1, снова получим функцию, определяющую строго квазивыпуклую функцию. Таким образом, найдется функция f e SQC(d, r), такая, что для любого ее разрешающего множества T' справедливо T' с T. Лемма доказана.
Из леммы 3 следует, что количество листьев в дереве решений, построенном при заданных d и r по произвольному алгоритму минимизации квазивыпуклой функции, содержит не менее |T(d, r)| листьев. Доказываемая теорема следует теперь из утверждения 3 и леммы 2.
Список литературы
1. Сухарев А.Г., Тимохов А.В., Федоров В.В. Курс методов оптимизации. М.: Наука, 1986.
2. Чирков А.Ю. Минимизация квазивыпуклой функции на двумерной целочисленной решетке // Вестник Нижегородского университета им. Н.И. Лобачевского. Серия: Математическое моделирование и оптимальное управление. 2003. № 1. C. 227-238.
3. Шевченко В.Н., Груздев Д.В. Модификация алгоритма Фурье - Моцкина для построения триангуляции // Дискретный анализ и исследование операций. Серия 2. 2003. Т. 10, № 1. С. 53-64.
A LOWER BOUND FOR THE COMPLEXITY OF MINIMIZATION OF A STRONG QUASICONVEX FUNCTION ON THE INTEGER LATTICE
N.Yu. Zolotykh, A.Yu. Chirkov
A minimization problem of a strong quasi-convex function defined on the domain {x e Zd: max |xj < r} is considered. It is assumed that the function is defined by an oracle which allows determining by any two points x and y in the domain iff (x) < f (y) holds or not. We prove that under these conditions any minimization algorithm requires (in the worst case) at least 3d-1log2(2r - 1) calls to the oracle.
Keywords: quasiconvex function, complexity, integer lattice, lower bounds.