Научная статья на тему 'Редукция двойственных форм в методе атомной оптимизации'

Редукция двойственных форм в методе атомной оптимизации Текст научной статьи по специальности «Математика»

CC BY
139
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ / МАТРИЧНЫЕ НЕРАВЕНСТВА / ПОЛИНОМИАЛЬНЫЕ НЕРАВЕНСТВА / ТЕОРИЯ МОМЕНТОВ / NONLINEAR PROGRAMMING / MATRIX INEQUALITIES / POLYNOMIAL INEQUALITIES / MOMENT THEORY

Аннотация научной статьи по математике, автор научной работы — Поздяев Владимир Васильевич

Рассмотрены одномерные задачи оптимизации с полиномиальной целевой функцией и ограничениями в виде полиномиальных матричных неравенств. Для задач, двойственных к их линейным релаксациям, представлен механизм преобразования к форме, совместимой с методом атомной оптимизации как в базовой формулировке, так и в обобщённом варианте с уменьшенным числом атомов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dual form reduction in the atomic optimization method

Unidimensional optimization problems with polynomial objective function and inequality constraints are considered. For problems dual to their linear relaxations a transformation is presented that makes them compatible with the atomic optimization method, both in its basic and in the generalized form with a reduced number of atoms.

Текст научной работы на тему «Редукция двойственных форм в методе атомной оптимизации»

УДК 681.5.011 +519.853.4 ББК 32.965 + 22.19

РЕДУКЦИЯ ДВОЙСТВЕННЫХ ФОРМ В МЕТОДЕ АТОМНОЙ ОПТИМИЗАЦИИ1

Поздяев В. В.2

(Арзамасский политехнический институт (филиал) Нижегородского государственного технического университета им. Р.Е. Алексеева, Арзамас)

Рассмотрены одномерные задачи оптимизации с полиномиальной целевой функцией и ограничениями в виде полиномиальных матричных неравенств. Для задач, двойственных к их линейным релаксациям, представлен механизм преобразования к форме, совместимой с методом атомной оптимизации как в базовой формулировке, так и в обобщённом варианте с уменьшенным числом атомов.

Ключевые слова: нелинейное программирование, матричные неравенства, полиномиальные неравенства, теория моментов.

Введение

Двойственные формы задач — один из фундаментальных инструментов теории (и практики) оптимизации, действующий одновременно на нескольких уровнях. На уровне постановки задачи он позволяет давать альтернативные интерпретации, менять точку зрения на неизвестные и ограничения. На уровне вычислительных схем он интегрируется в некоторые классы алгоритмов решения: напрямую или в виде комбинированных прямых-двойственных форм.

1 Работа выполнена при частичной поддержке РФФИ (грант № 13-08-1092_а).

2 Владимир Васильевич Поздяев, кандидат физико-математических наук, доцент ([email protected]).

Метод решения задач невыпуклой оптимизации с участием полиномиальных целевых функций и полиномиальных скалярных или матричных неравенств, представленный в [4,5,7] и других работах данных авторов, сводит такие задачи к иерархиям релаксаций, имеющих вид систем линейных матричных неравенств (ЛМН) и допускающих естественную трансформацию к двойственным формам.

Атомная оптимизация — модификация данного метода, ориентированная на задачи с относительно высокой формальной сложностью (выраженной порядками полиномов, их количеством и т. д.) и относительно невысокой фактической сложностью (выраженной количеством компонент связности области поиска, характером их невыпуклости и т.д.): в первую очередь, на задачи теории управления, использующие функции Ляпунова. Базовые результаты, связанные с атомной оптимизацией, опубликованы в [1,2]; статья [3] расширяет эту технику на прямые-двойственные формы задач.

В настоящей статье представлено обобщение двойственных/прямых-двойственных форм, ассоциируемых с ЛМН-релаксациями, на случай редуцированных прямых задач (задач с количеством атомов, меньшим, нежели предписано оригинальным методом). Детально рассмотрены задачи одномерной оптимизации. Раздел 1 содержит краткие сведения о методах, составляющих фундамент построений данной статьи. В разделе 2 приводятся основные сведения о новых формах задач и их элементах. Раздел 3 описывает подход к построению данных форм. Разделы 4 и 5 содержат сведения о вычислении их ключевых элементов в исходном и редуцированном вариантах соответственно. В разделе 6 приведены примеры, демонстрирующие возможности и ограничения полученных результатов.

1. Базовые методы

Рассмотрим задачу нахождения глобальных экстремумов полиномиальной целевой функции на множестве, заданном поли-

67

номиальными матричными неравенствами:

f * = min f (x),

(1) Gi(x) > 0,

x e Rn, i = l,...,m, где f (x) и элементы матриц Gi (x) — (не обязательно выпуклые) полиномы, а знак неравенства понимается как требование положительной полуопределенности. Далее данные задачи мы будем называть задачами ПМН.

Пусть br (x), x e — вектор, состоящий из одночленов, образующих базис пространства многочленов порядка не выше r, а sn(r) = CQ+r = (П+Г)! — его размерность (в частности, для

одномерных задач br(x) = [l x x2 ... xr]T и si(r) = r + 1). Каждому одночлену из br (x) поставим в соответствие вектор а e NQ, i ai ^ r (далее будем записывать как а ^ r) показателей степеней x1, x2, ..., xn; обозначим xa = x^1 x^2 ... x^". Для произвольного вектора p e RSn(r), ассоциированного с пространством моментов x степени не выше r, будем индексировать его элементы двумя взаимозаменяемыми способами: по номеру элемента и по вектору показателей степеней; порядок элементов будем считать соответствующим структуре br (x). Таким образом, Р = [Pi]l<i<sn(r) = [Pa]aeN" a^r, в том числе pi = Р[0,0,...,0], Р2 = Р[1,0,...,0] и т. д. Аналогичным образом будем индексировать строки и столбцы матриц там, где это применимо.

Рассмотрим некоторую (неизвестную) меру ß и соответствующий ей вектор моментов у:

У = / b2k (x)dß.

Пусть = [I deg Сг(ж)], а к удовлетворяет ограничениям 2к ^ deg /(ж), к ^ йг. Пусть /а — коэффициенты /(ж) в базисе Ь2к(ж), так что

/ /(ж)й^ = /«жаф = /аУа.

^ а<2к а<2к

ЛМН-релаксацией (1) называется задача

/ * = ШШ V ¡аУа,

у —*

. . )аь

У

а<2к

мк(у) ^ 0,Ык-Л1 (Ог,у) ^ 0,

г = l,... ,т,у[о,о,...,о] = l,

где матрица моментов Мк (у) и локализующие матрицы Мк-41 (дг,у) конструируются исходя из соотношений

Мк (у) = Ьк (х)Ьк (*)ТФ,

(2)

Мк-<1(0,у)= (Ьк-а(хх)Ьк-а(х)Т) ® С(х)й^

В [5,7] детально описан механизм данных построений и показано, что с учетом некоторых непринципиальных ограничений при к ^ ж величина экстремума ЛМН-релаксации стремится к величине экстремума исходной задачи ПМН. Более того, как правило, уже при конечных (и относительно небольших) значениях к данные величины становятся равны, а вектор моментов у* решения х* задачи ПМН является решением соответствующей ЛМН-релаксации. Общее же решение ЛМН-релаксации представляет собой вектор моментов г-атомной меры3, атомы которой х*, ] = 1,... ,г, соответствуют глобальным минимумам (1). Данные атомы могут быть извлечены из у* путем решения системы полиномиальных уравнений (в которую для г-атомных мер превращается (2)) с помощью алгоритма, представленного в [4].

Предложенный в [1,2] метод атомной оптимизации переносит процедуру решения ЛМН-релаксации методом внутренней точки из пространства моментов у в пространство атомов или их конфигураций фиксированного размера. Это позволяет конструировать обобщения релаксаций, не подверженные эффекту комбинаторного взрыва при увеличении размерности задачи, порядка задействованных полиномов и порядка собственно релаксаций.

3 N-атомная мера — мера, носитель которой является множеством из N точек («атомов»).

При этом в общем случае теряются гарантии нахождения истинного глобального экстремума, но при отсутствии у задачи патологической невыпуклости качество результата зачастую остаётся приемлемым; подробности приведены в оригинальных работах.

2. Двойственные формы

Рассмотрим одномерную задачу ПМН

/ * = шт ¡(х),

X

Сг(х) > 0,

х е М, Сг(х) = аТТ(х) е Мпхп, г = 1,...,ш,

и её ЛМН-релаксацию порядка к [5]:

/* = шт/(у) = штТ /гуг,

УУ

г

(3) F(у) = Ео + ^ Ггуг > 0,

г

у [0] = 1,

где у = [уг]г=1,...,к+1 = [у[г]]г=о,...,к = [/ хЧ^]г=о,..,к — вектор моментов неизвестной меры Е (у) =

Кщр (у),Ек-Л1 (С1,у),...,Ек-Лт (Ст,у)) е Мпхп; Ек (у) и Ек-л1 (Сг, у) — матрица моментов и локализующие матрицы; дг = \2 degСг(х)~\. Соответствующие атомизированные прямая [1] и прямая-двойственная [3] формы задачи имеют вид

/ * = шт / (у(х)),

X

(4) Е(у(х)) ^ 0,

и^х = 1,

и

Ь* = ШШх^ (у(х))г, Е(у(х)) > 0,

(5) * > 0,

^х х 1,

VХАХ 2 = Ьх.

Здесь x = [xi]i=1,...,2r = [x1 ... xr p1 ... pr]T — вектор в пространстве атомов (r = k + 1 — количество атомов, xi — атомы, pi — их веса); vx = [0 ... 01 ... 1]T; v^r — матрица наибольшего ранга, ортогональная к Vx; y(x) = Еr=1 Pixjb=0,...,2fc+b Z = ZT e Rnxn — матрица двойственных переменных; z — представление Z в некотором базисе Zi симметричных матриц: Z = i Zizi. Далее мы будем считать размерность z равной количеству линейно независимых элементов Z, но отметим, что двойственное решение Z* имеет блочно-диагональную структуру, аналогичную структуре F(у); если таковым будет и начальное приближение, то при решении задачи методом внутренней точки все промежуточные аппроксимации

Z(i)

фактически будут находиться в подпространстве меньшей размерности. Кроме того, будем считать базис Zi состоящим из матриц вида

[¿ipj ]pq, i = 1, . . . , П, j = i; и [¿ip j + ¿iq ¿jp]pq, i = 2, . . . , П,

j = 1,..., i — 1 (¿ae — символ Кронекера, пара (i; j) определяет элемент базиса).

Линейные ограничения на z в (5) задаются матрицами

(6) Ax =

t^ ¿F(y(x)^ Zj

bx =

£ f <y<x»

г.?

и, в случае равенства размерностей пространств моментов и атомов, описывают подпространство, не зависящее от ж.

3. Уменьшение количества атомов

В [1] было показано, что система (4) допускает обобщение на случай, когда порядок (некоторых из) полиномов / (ж) и Сг(ж) выше, чем максимальный порядок моментов в исходной ЛМН-релаксации, или, эквивалентно, когда порядки матриц моментов и/или локализующих матриц меньше, чем минимально допустимые с точки зрения исходного метода [5] значения. Поскольку порядок матрицы моментов напрямую определяет число атомов (г = к + 1), последнее соотношение может быть проинтерпретировано как снижение количества отслеживаемых атомов.

Покажем, что для прямых форм такого вида также могут быть сконструированы двойственная/прямая-двойственная фор-

71

мы, позволяющие давать оценки качества находимых экстремумов. Основное препятствие здесь заключается в том, что у редуцированных систем подпространство [г | [и^А^ г = и^ЬХ} более не является константой по отношению к х (т. е. к положению атомов). Это приводит к появлению следующих проблем:

• понятие единственной матрицы 2, характеризующей поведение целевой функции и ограничений для системы атомов в целом, теряет смысл, поскольку окрестности разных атомов будут предписывать различные допустимые подпространства для 2;

• по мере того как вычислительный метод находит новые, улучшенные системы атомов, допустимые подпространства для 2 изменяются, что влечет необходимость коррекции 2 и, как следствие, ухудшает сходимость процесса решения двойственной подзадачи. При этом сходимость процесса решения прямой подзадачи — нахождения самих атомов — в общем случае не затрагивается; это создает препятствия применению алгоритмов, параллельно обновляющих текущие приближения х(г) и 2 (г).

Предлагаемое в данной статье решение указанных проблем основано на следующих наблюдениях. Во-первых, сколько бы глобальных экстремумов ни было у задачи, каждый из них по отдельности, будучи взят с единичным весом, образует систему атомов, являющуюся решением релаксации достаточного порядка. (Остальные решения образованы всеми возможными сочетаниями атомов-экстремумов с весами рг ^ 0, ^г Рг = 1.) Таким образом, подход к нахождению 2 должен поддерживать одноатомные системы. Логическим развитием данной идеи является использование своей матрицы 2 для каждого атома по отдельности.

Во-вторых, прямая и двойственная подзадачи могут решаться независимо; алгоритмы, осуществляющие одновременный поиск решений х* и 2*, делают это главным образом для повышения эффективности вычислений. Поскольку целью данной статьи 72

является не столько эффективность, сколько формирование принципиального подхода к нахождению двойственных решений, мы будем рассматривать конфигурации, в которых набор атомов уже эволюционировал в соответствии с вычислительными схемами из предыдущих публикаций и находится в окрестности решения прямой задачи (возможно, не глобального).

4. Линейные ограничения

Формат линейных ограничений, заданных (6), использует весь набор атомов и жёстко привязан к их количеству. Покажем, что данные ограничения могут быть преобразованы к виду, использующему лишь один атом (с единичным весом). Обозначим этот атом как жо. Тогда в векторе ж = ж(жо) единственными ненулевыми элементами являются ж? = жо и ж?+г = 1, где г — порядковый номер данного атома в г-атомной конфигурации; вектор

моментов имеет вид у0(ж0) = у(ж(ж0)) =

х

, з =0,..., + 1.

Теорема 1. Для нередуцированной прямой-двойственной формы (5) подпространство [х | г = ^Ц-Ь^} совпадает

с подпространством [х | ЛДж^х = Ьх(ж0)}, где

-Р (У0(ж0))

(7)

Аж(ж0) =

Ьс(ж0) =

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ёж?,

у

ёж;

г/(У0(ж0))

,п2

г = 1,..., 2Л, з = 1, а п —размерность вектора х.

Доказательство. По построению (см. [3]), [х | х =

} эквивалентно [х | х = }, где

=

Ьу =

ёУ[г]

/ (У)

р(у) я.

иу = [10 ... 0],

г = 0,..., 2к + 1, з = 1,...,иг.

Напомним, что целью левого умножения на и^ является исключение первых строк из данных матриц. Последние же их строки равны 0 в силу того, что момент у2к+1 имеет формальное предназначение и не встречается в Е(у) и /(у). Таким образом, нужное нам подпространство задается подматрицами, образованными строками 2,..., 2к + 1: (Ау )2...2к+1,* и (Ьу Ь...2к+ь

Пусть хо = 0. Тогда, поскольку каждая пара соответствующих элементов /(у) и /(уо(х)) имеет вид

(/(у))г = соу[о] + С1у[1] + С2у[2] + ...,

(/(уо(х)))г = со + С1х + С2х2 + ..., для некоторого набора коэффициентов ст мы видим, что

ах/ (уо(х)

/(у).

х=о йу[г]

Следовательно, Ьх(0) отличается от (Ьу)2...2к+1 лишь левым умножением на матрицу diag(l!, 2!, 3!,...). Чуть более сложно, но в целом аналогично доказывается то же соотношение для матриц Ах(0) и (Ау)2...2к+1,*, откуда следует утверждение теоремы для хо = 0.

Пусть теперь хо = 0. Поскольку элементы /(уо(х)) — полиномы порядка не выше 2к, то

ах/ (уо(х)

2к т-г л'

х—хо т—г

х=о

откуда следует, что Ьх(хо) отличается от Ьх(0) лишь левым умножением на невырожденную квадратную матрицу (верхнюю треугольную с единичной диагональю). То же соотношение может быть аналогичным образом продемонстрировано для матриц Ах(хо) и Ах(0), откуда следует утверждение теоремы для любых хо. 74

Если xo является глобальным экстремумом исходной задачи, то мера, описываемая моментами yo(xo), является частным (вырожденным) случаем r-атомной меры с носителем в виде множества глобальных экстремумов. Тогда форма (5) может быть превращена в обычную двойственную задачу заменой F(y(x)) на F(yo(xo)). Более того, если вместо такого x0 мы возьмём точку x0, не являющуюся глобальным экстремумом, целевая функция tr F(yo(x'o))Z будет (с учётом линейных ограничений двойственной задачи) отличаться от tr F(y0(x0))Z на

(8) tr (F(yo(x0)) - F(yo(xo))) Z =

= ^2(Vo(x'o) - yo(xo))i tr FiZ =

i

= ^2(yo(x'o) - yo(xo))ifi = const(Z).

i

Таким образом, при фиксированных линейных ограничениях на Z решение Z новой вариации задачи (5) не зависит от x0; изменяется лишь итоговое значение целевой функции, которое может быть равно 0 только если x0 совпадает с одним из глобальных экстремумов исходной задачи.

Ценность данных результатов определяется двумя факторами. Во-первых, мы получаем возможность выделить в наборе атомов наиболее подходящих кандидатов на роль глобальных экстремумов и дать им индивидуальные оценки качества в виде интервалов двойственности. Во-вторых, теорема 1 допускает естественное обобщение на случай редуцированных прямых-двойственных форм (см. следующий раздел). При этом формулы для нахождения элементов Ax и bx остаются идентичными, меняются лишь размеры матриц.

5. Понижение порядка

Рассмотрим полную и редуцированную прямые-двойственные формы одной и той же задачи. Сохраним для полной формы использованные выше обозначения, а для редуцированной формы обозначим количество атомов как r' < r,

порядок релаксации как к' < к, а также зададим такие й' (уже не связанные напрямую с порядками полиномов в С?(ж)), что

к' - 4 < к - йг.

Пусть ж0 — анализируемый кандидат на точку глобального экстремума. Модифицируем исходную задачу так, чтобы сохранить в ж0 локальные характеристики целевой функции и ограничений, и при этом уменьшить порядок задействованных полиномов до такой степени, чтобы редуцированная форма стала полной для новой задачи. Для этого заменим / (ж) и Сг(ж) на соответствующего порядка фрагменты их разложений в ряд Тейлора в окрестности ж0. Система (5) станет обычной двойственной формой и примет вид

д* = шш^' Р'(у0 (ж0))^', (9) г' ^ 0,

АХ(ж0 )х' = ЬХ (ж0). Здесь г' и х' связаны аналогично г и х; Р '(у) = diag(Ffc'(у),Рк'-^(Сьу),...,^'-^(Ст,у)); АХ(ж0) и ЬХ(ж0) находятся из (7) с учётом новых порядков. Как показывает следующее утверждение, линейные ограничения в (9) тесно связаны с аналогичными ограничениями нередуцированной задачи.

Утверждение 1. АХ(ж0) и Ъ'х(ж0) являются подматрицами Ах(ж0) и Ьх(ж0). Они образованы первыми 2к' строками; столбцы АХ(ж0) представлены теми столбцами Ах(ж0), для которых скалярное умножение на (при формировании АХ(ж0)) выделяет из Р'(у) те же элементы, что и скалярное умножение Р(у) на (при формировании АХ(ж0)).

Доказательство. Утверждение следует из структуры (7) и того, что, с точностью до исключённых из рядов Тейлора слагаемых (не участвующих в АХ(ж0) и ЬХ(ж0)), матрицы Р^ (у) и Рк'-^ (Сг, у) являются подматрицами Рд,(у) и Р^. (С?, у), а значит, Р'(у) является подматрицей Р(у).

Если в исходной и редуцированной задачах имеет место сильная двойственность, а точка ж0 является в них глобальным минимумом, обе они приведут к обнаружению нулевого интервала двойственности (^Р(у0(ж0))г и trР'(у0(ж0))г', соответ-76

ственно). Условия, при которых глобальный экстремум исходной формы является таковым и для редуцированной формы, представляются нетривиальными. Тем не менее мы можем констатировать, что для каждой задачи существует такое значение т" ^ т, что при Т ^ т" глобальный экстремум будет корректно детектирован прямой-двойственной формой.

6. Примеры

6.1. БАЗОВЫЙ ПРИМЕР

Рассмотрим пример, ранее приведённый в [1]:

/•* • 2 / = шт х ,

X

д\(х) = —2х4 + 4х2 - 1 ^ 0.

Графики /(х) и д1(х) изображены на рис. 1. Неравенство д1 (х) ^ 0 задаёт область поиска в виде двух отрезков, на которых / (х)

имеет по одному локальному минимуму в точках 1 — /2/2 ~ ±0,5412 соответственно.

Рис. 1. Графики / (х) и д1(х)

Построим трансформированную прямую-двойственную форму ЛМН-релаксации данной задачи. Как и в оригинальной работе, размеры матриц в ЛМН-релаксации определяются параметрами й1 = \\ degд1(х)] =2 и к ^ шах{ 1 deg /(х),й1} = 2.

77

Для минимального порядка к = 2 (и г = к + 1 = 3) соответствующая ЛМН-релаксация (3) имеет вид

/ * = шт сту,

У

Р(у) =

^У"у = 1

у[0] у[1] у[2]

у[1] у[2] у[3]

у[2] у[3] у[4]

0 0 0

^ 0,

у = [у[0] у[1] у[2] у[з] у[4] у [5]] т , с = [0 0 1 0 0 0]т ,

^у = [1 0 0 0 0 0]т .

Воспользуемся той же трансформацией пространства поиска, что и ранее:

г

уЬ1 = ^Р?ж-, 3 =0,1,..., 2к + 1,

г=1

где ж? и Рг — новые неизвестные, составляющие вектор

ж = [ж1 ж2 . . . жг Р1 Р2 ... Рг]Т .

Тогда

(10) Р (у(ж)) =

з

Е3=1 Рг ...

0 ... Е3=1 Ргд1(ж')

г — симметричная матрица 4 х 4; = [0 0 0 1 1 1]т; в качестве ^ можно взять матрицу

1 0 0 0 0 0

0 1 0 0 0 0

(11) ^ = 0 0 1 0 0 0

0 0 0 10 -1

^ 0 0 0 0 1 -1

0

Как было продемонстрировано в [1,3], при использовании приведенного в данных работах метода атомы сходятся к экстрему-

мам ±л/1 — \/2/2. Подставив набор

атомов х1

= — л/ 1 — у/2/2,

х2 = — /2/2, хз = 0, Р1 = р2 = 1/2, рз = 0 в (10), (6) и далее, вместе с (11), в форму (5), приходим к двойственной задаче, решение которой имеет вид

2

0,0607 0,0000

0,0000 0,0000

0,2071 0,0000

0,0000 0,0000

0,2071 0,0000

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,0000 0,0000

0,7071 0,0000

0,0000 0,3536

^ 0.

Оценим теперь данные экстремумы с помощью результатов, полученных в настоящей статье. Возьмем в качестве кандидата

на экстремум точку хо = задачи имеем, с учетом (7):

1 — у/2/2. Для нередуцированной

Ах(хо)

Р(Уо(хо))

0 2,0 00 00 00

1,0000 0,5412 0,5412 0,2929 0,2929 0,1585 00

0,2929 0,1585 0,0858 0

2,2

4,0 0 0

1,1 2,0 0 0

1,8 6,5 12,0 0

0,6 3,5 13,0 24,0

0 0 0 0

0 3,1

0 1,0

0 —26,0

0 —48,0

Ъх/хо) ~ [ 1,1 2,0 0 0 J

Подставив данные матрицы в (5) и решив полученную двойственную задачу, мы получим матрицу 2, идентичную приведённой выше.

Проделаем теперь те же операции для редуцированной задачи с к = 1. Получим:

Р '(Уо(хо))

1,0000 0,5412 0

0,5412 0 0,2929 0 00

0 2,0 0 1,1 0 3,1 0 0 0 2,0 0 1,0

(x0)

1,1 2,0

Решение соответствующей задачи (9) имеет вид

Z'

0,2426 -0,4483 0,0000 -0,4483 0,8284 0,0000 -0,0000 0,0000 0,3536

tr F'Ztt 0.

Таким образом, жо является также экстремумом согласно редуцированной схеме.

Заметим, что, в силу параллелей между двойственными задачами и условиями Каруша-Куна-Таккера, которые в данном случае вырождаются в метод множителей Лагранжа, нижние правые элементы матриц Z и Z' (соответствующие ограничению gl (ж) = 0) равны множителю Лагранжа Л в задаче

f * = min f (ж),

X

gi(x) = 0 с функцией Лагранжа f (ж) + Лg1(ж).

6.2. ОБНАРУЖЕНИЕ ЛОКАЛЬНЫХ ЭКСТРЕМУМОВ Изменим целевую функцию:

f * = min (ж - 1/10)2,

X

gl (ж) = -2ж4 + 4ж2 - 1 ^ 0.

Точка ж0 = 1 - ^2/2 по-прежнему является глобальным экстремумом данной задачи, но -ж0 теперь — ложный экстремум.

Проделывая вычисления, аналогичные предыдущему примеру, мы получаем следующие результаты.

• Нередуцированная форма (5) корректно определяет глобальный экстремум, демонстрируя нулевой интервал двойственности в ж0 и ненулевой — в -ж0.

• Редуцированная форма (9) приводит к нулевому интервалу двойственности в обоих точках. Таким образом, в данном случае редуцированная форма может использоваться для определения качества нахождения каждого из экстремумов (степени близости текущей аппроксимации к /(±ж0)), но не для определения того, является ли он глобальным. Последнее нуждается в нахождении обеих точек и прямом сравнении соответствующих значений целевой функции.

6.3. ОГРАНИЧЕНИЯ РЕДУКЦИИ

Продемонстрируем теперь ситуацию, когда возможности редуцированных форм более ограничены. Усложним целевую функцию задачи, заменив её на полином, подобранный так, чтобы изменить знак второй производной в окрестности решения, сохранив само решение задачи:

/* = шт ж2 - 6/5ж4 + ж6/2,

X

ш (ж) = -2ж4 + 4ж2 - 1 ^ 0. Графики /(ж) и (ж) приведены на рис. 2. Глобальные экстре-

мумы, как и в первом примере, находятся в ±л 1 - л/2/2.

Рис. 2. Графики /(ж) и д1(ж)

Особенностью данной задачи является то, что для её решения методом моментов необходима ЛМН-релаксация существенно более высокого порядка, чем в предыдущих

81

примерах. Минимально допустимый порядок равен k = max{|" 1 deg f(ж)], |2degg1(x)]} = 3, но даже его недостаточно, в чём можно убедиться, попытавшись решить задачу с помощью GloptiPoly [6]:

mpol x 1

f = хЛ2-1.2*хЛ4+хЛ6/2 g1 = -2*хЛ4+4*хЛ2-1 P = msdp(min(f), [g1>=0]) % *** [status, obj] = msol(P) double(x)

Данный код приводит к сообщению о невозможности извлечения глобальных экстремумов. Решение становится доступным, только если увеличить порядок релаксации на единицу, заменив строку, помеченную «***», на «Р = msdp(min(f), [g1>=0], 4)». Структура матрицы F (y) G R8x8 в этом случае является блочно-диагональной с блоками F4(y) G R5x5 и F2(gi,y) G R3x3.

Проверим с помощью двойственных форм точку Хо =

\ 1 -у/2/2 на экстремальность. Подстановка уо(хо) в базовую форму (5) приводит к решению Z G R8x8, также состоящему из блоков 5 х 5 и 3 х 3. (Мы не приводим значения Z, а также Ax е R и bx G R ввиду их размеров.) Соответствующий интервал двойственности tr FZ к 0, так что проверка Хо на экстремальность пройдена.

Если мы попытаемся произвести редукцию двойственной формы, понизив значение k, то ближайшая комбинация порядков будет иметь вид k! = 3, k! — dl = 2, а соответствующая матрица F'(y0(x0)) G R7x7 будет состоять из блоков F3(у) G R4x4 и F2(gi,y) G R3x3 (кроме того, A'x G R6x28 и b'x G R6). Решение редуцированной задачи (9) в данном случае также даёт tr F'Z' к 0 и таким образом проходит проверку.

Дальнейшая редукция задачи сопровождается переменным успехом. Некоторые из комбинаций kk и dl приводят к нулевому, некоторые — к существенно ненулевому значению целевой функ-

ции ^ ^' Z', а для некоторых задача не имеет решения. Причину такого эффекта можно наглядно продемонстрировать на примере редукции до к = 1. Согласно описанной в разделе 5 процедуре, это преобразование эквивалентно замене /(ж) и #1 (ж) на их аппроксимации порядка 2 в окрестности жо. Данные аппроксимации изображены на рис. 3. Мы видим, что в задаче с такими полиномами целевая функция неограниченно убывает при ж ^ —то,

при этом значения ж < — ^ 17 + 23/-^2 ~ —5,7674 являются допустимыми. Таким образом, экстремум модифицированной прямой задачи неограничен, а двойственная задача, соответственно, неразрешима.

Рис. 3. Аппроксимации /(ж) и #1 (ж) в окрестности ж0 ~ 0,54

7. Заключение

В статье продемонстрировано применение метода атомной оптимизации для получения редуцированных двойственных форм ЛМН-релаксаций в одномерных задачах невыпуклого программирования. Данный результат позволяет в ряде случаев давать глобальные или локальные оценки качества найденных экстремумов в виде интервалов двойственности. В дальнейшем предполагается распространение данной техники на многомерные задачи, а также определение допустимых степеней редукции в зависимости от класса задачи.

Литература

1. ПОЗДЯЕВ В.В. Атомная оптимизация, часть 1: трансформация пространства поиска и одномерные задачи // Управление большими системами. - 2011. - №36. - С. 3980.

2. ПОЗДЯЕВ В.В. Атомная оптимизация, часть 2: многомерные задачи и полиномиальные матричные неравенства // Управление большими системами. - 2013. - №43. -С. 95-123.

3. ПОЗДЯЕВ В.В. Прямые и двойственные формы в методе атомной оптимизации для одномерных задач // Динамика сложных систем — XXI век. - 2014. - №1. - С. 53-58.

4. HENRION D., LASSERRE J.-B. Detecting global optimality and extracting solutions in GloptiPoly // Positive polynomials in control. - 2005. - P. 1-18.

5. HENRION D., LASSERRE J.-B. Convergent relaxations of polynomial matrix inequalities and static output feedback // IEEE Trans. Automatic Control. - 2006. - Vol. 51, №2. -P. 192-202.

6. HENRION D., LASSERRE J.-B., LOFBERG J. GloptiPoly 3: moments, optimization and semidefinite programming // Optimization Methods and Software. - 2009. - Vol. 24, №45. - P. 761-779.

7. LASSERRE J.-B. Global optimization with polynomials and the problem of moments // SIAM J. on Optimization. - 2001. -Vol. 11, №3. - P. 796-817.

DUAL FORM REDUCTION IN THE ATOMIC OPTIMIZATION METHOD

Vladimir Pozdyayev, Arzamas Polytechnical Institute of R.E. Alekseev Nizhny Novgorod State Technical University, Arzamas, Cand.Sc., associate professor ([email protected]).

Abstract: Unidimensional optimization problems with polynomial objective function and inequality constraints are considered. For problems dual to their linear relaxations a transformation is presented that makes them compatible with the atomic optimization method, both in its basic and in the generalized form with a reduced number ofatoms.

Keywords: nonlinear programming, matrix inequalities, polynomial inequalities, moment theory.

Статья представлена к публикации членом редакционной коллегии П.С. Щербаковым

Поступила в редакцию 05.10.2014. Дата опубликования 31.03.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.