УДК 517.977.1 ББК 22.18
АППРОКСИМАЦИИ МАТРИЧНОЙ /д-КВАЗИНОРМЫ
ПРИ СИНТЕЗЕ РАЗРЕЖЕННЫХ РЕГУЛЯТОРОВ: ЧИСЛЕННЫЕ ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ1
Быков А. В.2
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва) Щербаков П. С.3
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, ФИЦ «Информатика и управление», ИСА РАН, Москва)
Рассмотрены различные способы аппроксимации числа ненулевых строк матрицы для получения разреженных регуляторов в задачах оптимального управления линейными системами. Наряду с популярным подходом, основанным на использовании матричной 11-нормы, применяются более сложные невыпуклые приближения, минимизация которых требует специальных вычислительных процедур. Сравнение эффективности разных аппроксимаций происходит в рамках численного моделирования.
Ключевые слова: разреженные регуляторы, ¿1-оптимизация, линейные системы, оптимальное управление, линейные матричные неравенства.
1 Работа поддержана Российским научным фондом, проект 16-11-10015.
2 Алексей Витальевич Быков, аспирант, (alexey. [email protected]).
3 Павел Сергеевич Щербаков, доктор физико-математических наук, ([email protected]).
Управление большими системами. Выпуск 68 Введение
В задачах оптимального управления линейными системами помимо оптимизации целевого функционала могут возникать требования к структуре получаемого регулятора, например, требование разреженности регулятора [14, 15, 16, 22]. Под разреженностью понимается, как правило, наличие нулевых элементов в матрице усиления регулятора, построенного, например, в форме статической линейной обратной связи по состоянию. Наличие такой поэлементной или блочной разреженности позволяет строить распределенные системы с децентрализованным управлением. Естественно, дополнительное требование к структуре матрицы регулятора неизбежно ухудшает качество управления, так как таким образом сужается множество допустимых регуляторов, на котором происходит минимизация целевого функционала. Тем не менее в некоторых задачах разумный проигрыш в значении критерия качества может считаться допустимым. Так, в задаче о линейно-квадратичном регуляторе в роли целевого функционала выступает квадратичный критерий, связанный с расходом энергии в системе, например, топлива для летательного аппарата. Разреженное управление с одной стороны ухудшает значение критерия, увеличивая расход энергии, с другой - придает системе различные полезные свойства. Например, децентрализация управления делает систему более надежной, устойчивой к отказам элементов системы, уменьшение количества используемых приводов позволяет снизить износ управляющих элементов, тем самым увеличив срок службы системы.
Отличная от поэлементной разреженности структура рассмотрена в работе [17] (см. также [1] - ее русскоязычную версию): разреженным называют регулятор с большим числом нулевых строк или столбцов в матрице усиления. Такие регуляторы позволяют снизить требования к аппаратной реализации систем управления, иными словами, уменьшить число используемых приводов, сенсоров, каналов передачи данных. Непосредственная минимизация числа ненулевых строк или столбцов мат-
рицы - задача, решаемая только с помощью перебора всевозможных комбинаций априори обнуляемых строк или столбцов и вычисления значения целевого функционала. С увеличением размерности такой метод становится неприемлемым из-за экспоненциальной асимптотической сложности решения в смысле времени работы алгоритма. В [1, 17] был предложен подход, в основе которого лежит замена исходной невыпуклой задачи ее выпуклым приближением путем введения специальных матричных норм, выступающих в роли выпуклых приближений исходных невыпуклых матричных ¿о-квазинорм (числа ненулевых строк/столбцов). Использование выпуклых аппроксимаций, однако, не гарантирует получение нулевых строк в матрице регулятора, и, по всей видимости, сформулировать строгие теоретические результаты не удастся ввиду невыпуклости исходной задачи. Тем не менее в пользу применения подхода представлены эвристические соображения, а также приводится ряд численных примеров, подтверждающих работоспособность метода. Компьютерное моделирование является, пожалуй, одним из основных способов проверки эффективности подобных нестрогих подходов, поэтому и в данной работе акцент делается на численном эксперименте.
Кроме выпуклых аппроксимаций, в литературе предлагаются невыпуклые приближения, которые позволяют в некотором смысле более эффективно получать векторные и матричные разреженные представления [6, 7, 8, 15].
Целью данной работы является сравнение между собой различных по своей природе приближений матричной 1о-квазинормы, которые могут быть использованы для синтеза разреженных регуляторов в задачах оптимального управления. Приводится обобщенная схема достижения компромисса между оптимальностью и разреженностью, позволяющая единообразно применять разные аппроксимации.
Центральными моментами статьи являются адаптация различных приближений матричной ¿о-квазинормы для достижения матричной строчной разреженности, описание схемы численного эксперимента, а также сравнительный анализ результатов чис-
ленной апробации. В ходе эксперимента решались как тестовые задачи, так и линеаризованные модели реальных систем, применялись различные вычислительные средства [9, 18, 19], были адаптированы алгоритмы невыпуклой оптимизации [7, 21].
В работе акцент сделан на численном эксперименте в силу следующей причины. Несмотря на то, что утверждения о работоспособности предлагаемых методов подкреплены обоснованной эвристикой, эти утверждения не вполне конструктивны: можно лишь надеяться на наличие нулевых строк в матрице регулятора. Поэтому разные методы на практике могут иметь разную эффективность для различных задач; эффективность этих методов как раз и является предметом исследования в данной работе.
Работа во многом задействует аппарат линейных матричных неравенств (англ. LMI - Linear Matrix Inequalities) [5], позволяющий формулировать многие задачи теории управления в виде задач полуопределенного программирования (англ. SDP -SemiDefinite Programming) [20].
1. Синтез разреженных регуляторов в задачах оптимального управления
Рассмотрим классическую постановку задачи синтеза оптимального стабилизирующего управления в линейных системах. Пусть исследуемая система описывается обыкновенным дифференциальным уравнением и начальным условием: (1) х = Ах + Ви, х(0) = хо,
где x(t) £ Мга - вектор состояния, u(t) £ W - управление, А £ Мгахга, В £ RnxP, пара (А, В) управляема.
Если матрица А не является гурвицевой, то система (1) неустойчива, поэтому управление должно стабилизировать систему. Кроме того, регулятор, как правило, должен минимизировать некоторый целевой функционал на траекториях замкнутой системы. Существуют разные постановки, отличающиеся видом синтезируемого управления; для простоты будем строить управление в форме статической линейной обратной связи по состоя-
нию:
(2)
и — Кх, К е Мрхп
Далее будем рассматривать задачу синтеза линейно-квадратичного регулятора, при этом отметим, что численный эксперимент, равно как и лежащий в его основе подход к достижению разреженности, могут быть легко перенесены на случай других задач оптимального управления. В задаче синтеза ЬрЯ-регулятора целевой функционал - квадратичный критерий качества - выглядит следующим образом:
где К е Мпхп и Б е Мрхр - заданные положительно определенные матрицы.
Отметим следующий факт: требование минимизации функционала (3) автоматически влечет за собой стабилизацию системы (1). Действительно, неустойчивость замкнутой системы приводила бы к расходимости интеграла (3), а так как пара (А, В) управляема, то существует стабилизирующий регулятор, для которого функционал ■] принимает конечное значение.
Классический способ решения задачи синтеза ЬрЯ-регулятора заключается в нахождении решения алгебраического уравнения Риккати, однако здесь мы будем придерживаться другого подхода (см., например, [3]), основанного на применении аппарата линейных матричных неравенств. В [3] показано, что ЬрЯ-регулятор можно искать как решение следующей задачи полуопределенного программирования:
Задача 1. Пусть Рорг, Уорг - решение задачи
те
(3)
о
^ Р
тах
при ограничении
(4)
Р УТ Е-1 0 * -5-1
тогда регулятор (2) с матрицей
(5) Корг — Уор&Рор1
стабилизирует систему (1), минимизируя при этом функционал (3), оптимальное значение которого определяется выражением
(6) 0'орь = РорьНе-
описанный подход бывает полезен, когда одним уравнением Риккати не обойтись, например, при решении робастной линейно-квадратичной задачи, когда в матрицах системы присутствует неопределенность. Что более важно для данной работы, именно ЬМ1-подход удобно использовать для синтеза разреженного управления.
Разреженная вариация данной постановки подразумевает дополнительное требование к структуре матрицы регулятора, а именно желание получить как можно больше нулевых строк в матрице К, не сильно проиграв при этом в критерии качества оптимальному регулятору. Проигрыш возникает из-за того, что задавая определенную нулевую структуру матрицы К, мы по сути сужаем область допустимых регуляторов, на которой происходит минимизация функционала (3).
Вопрос сравнения регуляторов по квадратичному критерию качества нетривиален и подробно рассмотрен в [4]. Это связано с тем, что при сравнении значений функционала Р(Р) = х°Р-1х, соответствующих разным стабилизирующим регуляторам К1 и К2 с матрицами Р1 и Р2 соответственно, знак неравенства Р(Р1) ^ Р(Р2) может меняться при изменении начального условия ж0. В данной работе, однако, нам будет необходимо сравнивать разреженные регуляторы с оптимальным, т.е. придающим наилучшее значение функционалу Р для любого начального условия жо. Иными словами, разреженный регулятор с матрицей Рвр всегда будет уступать оптимальному с матрицей Рорй величина проигрыша для конкретного начального условия хо определяется отношением
■^вр % Ррр Но
орЬ Хо Р(рр1 Хо
значение которого, опять же, может значительно варьироваться для разных жд.
Хорошо известен подход [13], основанный на усреднении значений функционала по начальным условиям, равномерно распределенным по поверхности единичной п-мерной сферы. Нетрудно показать, что математическое ожидание значения функционала 3 в таком случае равно
Е(х1р-1Х0 ) _ ^г Р -1; п
тогда величина проигрыша разреженного управления оптимальному «в среднем» равна
т +г Р-1
(7) " яр _ ^ вр
ЗорЬ tг Р-
В данной работе мы будем судить о величине проигрыша разреженного регулятора оптимальному именно «в среднем», т.е. пользоваться соотношением (7).
В работе [1] предложена схема, позволяющая строить разреженные регуляторы в задачах оптимального управления, в частности, в задаче ЬрЯ. На ключевом шаге для обнаружения нулевых строк в матрице регулятора предлагается минимизировать 1те-норму, выступающую в роли выпуклого приближения числа ненулевых строк матрицы, т.е. невыпуклой матричной ¿о-квазинормы. Матричная 1те-норма определяется следующим образом:
п
(8) н* н^ _ Ета*^-1,х е мпхр-
г=1
Трехшаговая схема из [1], обобщенная на случай произвольной аппроксимации матричной ¿о-квазинормы, была взята за основу в численном эксперименте в данной работе, поэтому опишем ее ключевые моменты.
Шаг 1 (поиск оптимального регулятора). Решаем классическую задачу синтеза ЬрЯ-регулятора (задачу 1) и фиксируем величину ^ Р—1, характеризующую оптимальное значение Л^.
Шаг 2 (обнаружение разреженной структуры). Допустим, что добиваясь разреженности регулятора, мы готовы проиграть в значении критерия оптимальности в среднем не больше чем
в а раз, т.е. хотим гарантировать выполнение следующего условия:
PSP
-^ а, а > 1.
tr Popt
Таким образом, а - коэффициент допустимой потери в качестве управления, который является параметром в следующей задаче SDP:
Задача 2.
||Y II (ар) ^ min
при ограничениях (4),
(9) ^ ^ 0, и trX ^ а tr P-p.
Заметим, что, как и в задаче 1, матрица регулятора К явным образом не входит в ограничения или минимизируемый функционал. Переменными же являются положительно определенные матричные переменные P и X, а также вспомогательная матричная переменная Y = KP, введение которой обусловлено желанием привести ограничения в задаче к виду линейных матричных неравенств.
Минимизируемая величина в задаче 2, обозначенная ||-||(sp), играет роль приближения матричной Iq-квазинормы. 1те-норма-одно из таких приближений - позволяет вместо невыпуклой задачи минимизации числа ненулевых строк решать выпуклую задачу. Возможны и другие, более сложные и вместе с тем более эффективные, аппроксимации, речь о которых пойдет в следующем разделе.
Пусть матрица YQ - решение задачи 2, в которой мы обнаружили малые (близкие к нулевым) строки. Зафиксируем эти строки как нулевые, гарантируя при этом, что и в матрице усиления регулятора Ко = YQP-1 будут те же нулевые строки. Последний факт следует из правил матричного умножения. Значение целевого функционала в среднем не превышает (y,Popt.
Шаг 3 (дооптимизация). Снова решаем задачу синтеза LQR-регулятора, только уже с полученной на Шаге 2 нулевой
структурой матрицы регулятора. Иными словами, решаем задачу 1 с дополнительными ограничениями на элементы матричной переменной Y.
Подводим итог: следуя описанному алгоритму, можно построить регулятор, который, вероятно, обладает разреженной структурой и при этом не сильно уступает оптимальному с точки зрения качества управления; таким образом достигается компромисс между разреженностью и оптимальностью.
2. Аппроксимации матричной h,-квазинормы
Итак, ключевым шагом в процессе синтеза разреженных регуляторов является обнаружение нулевых строк в матрице усиления. Для этого осуществляется минимизация некоторой величины, аппроксимирующей число ненулевых строк матрицы.
Далее мы рассмотрим четыре различных аппроксимации матричной lo-квазинормы, эффективность применения которых сравним на численных примерах. Все аппроксимации будут выражены как функции от г% - величин, характеризующих величину значений в строке с номером г. Если рассматривать строку матрицы как вектор, то в качестве г i могут выступать различные нормы вектора, например, l1-, l2-, loo -норма. Строка называется нулевой, если все ее элементы нулевые, поэтому, устремляя любую из указанных норм к нулю, мы неизбежно зануляем все ее элементы. Численные эксперименты подтверждают, что выбор конкретной нормы для г i непринципиален; мы остановимся на loo -норме, которая по сути является максимумом среди абсолютных значений элементов вектора. Таким образом, вводим обозначение
(10) гг = max lyij|, Y = \\угз \\ е Mpxn
l^j^n
2.1. 1ж-НОРМА
Предложенная в работе [1] и уже упомянутая в предыдущем разделе 1те-норма (8) в терминах ri, определенных в (10), выглядит следующим образом:
(11) \\Y\\i^ = £ ri.
i=1
Эта норма является выпуклой, поэтому ее минимизация при ограничениях (4), (9) - задача SDP, эффективно решаемая средствами выпуклой оптимизации [20].
2.2. ВЗВЕШЕННАЯ 1 ж-НОРМА
В работе [7], развивая идеи Ii-оптимизации для достижения разреженности в векторном случае, авторы предлагают новый алгоритм, который заключается в решении последовательности задач взвешенной Ii -минимизации. На каждой итерации алгоритма происходит переоценка используемых весовых коэффициентов, исходя из решения, полученного на текущем шаге. С учетом весовых коэффициентов ¿i-норма выглядит следующим образом:
(12) Ii y =
г=1
Адаптируя алгоритм из [7] для решения задачи 2, получаем следующую итеративную процедуру: Алгоритм 1.
1) Начальная точка: I = 0, w(0) = 1, i = 1,... ,р.
2) Решаем выпуклую задачу с заданными весами:
p
(I) W- Vi
r(l) = arg min
Е
,i= 1
при ограничениях (4), (9).
3) Обновляем значения весов:
= —-, £ > 0.
* | г7°|
4) Выходим из цикла, если алгоритм сошелся или достигнуто максимальное число итераций. Иначе увеличиваем I и переходим к пункту 2.
Авторы оригинальной статьи [7] в ряде численных экспериментов подтверждают существенно большую эффективность подхода со взвешенной 1\ -минимизацией по сравнению с классической ¿1-минимизацией. Решая последовательность выпуклых задач, авторы находят решение задачи невыпуклой, 56
что, по-видимому, позволяет более точно аппроксимировать Iq -квазинорму.
2.3. НЕВЫПУКЛЫЙ ДЕТЕКТОР РАЗРЕЖЕННОСТИ - NSD
В работе [6] для обнаружения разреженности предложено использовать следующую невыпуклую функцию:
(13) г unsd = £ ^^ П Дт.
i=l j=i 3
Авторы предлагают эвристические соображения относительно целесообразности использования такой аппроксимации, а также демонстрируют на численных примерах ее большую эффективность по сравнению с 1те-нормой.
В этой же работе показано, что функция (13) является DC-функцией (англ. Difference of Convex) [10], а для ее минимизации предлагается использовать вогнуто-выпуклую процедуру (англ. Concave-Convex Procedure, CCCP) [21].
Пусть функция (13) представима в виде DC-функции: NSD(r) = U(г) — V(г). Тогда алгоритм ее минимизации будет выглядеть следующим образом: Алгоритм 2.
1) Начальная точка: I = 0, r(0) = max 1, г = 1,... ,р, где
Yopt = \\yij || - решение задачи 1.
2) Решаем выпуклую задачу:
r(l+1) = arg min U(г) - rTW
при ограничениях (4), (9).
3) Выходим из цикла, если алгоритм сошелся или достигнуто максимальное число итераций. Иначе увеличиваем I и переходим к пункту 2.
В работе [11] получены некоторые результаты относительно сходимости CCCP; в общем случае результатов о глобальной сходимости в силу невыпуклости получить не удается. Однако
57
на практике метод, как правило, позволяет достигать требуемого результата.
2.4. НЕВЫПУКЛАЯ АППРОКСИМАЦИЯ log-sum
В ряде работ было показано [7, 8, 15], что log-sum функция (см. определение ниже) способна более точно приближать Iо-норму вектора. Действительно, рассмотрим следующие функции скалярного аргумента (рис. 1), выступающих в роли функции штрафа ненулевых значений:
Ы
fo(x) = 1[х=0], fl(x) = |x|, flog,e(x) = Cs log (l + —), константа пропорциональности функции Ce выбирается так, чтобы выполнялось равенство fiog)£(1) = 1 = fo(1) = fi (1).
Рис. 1. Аппроксимации 10-квазинормы
Производная функции fiog)£(x) в положительной окрестности нуля растет приблизительно как функция 1 при е —> 0. Это позволяет устанавливать относительно большие значения штрафа для малых, но в то же время ненулевых значений. Более того, можно заметить, что fiog)£(x) —> fo(x) при е —> 0. К сожалению, при уменьшении до малых значений минимизация функции log-sum становится затруднительной; эвристика выбора е предложена в [7]. 58
о
Адаптируя функцию log-sum для случая строчной матричной разреженности, получим следующую аппроксимацию:
р
В силу вогнутости функции (14) ее нельзя минимизировать средствами выпуклой оптимизации. Однако она представляет собой частный случай DC-функции, что позволяет применять для нее тот же алгоритм, что и для NSD - вогнуто-выпуклую процедуру (CCCP).
3. Результаты численных экспериментов
В предыдущем разделе были описаны некоторые известные и новые аппроксимации числа ненулевых строк матрицы. В их число входят уже встречавшаяся ранее в литературе 1те-норма [1], а также предложенная авторами в работе [6] аппроксимация NSD. Оба приближения, однако, не прошли достаточной численной апробации, что и сделало их претендентами на включение в численный эксперимент. Кроме того, для поиска нулевых строк в матрице были адаптированы две другие аппроксимации (взвешенная i -норма вектора и функция log-sum), которые ранее применялись для векторов. Все эти приближения использовались на шаге 2 схемы синтеза разреженных регуляторов при проведении численного эксперимента в данной работе.
Все примеры решались в среде моделирования Matlab с помощью пакета для решения задач выпуклой оптимизации cvx [9] и решателя SDPT3 [19]. Использование других решателей, например, SeDuMi [18], не выявило каких-либо существенных преимуществ или недостатков.
Основной целью моделирования была проверка эффективности применения аппроксимаций (11), (12), (13), (14) для получения матриц Y0 с нулевыми строками на шаге 2 (а следовательно, и строчно-разреженных матриц регулятора) в задачах оптимального управления на примере задачи синтеза LQR-регулятора. В ходе моделирования рассматривались как модельные задачи, так и ли-
(14)
неаризованные модели реальных систем, взятых из СОЫР1егЬ -свободно распространяемой библиотеки тестовых задач управления [12]. Общая схема проведения численного эксперимента может быть описана следующим алгоритмом: Алгоритм 3 (схема эксперимента).
1) Решаем классическую задачу синтеза LQR-регулятора (за-
Э-1
opt
дачу 1) и фиксируем величину tr Р^Л, характеризующую
оптимальное значение Jopt.
2) Устанавливаем начальное значение допустимой величины проигрыша в качестве управления amin = 1 + е, е > 0.
3) Увеличивая в цикле значение а до тех пор, пока не получим максимально разреженное управление, выполняем следующие шаги:
а) Решаем задачу обнаружения нулевых строк (задачу 2) с выбранным значением а. Фиксируем полученную нулевую структуру, а также количество ненулевых строк, которое обозначим Nnz.
б) Решаем задачу синтеза LQR-регулятора (задачу 1) с зафиксированной нулевой структурой регулятора. Определяем проигрыш в качестве управления разреженного регулятора оптимальному как отношение
= tri-1.
tr lopt
Таким образом, на каждой итерации получаем две точки на плоскости с координатами число ненулевых строк и проигрыш в качестве управления: (Nnz, а) и (Nnz, asp), при этом а - величина допустимого проигрыша, при котором были обнаружены нулевые строки, а asp - величина реального проигрыша при найденной нулевой структуре, которая может оказаться существенно меньше а.
4) Осуществляем полный перебор всевозможных комбинаций нулевых строк матрицы регулятора и для соответствующей
нулевой структуры решаем задачу синтеза LQR-регулятора (задачу 1). Для каждой комбинации с номером к £ [1; 2Р-2] определяем проигрыш в качестве управления разреженного
tr Р~\
регулятора оптимальному как отношение abf,k = p-i .
tr ^opt
Отметим, что интересующих нас комбинаций нулевых строк при полном переборе именно 2Р — 2, а не 2Р. Мы не считаем случай, когда нулевых строк нет вообще - это эквивалентно отсутствию разреженности и совпадает с классической постановкой задачи, а также случай, когда все строки нулевые - тогда полностью отсутствует управление, а, значит, систему нельзя даже стабилизировать, не говоря уже о достижении оптимального значения целевого функционала.
Полученные в алгоритме 3 точки (Nnz ,asp) связаны с известным понятием теории многокритериальной оптимизации -оптимальностью по Парето: улучшая один критерий, мы неизбежно ухудшаем другой. Стоит отметить, однако, что значения asp могут не быть оптимальными при заданном числе ненулевых строк Nnz. Это связано с тем, что мы решаем приближение исходной невыпуклой задачи, поэтому отсутствуют гарантии достижения глобального экстремума. Тем не менее, варьируя важность того или иного критерия, можно добиваться необходимого компромисса между разреженностью и оптимальностью.
3.1. ЗАДАЧИ ИЗ COMPleib
Эксперимент проводился в соответствии с описанной схемой для различных задач из библиотеки COMPleib: «AC1», «AC9», «AC12», «HE3», «HE4» (линеаризованные модели самолетов и вертолетов). Эти модели были выбраны как наиболее интересные с точки зрения количества управляющих воздействий. Для всех пяти моделей мы наблюдали схожие отличия в поведении различных аппроксимаций матричной Iо-квазинормы. Поэтому имеет смысл привести здесь результаты для одной из типичных задач - для «HE4».
Эта линейная модель восьмого порядка описывает двухдви-гательный многоцелевой военный вертолет. Напомним, что урав-
нения, описывающие поведение системы, имеют вид (1). Численные значения матриц А и В мы не приводим ради экономии места; их можно найти в документации к библиотеке СОЫР1егЬ. В эксперименте использовались единичные матрицы К и Б, входящие в квадратичный функционал (3).
Результаты эксперимента, проведенного в соответствии с Алгоритмом 3, представлены на рис. 2, 3, 4.
1.018 1.016 1.014
е
11.012
со
ё
1.01
0) о.
I 1.008
оэ
.§. 1.006 ■а
п
1.004 1.002 1
Рис. 2. «НЕ4». Обнаружение нулевых строк при разных а
На рис. 2 показаны точки (Мпг ,а), полученные для функций (11), (12), (13), (14) с помощью Алгоритма 3. Этот график демонстрирует, насколько большим надо сделать а - допустимый проигрыш по критерию оптимальности, чтобы получить нулевые строки в матрице регулятора. Видно, что аппроксимации (12), (13), (14) справляются с обнаружением нулевой структуры при меньших значениях а. Оказалось, что если пользоваться лю-62
Результаты для задачи НЕ4
° 1то-норма -
□ \«1 то-норма
<>N80 -
Озит-!од
2 3 4
Число ненулевых строк
бым критерием, кроме 1 го-нормы, то для обнаружения двух нулевых строк из четырех было достаточно задать а чуть меньше 1,005, что соответствует величине относительного проигрыша в качестве управления всего в 0,5%.
Переход от одной нулевой строки к двум происходит при близких значениях а, поэтому, выбрав недостаточно мелкий шаг по а, можно получить данные, якобы свидетельствующие о том, что происходит обнуление сразу двух строк. Такое одномоментное обнуление при проведении эксперимента замечено не было, что, по-видимому, связано с тем, что добавляя очередную нулевую строку в структуру регулятора, мы все сильнее сужаем область допустимых регуляторов, на которой происходит оптимизация целевого функционала, а значит, наилучшее значение критерия для регулятора с п + 1 нулевой строкой заведомо хуже наилучшего значения того же критерия для регулятора с п нулевыми строками.
На рис. 3 показаны точки ( Мпг,азр) из Алгоритма 3, соответствующие уже реальному проигрышу разреженного регулятора с зафиксированной нулевой структурой. Видно, что для 1 го-нормы значения а ^ азр, остальные же аппроксимации успешно обнаруживают нулевую структуру при значениях а близких к азр, что является их несомненным преимуществом. Действительно, если для того, чтобы обнаружить разреженную структуру, дающую фактический проигрыш азр, необходимо задавать существенно большие значения а, то теряется интерпретируемость а как допустимого проигрыша, которым мы готовы пожертвовать. Например, для нашей модели «НЕ4» для получения нулевой структуры с проигрышем в 0,5% при использовании 1 го-нормы нам пришлось «согласиться» на проигрыш в 15-20 %, а уже потом узнать, что фактический проигрыш на порядок меньше. Более того, в разных задачах при использовании 1 го-нормы разница между а и азр варьируется непредсказуемо. В случае использования остальных аппроксимаций обнаружение разреженной структуры происходит, как правило, при значениях а, довольно близких к азр, что делает а намного более достоверной оценкой азр.
Результаты для задачи НЕ4
1.018
1.016
1.014
1 1.012 л
1.01 | 1.008 1.006 1.004 1.002 1
° 1то-норма □ \«1 то-норма Оэит-Ьд -
2 3 4
Число ненулевых строк
Рис. 3. «НЕ4». Фактический проигрыш в качестве управления
На рис. 3 также отмечены черными крестами точки, полученные на шаге 4 Алгоритма 3 в процессе полного перебора. Обнаруживаем, что найденные разреженные структуры совпадают с оптимальными для данного числа нулевых строк. Рис. 3 является частью полной картины, представленной на рис. 4, на котором охвачены все варианты разреженных структур матрицы регулятора. Видно, что при неудачном выборе строк для зануления можно сильно ухудшить качество управления. Подчеркнем, что огромные значения фактического проигрыша на рис. 4 никак не связаны с методом обнаружения разреженной структуры, а, напротив, обусловлены внутренним устройством системы, для которой обнуление определенных компонент управления оборачивается
110'
л
е
100
Результаты для задачи НЕ4
° 1то-норма □ w1 то-норма
Onsd
Qsum-log
3
Число ненулевых строк
Рис. 4. «НЕ4». Фактический проигрыш в качестве управления. Все комбинации нулевых структур
2
4
катастрофическим проигрышем в качестве. Однако здесь есть и положительный момент, который заключается в том, что выбирая в качестве а приемлемые значения допустимого проигрыша, мы заведомо не получим регулятор с «неудачной» структурой, значительно проигрывающий оптимальному.
В заключение подчеркнем, что подобные результаты мы получили не только для задачи «HE4», но и для ряда других задач из COMP IJ b: «AC1», «AC9», «AC12», «HE3». Поэтому приведенные наблюдения и выводы характерны для всех упомянутых моделей.
3.2. ЗАДАЧА «MASS SPRING SYSTEM»
Рассмотрим систему, состоящую из N твердых тел с массами mi, соединенных пружинами с коэффициентами упруго-
65
сти , скользящих без трения вдоль горизонтальной линии (см. рис. 5). Обозначим за смещение г-го тела относительно положения равновесия, и пусть переменными состояния являются XI = [рг . ..рп]Т и Х2 = X1.
Как и в предыдущем примере, уравнения, описывающие поведение системы, имеют вид (1). В данном примере использовались единичные матрицы К и Б, входящие в квадратичный функционал (3). Для простоты будем рассматривать систему со следующими параметрами:
тг = ■ ■ ■ = тм = 1, кг = ■ ■ ■ = км = 1. Для указанных значений параметров матрицы системы (1) выглядят следующим образом:
А =
О Т
I О
в =
0
1
где Т € М мхМ - теплицева матрица со значением —2 на главной диагонали и значением 1 на первых побочных диагоналях, остальные элементы матрицы Т нулевые; I € М м хМ - единич-
ная матрица; О G R
NxN
матрица, состоящая из нулей.
Рис. 5. Модель «Mass Spring System»
Данная модель была выбрана, так как можно произвольным образом выбирать N - число тел, варьируя тем самым размерность модели. Эксперимент выполнялся для разных значений N, результаты при этом получаются похожими. Выберем N = 10, так как даже при такой небольшой размерности количество всевозможных комбинаций нулевых строк 210 — 2 = 1022, поэтому полный перебор хоть и возможен, но уже затруднителен.
Результаты эксперимента, полученные для данной модели, представлены на рис. 6, 7. Из рисунков видно, что для данной задачи
3.5
со г с о.
I 2.5 ш
I 2
I
1.5
Результаты для задачи М81.
О *
° 1то-норма □ w1 то-норма <>N80
Оэит-Ьд
23456789 10 Число ненулевых строк
Рис. 6. «MS». Обнаружение нулевых строк при разных а
3
1 го-норма не справилась с задачей обнаружения нулевой структуры, причем даже увеличение а до огромных значений не приводит к требуемому результату. Иными словами, снова наблюдаем эффект из предыдущего примера «HE4»: при использовании 1 го-нормы значение а является крайне неточной верхней оценкой а.зр, только в данном примере эту оценку и вовсе получить не удалось. Трудно объяснить причины такой неэффективности 1 го-нормы, которая, к слову, наблюдалась для всех значений N, участвующих в численном эксперименте. Возможно, дело в «однородности» задачи: элементы системы и применяемые к ним управляющие воздействия идентичны, что усложняет выбор конкретного кандидата для обнуления.
В свою очередь, взвешенная 1 го-норма хоть и позволяет ре-
Результаты для задачи Мв1.
3.5
£ 3
| 2.5
0
01 т
2
1.5
° 1 ж>-норма □ \«1 ж>-норма
Оивй
Озит-!од
4 5 6 7 8
Число ненулевых строк
9 10
Рис. 7. «МБ». Фактический проигрыш в качестве управления
4
2
3
шить разреженную задачу, уступает в эффективности невыпуклым аппроксимациям (13), (14). Несмотря на это, алгоритм 1, минимизирующий взвешенную 1те-норму, достаточно прост в реализации и по сравнению с минимизацией обычной 1те-нормы гораздо более эффективен. Интересен процесс последовательного обнаружения нулевых строк: их количество растет постепенно, скачкообразно увеличиваясь на некоторых итерациях. В соответствии с алгоритмом нулевым строкам - при численном моделировании нулем считаются значения порядка 10-10 - назначается очень большой вес, так как он обратно пропорционален максимальному абсолютному значению элементов строки. Для строк с весом порядка 1010 возвращение к ненулевым значениям практи-
чески невозможно. Таким образом, строка, оказавшаяся нулевой в процессе итеративного процесса, останется нулевой до конца работы алгоритма.
Реализация алгоритма для аппроксимаций (13), (14) -CCCP - требует вычисления градиента соответствующих функций, а благодаря своей итеративности его реализация в целом похожа на реализацию алгоритма 1. Если сравнивать между собой невыпуклые функции, то NSD, в целом не уступая log-sum, в некоторых случаях оказывается лучше. Из рис. 7 видно, что найденные с помощью функций (13), (14) разреженные структуры близки к оптимальным, а иногда и совпадают с ними. Взвешенная норма (12) в этом отношении менее эффективна. Этот результат важен, так как теоретических гарантий сходимости к глобальному минимуму для невыпуклой задачи нет, поэтому способность находить решения, близкие к оптимальным, ценна.
На основании результатов проведенных численных экспериментов сделаны следующие выводы:
• Для 1 го-нормы реальный проигрыш в качестве управления существенно меньше задаваемого коэффициента релаксации а, необходимого для обнаружения нулевых строк. Остальные аппроксимации эффективны, как правило, при значениях а, близких к реальному проигрышу.
• Аппроксимации обнаруживают нулевую структуру, как правило, близкую к оптимальной в смысле качества управления.
• Существуют задачи (второй пример из раздела с численными экспериментами - тому подтверждение), в которых среди всех приближений Iq-квазинормы только 1го-норма не справляется с нахождением нулевых строк даже при больших значениях а.
• Аппроксимация NSD оказалась эффективной при решении задач, причем не уступает, например, невыпуклому приближению log-sum, а иногда оказывается лучше.
4. Заключение
В работе исследованы различные аппроксимации матричной ¿0-квазинормы, которые можно применять при синтезе разреженных регуляторов в задачах оптимального управления. Результаты численных экспериментов свидетельствуют о том, что до определенной степени все рассмотренные приближения можно применять для обнаружения нулевых строк, однако невыпуклые приближения справляются с этой задачей с большей эффективностью.
В дальнейшем хотелось бы понять, в каких случаях те или иные аппроксимации матричной 1о-квазинормы оказываются неэффективными. Кроме того, интерес представляют другие вычислительные процедуры (например, ADMM - alternating direction method of multipliers), которые можно применять для получения разреженной структуры регулятора.
Литература
1. ПОЛЯК Б.Т., ХЛЕБНИКОВ М.В., ЩЕРБАКОВ П.С. Разреженная обратная связь в линейных системах управления // Автоматика и телемеханика. - 2014. - №12. -
С. 13-27.
2. ПОЛЯК Б.Т., ХЛЕБНИКОВ М.В., ЩЕРБАКОВ П.С.
Управление линейными системами при внешних возмущениях: Техника линейных матричных неравенств. -М.: УРСС, 2014. - 560 с.
3. ХЛЕБНИКОВ М.В., ЩЕРБАКОВ П.С., ЧЕСТНОВ В.Н. Задача линейно-квадратичного управления: I. Новое решение // Автоматика и телемеханика. - 2015. - №12. -С. 65-79.
4. ХЛЕБНИКОВ М.В. Сравнение квадратичных критериев качества: эллипсоидальный подход // Стохастическая оптимизация в информатике. - 2014. - Т. 10, №1. -
С. 145-156.
5. BOYD S., EL GHAOUI L., FERON E., BALAKRISHNAN V. Linear Matrix Inequalities in System and Control Theory. - SIAM, Philadelphia, 1994. - 193 p.
6. BYKOV A., SHCHERBAKOV P., DING M. A tractable nonconvex surrogate for the matrix l0-quasinorm: applications to sparse feedback design // IFAC-PapersOnLine. - 2016. - Vol. 49, No. 13. - P. 53-58.
7. CANDEs E.J., WAKIN M.B., BOYD S.P. Enhancing sparsity by reweighted h minimization // Journal of Fourier Analysis and Applications. - 2008. - Vol. 14, No. 5. - P. 877-905.
8. FAZEL M., HINDI H., BOYD S. Log-det heuristic for matrix rank minimization with applications to Hankel and Euclidean distance matrices // Proc. of American Control Conference. -2003. - P. 2156-2162.
9. GRANT M., BOYD S. CVX: Matlab software for disciplined convex programming, version 2.1. - URL: http://cvxr.com/cvx.
10. HARTMAN P. On functions representable as a difference of convex functions // Pacific Journal of Mathematics. - 1959. -Vol. 9, No. 3.-P. 707-713.
11. LANCKRIET G.R., RANGARAJAN B.K. On the convergence of the concave-convex procedure // Advances in Neural Information Processing Systems. - 2009. - Vol. 22. -P. 1759-1767.
12. LEIBFRITZ F., LIPINSKI W. Description of the benchmark examples in COMPleib 1.0. - URL: http://www.complib.de.
13. LEVINE W.S., ATHANS M. On the determination of the optimal constant output feedback gains for linear multivariable systems // IEEE Trans. on Automatic Control. -1970. - Vol. 15, No. 1. - P. 44-48.
14. LIN F., FARDAD M., JOVANOVIC M.R. Augmented Lagrangian approach to design of structured optimal state feedback gains // IEEE Trans. on Automatic Control. - 2011. -Vol. 56, No. 12. - P. 2923-2929.
15. LIN F., FARDAD M., JOVANOVIC M.R. Design of optimal sparse feedback gains via the alternating direction method of multipliers // IEEE Trans. on Automatic Control. - 2013. -Vol. 58, No. 9. - P. 2426-2431.
16. MUNZ U., PFISTER M., WOLFRUM P. Sensor and actuator placement for linear systems based on and optimization // IEEE Trans. on Automatic Control. - 2014. -Vol. 59, No. 11. - P. 2984-2989.
17. POLYAK B., KHLEBNIKOV M., SHCHERBAKOV P. An LMI approach to structured sparse feedback design in linear control systems // Proc. of European Control Conference. -2013. - P. 833-838.
18. STURM J.F. Using SeDuMi 1.02, a MATLAB toolbox for optimization over symmetric cones // Optimization Methods and Software. - 1999. - Vol. 11-12. - P. 625-653.
19. TOH K.C., TODD M.J., TUTUNCU R.H. SDPT3 - a Matlab software package for semidefinite programming // Optimization Methods and Software. - 1999. - Vol. 11. -P. 545-581.
20. VANDENBERGHE L., BOYD S. Semidefinite programming // SIAM Review. - 1996. - Vol. 38, No. 1. -P. 49-95.
21. YUILLE A.L., RANGARAJAN A. The concave-convex procedure // Neural Computation. - 2003. - Vol. 15. -
P. 915-936.
22. ZELAZO D., SCHULER S., ALLGOWER F. Performance and design of cycles in consensus networks // Systems & Control Letters. - 2013. - Vol. 62, No. 1. - P. 85-96.
NUMERICAL STUDY ON EFFECTIVENESS OF SURROGATES FOR THE MATRIX /0-QUASINORM APPLIED TO SPARSE FEEDBACK DESIGN
Alexey Bykov, Institute of Control Sciences of RAS, Moscow, ([email protected]).
Pavel Shcherbakov, Institute of Control Sciences of RAS, Moscow, Institute for Systems Analysis, Federal Research Center "Computer Science and Control" of RAS, Moscow, Doctor of Science, ([email protected]).
Abstract: Optimal control problem formulations sometimes require the resulting controller to be sparse, i.e. to contain zero elements in gain matrix. On the one hand, sparse feedback leads to the performance drop if compared with the optimal control, on the other hand, it confers useful properties to the system. For instance, sparse controllers allow to design distributed systems with decentralized feedback. Some sparse formulations require gain matrix of the controller to have special sparse structure, which is characterized by the occurence of zero rows in a matrix. In this paper various approximations to the number of nonzero rows of a matrix are considered to be applied to sparse feedback design in optimal control problems for linear systems. Along with a popular approach based on using the matrix h-norm, more complex nonconvex surrogates are involved, those surrogates being minimized via special numerical procedures. Effectiveness of the approximations is compared via numerical experiment.
Keywords: sparse control, l\-optimization, linear systems, optimal control, linear matrix inequalities.
Статья представлена к публикации членом редакционной коллегии А.П. Курдюковым.
Поступила в редакцию 17.04.2017. Дата опубликования 31.07.2017.