УДК 517.977.58 Финкельштейн Евгения Александровна,
аспирант ИДСТУ СО РАН, тел. 45-30-45, 89501298275, e-mail: [email protected]
Горнов Александр Юрьевич,
д. т. н., г. н. с. ИДСТУ СО РАН, тел. раб. 45-30-04, e-mail: [email protected]
АЛГОРИТМ АППРОКСИМАЦИИ МНОЖЕСТВА ДОСТИЖИМОСТИ НЕЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ ЭЛЛИПСОИДАМИ ОПТИМАЛЬНОГО ОБЪЕМА
E.A. Finkelstein, A. Yu. Gornov
ALGORITHM FOR APPROXIMATION OF THE REACHABLE SET OF A NONLINEAR CONTROL SYSTEM BY ELLIPSOIDS
OF OPTIMAL VOLUME
Аннотация. В работе предлагается основанная на методе стохастической аппроксимации технология оценивания множества достижимости нелинейной управляемой системы, включающая построение внешних оценок, составленных из одного или нескольких эллипсоидов. Для достижения минимальных размеров объемлющих эллипсоидов формулируются экстремальные задачи по нахождению покрытия с минимальным объемом.
Ключевые слова: множества достижимости, оптимальное управление.
Abstract. This paper proposes a technology for the estimation of the reachable set of a nonlinear control system based on a method of stochastic approximation, which includes the construction of external evaluations, consisting of one or more of the ellipsoids. To achieve the minimum dimension of enclosing ellipsoids extremal problems of finding coverage with a minimum volume are formulated.
Keywords: reachable set, optimal control.
Введение
Эллипсоидные конструкции достаточно давно используются при исследовании различных задач вычислительной математики. Широкую известность приобрел, например, «метод эллипсоидов» для решения задачи минимизации выпуклой функции, предложенный в 70-х годах XX века (см., напр., [1, 2]). Нетривиальные оценки эффективности этого метода вызвали большой интерес научного сообщества, в частности, неожиданное доказательство полиномиальной разрешимости задачи линейного программирования [3] было получено при изучении именно метода эллипсоидов. В дальнейшем были предложены конструктивные реализации метода эллипсоидов [4, 5], и он занял свое достойное место в ряду конкурентоспособных алгоритмов безусловной минимизации.
Для задач фазового оценивания применение эллипсоидальных конструкций также имеет достаточно долгую историю. Эллипсоиды оказались довольно удобным инструментом для приближения множеств достижимости, имеющих, как правило, существенно различные протяженности по разным направлениям в фазовом пространстве. В двух российских научных школах, работающих в Институте математики и механики УрО РАН и Институте проблем механики РАН, были разработаны методы построения как внутренних, так и внешних оценок множества достижимости эллипсоидального типа, предложены алгоритмы оценивания интегральных воронок как линейных, так и нелинейных систем (см., напр., [6, 7]); в дальнейших работах предложенные методики были распространены на новые классы управляемых систем и новые типы задач системного анализа (см., напр., [8, 9]). Однако вычислительные эксперименты, к сожалению, выявили и существенный недостаток классических алгоритмов, основанных на эллипсоидальных оценках: во многих исследуемых примерах внешние оценки получались сильно завышенными, а внутренние - сильно заниженными, что препятствовало широкому применению этого красивого метода при решении прикладных проблем. В последующие годы было предложено несколько модификаций алгоритмов, основанных на пересечениях эллипсоидов [10], но проблема создания эффективных методов аппроксимации множеств достижимости, удовлетворяющих жестким критериям практики, так и остается, на наш взгляд, открытой.
В работе предлагается основанная на методе стохастической аппроксимации технология оценивания множества достижимости нелинейной управляемой системы, включающая построение внешних оценок, составленных из одного или нескольких эллипсоидов. Для достижения мини-
мальных размеров объемлющих эллипсоидов формулируются экстремальные задачи по нахождению покрытия с минимальным объемом. Численное решение поставленных задач производится с применением поисковых оптимизационных алгоритмов, реализованных в программном комплексе OPTCON-A [11].
Алгоритм стохастической аппроксимации
Рассмотрим задачу аппроксимации множества достижимости двумерной нелинейной управляемой динамической системы на плоскости
x = f(x(t),u(t),t), (1)
заданной на t е [t0, tx ], с начальными условиями
x(t0 ) = x0 и управлениями u(t) = (щ (t),..., um (t)),
щ < щ (t) < щ, (2)
где функция f (x, u, t) непрерывно дифференцируема. Множеством достижимости системы (1) называется множество D = D(tx, x°) всех возможных значений вектора x(t ) , которые принимаются на решениях этой системы при начальных условиях x0 и выполнении ограничений (2).
Для решения этой задачи на первом этапе строится стохастическая аппроксимация множества. Подход стохастической аппроксимации может быть трактован как реализация метода Монте-Карло: для получения покрытия множества используется случайное распределение управляющих функций релейного типа, точки переключения которых равномерно распределены на множестве допустимых управлений щ < щ (t) < щ . Целесообразность применения релейных управлений следует из ряда известных теоретических результатов («принцип bang-bang», см., напр., [12]), основной вывод которых состоит в том, что граничные точки множества достижимости могут быть сколь угодно точно приближены траекториями, соответствующими релейным управлениям. Такой выбор пробных управлений, в частности, показал себя достаточно эффективным в практике вычислительных экспериментов. Проблемной технологической задачей, которую необходимо решить при использовании рассматриваемого подхода, является нахождение числа точек переключения, позволяющего получить наилучшие аппроксимации. На иллюстрирующем примере рассмотрим подробнее эффекты, возникающие при аппроксимации множества достижимости случайными релейными управлениями с различным числом точек переключения.
Генерация случайных управлений производится по следующему алгоритму:
Шаг 0. Задается алгоритмический параметр к^ - число точек переключения.
Шаг 1. На временном интервале t е [t0, tx ] генерируется к^ случайных точек переключения.
Шаг 2. На отрезках между точками переключения происходит генерация случайного числа
из [0,1], если оно больше , то управление
на отрезке задается как верхняя граница допустимого множества, если меньше, то как нижняя.
Алгоритм закончен.
На процедуру генерации случайного релейного управления опирается алгоритм построения стохастической аппроксимации множества достижимости:
Шаг 0. Задаются Ntter - число пробных управлений, к - число точек переключения
в пробных управлениях, B — 0. Полагается t = 0.
Шаг 1. Производится генерация допустимого управления ui (t) .
Шаг 2. Решается задача Коши с заданным начальным условием x0 и сгенерированным управлением u¡ (t) .
Шаг 3. Запоминается решение задачи Коши x(t ) в массив достижимых точек B .
Шаг 4. t = t +1.
Шаг 5. Если t < Ntter, переход на шаг 1. Иначе - алгоритм закончен.
Результат работы алгоритма в той или иной степени зависит от настраиваемых параметров. Алгоритм стохастической аппроксимации имеет два параметра, и если от Niter - числа пробных управлений - зависимость прямая: чем больше N , тем
больше точек на множестве достижимости и тем лучше аппроксимация, то зависимость качества оценки множества от числа точек переключения в генерируемом релейном управлении к носит характер вогнутой функции, имеющей максимум на определенном целочисленном значении, далее которого увеличивать данный параметр нецелесообразно.
Рассмотрим известный иллюстрирующий пример, моделирующий управление колебаниями «нелинейного маятника» (см., напр., [11]). Динамика системы на временном интервале t е [0,5] описывается дифференциальными уравнениями
{.x^ — Х2 Х2 — sin Xj + u
с начальными условиями хг (0) = 5, х2 (0) = 0. Управление системой может выполняться с управлениям из множества — 1 < и(/) < 1.
Задав кф = 1, исходя из свойства конкретной
рассматриваемой системы, линейной по управлению, получаем лишь контур на множестве достижимости, как показано на рис. 1, который, естественно, не обязательно будет совпадать с границей множества.
0 4 8 12 16 20
Рис. 2. Стохастическая аппроксимации множества достижимости при кф = 2
Увеличивая число точек переключения в алгоритме стохастической аппроксимации до 5, возможно получить более точные результаты (см. аппроксимацию множества рассматриваемой системы, изображенную на рис. 3, которая удовлетворяет визуальным требованиям к качеству). Однако
с ростом числа точек переключения начинает сказываться другой эффект - «размывание» границ множества, что, очевидно, связано с излишними степенями свободы, вносимыми в генерируемые пробные управления. Условный «признак качества», отражающийся, как правило, в хорошо очерченной границе множества и достаточной плотности покрытия, растет с увеличением числа точек переключения немонотонно и, проходя через максимум, начинает убывать. Область покрытия при некотором числе точек переключения начинает сужаться, граница перестает быть видимой. Описанный эффект для рассматриваемой модельной системы проиллюстрирован на рис. 4 и 5.
Рис. 1. Стохастическая аппроксимации множества достижимости при к = 1
Очевидно, такая аппроксимация не может быть сочтена достаточно адекватной. Повторив описанную выше процедуру с управлениями при к = 2, получаем более точную картину аппроксимации, включающую уже не только точки контура, но также и множество внутренних точек. Получаемое по такому способу «облако точек», безусловно, лучше полученной с управлением с одной точкой переключения оценки, однако, во-первых, внутренность множества заполнена недостаточно плотно, во-вторых, некоторая часть множества по-прежнему может быть не захвачена построенной аппроксимацией. Результат данного вычислительного эксперимента представлен на рис. 2.
Рис. 3. Стохастическая аппроксимации множества достижимости, при к = 5
Рис. 4. Стохастическая аппроксимации множества достижимости при к = 20
Рис. 5. Стохастическая аппроксимации множества достижимости при к = 30
Свойства аппроксимаций для значений к^ = {1,2,5}, приведенные для иллюстрирующей
системы, проявляются и для большинства систем, укладывающихся в рассматриваемую постановку задачи.
Оптимальное значение параметра метода стохастической аппроксимации к^ может быть
различным для разных динамических систем, но его значение в конкретном случае возможно определить после серии экспериментов, оценивая как по неформальным признакам, так и по формальным, например по размеру объемлющего множества достижимости параллелепипеда.
Алгоритм аппроксимации эллипсоидами оптимального объема
Наличие стохастической внутренней аппроксимации множества достижимости позволяет поставить задачи построения и внешней оценки исследуемого множества.
Задача 1 состоит в том, чтобы при заданных
начальных условиях х , конечном времени ^ и ограничениях (2) построить внешнюю аппроксимацию области достижимости О для системы (1) в виде эллипса.
Для решения поставленной проблемы формулируется задача оптимизации по параметрам, глобальное решение которой соответствует искомой аппроксимации. Используя алгоритмы глобальной оптимизации, реализованные в программном комплексе ОРТСО^А, возможно найти эллипс с минимальной площадью, в который входят все ранее сгенерированные точки множества.
Задача оптимизации по пяти параметрам
{ххс, хс2, а, Ь, ф}, задающим уравнение эллипса
((Хд - xf) cos ф - (x2 - xC) sin ф)2
+
+
((x1 - xC ) sin ф - (x2 - Х2с ) cos ф)2 _
ь2 ~
в плоскости фазовых переменных (x , x2) , имеет вид:
J = тЬ + wd ^ min, где d определяется как сумма расстояний от точек, не принадлежащих эллипсу, до его центра, а w -весовой коэффициент.
Задача 2. При заданных начальных условиях x0, конечном времени tj и ограничениях (2) построить внешнюю аппроксимацию области достижимости D для системы (1) в виде объединения конечного числа эллипсов.
Количество оптимизируемых параметров в сформулированной задаче, очевидно, в пять раз больше количества эллипсов, включенных в ап-
проксимирующее множество. Минимизируемым функционалом является
J = S^ + wd ^ min, где значение d определяет штрафную добавку в случае непопадания точки из множества стохастической аппроксимации ни в один из эллипсов, а w - весовой коэффициент. Площадь объединения эллипсов - - вычисляется приближенно по следующему алгоритму:
Шаг 1. Производится оценка размеров внешних объемлющих параллелепипедов для каждого эллипса.
Шаг 2. Вычисляются границы прямоугольника, ограничивающего область объединения всех эллипсов.
Шаг 3. На исчисленном прямоугольнике строится аппроксимирующая равномерная сетка.
Шаг 4. Полным перебором по всем узлам равномерной сетки находятся вложенные ячейки сетки, принадлежащие хотя бы одному из эллипсов.
Шаг 5. На основе числа вложенных ячеек вычисляется оценка площади объединения эллипсов. Алгоритм закончен.
Точность вычисления площади объединения эллипсов напрямую зависит от размера сетки, который, естественно, влияет на общие временные затраты работы алгоритма. Решением задачи минимизации суммарного функционала является покрытие, включающее все найденные методом стохастической аппроксимации точки множества достижимости, которое при заданном количестве эллипсов имеет минимальную площадь. С увеличением числа эллипсов резко растет количество параметров, по которым производится оптимизация, следовательно, и вычислительная трудность задачи, однако в большинстве случаев качество аппроксимации, оцениваемое как площадь покрывающего объединения, для числа эллипсов более двух растёт существенно медленнее (см. тестовые примеры). Объединение трех эллипсов, которое считалось в большинстве рассмотренных задач достаточным, требует решения оптимизационной задачи по пятнадцати параметрам, такая задача может быть эффективно решена с применением алгоритмов реализованных в программном комплексе OPTCON-A.
Вычислительный эксперимент
Пример 1. Аппроксимация множества достижимости линейной системы на временном интервале t е [0,1]
(xx^ — x 2 x2 — u '
с начальными условиями xx (0) = x2 (0) = 0, и множеством допустимых управле-
2
a
ний — 1 < ) < 1, была получена с использованием классического метода генерации эллипсоидов, предложенного в работе Ф.Л. Черноусько (см. [7], стр. 186). В первоисточнике приводятся также точное значение объема множества достижимости 2
= — и характеристики внешней оценки, полученной классическим методом: координаты центра нулевые, полуоси равны соответственно а = 1,4014 и Ь = 0,2837, значение объема
у+ = 1,2489. Характеристики эллипсоида, полученного с применением предложенного алгоритма, таковы: координаты центра хС =—0,0047, хс2 = —0,0067, полуоси равны соответственно а = 1,1448 и Ь = 0,2223 , а значение функционала, т. е. объема ^ = 0,7995. Обе внешние оценки изображены на рис. 6. Заметим, что с использованием рассматриваемого подхода удалось, что очевидно, получить эллипсоидальную оценку значительно меньшего объема.
1.5
-1.5
-1.0 -0.5 0,0 0.5 1.0
Рис. 6. Аппроксимации множества достижимости в примере 1. Множество достижимости закрашено серым цветом, аппроксимация классическим методом эллипсоидов изображена курсивом, а предложенным методом - сплошной линией
Тестовый пример 2. Рассмотрим нелинейную управляемую систему, определенную на временном интервале t е [0; 1,6]
1
х1 =
cos( хх) + 2
- + и
х2 — х1 ~+ Х2 ~+ и
значениями х1 (0) = 1, х2 (0) = 0, допустимых управлений
с начальными и множеством — 2 < и(.) < 1. В результате применения предложенного алгоритма для решения задач 1 и 2 получены следующие результаты: значения функционалов для аппроксимации одним эллипсом ^ = 86,334, двумя эллипсами - = 76,327, тремя
эллипсами - 2 = 75,541. На рис. 7 и 8 изображена стохастическая аппроксимация и внешняя оценка объединением двух и трех эллипсов соответственно. Площади оптимальных аппроксимирующих множеств, вполне естественно, заметно уменьшаются при увеличении числа эллипсов, что, очевидно, следует из увеличения гибкости получаемых оценок.
15
-4 -2 0 2 4 6
Рис. 7. Аппроксимации множества достижимости двумя эллипсами в примере 2, = 76,327
Рис. 8. Аппроксимации множества достижимости тремя эллипсами в примере 2, У2 = 75,541
Тестовый пример 3. Для нелинейной управляемой системы, определенной на временном интервале t е [0, 2]
Г.х1 = их2 + и ОЭ8(х )
[ х2 = и\ + Бт( х2 )
с начальными значениями х (0) = 1, х2 (0) = —1 и множеством допустимых управлений
— 1 < и(Х) < 2, были сформулированы и решены задачи 1 и 2. В результате вычислительных экспериментов были получены следующие результаты: значения функционалов для аппроксимации одним эллипсом ^ = 228,153, двумя эллипсами -= 61,523 , тремя эллипсами - = 50,257 (см. рис. 9-11).
<
Рис. 9. Аппроксимации множества достижимости одним эллипсом в примере 3, У = 228,153
Рис. 10. Аппроксимации множества достижимости двумя эллипсами в примере 3, У = 61,523
10
-10
-4-2 0 2 4 6 8 10
Рис. 11. Аппроксимации множества достижимости тремя эллипсами в примере 3, У2 = 50,257
Множество достижимости в данном примере, по-видимому, является достаточно неудобным для построения внешних оценок - далеко разнесенные ветви затруднительно охватить единым эллипсоидом. В данном случае особенно выразительно проявляется эффект уменьшения площади
аппроксимации, проявляющийся при увеличении числа эллипсов.
Заключение
Численные эксперименты по предложенной методике выполнены с помощью специализированного варианта программного комплекса глобальной оптимизации OPTCON-А. Проведен ряд численных экспериментов, продемонстрировавших эффективность предложенного подхода.
Работа частично поддержана междисциплинарным интеграционным проектом СО РАН № 81 и грантом РФФИ № 12-01-00193.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Шор Н. З. Методы минимизации недифферен-цируемых функций и их приложения. Киев : Наукова думка, 1977. 178 с.
2. Немировский А. С., Юдин Д. Б. Сложность задач и эффективность методов оптимизации. М. : Наука, ГРФМЛ, 1979. 384 с.
3. Хачиян Л. Г. Полиномиальный алгоритм в линейном программировании. Доклады Академии наук СССР, 1979, 244 (5), 1093-1096.
4. Дикин И.И. Итеративное решение задач линейного и квадратичного программирования. Доклады Академии наук СССР, 1967, 174 (4), 747-748.
5. Karmarkar N. A new polynomial-time algorithm for linear programming. Combinatorica, 1984, № 4, 373-395.
6. Куржанский А.Б. Управление и наблюдение в условиях неопределённости. М.: Наука, 1977. 392 с.
7. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. 320 с.
8. Гурман В.И. Принцип расширения в задачах оптимального управления. М.: Наука, 1985. 288 с.
9. Константинов Г.Н. Нормирование воздействий на динамические системы. Иркутск, 1983, 197 с.
10. Kurzhanskii A.B., Valyi I. Ellipsoidal Techniques for Dynamic Systems: Control Synthesis for Uncertain Systems. Dynamic and Control, 1992, Vol.2.
11. Горнов А.Ю. Вычислительные технологии решения задач оптимального управления. Новосибирск : Наука, 2009. 279 с.
12. Толстоногов А.А. Дифференциальные включения в банаховом пространстве. Новосибирск : Наука, 1986. 297 с.