Серия «Математика» 2017. Т. 19. С. 217-223
Онлайн-доступ к журналу: http://isu.ru/izvest.ia.
ИЗВЕСТИЯ
Иркутского государственного ■университета
УДК 517.977.5 MSG 93С10
DOI https://doi.org/10.26516/1997-7670.2017.19.217 Алгоритм квазиравномерного заполнения множества достижимости нелинейной управляемой системы*
Е. А. Финкельштейн, А.Ю. Горнов
Институт динамики систем и теории управления им. В. М. Матросова СО РАН
Аннотация. В работе предлагается алгоритм поиска, внутренней оценки множества. достижимости нелинейной управляемой динамической системы, которая получается в виде набора, точек квазиравномерно (с некоторой точностью) заполняющих множество уже при небольшом числе элементов. Предлагаемый алгоритм основан на. многократном решении вспомогательных задач оптимизации для пополнения набора, точек аппроксимирующего множества.. Минимизируемая функция, характеризующая равномерность заполнения, зависит от расстояния между элементами аппроксимации в евклидовом пространстве и строится так, чтобы быть равной или близкой к нулю, если расстояние больше желаемого порогового значения. Таким образом заранее определена, нижняя оценка, оптимального значения функционала., что позволяет существенно экономить вычислительное время на. случайной составляющей применяемых алгоритмов глобальной оптимизации. В основу используемого алгоритма, нелокальной оптимизации положена, «туннельная идеология», предполагающая наличие в конструкции, помимо механизмов локального спуска., также механизмов перехода, из локального экстремума, с текущим рекордным значением функционала, в области притяжения экстремумов с меньшим значением. В качестве глобализующего механизма, использован нелокальный поиск по случайным направлениям, повторяемый многократно на. каждой итерации алгоритма.. Для повышения надежности предложенного метода, в конструкции алгоритмов предусмотрен также периодический случайный мультиста.рт. Статья включает в себя построение аппроксимации множеств достижимости тестовых примеров и иллюстрацию результатов вычислительных экспериментов в сравнении с расчетами, полученными методом, основанным на. принципе максимума. Понтрягина. [7]. Конструкция предложенного метода, позволяет, помимо двумерных систем, рассматривать также и множества, достижимости многомерных систем. Проведенные эксперименты показали работоспо-
* Работа, выполнена, при частичной финансовой поддержке РФФИ (грант № 15-0703827) и Совета, по грантам Президента. Российской Федерации для государственной поддержки ведущих научных школ Российской Федерации (НШ-8081.2016.9).
собность подхода, а сравнение результатов подтвердило адекватность получаемых аппроксимаций.
Ключевые слова: множество достижимости, алгоритм аппроксимации, задача оптимального управления.
1. Введение
Построение множества достижимости (МД) управляемой динамической системы позволяет получить решение или хорошее начальное приближение для целого набора задач оптимального управления с различными функционалами и задач оценивания параметров, исследовать нелокальное поведение системы. МД играют важную роль при создании прикладных математических моделей и могут быть вспомогательным объектом для поиска управлений с обратной связью. Для линейных систем предложено множество методов аппроксимации МД, разработаны многочисленные алгоритмические подходы, решены основные технологические задачи (см., например, [2; 3; 4; 5]). Проблема численного оценивания фазовых состояний нелинейных динамических систем, несмотря на значительные усилия многих специалистов, к настоящему времени не является решенной. В статье предлагается алгоритм поиска внутренних облачных оценок, которые получаются в виде набора точек, квазиравномерно заполняющих объем МД уже при небольшом числе элементов. Предлагаемый для этого алгоритм некоторым образом схож с методом «глубоких ям» из [1]: аналогично рассмотренному в этой работе подходу, для пополнения точек аппроксимирующего множества требуется многократное решение вспомогательных задач оптимизации.
2. Метод аппроксимации
На отрезке времени Т = [¿0,^1] рассматривается управляемая система обыкновенных дифференциальных уравнений
х(1) = ¡(х(1),и(1),1), (2.1)
и £ II := {и : щ < щ < щ, г = 1,..., г}. (2.2)
с заданными начальными значениями ж (¿о) = ж0 € Кга, х = (х\, ...,хп) — состояние, и = (щ, ...,иг) — управление.
Функция / предполагается нелинейной, непрерывно дифференцируемой по х, и и кусочно-непрерывной по Допустимым управлением будем считать любую кусочно-непрерывную функцию и : Т 17.
Траектории системы (2.1), соответствующие допустимым управлениям, будут кусочно-гладкими функциями времени на Т.
Множеством достижимости системы (2.1) называется множество
D = D(ti,x°)
всех возможных значений вектора x(t\) = (x\(ti),..., xn(t\)), которые принимаются на решениях этой системы при начальных условиях х° и выполнении ограничений (2.2).
Алгоритм. Алгоритм построения аппроксимации заключается в последовательном добавлении точек xl(ti) к набору {хп}, построенному на предыдущих этапах, и основывается на минимизации непрерывной функции, зависящей от расстояния между точками.
1) База элементов МД инициируется случайным вектором
B = {X\t 0}. Число элементов в базе nb = 1.
nb
2) x*(t\) = arg min J] S(pi), где pi = \\хг — :c(ti)||2, хг € В.
иеи i=1
nb
3) Если min Y^ S(pi) = 0, то В = B\Jx*, nb = nb+1, переход на шаг 2.
u&J i=1
4) Иначе работа алгоритма завершена.
Равномерность заполнения оценивается через расстояние между элементами аппроксимации в евклидовом пространстве pi = \\xl—x[u](ti)\\2, здесь х[и] — решение (2.1) при управлении и. Минимизируемая функция S(p) определяется так, чтобы быть равной или близкой к нулю, если р больше желаемого порогового значения d\ равной достаточно большому числу М при р = 0, и монотонно убывать в промежутке [0, d]. При численных расчетах использованы:
• Простейший кусочно-линейный вариант so = [M(l-£),0<p<d
\о,р > d.
• Гладкий полиномиальный вариант
! _ \м(р — d)2n, 0 < р < d | 0 ,p>d.
• Гладкая экспоненциальная функция = Ме~Мс1р.
3. Вычислительные эксперименты
В ходе вычислительных экспериментов рассмотрен ограниченный класс линейных по управлению систем, в нём справедлив поиск оптимального управления среди релейных функций. Это позволяет свести сформулированную задачу к задаче оптимизации по параметрам. Тот факт, что заранее известна нижняя оценка оптимального значения функционала (по построению равная нулю), позволяет существенно экономить вычислительное время на случайной составляющей применяемых алгоритмов. В основу используемого алгоритма нелокальной оптимизации положена «туннельная идеология», предполагающая наличие в конструкции, помимо механизмов локального спуска, также механизмов перехода из локального экстремума с текущим рекордным значением функционала в области притяжения экстремумов с меньшим значением. В качестве глобализующего механизма использован нелокальный поиск по случайным направлениям, повторяемый многократно на каждой итерации алгоритма. Для повышения надежности предложенного метода в конструкции алгоритмов предусмотрен также периодический случайный мультистарт, который однако может быть не задействован.
Пример 1. Гассмотрпм простой билинейный пример, решение которого при ¿1 = 1.5 можно сравнить с [6]:
Х\ = ТТХ2, ¿2 = —ттих\,
начальные значения ж(0) = (—1,0), множество допустимых управлений 0 < и < 1. На достаточно малом интервале времени МД системы выпукло, однако с ростом временного горизонта выпуклость теряется.
Пример 2. В этом примере рассмотрим нелинейную управляемую систему:
Х\= Х2+ Щ, ¿2 = «2 — вШЖ!,
с начальными значениями ж(0) = (—2,1) и множеством допустимых управлений 0 < щ < 1, — 1 < и2 < 1 на интервале [0, 4].
Рис. 1. а) МД системы из примера (1); б) МД системы из примера (2).
Рис. 1 иллюстрирует проделанные эксперименты, черным отмечены точки аппроксимации множества, а также контур множества, полученный методом, основанным на принципе максимума Понтрягина [7]. Аппроксимация МД системы из примера 1 содержит 205 элементов, для её получения потребовалось произвести 865090 интегрирований системы. Результат расчетов соответствует решению, приведенному в [6], и в достаточной степени отражает основные особенности множества. На рис. 16) аппроксимирующее множество состоит из 195 точек. Сравнение результата работы предлагаемого подхода с результатом, полученным методом, основанным на принципе максимума Понтрягина, позволяет делать выводы о его работоспособности.
4. Заключение
В статье рассмотрен подход к построению алгоритма аппроксимации множества достижимости нелинейной управляемой системы, основанный на решении последовательности задач оптимального управления, порождающей последовательность достижимых точек, равномерно расположенных в МД. Конструкция метода позволяет, помимо двумерных систем, рассматривать также и множества достижимости многомерных систем. Проведенные эксперименты показали работоспособность подхода, а сравнение результатов с расчетами, выполненными с применением метода, основанного на принципе максимума Понтрягина, подтвердило адекватность получаемых аппроксимаций.
Список литературы
1. Каменев Г. К. Аппроксимация вполне ограниченных множеств методом глубоких ям / Г. К. Каменев // Журн. вычисл. математики и мат. физики. -2001. - Т. 41, N 11. - С. 1751-1760.
2. Лотов А. В. Численный метод построения множеств достижимости для линейных управляемых систем с фазовыми ограничениями / А. В. Лотов // Журн. вычисл. математики и мат. физики. - 1975. - Т. 15, N 1. - С. 67-78.
3. Панасюк А. И. Дифференциальное уравнение невыпуклых множеств достижимости / А. И. Панасюк // Мат. заметки. - 1985. - Т. 37, № 5. - С. 717-726.
4. Толстоногов А. А. Дифференциальные включения в банаховом пространстве / А. А. Толстоногов. - Новосибирск : Наука, 1986.
5. Черноусько Ф. Л. Оценивание фазового состояния динамических систем / Ф. Л. Черноусько. - М. : Наука, 1988.
6. Baier R. Approximation of reachable sets using optimal control algorithms / R. Baier, M. Gerdts, I. Xausa // Numer. Algebra Control Optim. - 2013. - Vol. 3, N 3. - P. 519-548.
7. The Method of Uniform Monotonous Approximation of the Reachable Set Border for a Controllable System / A.Yu. Gornov, T. S. Zarodnyuk, E. A. Finkelshtein, A. S. Anikin // J. Glob. Optim. - 2016. - Vol. 66, N 1. - P. 53-64.
Финкельштейн Евгения Александровна, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 453045 (e-mail: [email protected])
Горнов Александр Юрьевич, доктор технических наук, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 453004 (e-mail: [email protected])
Е. Finkelstein, A. Gornov
Algorithm of Quasiuniform Filling of Reachable Set for Nonlinear Control System
Abstract. In this paper, we propose an algorithm of obtaining points that uniformly fill the volume of the reachable set, and even for a small number of elements results in a cloud quasiuniform approximation of the set. To solve the task of finding each additional point is to solve the optimization problem. Minimized function describes the uniformity and depends on the Euclidean distance between the elements of the approximation. It is designed to be equal or close to zero, if the distance exceeds the desired threshold value. Thus, a lower bound for the optimal value of the functional is pre-defined, so we save computing time for the random component of global optimization algorithms. "The tunnel ideology" underlies this algorithm. Besides local descent mechanisms it assumes that there are also transition mechanisms from a local extremum with the current record functional value to lower value extrema attraction domains. As a globalizing mechanism we use a nonlocal search in random directions repeated several times at each iteration of the algorithm. To improve the reliability of the proposed method of algorithm construction a recurrent random multistart is also included. The article includes the results of computational experiments on test examples and its comparison with calculations obtained by the method based on the Pontryagin maximum principle [7]. The designed method of reachable set approximation is applicable for two-dimensional systems and multidimensional ones as well. The experiments showed the efficiency of the approach and results comparison confirmed the accuracy the obtained approximations.
Keywords: reachable set, approximation algorithm, optimal control problem.
References
1. Kamenev G.K. Approximation of completely bounded sets by the deep holes method Comput. Math. Math. Phys., 2001, vol. 41, no 11, pp. 1667-1675.
2. Lotov A.V. A numerical method for constructing sets of attainability for linear controlled systems with phase constraints USSR Comput. Math. Math. Phys., 1975, vol. 15, no 1, pp. 63-74. https://doi.org/10.1016/0041-5553(75)90135-4
3. Panasyuk A.I. Differential equation for nonconvex attainment sets Math. Notes Acad. Sci. USSR, 1985, vol. 37, no 5, pp. 395-400.
4. Tolstonogov A.A. Differential inclusions in a Banach space. Mathematics and its Applications. Kluwer Academic Publishers, Dordrecht, 2000. https://doi.org/10.1007/978-94-015-9490-5
5. Chernousko F.L. State estimation for dynamic systems. CRC Press, Boca Raton, 1994.
6. Baier R., Gerdts M., Xausa I. Approximation of reachable sets using optimal control algorithms Numer. Algebra Control Optim., 2013, vol. 3, no 3, pp. 519-548. https://doi.Org/10.3934/naco.2013.3.519
7. Gornov A.Yu., Zarodnyuk T.S., Finkelshtein E.A., Anikin A.S. The Method of Uniform Monotonous Approximation of the Reachable Set Border for a Controllable System J. Glob. Optim., 2016, vol. 66, no 1, pp. 53-64. https://doi.org/10.1007/sl0898-015-0346-8
Finkelstein Evgeniya Alexandrovna, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov St., Irkutsk, 664033, tel.: (3952) 453045 (e-mail: [email protected])
Gornov Alexander Yurievich, Doctor of Technical Sciences, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, tel.: (3952) 453004 (e-mail: [email protected])