УДК 517.977.1 © М. И. Гусев
МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ В ЗАДАЧЕ ПОСТРОЕНИЯ МНОЖЕСТВ ДОСТИЖИМОСТИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ1
Предложен метод построения внешних аппроксимаций множеств достижимости нелинейных управляемых систем при помощи решений дифференциальных неравенств Гамильтона-Якоби
Ключевые слова: управляемая система, множество достижимости, принцип сравнения.
Введение
В докладе рассматривается задача о построении внешних оценок множеств достижимости нелинейных управляемых систем в виде множеств уровня функций, удовлетворяющих дифференциальным неравенствам Гамильтона-Якоби [1—3]. Рассматриваются применения к эллипсоидальным оценкам множеств достижимости многомерных управляемых систем с нелинейными перекрестными связями.
§1. Внешние аппроксимации множеств достижимости и принцип сравнения
Рассмотрим управляемую систему
X = /¿0 ^ ^ ¿1, (1)
где X € К” — вектор состояния, и € Кг — управление. Считаем, что ограничение на управление и начальный вектор X0 имеет вид и^) € и, £ € [¿0,^1], х(^) = X0 € X0, где и — компакт в Кг, X0 — компакт в К”. Функция /(¿, х,и) непрерывна по совокупности переменных и имеет непрерывные частные производные по X. Пусть С (в) — множество достижимости системы (1) в момент времени в € [¿0, ¿1] из начальных точек X0 € X0. Будем строить внешние оценки для С(в) в виде
С(в) С {X : V(в,X) < W(в)}, (2)
где V(¿, X) — непрерывно дифференцируемая функция, удовлетворяющая дифференциальному неравенству Гамильтона—Якоби (^(¿, V) — заданная функция)
Р*^^) + шах{РХТ(¿^Х/(¿^,и) : и € и} ^ д(^ V(¿^)). (3)
Из принципа сравнения для дифференциальных неравенств вытекает включение (2), если в качестве функции И^(£) взять решение системы (уравнения) сравнения = <?(£, И^"), W(to) = W0 с начальным условием W0 ^ V(^^^ Vx0 € X0. Если исходная управляемая система линейна, а ограничения и и X0 имеют вид эллипсоидов, то функцию V можно искать в виде V(¿,X) = (X — x*(t))ТQ-1(t)(x — x*(í)), где x*(í) некоторое решение исходной системы, ^(¿) — положительно определенная матрица, являющаяся решением дифференциального уравнения Риккати [1]. Свойства оценок определяются непрерывной функцией п^) > 0, входящей в правую часть данного уравнения, в качестве правой части системы сравнения можно выбрать ^(¿, W) = — п(t)W + п^) [4].
В докладе рассматривается нелинейная управляемая система, в правой части которой можно выделить линейную составляющую, для которой считаются известными оценки в виде множеств уровня гладких функций в пространстве состояний. Данные функции удовлетворяют
дифференциальным неравенствам Гамильтона—Якоби, они модифицируются таким образом,
чтобы им удовлетворяли траектории нелинейной системы. В основе предлагаемого метода лежит принцип сравнения.
хРабота поддержана РФФИ (грант № 11-01-12088-офи-м-2011).
§ 2. Численная процедура построения решения дифференциального неравенства Гамильтона-Якоби
Для нелинейной управляемой системы (1) предлагается следующая итерационная процедура построения гладких решений дифференциальных неравенств Гамильтона-Якоби. В момент времени ¿о считается известной гладкая ограничивающая поверхность для множества X0, заданная уравнением V(Ьо,х) = 1. Фиксируется малый шаг по времени ДЬ > 0. Ограничивающая поверхность в момент Ь + ДЬ строится исходя из равенства V(Ь + ДЬ, ж + ДЬЕ(¿, ж)) = V(¿, ж), где Е(Ь, ж) — гладкая по х функция, определенная в точках поверхности V(Ь,ж) = 1 так, чтобы обеспечить выполнение неравенства тах{УХ7(Ь, х)(/(Ь,х,и) : и € и} ^ (Ь, х)Е(¿, ж).
Пересчет градиентов V в точках ограничивающих поверхностей производится по формуле ^(Ь + ДЬ, ж + ДЬЕ(Ь, ж)) = (Е — ДЬЕХ(¿, ж))^Х(Ь, ж), где Е — единичная матрица. В докладе обсуждаются способы выбора функции Е(Ь, ж) и особенности реализации приведенной вычислительной схемы. На приведенных ниже рисунках показаны результаты применения данной процедуры для двух примеров нелинейных управляемых систем 2-го порядка. Отдельные линии показывают ограничивающие поверхности для различных моментов времени.
В заключительной части доклада рассматриваются многомерные системы, состоящие из подсистем простой структуры (например, линейных), связанных между собой нелинейными перекрестными связями, задаваемыми ограниченными функциями [4,5]. На основе оценок для подсистем строится оценка для области достижимости объединенной системы. Метод получения оценок основан на конструкциях, аналогичных соответствующим построениям для векторных функций Ляпунова в теории устойчивости.
1.
2.
3.
4.
5.
Список литературы
Kurzhanski A. B., Valyi I. Ellipsoidal Calculus for Estimation and Control. Birkhauser, Boston, ser. SCFA., 1997. Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Оптимальное управление и динамические системы. Итоги науки и техн. Сер. Совр. мат. и ее прил. Тем. обзор, 110. ВИНИТИ. М. 2006. C. 76-108.
Куржанский А.Б. Принцип сравнения для уравнений типа Гамильтона-Якоби в теории управления // Труды института математики и механики УрО РАН. 2006. Т. 12. № 1. C. 173-183.
Gusev M.I. Estimates of Reachable Sets of Multidimensional Control Systems with Nonlinear Interconnections // Proceedings of the Steklov Institute of Mathematics. Suppl. 2. 2010. Pp. S134-S146.
Гусев М. И. О внешних оценках множеств достижимости нелинейных управляемых систем // Труды Института математики и механики УрО РАН. 2011. Т. 17. № 1. C. 60-69.
Поступила в редакцию 15.02.2012
М. И. Гусев
Dynamic programming method in construction of reachable sets for nonlinear control systems
We offer the method of constructing of outer attainability set approximations for nonlinear control systems via solutions of Hamilton-Jacobi differential inequalities.
Keywords: control system, reachable set, comparison principle.
Mathematical Subject Classifications: 49L20, 34K35
Гусев Михаил Иванович, д.ф-м.н., зав. отделом, Институт математики и механики УрО РАН, 620990, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. E-mail: [email protected]
Gusev Mikhail Ivanovich, Doctor of Physics and Mathematics, Head of Department, Institute of Mathematics and Mechanics, ul. S. Kovalevskoi, 16, Yekaterinburg, 620990, Russia