Симонов Пётр Михайлович
д. ф.-м. и., профессор
Пермский государственный университет
Россия, Пермь
e-mail: [email protected]
Petr Simonov
doctor of phys.-math. sciences, professor Perm State University,
Russia, Perm
e-mail: [email protected]
Чистяков Александр Владимирович к. ф.-м. н., доцент
Удмуртский государственный университет Россия, Ижевск e-mail: [email protected]
Aleksandr Chistyakov
candidate of phys.-math. sciences, senior lecturer
Udmurtian State University Russia, Izhevsk e-mail: [email protected]
УДК 517.977.5
МОНОТОННЫЕ РЕШЕНИЯ НЕРАВЕНСТВ ГАМИЛЬТОНА-ЯКОБИ В ОПТИМАЛЬНОМ УПРАВЛЕНИИ 1
© С. П. Сорокин
Ключевые слова: функции Ляпунова; неравенства Гамильтона-Якоби; множество достижимости; условия оптимальности.
Аннотация: В докладе речь пойдет об оценках множеств достижимости и связанных с ними необходимых и достаточных условиях оптимальности в задачах управления; оценки и условия оптимальности основаны на использовании семейств функций типа Ляпунова - решений неравенств Гамильтона-Якоби.
Решения неравенств и уравнения Гамильтона-Якоби (то есть функции типа Ляпунова, Кротова, Веллмана) находят широкое применение в теории управления при изучении вопросов инвариантности, достижимости, управляемости и оптимальности [1-4]. В докладе речь пойдет об аппроксимациях и точном описании множества достижимости (точнее, множества соединимых точек) управляемой системы, оценках целевого функционала задачи и условиях оптимальности. Ключевую роль в подходе играет оперирование произвольными множествами таких функций.
Приведем некоторые из указанных результатов применительно к следующей задаче оптимального управления (Рд) с общими (не разделенными) концевыми ограничениями:
х = /(Ь,х,п), п(1) £ и, (1)
(ж(£о),ж(£1)) £ С,
1 Работа выполнена при финансовой поддержке РФФИ (проект № 07-01-00741) и СО РАН (интеграционный проект СО РАН-УрО РАН № 85).
= l(x(to),x(ti}) — inf .
Здесь А = [t0, ti] - фиксированный отрезок времени, (x(-),u(•)) £ AC (А, М™) xL^(A, U) - процесс системы, множество U С Мт компактно, C замкнуто, множество скоростей системы f (t,x,U) выпукло, функция f непрерывна и липшицева по x равномерно по (t,u), l - непрерывна.
Введем множество точек, соединимых траекториями системы (1):
R := {(x0,xi) £ М™ х М™ | 3 x(-) : x(t0) = x0, x(ti) = xi}.
Рассмотрим два неравенства Гамильтона-Якоби
Pt(t, x, y) + max{^(t, x, y) ■ f (t, x,u) | u £ U} ^ 0 п.в. на А х М™ х М™, (2)
Pt(t, x, y) + max{^(t, x, y) ■ f (t, x,u) | u £ U} ^ 0 п.в. на А х М™ х М™, (3)
в качестве решений которых будем рассматривать локально липшицевые (для (2)) и локально
липшицевые и полувогнутые по (t, x) (для (3)) функцпп ^(t, x, y), зависящие от y как от пара-
метра и удовлетворяющие условию согласования
<^(t0,x, x) ^ 0 ^ x £ prx0C,
в предположении, что множество prx0C замкнуто. Множество решений неравенства (2) обозначим через Ф+, а неравенства (3) — через Ф_.
Отметим, что функции из Ф+ обладают свойством сильной монотонности — они не возрастают вдоль всех траекторий системы (1), а функции из Ф_ являются слабо монотонными — для каждой р £ Ф_ существует траектория системы (1), вдоль которой р не убывает. Все такие функции мы
L
Введем оценивающее множество, порожденное L-функцией р:
E(р) := {(x0,xi) £ М™ х М™ | р(t1,x1,x0) ^ 0; p(t0,x0,x0) ^ 0}.
Следующая теорема об аппроксимациях и точном описании множества R обобщает некоторые результаты работ [2, 4] на задачи с общими концевыми ограничениями (Рд).
Теорема!., а) Любое множество функций Ф С Ф+ дает внешнюю аппроксимацию множества соединимых точек:
П E(р) D R.
^еФ
б) Любое множество функций Ф С Ф_ дает внутреннюю аппроксимацию множества соединимых точек:
U E(р) С R.
в) Существует такая полувогнутая функция р £ Ф+ П Ф_, что
E (р) = R.
Сделаем ряд замечаний к теореме.
L
может показаться неожиданным, однако оно вполне естественно, так как речь идет об аппрокси-
М™ х М™
L
нацелено на получение предельно подходящих оценок множества соединимых точек, а с другой -
в конкретных задачах это позволяет более широко использовать гладкие ¿-функции [3, 4] вместо существенно негладких (скажем, полунепрерывных).
На основе теоремы 1 получаются нижние и верхние оценки точной нижней грани целево-
(Рд)
локальной и глобальной оптимальности. Отметим, что эти достаточные условия являются предпочтительными по гибкости и удобству в приложениях по сравнению с условиями В.Ф. Кротова и их известными модификациями (например, [5]).
ЛИТЕРАТУРА
1. Clarke F.И., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. Springer-Verlag, N. Y., Grad. Texts in Math. 1998. V. 178.
2. Хруста,лев М.М. Точное описание множеств достижимости и условие глобальной оптимальности динамических систем. I. Оценки и точное описание множеств достижимости и управляемости // Автоматика и телемеханика. 1988. № 5. С. 62-71.
3. Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Итоги науки и техники. Совр. математика и ее приложения. 2006. Т. 110. С. 76-108.
4. Аргучинцев А.В., Дыхта В.А., Срочко В.А. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума // Известия вузов. Математика. 2009. № 1. С. 3-43.
5. Clarke F.H., Nom С. Nonconvex Duality in Optimal Control // SIAM J. Control and Optimization. 2005. V. 43, № 6. P. 2036-2048.
Abstract: the report is devoted to estimating of reachable sets for control dynamic systems and to obtaining necessary and sufficient optimality conditions for optimal control problems; the estimations and the optimality conditions are based on using of a set of Lyapunov type functions, i.e., solutions to Hamilton-Jacobi inequalities.
Keywords: Lyapunov type functions; Hamilton-Jacobi inequalities; reachable set; optimality conditions.
Сорокин Степан Павлович аспирант
Институт динамики систем и теории управления Сибирского отделения РАН Россия, Иркутск e-mail: [email protected]
Stepan Sorokin post-graduate student Institute of System Dynamics and Control Theory of Siberian Department of RAS Russia, Irkutsk e-mail: [email protected]
УДК 519.85
РЕАЛИЗАЦИЯ МЕТОДА ФУЖЕРА 1
© М. В. Старое
Ключевые слова: базисы Гребнера; метод Фужера; модулярные методы.
Аннотация: Строится алгоритм вычисления базиса Гребнера методом Фужера F4; этот алгоритм реализован модулярно с применением метода CRT (Китайской теоремы об остатках).
1Работа выполнена при поддержке программы "Развитие потенциала высшей школы" (проект 2.1.1/1853).