УДК 517.977 ББК 22.161.8
В. И. Гурман, И. В. Расина, О. В. Фесько
О практических преобразованиях вырожденных задач оптимального управления
Аннотация. Рассматривается схема применения параметризованной модели управления для преобразования системы с неограниченными управляющими воздействиями к новой модели, регулярной с точки зрения применения известных общих методов оптимального управления. Заданный временной отрезок разбивается на конечное число элементарных, и рассматривается семейство таких преобразований, из которых выбирается конкретное для каждого элементарного отрезка. В результате получается управляемая система, в определенном смысле эквивалентная исходной, с которой можно оперировать как с обычной. При этом ее решение в исходном классе реализуется как импульсный режим.
Ключевые слова и фразы: оптимальное управление, параметризация, вырожденные задачи, обобщенные решения, импульсные режимы.
Введение
Математическое моделирование разнообразных процессов и систем тесно взаимосвязано с проблемой принятия решений, в том числе оптимальных. С этой целью строятся математические модели объектов, удобные для применения математических методов, в том числе методов современной теории оптимального управления, основы которой составляют принцип максимума Л.С. Понтрягина [1], метод динамического программирования [2], достаточные условия В.Ф. Кротова [3,4]. Во многих достаточно регулярных случаях типичное предположение о классе процессов управления, в котором ищется оптимальное (кусочная непрерывность, при котором строятся такие модели), дает возможность непосредственной практической
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект №12-01-00256.
© В. И. Гурман, И. В. Расина, О. В. ФЕсько, 2013
© ИПС им.А.К. Айламазяна РАН, 2013
© Сибирская академия права, экономики и управления, 2013
© Программные системы: теория и приложения, 2013
реализации получаемых решений. Однако также типичны и нерегулярные ситуации, характерные для нелинейных систем, когда решение в рассматриваемом классе не достигается, и речь идет о бесконечной минимизирующей последовательности, причем число переключений управления и/или величина управляющего воздействия неограниченно растет. Разумеется, возможны и регулярные ситуации, при которых число переключений оптимального управления ограничено, но достаточно велико, либо оно меняется слишком быстро с точки зрения применения реальных управляющих устройств. В таких случаях встает проблема изменения исходной модели так, чтобы она учитывала возможности практической реализации. Естественный путь ее решения — параметризация программ управления, когда множество допустимых составляют параметрические семейства процессов определенного типа с достаточно богатым набором параметров. При этом получаются модели и задачи той или иной общности. Как частный случай параметризации выступает дискретизация непрерывных систем путем задания на дискретных шагах непрерывного управления постоянным, линейным и возможно более сложным (с большим числом параметров). В [5-7] подробно рассматриваются дискретизованные модели управления простой структуры с постоянным и линейным законом изменения на шагах. Они приводят к двухуровневым дискретно-непрерывным моделям, которые можно рассматривать как частный случай более общего класса моделей, ориентированных на представление и исследование разнообразных систем неоднородной структуры [8-10], которые широко представлены в литературе под различными терминами, такими как системы переменной структуры [11], дискретно-непрерывные системы [12], логико-динамические системы [13], гибридные системы [14] и т.п.
Часто к дискретизации прибегают для приближенного решения задач оптимального управления, непрерывных в исходной постановке (например, с помощью развитых пакетов нелинейного программирования [15]), однако область применения подобных моделей значительно шире.
В данной статье рассматривается применение дискретизованной модели с кусочно-постоянным управлением для эффективного преобразования непрерывной системы с неограниченными управляющими
воздействиями и соответствующей ей вырожденной задачи оптимального управления к новой модели, регулярной с точки зрения применения известных общих методов оптимального управления.
В ряде работ, посвященных вырожденным задачам (см., например, [16] и обзор [17]), предложены методы решения таких задач, состоящие по существу в исключении пассивных дифференциальных связей, которые как раз и делают подобные задачи нерегулярными. Это выполняется путем специального преобразования исходной задачи к регулярной производной задаче меньшего порядка. В случае одного управления, линейного и неограниченного, такое преобразование практически однозначно. В случае нескольких управлений, например, когда коэффициенты при линейном управлении зависят от другого управления, появляются различные возможные варианты подобных преобразований.
Цель статьи — рассмотреть важную для практики нетрадиционную схему, в которой одновременно участвуют различные варианты. Заданный временной отрезок разбивается на конечное число элементарных, и рассматривается семейство таких преобразований, из которых выбирается конкретное для каждого элементарного промежутка путем применения модели простой структуры [5-7] с кусочно-постоянным управлением. В результате получается управляемая система, в определенном смысле эквивалентная исходной, с которой можно оперировать как с обычной. При этом ее решение в исходном классе реализуется как импульсный режим. Важно подчеркнуть, что лишь применение указанной модели простой структуры обеспечивает ее эквивалентность исходной. В качестве содержательного примера рассматривается характерный тип управления квантовыми системами.
1. Постановка задачи. Предельная и производная системы
Рассматривается задача оптимального управления для системы с неограниченным линейным управлением вида
(1)
х = д(х) + К(х,у)и, ге Т = [г/,гР], х е мп, и е м, « е V, х (Ь[) = Х[, I = Т (х (£р)) ^ М, где К (£, х, у) — п х 1-матрица, функции д (х), К (х, у), Т(х) предполагаются непрерывными. Допустимыми решениями считаются пары, где х( ) непрерывные, кусочно-гладкие, и( ) — кусочно-непрерывные.
В соответствии с общей теорией вырожденных задач [16, 17] строится соответствующая предельная система
описывающая асимптотически поведение исходной (1) при больших скоростях. Это автономная система, и ее траектории в пространстве х инвариантны при любом постоянном V. Возможны интегральные многообразия большей размерности. С практической точки зрения эти интегралы удобно представлять в параметрической форме у = ц(х,т). Строится производная система как полная производная ц(х,т) в силу исходной системы (1)
где £(у, т) — обращение у = ц(х, т). Очевидно, она имеет фактически меньший порядок, чем исходная (1) (поскольку параметр т можно исключить), не зависит от линейного управления и и в то же время эквивалентна исходной в том смысле, что любая ее траектория аппроксимируется по мере последовательностью траекторий исходной.
Множество скоростей предельной системы в рассматриваемом здесь случае представляет собой некоторый пучок прямых, проходящих через начало координат. Это означает, что она вполне управляема на любом своем интегральном (инвариантном) многообразии. Для простоты предполагается, что векторы к (х,у) коммутативны, иначе должна быть построена их алгебра Ли, и рассматриваться ее линейная оболочка [18,19].
Рассмотрим случай, когда используется семейство инвариантов.
2. Преобразование с использованием семейства производных систем
В системах (1), (2) матричный коэффициент к (х,у) содержит управление V. Возможны различные схемы, позволяющие применить хорошо известное преобразование для случая «изолированного» линейного управления. Наиболее простая и «очевидная» состоит в том, чтобы найти интеграл предельной системы при условии, что V постоянно, у = ц(х,т,у), зафиксировать некоторую программу как функциональный параметр, выписать соответствующую
(2)
(3)
у = 'Пхд(х), х = £(у,т,у),
производную систему (как полную производную от у = ц(х,т,у*(1;)) в силу исходной системы (1))
У = 'Пх9(х) + ^ 2, 2 = V*, X = £{у,т,у),
и затем варьировать на всем отрезке. Здесь £{у, т, у) и ц(х, т, у) имеют смысл общего решения системы (2) при постоянном V и его обращения. В качестве константы общего решения удобно взять начальное значение х (при т = 0). Тогда £{у, 0,у) = у и г/(х, 0, у) = х.
Если использовать специальный класс программ — кусочно-постоянных, и переходить к традиционной производной системе на интервалах постоянства, то на каждом таком интервале получается семейство производных систем с параметром V, из которого можно выбирать конкретную в начальной точке интервала.
Поскольку кусочно-постоянная функция аппроксимирует кусочно-непрерывную с любой точностью с уменьшением интервалов, то в пределе приходим к некоторой управляемой системе, полученной по правилам преобразования для случая линейного «изолированного» управления:
(4) у = Лхд{х), X = £{у,т,ь).
При этом на границах участков обеспечивается непрерывность у так, чтобы ур {Ьк) = У1 (¿к+1). Для этого достаточно положить т {^к) =0 в изолированных точках ^ с учетом свойств отображений X = €{у,т,ь), у = ц(х,т,ю).
Таким образом, исходная задача сводится к задаче с тем же функционалом для системы (4), где т и V играют роль управлений. Очевидно, ее решения инвариантны относительно значений управлений в изолированных точках, и их можно задавать с другими целями. В данном случае т (Ьь) = 0 задаются с целью реализации (аппроксимации исходной задачи) полученного решения новой задачи. Соответствующая аппроксимирующая последовательность строится так, как описано в конструктивном доказательстве Теоремы 2.4 из [20]. Для удобства исходная система на каждом элементарном участке записывается в новых переменных как производная, дополненная уравнением т = и. Основной шаг в этой процедуре сводится к аппроксимации кусочно-непрерывной функции т(I) в окрестностях точек разрыва решениями уравнения т = и при |м| ^ то. Решение системы (4), получаемое при своих кусочно-непрерывных управлениях и(Ь), т{£), можно рассматривать как обобщенное решение
исходной. Согласно терминологии [20], такое решение называется импульсным скользящим режимом.
Функционал I = Т (х (1 р)) в новых переменных записывается
как
I = ТУ (у (гр), т (гр) ,у (гР)), ту (у, т, у) = Т (£ (у, т, у)),
где т (Ьр), у (Ьр) не зависят от программ т(Ь), у(Ь) на промежутке (ЬI, Ь р), так что операцию минимума по ним можно выполнить априори, и функционал производной задачи задать стандартным образом как функцию конечного состояния:
3 = б (у ^Р)), Я(у) = шт Ту (у, т, у).
Семейства интегралов предельной системы и соответствующих производных систем под названием «сопровождающие системы» применялись ранее в [21,22] для исследования особых режимов, в частности, для вывода нетривиальных необходимых условий оптимальности, дополняющих принцип максимума Понтрягина. В данном случае речь идет о нетрадиционном преобразовании с помощью такого семейства исходной системы с линейным управлением к новой системе, которая также является релаксационным расширением исходной, но более сложным. Чтобы не вводить новых терминов, будем ее также назвать сопровождающей системой.
3. Пример. Преобразования управляемого уравнения Шредингера
Рассматривается уравнение Шредингера вида (см., например, [23])
(5) ¿= —Н(и, у)г, Н = Н0 + (у)]и, уе V С Мр,
где г — комплексная единица, Но — постоянная действительная симметричная матрица, описывающая взаимодействие спинов, ( ) — комплекснозначная кусочно дифференцируемая п-мерная вектор-функция, ( ) — кусочно непрерывная -мерная вектор-функция, V — компактное множество, К^ (у) — действительные непрерывные функции.
Для него выписывается соответствующая предельная система ¿х
(6) (у)}и.
Находится семейство интегралов
т = т, V) = &\^{егЬ!:>}х
предельной системы с параметром V и соответствующее семейство производных систем
(7) ю = -¡¿.[^{е1^(у)т }Но&^{е-Ш>(у)т }-ш.
Начальное состояние на каждом элементарном участке получается при Т[ = 0: и)[ = г[. Далее делается переход к действительным переменным, строится итерационный процесс улучшения в соответствующей дискретной системе.
Расчеты проводились для цепочки из трех спинов, где
/ -110 \ / (-V)2 0 0 \
Но = I 1 -2 1 I , Ь(и) = I 0 (1 - V)2 0 I ,
\ 0 1 -1 ) \ 0 0 (2 - V)2 )
— кусочно-постоянна.
Производная система в действительных переменных (с учетом известной формулы гп = хп + гу^+") получается следующей:
У! = вт((2у - 1)т)у2 + сов((2у - 1)т)у5 - уА, У2 = - 8ш((2-У - 1)т)у! + сои((2у - 1)т)у4+
+ 8ш((2-у - 3)т)уз + сов((2ь - 3)т)у6 - 2у5, Уз = - вт((2у - 3)т)У2 + сов((2у - 3)т)у5 - у6, У4 = - сов((2у - 1)т)у2 + вт((2у - 1)т)у5 + ух, у5 = - сов((2у - 1)т)у! - вт((2у - 1)т)у4-
- сов((2ь - 3)т)уз + вт((2-у - 3)т)у6 + 2у2, Ув = - сов((2у - 3)т)у2 - вт((2у - 3)т)у5 + у3, у (0) = (1,0,0,0,0,0)т, 1т 1< 3, н< 3, г е [0,1]. Минимизируемый функционал производной задачи в действительных переменных: 3 = 2 - 2^(уз)"2 + (ув)"2.
Производная система была дискретизирована и была поставлена задача улучшения начального кусочно-постоянного управления с помощью метода, подробно описанного в работе [24], для различного числа шагов дискретной системы. В качестве начального управления
были взяты т = 0, V = 2. Значение функционала на этом управлении 30 = 1.17989.
В таблице 1 содержатся найденные в процессе улучшения управления значения функционала 3 для различного числа шагов р. Из этой таблицы следует, что с увеличением значение функционала уменьшается. На рис. 1 изображены оптимальные траектории при р = 100, а на рис. 2 представлены оптимальные кусочно-постоянные управления.
Таблица 1. Таблица результатов
Число шагов, р 5 10 15 30 50 100
Значение функционала 3 1.15812 1.15651 1.15620 1.15602 1.15597 1.15595
1.2
■0.8--1--1--1--1-1-г
0 0.2 0.4 0.6 0.8 1 f
Рис. 1. Оптимальные траектории, р = 100
р=
2.5-,
15
2-
2-х р=10
1
0-
-1 -
2.5 —I
р=30
21.5 ? 1
0.50-0.5
0.2 0.4 0.6 0.8 1
1.2-, р=100
0.8
0.43
0-0.4
—I—1—I—1—I—1—Г
0.2 0.4 0.6 0.{
0.2 0.4 0.6 0.8 1
г
0.2 0.4 0.6 0.8 1
Рис. 2. Оптимальные кусочно-постоянные управления V, г для различного числа шагов дискретной системы
Заключение
Рассмотренное преобразование не всегда может быть выполнено в явном виде, поскольку связано с нахождением интегралов вообще говоря нелинейной предельной системы. Тогда его можно выполнять неявно или приближенно и встраивать в различные итерационные процедуры оптимизации. В то же время существуют практически важные классы управляемых систем, для которых возможны явные преобразования, выполнимые априори безотносительно к какой-либо конкретной задаче.
К таковым относится рассмотренная в качестве примера система на основе уравнения Шредингера. Соответствующая система, полученная в результате априорных преобразований и эквивалентная в определенном смысле исходной системе при сильных управляющих воздействиях, фактически может рассматриваться как новая модель управления, удобная для использования не только при оптимизации управлений, но и для других целей. В этом смысле она представляет самостоятельный интерес для теории и приложений.
Список литературы
[1] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М. : Физматгиз, 1961. f[]
[2] Беллман Р. Динамическое программирование. М. : ИЛ, 1960. f[]
[3] Кротов В. Ф. Методы решения вариационных .задач на основе достаточных условий абсолютного минимума // АиТ, 1962, № 12, с. 1571—1583. f[]
[4] Кротов В. Ф. Достаточные условия оптимальности для дискретных управляемых систем // ДАН СССР, 1967. Т. 172, № 1, с. 18-21. f[]
[5] Фесько О. В. Параллельный алгоритм оптимизации динамических систем на множестве кусочно-линейных управлений // Вестник Бурятского гос. ун-та. Матем. и информатика, 2010, № 9, с. 79-87. f[]
[6] Фесько О. В. Алгоритм поиска кусочно-линейного управления с нефиксированными моментами переключений // Вестник Бурятского гос. ун-та. Матем. и информатика, 2011, № 9, с. 52-56. f
[7] Fesko O. A 'parallel approach to improvement and estimation of the approximate optimal control // Journal of Computational Science, 2012. Vol. 3, no. 6, p. 486-491. f[]
[8] Гурман В. И., Расина И. В. Сложные процессы — Новосибирск : Наука, 1990, с. 84—94. f[]
[9] Гурман В. И., Расина И. В. Дискретно-непрерывные представления импульсных решений управляемых систем // АиТ, 2012, № 8, с. 16-29. f
[10] Расина И. В. Дискретно-непрерывные модели и оптимизация управляемых процессов // Программные системы: теория и приложения, 2011, №5(9), с. 49-72. f[]
Емельянов С. В. Теория систем с переменной структурой. М. : Наука, 1970. t[]
Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973. t[]
Васильев С. Н. Теория и применение логико-управляемых систем // Труды 2-ой Международной конференции «Идентификация систем и задачи управления» (SICPRO'03), 2003, c. 23-52. t[]
Точилин П. А., Куржанский А. Б. Задачи достижимости и синтеза управлений для гибридных систем. М. : МГУ, 2008. t[]
Evtushenko Yu.G., Grachev N.I. A library of programs for solving optimal control problems // Comput. Maths. Math. Phys., 1980. Vol. 19, no. 2, p. 99119. t[]
Гурман В. И. Вырожденные задачи оптимального управления. М. : Наука, 1977. t[], 1
Гурман В. И., Ни М. К. Вырожденные .задачи оптимального управления // АиТ, 2011, №3, 4, 5, с. 36-50, 57-70, 32-46. t[], 1
Гурман В. И., Ни М. К. Траектории импульсных режимов управляемых систем // Изв. ИГУ, 2009. Т. 2, № 1, с. 170-182. t1
Аграчев А. А., Сачков Ю. Л. Геометрическая теория управления. М. : Физматлит, 2005. t1
Гурман В. И. Принцип расширения в задачах управления. М. : Физматлит, 1997. t2
Gurman V. I. Singular solutions and 'perturbations in control systems // Singularization of Control Systems. IFAC Proc. Ser.. — Laxenburg, 1997, p. 512. t2
Гурман В. И. Метод кратных максимумов и условия оптимальности особых экстремалей // Дифференциальные уравнения, 2004. Т. 40, № 11. t2
Murphy M., Montangero S., Giovannetti V., Calarco T. Communication at the Quantum Speed Limit Along a Spin Chain // Phys. Rev. Lett., 2010. t3 Гурман В. И., Трушкова Е. А. Приближенные методы оптимизации управляемых процессов // Программные системы: теория и приложения, 2010, №4(4), c. 85-104. t3
Рекомендовал к публикации д.т.н. В. И. Гурман
Об авторах:
Владимир Иосифович Гурман д.т.н., профессор, г.н.с. ИЦСА ИПС им. А.К. Айламазяна РАН
e-mail: vig70@mail.ru
Ирина Викторовна Расина к.ф.-м.н., доцент, зав. каф. математики и естествознания Сибирской академии права, экономики и управления
e-mail: irinarasina@gmail.com
Олесь Владимирович Фесько
аспирант ИЦСА ИПС им. А.К. Айламазяна РАН
e-mail: oles.fesko@live.com
Образец ссылки на эту публикацию:
В. И. Гурман, И. В. Расина, О. В. Фесько. О практических преобразованиях вырожденных задач оптимального управления // Программные системы: теория и приложения : электрон. научн. журн. 2013. Т. 4, №2(16), с. 71-82.
URL:
http://psta.psiras.ru/read/psta2013_2_71-82.pdf
V. I. Gurman, I. V. Rasina, O. V. Fesko. Practical transformation of degenerate optimal control problems.
Abstract. The paper devoted to application of parametrized control model for transformation of system with unconstrained control to a new regular model. The time interval is devided by finite numer of intervals and family of transformations is considered. For every single interval a concrete transformation is used. As a result, we have a controllable system that can be manipulated as a regular. The solution of the problem is realized as a pulse mode in original class.
Key Words and Phrases: optimal control, parameterization, degenerate problem, generalized solution, pulse mode.