Научная статья на тему 'Об одной процедуре нелокального улучшения управлений в квадратичных по состоянию системах с терминальными ограничениями'

Об одной процедуре нелокального улучшения управлений в квадратичных по состоянию системах с терминальными ограничениями Текст научной статьи по специальности «Математика»

CC BY
54
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / OPTIMAL CONTROL PROBLEM / ТЕРМИНАЛЬНЫЕ ОГРАНИЧЕНИЯ / TERMINAL CONSTRAINTS / УСЛОВИЯ УЛУЧШЕНИЯ УПРАВЛЕНИЯ / CONDITIONS FOR IMPROVING CONTROL / ИТЕРАЦИОННЫЙ ПРОЦЕСС / ITERATIVE PROCESS

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович

В статье предложен подход к нелокальному улучшению управлений в классе квадратичных по состоянию и линейных по управлению задач оптимального управления с частично закрепленным правым концом на основе решения системы функциональных уравнений в пространстве управлений, которая определяет условия нелокального улучшения управления. Для решения рассматриваемой системы применяется итерационный процесс, на каждой итерации которого решается скалярное уравнение. Процедура обеспечивает улучшение допустимого управления без процедуры варьирования с сохранением всех терминальных ограничений и используется для итерационного метода решения задачи с ограничениями. Сравнительная эффективность метода иллюстрируется на модельной задаче.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On a Certain Procedure of Non-Local Improvement of Controls in Quadric-in-State Systems with Terminal Restrictions

In the article we propose an approach to nonlocal improvement of controls in the class of quadratic-in-state and linear problems of optimal control with a partially fixed right end based on the solution of a system of functional equations in the space of controls that determines the conditions for nonlocal management improvement. To solve the system under consideration we use an iterative process, and the scalar equation is solved at each iteration. The procedure ensures the improvement of permissible control without variation and with preservation of all terminal constraints and is used for solving a constrained problem using an iterative. Comparative efficiency of the method is illustrated on the model problem.

Текст научной работы на тему «Об одной процедуре нелокального улучшения управлений в квадратичных по состоянию системах с терминальными ограничениями»

УДК 517.977

DOI: 10.18101/2304-5728-2018-2-42-49

ОБ ОДНОЙ ПРОЦЕДУРЕ НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЕНИЙ В КВАДРАТИЧНЫХ ПО СОСТОЯНИЮ СИСТЕМАХ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1

© Трунин Дмитрий Олегович

кандидат физико-математических наук, старший преподаватель, Бурятский государственный университет Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: tdobsu@yandex.ru

В статье предложен подход к нелокальному улучшению управлений в классе квадратичных по состоянию и линейных по управлению задач оптимального управления с частично закрепленным правым концом на основе решения системы функциональных уравнений в пространстве управлений, которая определяет условия нелокального улучшения управления. Для решения рассматриваемой системы применяется итерационный процесс, на каяедой итерации которого решается скалярное уравнение. Процедура обеспечивает улучшение допустимого управления без процедуры варьирования с сохранением всех терминальных ограничений и используется для итерационного метода решения задачи с ограничениями. Сравнительная эффективность метода иллюстрируется на модельной задаче.

Ключевые слова: задача оптимального управления; терминальные ограничения; условия улучшения управления; итерационный процесс.

Введение

В статье [6] к нелокальному улучшению управлений в квадратичных по состоянию задачах оптимального управления с частично закрепленным правым концом с выполнением всех терминальных ограничений предлагается подход возмущений, основанный на выделении линейной по состоянию части и параметризации нелинейной части с помощью параметра возмущения. В данной статье для нелокального улучшения допустимых управлений в рассматриваемом классе задач предлагается итерационная процедура для решения системы функциональных уравнений в пространстве управлений, определяющей условия нелокального улучшения.

1. Постановка задачи

Рассматривается класс задач оптимального управления с терминальными ограничениями, приводимых к квадратичной по состоянию и линейной по управлению задаче оптимального управления с одним терминальным ограничением

1 Работа выполнена при финансовой поддержке МОН РФ, проект 1.5049.2017/БЧ; РФФИ, проект 18-41-030005-р_а

x = A(x,t)u + b(x,t), teT = [t0, tx\ (1)

x(t0) = x°, и (0 et/, (2)

Ф(и) = (с, x(Yj )) —» min, (3)

х1(0 = х11. (4)

Здесь функции A{x,t) и b{x,t) квадратичны по х и непрерывны по t на R" хТ , с е R" — заданный вектор, причем сх = 0 , действительное число х/ задано.

Под доступными управлениями в задаче (1)-(4) будем понимать кусочно-непрерывные на отрезке Т функции со значениями в множестве

V = {uePCr(T):u(t)eU, tel).

Здесь U <^Rr — компактное выпуклое множество.

Для доступного управления ueV обозначим x(t,u), teT (соответствующая фазовая траектория) — решение начальной задачи (1), (2) при и = u(t).

Будем полагать, что каждому доступному управлению соответствует единственная фазовая траектория.

Под допустимыми управлениями будем понимать доступные управления, если выполнено терминальное ограничение (4)

W = {и е V : Xj(ÎJ,M) = х/}.

В задаче (1)-(4) определим функцию Понтрягина

Н(р, x,u,t) = H0 (р, х, 0 + (#! (р, х, 0, и), где H0(p,x,t) = (p, b(x,t)), Hx(p,x,t) = A(x,t)Tp.

Рассмотрим функционал Лагранжа в регулярном случае L(u,Я) = (с,x(Yj)) + /l(xj(Yj) -х/), le R.

В соответствии с [2] имеет место точная (не содержащая остаточных членов разложения) формула приращения функционала Лагранжа

где (ï/'.vj —доступные управления, p(t,u°,v,X) —решение модифицированной сопряженной системы

Р = ~нх(р,x-u-t) ~\НXX(Р>х-и-0У> p1(t1) = -À,

Р,(0 = -с„ ' = 2, И, при и = U°(t), X = x(t,u°), у = x(t,v) - x(t,u°).

Для доступного управления и0 <еУ и фиксированного параметра проектирования а > 0 образуем аналогично [2] вектор-функцию

иа(р,х,0 = Ри(и°(0 + аН1(р,х^)), реЯ", хеГ, а>0,

где Ри — оператор проектирования на множество II в евклидовой норме.

В статье [6] показано, что для нелокального улучшения допустимого управления и0 е Ж можно решить следующую краевую задачу х = А(х^)иа(р,х^) + Ъ(х, 0, ¿еТ7,

р = -Нх (р, хЦ,и°),и° (0,0 - (р, хЦ,и°), и°( 0,0(* " х(Г, и0)), 1(^о) — > (^1) — '

= = 2,и.

Легко видеть, что краевая задача (5) эквивалентна системе функциональных уравнений в пространстве управлений

у^) = иа(р^,и°,у,Л)М(,у)Л а>0, ТеТ, ЛеЯ,

(6)

Для решения системы функциональных уравнений (6) предлагается итерационный процесс на основе специальной процедуры решения эквивалентной краевой задачи (5).

2. Процедура решения

Для решения краевой задачи (5) предлагается итерационный процесс с индексом к > 0

хш =А(хк+\()иа(рк+\хк+\() + Ь(хк+\(), (еТ = [(0,

хк+\(0) = х°, хк+\(1) = х\, (7)

рк+* =-Нх(рк+\х«,и°),и°( 0,0"

рк+\0 = -с{, / = 2Я При к = 0 задается начальное приближение х°(0 = х(/, у"), V0 е V, I е /'.

В задаче (7) уравнение для сопряженных переменных не зависит от х. Таким образом, к решению задачи (7) можно применить в аналогии с [6] модификацию известного [5] метода стрельбы.

Положим р1 (/,) = /;. где /; е И — неизвестный параметр, подлежащий определению.

Обозначим через р" (0, < е Т решение начальной задачи

р = -Нх(р,х(Г,и0),и°(^)-

РЛО = И> Pi(0 = ~ci> i = 2,n.

Обозначим через хц (/). / е Т решение задачи Коши

х = A(x,t)ua(pM(t),x,t) + b(x,t), teT, x(t0) = x°.

Тогда решение задачи (7) сводится к нахождению решения уравнения

<(о=*;. (8)

Пусть (xk+l(t),pk+l(t)}, teT —решение краевой задачи (7). Тогда

pk+l{t) = p{t,u\vkX),

где Хк =-pk+l(tl).

Сформируем выходное управление

v*+1 (0 = иа(pk+lit),xk+l(t),t), teT. Понятно, что xk+l(t) = x(i.vk 1 ), teT.

Отсюда возникает итерационный процесс

vk+l(t) = ua(p(t,u°,vk,Äk)Mt,vk+l),t), teT

xl(tl,vk+l) = x\.

Этот процесс рассматривается для реализации условия (6). В качестве начального приближения итерационного процесса (9) выбирается управление V0 е V.

Сходимость итерационного процесса (9) можно обосновать с помощью подхода возмущений в аналогии с [2].

Итерационный процесс (9) продолжается до первого улучшения управления и0. Далее строится задача улучшения для полученного управления и процесс повторяется. Критерием остановки итераций улучшения управления является отсутствие улучшения управления по целевому функционалу.

3. Результаты расчетов

Рассматривается квадратичная по состоянию задача оптимального управления иммунным процессом. В безразмерной форме управляемая модель имеет вид [4]

Х| — Х| /?2 Х^ Х2 ; t £ Т — ^ 0 ; J ; x2=h4(x3-x2)-\x1x2, u(t)e [О, итах], teT, Х^ — ^^з ^ Х3 1),

х4 =h6xl -й7х4, (10)

Xj (0) = xf > 0, х2(0) = 1, х3(0) = 1, х4(0) = 0, Ф0 (и) = Xj (tx ) —» min,

к

jx4(t)dt<m, m>0. (11)

о

Здесь Xj = Xj (t) — инфекционное начало (вирус), переменные х2 = х2 (t), х3 = х3 (t) характеризуют защитные силы организма,

х4 = х4 (t) — степень поражения организма, /г >0, i = 1.8 — заданные постоянные коэффициенты. Начальные условия имитируют ситуацию заражения организма малой начальной дозой вируса в начальный момент времени t = 0. Управляющее воздействие u{t), teT характеризует интенсивность введения иммуноглобулинов. Управление u(t) = 0, teT соответствует случаю отсутствия лечения; в этом случае модель описывает острое течение заболевания с выздоровлением.

Значения коэффициентов в рассматриваемом случае

й> =2, h2 = 0.8, h3 =104, h4 = 0.17, h5 =0.5, h6 =10, h, =0.12, hg =8, m = 0.1. Начальное значение х" задавалось равным 10~б.

В рассматриваемом случае единица времени соответствует одним суткам. Максимальное значение управляющего воздействия задавалось равным итях = 0.5. Отрезок времени Т задавался равным 20 суткам: /, = 20.

Целью управления является минимизация концентрации вируса к концу лечения на заданном интервале времени при ограничении поражения организма с помощью введения иммуноглобулинов, нейтрализующих вирус.

Наличие ограничения (11) существенно при моделировании острой формы вирусного заболевания, когда последствиями поражения организма нельзя пренебрегать и одной из целей лечения ставится ограничение суммарной нагрузки поражения организма.

Интегральное условие (11) стандартным образом с помощью введения дополнительной переменной по правилу

х5 = х4, х5 (0) = 0 (12)

сводилось к терминальному условию.

В итоге рассматриваемая задача (10), (11) приводилась к квадратичной по состоянию задаче с ограничением вида

х5(^)<т, т>0. (13)

В ходе вычислительных экспериментов была установлена активность функционального ограничения-неравенства (13) и рассматривалась задача оптимального управления с частично закрепленным правым концом

Ф1(и) = х5(Г1)-т = 0, т>0. (14)

К решению задачи (10), (12), (14) применялись метод нелокального улучшения (М2) с реализацией по правилу (7), (8) и метод штрафов (М1), состоящий в решении последовательности задач оптимального управления со свободным правым концом с целевым функционалом вида (штрафной функционал)

Ф(и) = Ф0(и) + ^Oj2(m) —» min, (15)

где параметр штрафа ys> 0, s>\.

Расчет вспомогательных задач (10), (12), (15) осуществлялся методом условного градиента [3]. Практическим критерием остановки расчета штрафной задачи при фиксированном значении параметра штрафа у!, > 0 являлось условие

\ф(ик+1)~ Ф(и*)| <ех |ф(г/)|, (16)

где к > 0 — номер внутренней итерации метода условного градиента, ^ =10 5.

При выполнении условия (16), если не выполнялось достижение заданной точности выполнения терминального ограничения

\х5(^,ик+1)-т\ <е2, (17)

где е2 = 10 1. то происходил пересчет параметра штрафа у, > 0 по правилу

Г.+1 = РУ:, ■

Расчет новой штрафной задачи производился с полученного управления ик+1 в качестве начального приближения для метода условного градиента.

Начальное значение параметра штрафа у0 задавалось равным 10" . Значение множителя ¡3 > 1 задавалось равным 10.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Окончательным критерием остановки расчета методом М1 являлось одновременное достижение условий (16) и (17).

В методе М2 расчет решения уравнения (8) осуществлялся с помощью стандартной процедуры пакета программ Фортран ёитро1 [1], реализующей метод деформируемого многогранника, с критерием (17) для достижения заданной точности выполнения терминального ограничения.

Практическим критерием остановки расчета задачи в методе М2 являлось условие

|ф0(ы*+1)-Фо("*)|<фо("*)|, где к > 0 — номер итерации, = 10 \

В качестве начального приближения в обоих методах выбиралось управление = 0, Т.

Сравнительные результаты расчетов приводятся в таблице 1. _Таблица 1

Метод Фо N Примечание

М1 2.686698х1019 1.854861 х 10~5 464 10"6

М2 1.172261 х Ю~20 1.534792х10"5 88 103

В таблице 1 Ф0 — расчетное значение целевого функционала задачи, [ф^ — модуль расчетного значения функционала-ограничения (14), N — суммарное количество решенных задач Коши. В примечании для метода М1 приведено значение параметра штрафа, при котором обеспе-

чивается заданная точность (17) выполнения терминального ограничения, для предлагаемого метода М2 — значение проекционного параметра а, обеспечивающего сходимость.

Расчетное управление в методах М1 и М2 с точностью до суток является кусочно-постоянной функцией с точкой переключения в момент ( = 5 с максимального значения на минимальное и обратного переключения в момент 1 = 14.

В рамках примера предлагаемый подход позволяет достигнуть существенного снижения вычислительной трудоемкости по сравнению со стандартным штрафным методом.

Заключение

Предлагаемая процедура нелокального улучшения допустимых управлений в рассматриваемом классе задач характеризуется отсутствием процедуры варьирования в малой окрестности улучшаемого управления, характерной для локальных методов, а также точным выполнением терминальных ограничений. Указанные свойства обеспечивают повышенную эффективность предложенной процедуры в решении задач оптимального управления с функциональными ограничениями по сравнению со стандартными методами.

Литература

1. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека ШКЬ. М.: Диалог-МИФИ, 2001. Ч. 2. 320 с.

2. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят, гос. ун-та, 2008. 260 с.

3. Васильев О. В. Лекции по методам оптимизации. Иркутск: Изд-во Иркут. гос. ун-та, 1994. 340 с.

4. Марчук Г. И. Математические модели в иммунологии. Вычислительные методы и алгоритмы. М.: Наука, 1991. 304 с.

5. Самарский А. А., Гулин А. В. Численные методы. М.: Наука, 1989. 432 с.

6. Трунин Д. О. Об одном подходе к нелокальному улучшению управлений в квадратичных по состоянию системах с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2017. № 2. С. 40-45. Б01: 10.18101/2304-5728-2017-2-40-45.

ON A CERTAIN PROCEDURE OF NON-LOCAL IMPROVEMENT OF CONTROLS IN QUADRIC-IN-STATE SYSTEMS WITH TERMINAL RESTRICTIONS

Dmitriy O. Trunin

Cand. Sci. (Phys. and Math.), Senior Lecturer, Buryat State University 24a Smolina St., Ulan-Ude 670000, Russia E-mail: tdobsu@yandex.ru

In the article we propose an approach to nonlocal improvement of controls in the class of quadratic-in-state and linear problems of optimal control with a partially fixed right end based on the solution of a system of functional equations in the space of controls that determines the conditions for nonlocal management improvement. To solve the system under consideration we use an iterative process, and the scalar equation is solved at each iteration. The procedure ensures the improvement of permissible control without variation and with preservation of all terminal constraints and is used for solving a constrained problem using an iterative. Comparative efficiency of the method is illustrated on the model problem. Keywords: optimal control problem; terminal constraints; conditions for improving control; iterative process.

References

1. Barten'ev O. V. Fortran cllya professionalov. Matematicheskaya biblioteka IMSL [Fortran for Professionals. IMSL Mathematical Library], Moscow: Dialog-MIFI Publ., 2001. Part 2. 320 p.

2. Buldaev A. S. Metody vozmushchenii v zadachakh uluchsheniya i optimizatsii upravlyaemykh sistem [Perturbation Methods in Problems of Improving and Optimizing Controlled Systems], Ulan-Ude: Buryat State University Publ., 2008. 260 p.

3. Vasil'ev O. V. Lektsii po metodam optimizatsii [Lectures on Optimization Methods], Irkutsk: Irkutsk State University Publ., 1994. 340 p.

4. Marchuk G. I. Matematicheskie modeli v immunologii. Vychislitel'nye metody i algoritmy [Mathematical Models in Immunology. Computational Methods and Algorithms], Moscow: Nauka Publ., 1991. 304 p.

5. Samarskii A. A., Gulin A. V. Chislennye metody [Numerical Methods]. Moscow: Nauka Publ., Moscow: Nauka Publ., 1989. 432 p.

6. Trunin D. O. Ob odnom podkhode k nelokal'nomu uluchsheniyu upravlenii v kvadratichnykh po sostoyaniyu sistemakh s terminal'nymi ogranicheniyami [On a Certain Approach to Nonlocal Improvement of Controls in Quadric-in-State Systems with Terminal Constraints]. Vestnik Buryatskogo gosudarstvennogo universiteta. Mate-matika, informatika — Bulletin of Buryat State University. Mathematics, Computer Science. 2017. No. 2. Pp. 40-45. DOI: 10.18101/2304-5728-2017-2-40-45.

i Надоели баннеры? Вы всегда можете отключить рекламу.