Научная статья на тему 'Обобщение метода характеристик Коши для построения гладких решений уравнения Гамильтона-Якоби-Беллмана в задачах оптимального управления с особыми режимами'

Обобщение метода характеристик Коши для построения гладких решений уравнения Гамильтона-Якоби-Беллмана в задачах оптимального управления с особыми режимами Текст научной статьи по специальности «Математика»

CC BY
175
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА / PONTRYAGIN'S MAXIMUM PRINCIPLE / ОСОБОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / SINGULAR OPTIMAL CONTROL / УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ-БЕЛЛМАНА / HAMILTON-JACOBI-BELLMAN EQUATION / ГЛАДКОСТЬ ФУНКЦИИ ЦЕНЫ / SMOOTHNESS OF THE BELLMAN FUNCTION / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ТЕРАПИИ ВИРУСНЫХ ИНФЕКЦИЙ / MATHEMATICAL MODEL OF VIRAL INFECTIONS' OPTIMAL TREATMENT

Аннотация научной статьи по математике, автор научной работы — Егоров И.Е.

Предложен подход к построению синтеза оптимального управления на основе исследования расположения характеристик задачи Коши для уравнения Гамильтона-Якоби-Беллмана (уравнения ГЯБ), т.е. выяснения того, как расширенное фазовое пространство заполняется этими характеристиками. Разработан метод отыскания глобального решения задачи Коши для уравнения ГЯБ посредством задания граничных значений на поверхности особых характеристик, соответствующих особым оптимальным управлениям. Управление считается одномерным и линейно входящим в систему. При описании метода предполагается, что указанная поверхность единственна и что переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней и притом не более одного раза. Выводятся соответствующие достаточные условия. Кроме того, устанавливается гладкость построенной таким образом функции цены. Разработанный подход продемонстрирован на примере математической модели терапии вирусных инфекций.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Extension of Cauchy’s characteristics method to construct smooth solutions of Hamilton-Jacobi-Bellman equations for optimal control problems with singular regimes

We introduce an approach for the construction of optimal control synthesis, based on investigation of the allocation of the characteristics for the Hamilton-Jacobi-Bellman equation (shortly, HJB equation), i.e., determination, how the extended state space is filled with these characteristics. A method for obtaining global solutions of Cauchy problems for HJB equations by setting boundary conditions on switching surfaces, corresponding to singular optimal controls, is developed. One-dimensional and linearly attending controls are considered. In the description of the method we assume that such singular surface is unique and that any switching of a controlled process may occur only on it and not more than once. The corresponding sufficient conditions are deduced. Furthermore, the smoothness of the so constructed Bellman function holds. The developed approach is demonstrated for a mathematical model of viral infections’ optimal treatment.

Текст научной работы на тему «Обобщение метода характеристик Коши для построения гладких решений уравнения Гамильтона-Якоби-Беллмана в задачах оптимального управления с особыми режимами»

УДК 517.977.5

И. Е. Егоров1

ОБОБЩЕНИЕ МЕТОДА ХАРАКТЕРИСТИК КОШИ ДЛЯ ПОСТРОЕНИЯ ГЛАДКИХ РЕШЕНИЙ УРАВНЕНИЯ ГАМИЛЬТОНА-ЯКОБИ-БЕЛЛМАНА В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ОСОБЫМИ РЕЖИМАМИ

Предложен подход к построению синтеза оптимального управления на основе исследования расположения характеристик задачи Коши для уравнения Гамильтона-Якоби-Беллмана (уравнения ГЯБ), т.е. выяснения того, как расширенное фазовое пространство заполняется этими характеристиками. Разработан метод отыскания глобального решения задачи Коши для уравнения ГЯБ посредством задания граничных значений на поверхности особых характеристик, соответствующих особым оптимальным управлениям. Управление считается одномерным и линейно входящим в систему. При описании метода предполагается, что указанная поверхность единственна и что переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней и притом не более одного раза. Выводятся соответствующие достаточные условия. Кроме того, устанавливается гладкость построенной таким образом функции цены. Разработанный подход продемонстрирован на примере математической модели терапии вирусных инфекций.

Ключевые слова: принцип максимума Понтрягина, особое оптимальное управление, уравнение Гамильтона-Якоби-Беллмана, гладкость функции цены, математическая модель терапии вирусных инфекций.

1. Введение. Известно (см., например, [1-3]), что задача синтеза оптимального управления, т. е. отыскания оптимального закона обратной связи, сводится к глобальному построению в фазовом или

1 Факультет ВМК МГУ, асп., e-mail: ivanyegorovQgmail.com

расширенном фазовом пространстве обобщенного решения задачи Коши для, вообще говоря, нелинейного уравнения Гамильтона Якоби Воллмана (уравнения ГЯБ) в частных производных первого порядка, которое может не иметь классического гладкого решения. Применение методов сугубо вычислительного характера для решения таких задач ограничивается следующими обстоятельствами:

• численное решение задачи Коши для уравнения ГЯБ ищется в ограниченной области фазового или расширенного фазового пространства, в то время как сама задача обычно ставится в неограниченной области, и тем самым возникает проблема корректного выбора ограниченной области для вычислений;

• близость приближенных решений задачи Коши для уравнения ГЯБ к точному решению далеко не всегда может быть обосновано той или иной теоремой о сходимости;

• с помощью методов сугубо вычислительного характера сложно получить целостное представление о геометрической картине синтеза оптимального управления, особенно для задач размерности, большей двух (в значительной степени это связано с тем, что такие методы, как правило, описываются для систем общего вида и поэтому не учитывают особенностей динамики, имеющих место в конкретных классах математических моделей).

Вместе с тем, если для определенного (возможно, достаточно узкого) класса задач удается задать все поверхности переключений оптимального позиционного управления, то глобальная геометрическая картина синтеза естественным образом выявляется без возникновения перечисленных выше трудностей.

Статья посвящена дальнейшему развитию подхода, намеченного в работах [4-8]. Предлагается метод отыскания глобального решения задачи Коши для уравнения ГЯБ посредством задания граничных значений на поверхности особых характеристик, соответствующих особым оптимальным управлениям [9]. Управление считается одномерным и линейно входящим в систему. Также при описании метода предполагается, что указанная поверхность единственна и что переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней и притом не более одного раза. Выводятся соответствующие достаточные условия. Кроме того, устанавливается гладкость построенной таким образом функции цены. В этом случае поверхность особых характеристик является универсальной согласно модифицированной А. А. Меликяном [10, 11] терминологии Р. Айзекса [12].

2. Постановка задачи. Рассматривается управляемая система

^ = f(x,u(t)) ^ f\x) + u(t) ■ fix), x{t) G IT, u(t) G P = [«1,^2] CR, Щ = const € Ж, i = 1,2, u\ < «2, t G [0,T],

где P — множество ограничений на управление, Т > 0 — фиксированный конечный момент времени. Требуется решить задачу синтеза оптимального управления для (1) с целью достижения точной нижней грани функционала

Ф(ж(Т)) —inf . (2)

«(•)еСоо([0,Т],Р)

Здесь гамильтониан принимает вид

Н(х, ф, и) =f (ф, f1(x)) + и ■ (ф, f2(x)) , ф) =f max Н(х, ф,й) = — minН(х, —ф, и).

и£Р и£Р

Управляемой системе (1) отвечает дифференциальное включение

^ G F(x) d= {/(ж,й): й G Р}. (3)

Запишем систему (1) и включение (3) в обратном времени г Г — I:

ОТ

— = -/(х,и(Т-т)), (4)

Предположение 1. Имеют место следующие положения:

• К — замыкание некоторой выпуклой открытой области в Жп, являющейся его внутренностью int К;

• функции /г: К ^ Жп, % = 1, 2, трижды непрерывно дифференцируемы, все элементы матриц Якоби Dfl(x), i = 1,2, ограничены в К;

• G — открытая область в Шп, представимая в виде

Gd= {жеЖп: д(х) = max д^(х) < О

[ г£{1,2,...,г}

где gf Жп Ж, г = 1,г, — дважды непрерывно дифференцируемые функции, причем в каждой точке х' границы dG = {х € Жп : д(х) = 0} семейство градиентов {Vgi(x'): i € I(x')} при

I(x')d^ {¿G {1,2,...,r}: gi(x')=g(x')} = {i£{l^...,r}: 9i{x') = 0} (x' € dG)

неотрицательно линейно независимо (в определении неотрицательной линейной независимости конечной совокупности векторов линейного пространства над полем Ж рассматриваются их линейные комбинации только с неотрицательными коэффициентами, одновременно не равными нулю, а_все остальное аналогично классическому определению линейной независимости);

• G С К;

• для любых ф функция 'Н(-. (/•): К ^ Ж локально липшицева;

• справедливо условие

Щх, -чр) = max {ф, -f(x, и)) sg О Уф (Е N^tG(x) Ух € dG,

и£Р

где N^tG(x) — нормальный конус Кларка [13, гл. 2] к внешности

ext G =f Жп \ G = {х G Жп : д(х) ^ 0}

области G в точке ж;

• справедливо такое представление G = G' П G", где

G' d= {х G Жп : дЦх) d= max9i(x) < о), I ieJ' J

G" d= kl": g2(x) d= max5i(i) < ol, I ieJ" J

J' U J" = {1,2,... , r), J' П J" = 0,

что выполнено требование

Щх, -ф) <0 Уф (Е N^tG,(x) Ух € dG' П dG,

где N^tG,{x) — нормальный конус Кларка к extG' = {ж € Жп : gl{x) ^ 0} в точке ж, и всякая фазовая траектория х: Гт1,т2] —> Жп, т\ < т2, дифференциального включения (5), удовлетворяющая начальному условию ж|т € G, не имеет общих точек с ext G" = {ж € Жп : д2(ж) ^ 0} на всем временном отрезке г € [ti,t2].

Рассмотрим задачу оптимального управления (1), (2) с ограничением ж(t) € G при всех t € [0,Т]. В силу принятых предположений G — сильно инвариантная область [3, гл. 4, § 3]. Выпишем

сопряженную систему в прямом времени t и обратном времени г Т — I:

^ = f\x) + u(t)-f2(x),

^ = - (Dxf(x))T ■ ф - u(t) ■ (Dxf( ж))Т • ф,

(6)

x\t=T = ж', ^\t=T = —V$(a;'), х € G, (7)

(8)

^ = _/l(a;)_u(T_T)./2(a;)

^ = (Dxf1(x))T ■ ф + u(T — t) ■ (Dxf(x))T ■ ф

ж|т_0 = ж', ф|т_0 = —УФ(ж'), ж' G G. (9)

Задача Коши для уравнения ГЯБ принимает вид

S — S (^х ; т") ; т — Т Я с

— = (VxSJ1(x))+ min {{VxSJ2(x))ü}, (ж,т) G G х [0,T], (Ю)

от

, ¿>(ж, 0) = Ф(ж), ж G G.

На основании результатов, изложенных, например, в [14], в ряде дополнительных естественных предположений имеют место следующие утверждения:

• существует единственное вязкостное решение [2, разделы II.4, II.8] задачи Коши (10), которое совпадает с функцией цены

S(x'<y )= ,, , inf Ф (х (Т; Т^ г', ж',(1)), «(•))),

заданной и непрерывной на множестве (ж', г') G G х [0,Т];

• при любом г G (0,Т) функция S(-,t): G ^ Ж локально липшицева;

• значение S(x',t') в точке (ж', г') G G х [0,Т] представляет собой минимум Ф(ж") по всем таким ж" G G, для которых найдется хотя бы одна характеристика (см., например, [14])

x(-)J(-)) ■ J^GxW1 (И)

задачи (10), удовлетворяющая равенствам ж(т') = ж', ж(0) = ж"; для каждой точки (ж', г') G G х (0,Т) супердифференциал

D+s(x',t') =

ÎfkaT):alÉr,er^ Ш S(x,r) - S(xW) ~ - х') - Ог(г - r>)

( (х,т)—>(х',т')

не пуст и представляет собой выпуклую оболочку всех таких векторов у—ф(т'),/Н{х(т'),ф(т'))

что (11) — какая-нибудь характеристика задачи (10), подчиненная равенствам ж(т') = ж' 5(ж',г') = Ф(ж(0)).

3. Описание метода. Зафиксируем числа Т < 0. Т. > Т.

Определение 1. Пусть при ¿ = 1,2 функция Бг: С х (Т_,Т+) —> Ж представляет собой гладкое решение задачи Коши

я я%

— = (Ухв*, /:(ж)) + <Уж^,/2(ж)>^, (ж, г) ебх (Т_,Т+),

5г(ж,0) = Ф(ж), ж С О,

которое существует и единственно в сделанных предположениях.

Мы полагаем, что при ¿ = 1,2 функция Бг находится аналитически посредством п первых интегралов расширенной системы (1), ^ = — 1 с и = щ. Определение 2. Положим

I)1 ^С1{(ж',г') С С х (Т_,Т+): (\7ж51(ж', г'), /2(ж')) > 0} П (О х (Т_, Т+)), I)2 с1{(ж',т') е(?х(Т_,Т+): <Уж52(ж',г'),/2(ж')> <0}п(Сх (Т_,Т+)), (12)

7; = {(а;',г')еСх(Т_,Т+): <Ух^(ж',г'),/2(ж')> = 0}П^, ¿ = 1,2, где с1 обозначает операцию замыкания, и для ¿ = 1,2

= (ж,г) €£>*}, Т; = {а;еК№,: (х,г)е7'} Ут С (Т_,Т+). (13)

Рис. 1. Взаимное: расположение множеств D\ 7% г = 1, 2. в случае =

Полученные аналитически функции S\ ?! = 1, 2, дают аналитические представления для множеств (12), (13). Ясно, что при ?! = 1,2 функция S* является решением уравнения ГЯБ из (10) на множестве D%.

Следующее предположение является ключевым и может быть проверено как непосредственно, так и с помощью принципа максимума Понтрягина.

П р е д п о л о ж е н и е 2. 7q = Jq == 70 (см. рис. 1).

Определение 3. Пусть для ?! = 1,2 и х' € G в*(х') первый момент достижения множества

С =f (ext G' х Ж) U (Ж" х [Т+, +эс)) (14)

выходящей из позиции (х,т) = (ж',0) интегральной кривой системы (4) с и = щ, а

(х*(-:0,х'),ф*(-:0,х')) : (Т-,в*(х')) Ж2"

есть решение задачи (8), (9) с и = щ. Кроме того, пусть при ?! = 1,2 для любых (х'.ф'.т1) € G х Ж" х х(Т_,Т+)

(х\-:т,,х,),ф\-:т\х\ф')) : (Т_,т' + в'(х')) Ж2"

есть решение системы (8) с и = щ, подчиненное равенству {х,ф)\ , = (х',ф'), (хг(-; т', х') от ф' не зависит).

Предположение 3. int Z)q, int Dq открытые области в Ж", int Dq = Dq \ jQ, ?! = 1, 2, и 70 связная регулярная гиперповерхность без краевых точек в Ж", делящая G на две части Dq, Dq. Определение 4. Положим

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Q* = {(.^(г:0,ж'),г) : х! G £>', г G (Т_, в*(х'))},

^ {(.^(г:0,ж'),г) : я' G 7о, т£ (Т_, },

Огг = {iel": (ijjeff) Vre(T_,T+), ?! = 1,2.

Рассмотрим случай, когда особое управление us принимает значения только внутри множества Р(и 1 < us < 112). Случай тривиальных особых управлений (us = щ, js = шг для фиксированного ?! € {1,2}) может быть разобран аналогично.

Нетрудно проверить, что ?;,(•) не присутствует явно в производной ^ (ф, /2(.т)), выраженной через (х,ф) посредством соотношений (6). Учитывая (6), (7), имеем

(ф(пг\х(т)))=^(ф,/\х))

= 0 при х(Т) € 7q.

Вторая производная ^ /2(х)) с помощью соотношений (6) может быть записана в форме

в2

(ф, ¡2(х)) = а1(х, ф) + а2(х, ф) ■ и, (15)

где функции щ : К х Жп ^ Ж, г = 1, 2, непрерывно дифференцируемы. С учетом представления (15) из условия ^р- {ф, /2(ж)) = 0 получаем, что

и = й8{х,ф) = при (ж,^)еСхЖп, а2{х,ф)ф 0. (16)

а2(х,ф)

Предположение 4. Имеют место следующие положения:

1) справедливо включение

Г о а= {(ж, -УФ(®)) : ж б 7о} С Ё8 а= {(ж ,ф) е'тЬКх Жп : а2(х,ф) > 0}

(тем самым в Е8 функция й8 из (16) определена и непрерывно дифференцируема, а также выполнено усиленное условие Келли [9]

д (¿2 дН

= >0 Ч(х,ф)€Е8, (17)

или, что то же самое, усиленное условие Лежандра-Клебша [15, 16]), через Е8 обозначена открытая связная компонента открытого множества Ё8, содержащая Г0;

2) при любом ж° € 7о задача Коши

% (18) = (Ц, {¡Нх) + й8(х,ф) • /2(ж)))Т • ф,

ж|т=0=ж°, Ф\Т=0 = ^УФ (ж°) ,

рассматриваемая только в открытой области (ж, ф) € Е8 своего фазового пространства, обладает единственным решением (х8 (•; 0, ж0) , ф8 (•; 0, ж0)), продолжимым на целый временной полуинтервал г € (Т_,в8 (ж0)], где в8 (ж0) — первый положительный момент попадания соответствующей интегральной траектории на множество всех позиций (ж,ф,т) € Ж2п+1 с (ж, г) € С (С определено в (14));

3) при любом х° € 7о задача Коши

^ = /1(х) + й8(х,ф)-/2(х), ^ = (/Ч®) + йв(х, ф) • /2(ж)))Т • ф,

о

Ф\t=T = ^Ф (ж0)

Н=Т ' r\ t=T

тоже рассматриваемая лишь в открытой области (ж, ф) € Е8 своего фазового пространства, имеет единственное решение, продолжимое на целый временной полуинтервал t € [Т — в8 (ж0) , Т — Т_);

4) выполнено требование ж € intZ8 и й8(х,ф) = u8zs(ж) € («1,^2) У(х,ф) € Ts, где

rs =f | (х8 (т; 0, ж0) , ф8 (г; 0, ж0)) : х° € 7о, те (Т_,Г( ж0))},

Z8 — замыкание некоторой выпуклой открытой области в Жп, являющейся его внутренностью int Z8, u8Zs~- г /' — непрерывно дифференцируемая функция.

Из утверждения пункта 2 предположения 4 (где система (18) рассматривается только в области (ж,ф) € Е8) следует, что Ts С Е8, а потому на основании требования (17) усиленное условие Келли справедливо и на Г®. Положим

и8 (ж) =f u8Zs (projzs ж) Ух € Жп, где projzs ж — проекция точки ж на выпуклое замкнутое множество Z8. Обозначим

в*т{х) d= min (Т, Г (ж)) Уж G 7о.

Из представления (15) и предположения 4 следует, что [15, 16] если

{х',ф') = (ж8(т';0,ж°),^(т';0,ж°)), х° € 7о, г' б [0, ват (ж0)) , (19)

то для некоторых чисел 5* (ж0,г') € (0,0^ (ж°) — г'), г = 1,2, справедливы неравенства

(ж\т-т\х'))) <0 Уте (г',г' + (ж0,г')) , (ф2(т;т',х',ф%/2 (ж2(т;т',ж'))> >0 Уте {т',т' + 82 (ж0,г')) .

(20)

Таким образом, локальный синтез экстремалей в некоторой окрестности особой поверхности js строится посредством соединения особых интегральных траекторий с регулярными (соответствующими постоянным граничным управлениям и = щ, ¿ = 1, 2). Более того, части полученных при этом траекторий, лежащие в некоторой окрестности js, удовлетворяют принципу максимума Понтрягина.

Предположение 5. Предположим, что из представления (19) следуют неравенства

{ф1{т-,т\х\ф')Л2(х1{т-,т\х')))< 0 Vre (г', в8т (ж0)), <^(г;г',ж',Л,/2(^2(г;г',ж'))>>0 Vre (г', (Гт (ж0)).

Заметим, что неравенства (21) представляют собой глобальный аналог локальных неравенств (20).

Предположение 6. йгт С D* \ 7* Vr € (0,Т], г = 1,2.

Предположение 6 в ряде случаев может быть проверено с помощью принципа максимума Понтрягина.

В сделанных предположениях особая поверхность единственна, и переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней, причем не более одного раза. Отсюда вытекает алгоритм глобального синтеза оптимального управления.

Определение 5. Обозначим через Q1 ш Q2 множества, на которые G х (Т_,Т+) делится поверхностью 7S. Положим для ¿ = 1,2

Qt = {ier: (i.rjeQ1}, 7* d= {ж е Жп : (ж,т) е 7S} Vre(T_,T+).

Предположение 7. Какова бы ни была точка (ж,г) € 7S, если гф(ж,г) — какой-нибудь нормальный вектор к 7S в точке (ж, г), принадлежащий (ради определенности) нормальному конусу N-Q-(x,t), то выполнены неравенства

(гф(ж,г), (-/(ж,Iii), 1)) < 0, (гф(ж,г), (~f(x,u2), 1)) > 0.

Теорема 1. Пусть в сделанных предположениях

Qi = ((Q4^)U7sUu/)n(ir х[0,т+)), ¿ = 1,2.

Тогда при г = 1,2 существует единственное гладкое решение Sl : Q\ х (Т_,Т+) ^ Ж задачи Коши

ß4i

= {VxSt,f\x)) + (VxStJ4х))щ, (ж,г) € Ql SI(x,T) = Sts(x,T), (ж,г)€7®, где

Qtd= {(жЧт;т',ж'),т): (ж',т')е7*, г G (Т_,г' + }

есть содержащая множество Q\ открытая область в Жп+1, а функция S7s : js ^ Ж определяется посредством условия

V(x',г') € js 3lxs'°(x',r') € 70, такое, что х = жя (г'; 0, ж5'0(ж', г')) , Зг(х',т') = Ф(ха'°(х',т')) У(х',r') e7s,

и справедливы следующие представления:

Г (ж, г), (ж, г) G 0®П (Жп х [О,Т]), ¿ = 1,2,

S(x,t) = < SI(x,t), (ж,г) е Ql П (Жп х [0,Т]), ¿ = 1,2, (22)

[S7s(x,t), (ж,г)€7®,

f«i, (ж, г) G Q'n (Жп х Г0,Т1), ¿ = 1,2, и fix Т - т) = < ' ' (23)

°Р \«в(®) = u*z,{x), (ж,г) G7sn (Жп х [0,Т]).

Нетрудно убедиться в том, что в условиях теоремы 1 фазовые компоненты характеристик задачи Коши для уравнения ГЯБ с разными начальными позициями при г = 0 (т. е. при t = Т) не пересекаются друг с другом. Используя [13, гл. 2, следствие из предложения 2.2.4 § 2.2 и теорема 2.5.1 § 2.5], можно доказать следующий результат.

Теорема 2. В условиях теоремы 1 функция цены является гладкой всюду в G х (0,Т). Из теоремы 2 следует, что поверхность особых характеристик является универсальной согласно модифицированной A.A. Меликяном [10, 11] терминологии Р. Айзекса [12].

4. Математическая модель терапии вирусных инфекций. Рассматривается математическая модель терапии вирусных инфекций [6]

^ = Ai - 71Ж1 - aiXifi(h),

= А2 + a3f3(h) - 72ж2 - a2x2f2(h),

at

dh , ,, _ = -73Ä + u(i),

0 ie[0,T],

l Ф(ж!(Т),ж2(Т)) = x\{T) + ехЦТ) —> inf,

x\(t) — численность основных вирусов в момент t, x2(t) — численность вирусов-мутантов в момент t, h(t) — концентрация лекарства в момент t;

Aj > 0, г = 1, 2, — скорости воспроизводства основных и мутировавших вирусов; 7г > 0, г = 1, 2, — показатели смертности вирусов двух типов, 73 > 0 — коэффициент диссипации лекарства;

i\j. / 1.2.3. />'. — положительные константы;

fi(h) = f(h) =f h/(B + h), % = 1, 2, В = const >0, — функции терапии, характеризующие интенсивность негативного влияния лекарства на клетки, зараженные основными и мутировавшими вирусами,

В

f,M = TBTw>0 Vh>-B[

Mh) =f h2/(A + h2), A = const >0, — функция, описывающая увеличение скорости воспроизводства вирусов-мутантов под воздействием лекарства,

9 Ah

Я№) = й7^>0 VA>0;

u(t) — управляющая функция, которая задает количество лекарства, поступающего в организм пациента в единицу времени.

Возьмем

G =f |(ж1, ж2, К) € Ж3 : xt < х\ < xi, ж2 < ж2 < ж2, 0 < h < R/731, К =f G, G' =f |(ж1,ж2,Л,) G Ж3 : Ж1<Ж1<Ж1, ж2 < ж2 < ж2|,

где:

G" =f {(xi, х2, h)e Ж3 : 0 < h < Д/7з},

О < х\ <

А,

7i + «1 /

R

A_i

7i

Xi> -, 0 < X2 <

Аз

72 + a.2f

R

Х2 >

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А2 + «з/з (f)

72

ч7з / " V''3,

Также приняты следующие предположения: • справедливы неравенства

^/г4 - 4Bh3 + 3 (А - В2) К2 + 4ABh + АВ2 >0 V/г € [О, Д/7з],

& (i)

, «2 _ ¡S-i < с\ —е < Ш2 <

®1

«1 £«2

-1;

С =

«3

2«2 f (JL

J I 7з

выполнены требования

h3 + 3Bh2 - 3Ah - АВ < 0 V/г € [О, Д/73], 0 < »'V/г) < Д я2,/г) € G,

-1

sv 1 ч def , 1 f.m.f"(h) ,„,м.

и (./'1. . /г) = 7з/г - — ( -"/„V - .ДО) х

«3 V /ЧМ

х {а^1 а3f3(h) - a2x2f'(h) - азf3(h) J2 + a2.f(h) +a2f'(h) А2 + а3/3(/г) j есть особое позиционное управление.

т

О Dq Dl h

Рис. 2. Геометрическая картина синтеза оптимального управления в математической модели терапии вирусных инфекций

Можно показать, что в сделанных допущениях поверхность особых характеристик, соответствующих особым оптимальным управлениям, единственна, и переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней и притом не более одного раза (см. рис. 2). Чтобы можно было получить представления (22), (23), необходимо проверить выполнение предположения 7. Однако в этом примере не было получено аналитическое представление для js, а потому вопрос установления справедливости предположения 7 аналитическим путем остается нерешенным. Заметим, что для математических моделей процесса лечения однородной твердой несосудистой опухоли с немонотонной функцией терапии из [4, 5] 7,s' обладает тривиальным аналитическим представлением (вида h = Iiq, где Iiq = const) и выполнение предположения 7 проверяется элементарно. Вместе с тем, действуя неформально, можно проводить численную проверку справедливости предположения 7 для имеющихся конкретных значений параметров.

5. Заключение. Разработан метод глобального синтеза оптимального управления в задачах

с характеристиками задачи Коши для уравнения ГЯБ, отвечающими особым управлениям. Рассмотрен пример — математическая модель терапии вирусных инфекций. Получены достаточные условия

гладкости функции цены.

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин J1. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1976.

2. Fleming W.H., So пег Н. М. Controlled Markov Processes and Viscosity Solutions. N.Y.: Springer-Verlag, 1998.

3. Clarke F.H., Ledyaev Yu. S., Stern R. J., Wolenski P. R. Nonsmooth Analysis and Control Theory. N.Y.: Springer-Verlag, 1998.

4. Бр ату с ь А. С., Чу мери на Е. С. Синтез оптимального управления в задаче выбора лекарственного воздействия на растущую опухоль // ЖВМ и МФ. 2008. 48. № 6. С. 946-966.

5. Чу мери на Е. С. Выбор оптимальной стратегии химиотерапии в модели Гомперца // Известия РАН. Теория и системы управления. 2009. 2. С. 170-176.

6. Братусь А.С., Зайчик С.Ю. Гладкое решение уравнения Гамильтона-Якоби-Беллмана в математической модели оптимальной терапии вирусных инфекций // Дифференц. уравн. 2010. 46. № 11. С. 15711583.

7.Bratus A., Todorov Y., Yegorov I., YurchenkoD. Solution of the feedback control problem in the mathematical model of leukaemia therapy //J. Opt. Theory Appl. 2013. 159. N 3. P. 590-605.

8. Yegorov I., Todorov Y. Synthesis of optimal control in a mathematical model of tumour-immune dynamics // Opt. Control Appl. & Methods. 2013. URL: http://dx.doi.org/10.1002/oca.2103.

9. Габасов P., Кириллова Ф.М. Особые оптимальные управления. М.: Книжный дом "ЛИБРОКОМ", 2013.

10. Mel iky an A. A. Generalized Characteristics of First Order PDEs: Application in Optimal Control and Differential Games. Boston: Birkhauser, 1998.

11. Melikyan A. A., Day M. V. Simple singularities for Hamilton-Jacobi equations with max-concave Hamil-tonians and generalized characteristics //J. Opt. Theory Appl. 2008. 138. N 2. P. 155-174.

12. Айзеке P. Дифференциальные игры. M.: Мир, 1967.

13. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.

14. Субботина Н.Н., Токманцев Т. Б. Классические характеристики уравнения Беллмана в конструкциях сеточного оптимального синтеза // Тр. Матем. ин-та РАН. 2010. 271. С. 259-277.

15. Gardner-Moyer Н. Sufficient conditions for a strong minimum in singular control problems // SIAM J. Control Optim. 1973. 11. N 4. P. 620-636.

16. Ledzewicz U., Schattler H. On the optimality of singular controls for a class of mathematical models for tumor anti-angiogenesis // Discrete Cont. Dyn-B. 2009. 11. N 3. P. 691-715.

Поступила в редакцию 18.02.14

EXTENSION OF CAUCHY'S CHARACTERISTICS METHOD TO CONSTRUCT SMOOTH SOLUTIONS OF HAMILTON—JACOBI—BELLMAN EQUATIONS FOR OPTIMAL CONTROL PROBLEMS WITH SINGULAR REGIMES

Egorov I. E.

We introduce an approach for the construction of optimal control synthesis, based on investigation of the allocation of the characteristics for the Hamilton-Jacobi-Bellman equation (shortly, HJB equation), i. e., determination, how the extended state space is filled with these characteristics. A method for obtaining global solutions of Cauchy problems for HJB equations by setting boundary conditions on switching surfaces, corresponding to singular optimal controls, is developed. One-dimensional and linearly attending controls are considered. In the description of the method we assume that such singular surface is unique and that any switching of a controlled process may occur only on it and not more than once. The corresponding sufficient conditions are deduced. Furthermore, the smoothness of the so constructed Bellman function holds. The developed approach is demonstrated for a mathematical model of viral infections' optimal treatment.

Keywords: Pontryagin's maximum principle, singular optimal control, Hamilton-Jacobi-Bellman equation, smoothness of the Bellman function, mathematical model of viral infections' optimal treatment.

i Надоели баннеры? Вы всегда можете отключить рекламу.