Научная статья на тему 'The method of approximate calculation of value function for the optimal control problem with terminal quality criteria'

The method of approximate calculation of value function for the optimal control problem with terminal quality criteria Текст научной статьи по специальности «Математика»

CC BY
45
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Kamzolkin D. V.

Рассматривается задача оптимального управления со свободным правым концом и терминальным функционалом качества. Приводится численный метод приближенного вычисления функции цены, использующий репрезентативную формулу для функции цены на основе экстремалей принципа максимума Понтрягина. Доказывается сходимость предложенного метода. Приводятся оценки погрешности вычисления в зависимости от параметров численного метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «The method of approximate calculation of value function for the optimal control problem with terminal quality criteria»

Аналогичным образом из уравнений в вариациях более высокого порядка находятся старшие производные отображения Пуанкаре.

В заключение отметим, что утверждения теорем 1 и 2 не зависят существенным образом от специфики ОЗТТ и остаются справедливыми для гамильтоновой системы общего положения двух или полутора степеней свободы, зависящей от одного параметра. Для системы с двумя степенями свободы необходимо рассмотреть преобразование фазовым потоком автономной системы двумерного сечения изоэнергетической поверхности, как в настоящей работе. В случае системы полутора степеней свободы, как, например, в уравнении колебаний спутника при движении по эллиптической орбите [6], необходимо рассмотреть преобразование за период двумерного фазового пространства системы с периодическими коэффициентами.

Автор благодарен В. Ф. Борисову, Ф. П. Васильеву и М.И. Зеликину за полезное обсуждение.

СПИСОК ЛИТЕРАТУРЫ

1. Siegel С. L., M ose г J. К. Lectures on celestial mechanics. Berlin: Springer, 1971.

2. Арнольд В.И., Козлов В.В., Нейштадт А. И. Математические аспекты классической и небесной механики. Динамические системы // Итоги науки и техн. Совр. пробл. матем. Фундам. напр. М.: ВИНИТИ, 1985. 3. С. 5-304.

3. Hénon M. Exploration numérique du problème restrient. II: Masses égales, stabilité des orbites périodiques // Ann. Astrophys. 1965. 28. N 6. P. 992-1007.

4. Hénon M., Guyot M. Stability of periodic orbits in the restricted problem // Period. Orbits, Stability and Resonances, G.E.O. Dordrecht: Reidel, 1970. P. 349-374.

5. Мельников H. Б. Особенности 2£)-многообразия периодических решений ограниченной задачи трех тел // Тезисы докладов ААНЗ-2004. Екатеринбург: УрО РАН, 2003. С. 199-200.

6. Varin V. P. Degeneracies of periodic solutions to the Beletsky equation // Regular and Chaotic Dynamics. 2000. 5. N 3. P. 313-328.

7. Whitney H. On singularities of mappings of Euclidean spaces. I: Mappings of the plane into the plane / / Ann. Math. 1955. 62. P. 374-410.

8. Мельников H. Б. Сингулярные возмущения однократных порождающих орбит ограниченной задачи трех тел // Нелинейная динамика и управление. Вып. 4. М.: Физматгиз, 2004. С. 295-308.

Поступила в редакцию 09.04.04

УДК 517.977.58

Д. В. Камзолкин

МЕТОД ПРИБЛИЖЕННОГО ВЫЧИСЛЕНИЯ ФУНКЦИИ ЦЕНЫ

ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМ

ФУНКЦИОНАЛОМ

(кафедра оптимального управления факультета ВМиК)

1. Постановка задачи. Рассматривается управляемая система, описываемая обыкновенным дифференциальным уравнением

ж = /(ж,и) (1)

на отрезке времени [¿о,Т], где Т — фиксированный момент времени, х 6 Я" — фазовая переменная, и 6 Яр — управление. В начальный момент времени ¿о считается заданным начальное условие

ж(£0) = жо 6 Д".

Под допустимыми управлениями и(-) понимаются измеримые по Лебегу функции, определенные на отрезке времени [io>^] и удовлетворяющие ограничениям u(t) G Р при t G [to,T], где Р С Rp — некоторый компакт. Обозначим класс всех допустимых управлений через U.

Считаем, что в дальнейшем функция / : R" X Р —> R" удовлетворяет следующим двум условиям.

Условие 1. Функция f(x,u) непрерывна по совокупности переменных и локально липшицева по х при х G R", и G Р.

Условие 2. Существует константа С\ ^ 0 такая, что для всех х G R" и и G Р

(ж, /(ж, и)) ^ С\{1 + INI2).

Первое условие (см. [1, 2]) гарантирует существование и единственность решения Каратеодори уравнения (1) для любого начального условия ж (¿о) = Е R" и любого допустимого управления и(-) G U. Второе условие является достаточным для продолжимости решения x(t) на весь интервал [t0,T] (см. [3, 4]).

Будем обозначать решение ж(-), соответствующее допустимому управлению и(-) G U и начальному условию ж (¿о) = Ж(ъ через x(-\to, xq, и(-)). Заметим, что это решение определено на всем интервале [to,T].

Пусть на множестве R" задана непрерывная целевая функция Ф(ж) : R" —> Д1. Задача оптимального управления для системы (1) с целевой функцией Ф(ж) заключается в нахождении управления и(-) и траектории x(-\to, xq, и(-)), доставляющих нижнюю грань функции Ф(ж(Т|£о, жо, и('))) по всем допустимым управлениям и(-) G U:

Ф(х(Т\1о,хо,и(-))) inf . (2)

и(-)еи

Если найдется допустимое управление и*(-), при котором достигается нижняя грань целевой функции, то и*(-) и соответствующую ему траекторию ж*(-) = x(-\to,xo,u*(-)) далее назовем решением задачи оптимального управления (1), (2).

Для существования решения задачи оптимального управления (1), (2) потребуем выполнения следующего условия (см. [3]).

Условие 3. Вектограмма f(x,P) = {у G R" : у = f(x,u), и G Р} — выпуклое множество для любого х G R" ■

Введем скалярную функцию V(to, xq) : [О, Т] xRn —> R1, называемую функцией цены или функцией Беллмана, которая определяется в каждой точке (¿о, Е [0, T]xRn как минимальное значение целевой функции в задаче оптимального управления (1), (2):

V{t0,x0)= min Ф(ж(Г|^,ж0,и(-))). (3)

и(-)еи

Рассмотрим задачу о нахождении приближенного значения функции цены для задачи (1), (2). Пусть в R" задана некоторая прямоугольная область

X = {ж G Rn : х~ ^ Xi ^ xf, i = 1,..., п}.

Требуется разработать алгоритм приближенного вычисления функции цены V(to, жо) для любой точки (toixo) £ [О, Т] X X с заданной точностью в метрике С([0,Т] X R").

2. Представление значения функции цены с помощью экстремалей принципа максимума Понтрягина. Получим эквивалентное представление функции цены V(t, ж) (3) с помощью экстремалей принципа максимума Понтрягина (см. также [5, 6 и 7]).

Для выполнимости принципа максимума для задачи (1), (2) потребуем выполнения двух условий.

Условие 4. Функция f(x,u) имеет непрерывные частные производные по ж при ж G R", и G Р.

Условие 5. Функция Ф(ж) имеет непрерывные частные производные по ж при ж G R".

Выпишем функцию Гамильтона-Понтрягина для задачи оптимального управления (1), (2):

Н(х,и,ф) = (/(ж ,и),ф).

Здесь ф G R" — вспомогательная переменная, которая является решением сопряженного дифференциального уравнения

• дН(х,и,ф) (df(x,u)\T

Ф=--Гх- = -{(4)

Условие трансверсальности на правом конце имеет вид

<9Ф(ж

ф(Т) = -

дх

х=х(Т).

(5)

Согласно принципу максимума Понтрягина [4, 8], если некоторое допустимое управление и(-) и соответствующая ему траектория ж(-) = x(-\to, жо, и(-)) являются решением задачи оптимального управления (1), (2), то существует такая вспомогательная переменная ф(-), являющаяся решением сопряженного уравнения (4) с конечным условием (5), что H(x(t),u,ip(t)) достигает максимума при и = u(t) для всех t £ [to,T], т.е.

maxH(x(t), и, ф{Ь)) = H(x(t)1u(t)1i¡)(t)).

udP

Таким образом, решение задачи оптимального управления (1), (2) следует искать среди пар

удовлетворяющих принципу максимума.

Обозначим через и*(х,ф) одно из управлений и 6 Р, доставляющих максимум функции Гамиль-тона-Понтрягина Н(х,и,ф) при фиксированных х и ф:

и*(х,ф) £ argmaхН(х,и,ф). иеР

(6)

Из непрерывности функции /(ж, и) и компактности множества Р следует, что максимизатор и*(х,ф) определен при любых ф 6 Я" и х 6 Я".

Для однозначного определения максимизатора функции Гамильтона-Понтрягина Н(х,и, ф) потребуем выполнения следующего условия.

Условие 6. Для любых ф £ Я" \ {0} и х 6 Я" множество argmax.fi(ж, и, ф) состоит из одной

иеР

точки.

Так как при ф = 0 функция Н(х,и,ф) = 0 при любом и £ Р, то максимизирующее управление и невозможно определить единственным образом. Для исключения этого случая будем считать, что выполняется следующее предположение, справедливость которого при выполнении ряда условий будет доказана далее.

Предположение 1. Для любой начальной позиции (¿о, жо) 6 [О, Г] X Я" и для любого допустимого управления и(-) и траектории ж(-|£о, жо, и(-)), удовлетворяющих принципу максимума Понтрягина, вспомогательная переменная ф{Ь) не обращается в ноль на отрезке времени [¿о,Т].

Таким образом, поиск всех пар (и(-), ж(-|£о, жо, и(-))), удовлетворяющих принципу максимума Понтрягина, сводится к решению краевой задачи для Гамильтоновой системы:

' х = /(х,и*(х,ф)) = F(ж, ф)

ф — ЭН(х,и,ф) ' дх

X(t0) = Ж0,

Ф(Т) =

и= и* (х,гр)

_ / df(x,u) I дх

и=и* (х,гр)

ф = G(x, ф)ф,

где G{x, ф) = -Mi

дх

х=х(Т) Т

— матрица пхп, зависящая от ж и ф.

(7)

и=и* (х,ф) /

Множество всех решений (ж(-), ф(-)) краевой задачи (7) обозначим через %1(£о>жо)- Для каждого решения (ж(-), ф(-)) £ %1(£о,жо) соответствующее ему управление вычисляется по формуле и(-) = и*(х(-),ф(-)).

(8)

Заменим в системе (7) условие ж (¿о) = жо на условие ж (Г) = ж у и рассмотрим вспомогательную задачу Коши

' X = -Р(ж, ф), ф = С(ж, ф)ф, х(Т) = ж т,

\Ф{т) = -д-Ц^.

Множество решений (ж(-), ф(-)) задачи Коши (8) при всех возможных конечных значениях жт £ Д™ обозначим через 'И.2-

Справедлива следующая

Л е м м а 1. Пусть выполняются условия 1-6 и предположение 1. Тогда для любой точки (¿о, жо) £ £ [О, Г] X Д™ функцию цены У(£о,жо) можно представить в виде

У{г0,х0)= тш

(х(-),ф(-))е-н2(г0,Х0)

(9)

где о, ж0) = {(ж(-), ф{-)) £ Н2 : ж(£0) = ж0}.

Доказательство. Утверждение леммы является следствием принципа максимума Понтрягина. При выполнении предположения 1 функцию цены У(£о,жо) можно представить как минимум целевой функции Ф(ж(Г)) на множестве решений краевой задачи (7), т.е.

У(10,х0)= тш Ф(ж(Т)). (10)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(х(-),ф(-))еп1(г0,х0)

Из определения множества Н2^о,хо) следует, что любая пара (ж(-), ф(-)) £ 'Н2^о,хо) является решением краевой задачи (7), т.е. принадлежит множеству Их {¿о, жо). Наоборот, любое решение (ж(-), ф(-)) краевой задачи (7) является решением задачи Коши (8) с конечным условием жт = Х(Т) и удовлетворяет условию ж (¿о) = жо- Значит, множества (¿о ? жо) и %2(£(ъжо) совпадают и формула (10) эквивалентна формуле (9) из утверждения леммы.

3. Исследование решения задачи Коши (8). Обозначим через X¿о> хо) = {х(^о, хо, и(')) '■ и(-) £ 11} множество достижимости системы (1) в момент времени £ ^ ¿о из начального состояния ж (¿о) = жо-

Так как для /(ж, и) выполняется условие 2, то, используя лемму Гронуолла [3, 8] и компактность множества X, можно показать существование такой константы

Д =

1 + ||А"||2еС1Т,

где ||Х|| = тах

х£Х

, что для любых (¿0,ж0) £ [О, Г] X X, и(-) £ II и £ £ [¿0, Г] ||ж(^0, ж0, и(-))|| ^ Д.

Следовательно, для любых (¿о ? жо) £ [0,Т] X X и £ £ множество достижимости X¿о> хо) С

С К, где

К = {ж £ Д" : N1 ^ Д, г = 1,.. ,,п}.

Так как нас интересуют решения (ж(-), ф(-)) задачи Коши (8), удовлетворяющие условию ж (¿о) = = жо, то конечное значение жт должно выбираться из множества достижимости Х(Т, ¿о,жо)- Таким образом, для любых (¿о, жо) £ [О, Т] X X множество конечных значений ж у в задаче Коши (8) можно ограничить множеством К.

Пусть выполняется следующее

Условие 7. Существует > 0 такое, что

дФ(х)

дх

^ бф для любого х £ К.

Тогда множество Фу = {~: х £ К} конечных значений вспомогательной переменной в задаче Коши (8) строго отделимо от нуля, т.е. Фу С {ф £ Д" : ^ еф}- Также из непрерывности и компактности К следует, что множество Фу ограничено сверху по норме некоторой константой . Таким образом, выполняется включение

Дф = тах

хек

эф (ж)

дх

ФТ С {ф £ Д" : 6Ф ^ <С Дф}.

(П)

Предположим далее, что выполняются два условия.

Условие 8. Функция и*(х,ф) локально липшицева по совокупности переменных при х £ Я" и

ф £ Д" \ {0}.

Условие 9. Функция /(ж, и) и ее частные производные по х локально липшицевы по совокупности переменных при х £ Я" и и £ Р.

Из этих условий следует локальная липшицевость функций Р(х,ф) и С{х^ф)ф при х £ Я" и ф £ Я" \ {0} как суперпозиции липшицевых функций. Так как при жу £ К конечное значение вспомогательной переменной не равняется нулю, то решение (х(-), ф(-)) задачи Коши (8) существует и единственно для любого конечного значения жу £ К.

Обозначим решение задачи Коши (8), соответствующее конечному значению жу, через

{хн(-\хт),фн(-\хт)).

Для продолжимости решения ж#(-|жт) в обратном времени на весь интервал [О, Г] потребуем выполнения следующего условия.

Условие 10. Существует константа Сч ^ 0 такая, что для всех х £ Я" и и £ Р

(ж, -/(ж, и)) ^ С2(1 + ||ж||2).

Из этого условия следует существование такой константы

Ях = у/1+ \\К\\2ес?Т,

что при всех £ £ [О, Г] и ж у £ К решение ж#(£|жт) ограничено некоторым прямоугольным множеством

Кх = {ж £ Я" : | ж» | ^ Ях, I = 1,... ,п}.

Лемма 2. Дри выполнении условий 1-10 существует такая константа Сф, что для любых х £ Кх и ф £ Я" \ {0} справедливо неравенство

\(ф,С(х,ф)ф)\^Сф

(12)

Доказательство. Так как ж ограничен компактным множеством и /(ж, и) имеет непрерывные частные производные по ж при ж £ Я" и и £ Р, то существует такая константа С,/, > 0, что

^ Сф, где ||-||£ — евклидова норма матрицы.

Е

Функция и*(ж, ф) определена при ж £ Я" и ф £ Д"\{0} и принимает значения из Р, следовательно, справедлива оценка

<9/(ж , и)

дх и=и* (х,ф)

\\С(х,

С помощью этой оценки получим неравенство (12):

\{ф,с(х,ф)ф)\ <с • \\С(х,ф)ф\\ <с \\с(х, уЛ|£

€ с

ф-

< а,

Лемма 3. Пусть выполняются условия 1-10, тогда существуют такие константы Яф ^ еф > > 0, что для любых £ £ [0,Т] и хт £ К выполняется включение

фн{АхТ) £ Кф = {феяп : еф<: «С ЯФ}.

Доказательство. Из неравенства (12) и ограниченности и отделимости от нуля множества конечных значений вспомогательной переменной Фу следует, что для любых £ £ [0,Т] и ж у £ К справедлива оценка

€фе~СфТ = еф<: \\фн(г\хт)\\ <:яф = ЯФес^т.

Лемма4. При выполнении условий 1-10 решение задачи Коши (8) (хн(-\хт),Фн('\хт)) существует и единственно при любом жт £ К, определено на всем интервале [0, Г] и ограничено компактным

множеством D = Кх X Кф. При этом для любой точки (tо, хо) G [О, Г] X X справедлива формула для функции цены

V(t0,x0)= min Ф(жт), (13)

xTexT(t 0,х0)

где XT(t0,x0) = {хТ G К : xH(t0\xT) = ж0}.

Доказательство. Как уже было показано ранее, из условий 8, 9 и включения (11) следует существование и единственность решения (жя('|жт), фн{'\хт)) Для любого хт G К. Условие 10 и неравенство (12) гарантируют ограниченность решения множеством D = Кх X Кф и его продолжимость на весь временной интервал [О, Г].

Таким образом, для любого хт G К вспомогательная переменная фн{'\хт) не обращается в ноль на всем отрезке [О, Г] и, следовательно, выполняется предположение 1.

Формула (13) следует из леммы 1 и ограниченности множества достижимости X(T,to, xq) множеством К.

4. Метод приближенного вычисления функции цены. Приведем метод приближенного вычисления функции цены V(t, х) в области [О, Т] хХ, основанный на формуле (13), доказанной в лемме 4.

Зададим на множествах [О, Г] X X и К равномерную сетку. Разобьем временной интервал [О, Г] на / одинаковых частей точками Tf.

Т

О = г0 < Ti < ... < Ti = Т, Ti+1 -Ti = —.

Каждый из отрезков [xi ,xf], г = 1,..., га, определяющих множество X, разобьем на то одинаковых частей точками

Xi ~ < < • • • < Ст ~ Х11 ££+1 Ск ~ 1 •

Получим на множестве [О, Г] X X равномерную сетку с узлами в точках

> 4 > 4 > •• •>£?„)> .70 = 0,...,/; ^ = 0 ,...,то; г=1,...,га. Эта сетка разбивает множество [О, Г] X X на прямоугольные ячейки

Чзо,к,-,й = [Тзо-иТз0] X [4-1,4] х ''' х .70 = 1, •••,/, ¿г = 1 ,...,то, ¿=1,

Множество всех ячеек Ч]0,з1,...,зп обозначим через

2 = !'// ,/ ....../ ./'(> = 1, • •.,/; ^ = 1, • • - г = 1,.. .,п}.

га.

Обозначим диагональ прямоугольного множества X через А = (xt ~ xi) , а минимальную из

у ¿=1

длин сторон через 5 = min (xf — х~).

i = l,...,n

Аналогично множеству X зададим равномерную сетку на прямоугольном множестве К. Узлами сетки будут точки //,......, = (т^, . ••,??"„):

R i i i R i i 2 R

~R + j = Vi < Vi < ■■■ < Vk = R- p Vk+i-Vk = —, г = 1,...,п.

Множество всех узлов этой сетки обозначим через

¡'/.,....../ = !,•••, i = l,...,n}.

Множество N обладает следующим свойством. Для любого х G К существует точка г] G N такая, что \\v ~ х\\ ^ f' где а = ^ — половина диагонали прямоугольного множества К.

Для приближенного решения задачи Коши (8) в обратном времени применим метод Эйлера с постоянным шагом [9]. Отрезок [О, Г] разделим на s ^ / частей точками

Т

о = io < h < ... < ts = Т, tl+1 -ti = - = hE.

s

Множество всех точек ti разбиения отрезка [О, Г] обозначим через ojp(s) = {i, : г = 0,..., s}. Каждой точке г] G N поставим в соответствие множество Хр(г]), состоящее из s точек, являющихся вершинами ломаной Эйлера с началом в точке (Г, г/):

XE(r]) = {(tt,xtH(r])): i = 0,..., s, x*H{rj) = г], ф8н(л) =--¿А

*h\v) = хШ - hEF(x'H(V)^'H(V)), Фн\V) = ФШ ~ ЬЕС(хШ,ГнтГнШ- (14)

Оценим погрешность метода Эйлера в зависимости от величины s

RH{s) = max max {\\хгн(т]) - жя(^|??)|| + IIФн^) ~ Фн{иМ|)-

Г/ЕЛ/ г = 0,...,s

Обозначим е-окрестность множества D через D(e) = (Кх + 5е) X (Кф + 5е).

Из условий 8 и 9 следует липшицевость функций F(x, ф) и G(x, ф)ф на множестве с положи-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

тельными константами Lp и Lq и ограниченность по норме константами Мр и Mq соответственно, т.е. для любых {х1,ф\) и (х2,ф2) из

\\F(xu Vi) - F(x2, ф2)\\ ^ LF(\\Xl - x2\\ + ||Vi - ф21|),

||С(жЬ Vl)Vl - G(x2, ф2)ф2\\ ^ LG( 11Ж1 - X2\\ + || Vi - -02 II),

и для любой точки (ж, ф) G D {-rjr)

\\F(x^)\\ <С Мр, \\С{х,ф)ф\\<^Ма.

Таким образом, при достаточно большом s для погрешности метода Эйлера верна оценка (см. [7])

^ LHMHT2eL"T 1 Сн Rh{s) ^ ---- = —, (15)

где Lh = Lp + Lg и Mjj = Мр + а параметр s должен удовлетворять неравенству

. 2 Сн s -.

Для каждой ячейки q обозначим через

AT(q) = {г, G Я : «Ше^/Й}

множество всех точек г] G Л/", из которых ломаная Эйлера проходит через ячейку q. Если множество Af(q) непусто, то минимальное значение функционала на этом множестве обозначим через

W(q) = min Ф(т/). (16)

rjGAi(q)

Определим приближенное значение функции цены V(t,x) в ячейке q как значение W(q):

V{t,x) = W{q), (t, х) G q. (17)

Оценим погрешность вычисления функции цены

Rv = max \V(t,x) - V(t,x)\ (18)

(i,i)e[o,T]xx 1 1

в зависимости от параметров m, l, k и s.

Лемма 5. Пусть выполняются условия 1-10. Тогда существуют такие положительные константы Lyx и Lvt, что для любых точек (t\,xi) и (t2,x2) из множества [О, Г] X X справедлива оценка

¡Vit^X!) -V(t2,x2)\ <С Lvx\\x! -x2\\ + LVT\ti -t2\. (19)

Доказательство. Рассмотрим любые две точки (t \,х\) и (t2,x2) из [О, Г] X X. Так как решение задачи оптимального управления с начальным условием x(t\) = х\ существует, то найдется некоторое допустимое управление tii(-) G U, при котором функционал (2) достигает минимума.

Оценим расстояние между двумя решениями системы (1), исходящими из точек (¿х, жх) и

(Ь2,х2) поД действием одного и того же управления «!(•). Обозначим эти решения ж(-, «!(•))

и ж(• (¿2? ж2? (")) соответственно.

Из условия 1 следует липшицевость по переменной х функции /(ж, и) при xE.KviuE.Pc

некоторой константой Ь и ограниченность /(ж, и) по норме константой М = тах ||/(ж,и)||.

хек,иеР

Из оценки расхождения двух движений [2] получаем

Цх^г^х^щф)) - х(т\г2,х2,и1(-))\\ <с (\\хх - х2\\ + м - г2\)еьт. (20)

Из условия 5 следует липшицевость функции Ф(ж) на множестве К с некоторой константой Ьф. Используя неравенство (20), получаем оценку

|Ф(Ж(Г|^1,Ж1,И1(-))) - Ф(ж(Г|^2,ж2,И1(-)))| «С ЬФеьт \\Х1 - х2\\ + ЬФМеьт - Ь2\. (21)

Обозначим Ьух = Ьфвьт и Ьут = ЬфМеьт. Так как Ф(ж(Г|^1, х\, -«!(•))) = V(¿1,2:1) и У(Ь2,х2) ^ ^ Ф(ж(Г|^2, Ж2, И1(-))), то из (21) следует неравенство

У(Ь2,х2) ^ ^(¿1, Ж1) + Ьух ||ж1 - ж2|| + Ьут - ■

Аналогично доказывается обратное неравенство

1, Ж1) ^ У(Ь2,х2) + Ьух ||ж1 - ж2|| + Ьут - ■

Объединяя последние два неравенства, получаем утверждение леммы.

Теорема. Пусть выполняются условия.

1. Функция /(ж, и) и ее частная производная по ж локально липшицевы по совокупности переменных при х £ Я" и и £ Р.

2. Существуют константы С\ ^ 0 и С2 ^ 0 такие, что для всех ж £ Я" и и £ Р

(ж, /(ж, и)) <С С1(1 + ||ж||2), (ж, -/(ж, и)) ^ С2(1 + ||ж||2).

3. Вектограмма /(ж, Р) — выпуклое множество для любого ж £ Я".

4. Функция Ф(ж) имеет локально липшицеву производную по ж при ж £ Я".

5. Существует > 0 такое, что

дФ(х) дх

бф для любого х £ К.

6. Для любых ф £ Я" \ {0} и ж G Д™ множество argmaxií(ж, и, ф) состоит из одной точки.

иеР

7. Функция и*(ж, ф) локально липшицева по совокупности переменных при ж £ Д" и ф Е Я" \ {0}.

8. Условие согласования величин кит

Ск_ = а(1 + Ьфх)еЬнТ < A; k ^ 4т'

г<?е ¿ф^ — константа Липшица функции на множестве К.

9. Условие согласования величин sum

s ^ 4т

10. Параметр s удовлетворяет неравенству

I7 2Сн^ s > max /, -

)

Тогда значение УУ(д) определено для любого д £ О. и для погрешности вычисления функции цены верна оценка

Яу ^ Ьух (Д + 7) - + ЬУТт\, (22)

\ 4/ то I

где константы Ьух и Ьут определены в лемме 5.

Доказательство. Докажем вначале, что значение УУ(д) определено для всех ячеек д Е О,, т.е. множество М(д) непусто. Рассмотрим произвольную ячейку д Е О,- Обозначим точкой центр ячейки д. Так как в ^ I, то найдется точка tj из разбиения ^(й) такая, что (£.,•, ж*) £ д. Так

как решение задачи оптимального управления существует для любого ж) 6 [О, Г] X X, то согласно лемме 4 найдется такая точка т/* 6 К, что хн^^г]*) = ж* и ж*) = Ф(?/*). Из построения множества Л/" следует существование такого г] 6 Л/", что

\\v-v*\\ ^

Из липшицевости производной функции Ф(ж) на множестве К и (23) следует, что

(23)

дФ(г]) дФ (?/*

Зж

Зж

€ L

ф«

ф«

к

Следовательно, для конечных значений вспомогательной переменной, соответствующих точкам г] и ?/*, справедлива оценка расстояния

а

\\Фн{Т\г,) ~ фн{Т\г,*)\\ ^

к

(24)

Из оценки расхождения двух движений [2], неравенств (23), (24) и условия 8 теоремы следует оценка

5

\xH(tj\v) - xH(tj\v*)\\ = \\хн(Ь\г})-х4 <: + <: -(l + L„JeL-T <с —. (25)

Рассмотрим точку х3н(г])), принадлежащую ломаной Эйлера Хе(т])- Из условия 9 теоремы следует оценка расстояния

хн(Ъ\ч) - хн(г])

Объединяя неравенства (25) и (26), получаем

5

Сн $

^ s ^ 4 тп

(26)

xJH(ri) - х* ^ \\xH(tj\rj) - ж*|| + xH(tj\rj) - xJH(r])

<

2m

Следовательно, точка (Ь^^хн^к^'ч)) принадлежит ячейке q, и значит,

ХЕ(71)ПдфФ.

Таким образом, для любого д Ё 2 множество Л/"(д) ф 0.

Докажем оценку сверху для \¥(д). Используя липшицевость Ф(ж), получаем

и следовательно,

|Ф(гу) - Ф(т?*)| ^ 1ф || 1] - щ\\ ^ Ьф-,

Ф[Г]) ^ Ф(^) + = V(tj,x*) + Lф^.

Так как г] £ M(q), то из формулы (16) следует, что W(q) ^ Ф(?/), и значит,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из леммы 5 следует оценка

W(q) iC Ф(??) ^ V(tj, х*) + 1Ф-.

\V(t,x)-V(tj,xm) \ <: LVx^ + LVT J

для любой точки (t, ж) G q. Таким образом, из (27) и (28) получаем

(т Д Т

W{q) iC V{t,x) + ЬФ- + Lvx— + LVtT-

К ТП I

(27)

(28)

(29)

Докажем теперь оценку снизу для Так какЛ/"(д) ф 0, то выберем любую г] £ Л/"(д) такую, что

= Ф(г]). Пусть ж^(?])) — любая точка из множества Хе(т]), которая принадлежит ячейке q. Для погрешности метода Эйлера справедлива оценка

Сн $

^ s ^ 4 тп

xH{t3\rt) - x3H(r}) Из определения функции цены получаем

W(q)=^(V)^V(tj,xH(tj\rl)).

(30)

Из леммы 5 и (30) следует

< L —

^ VX 4т

V(tj,ZH(tj,Ti) - V(tj,xJH(r]))

Из неравенства (31) и липшицевости функции цены получаем оценку

6 А Т

W(q)^V(t,x)- Lvx---Lyx--Lvt~t- (32)

4m m I

Объединяя оценки сверху (29) и снизу (32), получаем

, а 6 \ А Т

Rv ^ max ( Ьф~, Lvx— I + Lvx~ + LVTj- (33)

Сравним величины Ьф^ и LvxИз условия 8 теоремы следует, что

_ а а(1 + ЬФ^)еЬнТ 6 6

Lф— ^ Ьф-р2- ^ Ьф-— ^ Lvx~—•

к к 4т 4т

Неравенство (33) примет вид

Rv ^ Lvx ( А + 7 ] — + Lvtt\.

\ 4 J т I

Получаем искомую оценку (22) погрешности вычисления функции цены. Теорема доказана.

Замечание. При определении множества К, ограничивающего множество достижимости X(t,to, xq) системы (1), использовались экспоненциальные оценки, которые могут давать результат, сильно превосходящий аппроксимируемое множество достижимости. Поэтому в тех задачах, где удается доказать, что множество достижимости X(t,to, xq) содержится в некотором прямоугольном множестве К' С К при любых (tо,жо) Е [О, Т] X X и t G [to,T], вместо множества К можно использовать множество К'.

Также вместо множества D можно рассматривать произвольное множество D' С D, содержащее в себе все решения задачи Коши (8) (ж#(£|жт)> Фн{^\хт)) при любых t G [О, Г] и хт G К.

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974.

2. Камке Э. Справочник по обыкновенным дифференциальным уравнениям. М.: Наука, 1976.

3. Филиппов А.Ф. О некоторых вопросах теории оптимального регулирования // Вестн. Моск. ун-та. Сер. 1. Математика и механика. 1959. № 2. С. 25-32.

4. Понтрягин JI. С., Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р.В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1976.

5. Субботина H.H. Необходимые и достаточные условия оптимальности управлений и траекторий // Синтез оптимального управления в игровых системах. Свердловск: ИММ УНЦ АН СССР, 1986. С. 86-96.

6. Субботина H.H. Необходимые и достаточные условия оптимальности в терминах принципа максимума и супердифференциала функции цены // Свердловск: ИММ УрО АН СССР, 1988. Деп. в ВИНИТИ. № 2898-В.88.

7. Subbotina N.N. The maximum principle and the superdifferential of the value function // Probl. Control Inform. Theory. 1989. 18(3). P. 151-160.

8. Васильев Ф.П. Методы оптимизации. M.: Факториал пресс, 2002.

9. Бахвалов Н.С. Численные методы. М.: Наука, 1973.

Поступила в редакцию 15.06.04

УДК 530.145:510.58:519.68

Квантовые компьютеры: смена парадигмы вычислений / Валиев К. А. // Вестн. Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2005. № 2. С. 3-16.

Квантовая механика предлагает принципиально новый вид вычислений — квантовые вычисления. Они радикально отличаются от классических. Например, задачи перебора, а также моделирование многочастичной квантовой динамики могут быть решены на квантовом компьютере принципиально быстрее, чем на любом возможном классическом. В статье рассматривается общая схема квантового компьютера и анализируется работа его элементарных вентилей.

Ил. 5. Библиогр. 20.

УДК 517.956.4, 517.958:535.14

Об аттракторе одного уравнения оптической фурье-фильтрации / Чушкин В. А. // Вестн. Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2005. № 2. С. 16-25.

Исследована динамика нелинейных параболических функционально-дифференциальных уравнений с оператором дискретной фурье-фильтрации в функциональном члене. Такие задачи возникают при математическом моделировании адаптивных оптических систем с фурье-фильтрацией в контуре обратной связи. Для произвольного дискретного фильтра из пространства £оо доказано существование у исследуемой задачи компактного аттрактора и получены оценки сверху и снизу его хаусдорфовой размерности.

Библиогр. 11.

УДК 519.2

Об асимптотическом распределении промежуточных порядковых статистик / П а г у-рова В. И. // Вестн. Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2005. № 2. С. 26-32.

Для двупараметрических сдвигово-масштабных семейств распределений исследуется асимптотическое распределение промежуточных порядковых статистик ранга па, 0 < а < 1, в выборке объема п независимых одинаково распределенных величин. Для однопараметрических семейств указана скорость сходимости распределения нормированной порядковой статистики к предельному закону при различных оценках неизвестного параметра сдвига.

Библиогр. 3.

УДК 517.925, 521.135

Локализация невырожденных бифуркаций периодических решений ограниченной задачи трех тел / Мельников Н.Б. // Вестн. Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2005. № 2. С. 33-38.

Рассматривается двухпараметрическое семейство периодических решений ограниченной задачи трех тел. Получены условия для локализации двух основных типов бифуркаций. Эти условия конструктивны и дают большую точность по сравнению с методом экстраполяции.

Библиогр. 8.

УДК 517.977.58

Метод приближенного вычисления функции цены для задачи оптимального управления с терминальным функционалом /Камзолкин Д. В. // Вестн. Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2005. № 2. С. 38-47.

Рассматривается задача оптимального управления со свободным правым концом и терминальным функционалом качества. Приводится численный метод приближенного вычисления функции цены, использующий репрезентативную формулу для функции цены на основе экстремалей принципа максимума Понтрягина. Доказывается сходимость предложенного метода. Приводятся оценки погрешности вычисления в зависимости от параметров численного метода. Библиогр. 9.

i Надоели баннеры? Вы всегда можете отключить рекламу.