Научная статья на тему 'Явное решение линейно-квадратичной задачи оптимального регулирования с произвольным терминальным членом'

Явное решение линейно-квадратичной задачи оптимального регулирования с произвольным терминальным членом Текст научной статьи по специальности «Математика»

CC BY
200
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНО-КВАДРАТИЧНЫЙ РЕГУЛЯТОР / LINEAR-QUADRATIC REGULATOR

Аннотация научной статьи по математике, автор научной работы — Асеков Азнаур Заурович

В рассматриваемой задаче оптимального регулирования минимизируется сумма линейно-квадратичного интегрального функционала и терминального члена произвольного вида. Доказывается, что в этом случае управление также можно построить в явной аналитической форме.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Асеков Азнаур Заурович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Explicit solution to a linear-square problem of optimal regulation with an arbitrary terminal

An optimal control problem is considered and the sum of a linear-quadratic integral functional and the terminal term of arbitrary form is minimized. It is proved that the control can be also constructed in explicit analytic form in this case.

Текст научной работы на тему «Явное решение линейно-квадратичной задачи оптимального регулирования с произвольным терминальным членом»

2. Лупанов О.Б. Об одном подходе к синтезу управляющих систем — принципе локального кодирования // Проблемы кибернетики. Вып. 14. М.: Наука, 1965. 31-110.

3. Шоломов Л.А. О реализации недоопределенных булевых функций схемами из функциональных элементов // Проблемы кибернетики. Вып. 21. М.: Наука, 1969. 215-226.

Поступила в редакцию 12.10.2016

УДК 517.977

ЯВНОЕ РЕШЕНИЕ ЛИНЕИНО-КВАДРАТИЧНОИ ЗАДАЧИ ОПТИМАЛЬНОГО РЕГУЛИРОВАНИЯ С ПРОИЗВОЛЬНЫМ ТЕРМИНАЛЬНЫМ ЧЛЕНОМ

А. 3. Асеков1

В рассматриваемой задаче оптимального регулирования минимизируется сумма линейно-квадратичного интегрального функционала и терминального члена произвольного вида. Доказывается, что в этом случае управление также можно построить в явной аналитической форме.

Ключевые слова: линейно-квадратичный регулятор.

An optimal control problem is considered and the sum of a linear-quadratic integral functional and the terminal term of arbitrary form is minimized. It is proved that the control can be also constructed in explicit analytic form in this case.

Key words: linear-quadratic regulator.

Задача отиимального регулирования с линейно-квадратичным интегральным функционалом и линейно-квадратичным терминальным членом хорошо изучена (см., например, [1]), оптимальное управление строится в явном виде через решения матричных уравнений типа Риккати. В настоящей работе рассматривается линейно-квадратичная задача оптимального регулирования с терминальным членом в функционале произвольного (необязательно задаваемого линейно-квадратичной функцией) вида и доказывается, что в этом случае управление также можно выразить через решения систем обыкновенных дифференциальных уравнений или в аналитической форме.

Рассмотрим задачу оптимального регулирования

J = М[ [ О + 2£N(t)u + (N0(t)u, и) + 2h^ + 2h2u)dt + Ф(£(Т))] -»• min, (1)

Jo

где Ni(t) (г = 0,1), N(t) — заданные, неотрицательно определенные симметричные матрицы размера п х п, hi — некоторые заданные векторы, и = (щ,...,ип) — искомое управление, (u,v) = Y17=iuivi' и = (и\,...,ип), v = (v\,...,vn), Ф(у\,...,уп) — произвольная гладкая функция переменных у 1,... ,уп. В классической постановке Ф является линейно-квадратичной формой.

Процесс £ = ... удовлетворяет стохастическому дифференциальному уравнению = (a(t)^ + u)dt + aduj с начальным условием {(0) = {о = (С?, • • •, £п)> гДе ш = (wb • • • > шп) — винеровский процесс с независимыми компонентами, a(t) — матрица размерности п х п, а = {(Tij) — матрица размерности п х п с постоянными элементами.

Мы предполагаем, что коэффициенты матриц Ni(t) (г = 0,1), N(t), a(t) гладко зависят от t.

Далее мы будем использовать результаты работ [2, 3], в которых строится решение задач Коши для эволюционных уравнений с эллиптической частью специального вида. Приведем нужные нам результаты.

1 Асеков Азнаур Заурович — асп. каф. дифференциальных уравнений мех.-мат. ф-та МГУ, e-mail: az.asekovQrambler.ru.

Рассмотрим задачу Коши

W( 0) =ш(х),

(2)

где

cw = -+£(£m* + Ш

%3 г \ 3 /

+ I] Fij(t)xixj + gi(t)xí + h(t) W, \ íj í /

элементы матриц и функции F, А, В, с, g, h непрерывны по t, матрица А с элементами Aij положительно определена для t ^ 0.

Задача (2) — задача Коши для параболического дифференциального уравнения с полиномиальными коэффициентами. Коэффициенты при операторе второго порядка не зависят от пространственных переменных, при операторе первого порядка — линейны по пространственным переменным, а потенциал — линейно-квадратичный по пространственным переменным. Введем оператор £t\uj(x)\ = W(t,x), ставящий в соответствие начальному условию решение задачи Коши в момент времени t, аналогичный свертке с ядром Пуассона в случае уравнения теплопроводности. Для определения оператора 8г в явном виде рассмотрим задачу Коши

Г ди _ г

dt ьи, (3)

[и( 0) = 5у(х),

где 5у(х) — дельта-функция с носителем в точке у.

Согласно [2, 3], решение задачи Коши (3) имеет вид

u(t, х, у) = exp{xTS{t)x + qT{t)x + r(t)}C(t) exp{(P~1(t)(x - m(t, y)),x - m(t, y))}, (4) где C(t), S(t), P(t), m(t, y), q(t), r(t) — решения систем обыкновенных дифференциальных уравнений

'S' = 2 SAS + SB + BTS + \{F + FT),

q' = (2SA + BT)q + 2Sc + g, (5)

У = Tr (AS) + \qTAq + qTc + h,

' P' = -P(2AS + BT) - (2AS + B)P - 2A,

m' = -(2AS + B)m -c-Aq, (6)

C' = C(Tv(AP~1)).

Начальные значения для системы (5) суть <5(0) = 0, q(0) = 0, r(0) = 0, для системы (6) Р(0) = 0, т(0) = у, C(t) есть частное решение третьего уравнения системы (6) вида

Сп\ =_I_ех r_ü [* d31

лУ(2iit)n det A(0) exp 2 J0 s S|'

■sj(2nt)n det A(0)

где

q(t) = itr ((E + Q(t))~l -E + (A(t) - A(0))A(0)-\E + Q(t))"1),

Q(t) = ~^R(t)A(0)-l,R(t) = P(t) + 2L4(0)

при исходном условии Jq ^p-ds < oo (cm. [4]).

Легко видеть, что в (4) решение уравнения для m(t, у) зависит от начального условия у аф-финно. Именно если m\(t),..., mn(t) есть система решений для второго уравнения системы (6) без членов (—с — Aq) и с начальными условиями в виде единичных ортов е\,... ,еп, a mo(t) — решение

неоднородного уравнения с нулевым начальным условием, то m(t,y) = m\{t)yi + ... + mn{t)yn + mo{t). Следовательно, искомое решение задачи (2) может быть представлено в виде

u(t, х, у) = exp{xTS(t)x + qT(t)x + r(t)}x

п п

rrii(t)yi - m0(t)), (x - rm(t)yi - m0(t)))},

i= 1 i= 1

а значение оператора S1 [w] (x) определяется по формуле

/+оо

u(t,x,y)u(y)dy. (7)

-оо

Применим приведенные результаты к проблеме построения синтеза управления задачи (1) в случае, когда Ф(ж) необязательно является линейно-квадратичной функцией. Уравнение Беллмана и терминальное условие для задачи (1) имеют вид

dV

+2(ж, Nu) + 2hix + 2h2u + ^Tr(aTHx(V)a) + (N\x, x) + (N0u, u)}, (8)

V(T,x) = Ф(х),

где V(t,x) — функция Беллмана. Возьмем инфимум по и в правой части уравнения и применим к полученному уравнению "логарифмическое" преобразование V = ^ In W, в = const > 0. Вычисления, которые мы опускаем, показывают, что нелинейное уравнение Беллмана (8) "линеаризуется" с помощью данной замены, если а и No — диагональные матрицы и а2No = где Е — единичная матрица. В этом случае уравнение (8) принимает вид

= + (9)

г г

где введены обозначения: L = a{t)x+AM N x+AMh2+^Kh2+^К N x, S = 2hiX+4(2MNx+Mh,2, /¿2) + 4(MNx, Nx) + (N\x, x) + 4(KNx, Nx) + 4(Kh2,h2) + 8(KNx, h2).

Терминальное условие для уравнения (9) записывается следующим образом: W(T, х) = едф(х). Сформулируем теперь основной результат в форме теоремы.

Теорема. Пусть а — диагональная матрица, a2No = аЕ, а > 0 и функция Ф(у), определяющая, "шт,ра,фное" терминальное слагаемое в функционале (1), принадлежит классу функций, для которых определен интеграл, (7). Тогда, оптимальное управление (в форме синтеза,) задачи (1) имеет вид

и* = -(2No)~1(vA Ь^[е0Ф(ж)]) + 2Nx + 2h2),d =

и ¿(1

Доказательство. Уравнение Беллмана, соответствующее исходной задаче (1), после преобразований и применения "линеаризующей" замены V = jjlnW принимает вид (9). Нетрудно видеть, что оно аналогично исследованному в работах [2, 3] и задача Коши для него может быть выражена через решения систем обыкновенных (матричных, векторных и скалярных) дифференциальных уравнений вида (5) и (6). Оптимальное управление и* в форме синтеза строится по функции Беллмана согласно хорошо известным формулам (см. [1]).

С помощью приведенной теоремы можно свести исходную задачу построения синтеза оптимального управления к интегрированию систем обыкновенных дифференциальных уравнений и расчету интегралов, хотя терминальная функция Ф(ж) не является линейно-квадратичной.

Автор приносит благодарность A.C. Шамаеву за постановку задачи и внимание к работе, а также А. Г. Чечкину за ценные замечания при обсуждении формул (4)-(6).

СПИСОК ЛИТЕРАТУРЫ

1. Черноусько Ф.Л., Колмаповский В.Б. Оптимальное управление при случайных возмущениях. М.: Физмат-лит, 1978.

2. Suslov S.K. Quantum integrals of motion for variable quadratic Hamiltonians // Ann. Phys. 2010. 325, N 9. 1884-1912.

3. Yau S.S.T. Computation of Fokker-Planck equation // Quart. Appl. Math. 2004. 62, N 4. 643-650.

4. Chechkin A.G. Explicit form of the fundamental solution to a second order parabolic operator //J. Math. Sci. 2015. 210, N 4. 545-555.

Поступила в редакцию 23.12.2016

УДК 519.622

О РАЗРЕШИМОСТИ СИСТЕМЫ УРАВНЕНИЙ ОТНОСИТЕЛЬНО КОЭФФИЦИЕНТОВ ФУРЬЕ ЧЕБЫШЁВА ПРИ РЕШЕНИИ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ МЕТОДОМ РЯДОВ ЧЕБЫШЁВА

О. Б. Арушанян1, С. Ф. Залеткин2

Приведена формулировка теоремы о разрешимости системы уравнений относительно приближенных значений коэффициентов Фурье—Чебышёва. Теорема является теоретическим обоснованием метода интегрирования обыкновенных дифференциальных уравнений с использованием рядов Чебышёва.

Ключевые слова: обыкновенные дифференциальные уравнения, приближенные аналитические методы, численные методы, ортогональные разложения, смещенные ряды Чебышёва, квадратурные формулы Маркова.

A solvability theorem for a system of equations with respect to approximate values of Fourier-Chebyshev coefficients is formulated. This theorem is a theoretical substantiation for the numerical solution of ordinary differential equations using Chebyshev series.

Key words: ordinary differential equations, approximate analytical methods, numerical methods, orthogonal expansions, shifted Chebyshev series, Markov quadrature formulas.

Рассматривается задача Коши для нормальной системы M обыкновенных дифференциальных уравнений

У' = fix,у), у(х0)=уо, х0 ^х ^хо+Х, (1)

при условии, что функция fix,у) непрерывна в области I) определения системы вместе с частными производными до некоторого порядка. Предполагается также, что на отрезке [жо, Жо + X] задача Коши (1) имеет единственное решение.

В работах [1, 2] предложен приближенный метод решения задачи (1), основанный на разложении правой части системы

y'ix) = /(ж) uix)) = f{xo + oth, yixo + ah)) = Ф(а), 0 ^ a ^ 1, h^X,

па частичном отрезке [жо, Жо + h] в ряд по смещенным многочленам Чебышёва первого рода оо 1

Ф(а) = 5>?[ВД(«). а*[Ф] = - f Щ^Щйх, Ща) = Щ2а - 1). (2)

Здесь штрих у знака суммы означает, что слагаемое с индексом 0 берется с дополнительным множителем 1/2, и Tiit) — многочлен Чебышёва на отрезке [—1, 1]. Если коэффициенты этого разложения

1 Арушанян Олег Багратович — доктор техн. наук, проф., зав. лаб. Научно-исслед. вычисл. центра МГУ, e-mail: arushQsrcc.msu.ru.

2 Залеткин Сергей Федорович — канд. физ.-мат. наук, ст. науч. сотр. Научно-исслед. вычисл. центра МГУ, e-mail: irazQsrcc.msu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.