Maksimov Vyacheslav Ivanovich, Institute for Mathematics and Mechanics of the Ural branch of the Russian Academy of Sciences, Ekaterinburg, the Russian Federation, Doctor of Physics and Mathematics, Professor, the Head of the Differential Equations Department, e-mail: maksimov@imm.uran.ru
УДК 517.929
ОДИН ВАРИАНТ ПРИНЦИПА МАКСИМУМА ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С ПОСЛЕДЕЙСТВИЕМ
© В.П. Максимов
Ключевые слова: линейные функционально-дифференциальные системы; задачи управления; оптимальное управление.
Для линейной функционально-дифференциальной системы с последействием общего вида, рассматривается задача оптимального управления с линейным целевым функционалом. На основе использования матрицы Коши выводится необходимое и достаточное условие оптимальности в форме принципа максимума. Дано явное представление аналога функции Гамильтона-Понтрягина для общего случая, охватывающего задачи с нелокальным оператором, реализующим управляющие воздействия.
Здесь мы следуем обозначениям и основным положениям теории функционально-дифференциальных уравнений в части линейных систем с последействием [1-3]. Обозначим через Ьп = Ьп[0,Т] пространство суммируемых по Лебегу на конечном промежутке [0,Т] функций г : [0,Т] ^ Еп с нормой 11-гЦ^п = /0 |г(г)|п где |-|п - норма в Еп (далее, если размерность пространства очевидна, индекс у нормы будем опускать). Обозначим через АСп = АСп[0, Т] пространство абсолютно непрерывных функций х : [0; Т] ^ Яп с нормой
1|х|1асп = |х(0)| + ||Х•
Для описания системы управления введем линейный оператор С :
(Сх)(г) = х(г) — [ К(г,в)х(в) ^ - А(г)х(0), г € [0,Т]. (1)
0
Здесь элементы к^ (г, в) ядра К (г, в) измеримы на множестве {(г, в) :0 ^ в ^ г ^ Т} и таковы, что на этом множестве |к^ (г, в)| ^ к(г), г,^ = 1,...,п, где функция к суммируема на [0, Т] , элементы (п х п) -матрицы А(г) суммируемы на [0, Т] . Оператор С : АСп ^ Ьп ограничен. Функционально-дифференциальная система Су = / охватывает дифференциальные уравнения с сосредоточенным и/или распределенным запаздыванием и интегро-дифференциальные системы Вольтерра (см., например, [4]). В частности, для оператора (Сх) (г) = Х(г) — /ф й8 Я(г, в) х(в) с распределенным запаздыванием, где без ограничения общности можно считать Я(£, г) = 0 , имеем К (г, в) = Я(г, в), А(г) = Я(г, 0) .
При сделанных предположениях линейный оператор ^ : Ьп ^ Ьп, (фг)(г) = г(г) — — К (г, в)г(в)(в) ^в имеет ограниченный обратный (^-1/)(г) = / (г) + ^(г,в)/(в)(в) ^в , где ^(г,в) - резольвентное ядро, соответствующее ядру К (г, в) . Матрица С (г, в) = Е + + в) где Е — единичная (п х п) -матрица, называется матрицей Коши [5, 6].
Свойства матрицы Коши, используемые ниже, подробно исследованы в [6]. Отметим здесь только два соотношения, связывающих матрицу Коши с ядром К (г, в) :
С (г,в)= /" С (г,т )К (т, в) ^т + Е, С^(г,в)= / С'(г,т )К (т,в) ^т + К (г, в).
Система управления описывается уравнением
(Lx)(t) = (Bu)(t) + g(t),t € [0,T]. (2)
Здесь B —линейный оператор, определенный на пространстве L2 = L2[0,T] суммируемых с квадратом функций u : [0, T] ^ Rr , норма в этом пространстве порождается стандартным скалярным произведением (u, v) = JQTu^(t)v(t)dt (■± - символ транспонирования). Предполагается, что B действует в пространство Ln , ограничен и обладает свойством вольтерровости: для любого т € (0, T) (Bu)(t) = 0 на [0, т] для всех таких u € Lr2 , что u(t) = 0 на [0,т]; g € Ln . Начальное состояние системы (2) задано: y(0) = а , цель управления задается с помощью линейного ограниченного функционала Л : ACn х L2 ^ R, Л(ж, u) = + Au, l : ACn ^ R, Л : Lrr ^ R. Ограничения на управление формулируются в виде системы линейных неравенств: Gu(t) ^ 7, t € [0, T] , где G — заданная (N х r) -матрица; предполагается, что множество решений системы Gv ^ 7 (множество допустимых значений управления) непусто и ограничено в Rr . Обозначим это множество через V . Требуется найти такое управление u : [0, T] ^ Rr , при котором соответствующая траектория системы (2) с заданным начальным состоянием доставляет целевому функционалу Л минимальное значение. Таким образом, рассматриваемая задача имеет вид
Л(х, u) ^ min, (Lx) (t) = (Bu) (t) + g(t), t € [0, T], x(0) = a, Gu(t) ^ 7, t € [0, T]. (3)
Напомним общий вид функционала l: = фх(0) + JQT ^>(s)X(s) ds и функционала Л : Au = JQT A(s)u(s) ds . Здесь ф - постоянный (1 х n) -вектор, <^(s) - (1 х n) -вектор с ограниченными в существенном элементами, A^(-) € L2 .
Обозначим через $ : [0,T] ^ (Rn)* решение интегрального уравнения
0(t) = [ 0(т) K(T,t) dT - [ ф) K(T,t) dT, t € [0,T]. (4)
Jt Jt
Однозначная разрешимость этого уравнения установлена в [6], свойства решения, определяемые свойствами ядра K (t, s) как функции второго аргумента, исследованы в [7, с. 52-63], где, в частности, сформулированы условия, при выполнении которых функция $(■) наследует соответствующие свойства функции K(t, ■) (ограниченность вариации, непрерывность, абсолютную непрерывность). Определим отображение H : [0,T] х (Ln)* х х (Ln)* х Rr ^ R равенством
H(t,y(-),z(-),u) = B*(y - z)(t) ■ u - A(t) ■ u. (5)
Здесь знак * используется для перехода к сопряженным пространствам и операторам. Теорема1. Управление u(t) решает задачу (3), если и только если равенство
H(t,0(O,p(O,u(t)) = maxH(t, #(■), p(-),u)
uev
выполняется почти всюду на [0, T] .
Замечание. В случае, когда матрица C (t, s) известна, функция $(t) может быть записана в явном виде:
tf(t) = J ф) C' (T,t) dT.
Приведем явный вид отображения H для некоторых случаев оператора B . С л у ч а й 1. (Bu)(t) = B(t)u(t). В этом случае имеем
H(t,y(-),z(-),u) = (y(t) - z(t)) ■ B(t) ■ u - A(t) ■ u.
Здесь столбцы (n х r) -матриц,ы принадлежат пространству L^ .
Случай 2. (Ви)(г) = /0Г В(г,т)и(т) ^т. Для этого случая отображение Н имеет вид
Н(г,у(-),г(-),и) = £ (у(в) — г(в)) ■ В(в,г) ^в ■ и — л(г) ■ и.
Здесь ядро B(i,r) обеспечивает непрерывное действие интегрального оператора B из пространства L2 в пространство Ln .
, wx fB(t)u(t - А), если t е [A, T],
С л у ч а й 3. (Bu)(t) = ^ v ; v J' 1 ' J' где А, 0 < А < T, -
I 0 в остальных случаях,
постоянное запаздывание. В таком случае отображение H определяется равенством H(i,y(-),z(-),u) = Х[0,т—A](t) (y(t + А) - z(t + А)) ■ B(t + А) ■ u - A(t) ■ u,
где Х[о,т—A](') — характеристическая функция отрезка [0,T — А] .
Отметим, что подход к выводу принципа максимума на основе вариационных производных, охватывающий и нелинейные системы управления с последействием, систематически изложен в [8]. Наш подход основывается на использовании матрицы Коши линейной системы и позволяет в случае линейной системы управления с последействием по состоянию и по управлению формулировать принцип максимума только в терминах управления. При этом роль сопряженного уравнения выполняет уравнение (4), форма которого оказывается универсальной и общей для всех видов последействия, охватываемых постановкой задачи (3).
ЛИТЕРАТУРА
1. Азбелев Н.В., Максимов В.П., Рахматуллина Л.Ф. Введение в теорию функционально-дифференциальных уравнений. М.: Наука, 1991.
2. Азбелев Н.В., Максимов В.П., Рахматуллина Л.Ф. Элементы современной теории функционально-дифференциальных уравнений. М.: Институт компьютерных исследований, 2002.
3. Azbelev N.V., Maksimov V.P., Rakhmatullina L.F. Introduction to the theory of functional differential equations: methods and applications. New York; Cairo: Hindawi Publishing Corporation, 2007.
4. Азбелев Н.В., Максимов В.П. Априорные оценки решений задачи Коши и разрешимость краевых задач для уравнений с запаздывающим аргументом // Дифференц. уравнения. 1979. Т. 15. № 10. C. 17311747.
5. Максимов В.П., Рахматуллина Л.Ф. О представлении решений линейного функционально-дифференциального уравнения // Дифференц. уравнения. 1973. Т. 9. № 6. C. 1026-1036.
6. Максимов В.П. О формуле Коши для функционально-дифференциального уравнения // Дифференц. уравнения. 1977. Т. 13. № 4. C. 601-606.
7. Максимов В.П. Вопросы общей теории функционально-дифференциальных уравнений. Пермь: Изд-во ПГУ, 2003.
8. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. М.: Книжный дом «ЛИБРОКОМ», 2011.
БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке в рамках Постановления Правительства РФ от 9.04.2010 г. № 218, гос. контракт № 02.G25.31.0039.
Поступила в редакцию 24 апреля 2015 г.
Maksimov V.P. A VARIANT OF THE MAXIMUM PRINCIPLE FOR LINEAR SYSTEMS WITH AFTEREFFECT
An optimal control problem is considered for the linear system with time delay of the general form. A sufficient and necessary condition of optimality is derived using the Cauchy matrix. The representation of an analog to the Hamilton-Pontryagin function is given as applied to the case of nonlocal control input operator.
Key words: functional differential systems; control problems; optimal control.
Максимов Владимир Петрович, Пермский государственный национальный исследовательский университет, г. Пермь, Российская Федерация, доктор физико-математических наук, профессор кафедры информационных систем и математических методов в экономике, e-mail: maksimov@econ.psu.ru
Maksimov Vladimir Petrovich, Perm State National Research University, Perm, the Russian Federation, Doctor of Physics and Mathematics, Professor of the Information Systems and Mathematical Methods in Economics Department, e-mail: maksimov@econ.psu.ru
УДК 517.9
THE LAPLACE TRANSFORM METHOD IN AN ALGORITHM OF SOLVING DIFFERENTIAL EQUATIONS WITH DELAYED ARGUMENT
© N.A. Malashonok
Key words: linear differential equations; delayed argument; symbolic-numerical algorithm. The method is used for linear differential equations with delayed argument. There is constructed an algorithm, which is symbolic-numerical. The numerical component concerns a representation of functions, involved into the process by some kind of series.
1. Introduction
There is a class of physical problems, which is associated with action of some kind of complementary forces - forces which are involved at various not initial time moments. Such problems frequently lead to the so called differential equations with delayed argument. Different ways of dealing with such equations exist. See for example [1-4]. We consider linear equations with constant coefficients and right-hand parts of exponential increase.
Applications of the Laplace transform method are well known. In this article we continue working-out the application of Laplace transform for solving differential equations (for example [5-7]).
It permits to reduce an infinitesimal problem to an algebraic one that may be solved symbolically or symbolic-numerically. Moreover, it gives means to estimate an accuracy of calculations.
However there are some facts which prevent using this method in a symbolic way. Some difficulties, for example, are connected with a form of the solution of the Laplace image of the input differential equations, i.e. the exponential polynomials, which appears in the solution of algebraic equation. We suggest the usage of series expansion of some kind for symbolic-numerical solution with a necessary accuracy. It extends the class of equations to be solved by this method.
We restrict ourselves to the consideration of one equation, but the method works similarly with systems of equations of such type.
2. A differential equation with delayed argument
We consider all functions, either unknown or standing at the right-hand parts of equations, on the segment T : 0 ^ t ^ T. Split T into parts by rational points 0 < tk < tk+1 < T, k = = 0,..., N. All functions of the argument t are supposed to satisfy the conditions for existing of their Laplace transform, i.e. they have an exponential increase.