Научная статья на тему 'О НЕПРЕРЫВНОСТИ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ КАК ФУНКЦИИ НАЧАЛЬНОГО СОСТОЯНИЯ ДЛЯ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ОБЪЕКТОВ'

О НЕПРЕРЫВНОСТИ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ КАК ФУНКЦИИ НАЧАЛЬНОГО СОСТОЯНИЯ ДЛЯ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ОБЪЕКТОВ Текст научной статьи по специальности «Математика»

CC BY
16
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ БЫСТРОДЕЙСТВИЕ / ИЗМЕРИМЫЕ УПРАВЛЕНИЯ / ФОРМУЛА КОШИ / МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ / ИНТЕГРАЛ ОТ МНОГОЗНАЧНОГО ОТОБРАЖЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Никольский М. С.

В статье изучается свойство непрерывности времени оптимального быстродействия как функции начального состояния для линейных управляемых объектов. При этом получены обобщения части теоремы 21 и части утверждения теоремы 22 из монографии Э. Б. Ли и Л. Маркуса "Основы теории оптимального управления", касающиеся непрерывности времени оптимального быстродействия как функции начального состояния управляемого объекта. В данной статье широко используется аппарат опорных функций из выпуклого анализа. Можно отметить конструктивность полученных результатов по сравнению с более общими известными результатами, полученными с использованием более абстрактного математического аппарата. В первой части статьи рассматривается стационарный случай, а во второй --- нестационарный.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT CONTINUITY OF OPTIMAL TIME, AS THE FUNCTION OF INITIAL STATE, FOR LINEAR CONTROL OBJECTS

It is considered the question about continuity of optimal time, as the function of initial state, for linear control objects. We obtained some generalization of the Theorems 21, 22 from the second Chapter of monograph E.B.Lee, L.Markus "Foundations of Optimal Control Theory," J.Wiley and Sons, 1967, connected with continuity of optimal time, as the function of initial state, for linear controlled objects. In the article we broadly use the apparatus of support functions from Convex Analysis. Our results are obtained in more constructive form than another general results In this direction. In the first part we consider stationary case and in the second part it is considered non-stationary case.

Текст научной работы на тему «О НЕПРЕРЫВНОСТИ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ КАК ФУНКЦИИ НАЧАЛЬНОГО СОСТОЯНИЯ ДЛЯ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ОБЪЕКТОВ»

ВЕСТН. МОСК. УН-ТА. СЕР. 15. ВЫЧИСЛ. МАТЕМ. И КИБЕРН. 2023. № 2. С. 31-38 Lomonosov Computational Mathematics and Cybernetics Journal

УДК 517.977

М.С. Никольский1

О НЕПРЕРЫВНОСТИ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ КАК ФУНКЦИИ НАЧАЛЬНОГО СОСТОЯНИЯ ДЛЯ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ОБЪЕКТОВ

В статье изучается свойство непрерывности времени оптимального быстродействия как функции начального состояния для линейных управляемых объектов. При этом получены обобщения части теоремы 21 и части утверждения теоремы 22 из монографии Э. Б. Ли и Л. Маркуса "Основы теории оптимального управления", касающиеся непрерывности времени оптимального быстродействия как функции начального состояния управляемого объекта. В данной статье широко используется аппарат опорных функций из выпуклого анализа. Можно отметить конструктивность полученных результатов по сравнению с более общими известными результатами, полученными с использованием более абстрактного математического аппарата. В первой части статьи рассматривается стационарный случай, а во второй — нестационарный.

Ключевые слова: оптимальное быстродействие, измеримые управления, формула Коши, многозначные отображения, интеграл от многозначного отображения.

DOI: 10.55959/MSU/0137-0782-15-2023-47-2-31-38

1. Рассматривается линейный управляемый объект вида (см. [1-3])

x = Ax + Bu, x(0) = x0, (1)

где x € Rn (n ^ 1), u € U — выпуклому компакту из Rp (p ^ 1), A — n x n-матрица, B — n x р-матрица, xo — начальный вектор из Rn.

Обозначения. Символом Rk (k ^ 1) условимся обозначать стандартное арифметическое евклидово пространство с элементами, записываемыми в виде k-мерных столбцов, со стандартными скалярным произведением векторов (•, ■) и длиной вектора | ■ Символами rank, int, dist(y,M) будем обозначать соответственно ранг матрицы, внутренность множества, расстояние от точки y до замкнутого множества M.

Движение управляемого объекта (1) происходит под воздействием измеримых по Лебегу управлений

u(t) € U, t ^ 0.

Соответствующее начальному условию x(0) = xo и допустимому управлению u(t) € U, t ^ 0, решение x(t) при t ^ 0 описывается в классе локально абсолютно непрерывных функций формулой Коши вида (см. [2, 3]):

t

x(t) = etAxo + У e(t-s)ABu(s) ds, (2)

o

где etA — экспоненциал матрицы tA, а интеграл понимается в смысле Лебега. О свойствах etA см., например, в [2, 3].

Фиксируем в качестве терминального множества M точку 0 € Rn и рассмотрим задачу оптимального быстродействия из начальной точки xo в терминальную точку M = {0} для управляемого объекта (1) при всевозможных измеримых управлениях u(t) € U, t ^ 0. Известно (см. [2, 3]),

1 Математический ин-т им. В. А. Стеклова РАН, вед. науч. сотр.; факультет ВМК МГУ, проф., д.ф.-м.н.; e-mail: mni@mi-ras.ru

что при наших предположениях из существования хотя бы одного допустимого управления, осуществляющего цель управления для управляемого объекта (1) за конечное время, следует существование оптимального по быстродействию управления с временем оптимального быстродействия T(хо). Отметим, что T(хо) > 0 при хо = 0 и T(0) = 0. Множество точек хо, из которых точка M = {0} достижима для управляемого объекта (1) за конечное время, называется множеством нуль-управляемости. Обозначим его E. Наша цель — получить достаточные условия, при которых функция T(у) непрерывна на E (здесь полагается у = ж0). В дальнейшем предполагаются выполненными следующие два условия. 1°. Ранг матрицы управляемости (см. [2])

C = (B,AB,...,An-1B)

равен п.

2°. Нулевая точка 0 € Rp является внутренней точкой выпуклого компакта U, т.е. 0 € int U. Отметим, что при выполнении условия 1° пара матриц (A, B) называется управляемой по Калману.

Допустим, что при некотором измеримом управлении u(t) € U, 0 ^ t ^ т (т > 0) для данного начального состояния жо = 0 для управляемого объекта (1) выполняется равенство х(т) = 0, т.е.

(см. (2))

т

тЛ Г (Т -°)Л^П(8]

етА х Че(т-')А Ви(в) йв=°-

О

Используя свойства экспоненциала егА и невырожденность матрицы етА, отсюда получаем, что

т

Хо = - ^ е-вАВи(в) йв. (3)

Применяя определение интеграла от многозначного отображения е вВи на отрезке [0, т] (см. [3]), из (3) получаем включение

т

Хо € (-1)У е-зАВи йв. (4)

О

Если при данных т > 0, Хо € Яп выполняется включение (4), то, используя свойства интеграла от многозначного отображения (см. [3]) и лемму ЗА из [2, с. 175], можно утверждать, что при некотором измеримом управлении и(Ь) € и, 0 ^ Ь ^ т, точка 0 € Яп достижима в момент т и, следовательно, Хо € Е .В связи со сказанным получаем, что

т

Е =и(-!)/ е~зАВийв, (5)

0

о

где / е вАВи йв = {0}. Для дальнейшего полезно изучить свойства многозначного отображения

о

^ (т ) = (-!)/ е~зАВийв (6)

о

при т ^ 0. Из теории многозначных отображений (см., например, [3]) следует, что при т ^ 0 множество ^(т) — непустой выпуклый компакт и что при 0 ^ т\ ^ т2 имеет место аддитивность интеграла от многозначного отображения вида

т2

-вА

F(Т2) = F(ti) + (-1) j e-sABUds

Т2

где сложение понимается в алгебраическом смысле, а интеграл J e-sABU ds является непустым

Т1

выпуклым компактом. В силу условия 2° для выпуклого компакта U при достаточно малом а > 0 выполняется включение

V« С U, (7)

V« = (С € Rp: |С| < а}. (8)

Из свойств интеграла от многозначного отображения (см. [3]) и из (7), (8) при 0 ^ т\ ^ Т2 вытекает включение

Т2 Т2

J e-sABVa ds с у e-sABUds. (9)

T1 T1

Используя условие 1°, можно с помощью рассуждений на с. 92, 93 из [2] обосновать, что при т > 0 выполняется включение

0 € int ^ j esABVads

Так как пара (—A, —B) тоже удовлетворяет условию 1°, то при т > 0 (см. (6))

0 € int(F(т)). (10)

Теперь рассмотрим при 0 ^ т\ <т2 следующий интеграл от многозначного отображения:

Т2

I(т1,т2) = (-1)^ e-sABVa ds. (11)

T1

С помощью замены переменного s = r — т1 и свойств экспоненциала от матрицы tA из (11) получаем равенство

Т2— Т1

o-rA :

1(т1,т2) = (—1)eT1 A J e-rABVa dr. (12)

0

Из невырожденности матрицы enA и соотношений (9)—(12) при т = т2 — т1 вытекает включение

(Т2 \

(—1^ e-sABUds

Т1 /

Из сказанного вытекает

Лемма 1. Для многозначного отображения F(т) (см. (6)) при 0 ^ т1 < т2 имеет место включение

F(т1) С int(F(т2)). (13)

Из (5), (6) и леммы 1 вытекает

Лемма 2. Множество E является выпуклым и открытым.

Займемся вопросом о непрерывности функции T(у) на множестве E. Фиксируем точку С € E. В силу леммы 2 она является внутренней точкой множества E. Будем вести рассмотрение в некоторой открытой окрестности W точки С, принадлежащей множеству E. Фиксируем некоторое е > 0 и рассмотрим множество (см. (6)) F(T(С) + е). Отметим, что (см. (13))

С € F(T(С)) С int F(T(С) + £)).

Отсюда следует, что

С + Vh С F(T(С) + е),

где h > 0 достаточно мало, Vh = {x € Rn: |x| ^ h}, причем £ + Vh С W. Отсюда и из определения функции T(у) вытекает, что при |у — £| ^ h

т(y) < T(0+ е. (14)

Если £ = 0, то T(£) =0 и при |y| ^ h из (14) получаем неравенство

T(у) < е. (15)

Таким образом, в силу произвольности е > 0 непрерывность T(у) на основе вышесказанного при £ = 0 следует из (15).

Продолжим наши рассмотрения при £ = 0 и у € £ + Vh. Теперь рассмотрим (см. (6)) множество F(T(£) — е), где е € (0,T(£)). Из определения величины T(£) и свойств множеств F(т) следует, что

£ € F(T(£) — е).

Так как F(T(£) — е) — выпуклый компакт, то величина

в = dist(£,F(T(£) — е)) > 0.

Используя выпуклый анализ (см., например, [4]), можно конструктивно показать, что при достаточно малом 5 > 0 при у € £ + VS, где ö ^ h выполняются следующие соотношения:

в

С помощью этих соотношений и леммы 1 при у € £ + Vs мы получаем, что

т(у) ^ т(£) — е.

Суммируя сказанное и используя произвольность точки £ € E и величины е > 0, получаем теорему.

Теорема 1. При сделанных предположениях функция T (у) непрерывна на E. Отметим, что в теореме 21 из [2, с. 157,158] содержатся другие условия, достаточные для непрерывности исследуемой функции T(xo), нежели в нашей теореме 1. Основное отличие состоит в том, что в теореме 21 требуется условие нормальности для изучаемой линейной управляемой системы, а мы его не требуем.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Интересно сравнить результат нашей теоремы также с теоремой 22 из [2, с. 160-161] в той ее части, которая касается непрерывности функции T(у) на множестве E. В теореме 22 множество U имеет вид выпуклого многогранника, причем 0 € int U и выполняется условие нормальности: векторы Bw, ABw, ..., An-1Bw линейно независимы для любого вектора w € Eu, где множество Eu состоит из всех векторов единичной длины, параллельных ребрам выпуклого многогранника U.

Покажем, что из приведенных условий теоремы 22 вытекает выполнимость нашего условия 1° (2° выполняется автоматически). Фиксируем один из векторов w € Eu. Тогда для него выполняется

rank(Bw, Abw,..., An-1Bw) = n. Отсюда следует, что для линейного управляемого объекта

x = Ax + (Bw)v, (16)

где x € Rn, v € R1, выполняется условие управляемости вида 1°. Таким образом (см. [2, с. 9193]) для произвольных начальной точки xo € Rn и терминальной точки m € Rn, где xo = m, существует такое ограниченное по модулю скалярное измеримое управление -ö(t) на некотором отрезке [0, в] (в > 0), что для соответствующего решения x(t) уравнения (16) с начальным условием

Ж(0) = ж0 будет выполнено условие Ж(в) = m. Отметим, что векторное управление u(t) = wv(t) является ограниченным по модулю и измеримым по Лебегу на [0, в], причем на [0, в] почти всюду

X(t) = Ax(t) + Bu(t).

Поэтому (см. [2, с. 91-93]) для пары (A, B) выполнено условие 1°.

Напомним, что в нашем условии 2° U — произвольный выпуклый компакт, содержащий точку 0 внутри.

Поэтому из сказанного вытекает, что наши условия 1°, 2° расширяют соответствующие условия теоремы 22 из [2] для непрерывности функции T(у) на E.

2. Рассмотрим линейный нестационарный управляемый объект (см., например, [1, 2]) вида

ж = A(t)x + B (t)u, ж(0) = ж0 , (17)

где ж € Rn (n ^ 1), A(t) — непрерывная при t ^ 0 n х n-матрица, B(t) — непрерывная при t ^ 0 n х р-матрица (р ^ 1), u € U — выпуклому компакту из Rp. Для управляемого объекта (17) в качестве допустимых управлений рассматриваются измеримые по Лебегу функции u(t) € U, t ^ 0. Отметим важную для нас формулу Коши, описывающую решение начальной задачи (17) x(t) при данном допустимом управлении u(t) € U, t ^ 0 (см., например, [2]):

t

x(t) = $(t)xo + J $(t)$-1(s)B(s)u(s) ds, (18)

о

где $(t) — фундаментальная матрица решений однородного уравнения Ж = A(t)x с начальным условием Ф(0) = E, E — единичная матрица порядка n, а интеграл понимается в смысле Лебега. Обозначим через E множество начальных точек Жо, из которых терминальная точка M = {0}, где 0 — нулевая точка из Rn, достижима по допустимой траектории управляемого процесса (17) за конечное время. Отметим, что в силу известных результатов при наложенных нами условиях для точек множества E определено время оптимального быстродействия T(жо) (см. [2]). При этом T(0) = 0 и T(ж0) > 0 для ж0 = 0. Нас будет интересовать вопрос о непрерывности функции T(у) на E (здесь мы обозначаем через у € Rn начальный вектор ж0). В дальнейшем предполагается, что

0 € int U, (19)

где 0 — нулевая точка из Rp.

Рассмотрим точку ж0 € E. Для нее определено некоторое допустимое управление u(t) € U, t € [0, т], где т ^ 0, такое, что (см. (31))

т

ф(т)жо + У Ф(т)$-1(s)B(s)u(s) ds = 0. (20)

о

Используя невырожденность матрицы Ф(т), получаем из (20) равенство

т

Жо = - У $-1(s)B(s)u(s) ds. (21)

Применяя определение интеграла от многозначного отображения (см. [3]) и формулу (21), получаем включение

т

Жо € (-1)У Ф-1(«)£(в)и^, (22)

о

где интеграл понимается в смысле теории многозначных отображений. Далее, если для точки Жо выполняется включение (22) при некотором т ^ 0, то с помощью матрицы Ф(т), леммы ЗА из

[2, с. 175] и формулы (18) приходим к формуле (20) при некотором допустимом управлении и(в), 0 ^ в ^ т. Из сказанного вытекает следующая формула для множества Е:

т

E = UM /(s)Uds,

т >0 ^

т

где J Ф 1(s)B(s)U ds = {0}. Полезно изучить свойства многозначного отображения

0

F (т) = (-1^ Ф-1^)£ (s)Uds

при т ^ 0. Отметим, что в силу свойств интеграла от многозначного отображения (см. [3]) F(т) — непустой выпуклый компакт при т ^ 0, причем (см. (19)) 0 € F(т). Используя аддитивность интеграла от многозначного отображения в смысле алгебраического сложения множеств (см. [3]), мы получаем формулу при 0 ^ т1 ^ т2

Т2

F(Т2) = F(ti) + (-1) / Ф-1(з)£(s)Uds. (23)

Т1

Отметим, что интеграл

Т2

-1

I(т1,т2) = (-1)^Ф-1(в)£(в)и^в (24)

является непустым выпуклым компактом при 0 ^ т1 ^ т2, причем 0 € I(т1,т2) (см. [3]) и (19)). Для дальнейшего желательно найти достаточные условия, при которых 0 € т1(/(т1, т2)), где 0 ^ т1 < т2. Тут полезным оказывается аппарат опорных функций.

Определение. Пусть С — непустой компакт из Яга. Тогда его опорная функция с(С,ф) при ф € Ега определяется по формуле

с(С,ф) = тах(^,ф).

В книге [3] приведены свойства этой функции. В частности, для выпуклого компакта I(т1,т2) (см. (24)) можно написать следующую формулу при ф € Ега:

Т2

с(1(т1 ,т2),Ф) = / с(-Ф-1 (в)В(в)и, ф) ^в. (25)

т1

Отметим, что при s € [т1,т2], ф € u € U

(ф, Ф-1^)£(s)u) = ф*Ф-1^)£(s)u, (26)

где * означает транспонирование. Учитывая соотношения (19), (25), (26) и свойства скалярного произведения векторов, можно обосновать, что для выполнения неравенства

c(1 (Т1 ,Т2),ф) > 0 (27)

при 0 ^ Т1 < Т2, ф € ст, где ст = {ф € : |ф| = 1}, достаточно обеспечить линейную независимость непрерывных векторов-строк матричной функции Ф-1^)В(s) в функциональном смысле на отрезке [т1,т2]. Если условие (27) выполняется при любом ф € ст, то используя непрерывность функции с(1 (т1,Т2),ф) по ф € ст, мы получаем, что величина

Мт1, Т2) = min c(1 (т1, Т2), ф) > 0. (28)

С помощью аппарата опорных функций (см. [3]) из (28) выводим, что имеет место включение

V, С I(т1,т2), (29)

где ^ = ^(тьт2) > 0.

Обеспечить линейную независимость в функциональном смысле на [т1, т2] векторов-строк матричной функции Ф-1(в)В(в) при 0 ^ т1 < т2 можно следующим конструктивным образом. Обозначим при в ^ 0:

С (в) = Ф-1(в)В(в). (30)

Далее мы используем дифференциальный подход в предположении, что матричные функции А(в), В (в) достаточное число раз дифференцируемы при в ^ 0 (в точке в = 0 ограничимся правыми производными). Отметим, что при в ^ 0

= -*-(.МС). (31)

Последовательно дифференцируя матричную функцию С (в) (см. (30)) при в ^ 0 и используя формулу (31), мы получаем следующие последовательности матричных функций:

Со(з) = Ф-1(8)ПО(8), Сг(8) = ^-^ = ф-1(8)Пг(з), (32)

авг

где г = 1,..., п — 1, если п ^ 2,

Яо (в) = В (в), Д(в) = —А(в)А-1(в) + ^¿-1 (в), (33)

где г = 1,..., п — 1, если п ^ 2 . Отметим, что в последовательности матричных функций (32) при п = 1 только один член Со (в) и операция дифференцирования С (в) не используется. Аналогично, в последовательности матричных функций (33) при п = 1 только один член А (в) и операция дифференцирования для А(5),В(5) не используется.

Напомним, что по исходным предположениям матричные функции А(в), В (в) непрерывны

при в ^ 0. Для существования производных Сг{в) = ^ при г = 1,... ,п — 1, в ^ 0, когда п ^ 2, в соответствии с формулами (32), (33) нам потребуется следующее предположение.

3°. Матричная функция А(в) имеет п — 2 производных при п ^ 3 , в ^ 0, а матричная функция В (в) имеет п — 1 производных при п ^ 2, в ^ 0.

Отметим, что при п = 1 и п = 2 дополнительные требования гладкости в (32) на А(в) не требуются. Так же для В (в) в (32) при п = 1 дополнительные требования гладкости не требуются. Далее предположение 3° считается выполненным.

Утверждение. Для линейной независимости непрерывных векторов-строк матричной функции С (в) = Ф-1(в)В (в) в функциональном смысле на [т1,т2], где 0 ^ т1 < т2, достаточно, чтобы (см. (32), (33))

гапк(Д)(л),..., Яга_1 (т1)) = п. (34)

Это утверждение доказывается от противного с использованием невырожденности матрицы Ф-1(в).

Отметим, что в нашем утверждении в соотношении (34) не используется матричная функция Ф-1(в). Это обстоятельство существенно для приложений, так как точное вычисление матричной функции Ф-1(в) в общем случае представляет собой трудную задачу. Из вышесказанного вытекает следующая

Лемма 3. Для выполнения соотношения (29) при 0 ^ т1 < т2 при сделанных предположениях достаточно, чтобы для матричной функции С (в) (см. (30)) выполнялось (см. (32), (33)) условие (34).

По аналогии с доказательством теоремы 1 с очевидными видоизменениями доказывается Теорема 2. При сделанных предположениях и выполнении условия (34) для каждого т1 ^ ^ 0 функция Т(у) непрерывна на Е.

Замечание 1. Отметим, что в ранее упомянутых теоремах 21, 22 из [2] нестационарный случай не рассматривался.

Замечание 2. В работах [5, 6] и других работах профессора Е.Л. Тонкова и его учеников (г. Ижевск) содержатся интересные результаты общего вида по проблеме непрерывности функции Т(жо) для линейных нестационарных управляемых объектов. Эти результаты получены с использованием абстрактного аппарата теории динамических систем. Отдавая дань общности этих результатов, можно заметить, что при практических исследованиях конкретных управляемых объектов использование общих теорем может натолкнуться на значительные математические трудности. Наша теорема 2 позволяет уменьшить соответствующие трудности в приложениях. Отметим также, что в настоящей статье используется традиционный математический аппарат, привычный для современной теории управления.

В заключение я хочу поблагодарить моего рецензента за полезные для меня советы и пожелания.

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин Л.С. и др. Математическая теория оптимальных процессов. М.: Наука, 1976.

2. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.

3. Благодатских В.И. Введение в оптимальное управление. Линейная теория. Высшая школа, 2001.

4. Васильев Ф.П. Методы оптимизации. М.: Факториал Пресс, 2002.

5. Родионова А.Г., Т о н к о в Е.Л. О непрерывности функции быстродействия линейной системы в критическом случае // Изв. вузов. Матем. 1993. № 5. С. 101-111.

6. Николаев С.Ф., Тон ко в Е.Л. Дифференцируемость вектора быстродействия и позиционное управление линейной докритической системой // Дифференц. уравн. 2000. № 1. С. 87-96.

Поступила в редакцию 11.01.22 Одобрена после рецензирования 25.03.23 Принята к публикации 25.03.23

i Надоели баннеры? Вы всегда можете отключить рекламу.