УДК 517.977
М. С. Никольский1
ИССЛЕДОВАНИЕ ОДНОЙ МИНИМАКСНОЙ МОДЕЛИ УПРАВЛЕНИЯ
Статья посвящена исследованию одной минимаксной динамической модели управления. Минимаксные задачи характерны для теории игр и теории исследования операций. Сам минимакс в такого рода задачах можно трактовать как наименьший гарантированный результат одного управляющего субъекта при произвольных действиях другого управляющего субъекта. В динамических задачах управления нередко в качестве другого управляющего субъекта выступает Природа, поведение которой не предсказуемо заранее. В настоящей статье исследуется модель управляемого объекта при наличии возмущающих факторов, которые можно трактовать как помехи или возмущения, изучаются свойства соответствующего наименьшего гарантированного результата. Доказаны теоремы существования минимакса и получены условия, обеспечивающие непрерывность и локальную липшице-вость наименьшего гарантированного результата как функции начального состояния рассматриваемой управляемой системы.
Ключевые слова: управляемый объект, возмущение, минимакс, наименьший гарантированный результат.
1. Постановка задачи. Теоремы существования. Рассматривается управляемый объект вида (ср. с [1^4])
х = А(х)и + #(х,г) (1)
с начальным условием
х(0) = хо. (2)
Здесь х € Яп, п ^ 1, и € Р — выпуклому компакту из Яр, р ^ 1, А(х) — п х р-матрица с локально липшицевыми элементами на Яп, компоненты векторной п-мерной функции ^(х,г), где г € Q — компакту из Я9, ц ^ 1, непрерывны на Яп х ^ ^ по г € Q локально липшицевы
по х € Яп. Символом Як, к ^ 1, мы будем обозначать евклидово арифметическое пространство, элементами которого являются упорядоченные наборы из к действительных чисел, записываемых в виде столбцов, причем в Як скалярное произведение (■, •) и длина вектора | ■ | определяются стандартным образом.
Определение 1. Скалярную функцию Л,(х), определенную на Яп, будем называть локально липшицевой, если для любого непустого компакта С С Яп существует такая неотрицательная константа 1с что при произвольных х', х'' из С выполняется неравенство
|Ь(х') - Ь(х'')| < 1с|х' - х''|.
В дальнейшем предполагается выполненным следующее неравенство (ср. с [4]):
(х,/(х,и,г)) < с(1 + |х|2), (3)
где х € Яп, и € Р, г € ^ с — неотрицательная константа и (см. (1))
/ (х,и,г) = А(х)и + £(х,г). (4)
Перейдем к постановке рассматриваемой в этом пункте задачи. Фиксируем величину Т > 0 и некоторую скалярную функцию ^>(х), определенную и непрерывную на Яп. Обозначим через
1 Математический ин-т им. В. А. Стеклова РАН, вед. науч. сотр.; факультет ВМК МГУ, проф., д.ф.-м.н.; e-mail:
mniQmi-ras.ru
U, V множества измеримых по Лебегу векторных функций u(t) € P, v(t) € Q t € Д = [0,T], соответственно. Рассмотрим величину
7 = inf sup ^(x(T,u(-),v(^))). (5)
Здесь ж(^и(), v()), t € Д, означает абсолютно непрерывное решение задачи Коши (1), (2) при фиксированных u(-) € U, v() € V. Отметим, что при сделанных предположениях решение x(t,u(), v()) существует на отрезке Д (см. [4]). Единственность решения ж(£,u(),v()) на Д можно обосновать, используя локальную липшицевость элементов матричной функции А(ж) и равномерную по v € Q локальную липшицевость функции g(x,v).
Заметим, что величина 7 (см. (5)) представляет интерес, например, для задач управления с неполной информацией, когда в распоряжении управляющего объектом (1), (2) находится управление u() € U, а управление v(-) € V моделирует воздействие неизвестных помех и возмущений. В таких задачах величину 7, в соответствии с теорией исследования операций, можно трактовать как наименьший гарантированный результат (при этом величина 7 не обязательно реализуется на каком-то u() € U).
Отметим, что различным минимаксным задачам управления уделено большое внимание, например, в известных монографиях [3, 5-7] и других. Заметим еще, что менее общая чем здесь модель минимаксного управления была рассмотрена в [8].
В прикладных задачах в качестве функции <^(ж) (см. (5)) может выступать, например, функция <^(ж) = |ж — £|2, где £ — фиксированный вектор из Rn. При такой функции <^(ж) управляющий системой (1), (2) стремится, чтобы вектор ж(Т, u(-), v()) был по возможности ближе к целевой точке
Докажем следующую актуальную для приложений теорему.
Теорема 1. При сделанных предположениях формулу (5) можно записать в виде
7 = min sup <^(ж(Т,«(-),v(-))),
u(-)&U v(.)ey
т.е. в формуле (5) минимум по u(-) € U достигается.
Доказательство. Фиксируем произвольные допустимые управления u() € U, v() € V.
t € Д
\x(t,u(-),v(-))\ ^ есТл/1 + |жо|2. (6)
Отсюда и из непрерывности функции <^(ж) на Rn следует, что 7 (см. (5)) является конечной величиной. Обозначим при u(-) € U, v() € V :
a(u(-),v(-)) = <^(ж(Т,«( • ), v( • ))), (7)
в(и( • ))= sup a(u(• ),v( • )). (8)
v(-)&y
Отметим, что в силу (5), (7), (8)
7 = mf в(и(• )). (9)
u(-)eu
Рассмотрим некоторую минимизирующую последовательность функций ■ ) € U, i = 1, 2,..., для которой (см. (7)-(9))
lim ( ■ )) = 7- (10)
Фиксируем произвольное допустимое управление v( ■ ) € V. С помощью соотношений (1), (2) для соответствующих парам (ui( ■ ),v( ■ )) решений
Xi (t) = x(t,Ui( • ),v( ■ )) (11)
при Ь € А мы получаем равенство
г
Ж^Ь) = Жо + ^ [А(Жг(5))щ(5) + ^жД«), £(5))] (12)
0
где интегрирование ведется в смысле Лебега. Отметим, что функции Жi(Ь) являются абсолютно непрерывными на А и поэтому производные Ж i (Ь), г = 1, 2,..., существуют почти всюду на А
большой положительной константе С2 выполняется почти всюду на А при г = 1, 2,... оценка
|ЖЖi(Ь) | < С2. (13)
Из соотношений (6), (13) и непрерывности функций жДЬ), г = 1, 2,..., на Ас помощью теоремы Арцела (см., например, [9]) получаем, что некоторая подпоследовательность функций Жik (Ь) сходится к некоторой пмерной непрерывной функции ж*(Ь) равномерно на А, т.е. в смысле метрики банахова пространства п-мерных непрерывных на А функций Сп(А). Отметим, что функции и(-) € и можно рассматривать как элементы гильбертова пространства ^(А) в силу ограниченности множества Р. Так как Р — выпуклый компакт, то (см. [2, 3]) множество и является слабо компактным. Следовательно, из последовательности функций щк (■) можно выделить подпоследовательность функций, слабо сходящуюся к некоторой функции и*(-) € и. Производя, если надо, перенумерацию, можно считать, что последовательность функций щ(-) € и сходится слабо к и*(-) € и на А, а последовательность непрерывных функций жДЬ) € Кп, г = 1, 2,..., сходится в равномерной метрике к ж*(Ь) € Яп на А.
Продолжим наши рассуждения. Формулу (12) можно при Ь € А переписать в следующем виде при г = 1, 2,... :
г г г
Жi(Ь) = жо + | А(ж*(5))и^) ^ + J(A(Жi(5)) - А(ж*(5)))«Д«) ^ + J g(Жi(s),v(s)) (14)
0 0 о
Используя свойства функций А(ж), #(ж, V) и свойства последовательностей иД-), Жi(•), с помощью формулы (14) предельным переходом по г — го получаем при Ь € А равенство
г
ж*(Ь) = жо + У(А(ж*(«))«*(«) ^(ж*(«), £(«))) (15)
о
где интегрирование ведется в смысле Лебега. Из соотношения (15) вытекает, что функция ж*(Ь) абсолютно непрерывна на А и является решением задачи Коши (1), (2) при и = и*(Ь), Ь € А. Из формул (7), (8) при г = 1, 2,... вытекает неравенство
а(и(•),£(•)) < в (и(•))• (16)
Из сказанного выше следует, что при г — го
а(и (•),£(•)) — а(и* (•),£(•)). (17)
Из формул (10), (16), (17) получаем неравенство
а(и,(•),£(•)) < 7- (18)
Так как £(■) произвольное управление из V, то из (8), (18) получаем неравенство в(и*(-)) ^ 7В силу формулы (9) неравенство в(и*(-)) < 7 невозможно. Таким образом, получаем
в(и* (■))= 7 (19)
и, следовательно, на и*(• ) € и достигается минимум функции в(и(•)) на и. Из равенства (19) следует утверждение теоремы 1.
Полезной для приложений является
Теорема 2. Пусть помимо сделанных предположений для каждого х € Яп компакт g(x,Q) является выпуклым. Тогда для каждого управления и( ■ ) € и {ср. с (8))
Доказательство. При фиксированном и( • ) € и рассмотрим максимизирующую последовательность • ) € V, г = 1,2,..., для которой (см. (8)) при г ^ то а(и( ■ ),Vi( ■ )) ^ ^ в(и( • ))• С помощью идей доказательства теоремы существования оптимального по быстродействию управления из [4] можно обосновать, что для некоторой подпоследовательности решений Xik (¿) = х(*,и(• ),Vik ( ■ )) задачи Коши (1), (2) имеет место равномерная сходимость на А непрерывных функций х^ ( ■ ) к некоторой непрерывной функции х* (¿) € Кп, í € А, причем х*(£) абсолютно АА
Далее с помощью известной леммы Филиппова [4] обосновывается, что существует такое v*(• ) € € V, что ж*(£) = ж(^«( • ),v*( • )) при t € Д. Из сказанного вытекает утверждение теоремы 2. Следствием теорем 1, 2 является следующая
Теорема 3. Пусть пом,им,о исходных предположений относительно матричной функции А(ж) и векторной функции g^,v) го (1) выполняется еще условие: множество #(ж, Q)
ж € Rn
7 = min max ^>(ж(Т, u(• ),v( • ))). u(-)&Uv(-)&y
2. Изучение случая, когда начальный вектор жо является переменным. В первом пункте начальный вектор ж(0) = жо (см. (2)) являлся постоянным. Теперь мы рассмотрим случай, когда
ж(0) = w,
где w € Rn — переменный вектор. В этом случае величина 7 (см. (5)) является функцией переменного начального вектора жо = w, т.е.
где ж(^«(• ), v( • ), w) обозначает решение уравнения (1), соответствующее управлениям u( • ), v( • ), с
ж(0) = w 7(w) w € Rn
В дальнейшем предполагается, что множество #(ж, Q) (см. (1)) является выпуклым компактом ж € Rn
7(w) w € Rn
7(w) = min max ^>(ж(Т, u(• ),v( • ),w)). (21)
u(-)&Uv(-)&y
Фиксируем некоторый непустой компакт G С Rn, содержащий не менее двух различных точек. Мы хотим изучить свойства непрерывности и липшицевости функции 7(w) на G. Обозначим (ср. с (7)-(9)) при w € Rn:
e(u( • )) = max a(u( • ),v( • )).
v(-)ey
ж*(t) € А(ж*(t))u(t) +я(ж*С0,д).
7(w) = inf sup <р(ж(Т,и(• ),v(0,w))
u(^)eu v(.)ey
(20)
a(u( • ),v( • ),w) = <^(ж(Т, u( • ),v( • ),w)),
(22) (23)
/3(w( • ),w) = max a(u(• ),v( • ),w), v(-)ey
7(w) = mm /3(u( • ),w). u(-)eu
Нетрудно видеть, что (см. (21)-(24)) при ш € Кп
7(ш) = 7(ш)-
Фиксируем произвольные точки Ш1, Ш2 из множества С. Из формул (21)-(24) вытекают соотношения
7(ш^ = /3(иД-)^),
где г = 1, 2 Ui(■) € и — соответствующие минимизаторы в формуле (24). Из определения функций ui(•) следует, что
7(ш1) - 7(ш2) ^ /3(и2(■), Ш1) - в(и2('), Ш2)• (25)
Отметим, что в силу формулы (23)
в(и2(-),Ш1) = й(и2(-),£1 (0,Ш1), (26)
/3(и2(-),Ш2) = А(и2(-),£2 (-),Ш2), (27)
где £1(-), £2(-) — соответствующие максимпзаторы по £(•) € V в формуле (23) для /?(и2(-),ш1), (и2(■), Ш2) соответственно. Из соотношений (25)-(27) получаем неравенство
7(ш1) - 7(ш2) ^ а(и2(-),£1(-),Ш1) - й(и2(-),£1(-),Ш2). (28)
Аналогичным образом можно обосновать неравенство
7(ш2) - 7(ш1) ^ а(и1(-), £э(-), Ш2) - а(и1(-), £э(-), Ш1), (29)
где £з(-) является макспмизатором функции й(и1(-), £(■), Ш2) по £(■) € V. Справедлива
Л е м м а. При произвольных и(-) € и, £(■) € V и ш2 из С при достаточно большой константе с3 > 0 выполняется неравенство
|ж(Т,и(-),£(-),Ш1) - ж(Т,и(-),£(-),Ш2)| < Сз|Ш1 - Ш2|. (30)
Доказательство. При фиксированных и(-) € и, £(■) € V и из С с помощью
соотношения (1) получаем при Ь € А равенства:
г
жДЬ) = Шi + ^ (А^(5))и(5) (5), £(5))) (31)
о
где
жДЬ) = ж(Ь, и(-), £(■), Шi), (32)
Ь € А г = 1, 2- Отметим, что в (31) интегралы понимаются в смысле Лебега. Используя ограни-С
|ж(Ь,и(-),£(-),ш)| ^ С4 (33)
при произвольных и(-) € и, £(■) € V, ш € С гДе С4 — достаточно большая положительная константа. Из предположений о липшицевости, сделанных относительно функций А(ж), ^(ж,£), а также из ограниченности множества Р и соотношений (31)—(33) мы получаем при Ь € А неравенство вида
г
¿(Ь) < |ш1 - ш2| + I С5¿(5) (34)
о
где
¿(Ь) = |ж1 (Ь) - Ж2(Ь)|,
c5 — достаточно большая константа, не зависящая от щ( • ) € U, v( • ) € V, € G, i = 1,2. Отметим,что константу С5 можно построить конструктивно, используя константы Липшица для элементов а(ж), Ь(ж,-и) по ж, вычисленные для шара с центром в 0 и радиусом (ср. с (6))
г = есТ л/l + |G|2,
где |G| обозначает max|ж|.
x€G
Теперь, применяя известное неравенство Гронуолла-Беллмана (см. [10]) к неравенству (34), мы приходим к неравенству
|xi(T) - Ж2(Т)| < eC5T- W2|.
Отсюда вытекает неравенство (30). Лемма доказана.
Теорема 4. При сделанных предположениях функция y(w) = y(w) (см. (21) — (24)) непрерывна, на, G. Если функция <^(ж) еще и локально липшицева на Rn, mo функция y(w) липшицева на G.
Доказательство. Обозначим S = {ж € Rn: |ж| ^ c4}, где константа c4 > 0 взята из (33). Нам будет полезно следующее определение.
Определение 2. Модулем непрерывности функции <^(ж) на ша pe S при h ^ 0 называется функция ^(h), которая определяется как
max ^(ж0 — Р(ж'')|>
x',x''
где векторы ж', ж'' принадлежат S и |ж' — ж''| ^ h. Можно доказать, что:
1) ^(h) ^ 0 при h ^ 0 и ^(0) = 0;
2) ^(h) непрерывна при h ^ 0;
3) ^(h) монотонно растет с ростом h при h ^ 0.
Отметим, что в силу леммы, формул (22), (28), (29) и свойств функции ^(h) при произвольных w1, w2 из G имеют место неравенства
Y(wi) — Y(W2) ^ ^(Сэ|W1 — W2|), 7(^2) — y(^i) ^ ^(Сэ|wi — W2|).
Отсюда вытекает неравенство
|Y(wi) — y(w2)| ^ ^(сэ|^1 — W2|), (35)
справедливое при произвольных W1, W2 из G. Используя свойства функции ^(h), нетрудно с помощью неравенства (35) обосновать непрерывность функции y(w) на G. Если предположить еще, что функция <^(ж) локально липшицева на Rn, то функция <^(ж) липшицева на S с некоторой положительной константой l и выполняется неравенство ^(h) ^ lh при h ^ 0. Отсюда и из неравенства (35) вытекает липшицевость y(w) на G с константой Сэ1.
СПИСОК ЛИТЕРАТУРЫ
1. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В. Математическая теория оптимальных процессов. М.: Наука, 1983.
2. Ли Э. В., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.
3. Васильев Ф. П. Методы оптимизации. М.: Факториал Пресс, 2002.
4. Филиппов А. Ф. О некоторых вопросах оптимального управления // Вести. Моск. ун-та. Сер. 1. Матем. Мех. 1959. № 2. С. 25-38.
5. К р а с о в с к и й II. II.. Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.
6. Федоров В. В. Численные методы максимина. М.: Наука, 1972.
7. К е й н В. М. Оптимизация систем управления по минимаксному критерию. М.: Наука, 1985.
8. Никольский М. С. Об одной задаче минимизации разброса траекторий управляемого процесса // Вести. Моск. ун-та. Сер. 15. Вычисл. матем и киберн. 2021. № 3. С. 26—30.
9. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М.: Наука, 1974.
10. Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967.
Поступила в редакцию 07.09.21 Одобрена после рецензирования 24.10.21 Принята к публикации 24.10.21