Научная статья на тему 'ИССЛЕДОВАНИЕ ОДНОЙ МИНИМАКСНОЙ МОДЕЛИ УПРАВЛЕНИЯ'

ИССЛЕДОВАНИЕ ОДНОЙ МИНИМАКСНОЙ МОДЕЛИ УПРАВЛЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
11
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЕМЫЙ ОБЪЕКТ / ВОЗМУЩЕНИЕ / МИНИМАКС / НАИМЕНЬШИЙ ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ

Аннотация научной статьи по математике, автор научной работы — Никольский М.С.

Статья посвящена исследованию одной минимаксной динамической модели управления. Минимаксные задачи характерны для теории игр и теории исследования операций. Сам минимакс в такого рода задачах можно трактовать как наименьший гарантированный результат одного управляющего субъекта при произвольных действиях другого управляющего субъекта. В динамических задачах управления нередко в качестве другого управляющего субъекта выступает Природа, поведение которой не предсказуемо заранее. В настоящей статье исследуется модель управляемого объекта при наличии возмущающих факторов, которые можно трактовать как помехи или возмущения, изучаются свойства соответствующего наименьшего гарантированного результата. Доказаны теоремы существования минимакса и получены условия, обеспечивающие непрерывность и локальную липшицевость наименьшего гарантированного результата как функции начального состояния рассматриваемой управляемой системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH OF ONE MINIMAX MODEL OF CONTROL

The paper is devoted to research of one general minimax dynamical model of control. Minimax models are interested for the Game Theory and Operation Research Theory. Itself minimax in many problems is possible to interpret as the least guaranteed result for one player under any actions of the another player. In dynamical problems of Control, often the Nature acts as the second player. It is important that in such problems the behavior of the Nature is not known in the future. In the paper we consider the controlled object under of some disturbances, which can be interpreted as noise. We research some properties of the least guaranteed result for such objects. There were obtained some conditions under which the considered minimax exists and is continuous or local Lipschitzian as function of initial condition for the controlled system under consideration.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ОДНОЙ МИНИМАКСНОЙ МОДЕЛИ УПРАВЛЕНИЯ»

УДК 517.977

М. С. Никольский1

ИССЛЕДОВАНИЕ ОДНОЙ МИНИМАКСНОЙ МОДЕЛИ УПРАВЛЕНИЯ

Статья посвящена исследованию одной минимаксной динамической модели управления. Минимаксные задачи характерны для теории игр и теории исследования операций. Сам минимакс в такого рода задачах можно трактовать как наименьший гарантированный результат одного управляющего субъекта при произвольных действиях другого управляющего субъекта. В динамических задачах управления нередко в качестве другого управляющего субъекта выступает Природа, поведение которой не предсказуемо заранее. В настоящей статье исследуется модель управляемого объекта при наличии возмущающих факторов, которые можно трактовать как помехи или возмущения, изучаются свойства соответствующего наименьшего гарантированного результата. Доказаны теоремы существования минимакса и получены условия, обеспечивающие непрерывность и локальную липшице-вость наименьшего гарантированного результата как функции начального состояния рассматриваемой управляемой системы.

Ключевые слова: управляемый объект, возмущение, минимакс, наименьший гарантированный результат.

1. Постановка задачи. Теоремы существования. Рассматривается управляемый объект вида (ср. с [1^4])

х = А(х)и + #(х,г) (1)

с начальным условием

х(0) = хо. (2)

Здесь х € Яп, п ^ 1, и € Р — выпуклому компакту из Яр, р ^ 1, А(х) — п х р-матрица с локально липшицевыми элементами на Яп, компоненты векторной п-мерной функции ^(х,г), где г € Q — компакту из Я9, ц ^ 1, непрерывны на Яп х ^ ^ по г € Q локально липшицевы

по х € Яп. Символом Як, к ^ 1, мы будем обозначать евклидово арифметическое пространство, элементами которого являются упорядоченные наборы из к действительных чисел, записываемых в виде столбцов, причем в Як скалярное произведение (■, •) и длина вектора | ■ | определяются стандартным образом.

Определение 1. Скалярную функцию Л,(х), определенную на Яп, будем называть локально липшицевой, если для любого непустого компакта С С Яп существует такая неотрицательная константа 1с что при произвольных х', х'' из С выполняется неравенство

|Ь(х') - Ь(х'')| < 1с|х' - х''|.

В дальнейшем предполагается выполненным следующее неравенство (ср. с [4]):

(х,/(х,и,г)) < с(1 + |х|2), (3)

где х € Яп, и € Р, г € ^ с — неотрицательная константа и (см. (1))

/ (х,и,г) = А(х)и + £(х,г). (4)

Перейдем к постановке рассматриваемой в этом пункте задачи. Фиксируем величину Т > 0 и некоторую скалярную функцию ^>(х), определенную и непрерывную на Яп. Обозначим через

1 Математический ин-т им. В. А. Стеклова РАН, вед. науч. сотр.; факультет ВМК МГУ, проф., д.ф.-м.н.; e-mail:

mniQmi-ras.ru

U, V множества измеримых по Лебегу векторных функций u(t) € P, v(t) € Q t € Д = [0,T], соответственно. Рассмотрим величину

7 = inf sup ^(x(T,u(-),v(^))). (5)

Здесь ж(^и(), v()), t € Д, означает абсолютно непрерывное решение задачи Коши (1), (2) при фиксированных u(-) € U, v() € V. Отметим, что при сделанных предположениях решение x(t,u(), v()) существует на отрезке Д (см. [4]). Единственность решения ж(£,u(),v()) на Д можно обосновать, используя локальную липшицевость элементов матричной функции А(ж) и равномерную по v € Q локальную липшицевость функции g(x,v).

Заметим, что величина 7 (см. (5)) представляет интерес, например, для задач управления с неполной информацией, когда в распоряжении управляющего объектом (1), (2) находится управление u() € U, а управление v(-) € V моделирует воздействие неизвестных помех и возмущений. В таких задачах величину 7, в соответствии с теорией исследования операций, можно трактовать как наименьший гарантированный результат (при этом величина 7 не обязательно реализуется на каком-то u() € U).

Отметим, что различным минимаксным задачам управления уделено большое внимание, например, в известных монографиях [3, 5-7] и других. Заметим еще, что менее общая чем здесь модель минимаксного управления была рассмотрена в [8].

В прикладных задачах в качестве функции <^(ж) (см. (5)) может выступать, например, функция <^(ж) = |ж — £|2, где £ — фиксированный вектор из Rn. При такой функции <^(ж) управляющий системой (1), (2) стремится, чтобы вектор ж(Т, u(-), v()) был по возможности ближе к целевой точке

Докажем следующую актуальную для приложений теорему.

Теорема 1. При сделанных предположениях формулу (5) можно записать в виде

7 = min sup <^(ж(Т,«(-),v(-))),

u(-)&U v(.)ey

т.е. в формуле (5) минимум по u(-) € U достигается.

Доказательство. Фиксируем произвольные допустимые управления u() € U, v() € V.

t € Д

\x(t,u(-),v(-))\ ^ есТл/1 + |жо|2. (6)

Отсюда и из непрерывности функции <^(ж) на Rn следует, что 7 (см. (5)) является конечной величиной. Обозначим при u(-) € U, v() € V :

a(u(-),v(-)) = <^(ж(Т,«( • ), v( • ))), (7)

в(и( • ))= sup a(u(• ),v( • )). (8)

v(-)&y

Отметим, что в силу (5), (7), (8)

7 = mf в(и(• )). (9)

u(-)eu

Рассмотрим некоторую минимизирующую последовательность функций ■ ) € U, i = 1, 2,..., для которой (см. (7)-(9))

lim ( ■ )) = 7- (10)

Фиксируем произвольное допустимое управление v( ■ ) € V. С помощью соотношений (1), (2) для соответствующих парам (ui( ■ ),v( ■ )) решений

Xi (t) = x(t,Ui( • ),v( ■ )) (11)

при Ь € А мы получаем равенство

г

Ж^Ь) = Жо + ^ [А(Жг(5))щ(5) + ^жД«), £(5))] (12)

0

где интегрирование ведется в смысле Лебега. Отметим, что функции Жi(Ь) являются абсолютно непрерывными на А и поэтому производные Ж i (Ь), г = 1, 2,..., существуют почти всюду на А

большой положительной константе С2 выполняется почти всюду на А при г = 1, 2,... оценка

|ЖЖi(Ь) | < С2. (13)

Из соотношений (6), (13) и непрерывности функций жДЬ), г = 1, 2,..., на Ас помощью теоремы Арцела (см., например, [9]) получаем, что некоторая подпоследовательность функций Жik (Ь) сходится к некоторой пмерной непрерывной функции ж*(Ь) равномерно на А, т.е. в смысле метрики банахова пространства п-мерных непрерывных на А функций Сп(А). Отметим, что функции и(-) € и можно рассматривать как элементы гильбертова пространства ^(А) в силу ограниченности множества Р. Так как Р — выпуклый компакт, то (см. [2, 3]) множество и является слабо компактным. Следовательно, из последовательности функций щк (■) можно выделить подпоследовательность функций, слабо сходящуюся к некоторой функции и*(-) € и. Производя, если надо, перенумерацию, можно считать, что последовательность функций щ(-) € и сходится слабо к и*(-) € и на А, а последовательность непрерывных функций жДЬ) € Кп, г = 1, 2,..., сходится в равномерной метрике к ж*(Ь) € Яп на А.

Продолжим наши рассуждения. Формулу (12) можно при Ь € А переписать в следующем виде при г = 1, 2,... :

г г г

Жi(Ь) = жо + | А(ж*(5))и^) ^ + J(A(Жi(5)) - А(ж*(5)))«Д«) ^ + J g(Жi(s),v(s)) (14)

0 0 о

Используя свойства функций А(ж), #(ж, V) и свойства последовательностей иД-), Жi(•), с помощью формулы (14) предельным переходом по г — го получаем при Ь € А равенство

г

ж*(Ь) = жо + У(А(ж*(«))«*(«) ^(ж*(«), £(«))) (15)

о

где интегрирование ведется в смысле Лебега. Из соотношения (15) вытекает, что функция ж*(Ь) абсолютно непрерывна на А и является решением задачи Коши (1), (2) при и = и*(Ь), Ь € А. Из формул (7), (8) при г = 1, 2,... вытекает неравенство

а(и(•),£(•)) < в (и(•))• (16)

Из сказанного выше следует, что при г — го

а(и (•),£(•)) — а(и* (•),£(•)). (17)

Из формул (10), (16), (17) получаем неравенство

а(и,(•),£(•)) < 7- (18)

Так как £(■) произвольное управление из V, то из (8), (18) получаем неравенство в(и*(-)) ^ 7В силу формулы (9) неравенство в(и*(-)) < 7 невозможно. Таким образом, получаем

в(и* (■))= 7 (19)

и, следовательно, на и*(• ) € и достигается минимум функции в(и(•)) на и. Из равенства (19) следует утверждение теоремы 1.

Полезной для приложений является

Теорема 2. Пусть помимо сделанных предположений для каждого х € Яп компакт g(x,Q) является выпуклым. Тогда для каждого управления и( ■ ) € и {ср. с (8))

Доказательство. При фиксированном и( • ) € и рассмотрим максимизирующую последовательность • ) € V, г = 1,2,..., для которой (см. (8)) при г ^ то а(и( ■ ),Vi( ■ )) ^ ^ в(и( • ))• С помощью идей доказательства теоремы существования оптимального по быстродействию управления из [4] можно обосновать, что для некоторой подпоследовательности решений Xik (¿) = х(*,и(• ),Vik ( ■ )) задачи Коши (1), (2) имеет место равномерная сходимость на А непрерывных функций х^ ( ■ ) к некоторой непрерывной функции х* (¿) € Кп, í € А, причем х*(£) абсолютно АА

Далее с помощью известной леммы Филиппова [4] обосновывается, что существует такое v*(• ) € € V, что ж*(£) = ж(^«( • ),v*( • )) при t € Д. Из сказанного вытекает утверждение теоремы 2. Следствием теорем 1, 2 является следующая

Теорема 3. Пусть пом,им,о исходных предположений относительно матричной функции А(ж) и векторной функции g^,v) го (1) выполняется еще условие: множество #(ж, Q)

ж € Rn

7 = min max ^>(ж(Т, u(• ),v( • ))). u(-)&Uv(-)&y

2. Изучение случая, когда начальный вектор жо является переменным. В первом пункте начальный вектор ж(0) = жо (см. (2)) являлся постоянным. Теперь мы рассмотрим случай, когда

ж(0) = w,

где w € Rn — переменный вектор. В этом случае величина 7 (см. (5)) является функцией переменного начального вектора жо = w, т.е.

где ж(^«(• ), v( • ), w) обозначает решение уравнения (1), соответствующее управлениям u( • ), v( • ), с

ж(0) = w 7(w) w € Rn

В дальнейшем предполагается, что множество #(ж, Q) (см. (1)) является выпуклым компактом ж € Rn

7(w) w € Rn

7(w) = min max ^>(ж(Т, u(• ),v( • ),w)). (21)

u(-)&Uv(-)&y

Фиксируем некоторый непустой компакт G С Rn, содержащий не менее двух различных точек. Мы хотим изучить свойства непрерывности и липшицевости функции 7(w) на G. Обозначим (ср. с (7)-(9)) при w € Rn:

e(u( • )) = max a(u( • ),v( • )).

v(-)ey

ж*(t) € А(ж*(t))u(t) +я(ж*С0,д).

7(w) = inf sup <р(ж(Т,и(• ),v(0,w))

u(^)eu v(.)ey

(20)

a(u( • ),v( • ),w) = <^(ж(Т, u( • ),v( • ),w)),

(22) (23)

/3(w( • ),w) = max a(u(• ),v( • ),w), v(-)ey

7(w) = mm /3(u( • ),w). u(-)eu

Нетрудно видеть, что (см. (21)-(24)) при ш € Кп

7(ш) = 7(ш)-

Фиксируем произвольные точки Ш1, Ш2 из множества С. Из формул (21)-(24) вытекают соотношения

7(ш^ = /3(иД-)^),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где г = 1, 2 Ui(■) € и — соответствующие минимизаторы в формуле (24). Из определения функций ui(•) следует, что

7(ш1) - 7(ш2) ^ /3(и2(■), Ш1) - в(и2('), Ш2)• (25)

Отметим, что в силу формулы (23)

в(и2(-),Ш1) = й(и2(-),£1 (0,Ш1), (26)

/3(и2(-),Ш2) = А(и2(-),£2 (-),Ш2), (27)

где £1(-), £2(-) — соответствующие максимпзаторы по £(•) € V в формуле (23) для /?(и2(-),ш1), (и2(■), Ш2) соответственно. Из соотношений (25)-(27) получаем неравенство

7(ш1) - 7(ш2) ^ а(и2(-),£1(-),Ш1) - й(и2(-),£1(-),Ш2). (28)

Аналогичным образом можно обосновать неравенство

7(ш2) - 7(ш1) ^ а(и1(-), £э(-), Ш2) - а(и1(-), £э(-), Ш1), (29)

где £з(-) является макспмизатором функции й(и1(-), £(■), Ш2) по £(■) € V. Справедлива

Л е м м а. При произвольных и(-) € и, £(■) € V и ш2 из С при достаточно большой константе с3 > 0 выполняется неравенство

|ж(Т,и(-),£(-),Ш1) - ж(Т,и(-),£(-),Ш2)| < Сз|Ш1 - Ш2|. (30)

Доказательство. При фиксированных и(-) € и, £(■) € V и из С с помощью

соотношения (1) получаем при Ь € А равенства:

г

жДЬ) = Шi + ^ (А^(5))и(5) (5), £(5))) (31)

о

где

жДЬ) = ж(Ь, и(-), £(■), Шi), (32)

Ь € А г = 1, 2- Отметим, что в (31) интегралы понимаются в смысле Лебега. Используя ограни-С

|ж(Ь,и(-),£(-),ш)| ^ С4 (33)

при произвольных и(-) € и, £(■) € V, ш € С гДе С4 — достаточно большая положительная константа. Из предположений о липшицевости, сделанных относительно функций А(ж), ^(ж,£), а также из ограниченности множества Р и соотношений (31)—(33) мы получаем при Ь € А неравенство вида

г

¿(Ь) < |ш1 - ш2| + I С5¿(5) (34)

о

где

¿(Ь) = |ж1 (Ь) - Ж2(Ь)|,

c5 — достаточно большая константа, не зависящая от щ( • ) € U, v( • ) € V, € G, i = 1,2. Отметим,что константу С5 можно построить конструктивно, используя константы Липшица для элементов а(ж), Ь(ж,-и) по ж, вычисленные для шара с центром в 0 и радиусом (ср. с (6))

г = есТ л/l + |G|2,

где |G| обозначает max|ж|.

x€G

Теперь, применяя известное неравенство Гронуолла-Беллмана (см. [10]) к неравенству (34), мы приходим к неравенству

|xi(T) - Ж2(Т)| < eC5T- W2|.

Отсюда вытекает неравенство (30). Лемма доказана.

Теорема 4. При сделанных предположениях функция y(w) = y(w) (см. (21) — (24)) непрерывна, на, G. Если функция <^(ж) еще и локально липшицева на Rn, mo функция y(w) липшицева на G.

Доказательство. Обозначим S = {ж € Rn: |ж| ^ c4}, где константа c4 > 0 взята из (33). Нам будет полезно следующее определение.

Определение 2. Модулем непрерывности функции <^(ж) на ша pe S при h ^ 0 называется функция ^(h), которая определяется как

max ^(ж0 — Р(ж'')|>

x',x''

где векторы ж', ж'' принадлежат S и |ж' — ж''| ^ h. Можно доказать, что:

1) ^(h) ^ 0 при h ^ 0 и ^(0) = 0;

2) ^(h) непрерывна при h ^ 0;

3) ^(h) монотонно растет с ростом h при h ^ 0.

Отметим, что в силу леммы, формул (22), (28), (29) и свойств функции ^(h) при произвольных w1, w2 из G имеют место неравенства

Y(wi) — Y(W2) ^ ^(Сэ|W1 — W2|), 7(^2) — y(^i) ^ ^(Сэ|wi — W2|).

Отсюда вытекает неравенство

|Y(wi) — y(w2)| ^ ^(сэ|^1 — W2|), (35)

справедливое при произвольных W1, W2 из G. Используя свойства функции ^(h), нетрудно с помощью неравенства (35) обосновать непрерывность функции y(w) на G. Если предположить еще, что функция <^(ж) локально липшицева на Rn, то функция <^(ж) липшицева на S с некоторой положительной константой l и выполняется неравенство ^(h) ^ lh при h ^ 0. Отсюда и из неравенства (35) вытекает липшицевость y(w) на G с константой Сэ1.

СПИСОК ЛИТЕРАТУРЫ

1. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В. Математическая теория оптимальных процессов. М.: Наука, 1983.

2. Ли Э. В., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.

3. Васильев Ф. П. Методы оптимизации. М.: Факториал Пресс, 2002.

4. Филиппов А. Ф. О некоторых вопросах оптимального управления // Вести. Моск. ун-та. Сер. 1. Матем. Мех. 1959. № 2. С. 25-38.

5. К р а с о в с к и й II. II.. Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.

6. Федоров В. В. Численные методы максимина. М.: Наука, 1972.

7. К е й н В. М. Оптимизация систем управления по минимаксному критерию. М.: Наука, 1985.

8. Никольский М. С. Об одной задаче минимизации разброса траекторий управляемого процесса // Вести. Моск. ун-та. Сер. 15. Вычисл. матем и киберн. 2021. № 3. С. 26—30.

9. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М.: Наука, 1974.

10. Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967.

Поступила в редакцию 07.09.21 Одобрена после рецензирования 24.10.21 Принята к публикации 24.10.21

i Надоели баннеры? Вы всегда можете отключить рекламу.