Научная статья на тему 'Об одной задаче управления пучком траекторий'

Об одной задаче управления пучком траекторий Текст научной статьи по специальности «Математика»

CC BY
64
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ / ПУЧКИ ТРАЕКТОРИЙ / ОПОРНЫЕ ФУНКЦИИ / ГЕОМЕТРИЧЕСКАЯ РАЗНОСТЬ МНОЖЕСТВ / LINEAR CONTROL PROBLEMS / BUNDLES OF TRAJECTORIES / GEOMETRIC DIFFERENCE OF SETS

Аннотация научной статьи по математике, автор научной работы — Никольский М. С.

В статье изучается линейная задача управления, в которой начальное множество является неодноточечным. Для нее рассматривается вопрос о возможности перевода этого начального множества по траекториям линейной управляемой системы в некоторое фиксированное терминальное множество за конечное время с помощью единого управления. Средствами аппарата опорных функций изучаются различные аспекты этой задачи управляемости.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об одной задаче управления пучком траекторий»

УДК 517.97

М. С. Никольский1

ОБ ОДНОЙ ЗАДАЧЕ УПРАВЛЕНИЯ ПУЧКОМ ТРАЕКТОРИЙ*

В статье изучается линейная задача управления, в которой начальное множество является неодноточечным. Для нее рассматривается вопрос о возможности перевода этого начального множества по траекториям линейной управляемой системы в некоторое фиксированное терминальное множество за конечное время с помощью единого управления. Средствами аппарата опорных функций изучаются различные аспекты этой задачи управляемости.

Ключевые слова: линейные задачи управления, пучки траекторий, опорные функции, геометрическая разность множеств.

Введение. В статье рассматривается одна линейная задача управления пучком траекторий. Подобного рода задачи изучаются в математической теории управления (см., например, [1-3]). Они характеризуются тем, что начальная точка управляемой системы принадлежит некоторому компакту К, содержащему более одной точки, и под воздействием допустимого управления u(t) возникает пучок траекторий, исходящих из различных точек К. Качество управления u(t) можно оценивать различными функционалами и ставить различные оптимизационные задачи. Отметим, что подобного рода задачи актуальны (см. [1]), например, при оптимизации физических систем ускорения и формирования пучков заряженных частиц. В качестве другого интересного для приложений примера можно рассмотреть ситуацию, когда начальный вектор управляемой системы измеряется неточно и априори известно только, что он принадлежит некоторому компакту К, содержащему более одной точки (см., например, [2, 3]).

В этой статье мы рассматриваем линейную задачу управления пучком траекторий с терминальным множеством. Изучается в основном задача об управляемости такого объекта. Символом R\ к ^ 1, условимся обозначать действительное арифметическое евклидово пространство с элементами, записываемыми в виде столбцов из к чисел, со стандартными скалярным произведением векторов {•,•) и длиной вектора |-|. Часто будут использоваться без пояснений элементы выпуклого анализа и теории многозначных отображений (см. [4-6]).

Приведем некоторые обозначения и определения. Будем обозначать для пары непустых множеств .V. V ич Hf' их алгебраическую сумму через X + Y, произведение действительного числа а на X через аХ, произведение т х ^-матрицы М на X через MX. Для непустого компакта X С Rk символом W(X, ф) будем обозначать его опорную функцию:

W(X, ф) = та х(ж, i/>),

х£Х

где ф — произвольный вектор из Rk. Для произвольных непустых компактов X, Y из Rk рас*

стояние Хаусдорфа между ними обозначим через h(X, F), а через X — Y — их геометрическую разность [6]. Многозначные отображения (м.о.) fi(i) с областью определения S С R1 будем рассматривать со значениями в пространстве непустых компактов Comp(i?fc) и использовать понятия непрерывности и полунепрерывности сверху для них. Многозначное отображение O(i), t € [a,b], называется липшицевым, если при произвольных t', t" из [a,b] выполняется неравенство h(tt(t'),tt(t")) < l\t' - t"I, где — константа.

1. Рассмотрим линейный управляемый объект (см., например, [4, 7])

х = Ах + Ви, (1)

где а; е Д", n ) 1, « G Дг, г ) М — постоянная матрица размерности п х п, В — постоянная матрица размерности п х г. На управляющий вектор и в (1) наложим геометрическое ограничение

1 Матем. ин-т им. В. А. Стеклова РАН, вед. науч. сотр.; факультет ВМК МГУ, проф., д.ф.-м.н., e-mail: mniQmi.ras.ru

* Исследование выполнено за счет гранта Российского научного фонда, проект № 14-50-00005.

вида и € и, где II — непустой выпуклый компакт из К''. Для управляемого объекта (1) на начальный вектор жо € На накладывается ограничение жо € К, где К — непустой выпуклый компакт из Дп, содержащий более одной точки. Подставим произвольное измеримое по Лебегу управление и = и(1) € и, I ^ 0, в уравнение (1) и решим его с начальным условием жо € К. В результате получим решение

t

х(г,х0,и(-)) = егАха + J е(* ^АВи(в) (2)

о

где егА — экспоненциальная матрица ЬА (см., например, [4]), а интеграл понимается в смысле Лебега.

Обозначим при измеримом управлении и(1) € и, I ^ О,

Х(1,К,и(-))= ж(£,жо,«(•))• (3)

х0£К

Фиксируем некоторую ненулевую т х п-матрицу -к, т ^ 1, и некоторый непустой выпуклый компакт М из Д™.

Основная задача, которую мы будем рассматривать, состоит в нахождении условий, при которых для управляемого объекта (1) существует такое измеримое управление и(1) € и, I ^ 0, что (см. (3)) при некотором г ^ О

жХ(т,К,и(-)) С М. (4)

Эта задача носит качественный характер. Ее можно рассматривать как задачу управляемости для линейного управляемого объекта (1) с терминальным условием (4). С помощью аппарата опорных функций из выпуклого анализа и элементов теории многозначных отображений (см., например, [4-6]) удается весьма существенно продвинуться в решении нашей задачи управляемости. Используя формулу (2), включение (4) можно переписать в виде

т

Отсюда с помощью операции геометрического вычитания множеств [6] получаем эквивалентное включение

т

J тгe{-T-s^ABu{s) ds € 0(r), (5)

о

где

fi(r) = М - жетАК. (6)

Отметим, что в общем случае множество 0(т) при данном г ^ 0 может оказаться пустым. Поэтому перед проверкой выполнения включения (5) при данном т ^ 0 надо убедиться в том, что 0(т) ф 0. Обозначим через 21 множество тех г ^ 0, при которых П(г) ф 0. Легко построить примеры, в которых 21 = 0.

Пусть 21 ф 0. Используя определение геометрической разности и непрерывность многозначных отображений fii = Л/. 02(i) = ixetAK при t ^ 0, нетрудно обосновать, что множество 21 замкнуто. Опять-таки, используя свойства операции геометрической разности множеств и непрерывность м.о. Oi(i), 02(i), можно доказать, что м.о. fi(i) полунепрерывно сверху при t € 21. Из выпуклости компакта М и свойств операции геометрической разности множеств следует, что Q(t) — непустой выпуклый компакт при t € 21. Обозначим при г ^ О

т

F(r) = I J [ neST~s^ABu{s) ds, (7)

о

где объединение ведется по произвольным измеримым управлениям € 17 на [0,г]. С помощью результатов теории многозначных отображений (см., например, [4, 5]) и, используя лемму

об обратных функциях из [8], можно показать, что при г ^ О

т

F(t) = J 03(r)dr, (8)

о

где интеграл понимается в смысле теории многозначных отображений (в смысле Ауманна), а м.о. 03(г) определяется формулой

П3(г) = жегАВи. (9)

Из соотношений (8), (9) и результатов теории многозначных отображений (см., например, [4, 5]) вытекает, что F(r) непустой выпуклый компакт для каждого т ^ 0, причем м.о. F(t) непрерывно на [0, +оо) и имеет место формула

т

W(F(t),iP) = J Ш(П3(г),ф) dr, о

где ф — произвольный вектор из Кт. Справедлива (см. (7)) следующая

Лемма 1. Включение (5) при данном т ^ 0 выполняется хотя бы для одной измеримой функции u(s) € U, s € [0, г], тогда и только тогда, когда

F(t) П 0(Т) ф 0. (10)

Используя результаты [9], можно переписать соотношение (10) в следующем виде:

min^(F(r) + (-l)n(r)^)^0, (И)

"¡/>£0"

где а = {'ф G Rm: 1^1 = 1}, символ \ф\ означает длину вектора ф. При проверке условия (11) для данного те 21 используется равенство

W{F{t) + (-l)fi(r), ф) = W(F(t),ф) + W((-l )П(т),ф) ЩеКт. (12)

В связи со сказанным рассмотрим при t ^ 0 функцию (см. (6)-(9), (11))

A(i) = minW(F(i) + (-l)fi(i),^). (13)

ф£<т

Тогда точки те 21 характеризуются неравенством (ср. с (11))

А(т) ^ 0. (14)

Если т G 21 и А(т) < 0, то пересечение выпуклых компактов F(t), П(т) пусто. В связи с соотношениями (12), (13) целесообразно изучить свойства м.о. F(t) (см. (8), (9)) при t ^ 0 и м.о. Q(t) (см. (6)) при t G 2t. Выше уже говорилось, что множества F(t) при t ^ 0 являются выпуклыми компактами, причем м.о. F(t) непрерывно при t ^ 0. На каждом отрезке [а, Ь] из полуоси t ^ 0 м.о. F(i) является

еще и липшицевым. Множества tt(t) = М — же К при t € 2t являются непустыми выпуклыми компактами. В общем случае можно обосновать, что м.о. fi(i) при t € 2t полунепрерывно сверху.

Пусть отрезок [а, Ц, где 0 ^ а < Ь, принадлежит множеству 21. При исследовании соотношения (14) для т G [а,Ь] численными методами полезно, чтобы функция А(т) была липшицевой на [а, Ц. Для этого достаточно обеспечить липшицевость м.о. fi(i) на [а, Ь) (липшицевость м.о. F(t) на [а, Ь) имеет место). Справедливость этого утверждения вытекает из следующих неравенств:

| W(X,i/>)-W(Y,il>)\K;h(X,Y) Уфе а, \ттШ(Х,ф) - mmW(Y, ф)\ < h(X,Y),

if>£a if>(z<T

где X,Y — произвольные непустые выпуклые компакты из Rm.

Достаточные условия, обеспечивающие липшицевость м.о. fi(i) на [а, Ь) С 21, дает Лемма 2. Пусть отрезок [а,Ь] ненулевой длины принадлежит множеству 21 и для каждого t G [а, Ц выпуклому компакту Q(t) принадлежит шар S£(u(t)), где центр шара ш(1) G O(i), е > 0 — радиус шара, не зависящий от t. Тогда м.о. Q(t) липшицево на [а,Ь].

Доказательство. Отметим, что м.о. fi2 (t) = netAK является липшицевым на отрезке [а, Ь]

с константой I = ||7г|| • || ■ \К|, где ||7г|| = тах|7гж|, ||А|| = тах|Аж|, здесь х € Rn; \К\ = тах|ж|.

Mí1

Фиксируем во € [а,Ь]. С помощью результатов [6, § 3] и липшицевости м.о. fi2(í) на [а, Ц нетрудно показать, что существуют константы L > 0, а > 0, такие, что при в € [а,Ь], где \0 — #о| ^ выполняется неравенство

h(Q(0o),Q(0)) < Ь\в -0О|- (15)

Отметим, что согласно результатам [6, § 3] константы L > 0, а > 0 можно выбрать не зависящими от 0q € [а, Ь). Таким образом, при 0', в" из [а, Ь], таких, что \в' — 0"\ ^ а, имеет место липшицевость м.о. fi(í) на [а, Ь) с константой L.

Покажем, что при произвольных в', в" из [а, Ь] тоже имеет место липшицевость м.о. fi(í) на [а, Ц с константой L из (15). Достаточно рассмотреть произвольную пару чисел 0', в" из [а, Ь], для которых выполняется неравенство \в' — 0"\ > а. Не ограничивая общности, можно считать, что в' < в". Фиксируем некоторые точки € [в', в"], i = 0,..., N (N ^ 2), удовлетворяющие условиям: во = 0', в\у = в", 0 < в\ < ... < 0jv и Oí — di-1 ^ а при i = 1,..., N. Используя неравенство треугольника для метрики Хаусдорфа h(-, •), получаем неравенства

ЦП(во), П(в2)) < h(Q(0o), П(вг)) + ЦП(вг), П(в2)) < Щвг - ва) + (в2 - 0J) = Ь(в2 - 0О) = Цв2

(16)

Если N = 2, то неравенство

ЦП(в'),П(в")) < Цв' -0"\ (17)

получено. Если N ^ 3, то имеем неравенство

ЦП(во), П(в3)) < ЦП(в0), П(в2)) + ЦП(в2), П(в3)). (18)

При N = 3 имеем в3 = в", и с помощью неравенств (16), (18) получаем неравенство (17). Если N > 3, то аналогичным образом последовательно рассматриваем тройки отрезков

([#0> 04], [00, 0з], [03, 04]), • • • , ([00, 0jv], [00, 0JV-l], [0JV-1, 0jv])

и в конце концов получаем искомое неравенство вида (17).

Отметим следующее обстоятельство: если функция A(í) непрерывна на [а, Ц С 21, где b — а > О, и А (а) < 0, a A (b) ^ 0, то на отрезке [а, Ь) обязательно найдется такой момент т0, что А (т0) = 0. Тогда из формулы (13) вытекает, что

0 € F(tq) + (-l)fi(ro), (19)

причем точка 0 лежит на границе выпуклого компакта Л = F(tq) + (—l)íí(ro). Обозначим через фо вектор из а, который является опорным вектором для Л в точке 0. Имеем равенства

0 = W(AM = W(F(t0),iI> о) + W((-l)fi(r0), ^о). (20)

Из (19) следует, что существуют векторы 77, где

С е f(t0), V е (-ты, (21)

такие, что

0 = í + r?, (22)

т.е. г] = —Из (20)-(22) вытекает, что

0 = (С, Фа) + (V, Фа)- (23)

Так как (^фо) ^ W(F(to),фо), {г),Фа) ^ W((—1)О(т-0),фо) и выполняются соотношения (20)-(23), то получаем соотношения

{i, Фа) = W(F(r0)M, (ъФа) = W((-l)Q(r0)M. (24)

Таким образом, точка £ принадлежит опорному множеству Ui(ipo) для выпуклого компакта F(tq) в направлении а точка г] принадлежит опорному множеству 112(фо) для выпуклого компакта (—l)íí(ro) в направлении вектора фо-

Из соотношений (24) также вытекает, что вектор £ допускает представление вида

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

То

с = I же{т°-")АВй(8)ё8, (25)

о

где й(«) € и, 5 € [0, то], — некоторое измеримое управление. Так как точка £ принадлежит границе выпуклого компакта

То

F(tq) = J ne{T°-s)ABU ds

о

с опорным вектором фа, то можно использовать аппарат линейной теории управления (см. [4, 7]) и получить следующую характеристику для управления u(t) (см. (25)): почти всюду на [0, т0] выполняется условие максимума

(ru(t), B*eST°~s^A*= та,х(и,В*е(-т°-^А\*фа),

и еи

где * означает операцию транспонирования матрицы.

Для вектора т] мы получаем (см. (21), (24)) следующее экстремальное соотношение:

('■1,Фо) = max (С,^о). Се(-1)п (т0)

2. Рассмотрим случай, когда М является непустым ограниченным выпуклым многогранником, который определяется конечной системой линейных неравенств следующим образом. Пусть С — некоторая действительная рхт-матрица, гдер ^ 1, m ^ 1. Строки этой матрицы будем обозначать через Cj, j = I,...,р. Пусть некоторый вектор d G Rp■ Предполагается, что непустой выпуклый компакт М С Rm совпадает с множеством всех решений системы линейных неравенств

слу < di,

....... (26)

Сру si dp,

где у G Rm, и di, г = 1,... ,р, — компоненты вектора d. В (26) используется матричное умножение строк Cj на столбец у. Систему неравенств (26) мы будем коротко записывать в виде Су ^ d. Отметим, что неравенства (26) с помощью операции скалярного произведения векторов можно переписать в виде

{с\,у) < di,

..................(27)

(с*, у) < dp,

где * означает транспонирование матрицы-строки. В дальнейшем мы будем использовать некоторые факты из теории полиэдров [10, гл. 2,3 ]. Термин "полиэдр" является синонимом термина "выпуклый многогранник".

На строки Cj, j = 1 ,...,р, в (26) наложим следующее условие [11], обеспечивающее ограниченность множества М при произвольном d G RP: Con(c*,j = 1 ,...,p) = Rm, где Con означает коническую оболочку множества векторов.

Пусть отрезок [а, Ь] ненулевой длины принадлежит 21. При t G [a, b] множество Q(t) ф 0. Учитывая, что М — непустой ограниченный выпуклый многогранник, определяемый системой линейных неравенств (26), удается получить простое описание для выпуклого компакта О(t) в виде системы линейных неравенств следующим образом.

Пусть z G O(i) при данном t G [a, b). Тогда, согласно определению операции геометрической разности множеств,

z + тге*-4С G М ЩеК. (28)

Отсюда с помощью соотношений (26) получаем, что

CjZ < hj(t) = dj - maxc,jixetAi, j = 1,...,p. (29)

Систему линейных неравенств (29) в векторной форме можно переписать в виде

Cz sC h(t). (30)

Обратно, пусть вектор z G Rm и удовлетворяет при данном t G [а, Ц системе линейных неравенств (30). Тогда, как нетрудно видеть, для произвольного i, G А выполняется включение (28) и, следовательно, z G Q(t). Таким образом, fi(i) при t G [а, Ц является непустым ограниченным выпуклым многогранником, который определяется системой линейных неравенств (30). Отметим, что функции hj, j = 1,... ,р, являются липшиповыми на [а, Ц. Это обстоятельство важно для нас, так как оно будет сейчас использовано при доказательстве липшицевости fi(i) на [а, Ь) с помощью неравенства Хоффмана [10].

Фиксируем пару di, в2 чисел из [а, Ь). Пусть z G fi(0i). Тогда, согласно Хоффману [10, теорема 10.1], для расстояния dist(z, О(02)) от точки z до компакта fi(02) имеет место неравенство

dist(z, П(в2)) < ШР(С, z, в2), (31)

где положительная константа Ш зависит только от элементов матрицы С, а функция /3(С, w, t) при w € Rm, t € [а, Ь], определяется формулой (см. (29))

/3(С, ад, t) = max (max(0; Со-го —/г,(i))). (32)

При произвольном фиксированном j = 1,... ,р имеем

Cjz - hj(e2) = (Cjz - hjfr)) + (hjfr) - hj(e2)). (33)

Здесь первое слагаемое в правой части неположительно. Поэтому при j = 1,... ,р

max(0-Cjz - hj(e2)) < \hj(e{) - hj(e2)\. (34)

Аналогичным образом для z G О(02) получаем при j = 1,... ,р неравенство

max(0-Cjz - hj{e{)) < \hj(e{) - hj(e2)\. (35)

Используя соотношения (31), (32), (34), (35) и определение расстояния Хаусдорфа, получаем неравенство

к(П(вг),П(в2)) max \к5{в{) - к5{в2)\ (36)

при произвольных в\, в2 из [а, Ц. Так как функции hj(t), j = 1,... ,р, липшицевы на [а, Ь], то из (36) вытекает липшицевость м.о. Q(t) на [а, Ц.

В заключение отметим одно полезное условие, которое обеспечивает разрешимость системы линейных неравенств вида (26) при данном векторе d:

d G Conjee, i = 1,... ,m; -ej, j = 1,...,m; gk, к = 1,... ,p},

где 6j G Rp, i = 1,... ,m, — столбцы матрицы С; g^ G Rp, к = 1,... ,p, — столбцы единичной матрицы Ер порядка р. Это условие является переформулировкой утверждения упражнения 13.11 из [10].

Заключение. В настоящей статье была рассмотрена задача об управляемости линейного управляемого объекта с неодноточечным начальным множеством К и заданным целевым множеством. При этом были использованы некоторые результаты из выпуклого анализа, теории многозначных отображений и теории линейных дифференциальных игр преследования. Использование этих современных методов анализа и теории управления позволило разработать конструктивные методы решения рассматриваемой задачи. Отметим, что в нелинейном случае подобного рода задачи представляют большой интерес и вызывают большие трудности, требуя разработки нового математического аппарата. Среди работ в этом направлении мы отметим монографию [12].

СПИСОК ЛИТЕРАТУРЫ

1. Овсянников Д. А. Математические методы управления пучками. JL: Изд-во ЛГУ, 1980.

2. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1973.

3.Пантелеев A.B., Бортаковский A.C., Летова Т. А. Оптимальное управление в примерах и задачах. М.: Изд-во МАИ, 1996.

4. Благодатеких В.И. Введение в оптимальное управление. М.: Высшая школа, 2001.

5. Благодатских В. И., Филиппов А.Ф. Дифференциальные включения и оптимальное управление // Труды МИАН. 1985. 169. С. 194-252.

6. Понтрягин J1. С. Линейные дифференциальные игры преследования // Мат. сб. Новая сер. 1980. 112. Вып. 3. С. 307-330.

7. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.

8. Филиппов А.Ф. О некоторых вопросах оптимального регулирования // Вестн. Моск. ун-та. Сер. 1. Матем. Мех. 1959. № 2. С. 25-38.

9. Пшеничный Б.Н. Линейные дифференциальные игры // Автоматика и телемеханика. 1968. № 1. С. 65-78.

10. Васильев Ф.П., Иваницкий А.Ю. Линейное программирование. М.: Факториал, 1998.

11. Ерёмин И. И. Линейная оптимизация и системы линейных неравенств. М.: Академия, 2007.

12. Kurzhanskii A.B., Varaiya P. Dynamics and Control of Trajectory Tubes. Theory and Computation. Birkhauser, 2014.

Поступила в редакцию 13.01.16

УДК 519.6

И. А. Лесин1, А. Г. Перевозчиков2, В. Ю. Решетов3

МОДЕЛЬ ПРЕОДОЛЕНИЯ МНОГОУРОВНЕВОЙ СИСТЕМЫ ЗАЩИТЫ НАПАДЕНИЕМ С НЕСКОЛЬКИМИ ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ

В работе рассмотрено развитие модели "оборона-нападение" Ю. Б. Гермейера в части учета многоуровневой системы обороны на заданном направлении. Модель представляет собой частный случай задачи дискретного оптимального управления терминального типа и может быть решена методом субградиентного спуска. Поставленная задача управления уточняет задачу распределения ресурсов защиты на заданном направлении по уровням с помощью использования более общих ограничений, учитывающих возможность действия средств защиты на различных рубежах.

Ключевые слова: дискретное оптимальное управление, субдифференциал критерия, субдифференциал агрегированной функции в ограничении, комбинированный метод проекции субградиента, сходимость комбинированнного метода.

1. Введение. Рассматриваемая модель многоуровневой системы защиты на заданном направлении представляет собой частный случай задачи дискретного оптимального управления (ОПУ) терминального типа. Главной проблемой ее решения методом типа градиентного спуска является недифференцируемость и невыпуклость липшицевых функций в правых частях уравнения движения и их производных по совокупности переменных. Это делает некорректным использование классических методов, предполагающих дифференцируемость терминального критерия и построения его градиента на основе сопряженной системы.

В работе [1] было предложено использовать процедуру осреднения функций в правых частях уравнения движения по совокупности переменных в малой окрестности, радиус которой h считается малым параметром. В результате указанные функции становятся дифференцируемыми по совокупности переменных и для решения полученной аппроксимирующей задачи можно использовать

1 Факультет ПМиК Тверского ГУ, асп., e-mail: lesik56Qmail.ru

2 Факультет ВМК МГУ, доц., д.ф.-м.н., e-mail: pere501Qyandex.ru

3 Факультет ВМК МГУ, доц., к.т.н., e-mail: kadryQcs.msu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.