Вычислительные технологии
Том 8, № 4, 2003
О ПОЛИЭДРАЛЬНЫХ ОЦЕНКАХ МНОЖЕСТВ ДОСТИЖИМОСТИ ЛИНЕЙНЫХ МНОГОШАГОВЫХ СИСТЕМ С ИНТЕГРАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
НА УПРАВЛЕНИЕ*
Е. К. КостоусовА
Институт математики и механики УрО РАН, Екатеринбург, Россия
e-mail: [email protected]
The capabilities of two-sided approximations (estimates) for attainability sets of linear multistage systems with integral non-quadratic constraints on control and the uncertainty in initial conditions (including systems with state constraints) are considered with the help of the families of parallelepipeds (parallelotopes).
Введение
Решение многих задач теории управления и оценивания в условиях неопределенности в гарантированной постановке основывается на исследовании трубок траекторий (многозначных функций, описывающих, например, динамику множеств достижимости, разрешимости, информационных областей) (см., например, [1-5]). Их явное описание известно только в частных случаях [1]. Существует несколько подходов к разработке численных методов аппроксимации трубок траекторий. Ряд методов основываются на аппроксимации множеств многогранниками с большим числом вершин и граней (см., например, [6]), объединением конечного числа точек [7, 8]. Другой подход состоит в аппроксимации множеств классом более простых областей некоторой фиксированной формы (в частности, эллипсоидами, параллелепипедами) (см., например, [2] и приведенную там библиографию).
В настоящей работе развивается подход [2, 9], заключающийся в аппроксимации искомой трубки целым семейством внешних (внутренних) трубок, образованных параллелепипедами (параллелотопами). Семейства вводятся таким образом, чтобы, с одной стороны, обеспечить точные представления решений (через пересечение или объединение оценок), а с другой — чтобы каждая конкретная трубка находилась с помощью систем эволюционных соотношений независимо от остальных (что открывает возможности для параллельных вычислений). Оценки желательно строить так, чтобы они были "как можно ближе"
* Работа выполнена при поддержке Российского фонда фундаментальных исследований, гранты № 00-01-00369, № 03-01-00528.
© Е. К. Костоусова, 2003.
к искомым множествам, например, были тугими [10, 11] или касающимися [12]. Ранее были предложены некоторые способы построения семейств параллелепипедозначных оценок трубок траекторий для систем с геометрическими (жесткими) ограничениями [9, 12-15].
В настоящей работе такие семейства вводятся для множеств достижимости (МД) линейных многошаговых систем с интегральными неквадратичными ограничениями на управление и неопределенностью в начальных условиях, включая системы с фазовыми ограничениями. Для случая без фазовых ограничений во введенных семействах выделены тугие и касающиеся оценки. Отметим, что рассмотрение в качестве оценок параллелепипедов, грани которых не обязательно параллельны координатным плоскостям, позволяет ослабить [12] известный в интервальном анализе "эффект обертывания" (wrapping effect) [16]. Рассматриваемые в работе множества достижимости, вообще говоря, не обладают полугрупповым свойством [2] (это свойство присуще множествам достижимости в расширенном фазовом пространстве, включающем координату, соответствующую текущему запасу управления [17]). Способы построения полиэдральных оценок множеств достижимости в расширенном пространстве и получаемые с их использованием параллелепипедо-значные оценки МД в "обычном" фазовом пространстве, а также результаты численного моделирования для систем с фазовыми ограничениями будут представлены в отдельной публикации.
Описание множеств достижимости из начала координат для автономных многошаговых систем (без фазовых ограничений) с интегральными неквадратичными ограничениями на скалярное управление дано в [18].
1. Постановка задачи
Рассматривается многошаговая система
x[j] = A j]x[j-1] + B[j]u[j] + v[j], j = 1,..., N. (1.1)
Здесь x[j] 6 IRn — фазовый вектор системы (IRn — n-мерное евклидово пространство); A[j] 6 IRnxn — известные неособые матрицы (IRnxm — пространство действительных ихш-матриц); B [j] 6 IRnxr; v[j] 6 IRn — известные входные воздействия. Начальное состояние x[0] и управление u[j] 6 Rr стеснены ограничениями
x[0] 6 Xo; (1.2)
k
]IL < в [k], k = 1,... , N; (1.3)
j=i
u[j] 6K[j], j = 1,..., N, (1.4)
где X0 6 conv IRn — заданное множество (conv IRn — множество всех выпуклых компактных подмножеств IRn); 0 < в[1] < в[2] < ■ ■ ■ < e[N] — известные числа; ||u||^ = max |uj| —
l<i<r
норма вектора u 6 IRr (нижний индекс будем использовать для нумерации компонент векторов, верхний — для нумерации векторов); K[j] С IRr — заданные выпуклые замкнутые конусы [19]. На состояние системы могут быть наложены фазовые ограничения
x[j] 6 Y[j], j = 1,...,N,
(1.5)
где У[7] — выпуклые замкнутые множества. Ограничения (1.5), в частности, могут порождаться уравнением измерений с неизвестной, но ограниченной помехой [4, 5]
у[7] = ОДх[7] + ф], ф] е в[7] с 7 = 1,...,^,
где ] — известные тхп-матрицы ранга т, в[7] е еопуЕ™ — заданные множества.
Множеством достижимости X [к] системы (1.1)-(1.4) ((1.1)—(1.5)) в момент к е (0,...,Ж} называется множество всех тех точек жеН", для каждой из которых существуют такие ж[0] и «[•], удовлетворяющие (1.2)—(1.4), что порождаемое ими в силу (1.1) решение ж[^] будет удовлетворять условиям ж [к] = ж (а также (1.5) для 7=1,... , к). Многозначная функция X[к], к = 1,...,Ж, известна как трубка траекторий X[•] [2]. Если ограничения (1.5) порождаются измерениями, то X[к] известны как информационные области [2, 5].
Введенные множества достижимости для систем с интегральными ограничениями (1.3), вообще говоря, не обладают полугрупповым свойством [2], и для них в общем случае не удается найти рекуррентные соотношения типа полученных в [4], имеющие место для многошаговых систем с геометрическими ограничениями. В разд. 2 будут приведены "полурекуррентные" соотношения для множеств достижимости (системы рекуррентных формул, с помощью которых можно находить МД) систем без фазовых ограничений, а также соотношения, описывающие МД систем с фазовыми ограничениями. Будем полагать, что Xo — параллелепипед
Xo = Р (ро,Р0,по) = Р [ро,Ро], (1.6)
а ограничения (1.5) (если присутствуют) являются параллелепипедами
У Ы = Р (Ф ],Ф ]) = Р [Ф ],Ш (1.7)
или полосами
т}]
У[7] = 5(ф-],£[7],а[7],т[7]) = П^], т[7] < п. (1.8)
г=1
Параллелепипедом Р(р,Р,п) в Б1га называем множество
п
Р = Р (р,Р,п) = (ж| ж = р + ^ Р'Пг^г; |&| < 1, г = 1,...,п},
г=1
где р е К,п; матрица Р = (р}} = (р1 ••• рп} е М"хп, М"хп = (Р е 1Кпхп| ае1 Р = 0, ||рг|| = 1} — множество всех неособых пхп-матриц со столбцами единичной длины1 (||а|| = (а, а)1/2 обозначает евклидову норму); п е Ип, п > 02. Можно сказать, что р задает центр параллелепипеда, рг — "направления", а пг — величины его "полуосей", Р — матрица ориентации. Любой параллелепипед является параллелотопом: Р(р,Р,п) = Р[р,Р], где Р = Р•diagп, символом diagп (или diag (пг}) обозначаем диагональную матрицу с компонентами пг вектора п на диагонали.
Параллелотопом Р[р, Р] в Б!п называем множество
г
Р = Р[р, Р] = (ж| ж = р + ^|&| < 1, г = 1, . . . , г},
г=1
Условие ||рг || = 1 несущественно и может быть опущено.
2Векторные и матричные неравенства понимаем покомпонентно.
где р Е М", г < п, а пхг-матрица Р = (р»} € М"хг может быть особой. Таким образом, р определяет центр параллелотопа, а матрица Р — его форму. Если г = п и Р = 0, то параллелотоп является параллелепипедом с Р = Pdiag (||р»||-1}, п» = ||рг||. Полосой Б (с, а, т) называем пересечение т (1 < т < п) гиперполос Е»:
т
Б = Б(с,5>,т) = р|Е*, Е» = Е(с»,з\а») = (х| |(х, в») - с»| < а»},
»=1
где с € М™; 5 = (з*} = (в1 • • • зт} — пхт-матрица ранга т со столбцами 3 единичной длины3; а € Мт, а > 0. Векторы ±з» определяют нормали к гиперплоскостям, ограничивающим гиперполосу Е».
Далее предполагаем также, что конусы ] таковы, что параллелепипедами являются множества Я [7]4:
]= С ПОД], С = Р(0,1, е) С ИМ, (1.9)
т. е.
ОД ] = Р (г[7'],Д[7 ]ОД ]) =Р [г[7 ],ВД. (1.10)
Здесь С — единичный куб в ИМ с центром в нуле, 1 — единичная матрица, е = (1,1,... , 1)т.
При сделанных предположениях МД, вообще говоря, не являются параллелепипедами, и точное построение МД (особенно для систем большой размерности) может быть достаточно затруднительным. В соответствии с подходом [2, 9] наша цель состоит не только в том, чтобы найти какие-либо внешние и внутренние оценки для X[•]:
Р-[к] СХ[к] СР +[к], Р±[к] = Р(р±[к],Р±[к],п±[к]), (1.11)
но и, в том, чтобы ввести некоторые семейства таких трубок, обеспечивающие точные представления
X И = р| Р + [к], X [к] = У Р- [к]. (1.12)
Оценки желательно строить так, чтобы они были "как можно ближе к МД".
Следуя [10, 11], называем внешнюю (внутреннюю) оценку Р множества Q Е еопуМ" тугой (в направлении /), если Р 1Э Q (Р С Q) и существует такой вектор I Е М", что р(±/|Р) = р(±1 |Q). Здесь р(/^) = вир((х,/)| х Е Q} — опорная функция Q.
Называем Р = Р(р, Р, п) внешним касающимся параллелепипедом для Q Е еопу М", если Q С Р и р(±(Р-1)те»|Р) = р(±(Р-1)т е*^), г = 1,... , п, где е» = (0,... , 0,1, 0,... , 0)т Е ИМ" — г-й единичный орт в М" (единица стоит на г-м месте).
В разд. 4, 5 вводятся семейства внешних и внутренних оценок, обладающие свойствами (1.11), (1.12). Предлагаемые оценки зависят от некоторых параметров, определяющих семейства трубок Р±[-]. Для случая без фазовых ограничений во введенных семействах выделены тугие и касающиеся оценки. Для замкнутости изложения в разд. 3 приведены некоторые свойства параллелепипедов, а в Приложении — вспомогательные утверждения (для которых автор не нашла ссылок), используемые в доказательствах. Далее используются обозначения: Т — знак транспонирования;
0 — нулевая матрица (вектор) произвольной размерности к х /;
3Условие ||в®Н = 1 может быть опущено.
4Столь специальное по форме ограничение позволяет охватить, например, ситуацию, когда К [7] — положительный ортант или полупространство, ограниченное координатной плоскостью.
Abs A — матрица абсолютных величин элементов матрицы A = |aj}: Abs A = {|aj |};
= {P G Rnxn| det P = 0}; MT = {P G M£xra| det(1 - P) = 0};
co Q — выпуклая оболочка множества Q С Rn [19];
sign z - функция знака числа: равна -1, 0, 1 соответственно при z < 0, z = 0, z > 0; □ — знак окончания доказательства.
2. Точное описание множеств достижимости
Описание множеств достижимости для систем без фазовых ограничений дает Теорема 2.1. Множества достижимости X[k] системы (1.1)-(1.4) удовлетворяют соотношениям
X [k] = X0[k] + *[k], k =1,...,N; (2.1)
X0[k] = A[k]X0[k-1] + v [k], k = 1,...,N, X0[0] = Xo; (2.2)
*[k] = в[k]co {e[k-1]-1A[k]X?[k-1] U B[k]R[k]}, *[0] = {0}, (2.3) где множества R[k] определены в (1.9). Если все
в[k] = в> 0, k = 1,...,N, (2.4)
то справедливы соотношения (где X0[k] по-прежнему находятся по формулам (2.2)):
X[k]=co{(A[k]X[k-1]+ v[k]) U (eB[k]R[k] + X0[k])}, k=1,...,N, X[0] = X0. (2.5) Доказательство. Ввиду формулы Коши X[k] представимо в виде (2.1), где множества
к
X°[k^[k, 0]X0 + J>[k,j]v[j] (2.6)
j=i
удовлетворяют соотношениям (2.2), а
кк
*[k] = {x| x = J] Ф[^ j]u[j], J] ||«[j]|U < в[k]; u[j] G K[j], j = 1,..., k}. (2.7) j=i j=i
Здесь Ф[k, /] - фундаментальная матрица для однородной системы (1.1): Ф^, Z]=A[k]A[k-1]-••• A[1+1] при k > / и Ф[М] = I при k = /, а Ф[М] = Ф^,/]^/]. В силу леммы П.1 из Приложения имеем
к
*[k] = в[k]co ^ Ф[^ j](C П K[j])}. (2.8)
j=i
Учитывая вид матриц Ф^'], имеем *[k] = в[k]co {A[k](Uк-i ^[k—1, j]R[j]) U B[k]R[k]}, что ввиду формулы (2.8) для Xf[k — 1] приводит к (2.3).
Равенство (2.5) при kG{1,... , N} получается, если в соотношение (2.1) подставить упрощенное ввиду (2.4) выражение (2.3) для Xf[k], а затем, пользуясь леммой П.2, внести X0[k] под знак co и учесть выражение (2.2) для X0[k] и формулу (2.1) при k—1. □
Для систем с фазовыми ограничениями стандартными процедурами выпуклого анализа [1] получается довольно громоздкое выражение для опорной функции МД.
Лемма 2.1. Пусть X[к] — множества достижимости системы (1.1)-(1.5) с Y[j] G convIR", j = . Тогда
k
P(l|X[k])= ^ rnf ip(A[j] | Y[j]) + р(Ф[к, 0]Tl - £ ф|>", 0]TA[j] | Xo)+
j=1
kk + E v[j]т(Ф[к, j]Tl - £ Ф[а, j]TA[a]) +
j=1 a=j
k
+ sup(E u[j ]T(^[k,j ]Tl j ]TA[a]) | J]|Hj]|U < в [к], u[j] G K[j ]}}.
uN j=1 a=j j=1
Пользуясь подходом из [2, 3, 5], можно свести описание МД систем с фазовыми ограничениями к построению семейства МД вспомогательных систем без фазовых ограничений, но с матричными параметрами T[•]:
z[j] = T[j]A[j]z[j-1] + (/ - T [j ])Z [j]+ T[j]v[j], j=1,...,N, z[0] GXo; Z [j] G Y [j ]; (2.9)
z[j] = T[j]A[j]z[j-1] + T[j]B[j]w[j], j=1,... , N;
z[0] = 0, £ ||w[j]|U < в[k]; w[j] g K[j]. (2'10)
j=i
Ограничения в них соответственно геометрические [4] и интегральные (типа (1.2)-(1.4)). Рассуждая подобно [3, 5] и используя лемму 2.1, заключаем, что справедлива Теорема 2.2. Пусть X[к] — множества достижимости системы (1.1)-(1.5), где Y[j] G convIR", j = 1,... ,N, а Z[k] = Z(k; T [•]) и ZT[k] = i(k; T [•]) — МД систем (2.9) и (2.10). Тогда при любых T[j] G МП0хп, j = 1,... , N, справедливы включения
X [к] С Z (к; T [•]) = Z [к] = Z[k] + Z^[k], к =1,...,N, (2.11)
и X[к] = P|T[•] Z[к], где в пересечении достаточно перебрать все последовательности T[j], j = 1,... , N, диагональных матриц, удовлетворяющих T[j] G МП0хп.
Замечание 2.1. Очевидно, что X[к] С Р|k=0 X[к, г], где через X[к, 0] обозначено множество достижимости системы (1.1)—(1.4) без фазовых ограничений, а X[к, г] — МД в момент к системы вида (1.1), где j=г+1,... , к, с ограничениями У] k=i+1 ||u[j ]||те < в [к], u[j] G K[j], и начальными условиями x[г] G Y[г]. Множества X[к, г] формально можно получить, положив X [к, г] = Z (к; T [•]), где T [j ] = 0 при j = 1,...,г, T [j ] = I при j = г + 1,... , к.
Описание X [к] можно свести также к построению семейства множеств достижимости вспомогательных систем с геометрическими ограничениями, задаваемого набором скалярных параметров h[-].
Теорема 2.3. Пусть X[к] — множество достижимости в момент к системы (1.1)-(1.5). Если h[j] — произвольные числа, удовлетворяющие условиям
k
h[j ] > 0, j = 1,...,к, ] < в [к], (2.12)
j=i
а X(к; h[-]) — множество достижимости системы (1.1), (1.2), (1.5) с ограничениями на и[-] вида
u[j ] G h[j ] R[j], j = 1,...,k, (2.13)
где ^[7] — множества (1.9), то
X(к; Щ С X[к]. (2.14)
Справедливо равенство
X[к] = У{X(к; й[-])| й[-] подчинены (2.12)}. (2.15)
Если в [к] = в ив (2.12), (2.13) к заменено на N, то (2.14), (2.15) верны при к = 1,... , N.
Доказательство. Пусть х 6 X(к; Л-[-]). Тогда найдутся такие х[0] 6 Xo и и[-], удовлетворяющие (2.13), что для соответствующего решения системы (1.1) имеем х[к] = х и выполнены соотношения (1.5). Имеем и [7] 6 Л.[7]К[7] С К[7], 7=1,...,к. Кроме того, II ]||те < ] < в [к]. Следовательно, х 6 X [к], что доказывает (2.14).
Пусть х 6 X[к], причем х соответствует х[0] и и[-]. Полагая Л,[7] = 11и[7] ||те, 7 = 1,... , к, несложно заметить, что выполняются соотношения (2.12), (2.13) и х 6 X(к; Л-[-]). □
3. Некоторые свойства параллелепипедов
Построение параллелепипедозначных оценок для МД основывается на выполнении операций над параллелепипедами (афинного преобразования, суммы Минковского, пересечения, выпуклой оболочки объединения). Результат такой операции может не быть параллелепипедом, и в этом случае он будет аппроксимироваться параллелепипедами (параллелотопами) снаружи и изнутри. Приведем некоторые свойства параллелепипедов, используемые для построения оценок (см. также [12, 13, 15]).
Опорные функции параллелепипеда и параллелотопа вычисляются по формулам
р(1|Р(р,Р,п)) = (р, 1) + АЬв (1ТР)п, р(/|Р[р,Р]) = (р, /) + лъб (/тР)е.
Если матрица А 6 В"Х" — неособая, а 6 К"-, то АР(р, Р, п) + а = Р(Ар + а, АР, п) = Р(Ар + а,АРВ-1,Вп), где В = ^{||Ар*||}. Если Р=Р[р,Р] С К", А 6 Е"ХГ, г < п, то АР=Р [Ар, АР] С К".
Внешняя касающаяся оценка для <2 6 сопуМ", минимальная по включению среди параллелепипедов с данной матрицей ориентации V, имеет вид [12]
р + (2) = Р(V, V, V), (3.1)
где V = Vc,
С* = (р(^-1)Те*|2) - -1)Те*|2))/2,
V = (р(^-1)Те* |2)+ p(-(V-1)Те*|2))/2, г = 1,...,п.
Сумма 2 = }=1 Р (рф Рф п^) параллелепипедов с одинаковыми матрицами Р(^)=Р
есть параллелепипед: 2 = Р(^к=1 р(Л, Р, ^к=1 п^). В общем случае это не так. Оценка
р+ (2) в этом случае принимает вид (3.1), где V = р(,?), V = АЬв (V-1Р(^))п(^).
Внутренние оценки для суммы параллелепипедов можно искать в виде параллелотопов. Пусть 2 = Р(1) + Р(2), где Р^ = Р[рф Р(Л], 7 = 1, 2, Р(Л 6 К"^, г, < п.
Введем множества $^Х" г, х п-матриц, для которых сумма абсолютных величин элементов каждой строки не превосходит 1:
"
Х" = {Г = {7а}| тах £ ^| < 1}. (3.2)
Зафиксируем произвольные матрицы 6 $г'Х", 7 = 1, 2, и определим параллелотоп
р—(1),г(2) (Р(1) + Р(2)) = Р[р(1) + р(2), Р(1)Г(1) + Р(2)Г(2)]. (3.3)
Для случая 2 = Р=Р[р, Р] будем использовать обозначение р-(Р) = Р[р, РГ]. Лемма 3.1. Параллелотоп (3.3) есть внутренняя оценка для <2 = Р(1) + Р(2) (т.е. р-(1) Г(2) (2) С 2), каковы бы ни были Г(к) 6 $ГкХ", к = 1,2. Кроме того, <2 = и{р-(1) г(2) (2)| Г(1) = {1,0}, Г(2) 6 $Г2Х"} (при г1 = п нулевой блок в Г(1) отсутствует). Оценка Р- вида (3.3) является тугой (в направлении I), если Г(к) = {7} 6 $Гк Х"
таковы, что
sign c(1)T7 (1)j = sign c(2) Ty (2)j Vj G {1,... ,n} : c(fc)TY(fc)j = 0, k = 1, 2, (3.4)
Abs(c(fc)TГ(к))е = (Abs c(k))Te5, k = 1, 2, где c(k) = P(k)Tl. (3.5)
Доказательство. Достаточно рассмотреть случай p(1)=p(2)=0. Первые два утверждения проверяются аналогично [13]. Для доказательства последнего замечаем, что p(l|P-) = Abs (lT (Р(1)Г(1)+Р(2)r(2)))e=Abs (c(1)TГ(1))е + Abs (c(2)Tr(2))e=p(l| P(1))+p(l|P(2)), где использованы формула для опорной функции параллелотопа и соотношения (3.3)-(3.5). □ Следствие 3.1. Пусть в условиях леммы 3.1 r1 = n, r2 = r. Пусть J = ... , jr} — произвольное подмножество индексов из множества {1, 2, ...,n}, а {i1,...,ir} — какая-либо перестановка чисел {1,... , r}. Если Г(1) = I, а
Г(2) = {7 (2)j}
такова, что ненулевыми могут быть только столбцы с номерами j G J, и столбцы вычисляются по формулам
Y(2)j = 0, если j / J, Y(2)j = , если j = ja G J,
(1b (2) (1) (2) n sign cj sign ci , если cj c, =0,
^ ja ^ ¿a 7 ja ¿a ' 1 /q
tf J • (2) (1) n (2) / n ( )
ва = \ sign cia , если cja = 0, cia = 0,
любое число, такое что |в«|<1, если c(2 = 0,
то оценка P-(1) р(2) (Q) будет тугой для Q (в направлении l)6.
Доказательство. Достаточно проверить (3.4), (3.5). Равенства (3.4) не нужно обеспечивать при j / J (так как тогда c(2) y(2)j = 0), а также при j = ja G J в случаях, когда c(2)=0 (тогда c(2)TY(2)j = ^в« = 0) или c£? = 0, но cj1)=0 (тогда c(1)TY(1)j = cj1) = 0). При оставшихся значениях а имеем cj^c^ = 0, и равенства (3.4) выполнены в силу выбора ва в соответствии с (3.6). Для проверки условия (3.5) при k = 2 (при k =1 оно очевидно)
достаточно заметить, что Abs (c(2) ' Г(2)) e = £a=i R ^«1, разбить последнюю сумму на три части, соответствующие трем указанным в (3.6) случаям вычисления в«, и убедиться, что полное суммирование дает У]0,=1 |ci2)|. □
Остановимся теперь на построении оценок для множеств вида Q = со (Jk=1 P(j), где P(j) = p[pj),pj)], p(j) g iRraxrj (r, < n).
Внешние оценки P + (Q) строятся согласно (3.1), где используются явные выражения
k k
р(/|со I I P(j)) = p(/| I I P(j)) = max p(/|P(j)) V/ G IRn. (3.7)
^^ ^^ 1<j<k j=1 j=1
5Здесь векторы е = (1,1,..., 1)т в левой и правой частях могут иметь разную размерность.
6Но не обязательно параллелепипедом.
Тогда множество Q(h)= ЕL hjR(j)CQ. Кроме того, Q= (J{Q(h)|hj подчинены (3.8)}.
Отметим два способа построения внутренних оценок (применимые в частных случаях).
Первый способ основывается на описанном ниже в лемме 3.2 сведении (путем ведения параметров) операции со ик=1 Р(7) к операции сложения к параллелотопов, а затем использовании известных способов построения внутренних оценок для суммы параллелотопов (например, последовательном построении оценок (3.3)). Лемма 3.2. Пусть <2 = со
ик=1 Р(7), где Р7 могут быть представлены в виде Р(7) = А7Р(7), А Е БЯ,гахг (г < п), Я(7) = Р(г(7),Д(7),р(7)) С — параллелепипеды специального вида, у которых матрицы Д.) = I — единичные, а компоненты векторов г(7) могут, принимать не более трех значений: 0, 0.5, -0.5, причем если г. = 0, то р7) = 1 или р7) = 0, а в противном случае р7) = 0.5. Пусть {Л.}к=1 — произвольный набор чисел, таких что к
Л. > 0, з = 1,...,к, < 1. (3.8)
.7 = 1
Доказательство. Достаточно заметить, что
представимы в виде Я(7) = С Р| К7, где К7 — выпуклые конусы, образованные пересечением полупространств, определяемых координатными плоскостями, воспользоваться леммой П.1 и провести рассуждения, аналогичные приведенным при доказательстве теоремы 2.3. □
Следствие 3.2. Пусть 2 = со и2=1 Р(7), где Р(7) = Р[0, Р(7)], Р(7) € 1Тхг'. Зафиксируем матрицы Г(7) € 9г'хп, 3 = 1, 2, число а Е [0,1] и определим параллелотоп
2
РГ(2) а(со и Р(7)) = Р[0, аР(1)г(1) + (1 - а)Р(2)Г(2)]. (3.9)
' ' 7=1
Тогда р-(Х), Г(2)>а(2)сд. Кроме того, 2= У{р, Г(2)>а(2)| Г(1)={1, 0}, Г(2)е£Г2хп,а€[0,1]}.
Второй способ построения внутренних оценок применим для случая, когда центры параллелотопов находятся в нуле, и сводится к решению задачи негладкой минимизации.
1о
Лемма 3.3. Пусть Q = со UJ=1 P(j), где P(j) = P[0, P(j)], P(j) E Rnxrj. Зафиксируем
E вектор п0 E IRn, п0 > 0, г
k
P(co(J P(j)) = P(0,P-,Yn0),
произвольные матрицу P E МПХП, вектор п0 E IRn, п0 > 0, и определим параллелепипед
j=i
где
Y = n min max {Abs (/TBj)e}, = (P-diagn0)-1P(j). (310)
Тогда параллелепипед P- вида (3.10) есть внутренняя оценка для Q.
Доказательство. Включение P- C Q эквивалентно соотношениям p(/|P-) < p(/|Q)
V/ E IRn, или с учетом выражений для опорных функций y(Abs /T)e < max Abs (/T)e,
1— j—k
где IT = /TP-diagп0. Выбор y в виде (3.10) гарантирует эти неравенства. □
И, наконец, напомним [15] некоторые простые способы построения внутренних парал-лелепипедозначных оценок с заданной матрицей ориентации для выпуклых ограниченных политопов с непустой внутренностью, задаваемых в виде пересечения Y > n+1 гиперполос
Y
Q = П^, = E(Cj) = {x : |(x,sj) - c,-| < a}. (3.11)
j=1
Пусть v £ Q и матрица V = {v1 • • • vn} £ МПхп. Тогда P(v, V, v) С Q тогда и только тогда, когда v удовлетворяет системе неравенств
ATv < b, v > 0, (3.12)
где A = {aj} = {а1 • • • ат} £ IRraxT и b £ IRT построены по формулам
aj = |(v>j )1, i j = 1,...> Y (3.13) bj = min{aj + Cj — (v, sj), aj — Cj + (v, sj)}, j = 1, ■ ■ ■, Y.
В частности, выбрав произвольные v £ Q (центр параллелепипеда) и V £ МПхп (матрицу ориентации), внутреннюю параллелепипедозначную оценку для множества (3.11) можно найти по явным формулам в виде
ТЛ * Г Yv0, если v £ int Q,
(Q) = P (v, V, v *), v * =i ' яп
v ' v ■>■>/■> ^ о, если v£d Q,
v0 = (1/n) min{bj/aj | j = 1, ■ ■ ■, Y, aj = 0}, i = 1, ■ ■ ■, n, Y = min{bj/(aj, v0)| j = 1, ■ ■ ■, Y, (aj, v0) = 0},
(3.14)
где дQ — граница Q7. Использование обозначения p- v(Q) из (3.14) и p"(1) r(2) (Q) из (3.3) в каждом конкретном контексте, по-видимому, не должно вызвать путаницы.
Конкретизируем построение внутренних оценок (3.14) для суммы k параллелотопов
к
Q = Y1 P(j)' P(j) = PGlRnXrj, j = 1,... , k, (3.15) j=i
для случая, когда int Q = 0. Обозначим через F = {f^}M=i такое множество различных векторов fß единичной длины, что для каждого ненулевого вектора p(j)' г, i £ {1,... , rj}, j £ {1,... , k} (i-го столбца матрицы P(j)) найдется fм £ F, коллинеареный p(j)' \ А через D = {de }Y= :1 обозначим множество всех различных векторов d, каждый из которых ортогонален каким-либо n — 1 линейно независимым векторам fßa £ F:
, d) = 0, a = 1,..., n — 1, rank {f^ }£=1 = n — 1 (3.16)
и ||d|| = 1, причем из двух векторов d и — d, удовлетворяющих этим условиям, в D включаем только один8. Тогда внутренние для множества (3.15) оценки можно построить в виде (3.14) при v = £k=i P(j) и любой V £ MnXn, где A и b определяются представлением Q в
виде Q = {x : ±(x,de) < Ек= p(±de |P(j)), de £ D, в = 1,..., Y}.
Упомянем некоторые возможные способы вычисления центра v оценки p- у (Q) в общем случае (3.11). Во-первых, в качестве центра можно брать, например, решения некоторых известных оптимизационных задач, используемых в математическом программировании для нахождения внутренних точек множеств. Во-вторых, эту точку можно искать из условия максимума объема нашей оценки: v £ Argmax {vol p- v(Q)| x £ Q}. В-третьих,
7Для нахождения V* использовано [15] решение V0 некоторой оптимизационной задачи, полученной путем "упрощения" задачи максимизации объема Р(V, V, V) при условиях (3.12), (3.13)
8Заметим, что условиям (3.16) удовлетворяет векторное произведение п — 1 векторов {/}^=1 [см. 20, с. 65-67]: d = [/М1 /М2 • • • ] = det{/М1 • • • /Мп-1 е}, где компоненты последнего столбца е — это базисные векторы в®, г = 1,. .., п.
если ищем пересечение Q = P Р| Е параллелепипеда с одной гиперполосой, то точку из Q всегда можно найти с помощью некоторых явных формул, приведенных ниже.
Конкретизируем построение внутренних оценок (3.14) для пересечения параллелепипеда и полосы. Здесь полезно иметь в виду связь между параллелепипедами и полосами.
Если m = n, то полоса S = S(c, S, а, m) есть параллелепипед P = P(p, P, п) с параметрами P = ST-1diag {||ST-V||-1}, p = Pdiag {(eiTSTPe*)-1} c, п = diag {(eiTSTPe*)-1} а. Обратно, параллелепипед P есть полоса S спараметрами m=n, S=PT 1diag {||eiT P-1||-1}, c = S Tp, а = STPn. Иначе говоря, P = {x £ Rra| x = p + Pdiag па, Abs а < e} = {x| Abs (P-1(x - p)) < п}.
Пусть Q = P(1) P| S(2) — это пересечение параллелепипеда P(1)=P(p(1), P(1), п(1)) и полосы S(2)=S(c(2), S(2), а(2), m2), причем найдено описанное выше представление параллелепипеда P(1) в виде полосы S(1) = S(c(1), S(1), а(1), n). При фиксированных v £ Q и V £ МПхп можно найти внутреннюю для Q оценку p- V (Q) вида (3.14), где A = {aj} £ ]Rrax(ra+m2) и b £ ]Rn+m2 определяются формулами (3.13), выписанными для n + m2 полос. Имеем
Q = U{p-, V(Q)l v = p(1) + AP(1)diagп(1) С, С £ dP(0,1, e),
A-(£)<A<A+(£)}, W £ MTn. (3.17)
Здесь объединение берется по всем v = v(£,A), которые параметризованы с помощью векторного параметра £, пробегающего границу единичного куба, и скалярного параметра A, стесненного указанными ограничениями, где
A (£) = max{-1, шах min{Ci ,С+}}, A+(£) = min{1, mm max{Ci ,Zi+}}
1—г—m2 1—г—m.2
— iЛ2) T^(1) ^ ^(2Ь
Z± = (c(2) - (s(2)i)Tp(1) ± ai(2))/(s(2)'i)TP(1)diagп(1)£.
Объединение в (3.17) можно дополнить варьированием VЕМПХП. Если для £ E dP(0,1, e)
A-(£) < A+ (О, (3.18)
то p"v(Q) - параллелепипед VAe(A-(£), A+(£)). Если же A-(£)>A+(£), то p"v(Q)=0.
Для случая, когда S(2) — это гиперполоса, несложно указать такие v, что v Е int Q, и, значит, могут быть построены заведомо непустые параллелепипеды p- v(Q). А именно, пусть Q = Pf] Е0 — это пересечение параллелепипеда P = P (p,P,n) и гиперполосы Е° = S(c(0), S(0), a(0), 1), причем int Q = 0. Если p Е int Q, т. е. C0 - a < s0Tp < C0 + 00, то при любом £ Е dP(0,I,e) имеем (3.18), где
A-(£) = max{-1, 0-}, A+(£) = min{1, 0+},
0- = min{Z-,Z+}, 0+ = max{Z-,Z+}, (3.19)
Z± = (c0 - s0Tp ± a0)/(n£), П = s0TPdiag п, и справедливы включения
v = v(£,A) = p + AP diag п£ E int Q VA E (A-(£),A+(£)). (3.20)
Если p / int Q, а £* — вектор с компонентами
{-sign пг, если пг = 0 и s0Tp > c0 + a0,
sign пг, если пг = 0 и s0Tp < c0 - a0, , i = ^ ... , n (3.21)
Е [-1,1], если пг = 0,
то для £ = £* опять имеем (3.18), (3.20).
4. Внешние полиэдральные оценки множеств достижимости
Теорема 4.1. Пусть X[к] — множества достижимости системы (1.1)-(1.4). Если
Р0+[к] = р++м(А[к]Р0+ [к—1]+ «[к]); Р0+[0] = р++[0](Х0);
, ~ (4.1)
Р + [к] = в [к]р++[к](в [к—1]-1А[к]Р + [к—1] и В МОД); ; Р +[0] = {0},
то
X[к] СР +[к]= Р0+[к] + Р+[к], к = 0,...,Ж, (4.2)
каковы бы ни были матрицы ориентации Р +[к] € М"хп, к = 0,... , N. Если Р € М"хп — произвольная матрица и
Р +[к] = А [к] Р + [к—1], к = 1,..., N Р+[0] = Р, (4.3)
то Р +[к] являются внешними касающимися оценками для X [к] и
X[к] = р|{Р +[к]| Р € МПхп}, к = 1,..., N. (4.4)
Доказательство. Множества Р + [к] являются параллелепипедами, так как Р0+[к] и Р +[к] имеют одинаковые матрицы ориентации Р +[к]. Включения (4.2) получаются сопоставлением формул (2.1)-(2.3) и (4.1). Свойство Р +[к] быть касающимися для [к], т.е.
р(±(Р+[к]-1)тег|Р +[к]) = р(±(Р+[к]-1)тег|Лр[к]), г =1,...,п, к =1,...,N, (4.5)
докажем индукцией по к. При к = 0 равенства выполняются. Пусть они справедливы при к — 1. Учитывая формулы (4.1), свойство оценок р+ (2) быть касающимися для <2, соотношения (2.3), (3.7), (4.3) и предположение индукции, можно записать цепочку равенств
р(±(Р+[к]-1)тег|Р + [к]) = р(±(Р+[к]-1)тег|в[к](в[к— 1]-1А[к]Р +[к—1] и В[ВДк])) = = в [к] тах{р(±(Р+[к—1]-1)твг|в [к—1]-1 Р +[к— 1]), р(±(Р+[к]-1)твг|В[ВДк])} =
= в [к] тах{р(±(Р +[к—1]-1)твг|в [к—1]-1Лр[к—1]),р(±(Р+[к]-1)т вг|В [ВДк])} =
= р(±(Р +[к]-1 )твг|;р[к]).
Соотношения (4.5) доказаны. Поскольку оценки Р0+[к] являются касающимися для X0[к] [12], то оценки Р +[к] оказываются касающимися для X[к]. Это свойство вместе с варьированием Р € МПхп обеспечивает (4.4). □ Опишем параллелепипедозначные оценки МД систем с фазовыми ограничениями. Пользуясь теоремой 2.2 и свойствами оценок для МД систем без фазовых ограничений (см. [12] по поводу систем с геометрическими ограничениями и теорему 4.1), заключаем, что справедлива
Теорема 4.2. Пусть X[к] — МД системы (1.1)-(1.5), где У[?']€ сопуЕ", и все X[к] = 0, к = 1,... , N. Если параллелепипеды Р +[к] и Р +[к], к = 1,... , N, построены по формулам
Р +[к] = р++[к](Т [к]А[к]Р[к—1] + (I — Т [к]) У [к] + Т [к]«[к]), Р +[0] = Р++[0^X0),
(4.6)
Р +[к] = в[к]р++[к](Т[к](в[к—1]-1А[к]Р +[к—1] и В[ВДк])), Р+[0] = р++[0]({0}),
то
X[к] С Р + [к] = Р + [к] + Р + [к], (4.7)
каковы бы ни были Т [к] € М"0х", к = 1,... , N, Р+[к] € М"х", к = 0,... , N. Если
Р+ [к] = Т[к]А[к]Р +[к-1], к =1,...,N, Р+[0] = Р € М"х", (4.8)
то Р + [к] и Р + [к] оказываются внешними касающимися оценками для множеств ¿[к]
и ¿[к], описанных в теореме 2.2, и X[к]= Р| (П(Р + [к] | (4.8)}}, где пересечение по Т[•] —
т[•] р
такое же, как и в теореме 2.2.
Если Хо, Я[к], У [к] — параллелепипеды, то все операции в рекуррентных формулах в теоремах 4.1, 4.2 производятся по явным формулам из разд. 3.
5. Внутренние оценки множеств достижимости
Рассмотрим сначала внутренние оценки МД систем без фазовых ограничений.
Теорема 5.1. Пусть X[к] — множество достижимости системы (1.1)-(1.4), (1.6), (1.9), (1.10). Пусть Л,[з], з = 1,...,к, — произвольные числа, удовлетворяющие (2.12), Л, Г(1)[з] и Г(2)[з] — произвольные матрицы, удовлетворяющие условиям
Л, Г(1)[з ] €£гахга, Г(2)[з] €£гх", з = 1,...,к, (5.1)
и параллелотопы Р- [з] построены по формулам
Р-[з]=р-(1)[Л р(2)Ь1(А[з]Р-[з-1]+Мз]в[з]Я[з])+Ф]; з=1,..., к; Р-[0] = р-(Х0). (5.2)
Тогда имеет место включение
Р-[к] СХ[к] (5.3)
и справедливо точное представление
X[к] = У{Р-[к]| &[•], Л, Г(2)Н подчинены (2.12), (5.1), Г(1)[з] = I}. (5.4)
Если в [к] = в ив (2.12), (5.1) к заменено на N, то (5.3), (5.4) верны при к = 1,... , N.
Доказательство. Включение (5.3) следует из теоремы 2.3, известных рекуррентных соотношений для X(к; ^[-]) и леммы 3.1. Теорема 2.3 обеспечивает равенство (2.15). А при каждом фиксированном справедливо представление X(к; ^[-]) = иР-[к], где Р-[к] построены по формулам (5.2), а объединение берется по указанным в (5.4) параметрам (это проверяется аналогично случаю систем с непрерывным временем [14]). □
Если
К[з] = К, з = 1,..., к, (5.5)
то в семействе оценок Р- [к] вида (5.2) имеются тугие. Действительно, зафиксируем / € К"". Пусть Т
1[з] = А[з]-1Т/[з-1], з = 1,..., к, /[0] = /. (5.6)
Тогда с учетом (2.1), (2.6), (2.8) и вида Ф[к,з] и Ф[к,з] имеем
к
р(/[к] IX [к]) = рда) + £ /[з'ГФ] + в [к] шах р(/[з ]|В[з ]Р[з ]).
—' 1<7<к
7=1 <
При Г(1) [j] = I, Л = I формулы (5.2) дают
к
p-[k] = Ф[к, 0]ро + ]h[j]r[j] + j]v[j]),
j=1
к
P-[k] = Ф[к, 0]Po + ^ №]r(2)[j],
j=i
откуда при условии (5.5), означающем, что r[j] = 0, R[j] = I, имеем
кк p(/[k]|P-[k]) = /Tp + £ / j]Tv[j] + Abs (/tPo + £ h[j]/[j]TB[j]Г(2)[j])e.
j=i j=i
Максимизируя полученное выражение сначала по Г(2)[-] (аналогично лемме 3.1 и следствию 3.1), а затем по h[-] и сравнивая результат со значением p(/[k]|X[k]), получаем
Следствие 5.1. Пусть X[k] - МД системы (1.1)-(1.4), (1.6), где K[j] = IRr. Пусть задан вектор / G IRn и /[j] находятся из (5.6). Если условиях теоремы 5.1 имеем Л = I, r(1)[j] = I, r(2)[j] построены в соответствии с (3.6), где следует брать c(1) = P0T/, c(2) = B[j]T/[j], а удовлетворяет (2.12), причем h[j] = 0, j=1,...,k, j / J[k], где J[k] = Argmax 1<j<kAbs (/[j]TB[j])e, то оценка P- [k] является тугой для X[k] (в направлении /[k]). Если в[k] = в, j* — наименьший элемент J[k] и j* < k, а h[j*]=e, h[j]=0, j=1,..., k, j =j*, то при всех j: j* < j < k оценки P- [j] являются тугими для X[j] (в направлении /[j]).
Рассмотрим теперь системы с фазовыми ограничениями. Из теоремы 2.3 и результатов [15] следуют
Теорема 5.2. Пусть X [k], k = 1,...,N, — МД системы (1.1)-(1.6), (1.8). Пусть
р-[j ] = р (mb1)-j ], j = i,...,k, P -[0] = Xo,
P(0)-[j] = P-(i)у])Г(2) j](A[j] P-[j-1] + h[j]B[j]R[j]) + v[j],
(р(i-1)-[j], если P(i-1)-[j] CZ(i)[j], а иначе (5.7)
P(i)-j]=S - (i) •
Q(i)[j] = P(i-1)-[j] П Z(i)[j], i = 1,... ,mj],
m[j] = 1, Z(1)[j] = Y[j], либо m[j] = m[j], Z(i)[j] = ].
Здесь все матрицы T(1)[j] G Gnxn, T(2)[j] G Grxn, P(i)-[j] G МПхп, P(i)-[j] — произвольные векторы, принадлежащие Q(i)[j], h[j] — числа, удовлетворяющие (2.12). Если в процессе пост/роения оказывается, что Q(i)[j] = 0, i = 1,... ,m[j], j = 1,... , k, то имеют место включения (5.3) и справедливо точное представление (1.12), где объединение взято по всевозможным значениям упомянутых параметров. Если e[k] = в ив (2.12) k заменено на N, то соотношения (5.3), (1.12) справедливы при всех k = 1,... , N.
Теорема 5.3. Утверждения теоремы 5.2 остаются верными, если в (5.7) формулы для P(0)-[j] заменить следующими:
P (0)-[j ] = P;(0)-b1)P (0)-b.](A[j ] P -[j-1] + h[j ]B [j]R[j ]) + v[j ], p(0)-[j] = A[j ]p-[j-1] + h[j ]B[j ]r[j ],
где P (0)-[j ] G МПхп — произвольные матрицы (j = 0,...,k); r[j ] и p-[j ] — центры параллелепипедов R[j] и P- [j].
Заметим, однако, что при неудачном выборе параметров Г(^[-], р(^)-[^], Р()-Н в теоремах 5.2 и 5.3 не исключается случай, когда начиная с некоторого шага могут получиться пустые множества Р-[з], а брать объединения по всевозможным р(г)-[з]€2(г)[з] не очень конструктивно.
В одном частном случае системы с фазовыми ограничениями внутренними оценками для X [к] служат также множества, описанные в следующей лемме.
Лемма 5.1. Пусть X [к] — МД системы (1.1)-(1.5), причем в [к] = в, X0 = — одноточечное множество и точки х°[к] = X0[к], вычисленные по формулам (2.2), удовлетворяют фазовым ограничениям:
x0[k] GY [k], k = 1,... , N.
(5.8)
Пусть множества X [k] построены по формулам
X[k] = (co {A[k]X[k-1] и вв[k]R[k]}) П (Y[k] - x0 Тогда
k = 1,... , N, X[0] = {0}. (5.9)
x0[k] + X[k] CX[k], k = 1,..., N. (5.10)
Доказательство. Проверим с помощью математической индукции неравенства
P(1|X[j]) < 1 inf JE P(AY |Y[y] - x0[y]) +
A1,...,AjeR" 7=1
+e max {р(Ф[з, y]t1 - E Ф[а, y]ta° |R[y])}},
1<Y<?
a=Y
p(1|x0[j] + X[j]) < p(1|X[j]) V/ G IRn, з = 1,..., N. Из формулы инфимальной конволюции из (5.9) вытекает, что
p(/|X[k]) = inf {p(Ak | Y[k] - x0[k])+
Ak eR"
+ max{p(A[k]T(/ - Ak)|X[k-1]),вр(/ - Ak|B[k]R[k])}}.
(5.11)
(5.12)
(5.13)
Сравнивая (5.13) с выражением для p(/|X[k]) из леммы 2.1, замечаем, что при j = 1 соотношения (5.11), (5.12) выполнены со знаком равенства. Предположим, что (5.11) выполнены для j = 1,... , k-1, и докажем для j = k.
Используя в правой части (5.13) неравенство (5.11) при j = k - 1, меняя местами операции max и inf по A1,... , Ak-1 (что допустимо в силу леммы П.3), учитывая равенства A[k^[k - 1, y] = ^[k,Y], а затем используя неравенства типа max{a,b + c} < b + max{a,c}, справедливые Vb > 0, взяв в качестве b выражение ЕY=1 p(AY | Y[y] - x0[y]) (оно неотрицательно в силу (5.8)), можно убедиться, что (5.11) верно и при j = k.
Оценивая p(/|x0[k] + X[k]) сверху с учетом (5.11) и (2.6) и сравнивая с выражением для p(/|X[k]) из леммы 2.1, несложно заметить, что для доказательства (5.10) достаточно проверить равенство p1 = p2, где p1 = sup{eY=:l(p[y],«[y])| eY=:l iny]iu < в,«М G k[y]} и p2 = вmax1<7<fcp(^[y]|r[y]), p[y] = ^[k,Y]TZ - ^[a,Y]TA[a]. Желаемое равенство
p1 = p2 вытекает из леммы П.1, если положить в ней = diag^[j], = K[j] и рассмотреть значения опорной функции множеств Q = Q на векторе е. □
6. Примеры
Приведем примеры оценок МД для многошаговых систем (1.1)-(1.4), (1.6), (1.9), (1.10), специального вида (полученных дискретизацией систем с непрерывным временем), в которых
АЦ ] = I + Нм А, Нм = вЫ-1, В и ] = В, V и ] = 0, в [к] = в.
Пример 6.1. Пусть А = " п , В = 0 , Ро = (-0.5, 0)т, Р0 = I, по = (0.5, 0.5)т,
—8 0 1
в = 2, К[7] = И1 (т.е. г[7] = 0, Я[з] = 1, р[7] = 1), в = 2, N = 200. На рис. 1, а показаны множество Х0 (штриховая линия) и внешние оценки Р + [Ы] для X [Ы], построенные в соответствии с теоремой 4.1 при Р + [0] = Р0, и шести других случайным образом выбранных матрицах Р + [0]; на рис. 1, б представлена динамика во времени внешних для X[к] оценок Р + [к], соответствующих Р + [0] = Р0 (Р + [к] изображены через каждые три шага к). На рис. 1, в кроме множества Х0 (штриховая линия) и внешних оценок Р + [Ы] (тонкие линии), представленных ранее на рис. 1, а, изображены тугие внутренние для X[Ы] оценки Р-[Ы] (жирные линии), построенные в соответствии со следствием 5.1 для и^ = 9
а
в
г
Рис. 1. Внешние и внутренние оценки множеств достижимости в примере 6.1.
Рис. 2. Внешние и внутренние оценки для множества достижимости X[Ж] в примере 6.2: а — случай К\)] = И1; б — случай ] = [0, те).
значений вектора l:
l = lг = (cos рг, sin рг)т, pi = (i — 1)п/и^, i = 1,..., n^. (6.1)
На рис. 1, г показана динамика во времени внутренних для X[k] оценок P- [k], определяемых вектором l = .
0 1 , а B, X0 = P(p0, Po, п0), в, ^ и N — такие же, как в
Пример 6.2. Пусть A =
0 0
примере 6.1. И пусть либо опять ] = К1 (случай 1), либо К^] = [0, те), т.е. г] = 0.5, ] = 1, р[]] = 0.5 (случай 2). Первому случаю соответствует рис. 2, а, он аналогичен рис. 1, в и представляет для множества X[Щ] несколько внешних Р + [Щ] и несколько тугих внутренних Р- [Щ] оценок, построенных для п^ = 6 векторов I вида (6.1). Второму случаю соответствует рис. 2, б. Тонкими линиями показаны внешние для X[Щ] оценки Р + [Щ]. Жирными линиями показаны несколько внутренних для X [Щ] оценок Р- [Щ], построенных в соответствии с теоремой 5.1 при Н[]] = в/Щ и нескольких других случайным образом выбранных значениях Н[^], удовлетворяющих (2.12); параметры Л = I, Г(1) ^] = I, Г(2) []] Е 0гхп вычислялись аналогично [15, формула (47)].
Автор выражает глубокую признательность академику А.Б. Куржанскому за внимание к работе, обсуждение результатов и замечания.
Приложение. Вспомогательные утверждения
Лемма П.1. Если Л3 Е Кпхг, К3 — выпуклые конусы в Кг, то множества
к к
Q = {х| х = ^ Л?и3; \\и3< в; и3 ЕК3= 1,..., к} (П.1)
3=1 3=1
и 2 = в со Ш к=1 Л3 (С ПК3)} совпадают (С — куб из (1.9)).
Доказательство. Пусть х Е 22. Несложно заметить, что это обеспечивает существование таких а? > 0 и и3 ЕС ПК3, ] = 1,... ,к, что
k k
x = aajwj, a = L (п.2)
j=i j=i
Вводя векторы wj = ва^wj, j = 1,... , k, видим, что x = Ek=i Ajwj, причем из принадлежности wj конусу Kj следует, что и wj 6 , а из неравенства ||wj || < 1 и свойств {aj} вытекает, что У]k=1 ||wj< в. Таким образом, x 6 Q.
Обратно, пусть x 6 Q, т. е. для x имеет место указанное в (П.1) представление. Рассмотрим три возможных случая значений y = Еk=1 ||wj Пусть 7 = в. Тогда можно записать x в виде (П.2), где aj = e-1|wj> 0, а wj = 0, если ||wj= 0, и wj = wj/||wjв противном случае. При этом получается, что ||wj < 1, wj 6 , т. е. x 6 Q. Пусть 7 = 0. Тогда wj = 0, j = 1, • • •, k, и точка x = 0 6 <2, поскольку представима в виде (П.2), где все wj = 0 6 C П Kj. Пусть 0 < y < в. Вводя wj = kwj, где k = в/т > 1, замечаем, что точка x = Еk=1 Ajwj 6 Q, для нее выполнены условия первого из рассматриваемых случаев и, значит, x 6 22. Ввиду выпуклости 22 получаем, что и x = k-1 x + (1 — k-1)0 6 22. □
Лемма П.2. Если X, Yj С IRra, j = 1,...,k, и X выпукло, то множества 21 = X + со Uk=1 и 22 = со Uk=1(X + ) совпадают.
Доказательство. Если x 6 221, то справедливо представление x = a + ЕN=1 a^x* = a*(a + x*), где a6X, a*>0, EN=1 a*=1, x* содержится в каком-нибудь из Yj, j = j(i) 6 {1, • • • , k} (i=1, • • • , N). Поскольку a+x* 6 X+Yj С U*U(X+Yj), то x622. Значит, 21cg2.
Если x 6 Uk=1(X + ), то найдется такое j 6 {1, • • •, k}, что x 6 X+Yj С X+ Uk=1 Yj С X + со Uk=1 Yj. Значит, Uk=1(X + ) С X + со U. Взяв выпуклую оболочку обеих частей этого включения и учитывая выпуклость X, имеем 22Ссо (X+со Uk=1 Yj)=21. □
Лемма П.3. Пусть c — некоторое число, а f (x) — функция, определенная на множестве X. Тогда числа M1 = max{c, inf f (x)} и M2 = inf max{c, f (x)} совпадают.
Доказательство. Разобьем X на две части: X = X1 U X2, где f (x) < c при x 6 X1 и
f (x) > c при x 6 X2. Обозначим inf =a1<c, inf =a2>c. Тогда M1 = max{c, min inf f (x)} JK J~ xex 1 1 xex2 1 L ¿=1,2xex* n
и, значит, M1 = max{c, a1}=c, если X1 = 0, и M1= max{c, a2}=a2, если X1 = 0. А M2 = min inf ^(x), где ^(x)=max{c, f (x)}, причем ^(x) = c, если x6X1, и ^(x)=f (x)>a2>c,
¿=1,2 x€X*
если x6X2. Поэтому M2=min{c, a2}=c, если X 1=0, и M2=a2, если
X 1=0. Имеем M1=M2. □
Список литературы
[1] КуржАнский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[2] Kurzhanski A.B., VAlyi I. Ellipsoidal Calculus for Estimation and Control. Boston: Birkhauser, 1997.
[3] КуржАнский А.Б., ФилиппОВА Т.Ф. Об описании пучка выживающих траекторий управляемой системы // Дифференц. уравнения. 1987. Т. 23, № 8. С. 1303-1315.
[4] КАЦ И.Я., КуржАнский А.Б. Минимаксная многошаговая фильтрация в статистически неопределенных ситуациях // Автоматика и телемеханика. 1978. № 11. С. 79-87.
[5] КОЩЕЕВ А.С., КУРЖАНСКИЙ А.Б. Адаптивное оценивание эволюции многошаговых систем в условиях неопределенности // Изв. АН СССР. Техн. кибернетика. 1983. № 2. С. 72-93.
[6] BuSHENKOV V., Chernykh O., Kamenev G., Lotov A. Multi-dimensional images given by mappings: construction and visualization // Pattern Recognition and Image Anal. 1995. Vol. 5. No. 1. P. 35-56.
[7] ГУСЕЙНОВ Х.Г., Незнахин А.А., Ушаков В.Н. Приближенное построение множеств достижимости с интегральными ограничениями на управление // Прикл. математика и механика. 1999. Т. 63, Вып. 4. С. 580-590.
[8] REVENKO V.V., SESEKIN A.N., STEPHANOVA A.V. Attainability Sets of Dynamic Systems With Impulse Control. Preprints of the Eleventh IFAC Intern. Workshop "Control Applications of Optimization", July 3-6, 2000, St.-Petersburg. State Univ., 2000. Vol. 2. P. 172-176.
[9] KOSTOUSOVA E.K., KURZHANSKI A.B. Theoretical framework and approximation techniques for parallel computation in set-membership state estimation / CESA'96 IMACS Multiconf. Comp. Eng. in Systems Appl., Lille, France, July 9-12, 1996 // Proc. Symp. on Modelling, Anal. and Simul. Vol. 2. P. 849-854.
[10] KURZHANSKI A.B., Varaiya P. On ellipsoidal techniques for reachability analysis. Pt I: External approximations // Optimization Methods & Software. 2002. Vol. 17, No. 2. P. 177-206.
[11] KURZHANSKI A.B., VARAIYA P. On ellipsoidal techniques for reachability analysis. Pt II: Internal approximations. Box-valued constraints // Ibid. P. 207-237.
[12] KOSTOUSOVA E.K. State estimation for dynamic systems via parallelotopes: optimization and parallel computations // Optimization Methods & Software. 1998. Vol. 9, No. 4. P. 269-306.
[13] KOSTOUSOVA E.K. Control synthesis via parallelotopes: optimization and parallel computations // Optimization Methods & Software. 2001. Vol. 14, No. 4. P. 267-310.
[14] КОСТОУСОВА Е.К. Внешнее и внутреннее оценивание областей достижимости при помощи параллелотопов // Вычисл. технологии. 1998. Т. 3, № 2. С. 11-20.
[15] КОСТОУСОВА Е.К. О внутренних полиэдральных оценках множеств достижимости линейных систем с фазовыми ограничениями / / Алгоритмы и программные средства параллельных вычислений. Екатеринбург: УрО РАН, 2001. Вып.5. С.167-187.
[16] Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. Новосибирск: Наука, 1986.
[17] ДАРЬИН А.Н., КУРЖАНСКИЙ А.Б. Нелинейный синтез при двойных ограничениях // Дифференц. уравнения. 2001. Т. 37, № 11. С. 1476-1484.
[18] Сиротин А.Н., ФОРМАЛЬСКИЙ А.М. Области достижимости и управляемости линейных дискретных систем // Изв. РАН. Теория и системы управления. 2002. № 4. С. 5-16.
[19] ПШЕНИЧНЫЙ Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980.
[20] РОЗЕНФЕЛЬД Б.А. Многомерные пространства. М.: Наука, 1966.
Поступила в редакцию 7 апреля 2003 г.