УДК 517.977.1
H. В. Стрелковский1
ПОСТРОЕНИЕ СТРАТЕГИИ ГАРАНТИРОВАННОГО ПОЗИЦИОННОГО НАВЕДЕНИЯ ДЛЯ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ*
В работе рассматривается развитие разработанного Ю. С. Осиповым и А. В. Кря-жимским метода пакетов программ для задачи гарантированного позиционного наведения на выпуклое и замкнутое целевое множество в заданный момент времени для линейной управляемой системы. Наблюдаемый сигнал о состояниях системы линеен, множество ее допустимых начальных состояний предполагается конечным. С использованием утверждения об эквивалентности задач гарантированного позиционного наведения, пакетного наведения и расширенного программного наведения в работе конструктивно описан алгоритм построения наводящего пакета программ и соответствующей ему наводящей позиционной стратегии.
Ключевые слова: управление, неполная информация, линейные системы.
I. Введение. Настоящая работа находится в рамках теории позиционного управления, развитой школой H.H. Красовского [1-4], и посвящена развитию метода пакетов программ [5-7] — инструмента анализа задач гарантирующего позиционного управления в условиях неполной информации о состояниях управляемой системы. В основе метода — утверждение об эквивалентности задач гарантирующего управления в классе позиционных стратегий и в классе пакетов программ. Пакет программ — это семейство программных управлений, параметризованное допустимыми начальными состояниями и обладающее свойством неупреждаемости по отношению к реализациям сигнала о наблюдаемых состояниях.
В данной работе выделяется случай, когда задача об управлении в классе пакетов программ эквивалентна задаче о программном управлении. Случай характеризуется линейностью управляемой системы, линейностью наблюдаемого сигнала и конечностью множества допустимых начальных состояний системы. Для определенности рассматривается задача о гарантированном наведении системы на выпуклое и замкнутое целевое множество в фиксированный момент времени.
С помощью метода сжатия мгновенного ресурса управления и теоремы об отделимости выпуклых множеств в работе конструктивно описывается метод построения наводящего пакета программ в случае выполнения критерия разрешимости задачи пакетного наведения и соответствующей ему наводящей позиционной стратегии, конструируемой управляющей стороной по наблюдаемому сигналу о состояниях системы.
2. Задача гарантированного позиционного наведения с неполной информацией. Рассмотрим управляемую линейную динамическую систему, описываемую обыкновенным дифференциальным уравнением
x(t) = A(t)x(t) + B(t)u(t) + c(t), (1)
где t — время, меняющееся на ограниченном отрезке [¿о,1!?] ненулевой длины, ¿о < $ < оо; x(t) G Шп — состояние системы в момент t, u(t) G К™ — значение управляющего вектора в этот момент. Функции А(-), В(-), с(-), определенные и непрерывные на отрезке [¿о,$], принимают значения в нормированных пространствах матриц размерностей n х п, я х m и в 1™ соответственно. Будем предполагать, что управляющей стороне априори известно, что истинное начальное состояние системы находится в заданном конечном множестве XQ С Кп, которое будем называть множеством допустимых начальных состояний, но само истинное начальное состояние системы не известно. Под программным управлением (программой) будем понимать всякую измеримую по Лебегу функцию и(-): [¿0,$] —> Р, где мгновенный ресурс управления Р С Шт — выпуклый
1 Факультет ВМК МГУ, асп.; IIASA, Лаксенбург, Австрия, e-mail: strelkonQiiasa.ac.at
* Работа поддержана РНФ, проект 14-11-00539.
компакт. Множество всех программных управлений обозначим 14. Для всякого допустимого начального состояния жо € Ха и программы и(-) € 14 решение (по Каратеодори) обыкновенного дифференциального уравнения (1), определенное на отрезке [¿о,??] и удовлетворяющее начальному условию ж (¿о) = жо, будем называть движением системы из начального состояния жо под действием программы и(-) и обозначать его ж(-|жо, «(•))•
Пусть задано выпуклое и замкнутое целевое множество Мс1",и для каждого ¿6 [¿о,Щ определена матрица-функция наблюдения (¿(1) размерности дхп, кусочно-непрерывная слева на отрезке
[иьЩ.
Перед управляющей стороной стоит задача гарантированного позиционного наведения в момент ■& — сформировать программное управление, приводящее состояние х(ч9) системы в конечный момент ч9 в заданную сколь угодно малую окрестность целевого множества М. В процессе движения управляющая сторона формирует свою программу позиционно, наблюдая в каждый момент времени £ € [¿о, 1?] текущий сигнал = (¿фх^) о состоянии системы х{Ь). В соответствии со стандартным формализмом, принятым в теории позиционного управления [1], позиционная стратегия управления с памятью позволяет управляющей стороне корректировать значения своей программы и(-) в заранее заданные моменты ¿0 < < • • • < = В каждый момент а^, = г,..., Д — 1, значения программного управления на полуинтервале £ € [ст^Сгч-1) выбираются в зависимости от предыстории £ у(1) наблюдения на отрезке [¿о,Сг] и предыстории £ и(1) управления на полуинтервале [¿о, (Тг).
В работе [6, теорема 2.1] установлено, что задача гарантированного позиционного наведения разрешима тогда и только тогда, когда разрешима задача пакетного наведения (в [6] последняя задача выступает как "точная идеализированная задача пакетного наведения"). Поэтому сосредоточимся на выводе условий разрешимости задачи пакетного наведения. Для описания пакетов программ будем использовать терминологию, введенную в работе [7].
3. Задача пакетного наведения. Рассмотрим однородную систему х(1) = А(1)х(1), соответствующую (1). По формуле Коши ее решение имеет вид х(1) = ¿о)жо, где •) — фундаментальная матрица, ¿о) = ехр^/ ¿¡^ . Для каждого жо € Ха через
9х 0(г) = С2(гММо)жо, ¿£[¿0,1?], (2)
обозначим функцию, которую будем называть однородным сигналом, соответствующим допустимому начальному состоянию жо. Однородный сигнал, соответствующий какому-либо допустимому начальному состоянию, будем называть просто однородным сигналом. Множество всех допустимых начальных состояний жо, соответствующих однородному сигналу д(-) до момента времени г € [¿о, 1?], обозначим Х0(т\д(-)). Таким образом, имеем
хо(т\з(-)) = {^0 € Ха : 5(')1[*о,г] =5хо(')1[*о,т]}-
Здесь и далее д(-)\^о т] — сужение однородного сигнала д(-) на [¿о, т], где г е [¿0,$].
Семейство (ижо('))х0ех0 программ будем называть пакетом программ, если оно удовлетворяет следующему условию неупреждаемости: для любого однородного сигнала д(-), любого момента г € (¿0,$] и допустимых начальных состояний х'0,х'0' € Х0(т|д(-)) при всех £ € [¿о,т) выполняется равенство их>о(1) = их^(1).
Пакет программ (их0('))х0ех0 будем называть наводящим, если для любого допустимого начального состояния жо € Ха движение ж(-), исходящее из жо, под действием программы иХо(-) в момент ■& приходит в целевое множество М: ж($|жо, иХо (•)) € М. Если существует наводящий пакет программ, говорим, что разрешима задача пакетного наведения.
Пусть О — множество всех однородных сигналов. Для произвольного однородного сигнала д(-) введем множество
ОоШ) = Ь(') е О : Ит {д{10 + А) - д{Ц + А)) = О
д-я-о
исходно совместимых с ним однородных сигналов и первый момент его расслоения
п(д(-)) = maxJr е [i0,i9] : max max \g(t) - g(t)\ = 0\.
{ g(-)£G0(g(-)) te[t0,r] J
Если Ti(g(-)) < $ и для какого-либо натурального i ^ 1 определена строго убывающая последовательность множеств однородных сигналов Go(g(-)) D ... D Gj_i(g(-)) и строго возрастающая последовательность моментов Ti(g(-)) < ... < Ti(g(-)) из [¿о,ч?) (моментов расслоения однородного сигнала д(-)), то определим множество
ОгШ) = {¿(О е Gi-гШ) ■ дИто (д(п(д(-)) + А) - д(п(д(-)) + А)) = о}
и момент (i + 1)-го расслоения однородного сигнала д(-)
П+1(д(-)) = тах.\т€(тг(д(-)),'д]: max max \g(t) - g(t)\ = 0 \.
Так как множество всех однородных сигналов G конечно, то для каждого однородного сигнала д(-) существует номер ^ 1, такой, что ткд{(д(-)) = Для каждого однородного сигнала д(-) € G введем множество всех моментов его расслоения Т(д(-)) = {тк(д(-)) : k = 1,..., и определим множество всех моментов расслоения для всех однородных сигналов Т = |J Т(д(-)).
д(-)ес
Представим Т в виде Т = {ti, ..., тк}, где Tj < г = 1,..., К — 1. Отметим, что тк =
Для каждого к = введем множество Х0(тк) = {Х0(тк\д(-)) : д(-) € G}, которое будем
называть кластерной позицией в момент тк. Элементы XQk множества Х0(тк) назовем кластерами начальных состояний в момент тк. Для каждого k = 1 ,...,К кластеры начальных состояний в момент тк образуют разбиение множества XQ всех допустимых начальных состояний, т. е. (см. [7, замечание 4])
Xq = У XQk, X[)k^X[lk = 0, Х'ок,ХЦк G Mnh X'Qk ф Х^к. хокех0(тк)
4. Расширенная задача программного наведения. Пусть Р — множество всех семейств («хо)хоеХо векторов из мгновенного ресурса управления Р. Всякую измеримую функцию £ (иХо(1))Хо£х0' [¿о, 1?] V будем называть расширенным программным управлением (расширенной программой) (измеримость функции понимается, как измеримость по Лебегу функции иХо(-): [¿о,1!?] Р для каждого жо € Х0). Будем отождествлять семейство программ (их0('))х0ех0 и расширенную программу г ^ (иХо(г))ХоеХо.
Для к = 1,...,К введем множество Рк всех семейств («х0)х0ех0 £ V, таких, что для всякого кластера Хок € Х0(тк) и произвольных начальных состояний х'0,хЦ € Хок выполняется равенство их'0 = их'0'- Расширенную программу (иЖо(•))х0ех0 будем называть допустимой, если для каждого к = 1 ,...,К выполняется (иЖо(¿))Ж0ех0 £ Рк при всех £ € (тк_1,тк] в случае к > 1 и при всех £ € [¿0;т1] в случае к = 1. Каждое множество Рк будем называть допустимым расширенным ресурсом управления на полуинтервале тк] в случае к > 1 и на отрезке [¿о, т\\ в случае к = 1.
Лемма 1 [7, лемма 3]. Расширенная программа (их0('))х0ех0 является пакетом программ тогда и только тогда, когда она допустима.
Для произвольного ] = 1,2,... определим расширенное пространство И? как конечномерное гильбертово пространство всех семейств векторов I = (1Х0)х0ех0 из Ж-? со скалярным произведением {•,•)■№ вида
= (Со'Со)' = (С0)х0ех0 € IV, I" = (1Х0)х0ех0 € IV.
ж0еХ0
Здесь и далее (•, •) — скалярное произведение в конечномерном евклидовом пространстве. Значения расширенных программ будем понимать как элементы Лт. Для произвольного непустого множества £ С IV, ] = ., введем его нижнюю р~(■]£): ^ н I и верхнюю р+(■]£): V) Ж опорные
функции:
р~{1\£) = Ы{1,е)Пз, Р+(Ц£) = sup(/,e)^j, leK?.
еее
Рассмотрим расширенную систему, которая состоит из экземпляров системы (1), параметризованных допустимыми начальными состояниями xq € Xq. Экземпляр системы, отвечающий параметру xq, исходит из начального состояния xq под действием программного управления иХо(-). Запишем расширенную систему в виде
%х0 (t) = A(t)xXo (t) + B(t)uXo (t) + c(t), XXo (t0) = XQ, Xq € Xq.
За фазовое пространство расширенной системы примем TZn и будем называть его расширенным фазовым пространством. Управление расширенной системой выбираем из класса всех допустимых расширенных программ. Для каждого допустимого расширенного программного управления («х0('))х0ех0 П°Д соответствующим ему движением расширенной системы будем понимать функцию t (x(t\xo, иХо (•))) у : Hq, 7tn, которую отождествляем с функциональным семейством
' Xq fcAo
(x(-\xQ,uXo(-)))xoeXo.
Расширенным целевым множеством назовем множество Л4 всех семейств (^x0)x0ex0 £ lZn, таких, что zXo € М для всех x,q € Xq. Будем говорить, что допустимая расширенная программа («х0('))х0ех0 является наводящей для расширенной системы, если соответствующее ей движение расширенной системы в момент i? принимает значение в расширенном целевом множестве: (ж($|жо, иХо (-)))Хоех0 G Будем говорить, что расширенная задача программного наведения разрешима, если существует допустимая расширенная программа, являющаяся наводящей для расширенной системы.
Лемма 2 [7, лемма 3]. Задача пакетного наведения разрешима тогда и только тогда, когда разрешима расширенная задача программного наведения. Допустимая расширенная программа является наводящим пакетом программ тогда и только тогда, когда она является наводящей для расширенной системы.
Исходя из лемм 1 и 2, в следующем разделе будем отождествлять допустимые расширенные программы и пакеты программ.
5. Метод поиска наводящего пакета программ. Обозначим через
А= {(x($\xQ,uXo(-)))Xoex0 ■■ (их0(-))х0ех0 еехШ},
множество достижимости расширенной системы в момент где ext U — множество всех допустимых расширенных программ. Введем функцию
7а(0хо)хо£Хо) = Е /( Е l*o> F(0> Ф(Т)) ds+
ХоЕХо /0 \Х0ех0 /Rn
к Тк
+ Е / Е Р~( Е BT(r)FT(^r)lXo\aP)dT^ Y, Р+(1*о\М). (3)
к=1ти-1 хок£Хо{ти) NkoGXoü ' xoGXo
В соответствии с результатами работы [7] отметим, что имеет место равенство
7l(0xo)xoeXo) = Р~ {(!хо)хо€Хо\А) - р+((1Хо)Хоех0\М).
Теорема 1 [7, теорема 2]. Каждая из трех задач: расширенная задача программного наведения, задача пакетного наведения и задача гарантированного позиционного наведения разрешима тогда и только тогда, когда
sup 7i(0xo)xoexo) < 0. (4)
(lx0)x0ex0ec
В формулировке теоремы С — произвольное множество в расширенном фазовом пространстве 1Zn, обладающее следующим свойством. Для произвольного семейства векторов (lX0)x0ex0 € G TV1', такого, что 1^х0|2 = существуют А и А, А ^ А > 0, такие, что (Asx0)x0ex0 £
х0ЕХ0
Назовем множество С множеством полного спектра.
Пакет программ (иЖо(-))жоеХо назовем нулевым, если и® (t) = 0, t G [¿о,i9], xq G Xq. Пусть критерий разрешимости (4) расширенной задачи программного наведения (а в силу теоремы 1 и задачи пакетного наведения) выполнен. Опишем метод построения наводящего пакета программ.
Лемма 3. Пусть выполнено условие (4) и нулевой пакет программ (Ux0('))x0ex0 не является наводящим для расширенной системы. Тогда существует a* G (0,1], такое, что
sup 1а*{(1хо)х0еХ0) = 0. (5)
(1х0)х0ех0еС
Доказательство. Для любого а ^ 0 нижняя опорная функция р~(-\аР) обладает свойством положительной однородности: р~(-\аР) = ар~(-\Р) (см., например, [8]). В силу свойств определенного интеграла и суммирования второе слагаемое в (3) линейно по а, поэтому функция 7(a) = sup 7a((lx0)x0ex0) непрерывна на отрезке [0,1]. Из (4) следует, что 7(1) ^ 0,
(¡■х0)х0ех0 ЕС
а так как нулевой пакет программ не является наводящим, то 7(0) > 0. Таким образом, по теореме Больцано-Коши [9] существует a* G (0,1], такое, что 7(0*) = 0, т.е. имеет место равенство (5).
Лемма 4 [8]. Из строгой выпуклости и компактности множества Р в пространстве Ж™ следует, что для произвольного а > 0 и произвольного ненулевого вектора I G Ж™ существует единственный вектор и* G аР, такой, что {1,и*) = р~(1\аР).
Для всякого пакета программ (иЖо(-))Жоех0! произвольного k = 1 ,...,К, произвольного кластера Xq}. G Х(т}.) и произвольного момента времени t G определим uxok(t) как общее значение программ иХо(-) в момент t для всех xq G
Теорема 2. Пусть множество Р — строго выпуклый компакт, 0 G intP, и для каждого т G [0,1?] матрица D(t) = ВТ{t)Ftт) имеет полный ранг. Пусть также выполняется условие (3) и вектор (1Хо)Хоех0 £ £ является максимизатором для (5). Пусть пакет программ (ижо ('))х0ех0 удовлетворяет условию и* (t) G а*Р, xq G Xq, t G [¿0,1?]), где a* — корень уравнения (5), и для каждого k = 1,..., К и всех кластеров Хак G выполняется равенство
(т Е l*xQ->u*xm(t)) = р~(т Е t^in-un)
XOEXqk XOEXQK
(6)
Если для любых к = 1,..., К и С Х(тк) верно ^ /* ф 0, то пакет программ (иХо(-))х0ех0
хо£Хок
является наводящим и определяется однозначно.
Доказательство. В силу предположений и леммы 3 имеем
7а*((СЬоехо) = 0. (7)
Из (3) и (5) следует, что
<(Со)*оехо,(я(0|яо,<о(-)))*оеХо> ~ Е Iм) = 7а*(0Жо)хоехо) = 0. (8)
ж0£Х0
Из (5) вытекает, что существует наводящий пакет программ («х0(-))хоех0! такой, что
иХо(1) С а* Р, хо£Ха. (9)
Рассмотрим произвольный пакет программ
(«х0('))х0ех0 Ф «0(-))х0ех0, (Ю)
удовлетворяющий (9). Покажем, что (их0('))х0ех0 не является наводящим для расширенной системы. Из этого будет следовать, что пакет программ (и*о(-))Жоех0 является наводящим для расширенной системы. Достаточно показать, что из (10) следует, что существует Хак С Х(т}.) и измеримое множество Е С ненулевой меры, такие, что
ихок{т)фь*Хш{т), т £ Е. (И)
Из предположения теоремы следует, что ^ /* ф 0, а из полноты ранга матрицы Т>{т)
хоЕХоь
вытекает, что 1?(т) ^ /* ф 0, г € Е. Из леммы 4 и условия (6) следует, что для любого
хоЕХоь
г б Е и*х к(т) является единственным минимизатором функционала и (Е(т) ^
на множестве аР. Таким образом, ввиду (11), ихок(т) для любого г € Е не минимизирует и (-О(т) 1Хо,и) на множестве а*Р, что эквивалентно неравенству
Хо£Х0к
(ад Е с«*о*о-))>р~(я(т) ^ гхо
Х0ех0к ' ^ xoGXoj;
XoGXoJ;
Из (4) очевидно вытекает, что
а*Р , т €Е.
к тк
Ф*х0)х0ЕХ0-, (x(é\xQ,UXo(-)))Xoex0) = Y^ / Е \D(T) Е
Xo(zxok
1?
/( E E E (c^WoW-
t *x0eX0 ' XoGXQ XOGXQ
E / E Eг
^ VoEXo ' fc=4-i ^О^ел-Ю 4 xo EX
В результате приходим к равенству (см. (3) и (7))
(OxoWxo, (ж(1?|ж0 ех0) — Е ^+!йо1м) > 7aW*Xo)x0ex0) = О,
а* Р I dr.
х0£Х0
из которого следует, что вектор (1Хо)х0ех0, являющийся максимизатором для (5), отделяет конечное состояние движения (ж($|жо, иХо (-)))х0ех0 от целевого множества М в расширенном фазовом пространстве 1Zn. Мы показали, что пакет программ (иЖо (-))жоеХо не является наводящим для расширенной системы. Теорема доказана.
6. Построение гарантирующего позиционного управления по наводящему пакету программ. Отправляясь от наводящего пакета программ (иХо(-))Хоех0, зададим некоторый позиционный способ управления системой (1), стартующей в момент í0 из, вообще говоря, неизвестного управляющей стороне истинного начального состояния xq G Xq. Отождествим себя с управляющей стороной. Отметим достаточно малое 8 > 0. До начала движения принимаем решение применять к системе произвольное управляющее тестовое воздействие их00 (t) G Р в каждый момент t G [ta, ¿o + S). В момент ta + 5 проделаем следующие действия: отметим некоторый момент ¿o G (to,to + 8) и рассмотрим значение у (¿o) = Q(to)x(to) сигнала (неоднородного!) об истинном состоянии ж (¿о) системы в этот момент. Заметим, что по формуле Коши имеем
t о t о
y(tü) = Q(iü)F(ia)xa + Q(ia) j F(Íq,t)B(t)uxoo(t) dr + Q(t0) j F($,t)c(t) dr.
to t o
Найдем вектор
t o t o
w(io) = y(io) - Q(t0) j F(Íq,t)B(t)uxoo(t) dr - Q(to) j F($,t)c(t) dr.
to to
Из определения однородного сигнала (2) ясно, что w(to) = Q(to)F(to,to)xo = 9x0(tо)- Так как до момента т\ G Т однородный сигнал дХо(-) не имеет моментов расслоения, мы установили, что xq G Хог^д^-)) = {xQ G XQ :
9xo (')l[to,Ti] ~~ 5áo(')l[to,Ti]}- Очевидно, что каждое множество *oi(ti|540(-)), Xq G Xq, является кластером из кластерной позиции X(ti). Следовательно, в каждый момент t G [ío + будем применять к системе управляющее воздействие ux01(Tl\Sd¡0(-))W' соответствующее кластеру XQi(Ti\g¿0(-)).
Аналогично для каждого момента разделения сигналов тк б Т, к = — 1, отметим
некоторый момент тк б (т^, г^ + <5) и найдем вектор
T¡¡ тк
w(h) = y(h) - Q(h) j F(Tk,r)B(T)Üo(s)dT^Q(fk) j F($, т)с(т) dr.
to t o
Очевидно, что w(fk) = Q(Tk)F(fk,to)xo = дХо(тк). Поскольку до момента rk+í однородный сигнал 9хо(') более не имеет моментов расслоения, то
хо G Ха(к+1)(тк+i|5xo(')) = {xq G Xq : 5x0 (') |[Í0)T;.+l] = 9x0 (•) |[t0)Tjk+i] }•
Итак, на отрезке [тк + 8, rk+i] применим к системе (1) управление их0(к+1)(Тк+1\щ;0 (•))№' соот~ ветствующее кластеру Xo(fc+i)(Tfc+i|(7£0(-)). В качестве пробного управления на отрезке (тк,тк + 5), к = — 1, используем управление, применявшееся на отрезке [тк-\ + 8, тк], а именно
u(t) = uXok(Tk\g¿0(.))(t), t € (тк,тк + 6), к = 1,..., К - 1.
Для унификации изложения последующего материала обозначим т0 = í0- Определим позиционную стратегию управляющей стороны (в рамках введенного в [1] формализма), как конечную
/ \К+1
последовательность S* = iak, Uk(yat¡ (•), uak (•))) , где
V / k=О
т°' k = í k = () ok = { + 8, l^k^K, Uk = lUXo, , , „ '
% kZK+1] \u*Xok,XQk=XQ(rk\gXo(-)), l^k^K.
Здесь uak(-) — сужение u(-) na [ta,ak) и y<jk(-) — сужение y(-) на [to,ak]. Заданную таким образом позиционную стратегию S* будем называть соответствующей пакету программ (и*о (-))х0ех0 ■
Будем называть позиционную стратегию S е-наводящей, если для любого е > 0 и xq G Xq движение х(-) в управляемом процессе под ее действием удовлетворяет условию x(t9) G [М}£, где [М)£ есть е-окрестность целевого множества М.
Лемма 5. Пусть задача пакетного наведения для системы (1) разрешима и х*(-) = = x(-\xq, uXq (•)) — движение, исходящее из допустимого начального состояния xq G Xq под действием программы и* (•) из наводящего пакета программ и*о (-)х0ех0 ■ Пусть х*{-) = = x(-\xq, ü* (•)) — движение в управляемом процессе (х* (•),у(-),й* (•)) с начальным состоянием xq под действием позиционной стратегии S*, соответствующей (и*о(-))Хо^х0, где и*(-) G U, y(t) = Q(t)x(t)i t G [¿о,1!?]. Пусть для каждого к = О,...,К выполнено ü*(t) = ü*(ak) = = Uk(yCrk(-),uCrk(-)), t G [ok,ok.|_i]. Тогда имеет место неравенство |£*(i?) — ж*(ч?)| ^ К8С, где С — неотрицательная постоянная.
Доказательство. По формуле Коши имеем
i?
x ($) = F($,tQ)xо + J F(i9,r)5(r)ü*0(r)dr + J r)c(r) dr,
t o t o
(ti) = F($,ta)xa + j F{ti,T)B{T)u*XQ{T)dT + J F($, r)c(r) dr.
x (v) =
t o t o
В силу построения позиционной стратегии 5* имеем йХа (¿) = иХа (¿), í С [тк + 8,тк+х], к = = 0,..., К — 1. Поэтому для разности х*(<д) — х*($) получим оценку
\х*(г9) - ж* (0)| =
к — 1 т"+6
Е / F(#,T)B(T)[ü*Xo(T)-U*Xo(T)]dr
k=0
£
rk
к — 1 tk+s к — 1 tk+s
/ imr)B(r)[ü;0(r)-<0(r)]|dr= Е / IF($,T)B(T)\-\ü*X0(T)^u*X0(r)\dT.
k=° í rk
Так как для любого г € верно неравенство т)В(т)\ ^ Н и мгновенный ресурс
управления Р ограничен, то |й* (г) — и*Хо (т) | ^ Ск, т € (тк,тк + 6), 0 ^ к ^ К — 1. Здесь II и ("•'/, — некоторые неотрицательные константы. Положим С* = тах Ск- Тогда будем иметь
Osü-ks^-K— 1 к— 1 к — 1 tk+ä
|ж*(??) -ж*(0)1 < Y1 [ HCkdT^Y^ [ HC*dt = K8HC*. k=о ;' fc=o l
Полагая С = НС*, получим утверждение леммы.
Теорема 3. Пусть задача пакетного наведения для системы (1) разрешима и для достаточно малого положительного 8 выполнено условие К8С ^ е, где С — некоторая положительная постоянная. Тогда позиционная стратегия S* = (о^, , соответствующая наводящему пакету программ, будет являться е-наводящей.
Доказательство теоремы с очевидностью вытекает из леммы 5.
СПИСОК ЛИТЕРАТУРЫ
1. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
2. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
3. Красовский H.H., Осипов Ю. С. Задача управления с неполной информацией // Механика твердого тела. 1973. № 4. С. 5-14.
4. КуржанскийА. Б. О синтезе управлений по результатам наблюдений // Прикл. матем. и механика. 2004. № 4. С. 547-563.
5. Осипов Ю. С. Пакеты программ: подход к решению задач позиционного управления с неполной информацией // Успехи матем. наук. 2006. 61. № 4. С. 25-76.
6. Кряжимский A.B., Осипов Ю.С. О разрешимости задач гарантирующего управления для частично наблюдаемых линейных динамических систем // Математическая теория управления и дифференциальные уравнения. Тр. МИАН. № 277. М.: МАИК: "Наука/Интерпериодика", 2012. С. 152-167.
7. Кряжимский А. В., Стрелковский Н. В. Программный критерий разрешимости задачи позиционного наведения с неполной информацией. Линейные управляемые системы // Тр. Ин-та матем. и мех. УрО РАН. 2014. 20. № 3. С. 132-147.
8. Киселёв Ю.Н., Аввакумов С.Н., Орлов М.В. Оптимальное управление. Линейная теория и приложения. М.: МАКС Пресс, 2007.
9. Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления. М.: Физматлит, 2001.
Поступила в редакцию 16.02.15
CONSTRUCTION OF A GUARANTEED CLOSED-LOOP GUIDANCE STRATEGY FOR A LINEAR CONTROL SYSTEM WITH INCOMPLETE INFORMATION
Strelkovskii N. V.
In this paper the method of open-loop control packages developed by Yu. S. Osipov and A. V. Kryazhimskiy is applied to the problem of guaranteed closed-loop guidance of a linear control system to a convex closed target set at a predefined time point. The observed signal is linear and the admissible initial states set is assumed to be finite. Using equivalence of the problem under consideration, the open-loop control package guidance problem and the problem of open-loop guidance of an extended linear control system to an extended convex target set, an algorithm of construction of the guiding open-loop control package and the corresponding closed-loop guiding strategy is described in this paper.
Keywords: control, incomplete information, linear systems.