Научная статья на тему 'Построение стратегии гарантированного позиционного наведения для линейной управляемой системы при неполной информации'

Построение стратегии гарантированного позиционного наведения для линейной управляемой системы при неполной информации Текст научной статьи по специальности «Математика»

CC BY
59
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНИЕ / CONTROL / НЕПОЛНАЯ ИНФОРМАЦИЯ / INCOMPLETE INFORMATION / ЛИНЕЙНЫЕ СИСТЕМЫ / LINEAR SYSTEMS

Аннотация научной статьи по математике, автор научной работы — Стрелковский Н. В.

В работе рассматривается развитие разработанного Ю.С. Осиповым и А.В. Кряжимским метода пакетов программ для задачи гарантированного позиционного наведения на выпуклое и замкнутое целевое множество в заданный момент времени для линейной управляемой системы. Наблюдаемый сигнал о состояниях системы линеен, множество ее допустимых начальных состояний предполагается конечным. С использованием утверждения об эквивалентности задач гарантированного позиционного наведения, пакетного наведения и расширенного программного наведения в работе конструктивно описан алгоритм построения наводящего пакета программ и соответствующей ему наводящей позиционной стратегии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Построение стратегии гарантированного позиционного наведения для линейной управляемой системы при неполной информации»

УДК 517.977.1

H. В. Стрелковский1

ПОСТРОЕНИЕ СТРАТЕГИИ ГАРАНТИРОВАННОГО ПОЗИЦИОННОГО НАВЕДЕНИЯ ДЛЯ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ*

В работе рассматривается развитие разработанного Ю. С. Осиповым и А. В. Кря-жимским метода пакетов программ для задачи гарантированного позиционного наведения на выпуклое и замкнутое целевое множество в заданный момент времени для линейной управляемой системы. Наблюдаемый сигнал о состояниях системы линеен, множество ее допустимых начальных состояний предполагается конечным. С использованием утверждения об эквивалентности задач гарантированного позиционного наведения, пакетного наведения и расширенного программного наведения в работе конструктивно описан алгоритм построения наводящего пакета программ и соответствующей ему наводящей позиционной стратегии.

Ключевые слова: управление, неполная информация, линейные системы.

I. Введение. Настоящая работа находится в рамках теории позиционного управления, развитой школой H.H. Красовского [1-4], и посвящена развитию метода пакетов программ [5-7] — инструмента анализа задач гарантирующего позиционного управления в условиях неполной информации о состояниях управляемой системы. В основе метода — утверждение об эквивалентности задач гарантирующего управления в классе позиционных стратегий и в классе пакетов программ. Пакет программ — это семейство программных управлений, параметризованное допустимыми начальными состояниями и обладающее свойством неупреждаемости по отношению к реализациям сигнала о наблюдаемых состояниях.

В данной работе выделяется случай, когда задача об управлении в классе пакетов программ эквивалентна задаче о программном управлении. Случай характеризуется линейностью управляемой системы, линейностью наблюдаемого сигнала и конечностью множества допустимых начальных состояний системы. Для определенности рассматривается задача о гарантированном наведении системы на выпуклое и замкнутое целевое множество в фиксированный момент времени.

С помощью метода сжатия мгновенного ресурса управления и теоремы об отделимости выпуклых множеств в работе конструктивно описывается метод построения наводящего пакета программ в случае выполнения критерия разрешимости задачи пакетного наведения и соответствующей ему наводящей позиционной стратегии, конструируемой управляющей стороной по наблюдаемому сигналу о состояниях системы.

2. Задача гарантированного позиционного наведения с неполной информацией. Рассмотрим управляемую линейную динамическую систему, описываемую обыкновенным дифференциальным уравнением

x(t) = A(t)x(t) + B(t)u(t) + c(t), (1)

где t — время, меняющееся на ограниченном отрезке [¿о,1!?] ненулевой длины, ¿о < $ < оо; x(t) G Шп — состояние системы в момент t, u(t) G К™ — значение управляющего вектора в этот момент. Функции А(-), В(-), с(-), определенные и непрерывные на отрезке [¿о,$], принимают значения в нормированных пространствах матриц размерностей n х п, я х m и в 1™ соответственно. Будем предполагать, что управляющей стороне априори известно, что истинное начальное состояние системы находится в заданном конечном множестве XQ С Кп, которое будем называть множеством допустимых начальных состояний, но само истинное начальное состояние системы не известно. Под программным управлением (программой) будем понимать всякую измеримую по Лебегу функцию и(-): [¿0,$] —> Р, где мгновенный ресурс управления Р С Шт — выпуклый

1 Факультет ВМК МГУ, асп.; IIASA, Лаксенбург, Австрия, e-mail: strelkonQiiasa.ac.at

* Работа поддержана РНФ, проект 14-11-00539.

компакт. Множество всех программных управлений обозначим 14. Для всякого допустимого начального состояния жо € Ха и программы и(-) € 14 решение (по Каратеодори) обыкновенного дифференциального уравнения (1), определенное на отрезке [¿о,??] и удовлетворяющее начальному условию ж (¿о) = жо, будем называть движением системы из начального состояния жо под действием программы и(-) и обозначать его ж(-|жо, «(•))•

Пусть задано выпуклое и замкнутое целевое множество Мс1",и для каждого ¿6 [¿о,Щ определена матрица-функция наблюдения (¿(1) размерности дхп, кусочно-непрерывная слева на отрезке

[иьЩ.

Перед управляющей стороной стоит задача гарантированного позиционного наведения в момент ■& — сформировать программное управление, приводящее состояние х(ч9) системы в конечный момент ч9 в заданную сколь угодно малую окрестность целевого множества М. В процессе движения управляющая сторона формирует свою программу позиционно, наблюдая в каждый момент времени £ € [¿о, 1?] текущий сигнал = (¿фх^) о состоянии системы х{Ь). В соответствии со стандартным формализмом, принятым в теории позиционного управления [1], позиционная стратегия управления с памятью позволяет управляющей стороне корректировать значения своей программы и(-) в заранее заданные моменты ¿0 < < • • • < = В каждый момент а^, = г,..., Д — 1, значения программного управления на полуинтервале £ € [ст^Сгч-1) выбираются в зависимости от предыстории £ у(1) наблюдения на отрезке [¿о,Сг] и предыстории £ и(1) управления на полуинтервале [¿о, (Тг).

В работе [6, теорема 2.1] установлено, что задача гарантированного позиционного наведения разрешима тогда и только тогда, когда разрешима задача пакетного наведения (в [6] последняя задача выступает как "точная идеализированная задача пакетного наведения"). Поэтому сосредоточимся на выводе условий разрешимости задачи пакетного наведения. Для описания пакетов программ будем использовать терминологию, введенную в работе [7].

3. Задача пакетного наведения. Рассмотрим однородную систему х(1) = А(1)х(1), соответствующую (1). По формуле Коши ее решение имеет вид х(1) = ¿о)жо, где •) — фундаментальная матрица, ¿о) = ехр^/ ¿¡^ . Для каждого жо € Ха через

9х 0(г) = С2(гММо)жо, ¿£[¿0,1?], (2)

обозначим функцию, которую будем называть однородным сигналом, соответствующим допустимому начальному состоянию жо. Однородный сигнал, соответствующий какому-либо допустимому начальному состоянию, будем называть просто однородным сигналом. Множество всех допустимых начальных состояний жо, соответствующих однородному сигналу д(-) до момента времени г € [¿о, 1?], обозначим Х0(т\д(-)). Таким образом, имеем

хо(т\з(-)) = {^0 € Ха : 5(')1[*о,г] =5хо(')1[*о,т]}-

Здесь и далее д(-)\^о т] — сужение однородного сигнала д(-) на [¿о, т], где г е [¿0,$].

Семейство (ижо('))х0ех0 программ будем называть пакетом программ, если оно удовлетворяет следующему условию неупреждаемости: для любого однородного сигнала д(-), любого момента г € (¿0,$] и допустимых начальных состояний х'0,х'0' € Х0(т|д(-)) при всех £ € [¿о,т) выполняется равенство их>о(1) = их^(1).

Пакет программ (их0('))х0ех0 будем называть наводящим, если для любого допустимого начального состояния жо € Ха движение ж(-), исходящее из жо, под действием программы иХо(-) в момент ■& приходит в целевое множество М: ж($|жо, иХо (•)) € М. Если существует наводящий пакет программ, говорим, что разрешима задача пакетного наведения.

Пусть О — множество всех однородных сигналов. Для произвольного однородного сигнала д(-) введем множество

ОоШ) = Ь(') е О : Ит {д{10 + А) - д{Ц + А)) = О

д-я-о

исходно совместимых с ним однородных сигналов и первый момент его расслоения

п(д(-)) = maxJr е [i0,i9] : max max \g(t) - g(t)\ = 0\.

{ g(-)£G0(g(-)) te[t0,r] J

Если Ti(g(-)) < $ и для какого-либо натурального i ^ 1 определена строго убывающая последовательность множеств однородных сигналов Go(g(-)) D ... D Gj_i(g(-)) и строго возрастающая последовательность моментов Ti(g(-)) < ... < Ti(g(-)) из [¿о,ч?) (моментов расслоения однородного сигнала д(-)), то определим множество

ОгШ) = {¿(О е Gi-гШ) ■ дИто (д(п(д(-)) + А) - д(п(д(-)) + А)) = о}

и момент (i + 1)-го расслоения однородного сигнала д(-)

П+1(д(-)) = тах.\т€(тг(д(-)),'д]: max max \g(t) - g(t)\ = 0 \.

Так как множество всех однородных сигналов G конечно, то для каждого однородного сигнала д(-) существует номер ^ 1, такой, что ткд{(д(-)) = Для каждого однородного сигнала д(-) € G введем множество всех моментов его расслоения Т(д(-)) = {тк(д(-)) : k = 1,..., и определим множество всех моментов расслоения для всех однородных сигналов Т = |J Т(д(-)).

д(-)ес

Представим Т в виде Т = {ti, ..., тк}, где Tj < г = 1,..., К — 1. Отметим, что тк =

Для каждого к = введем множество Х0(тк) = {Х0(тк\д(-)) : д(-) € G}, которое будем

называть кластерной позицией в момент тк. Элементы XQk множества Х0(тк) назовем кластерами начальных состояний в момент тк. Для каждого k = 1 ,...,К кластеры начальных состояний в момент тк образуют разбиение множества XQ всех допустимых начальных состояний, т. е. (см. [7, замечание 4])

Xq = У XQk, X[)k^X[lk = 0, Х'ок,ХЦк G Mnh X'Qk ф Х^к. хокех0(тк)

4. Расширенная задача программного наведения. Пусть Р — множество всех семейств («хо)хоеХо векторов из мгновенного ресурса управления Р. Всякую измеримую функцию £ (иХо(1))Хо£х0' [¿о, 1?] V будем называть расширенным программным управлением (расширенной программой) (измеримость функции понимается, как измеримость по Лебегу функции иХо(-): [¿о,1!?] Р для каждого жо € Х0). Будем отождествлять семейство программ (их0('))х0ех0 и расширенную программу г ^ (иХо(г))ХоеХо.

Для к = 1,...,К введем множество Рк всех семейств («х0)х0ех0 £ V, таких, что для всякого кластера Хок € Х0(тк) и произвольных начальных состояний х'0,хЦ € Хок выполняется равенство их'0 = их'0'- Расширенную программу (иЖо(•))х0ех0 будем называть допустимой, если для каждого к = 1 ,...,К выполняется (иЖо(¿))Ж0ех0 £ Рк при всех £ € (тк_1,тк] в случае к > 1 и при всех £ € [¿0;т1] в случае к = 1. Каждое множество Рк будем называть допустимым расширенным ресурсом управления на полуинтервале тк] в случае к > 1 и на отрезке [¿о, т\\ в случае к = 1.

Лемма 1 [7, лемма 3]. Расширенная программа (их0('))х0ех0 является пакетом программ тогда и только тогда, когда она допустима.

Для произвольного ] = 1,2,... определим расширенное пространство И? как конечномерное гильбертово пространство всех семейств векторов I = (1Х0)х0ех0 из Ж-? со скалярным произведением {•,•)■№ вида

= (Со'Со)' = (С0)х0ех0 € IV, I" = (1Х0)х0ех0 € IV.

ж0еХ0

Здесь и далее (•, •) — скалярное произведение в конечномерном евклидовом пространстве. Значения расширенных программ будем понимать как элементы Лт. Для произвольного непустого множества £ С IV, ] = ., введем его нижнюю р~(■]£): ^ н I и верхнюю р+(■]£): V) Ж опорные

функции:

р~{1\£) = Ы{1,е)Пз, Р+(Ц£) = sup(/,e)^j, leK?.

еее

Рассмотрим расширенную систему, которая состоит из экземпляров системы (1), параметризованных допустимыми начальными состояниями xq € Xq. Экземпляр системы, отвечающий параметру xq, исходит из начального состояния xq под действием программного управления иХо(-). Запишем расширенную систему в виде

%х0 (t) = A(t)xXo (t) + B(t)uXo (t) + c(t), XXo (t0) = XQ, Xq € Xq.

За фазовое пространство расширенной системы примем TZn и будем называть его расширенным фазовым пространством. Управление расширенной системой выбираем из класса всех допустимых расширенных программ. Для каждого допустимого расширенного программного управления («х0('))х0ех0 П°Д соответствующим ему движением расширенной системы будем понимать функцию t (x(t\xo, иХо (•))) у : Hq, 7tn, которую отождествляем с функциональным семейством

' Xq fcAo

(x(-\xQ,uXo(-)))xoeXo.

Расширенным целевым множеством назовем множество Л4 всех семейств (^x0)x0ex0 £ lZn, таких, что zXo € М для всех x,q € Xq. Будем говорить, что допустимая расширенная программа («х0('))х0ех0 является наводящей для расширенной системы, если соответствующее ей движение расширенной системы в момент i? принимает значение в расширенном целевом множестве: (ж($|жо, иХо (-)))Хоех0 G Будем говорить, что расширенная задача программного наведения разрешима, если существует допустимая расширенная программа, являющаяся наводящей для расширенной системы.

Лемма 2 [7, лемма 3]. Задача пакетного наведения разрешима тогда и только тогда, когда разрешима расширенная задача программного наведения. Допустимая расширенная программа является наводящим пакетом программ тогда и только тогда, когда она является наводящей для расширенной системы.

Исходя из лемм 1 и 2, в следующем разделе будем отождествлять допустимые расширенные программы и пакеты программ.

5. Метод поиска наводящего пакета программ. Обозначим через

А= {(x($\xQ,uXo(-)))Xoex0 ■■ (их0(-))х0ех0 еехШ},

множество достижимости расширенной системы в момент где ext U — множество всех допустимых расширенных программ. Введем функцию

7а(0хо)хо£Хо) = Е /( Е l*o> F(0> Ф(Т)) ds+

ХоЕХо /0 \Х0ех0 /Rn

к Тк

+ Е / Е Р~( Е BT(r)FT(^r)lXo\aP)dT^ Y, Р+(1*о\М). (3)

к=1ти-1 хок£Хо{ти) NkoGXoü ' xoGXo

В соответствии с результатами работы [7] отметим, что имеет место равенство

7l(0xo)xoeXo) = Р~ {(!хо)хо€Хо\А) - р+((1Хо)Хоех0\М).

Теорема 1 [7, теорема 2]. Каждая из трех задач: расширенная задача программного наведения, задача пакетного наведения и задача гарантированного позиционного наведения разрешима тогда и только тогда, когда

sup 7i(0xo)xoexo) < 0. (4)

(lx0)x0ex0ec

В формулировке теоремы С — произвольное множество в расширенном фазовом пространстве 1Zn, обладающее следующим свойством. Для произвольного семейства векторов (lX0)x0ex0 € G TV1', такого, что 1^х0|2 = существуют А и А, А ^ А > 0, такие, что (Asx0)x0ex0 £

х0ЕХ0

Назовем множество С множеством полного спектра.

Пакет программ (иЖо(-))жоеХо назовем нулевым, если и® (t) = 0, t G [¿о,i9], xq G Xq. Пусть критерий разрешимости (4) расширенной задачи программного наведения (а в силу теоремы 1 и задачи пакетного наведения) выполнен. Опишем метод построения наводящего пакета программ.

Лемма 3. Пусть выполнено условие (4) и нулевой пакет программ (Ux0('))x0ex0 не является наводящим для расширенной системы. Тогда существует a* G (0,1], такое, что

sup 1а*{(1хо)х0еХ0) = 0. (5)

(1х0)х0ех0еС

Доказательство. Для любого а ^ 0 нижняя опорная функция р~(-\аР) обладает свойством положительной однородности: р~(-\аР) = ар~(-\Р) (см., например, [8]). В силу свойств определенного интеграла и суммирования второе слагаемое в (3) линейно по а, поэтому функция 7(a) = sup 7a((lx0)x0ex0) непрерывна на отрезке [0,1]. Из (4) следует, что 7(1) ^ 0,

(¡■х0)х0ех0 ЕС

а так как нулевой пакет программ не является наводящим, то 7(0) > 0. Таким образом, по теореме Больцано-Коши [9] существует a* G (0,1], такое, что 7(0*) = 0, т.е. имеет место равенство (5).

Лемма 4 [8]. Из строгой выпуклости и компактности множества Р в пространстве Ж™ следует, что для произвольного а > 0 и произвольного ненулевого вектора I G Ж™ существует единственный вектор и* G аР, такой, что {1,и*) = р~(1\аР).

Для всякого пакета программ (иЖо(-))Жоех0! произвольного k = 1 ,...,К, произвольного кластера Xq}. G Х(т}.) и произвольного момента времени t G определим uxok(t) как общее значение программ иХо(-) в момент t для всех xq G

Теорема 2. Пусть множество Р — строго выпуклый компакт, 0 G intP, и для каждого т G [0,1?] матрица D(t) = ВТ{t)Ftт) имеет полный ранг. Пусть также выполняется условие (3) и вектор (1Хо)Хоех0 £ £ является максимизатором для (5). Пусть пакет программ (ижо ('))х0ех0 удовлетворяет условию и* (t) G а*Р, xq G Xq, t G [¿0,1?]), где a* — корень уравнения (5), и для каждого k = 1,..., К и всех кластеров Хак G выполняется равенство

(т Е l*xQ->u*xm(t)) = р~(т Е t^in-un)

XOEXqk XOEXQK

(6)

Если для любых к = 1,..., К и С Х(тк) верно ^ /* ф 0, то пакет программ (иХо(-))х0ех0

хо£Хок

является наводящим и определяется однозначно.

Доказательство. В силу предположений и леммы 3 имеем

7а*((СЬоехо) = 0. (7)

Из (3) и (5) следует, что

<(Со)*оехо,(я(0|яо,<о(-)))*оеХо> ~ Е Iм) = 7а*(0Жо)хоехо) = 0. (8)

ж0£Х0

Из (5) вытекает, что существует наводящий пакет программ («х0(-))хоех0! такой, что

иХо(1) С а* Р, хо£Ха. (9)

Рассмотрим произвольный пакет программ

(«х0('))х0ех0 Ф «0(-))х0ех0, (Ю)

удовлетворяющий (9). Покажем, что (их0('))х0ех0 не является наводящим для расширенной системы. Из этого будет следовать, что пакет программ (и*о(-))Жоех0 является наводящим для расширенной системы. Достаточно показать, что из (10) следует, что существует Хак С Х(т}.) и измеримое множество Е С ненулевой меры, такие, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ихок{т)фь*Хш{т), т £ Е. (И)

Из предположения теоремы следует, что ^ /* ф 0, а из полноты ранга матрицы Т>{т)

хоЕХоь

вытекает, что 1?(т) ^ /* ф 0, г € Е. Из леммы 4 и условия (6) следует, что для любого

хоЕХоь

г б Е и*х к(т) является единственным минимизатором функционала и (Е(т) ^

на множестве аР. Таким образом, ввиду (11), ихок(т) для любого г € Е не минимизирует и (-О(т) 1Хо,и) на множестве а*Р, что эквивалентно неравенству

Хо£Х0к

(ад Е с«*о*о-))>р~(я(т) ^ гхо

Х0ех0к ' ^ xoGXoj;

XoGXoJ;

Из (4) очевидно вытекает, что

а*Р , т €Е.

к тк

Ф*х0)х0ЕХ0-, (x(é\xQ,UXo(-)))Xoex0) = Y^ / Е \D(T) Е

Xo(zxok

1?

/( E E E (c^WoW-

t *x0eX0 ' XoGXQ XOGXQ

E / E Eг

^ VoEXo ' fc=4-i ^О^ел-Ю 4 xo EX

В результате приходим к равенству (см. (3) и (7))

(OxoWxo, (ж(1?|ж0 ех0) — Е ^+!йо1м) > 7aW*Xo)x0ex0) = О,

а* Р I dr.

х0£Х0

из которого следует, что вектор (1Хо)х0ех0, являющийся максимизатором для (5), отделяет конечное состояние движения (ж($|жо, иХо (-)))х0ех0 от целевого множества М в расширенном фазовом пространстве 1Zn. Мы показали, что пакет программ (иЖо (-))жоеХо не является наводящим для расширенной системы. Теорема доказана.

6. Построение гарантирующего позиционного управления по наводящему пакету программ. Отправляясь от наводящего пакета программ (иХо(-))Хоех0, зададим некоторый позиционный способ управления системой (1), стартующей в момент í0 из, вообще говоря, неизвестного управляющей стороне истинного начального состояния xq G Xq. Отождествим себя с управляющей стороной. Отметим достаточно малое 8 > 0. До начала движения принимаем решение применять к системе произвольное управляющее тестовое воздействие их00 (t) G Р в каждый момент t G [ta, ¿o + S). В момент ta + 5 проделаем следующие действия: отметим некоторый момент ¿o G (to,to + 8) и рассмотрим значение у (¿o) = Q(to)x(to) сигнала (неоднородного!) об истинном состоянии ж (¿о) системы в этот момент. Заметим, что по формуле Коши имеем

t о t о

y(tü) = Q(iü)F(ia)xa + Q(ia) j F(Íq,t)B(t)uxoo(t) dr + Q(t0) j F($,t)c(t) dr.

to t o

Найдем вектор

t o t o

w(io) = y(io) - Q(t0) j F(Íq,t)B(t)uxoo(t) dr - Q(to) j F($,t)c(t) dr.

to to

Из определения однородного сигнала (2) ясно, что w(to) = Q(to)F(to,to)xo = 9x0(tо)- Так как до момента т\ G Т однородный сигнал дХо(-) не имеет моментов расслоения, мы установили, что xq G Хог^д^-)) = {xQ G XQ :

9xo (')l[to,Ti] ~~ 5áo(')l[to,Ti]}- Очевидно, что каждое множество *oi(ti|540(-)), Xq G Xq, является кластером из кластерной позиции X(ti). Следовательно, в каждый момент t G [ío + будем применять к системе управляющее воздействие ux01(Tl\Sd¡0(-))W' соответствующее кластеру XQi(Ti\g¿0(-)).

Аналогично для каждого момента разделения сигналов тк б Т, к = — 1, отметим

некоторый момент тк б (т^, г^ + <5) и найдем вектор

T¡¡ тк

w(h) = y(h) - Q(h) j F(Tk,r)B(T)Üo(s)dT^Q(fk) j F($, т)с(т) dr.

to t o

Очевидно, что w(fk) = Q(Tk)F(fk,to)xo = дХо(тк). Поскольку до момента rk+í однородный сигнал 9хо(') более не имеет моментов расслоения, то

хо G Ха(к+1)(тк+i|5xo(')) = {xq G Xq : 5x0 (') |[Í0)T;.+l] = 9x0 (•) |[t0)Tjk+i] }•

Итак, на отрезке [тк + 8, rk+i] применим к системе (1) управление их0(к+1)(Тк+1\щ;0 (•))№' соот~ ветствующее кластеру Xo(fc+i)(Tfc+i|(7£0(-)). В качестве пробного управления на отрезке (тк,тк + 5), к = — 1, используем управление, применявшееся на отрезке [тк-\ + 8, тк], а именно

u(t) = uXok(Tk\g¿0(.))(t), t € (тк,тк + 6), к = 1,..., К - 1.

Для унификации изложения последующего материала обозначим т0 = í0- Определим позиционную стратегию управляющей стороны (в рамках введенного в [1] формализма), как конечную

/ \К+1

последовательность S* = iak, Uk(yat¡ (•), uak (•))) , где

V / k=О

т°' k = í k = () ok = { + 8, l^k^K, Uk = lUXo, , , „ '

% kZK+1] \u*Xok,XQk=XQ(rk\gXo(-)), l^k^K.

Здесь uak(-) — сужение u(-) na [ta,ak) и y<jk(-) — сужение y(-) на [to,ak]. Заданную таким образом позиционную стратегию S* будем называть соответствующей пакету программ (и*о (-))х0ех0 ■

Будем называть позиционную стратегию S е-наводящей, если для любого е > 0 и xq G Xq движение х(-) в управляемом процессе под ее действием удовлетворяет условию x(t9) G [М}£, где [М)£ есть е-окрестность целевого множества М.

Лемма 5. Пусть задача пакетного наведения для системы (1) разрешима и х*(-) = = x(-\xq, uXq (•)) — движение, исходящее из допустимого начального состояния xq G Xq под действием программы и* (•) из наводящего пакета программ и*о (-)х0ех0 ■ Пусть х*{-) = = x(-\xq, ü* (•)) — движение в управляемом процессе (х* (•),у(-),й* (•)) с начальным состоянием xq под действием позиционной стратегии S*, соответствующей (и*о(-))Хо^х0, где и*(-) G U, y(t) = Q(t)x(t)i t G [¿о,1!?]. Пусть для каждого к = О,...,К выполнено ü*(t) = ü*(ak) = = Uk(yCrk(-),uCrk(-)), t G [ok,ok.|_i]. Тогда имеет место неравенство |£*(i?) — ж*(ч?)| ^ К8С, где С — неотрицательная постоянная.

Доказательство. По формуле Коши имеем

i?

x ($) = F($,tQ)xо + J F(i9,r)5(r)ü*0(r)dr + J r)c(r) dr,

t o t o

(ti) = F($,ta)xa + j F{ti,T)B{T)u*XQ{T)dT + J F($, r)c(r) dr.

x (v) =

t o t o

В силу построения позиционной стратегии 5* имеем йХа (¿) = иХа (¿), í С [тк + 8,тк+х], к = = 0,..., К — 1. Поэтому для разности х*(<д) — х*($) получим оценку

\х*(г9) - ж* (0)| =

к — 1 т"+6

Е / F(#,T)B(T)[ü*Xo(T)-U*Xo(T)]dr

k=0

£

rk

к — 1 tk+s к — 1 tk+s

/ imr)B(r)[ü;0(r)-<0(r)]|dr= Е / IF($,T)B(T)\-\ü*X0(T)^u*X0(r)\dT.

k=° í rk

Так как для любого г € верно неравенство т)В(т)\ ^ Н и мгновенный ресурс

управления Р ограничен, то |й* (г) — и*Хо (т) | ^ Ск, т € (тк,тк + 6), 0 ^ к ^ К — 1. Здесь II и ("•'/, — некоторые неотрицательные константы. Положим С* = тах Ск- Тогда будем иметь

Osü-ks^-K— 1 к— 1 к — 1 tk+ä

|ж*(??) -ж*(0)1 < Y1 [ HCkdT^Y^ [ HC*dt = K8HC*. k=о ;' fc=o l

Полагая С = НС*, получим утверждение леммы.

Теорема 3. Пусть задача пакетного наведения для системы (1) разрешима и для достаточно малого положительного 8 выполнено условие К8С ^ е, где С — некоторая положительная постоянная. Тогда позиционная стратегия S* = (о^, , соответствующая наводящему пакету программ, будет являться е-наводящей.

Доказательство теоремы с очевидностью вытекает из леммы 5.

СПИСОК ЛИТЕРАТУРЫ

1. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

2. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.

3. Красовский H.H., Осипов Ю. С. Задача управления с неполной информацией // Механика твердого тела. 1973. № 4. С. 5-14.

4. КуржанскийА. Б. О синтезе управлений по результатам наблюдений // Прикл. матем. и механика. 2004. № 4. С. 547-563.

5. Осипов Ю. С. Пакеты программ: подход к решению задач позиционного управления с неполной информацией // Успехи матем. наук. 2006. 61. № 4. С. 25-76.

6. Кряжимский A.B., Осипов Ю.С. О разрешимости задач гарантирующего управления для частично наблюдаемых линейных динамических систем // Математическая теория управления и дифференциальные уравнения. Тр. МИАН. № 277. М.: МАИК: "Наука/Интерпериодика", 2012. С. 152-167.

7. Кряжимский А. В., Стрелковский Н. В. Программный критерий разрешимости задачи позиционного наведения с неполной информацией. Линейные управляемые системы // Тр. Ин-та матем. и мех. УрО РАН. 2014. 20. № 3. С. 132-147.

8. Киселёв Ю.Н., Аввакумов С.Н., Орлов М.В. Оптимальное управление. Линейная теория и приложения. М.: МАКС Пресс, 2007.

9. Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления. М.: Физматлит, 2001.

Поступила в редакцию 16.02.15

CONSTRUCTION OF A GUARANTEED CLOSED-LOOP GUIDANCE STRATEGY FOR A LINEAR CONTROL SYSTEM WITH INCOMPLETE INFORMATION

Strelkovskii N. V.

In this paper the method of open-loop control packages developed by Yu. S. Osipov and A. V. Kryazhimskiy is applied to the problem of guaranteed closed-loop guidance of a linear control system to a convex closed target set at a predefined time point. The observed signal is linear and the admissible initial states set is assumed to be finite. Using equivalence of the problem under consideration, the open-loop control package guidance problem and the problem of open-loop guidance of an extended linear control system to an extended convex target set, an algorithm of construction of the guiding open-loop control package and the corresponding closed-loop guiding strategy is described in this paper.

Keywords: control, incomplete information, linear systems.

i Надоели баннеры? Вы всегда можете отключить рекламу.