Серия «Математика»
2012. Т. 5, № 4. С. 95-115
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.977.1
О построении решений задачи о сближении в фиксированный момент времени *
В. Н. Ушаков, А. Р. Матвийчук, А. В. Ушаков
Институт математики и механики УрО РАН
А. Л. Казаков
Институт динамики систем и теории управления СО РАН
Аннотация. Изучается задача о сближении с компактным целевым множеством в фиксированный момент времени. Исследуется вопрос о построении решений этой задачи.
Ключевые слова: управляемая система; игровая задача о сближении; множество Достижимости; интегральная воронка.
В работе изучается задача о сближении управляемой системы с компактным целевым множеством в фазовом пространстве в конечный момент из промежутка времени, на котором рассматривается система [5, 6, 7, 11]. К этой ключевой в теории управления задаче сводятся многие другие задачи управления; с ней также связаны другие важные задачи, например, задача об оптимальном быстродействии. Важностью рассматриваемой нами задачи объясняется стремление разработать эффективные методы и алгоритмы ее решения. При этом в случае задачи в общей постановке реальна лишь разработка алгоритмов приближенного вычисления решений; о нахождении точного решения речи не идет из-за сложности задачи. Одним из основных элементов разрешающей конструкции задачи о сближении является множество разрешимости Ш — множество всех тех исходных позиций управляемой системы, из
* Работа выполнена при частичной финансовой поддержке РФФИ, гранты 1—01— 12088 офи_м_2011, 10-01-96006-р_урал_а, 12-07-33045 мол_а_вед и проекта 12-С-1-1017/3
Введение
которых возможно сближение с целевым множеством. Выделить точно множество Ш в пространстве позиций удается лишь в относительно простых случаях, поэтому, как правило, приходится прибегать к приближенным вычислениям множества Ш. Поскольку Ш можно проинтерпретировать как интегральную воронку управляемой системы, записанной в обратном времени, то построение множества Ш можно и даже желательно свести к построению соответствующей интегральной воронки 2. Некоторые методы и схемы приближенного построения и оценки интегральных воронок и их сечений-множеств достижимости изложены в работах [2, 3, 8, 12, 13, 14, 15, 18, 19]. В настоящей работе для того, чтобы не усложнять выкладки, предполагаем, что множество Ш уже вычислено. Для начальных позиций управляемой системы, содержащихся в Ш, предлагается метод приближенного построения управления, обеспечивающего решение задачи о сближении с определенной степенью точности. При этом, в основе метода лежит технология копирования локальных управлений, возникающих в некой вспомогательной системе — поводыре, эволюционирующем вблизи множества Ш. Работа является непосредственным продолжением и дополнением исследований [3, 12, 13]; она также близка по тематике к работам [9, 10]. В работе также используются примеры из [1, 16, 17].
1. Управляемые системы и дифференциальные включения, инвариантные и слабо инвариантные множества
Пусть на промежутке [¿о,$], ¿о < $ < то задана управляемая система Ах
— = /(г,х,п), х е мга (1.1)
Здесь и — вектор управляющих воздействий, удовлетворяющий включению
и е Р, (1.2)
где Р — компакт в евклидовом пространстве Кр.
Предполагается, что правая часть системы (1.1) удовлетворяет условиям
Условие Л.Вектор-функция /(¿,х,и) определена и непрерывна на [¿о,$] х и для любой ограниченной и замкнутой области
О С [¿0,$] х Мга существует такая постоянная Ь = Ь(О) е [0, то), что
||/(¿, х(1\и) — /(¿,х(2),и)|| ^ Ь||х(1) —х(2 ||, (¿,х(г\и) е БхР, г = 1,2.
(1.3)
Условие В.Существует такая постоянная 7 Є (0, то), что
\\/(Ь,х,и)\\ ^ 7(1 + ||ж||), (Ь,х,и) Є [¿о,$] х М™ х Р. (1.4)
Здесь \\/1| — норма вектора / в евклидовом пространстве.
Полагаем Т(Ь,х) = {/(і,х,п); и Є Р}, Г(і,х) = соТ(і,х), (Ь,х) Є [Ьо,§] х М™; здесь со{/} — выпуклая оболочка множества {/} векторов /.
Наряду с системой (1.1) будем рассматривать дифференциальное включение (д.в.) на [Ьо,§]
— Є г (Ь,х). (1.5)
Напомним некоторые известные определения.
Решением уравнения (1.1) на [Ьо,§] с начальным условием х(Ьо) = хо называется такая абсолютно непрерывная на [Ьо,§] вектор-функция х(Ь), х(іо) = хо, что
= / (Ь,х(Ь),и(Ь))
почти всюду (п.в.) на [Ьо,§]; здесь и(Ь) — некоторое допустимое управление, то есть такая измеримая по Лебегу вектор-функция на [Ьо,§], что и(Ь) Є Р на [Ьо,§].
Решением д.в. (1.5) на [Ьо,§] с начальным условием х(Ьо) = хо называется такая абсолютно непрерывная на [Ьо,§] вектор-функция х(Ь), х(Ьо) = хо, что
'-хг Є г<**‘»
п.в. на [Ьо, §].
Пусть Ьо ^ Ь* < Ь* ^ § и х* Є М™.
Определение 1. Назовем множеством достижимости X(Ь*,Ь*,х*) управляемой системы (1.1), отвечающим моменту Ь*, множество всех таких х* Є М™, что х* = х(Ь*) для некоторого решения х(Ь), х(Ь*) = х* уравнения (1.1).
Полагая X* С М™, введем обозначение X(Ь*,Ь*,Х*) = и X(Ь*,Ь*,х*)
х*ЄХ*
— множество достижимости управляемой системы (1.1), отвечающее моменту Ь* и начальному множеству X*
Определение 2. Назовем интегральной воронкой управляемой системы (1.1) на [Ь*,§] с начальным условием х(Ь*) = х* множество X(Ь*,х*) = и {t*,X(t*,t*,x*)) в [Ь*,§]х М™; здесь (Ь*X*) = {(Ь*,х*):
х* Є X*}.
Введем также обозначение X(t*,X*) = (J X(t*,x*) — интеграль-
x*eX*
ная воронка управляемой системы (1.1) на [t*,§], отвечающая начальной паре (t*,X*), X* С М™.
Аналогично для д.в. (1.5) определяются множества достижимости Y(t*, t*,x*), Y(t*, t*,X*) и интегральные воронки Y(t*,x*), Y(t*, X*) на [t*,§].
Обозначим через comp(M™) метрическое пространство, элементы которого — компакты из М™, а метрика — хаусдорфова метрика
d(F*, F*) = max {h(F*,F*),h(F*, F*)},
где h(F*,F*) = max p(f*,F*), p(f*,F*) = min \\f* - f*|| — расстояние
f*GF* f *£F *
от точки f* до множества F*.
Пусть X* £ comp(M™). Из условий А и В, наложенных на правую часть системы (1.1) — вектор-функцию f (t,x,u), следует, что Y(t*) = Y(t*, t*,X*) £ comp(M™) при to ^ t* < t* ^ § и, кроме того, отображение (t*,t*,X*) ^ Y(t*,t*,X*) непрерывно в хаусдорфовой метрике.
Напомним теперь определения понятий инвариантности и слабой инвариантности множеств относительно управляемой системы и дифференциального включения.
Пусть задано непустое замкнутое множество Ф в [to,§] х М™.
Определение 3. Множество Ф называется инвариантным относительно системы (1.1) (д.в. (1.5)), если для любых t* £ [t0,§], (t*,x*) £ Ф, справедливо X(t*,x*) С Ф (Y(t*,x*) С Ф).
Приведем эквивалентное определение инвариантного множества Ф С [to, §] х М™.
Определение 4. Множество Ф называется инвариантным относительно системы (1.1) (д.в. (1.5)), если для любых t*, t* (t0 ^ t* < t* ^ §), (t*,x*) £ Ф справедливо X(t*,t*,x*) С Ф(^) (Y(t*,t*,x*) С Ф(Ь*)); здесь Ф(Ь*) = {x* £ М™ : (t*,x*) £ Ф}.
Наряду с определением инвариантных множеств приведем определение слабо инвариантных множеств Ф С [to,§] х М™.
Определение 5. Множество Ф называется слабо инвариантным относительно системы (1.1) (д.в. (1.5)), если для любых (t*,x*) £ Ф существует решение x(t),x(t*) = x* системы (1.1) (д.в. (1.5)) на [t*,§] удовлетворяющее включению (t,x(t)) £ Ф, t £ [t*,§].
Приведенные понятия инвариантных и слабо инвариантных множеств, как будет показано в последующих разделах, оказываются полезными при разработке алгоритмов приближенного построения интегральных воронок и решений задач управления, в том числе задачи о сближении.
2. Задача о сближении системы (1.1) с компактом в М™.
Алгоритм решения задачи в частном случае
Сформулируем задачу о сближении системы (1.1) с компактным целевым множеством в пространстве М™ в фиксированный момент времени §. Рассмотрим систему (1.1) в предположении, что в дополнение к условиям А, В она удовлетворяет условию С выпуклости вектограм-мы скоростей (см. ниже). При этих условиях на систему (1.1) обсудим схему решения этой задачи, основанную на использовании слабо инвариантных множеств. Приведем алгоритм приближенного построения решений в этой задаче.
Пусть М — компакт в М™ и хо Є М™
Учитывая специфику задачи о сближении, будем называть решения системы (1.1) (д.в. (1.5)) движениями системы (1.1) (д.в. (1.5)).
Задача 1. Требуется найти допустимое управление и(Ь) на [Ьо,§], порождающее движение х*(Ь), х* (Ьо) = хо системы (1.1) на промежутке [Ьо,§], которое удовлетворяет включению х*(§) Є М.
Вообще говоря, не при любых значениях параметров (Ьо,хо), § и М задача (1) разрешима. Допустим все же, что система (1.1) и эти параметры таковы, что задача (1) имеет решение. Зададим такое число 7о Є (0, то), что Н(М, {0}) < 7о; здесь 0 — нуль в М™.
Введем в рассмотрение замкнутую и ограниченную область
Э = 0(Ь,х) : Ь Є [Ьо,§], х Є Б(0; 7(Ь))} С [Ьо,§] х М™;
здесь ^^) = (7о + (Ь — Ьо)^)єі(і-І°') при Ь Є [Ьо,§] и число 7 определено в условии В, Б(0; ^) — замкнутый шар в М™ с центром в 0 и радиуса ^.
Область Э представляет собой интегральную воронку д.в.
| Є и(х) = Б(0; 7(1 + ||х||))
на [Ьо,§] с начальным множеством Э(Ьо) = Б(0; 7о). Из определения Э следует, что при некотором малом е* > 0 имеет место У(Ь,Ьо,М) + Б(0; е*) С Э(Ь), Ь Є [Ьо,§].
По области Э построим еще одну ограниченную и замкнутую область Б в [0о,§] х М™ такую, что Э(§) = Б}Ьо) и Э С Б. А именно, полагаем Б = {(Ь,х) : Ь Є [Ьо,§], х Є Б(0; г(Ь)) }, где г(Ь) = (го + (Ь — Ьо)7еі(і-І0')), Го = 7 (§).
Из определения Б следует, что для любых (Ь*,х*) Є Б, Ьо ^ Ь* < Ь* ^ § и любого движения х(Ь), х(Ь*) = х* системы (1.1) или д.в. (1.5) верно (Ь,х(Ь)) Є Б на [Ь*,Ь*].
Именно эту область вместе с константами Ь = Ь(Б) и К = тах{||/1| : / Є Б(Ь,х), (Ь,х) Є Б} < +то будем использовать в последующих рассуждениях.
Предположим, что наряду с условиями А и В выполняется следующее условие:
Условие С.^"(Ь,х) = Г(Ь,х) при (Ь,х) € Б.
Тогда, как известно, справедливо равенство
X(Ь*,Ь*,х*) = У(Ь*,Ь*,х*), (Ь*,х*) € Б,Ьо ^ Ь* <Ь* ^ $,
и, значит, множества X(Ь*,Ь*,х*) € сошр(М™).
Полагаем М* = МПХ($, Ьо, хо) — компакт в М™. Компакт М* непуст, согласно нашему допущению о разрешимости задачи (1) при заданных (Ьо,хо), $ и М.
Предполагая, что умеем вычислять М* и что М* уже вычислено нами, выберем произвольную точку х0 € М*.
Точка х0 — одна из тех точек в М, в которые может прийти движение системы (1.1) в момент $, отправляясь из х(Ьо) = хо. В выделении таких точек, как видим, множество X($,Ьо,хо) играет значительную роль. В алгоритмах (приближенного) вычисления множеств достижимости системы (1.1) мы ограничиваемся вычислением границы этих множеств. Так, при вычислении множества X($,Ьо,хо) мы ограничиваемся вычислением его границы дХ($,Ьо,хо). При этом мы не сохраняем в памяти для каждой точки х* € дХ($,Ь0,х0) и, тем более, для каждой точки х* € X($,Ьо,хо) то управление и(Ь) на [Ьо,$], которое приводит систему
(1.1) в эту точку х* в момент $. Это утверждение справедливо и для точки х0 : мы не сохраняем в памяти то управление и*(Ь) на [Ьо,$], которое которое породило движение х*(Ь) системы (1.1), приходящее в х0 в момент $.
В связи с этим возникает важный вопрос: “Как, зная точку х0 € М*, восстановить по ней допустимое управление и*(-) на [Ьо,$], приводящее систему (1.1) в эту точку в момент $?”
Для ответа на этот вопрос введем конструкции, тесно связанные с понятием множества достижимости.
Рассмотрим начальную точку хо € М™, промежуток [Ьо,$] и управление и(Ь) на [Ь0, $], порождающее некоторое движение х(Ь), х(Ь0) = х0, системы (1.1) на [Ьо,$]. Справедливо равенство
(^х^ = / (Ь,х(Ь),и(Ь)), х(Ьо) = хо (2.1)
при почти всех Ь € [Ьо,$].
Наряду с “прямым” временем Ь € [Ьо,$] введем так называемое “обратное” время т € [Ьо,$];
т = Ьо + $ - Ь, Ь € [Ьо, $].
Поставим в соответствие системе (1.1)
(1х г т
— = /(Ь,х,и),Ь € [Ьо,$]
управляемую систему в М™, отвечающую “обратному” времени т :
^ = /0(т,г,ь), т € [Ьо,$]; (2.2)
здесь /°(т, г, у) = —/(Ьо + $ — т,г, у), (т, г, у) € [Ьо, $] х М™ х Р.
Любой паре моментов Ь*,Ь* (Ьо ^ Ь* < Ь* ^ $) сопоставим пару
моментов т*,т* (Ьо ^ т* < т* ^ $) по формулам т* = Ьо + $ — Ь*,
т * = Ьо + $ — Ь*.
Заметим, что движению х(Ь) (2.1) системы (1.1), порожденному управлением и(Ь) на [Ьо,$], можно сопоставить движение г(т) системы (2.2), удовлетворяющее соотношению
= / °{т,г(т ),у(т)), г(Ьо )= х($)
при почти всех т € [Ьо,$];
здесь управление у(т) на [Ьо,$] определено равенством у(т) = и(Ь), т = Ьо + $ — Ь.
Можно сказать, что мы записали движение х(Ь) системы (1.1) в терминах “обратного” времени т как движение г(т) системы (2.2).
Движения х(Ь) и г(т) на [Ьо, $] связаны равенством
х(Ь) = г(т), т = Ьо + $ — Ь (2.3)
точно также как и порождающие их управления и(Ь) и у(т) на [Ьо,$].
Обратимся снова к точке х0 € М*. Рассмотрим интегральную воронку 2 = 2(Ьо,го), го = х$ системы (2.2), представляющую собой замкнутое множество в [Ьо,$] х М™.
Введем множество Ш в [Ьо,$] х М™ : Ш(Ь) = 2(т), Ь = Ьо + $ — т,
т € [Ьо, $].
Множество Ш — замкнутое множество в [Ьо, $] х М™, поскольку 2 — замкнутое множество в [Ьо, $] х М™. Кроме того, согласно определению Ш и свойству (2.3) двойственности движений систем (1.1) и (2.2), множество Ш есть множество разрешимости для системы (1.1) в задаче о сближении ее с точкой х0 в момент $. Точнее, Ш — множество всех (Ь*,х*), из которых возможно приведение движения х(Ь) системы (1.1) в точку х0 в момент $.
По построению множества Ш, выполняется Ш С Б и, кроме того, все движения х(Ь), Ь € [Ь*,$], начинающиеся в Ш (т.е. (Ь*,х(Ь*)) € Ш), удовлетворяют включению (Ь,х(Ь)) € Б,Ь € [Ь*,$].
Также по построению Ш ив силу выбора точки (Ьо,хо), имеем (Ьо,хо) € Ш и Ш слабо инвариантно относительно системы (1.1). Слабой инвариантностью множества Ш мы воспользуемся при конструировании управления на [Ьо,$], обеспечивающего приведение движения системы (1.1) из точки хо в х0 в момент $.
Для этого зададим на оси т некоторое разбиение Г = {то = Ьо,т\,..., т1,...,т^ = $} промежутка [Ьо, $] с равными шагами А^ = т+1 — ^ = А > 0, г = 0,М — 1, где диаметр А мал.
Вообразим себе сначала идеальную картину: продвигаясь последовательно от 2(то) = {х0} малыми шагами [тг,т+], г = 0,М — 1, мы смогли вычислить (точно) сечения 2(ъ) интегральной воронки 2 системы (2.2). В множестве разрешимости Ш задачи о сближении системы 1.1) с точкой х0 этим сечениям 2т) соответствуют сечения Ш(Ь]), ] = N—г, отвечающие разбиению Г = {Ьо,Ь\,. ..,Ь], ...,ЬN = $} промежутка [Ьо, $] на оси Ь.
Допустим, что мы умеем вычислять не только множества Ш(Ь]), 2 = N — г, но и множества достижимости X(Ь]+\,Ь],х(^), х(Я € М™, 2 =
0Х — 1.
Рассмотрим при этом условии первый промежуток [Ьо,Ьг] разбиения Г. Так как х(о = хо € Ш(Ьо) и Ш слабо инвариантно относительно системы (1.1), то
Ш (^)Р| X (Ь1,Ьо,х(0)) = 0,
и, значит, существует управление и*(Ь) на [Ьо,Ь 1), порождающее движение х*(Ь) системы (1.1), удовлетворяющее включению х(1 = х*(Ь1) € Ш(Ь1).
Переходим к промежутку [Ь1,Ь2] разбиения Г. Для точки х(1 € Ш(Ь1) выполняется
Ш (¿2^ X (Ь2,Ь1,х(1) = 0,
и, значит, существует управление и*(Ь) на [Ь1,Ь2), порождающее такое движение х*(Ь) системы (1.1) на [Ь1,Ь2], что х(2) = х*(Ь2) € Ш(Ь2).
Так, продолжая последовательно переходить от промежутка [Ь] ,Ь^+1] разбиения Г к следующему промежутку [Ь]+1,Ь]+2], мы сконструируем управление и*(Ь) на [Ьо,$], порождающее движение х*(Ь) системы (1.1), для которого х*($) = х0.
В итоге, при условии идеальной картины, мы, двигаясь малыми шагами [Ь],Ь]+1 ] разбиения Г, сконструировали управление и*(Ь) на [Ьо,$], порождающее движение х*(Ь) системы (1.1), для которого х*($) = х*^.
Однако в реальности мы не в состоянии вычислять (точно) ни множества Ш(Ь]), ни множества X(Ь]+1,Ь],х(^) даже при тех Г, у которых Ь] и Ь]+1 близки. Мы можем делать это лишь в редких случаях и, как правило, можем вести лишь приближенные вычисления.
Откажемся теперь от идеальной картины, но не полностью. Будем предполагать все же, что умеем вычислять множества Ш(Ь]) (точно), а множества X(Ь*,Ь*,х*) приближенно как множества Х(Ь*,Ь*,х*) = х* + (Ь* — Ь*)Г(Ь*,х*) ((Ь*,х*) € Б,Ьо ^ Ь* < Ь* ^ $) и, в частно-
сти, умеем лишь приближенно вычислять множества X(Ь]+1,Ь],х(^) как множества X(tj+1,tj,х(Я) = х(Л +АГ Ь ,х^).
Между множествами X(Ь*,Ь*,х*) и Х(Ь*,Ь*,х*), как известно, налицо хорошая степень близости:
вир (Ь* ,Ь*,х*), XX (Ь* ,Ь*,х*)) ^ ш(Ь* — Ь*),
(Ь*,х* )ЕО,1* £[1* ,Щ
здесь ш(5)=5ш* ((1+К)5), 5 > 0; ш*(р)=шах {||/(Ь*,х*,и)—/(Ь*,х*,и)\\ : (Ь*,х*) и (Ь*,х*) из Б, |Ь* — Ь*|+||х*— х*\| ^ р, и € Р}, р > 0; число К € (0, то) определено на с. 99.
Из определения функции ш*(р) следует, что ш*(р) I 0 при р I 0 и поэтому функция ш(5) есть также монотонная функция от 5 > 0 — величина порядка малости по 5, более высокого, чем первый порядок при 5 I 0.
Приступим к описанию пошагового построения управления и*(Ь) на [Ьо, $], цель которого состоит в приведении движения х*(Ь) системы (1.1) в точку х0 в момент $. Отметим, что мы не отказываемся здесь от предположения об умении (точно) вычислять множества Ш(Ь]) лишь потому, что такой отказ существенно усложнил бы выкладки. Учитывая нашу возможность вычислять множества X(Ь]+1 ,Ь],х(^) лишь приближенно, мы сможем построить управление и*(Ь) на [Ьо,$], приводящее движение х*(Ь) в момент $ лишь в некоторую окрестность точки х0.
Рассмотрим, как и в случае идеальной картины, промежуток [Ьо,Ь1]. Так как Ш слабо инвариантно относительно системы (1.1) и хо € Ш(Ьо), то
Ш(Ь1){) X(Ь1,Ьо,хо) = 0
и, значит,
Ш(Ь^цд) ^^Х(Ь1,Ьо,хо) = 0;
здесь Фш — ш-окрестность множества Ф в М™.
Выберем некоторую точку х(1 € Ш(Ь^цд) ПX(Ь1,Ьо,хо). Справедливо представление для точки
х(1 = хо + А/0, где /(о € Г(Ьо, хо).
Так как в рассматриваемом случае Г(Ьо, хо) = Т(Ьо, хо), то уравнение
/ (Ьо,хо,и) = /(0) (2.4)
относительно и разрешимо в Р, то есть существует вектор и(о) € Р, удовлетворяющий (2.4).
Будем считать, что мы умеем решать уравнение (2.4), и для некоторых классов систем (1.1) это действительно так. Например, для систем (1.1) вида /(Ь,х,и) = /(Ь,х) + В(Ь,х)и уравнение (2.4) сводится к решению линейного уравнения относительно управления и
В(Ьо,хо)и = (/(о — / (Ьо,хо));
здесь В(Ь, х) — матрица-функция от Ь, х.
В случае, если В(Ь,х) — неособая (п х п)-матрица-функция (т.е. ёе! В(Ь,х) = 0 при (Ь,х) € Б), будем иметь решение
и(0) = В(Ьо,хо)-1(/(0) — / (Ьо,хо)),
при этом справедливо и(о) € Р.
Поскольку сам вектор /(о) представим в виде
/(о) = А-1(х(1) — хо),
то в случае неособой п х п-матрицы-функции В(Ь,х) справедливо равенство ( )
и(о = А-1В(Ьо, хо)-1 (х(1 — хо — А/(Ьо,хо)).
Итак, для системы (1.1) управление и(о € Р определяем из уравнения (2.4), и в некоторых случаях удается выписать формулу для и(0\ К сожалению, это возможно далеко не всегда.
Управление и*(Ь) на [Ьо,Ь1) определяем равенством
и*(Ь) = и(0') € Р, Ь € [Ьо,Ь1).
Далее переходим к второму промежутку [Ь1,Ь2] разбиения Г. Для точки х(1 € Ш(Ь1)ш(д) ищем ближайшую точку х(1 на Ш(Ь{). Справедливо неравенство ||х(1) — х(1)\| ^ ш(А).
В силу слабой инвариантности Ш и х(1 € Ш(Ь{) имеем Ш(Ь2) Р|
X(Ь2,Ь1, х^) = 0. Из этого соотношения и неравенства d(X(Ь2,Ь1,х(1')), :К(Ь2,Ь1,х(1>)) ^ ш(А) следует
Ш (Ь2)ш(д^ XX (Ь2 ,Ь1,х(^) = 0.
Выберем некоторую точку х(2 € Ш(Ь2)цд) П X(t2,t1,x(1'l). Так как
х(2 € }С(Ь2,Ь1,х(1')), то х(2) = х(1) + А/(1) , где /(1) € Г(Ь1,х(1)).
Из уравнения
/ (Ь1,х(1),и) = /(1) (2.5)
определяем вектор и(1) € Р.
Уравнение (2.5) можно записать в виде
/(Ь1, х(1\и) = А-1(х(2 — х(1^),
так что справедливо х(2) = х(1) + А/(Ь1,х(1),и(1)).
Управление и*(Ь) на [Ь1,Ь2) задаем равенством и*(Ь) = и(1 € Р. Затем переходим к следующему промежутку [¿2,Ьз] разбиения Г. Для точки х(2) определяем точку х(2), ближайшую на Ш(Ь2). Выполняется неравенство ||х(2) — х^Ц ^ ш(А).
Учитывая слабую инвариантность множества Ш и х(2) € Ш(Ь2), получаем X(Ь3,Ь2, х(2')) = 0. Выбираем некоторую точку х(3 €
Ш(Ьз)ш(д)П XX(Ьз, Ь2, х(2')).
Для точки х(3 справедливо представление х(3 = х(2) + А/(2), где /(2) € Г(Ь2,х(2)).
Из уравнения
/ (Ь2,х(2),и) = /(2) (2.6)
определяем вектор и(2) € Р.
Так как /(2') = А-1(х(3 — х(2')), то вектор и(2) удовлетворяет равенству х(3') = х(2') + А/(Ь2,х(2\и(2')).
Управление и*(Ь) на [Ь2,Ь3] определяем равенством и*(Ь) = и(2) € Р.
Затем переходим к следующему промежутку [Ь3, Ь4]. Так продвигаясь вперед по шагам [Ь],Ь]+1] разбиения Г, построим кусочно-постоянное управление и*(Ь) на [Ьо,$]:
и*(Ь) = и^ € Р при Ь € [Ь],Ь]+1),] =0^ — 1.
Это управление порождает движение х*(Ь), х*(Ьо) = хо системы (1.1) на [Ьо, $].
Покажем, что при достаточно малых А > 0 движение х*(Ь) мало отстоит в моменты Ь] от множеств Ш(Ь]), то есть мала величина р(х*(Ь]), Ш(Ь])) — расстояние от х*(Ь]) до Ш(Ь]).
Для этого покажем, что во все моменты Ь] мала величина р] = \х*(Ь]) — х(^\\; здесь х(]') — точка из Ш(Ь]), которая определяется аналогично точкам х(1 и х(2).
Итак, сначала рассмотрим первый шаг [Ьо,Ь1 и оценим сверху величину р1. Справедливо равенство
х*(Ь1) — х(1 = (х*(Ь1) — х(1)) + (х(1) — х(1). (2.7)
Первое слагаемое в правой части (2.7) представимо в виде
*1
х*(Ь{) — х(1) = (хо + | /(Ь,х*(Ь), и(0')) dt^ — (хо + А/(Ьо,хо,и(0^)^
*0
*1
= J /(Ь, х*(Ь),и(0)) — /(Ьо, хо, и(о)) dt.
*0
По построению области Б, все рассматриваемые нами позиции содержатся в Б С [Ьо,$] х М™ и, в частности, (Ь,х*(Ь)) € Б при Ь € [Ьо,Ь1]. Принимая это во внимание, оценим величину
||/(Ь,х*(Ь),и(0)) — /(Ьо,хо,и(0))\\, Ь € [Ьо,Ь).
106 В. Н. УШАКОВ, А. Р. МАТВИЙЧУК, А. В. УШАКОВ, А. Л. КАЗАКОВ Справедлива при Ь € [Ьо,Ь1) оценка
||/(Ь,х*(Ь),и(оу)—/(Ьо,хо,и(оу)\ ^ ш*(1Ь—го1+\\х*(Ь)—хо||) ^ ш*((1 + К)А).
(2.8)
Учитывая (2.8), получаем
\х*(Ь) — х^1|| = 11|/(Ь,х*(Ь),и(0')) — /(Ьо^о,^^)! йЬ ^ ш(А). (2.9)
*0
Из равенства (2.7), оценок ||х(1) — х(1)|| ^ ш(А) и (2.9) следует
р1 = ||х*(Ь1) — х(1|| ^ 2ш(А).
Отсюда следует оценка р{х*(Ь1), Ш(Ь1)) ^ 2ш(А).
Рассмотрим теперь второй шаг [Ь1,Ь2] и оценим сверху величину р2. Справедливо равенство
х*(Ь2) — х(2) = (х*(Ь2) — х(2)) + (х(2 — х(2)). (2.10)
Первое слагаемое в правой части (2.10) имеет вид
х* (у _ х(2) = ¿0 + I (/^ щ, ^ _ / «у»,,«))) Л,
*1
где з(1) = х*(Ь1) — х(1
Справедливо неравенство
*2
Цх*(Ь2) — х^Ц ^ р(1)|| + 1 \\/(Ь,х*(Ь),и(1')) — / (Ь1,х(1\и(1')) | йЬ. (2.11)
*1
Оценим сверху подынтегральное выражение в (2.11) при Ь € [Ь1,Ь2).
||/(Ь,х*(Ь),и(1)) — /(Ь1,х(1),и(1))|| <
^ ||/(Ь,х*(Ь),и(1)) — /(Ь1,х*(Ь1),и(1))Ц +
+ ||/(Ь1,х*(Ь1 ),и(1)) — /(Ь1,х(1\и(1))|| ^
< ш*((1 + К)А)+ ^|5(1)|, (2.12)
где Ь = Ь(Б) — константа Липшица вектор-функции /(Ь,х,и) в Б.
Из неравенств (2.11) и (2.12) следует
Цх*(Ь2) — х(2)Ц ^ еьд||5(1)|| + ш(А). (2.13)
О ПОСТРОЕНИИ РЕШЕНИЙ ЗАДАЧИ О СБЛИЖЕНИИ 107
Учитывая оценки (2.13) и ||х(2) — х^Ц ^ ш(А), получаем
р2 = Цх*(Ь2) — х(2|| ^ еьдр1 + 2ш(А).
Отсюда следует оценка
р(х*(Ь2),Ш(Ь2)) ^ еьдр1 + 2ш(А).
Теперь переходим к следующему шагу [Ь2,Ьз]. На этом шаге оценим сверху величину рз.
Справедливо равенство
х*(Ь3) — х(3 = (х*(Ь3) — х(3)) + (х(3) — х(3)). (2.14)
Первое слагаемое в правой части равенства (2.14) имеет вид
*3
*2
где в(2) = х*(Ь2) — х(2).
Учитывая при Ь € [Ь2,Ь3) оценку
||/(Ь,х*(Ь),и(2)) — /(Ь2,х('22,и('2Л))Ц ^ Ьр2 + ш*((1 + К)А), получаем
Цх*(Ь3) — х(3) || ^ еьдр2 + ш(А). (2.15)
Учитывая оценки (2.15) и ||х(3) — х(3)|| ^ ш(А), получаем
р3 = ||х*(Ь3) — х(3 II ^ еьдр2 + 2ш(А). (2.16)
Отсюда следует оценка
р(х*(Ь3),Ш(Ь3)) ^ еьдр2 + 2ш(А).
Далее переходим к следующему шагу [Ь3,Ь4] разбиения Г и так вплоть до последнего шага [tN-1,tN]. На шаге [Ь],Ь]+1] верна оценка сверху величины р]+1 :
р]+1 < еьдр] + 2ш(А), (2.17)
где 2 = 1Х — 1 (здесь дополнительно ввели ро = 0).
Из рекуррентной оценки (2.17) получаем, что все величины р] малы при малых А > 0, а также верна оценка
рN < еь('&-1о')NА2ш* ((1 + К)А),
из которой следует оценка
р(х*^), )) < 2еь(^о)($ — Ьо)ш*((1 + К)А).
Принимая во внимание Ш(Ьм) = {х0}, получаем
1|х*($) — х%ц < 2еь(—)($- — Ьо)ш*((1 + К)А). (2.18)
Из оценки (2.18) следует, что при диаметре А разбиения Г, стремящемся к нулю, правая часть оценки (2.18) стремится к нулю и, значит, 1|х*($) — х0|| ^ 0. Следовательно, видим, что с измельчением диаметра А разбиения Г кусочно-постоянное управление и*(Ь) на [Ьо, $], построенное по разбиению Г, обеспечивает приведение движения х*(Ь) системы
(1.1) в момент $ в сколь угодно малую окрестность точки х0.
На основе приведенных построений и выкладок сформируем следующее утверждение, представляющее один из основных результатов настоящей работы.
Теорема 1. Пусть управляемая система 1.1 удовлетворяет условиям А, В, С, а начальная позиция (Ьо,хо) системы 1.1 такова, что М П X($,Ьо,хо) = 0. Пусть также х0 € М П X($,Ьо,хо) и Г — конечное равномерное разбиение промежутка [Ьо,$]. Тогда для любого е > 0 можно построить допустимое кусочно-постоянное управление и*(Ь) на [Ьо,$], отвечающее разбиению Г и порождающее движение х*(Ь), х(Ьо) = хо системы (1.1), которое удовлетворяет равенству ||х*($) — х£|| ^ е.
Набор {х(^} точек х('\ содержащихся вблизи множеств Ш(Ь]), 2 = 0, N, мы трактуем как своеобразного дискретного в М™ поводыря для движения х*(Ь) на [Ьо,$]. Этот поводырь формировался по ходу дела по шагам [Ь],Ь]+1] разбиения Г и параллельно с ним формировалось кусочно-постоянное управление и*(Ь) на [Ьо,$], которое сразу же использовалось при формировании движения х*(Ь) системы (1.1). Таким образом, управления в системе Т (1.1) формируются на основе копирования управления, порождающего движение поводыря. Этот поводырь {х(]) ,2 = 0^}, приходящий в момент Ьм = $ в ш(А)-окрестность точки х0, притягивает и движение х*(Ь) системы (1.1) в момент $ в малую окрестность точки х0.
Итак, мы рассмотрели систему (1.1) в предположении, что для нее выполняется условие С. Была описана процедура управления системой
(1.1), базирующаяся на копировании управления поводыря и обеспечивающая для начальных точек хо € Ш(Ьо) сколь угодно точное наведение системы (1.1) в момент $ на целевое множество х0. Желаемая точность наведения системы (1.1) на х0 обеспечивалась за счет измельчения шага разбиения Г промежутка [Ьо,$].
3. Применение алгоритмов приближенного вычисления решений к конкретным задачам о сближении
В этом разделе рассмотрим две конкретные задачи о сближении с целью в фазовом пространстве в фиксированный момент времени. Мы приведем здесь постановки задач и графическое представление результатов приближенных вычислений их решений.
Пример 1. Маятниковый осциллятор. Задан сферический маятниковый осциллятор, представляющий собой маятник с абсолютно твердым стержнем длины I = 1 и грузом массы т = 1. Маятник прикреплен к неподвижной точке подвеса и плоскость колебаний маятника вращается вокруг вертикальной оси (проходящей через точку подвеса) с постоянной угловой скоростью ш = 1.
и
т
д
Рис. 1.
Пусть ф — угол отклонения стержня маятника от вертикальной оси. На маятник действует сила гравитации тд, а также находящаяся в нашем распоряжении сила и, при помощи которой мы управляем маятником. Эта сила направлена вертикально и проявляется в уравнениях движения маятника в виде скаляра и, ограниченного по модулю. Считаем, что управление маятником осуществляется на промежутке времени [Ьо, $] = [0, 3]. Полагая в качестве переменных состояния маятника Хі = ф, Х2 = ф, запишем уравнения движения сферического маятника в виде
/ Х1 Х2, (3 і)
\Х2 = (-д + и) 8Іпх1 + 2$,іп2х1. ( . )
При указанных выше значениях параметров (I = 1, т = 1, ш = 1,
д = 9.8) считаем, что управление и = и(і) стеснено на [і0,$] = [0, 3]
ограничением
\и(Ь)\ < 3. (3.2)
Считаем также, что задано целевое множество М = {xf}, где Xf = (2, 0) € М2.
Задача состоит в том, чтобы для управляемой системы 3.1, 3.2 выделить в пространстве М2 множество Ш(Ьо) начальных точек хо, из которых возможно приведение управляемой системы 3.1, 3.2 в момент $ = 3 на целевое множество М и для нескольких произвольных точек хо € Ш(Ьо) выделить управление и*(Ь) на [Ьо,$] и порожденное им движение х*(Ь), х* (Ьо) = хо, удовлетворяющее включению х*($) € М, то есть равенству х*($) = Xf.
Система 3.1 удовлетворяет всем условиям (условия А, В, С), которые наложены на управляемую систему в §1, §2. Поскольку точно решить сформулированную задачу по управлению сферическим маятником невозможно, будем решать ее приближенно, используя алгоритмы приближенного построения решений, изложенные в §2, базирующиеся на использовании конструкций поводыря.
Зададим конечное равномерное разбиение Г = {Ьо,Ь-\_,...,Ь],...,Ьм = $} промежутка [Ьо,$] = [0, 3] с диаметром А = 0.01. Пятясь во времени по моментам Ь] разбиения Г от целевого множества Ш($) = М, вычислим последовательно аппроксимации Ш(Ь]), 2 = N — 1, 0 множеств Ш(Ь]) из §2, являющихся сечениями множества разрешимости Ш в задаче о сближении с М.
Аппроксимации Ш(Ь]) мы представляем в этой задаче в виде многоугольников на плоскости М2. Затем, выбрав какую-либо начальную точку хо € Ш(Ьо), построим, последовательно продвигаясь по шагам [Ь], Ь]+1] разбиения Г, кусочно-постоянное управление и*(Ь) на [Ьо,$] и порожденное им движение х*(Ь) на [Ьо,$], приходящее в момент $ в некоторую малую е-окрестность М£ множества М.
Ниже мы приведем графическое представление нескольких множеств Ш(Ь]) в М2 из полного набора {Ш(Ь]): Ь] € Г}, дающее определенное представление об эволюции множеств Ш(Ь]), Ь] € Г. Также приведем график скалярного управления и*(Ь) на [Ьо,$] и изображение в пространстве М3 движения х*(Ь), порожденного этим управлением.
На рисунках 2 — 4 изображены аппроксимации Ш (Ь]), отвечающие моментам Ьо = 0, Ь^о = 0.5, Ьюо = 1, Ь^о = 1.5, Ь2оо = 2 Ь25о = 2.5. Моменту Ь3оо = 3 отвечает целевое множество М = {xf}, Xf = (2, 0) € М2. Последовательность рисунков соответствует «обратному» времени.
На рисунках 5 — 6 для начального условия в задаче о сближении
— точки хо = (—0.4318,3.9678), содержащейся в Ш(Ьо), изображено движение маятникого осциллятора, приходящие в некоторую малую е-окрестность М£ множества М и порождающее его управление. Неточное попадание движения на целевое множество М обусловлено тем, что
оно реализованы на базе аппроксимирующих разрешающих конструкций.
1 = 0
1 = 0.5
1 = 1
1 = 1.5
Рис. 3
10
х2
1 = 2
О
10
х2
1 = 2.5
к
15 -10 -5 0 5 10 -15 -10 -5 0 5 10
х1 х1
5
5
Рис. 4
4г
3
2
1
и0
-1
-2
-3
-4
0 0.5 1 1.5 2 2.5 3
Рис. 6
Пример 2. Задача вариационного исчисления.
Пусть в некоторой ограниченной замкнутой области X С М2 с кусочно-гладкой границей задана непрерывная функция f (х, у) > 0. Среди кусочно гладких кривых Г, лежащих в X и соединяющих точки А и В, требуется выделить такую кривую Го, на которой принимает минимальное значение интегральный функционал
f(х,у)бГ.
(3.3)
Го
Данная задача является классической задачей вариационного исчисления и, как известно, допускает аналитическое решение только в исключительных случаях.
Для численного решения данной задачи, в частности, используется подход (см., например, [4]), восходящий к основателю вариационного исчисления И. Бернулли, основанный на аналогии между задачей вариационного исчисления и распространением света в оптически-неоднородной среде, который состоит в следующем. С точки зрения
геометрической оптики выражение (3.3) определяет время, за которое выпущенный в начальный момент времени из точки A(xo,yo) свет, двигаясь в оптически-неоднородной среде с локальной скоростью c(x, y) =
1/f (x,y), достигает точки B(xi,yi). В соответствии с принципом Гюйгенса, всякая точка области X, которой свет достиг, становится новым источником света. Следовательно, выпустив световую волну из точки A, можно построить траекторию ее движения и зафиксировать "квант" , достигающий первым точки B. Далее, пятясь во времени, можно восстановить траекторию движения этого "кванта" , которая является искомой кривой Го.
Легко видеть, что данный подход весьма похож на метод приближенного построения решений задачи о сближении, описанный в §2. Это сходство не является случайным. Можно показать(обосновывающие выкладки и рассуждения здесь опущены), что множество X(t*) С X точек x = (x,y), которых свет достиг к моменту времени t*, представляет собой объединение множеств достижимости X(t, t0, x0),t € [to,t*] (здесь to = 0, xo = (xo,yo) = A) и является проекцией на R2 интегральной воронки X(to, xo) = U (t,X(t,to, xo)) управляемой системы te[to,t*]
dx cos u dy sin u „
dt = fxy, d = fxy), 0<u < 2- (34)
рассматриваемой на промежутке [to,t*] с начальным условием
(x(to),y(to)) = xo.
Систему (3.4) можно незначительно (с точки зрения структуры множеств достижимости) подправить до системы (3.5)
dx w cos u dy w sin u r .
—r = ^-----г, ~т = ~r,-г, 0 < u < 2n,w € [0,1]. (3.5)
dt f (x,y) dt f (x,y)
с тем же самым начальным условием; здесь w — дополнительный к и параметр управления, регулирующий длину вектора скоростей системы (3.5).
Тогда, например, при условии липшицевости функции / (х) = /(х, у) по переменной х дополняющем условие положительности функции / (х) на X, мы получим, что система (3.5) удовлетворяет условиям А, В, С, наложенным на на управляемую систему (1.1) в §1, §2. В таком случае с помощью указанного в §2 метода возможно приведение движения управляемой системы (3.5), а также системы (3.4) в сколь угодно малую окрестность точки В.
Список литературы
1. Вдовин С. А. Построение множества достижимости интегратора Брокетта / С. А. Вдовин, А. М. Тарасьев, В. Н. Ушаков // Прикл. математика и механика.
- 2004. - Т. 68, вып. 5. - С. 707-724.
2. Гусев М. И. Оценки множества достижимости многомерных управляемых систем с нелинейными перекрестными связями / М. И. Гусев // Тр. Ин-та математики и механики УрО РАН. - 2009. - Т. 15, № 4. - С. 82-94.
3. Гусейнов Х. Г. Об аппроксимации областей достижимости управляемых систем / Х. Г. Гусейнов, А. Н. Моисеев, В. Н. Ушаков // Прикл. математика и механика. — 1998. — Т. 62, вып. 2. — С. 179-187.
4. Казаков А. Л. Об одном подходе к решению задач оптимизации, возникающих в транспортной логистике / А. Л. Казаков, А. А. Лемперт // Автоматика и телемеханика. - 2011. - №7. - С. 50-57.
5. Красовский Н. Н. Лекции по теории управления. Вып. 4. Основная игровая задача наведения. Поглощение цели. Экстремальная стратегия / Н. Н. Красовский. - Свердловск : Урал. гос. ун-т, 1970. - 96 с.
6. Красовский Н. Н. Управление динамической системой / Н. Н. Красовский. -М. : Наука, 1985. - 520 с.
7. Красовский Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин. - М. : ФИЗМАТЛИТ, 1974. - 456 с.
8. Костоусова Е. К. Об ограниченности и неограниченности внешних полиэдаль-ных оценок множеств достижимости линейных дифференциальных систем / Е. К. Костоусова // Тр. Ин-та математики и механики УрО РАН. - 2009. -Т. 15, № 4. - С. 134-145.
9. Никольский М. С. Об аппроксимации множества достижимости дифференциального включения / М. С. Никольский // Вестн. МГУ. Сер. 15, Вычисл. математика и кибернетика. - 1987. - №4. - С. 31-34.
10. Никольский М. С. Об оценке изнутри множества достижимости нелинейного интегратора Р. Брокетта / М. С. Никольский // Дифференц. уравнения. - 2000.
- Т. 96, №11. - С. 1501-1505.
11. Понтрягин Л.С. О линейных диф. играх I / Л. С. Понтрягин // Докл. АН СССР. - 1964. - Т. 156, № 4. - С. 738-741.
12. Ушаков В. Н. Аппроксимация множеств достижимости и интегральных воронок / В. Н. Ушаков, А. Р. Матвийчук, А. В. Ушаков // Вестн. Удмурт. ун-та. Математика. - 2011. - Вып. 4. - С. 23-39.
13. Ушаков В. Н. Построение интегральных воронок дифференциальных включений / В. Н. Ушаков, А. П. Хрипунов // ЖВМ и П.Ф. - 1994. - Т. 34, № 7. — C. 965-977.
14. Филиппова Т. Ф. Дифференциальные уравнения эллипсоидальных оценок множеств достижимости нелинейной динамической управляемой системы / Т. Ф. Филиппова // Тр. Ин-та математики и механики УрО РАН. - 2010. -Т. 16, № 1. - С. 223-232.
15. Черноусько Ф. Л. Оценивание фазового состояния динамических систем: Метод эллипсоидов / Ф. Л. Черноусько. - М. : Наука, 1988.
16. Astolfi A. Robust stabilization of the angular velocity of a rapid body / A. Astolfi, A. Rapaport // Systems and control letters. - 1998. - Vol. 34. - P. 257-264.
17. Brokett R. W. Asymptotic stability and feedback stabilization / R. W. Brokett // Differential Geometric Control Theory / eds. Brokett R. W. [et al.]. - Boston : Birkhauser, 1983. - P. 181-191.
18. Kurzhanski A. B. Ellipsoidal calculus for estimation and control / A. B. Kurzhanski, I. Valyi. - Boston : Birkhauser, 1997. - 321 p.
19. Kurzhanski A. A. Ellipsoidal toolbox [Electronic recource] / A. A. Kurzhanski, P. Varaiya. - URL: http://code.google.com/p/ellipsoids, 2005.
V. N. Ushakov, A. R. Matviychuk, A. V. Ushakov, A. L. Kazakov
On the solutions construction of the problem of convergence to a fixed point in time
Abstract. One game pursuit problem with compact target set at the finite time moment is studied. The enquiry of its solution construction is researched.
Keywords: controlled system, game pursuit problem, reachable set, integral fusion
Ушаков Владимир Николаевич, доктор физико-математических наук, член-корреспондент РАН, Институт математики и механики УрО РАН, 620990, Екатеринбург, ул. Софьи Ковалевской, д. 16, тел.: (343)3753456 ([email protected])
Матвийчук Александр Ростиславович, кандидат физико-математических наук, научный сотрудник, Институт математики и механики УрО РАН, 620990, Екатеринбург, ул. Софьи Ковалевской, д. 16, тел.: (343)3753438 ([email protected])
Ушаков Андрей Владимирович, аспирант, Институт математики и механики УрО РАН, 620990, Екатеринбург, ул. Софьи Ковалевской, д. 16, тел.: (343)3753456 ([email protected])
Казаков Александр Леонидович, доктор физико-математических наук, главный научный сотрудник, Институт динамики систем и теории управления СО РАН, 664033, Иркутск, ул. Лермонтова, 134, а/я 292, тел.: (3952)453033, ([email protected])
Ushakov Vladimir, Institute of Mathematics and Mechanics of Ural linebreak Branch of the Russian Academy of Sciences, 16, S.Kovalevskaja street, Ekaterinburg, 620219, Corresponding Member of the RAS, Phone: (343)3753456 ([email protected])
Matviychuk Alexander, Institute of Mathematics and Mechanics of Ural Branch of the Russian Academy of Sciences, 16, S.Kovalevskaja street, Ekaterinburg, 620219, Researcher, Phone: (343)3753438 ([email protected]) Ushakov Andrey, Institute of Mathematics and Mechanics of Ural Branch of the Russian Academy of Sciences, 16, S.Kovalevskaja street, Ekaterinburg, 620219, PhD student, Phone: (343)3753456 ([email protected])
Kazakov Alexander, Institute for System Dynamics and Control Theory of Siberian Branch of Russian Academy of Sciences, 134, Lermontov street, Post Box 292 , Irkutsk, Russia, 664033, Chief Researcher,
Phone: (3952)453033, ([email protected])