Научная статья на тему 'О ВОССТАНОВЛЕНИИ НЕОПРЕДЕЛЕННОГО ПОСТОЯННОГО ПАРАМЕТРА НЕСКОЛЬКИМИ ПРОБНЫМИ УПРАВЛЕНИЯМИ'

О ВОССТАНОВЛЕНИИ НЕОПРЕДЕЛЕННОГО ПОСТОЯННОГО ПАРАМЕТРА НЕСКОЛЬКИМИ ПРОБНЫМИ УПРАВЛЕНИЯМИ Текст научной статьи по специальности «Математика»

CC BY
17
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЕМАЯ СИСТЕМА / ЗАДАЧА О СБЛИЖЕНИИ / НЕОПРЕДЕЛЕННЫЙ ПОСТОЯННЫЙ ПАРАМЕТР / ПРОБНОЕ УПРАВЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Ушаков Владимир Николаевич, Ершов Александр Анатольевич

Рассматривается управляемая система, содержащая постоянный векторный параметр, неизвестный управляющему лицу. Известно лишь множество возможных значений этого неопределенного параметра. Для данной управляемой системы поставлена задача о сближении с целевым множеством в заданный момент времени. Для решения задачи управления в самом начале движения производится восстановление неопределенного параметра путем последовательного кратковременного применения к управляемой системе нескольких пробных управляющих векторов и наблюдения за реакцией на них управляемой системы. Выбор набора пробных управляющих векторов предлагается проводить с точки зрения минимизации погрешности восстановления неопределенного параметра. В отличие от предшествующих работ, рассмотрен более общий случай, когда одного пробного управляющего постоянного вектора недостаточно для однозначного восстановления неопределенного параметра, и, кроме того, для аппроксимации скорости движения применена центральная разностная производная системы вместо правой разностной производной. В качестве примера рассмотрена задача управления маятником с неизвестными коэффициентом трения и коэффициентом упругости пружины.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О ВОССТАНОВЛЕНИИ НЕОПРЕДЕЛЕННОГО ПОСТОЯННОГО ПАРАМЕТРА НЕСКОЛЬКИМИ ПРОБНЫМИ УПРАВЛЕНИЯМИ»

ISSN 2074-1871 Уфимский математический журнал. Том 12. № 4 (2020). С. 101-116.

УДК 517.977.12

О ВОССТАНОВЛЕНИИ НЕОПРЕДЕЛЕННОГО ПОСТОЯННОГО ПАРАМЕТРА НЕСКОЛЬКИМИ ПРОБНЫМИ УПРАВЛЕНИЯМИ

В.Н. УШАКОВ, A.A. ЕРШОВ

Аннотация. Рассматривается управляемая система, содержащая постоянный векторный параметр, неизвестный управляющему лицу. Известно лишь множество возможных значений этого неопределенного параметра. Для данной управляемой системы поставлена задача о сближении с целевым множеством в заданный момент времени. Для решения задачи управления в самом начале движения производится восстановление неопределенного параметра путем последовательного кратковременного применения к управляемой системе нескольких пробных управляющих векторов и наблюдения за реакцией на них управляемой системы. Выбор набора пробных управляющих векторов предлагается проводить с точки зрения минимизации погрешности восстановления неопределенного параметра. В отличие от предшествующих работ, рассмотрен более общий случай, когда одного пробного управляющего постоянного вектора недостаточно для однозначного восстановления неопределенного параметра, и, кроме того, для аппроксимации скорости движения применена центральная разностная производная системы вместо правой разностной производной. В качестве примера рассмотрена задача управления маятником с неизвестными коэффициентом трения и коэффициентом упругости пружины.

Ключевые слова: управляемая система, задача о сближении, неопределенный постоянный параметр, пробное управление.

Mathematics Subject Classification: 93С41

1. Введение

Работа посвящена изучению задачи о сближении нелинейной управляемой системы с компактным целевым множеством в конечномерном фазовом пространстве (см., напр., [1,2]). Особенностью рассматриваемой в работе задачи является наличие в системе неопределенного постоянного параметра, неизвестного лицу, формирующему управление. В качестве близкой по тематике работы, в которой была рассмотрена система с неопределенным постоянным параметром или, как отдельный вариант, неизвестной функцией, можно привести работу В.М. Велиова [3]. Однако, в той работе постоянный параметр фактически являлся управляющим вектором единственного игрока. Заметим, что нашу задачу можно трактовать как игровую задачу о сближении, в которой первый игрок, формирующий программные (за исключением небольшого начального промежутка времени) управления, стремится сблизить систему с целевым множеством, а второй игрок, владеющий выбором значений постоянного параметра, стремится противодействовать первому игроку в достижении цели. Гораздо более близкой по тематике к настоящей работе является работа М.С. Никольского [4], в которой вместо неопределенного параметра восстанавливается

V.N. Ushakov, A.A. Ershov, On recovering of unknown constant parameter by several test

controls.

© Ушаков B.H., Ершов A.A. 2020.

Исследование выполнено за счет средств гранта Российского научного фонда (проект № 15-11-10018).

Поступила 13 сентября 2020 г.

неопределенное начальное состояние на начальном промежутке движения управляемой системы. Кроме того, к тематике данной работы примыкают задачи теории динамического обращения, основы которой были развиты в работах [5, 6, 7].

Ранее, в работе [8] представлена схема конструирования управления, решающего с определенной степенью точности такую задачу о сближении из начальных позиций, принадлежащих некоторой аппроксимации множества разрешимости. Однако, в ней было использовано допущение, что мы можем абсолютно точно измерять фазовую переменную управляемой системы на начальном промежутке времени, В работе [9] это допущение было заменено на условие о том, что измерения фазовой переменной имеют ограниченную ошибку, В обоих случаях схема решения состояла из двух основных этапов: приближенного восстановления неопределенного параметра путем кратковременного применения пробного управления и последующего решения задачи о сближении стандартным пиксельным методом с использованием найденного постоянного параметра, В [8, 9] были получены оценки дополнительной погрешности вывода управляемой системы на целевое множество, возникающей из-за неточного восстановления неопределенного постоянного параметра.

Настоящая работа направлена на обобщение алгоритма восстановления неопределенного параметра на тот случай, когда кратковременного пробного управления в виде одного постоянного вектора недостаточно. Кроме того, в данной работе получены более точные оценки по сравнению с ранее полученными оценками в случае, когда применяется один вектор пробного управления. Улучшение точности достигнуто за счет применения центральной разностной производной для аппроксимации скорости движения системы вместо правой разностной производной. Заметим, однако, что для существенного уменьшения погрешности до второго порядка точности необходимы более строгие требования на гладкость вектор-функции в правой части управляемой системы дифференциальных уравнений.

2. Постановка задачи о сближении Пусть па промежутке времени [¿0,$] (¿о < $ < то) задана управляемая система

^ = /(*,*(*),«(*), а), (21)

х(£0) = х(0),

где £ — время, х(£) € Кп — фазовый вектор системы, (£0,х(0)) — начальное положение системы, и (¿) — допустимое управление, а — постоянный параметр, удовлетворяющий включению а € & € еошр(М9),

Здесь — евклидово пространство раз мерности к, сошр(Мк) — пространство компактов вКкс хауедорфовой метрикой.

Под допустимым управлением и(£), £ € [¿0, $], понимаем измеримую по Лебегу на [¿0,$] вектор-функцию со значениями в Р, где Р € еошр(Мр), Каждому допустимому управлению и(£) соответствует движение х(£), являющееся решением системы (2,1) в классе абсолютно непрерывных функций [10, §2,1],

Предполагаем г,ыполисными следующие условия,

А1. Вектор-функция / (¿,х, и,а) определена, непрерывна на [¿0,$] х Кп х Р х & и для любой ограниченной и замкнутой области П С [¿0, $] х Кп найдется такая константа Ь = Ь(П) € (0, то), что

||/(£,х(1), и, а) - /(¿, х(2), и, а)|| ^ Ь||х(1) - х(2) ||,

(£,хИ,и,а) € П х Р х &, г = 1, 2;

здесь || • || — евклидовая норма вектора в К . А2. Найдется такое 7 € (0, то), что

||/(¿,х,и,а)|| ^ 7(1 + ||х||), (¿,х,и,а) € [¿0, то) х х Р х &.

АЗ. Пусть N — некоторое натуральное число, А > 0. Вектор-функция /(¿, х, и, а) дважды непрерывно дифференцируема по совокупности переменных ¿и х на [¿0, ¿0 + N А] х при любых и € Р и а €

А4. Пусть задан набор {и(1), ...,и(мвекторов из Р. При некотором а € & кусочно-постоянное управление и(Ь) = и^ при £ € [¿о + (к — 1)А, ¿о + кА), к = порож-

дает движение х(£) на промежутке [¿0,£0 + N А], Обозначим многозначную функцию Р(£,х,и) = {/(¿, х, и, а) : а Е =£?}. Тогда существует такое семейство однозначных отображений

А т\ „/. /, т 1'

+ х ... х + ^ - -) А, х{м\ /») ^

Д1) хХЮ что

/(*> + (А: - ««а^, • • .., /(">)) = /(*>

для любых А, х1-^, и точек х!^ из достаточно больших окрест-

точек х^0 + — ' ^ =

При этом существует функция к(А) ^ 0 при А ^ 0 такая, что

I с^ [х ^ ,..., х

/ N

Па(1), • • •, /*(л°) - «II ^ *( ЕЬ*И° " 4° + (* ~ \)А)

N 1 1

+ Е & | ^ - / (¿о + - ^) А) ^ (¿о + - 2)А > , «

где коэффициенты Ьк ^ 0 и ^ 0 для всех к = 1, N.

Определение 2.1. Постоянные векторы из набора {и(1), )}, определенного в

условии А4, будем в дальнейшем называть пробными у правлениям,и.

Замечание 2.1. Заметим,, что отображение а задается, не только точками {х(1),..., х^)} в фазовом пространстве, но и набором пробных управлений {и(1),..., и^)}. Однако эту зависимость мы не отражаем в ее записи.

Пусть некоторый компакт М С — целевое множество для системы (2.1). Прежде чем приступить к постановке и обсуждению задач, относящихся к сближению М

управление системой (2.1).

В начальный момент времени ¿0 промежутка [¿0, $] в системе (2.1) реализовано некоторое значение а € и именно оно присутствует в системе (2.1) в течение всего промежутка [¿0, $]; в то же время в начш1ьный момент времени ¿0 это значение а неизвестно лицу,

и

что лицу, осуществляющему выбор и, известно лишь само ограничение &. Данный вариант при условии возможности точного измерения фазовой переменной х(£) был рассмотрен в работе [8].

В отличие от работы [8], здесь мы считаем, что можем измерять фазовую переменную х(£) лишь с погрешностью, не превосходящей 5, т.е.

||х*(¿) - х(*)|| ^ 5, (2.2)

где х*(£) — результат измерения х(£).

Тем самым мы обсудили информационные условия.

Задачу о сближении с целевым множеством M для системы (2,1) можно решать поэтапно, путем решения следующих двух задач.

Задача 1. Требуется приближенно выделить присутствующее в системе (2.1) значение а g L.

Задача 2. Требуется сконструировать программное управление, переводящее движение x(t) системы (2,1) в .малую окрестность целевого множества M в момент времени д.

Задачу 2 можно решать, применяя стандартные методы (пиксельные методы [12] конструирования и представления множеств разрешимости задачи о сближении, метод экстремального прицеливания H.H. Красовского [13, 14]) и используя приближенно восстановленное значение параметра. Оценка возникающей при этом дополнительной погрешности выполнена в работе [8], Поэтому настоящая работа посвящена решению задачи 1,

3. Задача 1. Восстановление неопределенного параметра

Сформулируем алгоритм приближенного восстановления неопределенного параметра а g L.

Алгоритм 3.1.

1) Выбираем набор пробных управлений {u(1),..., -1} и последовательно применяем их на промежутках [t0 + (k — l)A,t0 + кА), к = 1 ,N. В результате на промежутке времени [t0,t0 + N А] будет реализовано некоторое движение системы (2.1), которое обозначим, через x(t).

j _

2) В моменты времени t0 + - А, j = 0, 2N, измеряем фазовую переменную системы (2.1). В результате получаем значения, х* (t0 + > удовлетворяющие неравенствам

x*(tn + J-A) -x(tn + J-A

^ 5, j = 0, 2N.

3) Для, каждого k = 1, N вычисляем вектор

f

{k) _ x*(t0 + kA) - x*(t0 + (fc - 1)A) А

1 w ,/ ,, Ь

и его проекцию на множество р(^0+(к — А, ж* + {к — 2)^) > ^^ ■ В зависим,ости

от вида этого множества выбираем, аналитический или численный способ построения проекций [8, §5] с погрешностью

11/*к) - /(?11 <Р, (3-1)

где /$ — точная проекция, /*к) — приближенная проекция.

4) Находим приближенное значение а* € & параметра а € & из системы, уравнений

/(*«> + (к- \)А, х* (¿о +{к-\) А), «<*>, а*) = к = (3.2)

Замечание 3.1. В силу условия А4- решение системы (3.2) существует и устойчиво относительно возмущений правой части, и результатов измерений фазовой переменной

Перейдем к оценке точности алгоритма 3,1, С помощью леммы Гронуолла-Беллмана [15, гл. 1, §2, с, 26] легко получить следующее утверждение.

Лемма 3.1. Любое движение х(Т) управляемой системы (2.1) удовлетворяет неравенству

||х(Т) - х(0)|| ^ (Т - ¿0)К(Т),

где ¿0 ^ Т ^

К(Т) = тах{||/(¿,х,и, а)|| : ¿ € [¿0,Т],х € В(х(0), (||х(0)|| + 1)(е7(Т-4°) - 1)),и € Р, а € &}. Из леммы 3,1 и включения

В(х(0), (||х(0)|| + 1)(е7(т-4о) - 1)) С B(x*(¿о), (||х*&)|| + 5 + 1)(е7(т-4°) - 1) + 5) очевидным образом вытекает следующая оценка,

х(Т)

неравенству

||х(Т) - х(0)|| ^ (Т - ¿0)К*(Т),

где ¿0 ^ Т ^

К*(Т) =тах{/(¿,х,и,а) :

¿ € [¿0, Т], х € В(х*^о), (||х*^о)|| + 5 + 1)(в7(Т-4о) - 1) + 5), и € Р, а € &}.

Для формулировки основного результата настоящей статьи введем обозначения следующих постоянных:

К * ^А) = тах{||/ (¿, х, и, а) || : ¿ € [¿0 ,¿0 +

х € B(x*(¿о), (^(¿о)! + 5 + 1)(е7^ - 1) + 5), и € Р, а € &},

К1 =тах

д/ д/

— (¿, х,и,а) + ж, и, а)ж, и, а)

д Ь дх

¿ € [¿о,*о + N А], х € В (х*(0), N А • К *^А)),и € Р, а € & К2 = тах

д/ ч д2 / д<£. . д^.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-7-— х,и,а) + _ _ х,и,а) + -7— х,и,а) + -7— х,и,а)1и,х,и,а)

д¿2 д¿дx д¿ дх

¿ € [¿о,*о + N А], х € В (х* (0), N А • К ^А)),и € Р,а € , где функция

д/

</?(£, ж, и, а) = — (¿, ж, и, а) ■ ж, и, а).

Теорема 3.1. Пусть а* — восстановленное с помощью алгоритма 3.1 значение пара-а

Тогда

N

N

аа

^ к(5^6* + (р + ¿5 + г(А)) ^вк

к=1

к=1

где

Г(Д) = « +

1 ; А 12

(3.3)

(3.4)

Доказательство. В силу свойства А4

N

\а* - а|| ^ к\ 7 бк ^=1

N

^ +(£--)д)-ж(*0+(£--) д)

к=1

N 1 1

+ - / (¿о + (А; - + (* - 2

к=1

(3.5)

По условию (2,2) погрешность измерения фазовой переменной не превосходит величины 8, т.е.

N

5>

к=1

X

— X

N

85> к=1

(3.6)

Оценим

- /(¿о + (к- \)А,х(г0 + (к- \)А,и^,а)

к = 1,ЛТ.

Выберем произвольный помер к и зафиксируем его. Из неравенства треугольника для нормы, (3.1) и условия Л 1 следует, что

йк) -/(*,+ (*- + (к- \)А,и^,а)

<

< Р +

+

X

- >

и(к), а

, и(к), а

& -¡(ь0+{к--)А,х* (¿о + (к - -).А

+ Ь8 1

и(к), а

+ Ь8

/(к) -

и(к), а

+ Ь8

^ Р + Ь8 + 2

х*(¿о + кА) - х*(¿о + (к - 1)Д) х(г0 + кД) - х(г0 + (к - 1)Д)

Д

А

х(г0 + кД) - х(г0 + (к - 1)Д)

+2

„ 48 2 ^Р + Ы+А+А

г, 48 2 -р + Ы+А+А

х(

48 2

г Г 48 Д2 -Р + Ы+А + П

Д

¿0+кД /

¿0+(к-1)Д

¿0+кД /

¿0+(к-1)Д

¿0+кД /

¿0+(к-1)Д

¿0+кД /

¿0+(к-1)Д

- / (¿0 + - д, X (¿0 + (А; - д, И(к), а)

/(т,х(т), и(к), а)

-/(¿о + (А: - Д,х(*0 + (Л; -

1 , 1 ь 2 ^2 \

+ 2 V ~ ~ ^ ~ 2^) )<*т

¿=£ /

(й2

/(¿, х(^), и(к), а)

Г1 А2

^р + Ь5 + — + —

Т£ 45 А2

4о+ЫД

/

*о+(Ы-1)Д

4о+ЫД /

*о+(Ы-1)Д

(Й2

/ (¿,ж(£),м(ы),а)

д£2 д^

д^дж

д^

(Л)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

,(ы)

д*

дх

45 А3

д/ д^

где £ € (¿о + (к — 1)А,^0 + кА), — и — обозначает частную производную функ-

д/

цпй /(•,•,•,•) и </?(•,•,•,•) по первому аргументу, —— — по второму. Также отметим, что

дх

х(£) € В(х*(0), N А • К *(ЖА)) в силу следствия 3,1 и что обеспечивает выполение последнего неравенства.

Соответственно выполняется

N

Е

Ы=1

вы ||/*(Ы) - /(¿о + (к - 1)А,х(*0 + (к - 1)А,и(ы), а) II ^ (р + + г(А)) Vвы. (3.7)

те

ы=1

Подставляя (3,6) и (3,7) в (3,5), получаем утверждение теоремы.

Замечание 3.2. Для практического применения теоремы 3.1 'точные значения КА) и К2 можно заменить их оценками КА) ^ КА) и К2 ^ К2. Кроме того,

А

достигается, минимум г (А) (либо минимум оценочной функции г(А) = 45/А+А3Х2/12у).

I ^

Как несложно заметить, этим значением является А0 = 2 л4/-—.

К2

Заметим, что в нашем алгоритме 1 число необходимых измерений фазовой переменной выросло примерно в два раза по сравнению с алгоритмом, использующим правую разностную производную для аппроксимации скорости движения системы (2,1) (такой алгоритм сформулирован в [9] для случая, когда набор пробных управлений состоит из одного вектора), Поэтому рассмотрим усовершепстваппый алгоритм 2, отличающийся от алгоритма 1 следующим единственным пунктом,

2. В моменты, времени Ьо+]А, ] = О, N, измеряем фазовую переменную системы (2.1).

В результате получаем значения х* (¿0 + ] А), удовлетворяющие неравенствам

\x*(to+JA)-x(to+JA)\\^6, j = 0,N.

И кроме того, определим,

1, N.

И теперь оценим, насколько в этом случае увеличится погрешность восстановления неопределенного параметра.

Теорема 3.2. Пусть а* — восстановленное с помощью алгоритма 2 значение параметра а в си,стем,е (2.1).

Тогда

аа

N N

^ ^ Ьк + (р + ¿8 + р(Д)) £ вк),

(3.8)

к=1

к=1

где

48 д2 д3

о А = -г + — + —

/л ) д -г 8 -г 12

Доказательство. Для получения видоизмененной оценки (3.8) для алгоритма 2 доетаточ-

1. 21 Ч . / 1

но заново оценить (при к = 1, ./V) норму

1

/ (*„+ (к - -) а, ж* (¿0 + (к - -) а) , , а)

" / (*о + (Л " а, ж (¿о + (к - а) , «(*>, а)

которая при доказательстве теоремы 3.1 была оценена величиной ¿8.

Итак, выберем и зафиксируем произвольное натуральное значение к от 1 до N. Оценим

(¿о +{к - -)а) - + (к - -) А)

х*(¿0 + (к - 1)д) + х*(¿0 + кд) х(г0 + (к - 1)д) + х(г0 + кд)

х(*0 + (к - 1)д)+ х(*0 + кд)

^ 8 +

¿0+кД

Ь0+(к-±) А

- -

х(т )Нт

8+

8+

¿0+ §) А

¿0+кД

¿0+(к-1)Д

/(т,х(т),и(к),а)Нт -

*о+(М)А

/ (т,х(т ),и(к),а)Нт

¿0+(к-1)Д

¿0+кД

/ (¿0 + (к - а, ж (¿0 + (к - а) , и^, а)

Н

1 2

Н

¿0+ (^С—§) А

¿0+(к-1)Д

+ *(*),«<*>, а)

^б + ^кг а2,

о

/(¿о + (к - -)Д,ж(*0 + (А; - -)д)Уки)

•(г-^о-(к-^)А))^

2

2

2

где числа £ € + (к — ¿о + кЛ^ и ц е + (к — 1)Д, ¿0 + (к _ иозиикают

при разложении функции /(т, х(т),и(к\а) в ряд Тейлора с остаточным членом в форме Лагранжа,

Соответственно, с учетом условия А1 получаем, что

1.

/(¿о +(к - -) Д, х* (¿о + (А: - -).д) , «<*\ а

" / (*о + ^ " Д, * (¿о + {к - Д), «<*>, а

+ -ЬКгА2.

8

Остальное доказательство в точности повторяет доказательство теоремы 3.1.

Замечание 3.3. В данном случае (при использовании алгоритма, 2) выбор величины Д целесообразно производить исходя из минимизации функции

р(Д) = — Н—ЬКгА2 Н—-К2А3 или некоторой ее оценки р(Д).

Д 8

12

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Пример

Пусть на промежутке времени [¿0,$] = [0, то) задан пружинный маятник (рис. 1).

и2

и

1 1 / 1 / 1 1 и1 х1

V, А А

V, V V 0

У///////, У/у У/////////

\ тд

Рис. 1. Схема пружинного маятника

Его поведение описывается системой дифференциальных уравнений X1 = Х2,

и1 х^ (тд — и2)вщп(х2).

---Ь--к2,

т т т

X 2

(4.1)

если х2 > 0 ют и |и1 — х1 к11 > (тд — и2)к2, 0, если х2 = 0 и |и1 — х1к1| ^ (тд — и2)к2,

х*(0) = (1, —1),

где х1 (¿) — отклонение тела от положения равновесия по горизонтали и х2(£) — скорость тела, и = (и1,и2) € Р — управляющая сила, т = 0.11 — масса тела, д = 9.807 —

к1

к2 — неизвестный нам коэффициент трения скольжения, х*(0) — результат измерения начатьного положения х(0).

Заметим, что, как правило, сила трения покоя немного превышает силу трения скольжения: для того чтобы сдвинуть тело маятника с места, потребуется немного большее усилие, чем для продолжения движения. Однако, в системе (4,1) данное физическое явление не учитывается, как и любые другие возможные улучшения математической модели.

Пусть ограничением на вектор управления и = (и^и2) является шар Р = {и : ||и|| ^ 1}, Кроме того, до начала движения известно, что (кьк2) £ ^ = [0.1,0.8] х [0.1,0.5]. Будем считать, что фазовую переменную х = (х1, х2) мы можем измерять с погрешностью, не превосходящей 6 = 0.0001.

Задача состоит в том, чтобы наиболее точным образом определить неизвестный нам векторный параметр а = (к1,к2) па коротком начальном промежутке времени.

Выберем оптимальные значения параметров алгоритма 3.1 и оценим соответствующую им погрешность восстановления неопределенного параметра по теореме 3.1.

Прежде всего заметим, что в некоторой окрестности начального момента ¿0 = 0 за счет

х2 = 0

х1 = х2,

и1 х^ тд — и2

---к 1--к2,

т т т

х2

х* (0) = (1,1),

(4.2)

и удовлетворяет условиями теоремы 3.1.

Определим необходимое число пробных управлений. В матричном виде система (4.2) имеет следующий вид:

х2 и1 т

0

х1 т

0

тд — щ т

00

В силу того, что определитель матрицы I х1 тд — и2 I нулевой, вектор парамет-

тт

ров ( 1 ) те восстанавливается то одному наблюдению за вектором ( 1 \«2/ " 2 Таким образом, N = 2, то есть минимальный набор пробных управлений состоит из двух векторов и(1^ и и(2).

Прежде чем переходить к дальнейшим оценками постоянных, докажем вспомогательное утверждение.

Лемма 4.1. Любые числа а = 0 Ь X У удовлетворяют неравенству

л/(ах + Ь)2 + у2 ^ л/ТТ^^л/х2 + у2+

Доказательство. Используя неравенство Коши-Буняковекого для пары векторов (а2,1),

ь ^

х н— ) , у2 ) и неравенство а4 + Ь4 ^ л/«2 + Ь2, получаем, что

(аж + Ь)2 + у2 = ^а2(х -\—^ + у2

Здесь последнее неравенство следует из неравенства треугольника < |АВ| + |ВД

для ДАВД изображенного на рис, 2,

Я

Рис. 2. Треугольник ААБВ

Лемма доказана. □

Применяя лемму 4.1, оценим норму функции / (¿, х,щ,а) в правой части системы (4.2):

2 I Щ ^ 7 \

/(¿,ж,м,0!) = \ х% +--дк2А--к2--хх

V ш т т /

< \П+(-)*[ М +

т

кг

тт Щ — дк2т + щ2к2

к1

^ У1 + (т) + |_1М1\Л + -

^1+ + VI + 0.82 + 9.81 • 0.8 • О.п)

= 4.55||х|| + 19.49 ^ 19.5(||х|| + 1).

Следовательно, 7 = 19.5. Далее,

К*(2Д) = шах{||/(¿,ж,щ,а)|| : * € [0, 2Д],

х € В(ж*(*о), (||ж*(*о)|| + + 1)(е7ДМ — 1) + 5),Щ € Р,а € &} ^ шах{4.55||х|| + 19.49 : ||х| ^ 2.0001е39А — 1} ^ 9.105е39А + 14.94.

Отсюда, К*(2Д) = 9.105е39А + 14.94.

Поскольку в нашем случае множества

1

^ (¿о + (к - А, ж* (¿о + (к - А) , г/**) , к = 1,2,

представляют собой отрезки на плоскости, то будем считать, что мы можем аналитически построить точную проекцию на них из любой точки фазового пространства, иными словами, р = 0,

Теперь определим постоянную Липшица Ь, Используя неравенство Коши-Буняковекого, оценим норму разности

т

т 1 08

0.11

^ 7.342- ||х(1^ — х(2)|

|х(1) _ х(2)|

х(1) х(2)

т.е. Ь = 7.342.

Вычислив функцию

д/

^(Ь, х, и, а) = — (¿, х, и, а) ■ /(¿, х, и, а)

/дЬ дЬ\

дх1 дх2

дЬ дЬ

\дх1 дх2/

/1 /2

01

0

х2

и1 — к1х1 + к2и2

/и1 — &1х1 + к2и2 , \

(--9^2

т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т

и ее производную

т

<9^1 \

дх1 дх2

дх <9</?2 <9</?2

\дх1 дх2/

( _к\ т

^1х2

т

V

о --

т

оцепим с помощью леммы 4.1 постоянную

К2 = тах (

и1 — к1х1 + к2и2

т

(х, и, а) £ В(х* (0),6 + N А ■ К *(NA)) х Р х &

^ тах { —\1 +1 — I I ||ж| тт

кг\4

иг + к2и2 - дк2т\ к1т )

||х|| ^ ||х*(0) || + 6 + N А ■ К *(N А), и = (—1, 0), (А;^) = (0.5, 0.8) Ограничим сверху величину А ^ 0.058, где 0.058 есть решение уравнения

6

А* 4Д , Дл4,

: тах < — \ 1 + — ) | ||:г|

К2(А) 1 т V \т,

щ + к2и2 - дк2т\ к1т у

*

х ^ х

+ 6 + N А ■ К А), и = (—1,0), (кь&2) = (0.5,0.8)

0

1

Д

Тогда получаем оценку К2 ^ К2 = 142 и, в соответствии в замечанием 3,2, оптимальное значение

До = 2 = 0.058 К 2

При этом оценочная функция

г(Ао) = д^ + ~1Г

0.0092.

Построим функцию к. После применения алгоритма 3.1 будет получена система уравнений вида

и

(1)

к* и

(1)

22

т

— дк*—

к^-хЦ^А

т

/

(1), *,2 ,

и12) + к*и22)

— дк*—

К -жП-Д

/ (2) / *,2 ,

тт где а* = (к*, к*) — восстановленное значение параметра а = (кьк2), /*2 и /*22) — вто

,(к) х* (*о + кД) — х*(*о + (к — 1)Д)

рые компоненты проекции векторов р >

1 ^ . / 1

Д

к = 1, 2 на

множества -Р^о + (к — -) Д, ж* + (к — ' м<';г'>)> к = 1,2 соответственно.

Поскольку максимальная точность восстановления неопределенного параметра а = (к1, к2) достигается при наибольшем определителе этой системы, то определим пробные управления

и

(1)

(0,1),

и

(2)

(0, —1).

Тогда

а

к*

* к1 к2*

( т((тд - 1)Д(2) - (тд + 1)/^) ^ (1 + тд)х\ (±д) + (1 - тд)х\ (^д)

у (1 + тд)х\ (-Д) + (1 - тд)х\ (-д) у при этом точное значение параметра

( т((тд- 1)/22) - (тд + 1)721}) \ (1 + тд)х 1 (-Д) + (1 - тд)х1 (-Д)

а=

к1

^ (1 + тд)х 1 д) + (1 - д) у

где обозначено

11

= /2 (-Д, ж (-Д),««, а), Аг> = /2 (- д, ж (- Д |,, а

3 Л /3 22

Д2)

1

*

*

*,2

1

*,2

2

2

3

1

к

2

т Х1 -А ИУ-Х1 -А И

2

2

2

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Используя данные выражения для а и а*, оценим

((тд ~ 1)| -\ + {тд + 1)\- |)

|к* - 1 ^

т

(1 + т.

т

+

т\(тд- г)^ - {тд + 1)/$ |

3

-I

2

х\ ( - А ) - хг ( - А) + х\ ( - А ) - хг ( - А

(1 + тд)х\ (-А) + (1 - тд)х\ (-Д)

(1 + т

т

| к* — к21 ^

т

(1 + т

т

(И йА) -И-$ I+К (IИ-$-I ^ йА) -+ К йА) I • -

т

(1 + - (1-

(1 + тд)

т

Поскольку 8 и Д относительно малы, то

-А) -(1-шд)Ж1(-Д

х

*'3Д

х

х

Д

х

Д

х* (0)

2 ) \2 / \2 ) \2 -?(!) ..Ш .4 Г2) _.-?(2)

х

(0)

Л(1) « /(1) « /(¿о,*(0),Л(2) ~ /(2)

С учетом этих приближенных равенств можно получить следующие приближенные

оценки:

1*1" ^ - 1)||Л(2) - /2)|| + + 1)||Л(1) - /

(1)

2|х1

+

т ■ тах I(тд — 1)/2(£0, х(0),и(2), а) — (тд + 1)/2(£0, х(0), и(1), а

ае^ 1

4(х*(0))'

х

+

Х'{2А)-Х{-2А

¡0.4

ж1 ( -А - х{ -А

+ 0.4

+ 0.114||/(1)-7(1)||+0.004||/(2)-7

(2)

3

1

1^2 - к2| ^

т

. , 1И тах I /*2(¿о, х*(0), и^, а) I 2|х1(0)К 1 1 0 1 ; Л

+ тах 1 /2 (¿о, х2 (0), и(2), а)1 1 1

1

Х[32А)~Х(1А

1

ж* -А -Ж1 -А

+ К(о)|-||Л(1)-/(1)|| + К(°)1-||/*(2)-/(2)||)

+

тах | /2(1) (¿о, х2 (0), и(1), а) - /2^ (¿о, х2 (0), и(2), а) | «е%

4тд2|х1

((1 + (1Д) - ж(±д) | + (тд - 1)||ж2 (|д) - ж(^д) ||)

1.634

х' ( -А - х{ -Д

+ 0.447

Х[32А)-Х(1А

+ 0.055||/(1)-/(1)||+0-055||Л(2)-/

(2)

а

- а\\ ^ л/^-кг^ + Щ-Ц ^ Iк\ - кг\ + |к* - к2\

^ 2.034

х

22

(1) |

+ 0.847

х' ( -А ) — х

+ 0.169||/(1)-/и||+0.059||/(2)-/

(2)

Таким образом,

х Ь

х2(-Д) -жЛ-Д

Ь2

2.034

Х[12А)-Х(\А

+т1)-7(1)\\+ш2)-1{2)\\)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ 0.847 х2(^д) -х(^А) + О.169||/(1)-7(1)||+О.059||/(2)-7(2)||.

Отсюда получаем следующую (довольно грубую) оценку погрешности восстановления неопределенного параметра:

а

- а|| ^ 5 ■ (Ь1 + Ь2) + г(Д0) ■ (в1 + в2)) = 2.8815 + 0.228г(Д0) = 0.00239.

5. Заключение

Полученная в теореме 3.1 оценка погрешности восстановления неопределенного пара-а

г,од нон на центральную разностную производную. Данная схема решения задачи о сближении обладает тем недостатком, что после восстановления неопределенного параметра остается относительно мало времени на построение разрешающего программного управления. В связи с этим дальнейшие исследования можно направить на решение задачи по эффективному хранению заранее подготовленных разрешающих программных управлений при различных, специальным образом выбранных значениях параметра в управляемой системе и аппроксимации разрешающего управления на оставшиеся значения параметра.

СПИСОК ЛИТЕРАТУРЫ

1. Красовский H.H. Игровые задачи о встрече движений. М.: Наука. 1970.

2. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука. 1974.

3. V.M. Veliov Parametric and functional uncertainties in dynamic system,s local and global relationship, Computer Arithmetic and Enclosure Methods, North-Holland, Amsterdam (1992).

4. Никольский M.C. Об одной задаче управления с неполностью известным начальным, условием II Прикл. матем. и информ. 51, 16-23 (2016).

5. Осипов Ю.С., Кряжимский A.B., Максимов В.Н. Методы динамического восстановления входов управляемых систем. Екатеринбург: Изд-во УрО РАН. 2011.

6. Максимов В.Н. Задачи динамического восстановления входов бесконечномерных систем. Екатеринбург: Изд-во УрО РАН. 2000.

7. Денисов A.M. Введение в т,еорию обратных задач. М.: Изд-во МГУ. 1994.

8. Ершов A.A., Ушаков В.Н. О сближении управляемой системы, содержащей неопределенный параметр // Матем. сб. 208:9, 56-99 (2017).

9. V.N. Ushakov, A.A. Ershov, A.V. Ushakov An Approach Problem, with an Unknown Parameter and Inaccurately Measured Motion of the System // IFAC-PapersOnLine 51:32, 234-238 (2018).

10. Брессан А., Пикколи Б. Введение в математическую т,еорию управления. М.-Ижевск: Институт компьютерных исследований. 2015.

11. Михлин С.Г. Курс математической физики. М.: Наука. 1968.

12. Новикова А.О. Построение множеств достижимости двумерных нелинейных управляемых систем пиксельным методом // Труды «Прикладная математика и информатика» 50, 62-82 (2015).

13. Лемак С.С. К вопросу о формировании позиционных стратегий дифференциальной игры в методе экстремального прицеливания H.H. Красовского // Вестн. Моск. ун-та. Сер. 1. Матем., мех. 6, 61-65 (2015).

14. Ушаков В.Н., Матвийчук А.Р., Паршиков Г.В. Метод построения, разрешающего управления задачи о сближении, основанный на притягивании к множеству разрешимости // Тр. ИММ УрО РАН. 19:2, 275-284 (2013).

15. Лизоркин П.И. Курс дифференциальных и интегральных уравнений с дополнительным,и главам,и, анализа,. М.: Наука. 1981.

Владимир Николаевич Ушаков,

Институт математики и механики им. H.H. Красовского УрО РАН, ул. Софьи Ковалевской, 16, 620108, г. Екатеринбург, Россия E-mail: ushak@imm. uran. ru

Александр Анатольевич Ершов,

Институт математики и механики им. H.H. Красовского УрО РАН, ул. Софьи Ковалевской, 16, 620108, г. Екатеринбург, Россия E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.