Научная статья на тему 'КОРРЕКЦИЯ ДВИЖЕНИЯ УПРАВЛЯЕМОГО ДИНАМИЧЕСКОГО ОБЪЕКТА В УСЛОВИЯХ ВОЗДЕЙСТВИЯ НА НЕГО НЕКОНТРОЛИРУЕМОЙ ПОМЕХИ'

КОРРЕКЦИЯ ДВИЖЕНИЯ УПРАВЛЯЕМОГО ДИНАМИЧЕСКОГО ОБЪЕКТА В УСЛОВИЯХ ВОЗДЕЙСТВИЯ НА НЕГО НЕКОНТРОЛИРУЕМОЙ ПОМЕХИ Текст научной статьи по специальности «Математика»

CC BY
36
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗОВОЕ ДВИЖЕНИЕ / ВОЗМУЩЕННОЕ ДВИЖЕНИЕ / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ПОЗИЦИОННАЯ СТРАТЕГИЯ / ПРОГРАММНОЕ УПРАВЛЕНИЕ / BASIC MOTION / PERTURBED MOTION / DIFFERENTIAL GAMES / POSITIONAL STRATEGY / PROGRAM STRATEGY

Аннотация научной статьи по математике, автор научной работы — Лутманов С. В.

Решена задача коррекции движения управляемого динамического объекта в условиях воздействия на него неконтролируемой помехи. В ней представлены результаты, развивающие подход к исследованию управляемого движения, изложенного автором в работе [5]. Нейтрализация неблагоприятных воздействий помехи реализуется в статье в форме позиционной минимаксной стратегии игрока-союзника в дифференциальной игре двух лиц, в которой игрок-противник отождествляется с неконтролируемой помехой. Полученные результаты иллюстрируются на модельном примере.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CORRECTION OF THE MOTION OF A CONTROLLED DYNAMIC OBJECT UNDER CONDITIONS OF UNCONTROLLED INTERFERENCE

In the article the problem of motion correction for dynamic managed object in conditions of exposure to uncontrolled interference. It is a further development of the approach to the study of driven motion, described by the author in previous works. The neutralization of the adverse effects of interference is realized in the article in the form of positional strategy used by player-ally in the differential game of two persons. In this game the player-the enemy is identified with uncontrolled interference. The results are illustrated with an example.

Текст научной работы на тему «КОРРЕКЦИЯ ДВИЖЕНИЯ УПРАВЛЯЕМОГО ДИНАМИЧЕСКОГО ОБЪЕКТА В УСЛОВИЯХ ВОЗДЕЙСТВИЯ НА НЕГО НЕКОНТРОЛИРУЕМОЙ ПОМЕХИ»

2019

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика

Вып. 1(44)

УДК 519.7

Коррекция движения управляемого динамического объекта в условиях воздействия на него неконтролируемой помехи

С. В. Лутманов

Пермский государственный национальный исследовательский университет Россия, 614990, г. Пермь, ул. Букирева, 15 mpu@psu.ru; 8(342) 239-63-09

Решена задача коррекции движения управляемого динамического объекта в условиях воздействия на него неконтролируемой помехи. В ней представлены результаты, развивающие подход к исследованию управляемого движения, изложенного автором в работе [5]. Нейтрализация неблагоприятных воздействий помехи реализуется в статье в форме позиционной минимаксной стратегии игрока-союзника в дифференциальной игре двух лиц, в которой игрок-противник отождествляется с неконтролируемой помехой. Полученные результаты иллюстрируются на модельном примере.

Ключевые слова: базовое движение; возмущенное движение; дифференциальная игра; позиционная стратегия; программное управление.

DOI: 10.17072/1993-0550-2019-1-14-21

1. Дифференциальные уравнения движения и постановка задачи

Рассматривается управляемый объект, динамика которого допускает приближенное описание обыкновенным векторным дифференциальным уравнением

у = Г(г,у,м'), (1.1)

где г е Я1 — текущее время, у е Я" — фазовый вектор объекта, w е Яг — вектор управ-

7. Г)1+"+Г П"

. Я ^ Я вектор-функция, моделирующая как внутреннее устройство объекта, так и воздействие на него различных внешних факторов. Относительно функции У предполагается ее непрерывность по совокупности переменных, существование постоянной р > 0, для которой при всех г е Я1, у е Я", w е Яг справедливо неравенство

||У (у, w)||<р(l 41У ||)

© Лутманов С. В., 2019

и выполнение локального условия Липшица (равномерно по аргументам г и w) по переменной у . Последнее означает, что для любой ограниченной области G с Я" существует константа Ла > 0, для которой при всех у, у' е G справедливо неравенство

\\У (г, у, w) — У (г, у', w)|| <Ла\\у — у 'Ц,

w е Яг, г е Я1. Принимается также, что из уравнения (1.1) может быть выделена в явном виде зависимость вектора управляющих параметров от фазового вектора объекта, его производной и текущего времени

м> = Ж(г,у,у). (1.2)

Избавиться от неполной адекватности описания уравнением (1.1) динамического объекта можно, введя в его правую часть параметр V е Яг аддитивно управляющему параметру w . Параметр V е Яг будем трактовать как управляющее воздействие некоторого субъекта (в дальнейшем помехи), имеющего целью исказить точное описание динамики

процесса. Тогда уравнение (1.2) принимает вид

У = Г{1,у,м> + у), (1.3)

относительно которого принимается, что оно описывает динамику процесса точно.

Время функционирования управляемого динамического объекта фиксировано, т. е. t е [¿0, Т ]. В общем случае на фазовый вектор

объекта наложены геометрические ограничения, которые назовем фазовыми, в форме включения

у (t) е 7 (t)с Я", t е Т], (1.4)

где 7 ^)с Я, t е[t0, Т]— заданные выпуклые открытые множества. Относительно вектора управляющих параметров допускается, что для некоторых постановок задач он является произвольным, а для некоторых он подчинен геометрическим ограничениям в

форме включения w е Ж, где Ж с Яг — выпуклое компактное множество. Управляющие параметры помехи всегда ограничены: V е Q,

где Q с Яг — выпуклое компактное множество.

В статье исследуется и решается следующая задача управления динамическим объектом.

Задача 1. Построить управляющие воздействия на динамический объект, которые обеспечивали бы выполнение фазовых ограничений на всем промежутке времени функционирования объекта и перевод фазового вектора объекта из начального положения,

близкого к заданной точке у0 е 7 (t0) в заданное конечное положение ут е 7 (Т) при

любых допустимых реализациях управляющих параметров помехи.

2. Базовый кинематический закон движения динамического объекта и базовое программное управление

Введем понятие базового кинематического закона движения динамического объекта.

Определение 2. Будем говорить, что кинематический закон движения

у = у (t), t е [^, Т] динамического объекта

(1.1) является базовым, если

у (^) = у0> у (Т)= Ут,

у ^) е 7(t), t е[^,Т]. (2.1)

Заметим, что базовый закон не единственен, он не связан непосредственно с дифференциальными уравнениями движения и представляет собой некоторую виртуальную конструкцию, которая не обязана реализоваться в действительности в процессе управления динамическим объектом.

Приведем один прием построения базового закона движения. Промежуток времени

[Ч, Т ] разбиваем точками

^ = г гТг = гТг + А • • • гТг = гТг + А = т

s

на ^ промежутков. Далее в пространстве Я" нарабатывается набор точек

(*)

у = Ут ,

и по каждой координате производится интерполяция массива данных

1=1, —,И

полиномом

1 =0

Выбирая число промежутков * и величины степеней интерполяционных полиномов р., / = 1, • • •, п достаточно большими, можно добиться того, что кинематический закон

будет базовым.

Определение 3. Произвольную интегрируемую функцию w : [^, ТЯг назовем

программным управлением динамическим объектом.

Пусть у„ е Я" и w (•)— программное

управление. Символом у (•, ^, у„, w (•)) обозначим решение дифференциального уравнения (11) с начальными условиями у(^,) = у„. Это решение будем называть движением динамического объекта, выходящим из начального положения (^, у„) и порожденным программным управлением w (•) .

Определение 4. Будем говорить, что программное управление ММ (•) является базовым в паре с базовым законом движения у (•), если

У (•) = у (•>¡0,у0,м(•)) , у0 = У (г0) . (2.2)

Очевидно, что базовое программное управление необходимо удовлетворяет условию

= (2.3)

Заметим, что условие (2.3) не всегда является достаточным для того, чтобы программное управление ММ (•) было базовым. Поэтому

равенство (2.2) следует проверять непосредственно.

3. Общая схема решения задачи 1

Опишем основную идею решения задачи управления динамическим объектом, сформулированную в первом пункте. Она состоит в построении управления, вынуждающего объект двигаться из начального положения у0 е Z (г0), близкого к заданному положению у0 е Z (го), по кинематическому закону, который, начиная с некоторого момента времени г1 е [г0, Т], мало отличается от какого-либо базового закона движения у (•) . Выбирая момент времени ^ е [г0, Т ] достаточно близко к начальному го, можно добиться выполнения фазовых ограничений (1.4) и на промежутке времени [г0, ^ ].

Пусть (у (•), ММ (•)) пара, образованная

базовым движением и отвечающим ему базовым программным управлением. В случае, когда для начального положения у0 е Z (г0) динамического объекта выполнено условие уо = у0 + , &уо ^ 0, кинематический закон движения динамической системы у = у (г, ¡0, >о, ММ (•)), г е [¡0, Т], порожденный

базовым управлением м = ММ (г), г е [г0, Т], не

будет совпадать с базовым законом у(•) и

программное управление ММ (•) не обязано служить решением задачи 1.

Это утверждение тем более будет иметь место, если учитывать воздействие на объект неконтролируемой помехи.

Определение 5. Движение

у (•, ^ Уo, ММ (•)) назовем возмущенным движением, а разность (•) = у (•, ¡0, У0, М (•))-у (•) (3.1) - возмущением.

В дифференциальные уравнения математической модели динамического объекта вводится вектор дополнительных управляющих параметров и е Р, где Р ^ Яг — выпуклое компактное множество, аддитивно исходным управлениям. Дифференциальные уравнения движения тогда принимают вид

у = У^,у^ + и + у). (3.2)

Дополнительными управлениями следует распорядиться так, чтобы фазовый вектор возмущений (3.1) обратился в ноль в момент

времени ^ е [г0, Т ] и оставался таковым вплоть до конечного момента времени Т .

4. Сведение задачи о коррекции движения динамического объекта к дифференциальной игре

В работах [6,7] в предположении, что неконтролируемая помеха отсутствовала, задача обнуления возмущений в момент времени г1 е [г0, Т ] была решена в классе программных управлений. Решение задачи основывалось на аппроксимации возмущений фазовым вектором некоторого управляемого линейного динамического объекта. Динамика этого объекта описывалась дифференциальными уравнениями (1.1), линеаризованными в окрестности пары "базовое управление, базовое движение". Программное управление, решающее исходную задачу 1, имело вид

М

(г ) =

М

(г)+и0(г), ге^,г],

, (4.1)

^ М (г) г е[г, Т ]

где и0 (•)— программное управление, решающее задачу обнуления возмущений в момент времени г1 е [г0, Т ].

В данной работе принимается, что начиная с момента времени г е [г ,Т] на динамический объект действует неконтролируемая помеха. Тогда простое отключение про-

граммного управления и0 (•) в момент времени ^ е[^, Т], как это сделано в (4.1), не

обеспечивает дальнейшее совпадение откорректированного закона движения объекта с базовым законом движения. Указанное совпадение реализуется путем построения оптимальной гарантирующей стратегии игрока-союзника в дифференциальной игре, в которой игрок-противник отождествляется с неконтролируемой помехой. Цель игрока-противника состоит в предельном рассогласовании базового и корректируемого законов движения динамического объекта.

Оптимальная стратегия игрока-союзника является позиционной.

Определение 6. Позиционной стратегией и [•, •] игрока-союзника назовем произвольную функцию

и : [^,Т]хЯ" ^Р . В общем случае позиционная стратегия является разрывной по переменной у е Я". Отсюда вытекает необходимость формализовать движение динамического объекта как равномерный предел ломаных Эйлера. Следуя [2, 3] проведем эту формализацию.

Пусть А - конечное разбиение отрезка времени [/,, / ] точками Гл, .V = 0,1, • • •, г0 = .

Уа(0 = у*, УА (Ч ) = УА (t), uд(t ) = и , Уд(ч )] = const,

где vА (t) е Q, t е [t1, Т ] — произвольная интегрируемая реализация вектора управляющих параметров помехи.

Определение 7. Движением, выходящим из позиции , у„} и порожденным позиционной стратегией и [•, •], назовем всякую функцию у (•), для которой найдется последовательность ломаных Эйлера

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Уд„ = 1,2,-,

равномерно сходящаяся к ней на отрезке [^, Т ], при условии

lim sup(rip+\-z[p>) = 0.

p^-a

Совокупность всех движений, выходящих из позиции {t„, у„} и порожденных позиционной стратегией u [•, •], обозначим символом Y |jt„, У, u [•, -]J и назовем пучком конструктивных движений. Известно [2,3], что для любой позиции {t„, y„} и любой позиционной стратегией u [•, •], пучок

Y Цt„, У*, u [•, -]J содержит хотя бы одно движение. Заметим, что если

Y [^ У & ), u [•, •]] = {у (•)} , (4.2)

то по любому s > 0 найдется 8 > 0, что для любой ломаной Эйлера уд (•, ^, у (^ ), u [•, •]) будет иметь место неравенство

|уд(t, ^ у (ti), u [•, ])- у (t,

t e[ti, T] (4.3)

если sup(ri+i -rs)<8.

s

Таким образом, оптимальная гарантирующая стратегия игрока-союзника должна удовлетворять условиям (4.2).

5. Построение оптимальной гарантирующей стратегии игрока-союзника

Построение оптимальной гарантирующей стратегии игрока-союзника можно эффективно осуществить в следующих предположениях.

Предположение 1. Для любого вектора управляющих параметров помехи v е Q существует вектор управляющих параметров дополнительного управления u е P такой, что u + v = 0.

Предположение 2. Для всех s е Rn, t e[t, T], у е Rn имеет место равенство

: s • Y (t, у, w (t) + u + v) =

min max;

ueP veQ

= max min

veQ ueP

s • Y (t, у, w (t) + u + v) .

Заметим, что предположение 1 будет выполнено, если Р = ЛQ, Л > 1 и множество

Q с Яг симметрично относительно нуля.

s

Предположение 2 имеет место для функций У : Я1+"+г ^ Я" вида

У (г, у, М (г) + и + V ) =

= У(г, у, М (г)+и)+У(2) (г, у, М (г)+V).

Определение 8. Будем говорить, что множество £м с ^, Т]х Я" является стабильным для игрока-союзника, если для любой позиции (г„, у„) е £м, любого момента времени г * е [г„, Т ] и любого вектора управляющих параметров V е Q игрока-противника (неконтролируемой помехи) найдется вектор управляющих параметров и е Р игрока-союзника, что будет выполнено включение

у (г, 4, у,, М (•) + и + V )е $и ■

Из предположения 1 следует, что множество

5 = {( г, у )е[г1, Т ]х Я"\у = у (г)}

обладает свойством стабильности для игрока-союзника.

Определение 9. Будем говорить, что позиционная стратегия ие : [г, Т]х Я" ^ Р является экстремальной к множеству Би с [г,Т]хЯ", если

u

[t, У ] =

u

[t, y], (t, y Su,

из

veg

= min max.

ueP veg

Таким образом, в случае выполнения предположений 1, 2 решение основной задачи 1 реализуется следующим образом. На промежутке времени [г0, г1 ] строится программное управление и0 (•), решающее задачу обнуления вектора возмущений в момент времени гх, а далее управление динамическим

объектом производится по позиционной схеме, описанной в пункте 1.4. с использованием стратегии игрока-союзника, экстремальной к множеству

5 = {( г, у )е[г1, Т ]х Я"\у = у (г)}.

6. Иллюстрирующий пример

На рис. 1 изображен математический маятник, движущийся под действием управляющего момента м в среде с сопротивлением, пропорциональным скорости.

Vu e P, (t, y)e Su, где вектор u0 [t, y]e P определяется условия

max ^ (t, y) • Y (t, y, w (t) + u0 [t, y ] + v) =

\s (t, y )• Y (t, y, w (t) + u + v),

а вектор s (t, y) e Rn - из условия s (t, y ) = y (t)-X (t),

l|y(t)-4 (t )\\=xsiji )ll y(t)-4,

Su (t) = {x e Rn | (t, x) e Su} .

Из монографии [2] следует, что если выполнено предположение 2, то всякое движение, порожденное позиционным управлением, экстремальным к множеству SM с [^, T]х Rn и выходящее из начального положения (t„, y„)e Su, будет оставаться на множестве

S вплоть до момента времени T .

Рис. 1

Его динамика описывается дифференциальным уравнением

т12ф = -Ы2ф - mgl sin (р + w =>

.. k . g 1

<р =--<р--Sin^H--7W .

т I ml"

(6.1)

Здесь т — масса маятника, I — длина нити маятника, к — коэффициент пропорциональности, м — управляющий момент. В начальный момент маятник близок к положению устойчивого равновесия, и он практически

неподвижен, т. е. фп = 0, ф[] = 0 . Точные значения величин (р() и ф() становятся известными только в момент старта процесса.

В конечный момент времени маятник следует перевести в горизонтальное положение с нулевой конечной скоростью. Управление маятником происходит на промежутке

времени [г0, Т ].

Заменой

Ух=<Р, Уг=Ф нормализуем уравнение (6.1)

У\ = У2>

£ . к 1 (6.2)

У2 ~ ~ГУ\--У2+—

I т тг

Кинематический закон движения маятника

'у, (tЛ Г4т2 — жГ

У (t ) =

У 2 (t)

v 3nt - 3nt' j

y2=--smyi- — y2+-^(w(t) + ii).

m

fv Л

\X2 J

= A(t) 1 +B(t)

u,

V X2 j

где

A (t ) =

(dY <Y Л

ЗУ ^2

d^ ¿y.

V fyi дУ2 j 0

g

v l

(дТ Л

cos y

B (t ) =

dw

dY

.dw j

У1 = У U У1 = У1 ('. w=w(t)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 Л

k

m j

( о Л i

У1 = yi (* )■ У1 = У1 (í}.

w=w(t)

ml j

и0 (t ) = ^ ) + ^2 ^), t е[to, t1 ],

0 0

где у1 ,у2 — решение системы линейных алгебраических уравнений

ВД + «12^2 = <1,

^21^1 ^^22^23 С2'

в которой

(6.3)

аи = J(h 7]' h 7]У7' с = -X[Г1,ío]х0,

является базовым. Управление, найденное из

условия (2.3), здесь имеет вид

w(t) = ml2y2(t) + mlgsin(t) + l2ky2 (t).

Непосредственно проверяется, что в паре с законом движения (6.3) оно действительно является базовым.

Выпишем уравнения (6.2) с дополнительными управлениями

У1 =У2,

(ti [t р h2 [t ]

= H [t1, t ] = B' X [t1, t ],

X [t1, t], t е [t0, t1 ] — фундаментальная матрица Коши для однородной системы дифференциальных уравнений

Л

\Х2

1 МО

ÍY Л

V X2 j

а Х0 =

ÍY Л 10

Xn (

V X20 j

Л

20 j

Линейный динамический объект, аппроксимирующий динамику возмущений здесь имеет вид

начальные возмущения.

Принимаются следующие числовые значения для параметров маятника:

^ = 0сек, Т = 1 сек, т = 0.5 кг, I = 3 м,

к = 1-^, а = 9.8-^, w е Я1 (н • м) .

сек ' о сек2 ' V /

(6.4)

^.Ую = -0.3рад, ¿У20 = -0.5

рад

сек

\ = 0.5 сек .

На рис. 2 показаны фазовые траектории маятника в случае отсутствия неконтролируемой помехи. Здесь и далее (на рис. 3 и на рис. 4) штриховой линией изображается базовая траектория, а сплошной линией — откорректированная траектория. Из рисунка видно, что в момент времени ^ маятник в откорректированном движении выходит на базовую траекторию и в дальнейшем остается на ней вплоть до окончания процесса.

Программное управление и0 (•), решающее

задачу приведения фазового вектора линейного динамического объекта (6.4) в начало координат в момент времени ^ е [^, Т], записывается в виде [1], [4]

Рис. 2

На рис. 3 показаны фазовые траектории маятника при наличии неконтролируемой помехи и отключенном в момент времени г дополнительном управлении игрока-союзника. Помеха (игрок-противник) начинает действовать в момент времени г . Значение ее управляющего параметра V е Q = [—19,19] моделируется датчиком случайных чисел, равномерно распределенных на множестве Q .

У2

2.5 -

Рис. 3

Из рисунка видно, что после выхода маятника на базовую траекторию в момент времени г в дальнейшем он на ней не остается,

что приводит к невыполнению конечных граничных условий.

Рассмотрим случай, когда применяется позиционная схема дополнительного управления на базе минимаксной стратегии "игрока-союзника". Предположение 1 будет выполнено, если положить Р = [—20,20]. Очевидно, что, предположение 2 здесь также выполнено.

Тогда множество

5 = {( г, у )е[г1, Т ]х Я 2| у = у (г)}

обладает свойством стабильности для игрока-союзника, а его стратегия, экстремальная к множеству 5 обеспечивает равномерную сходимость ломаных Эйлера к этому множеству.

На рис. 4 приводится вид ломаной Эйлера, отвечающей разбиению промежутка [^, Т ] на 100 полуинтервалов. Она практически совпадает с базовой траекторией.

Рис. 4

Заключение

1. В статье ставится и решается задача управления динамическим объектом в условиях неполной информации о начальном положении объекта и воздействии на него неконтролируемой помехи.

2. Решение поставленной задачи осуществлено путем ее сведения к позиционной дифференциальной игре и построения в игре минимаксной стратегии прицеливания игрока-союзника на стабильный мост.

3. Результаты исследований проиллюстрированы на примере управляемого математического маятника, движущегося в среде с сопротивлением, пропорциональным квадрату скорости.

Список литературы

1. Красовский Н.Н. Теория управления дви-

жением. М.: Наука, 1968. 476 с.

2. Красовский Н.Н., Субботин А.И. Позици-

онные дифференциальные игры. М.: Наука, 1973. 455 с.

3. Субботин А.И., Ченцов А.Г. Оптимизация

гарантии в задачах управления. М.: Наука, 1981. 288 с.

4. Лутманов С.В. Вариационное исчисление и

теория оптимального управления в примерах и упражнениях: учеб. пособие / Перм. ун-т. Пермь, 2010. 200 с.

5. Лутманов С.В. Об одной методике иссле-

дования управляемой динамической системы // Вестник Пермского университета, Математика. Механика. Информатика. 2017. Вып. 1(36). С. 13-20.

6. Лутманов С.В., Кучкова Т.Ю., Овчинников

В.А. Управление динамической системой,

У2

У1

1.5

У1

линеаризованной в окрестности базового 7. Лутманов С.В. Хотько О.А. Оптимальная

S. V. Lutmanov

Perm State University; 15, Bukireva st., Perm, 614990, Russia mpu@psu.ru.; 8(342)239-63-09

In the article the problem of motion correction for dynamic managed object in conditions of exposure to uncontrolled interference. It is a further development of the approach to the study of driven motion, described by the author in previous works. The neutralization of the adverse effects of interference is realized in the article in the form of positional strategy used by player-ally in the differential game of two persons. In this game the player-the enemy is identified with uncontrolled interference. The results are illustrated with an example.

Keywords: basic motion; perturbed motion; differential games; positional strategy; program strategy.

движения, в условиях геометрических ограничений на вектор дополнительных управляющих параметров // Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2018. Вып. 50. С. 12-32.

коррекция полета тяжелой материальной точки в среде с сопротивлением, пропорциональным квадрату скорости // Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2018. Вып. 50. С. 33-45.

Correction of the motion of a controlled dynamic object under conditions of uncontrolled interference

i Надоели баннеры? Вы всегда можете отключить рекламу.