Научная статья на тему 'Метод построения областей достижимости для нелинейных управляемых систем'

Метод построения областей достижимости для нелинейных управляемых систем Текст научной статьи по специальности «Математика»

CC BY
168
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБЛАСТЬ ДОСТИЖИМОСТИ / КОНФЛИКТНАЯ ЗАДАЧА / CONFLICT PROBLEM / СИСТЕМА СТАБИЛИЗАЦИИ / STABILIZATION SYSTEM / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / ATTAINABILITY DOMAIN

Аннотация научной статьи по математике, автор научной работы — Сизова Анастасия Александровна

Рассматривается задача построения областей достижимости летательного аппарата при действии возмущений с неизвестными статистическими характеристиками. Граница области достижимости строится по точкам на основе решения вспомогательной конфликтной задачи, для которой предлагается итерационный алгоритм. Разработана программа, реализующая предложенный метод и демонстрирующая эффективность его применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DERIVATION OF ATTAINABILITY DOMAIN FOR NONLINEAR CONTROLLABLE SYSTEM

The problem of attainability domain derivation for an aircraft is considered. A method is proposed to take into account perturbations of unknown statistical characteristics. The attainability domain is derived point by point on the base of a subsidiary conflict problem solved with the use of proposed iteration algorithm. A program is developed which realizes the method and demonstrates effectiveness of its application.

Текст научной работы на тему «Метод построения областей достижимости для нелинейных управляемых систем»

УДК 681.5.01:629.7.05

А. А. Сизова

МЕТОД ПОСТРОЕНИЯ ОБЛАСТЕЙ ДОСТИЖИМОСТИ ДЛЯ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ

Рассматривается задача построения областей достижимости летательного аппарата при действии возмущений с неизвестными статистическими характеристиками. Граница области достижимости строится по точкам на основе решения вспомогательной конфликтной задачи, для которой предлагается итерационный алгоритм. Разработана программа, реализующая предложенный метод и демонстрирующая эффективность его применения.

Ключевые слова: область достижимости, конфликтная задача, система стабилизации, оптимальное управление.

При решении многих задач динамики полета летательного аппарата (ЛА) возникает проблема определения области возможных его положений в пространстве для различных моментов времени.

Пусть движение любой управляемой системы определяется векторным дифференциальным уравнением

ёг

— = /(*, г(*), и()), т

где г = (гьг2,..., гп) — вектор состояния системы; /Т = (Л,_/2, /п) — непрерывная вектор-

функция; и = (иь и2,..., ит) — вектор сигнала управления, удовлетворяющий ограничению

и(1 )еи,

где и — допустимое множество управлений. Заданы начальные условия

* = г(*0) = г0.

Областью достижимости (ОД) управляемой системы в фазовом пространстве в момент времени Т (Т > *о ) называется [ 1 ] множество всех состояний системы, в каждое из которых к моменту времени Т возможен перевод системы из начального состояния го посредством выбора вектор-функции управления и(*), удовлетворяющей заданным ограничениям.

Методы построения ОД находят применение при исследовании законов управления динамическими системами [2], при решении задач оптимального управления с фиксированным моментом окончания управляемого движения и сложными терминальными условиями [3]. Эти методы используются также при исследовании инвариантности управляемых систем [4], при решении задач векторной оптимизации [3], при идентификации динамических систем [5].

В частности, методы построения ОД эффективны при решении игровых задач управления [6, 7]. Например, при решении конфликтной задачи сближения — уклонения двух ЛА сигнал управления одного из них (преследователя) выбирается на основе анализа взаимного расположения ОД преследователя и преследуемого [6]. Или другой пример — для решения задач стабилизации: при наличии внешних возмущений и помех с неизвестными статистическими характеристиками управление целесообразно выбирать, основываясь на вычислении будущего гарантированного результата. Например, с учетом влияния ветра или взрывной волны можно считать, что воздействие имеет любые статистические характеристики, но ограничено по абсолютной величине. Рассматривать подобную задачу можно как дифференциальную игровую задачу с участием двух игроков. Первый игрок за счет выбора управления

стремится стабилизировать ЛА, а второй игрок, путем внесения помех и возмущений, действует наихудшим для первого игрока образом. Для решения данной задачи можно также использовать подход, основанный на анализе взаимного расположения ОД [6].

Рассмотрим приближенный алгоритм построения ОД на примере нелинейной системы стабилизации нормальной перегрузки ЛА при наличии возмущений с неизвестными статистическими характеристиками. Движение ЛА в вертикальной плоскости с учетом динамики системы стабилизации перегрузки определяется следующими дифференциальными уравнениями [8]:

dV dt de dt d ш

cx4S M

-g sin G;

{ ^пр s 0в };

a qS ô с qS g c°s G =ca a^—+ côs ----•

y MV y в

dt d S

MV V ш11

d 0в dt

dx т/ Û —=V cos G; dt

z = | maa+môв 0в + mtz ^+ml " I q—; —=V sin G;

V

Sl

Jz

dy dt

dt

(1)

(8 \ П^ Т

сУа+Сув5В; г e,,5В,ху]

здесь е — угол наклона траектории движения ЛА к горизонту; — угловая скорость ЛА вокруг поперечной оси г; $ — угол тангажа; 8в — угол отклонения рулей высоты; а — угол атаки; Ыу — безразмерная нормальная перегрузка ЛА; М — масса ЛА; V — скорость ЛА;

х, у — координаты ЛА в вертикальной плоскости; £ — площадь миделя; q = pV2/2 — скоростной напор; р — плотность воздуха; Е, — возмущение; сх — безразмерный коэффициент

лобового сопротивления; ca, cvB — производные коэффициента подъемной силы по углам

г с

a и 0в ; mz

m„

m^z, m" — производные коэффициента аэродинамического момента по

углам а, 8в и по величинам , Е,; т — постоянная времени рулевого привода; кпр — коэффициент усиления рулевого привода; Jz — момент инерции; I — размах крыла; в — сигнал, подаваемый на вход рулевого привода; ку, кпу, кю — коэффициенты контура стабилизации нормальной перегрузки.

Структурная схема контура стабилизации перегрузки ЛА в продольной плоскости, со-

Г кп

ответствующая математической модели (1), представлена на рис. 1

пр

тр+1

передаточная

функция рулевого привода, учитывающая инерционность в работе его подвижных частей). Будем считать начальное положение ЛА заданным:

= 0, V(0) = V), е(0)=ео, -Э(0)=$0, (0)=®г0, 8в(0)=8в0, х(0) = Хо, у(0) = Уо, (2) а управляющий сигнал и возмущение ограниченными:

^ ^ итах,

t )|

max •

(3)

(4)

в

Для рассматриваемой системы (1) область достижимости будем строить в плоскости ЫуОЫу (рис. 2) для некоего, заранее заданного, момента времени Т; ЫуОЫу — плоскость параметров системы, которые необходимо стабилизировать.

ky

raz, Ny

тр + 1

К

Рис. 1

О

Рис. 2

Для системы (1) при условиях (3), (4) ОД является ограниченной и замкнутой [6], значит, достаточно построить только границу ОД, которую будем строить по точкам [9].

В плоскости NyONy с помощью единичного вектора L =[cos ф sin ф] зададим направление движения ЛА, здесь ф — угол между осью ÜNy и вектором L. Смещение ЛА в направлении вектора L из некоторой позиции {t*, z(t*)} к моменту времени T будем характеризовать скалярным произведением вектора L и вектора параметров системы, которые необходимо стабилизировать: w(T) = (Ny (T), Ny (T)), т.е. функционалом вида

D=LTw(T)=Ny (T) cos ф+Ñy (T)sin ф . (5)

Из определения понятия ОД можно сделать вывод о том, что чем больше размеры ОД, тем больший диапазон требуемых значений стабилизируемых параметров может она обеспечить. А значит, управление системой должно выбираться таким, чтобы размеры ОД были максимальными, т.е. необходимо максимизировать критерий (5) для всех направлений вектора L. Предположим при этом, что действие возмущений носит наихудший для ЛА характер, и, следовательно, функция ^(t) должна выбираться такой, чтобы минимизировать критерий (5). Таким образом, задача (1)—(5) является конфликтной задачей.

Результатом решения данной конфликтной задачи при определенном значении угла ф

будет точка с координатами Ny (T) и Ny (T), которая и является точкой границы ОД. Таким образом, изменяя значение угла ф от 0 до 360°, построим границу ОД в предположении, что ОД является выпуклой.

k

u

Б

пр

k

ny

Для решения вспомогательной конфликтной задачи используем следующий итерационный алгоритм.

1. Задаем начальные программы управления и возмущения Uq (t), ^q (t) .

2. С использованием принципа максимума Понтрягина [10] находим оптимальную программу управления « (t), обеспечивающую максимальное смещение ЛА в направлении вектора L при заданной программе ^q (t) .

3. Фиксируем программу управления « (t) и на основе принципа максимума Понтрягина находим оптимальную программу возмущения ^ (t), обеспечивающую минимальное смещение в направлении вектора L.

4. Фиксируем программу возмущения ^(t) и находим новую оптимальную программу управления «2 (t) , и т.д.

5. Продолжаем итерации до тех пор, пока на некотором шаге к программы (t) и

Е,к (t) не будут удовлетворять условию uк (t) = uк — (t), Ё,к (t) = £>к-1 (t) .

Принимаем полученные программы Uк (t) и Е,к (t) в качестве оптимальных решений в

рассматриваемой конфликтной задаче.

Для решения задачи (5) при фиксированных программах управления или возмущения использовались необходимые условия принципа максимума Понтрягина [10], а возникающая краевая задача решалась на основе метода последовательных приближений Крылова — Чер-ноусько [11].

Уточним задачу расчета координат точки границы ОД на примере некоего гипотетического ЛА. Зададим значения параметров гипотетического ЛА: l =5,3 м; S =0,129 м;

М=395 кг; Jz =981 кг-м2; =-0,022 1/...°; mgв =-0,011 1/...°; mjz =-0,761; cj =0,15 1/...°; cg = 0,046 1/.°; cx =0,15; кпр =1, т = 0,1 с; кпу = 0,336; ку = -0,002; кю = -0,0805.

Рассмотрим движение системы (1) при фиксированной программе (t) . Требуется найти оптимальное управление, обеспечивающее максимум функционала (5) в заданный момент времени T при ограничении на управление (3) и начальных условиях (2).

В соответствии с принципом максимума вместо максимума критерия (5) определим минимум критерия:

D ' = -Ny (T )cos ф-#у (T )sin ф. (6)

Функция Гамильтона [10] для системы (1) с критерием оптимальности (6) имеет следующий вид:

.. cxqS а qS g _ qS g cos 9

H = -w —--Wvg sin 9+v9cy a^—+v9 сУв g^--y9 ^-+

M y MV y в MV V

i a ю ®zi g с qSi

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ mz a + VM mz z V + mz в gв + mZ ^jj-+ Wz +

+^в -

в T

1 (,(,(. qS ( a g s , i i

u-кпy Mg(сy a+cyBgв) M®z

кпр

ку

-gв

+

у

Составим сопряженную систему уравнений:

V V j j j

+V xV cos 9+v yV sin 9. (7)

(8)

= ая=w. 2_м£-(C„ a+ca. 8i)-gcos e

dt

dV

MV MV2

V

Щ(maa+mje5B +m%)~V»mO

+VSB -kykny

V2 Jz

2qS-(c?a+c^5B)-Vx cose~vv sine;

МgV

dVe дЯ n a qS g sin e -=--= VVg cos e+ve cv —--Ve-+Vomz

dt de V e y му e V o z j,

v

a qS/

^пр qs

-VsB — kvkw—ca +VxV sin e-V vV cos e;

qS

"у""ум-

d Vo

дя

v

o qS/ /

dt doz

d Va = dH =

dt da

d VsB = дя

dt dSB

d V x дЯ

dt dx

d V y = дЯ =

Jz V

qS a ---Vo maz

Vs+Vs, qS/

k k

пр o

МУ ,5в qs

+v8b

Jz B T

^ÍLk k _qlca ^ Мg

МУ

s qS/ V8B knp , , qS s -Vo mzS^+—+VsB kvkml—cV

Jz t

y-ny

Мg

= 0.

& ду

Граничные условия для фазовых координат сопряженной системы (8) определяются

(8)

следующим образом: Vv (T) =

qS 2 , a S o a

--(с., a cos ®+cvB SB cos ф+сv o z

М-V y y B y z

Мg y

a qS s _ qS i . qS a _ . сv a-—+cvBSB-— I sin ф+——у су cose sin ф;

v У МУ2 y B МУ2

Ve (T) = -с? М-c°s Ф+с? МГс? "МУ sin Ф-с?

МУ qS

М-

М- у МУ

МУ

sin e sin ф;

Vo (T) = с« qS si

y

М-

sin ф;

Va (T)=су МГ c°s ф-с? М-су МУ sin ф;

М-

М-- у МУ

s qS s qS a qS .

VS (T) = cVB —cosф-cSB -^—су^— sinф;

Sb y М-- y МУ y М-

V x (T) = 0, Vy (T) = 0.

Таким образом, задача определения оптимального управления сводится к краев ой задаче: найти решение систем урав нений (1) и (8), фазо в ые координаты которых удо в летворяют начальным условиям (2) и граничным условиям (9).

(9)

Согласно принципу максимума Понтрягина функция Гамильтона при оптимальном управлении должна достигать максимума, причем управление ) должно удовлетворять ограничению (3).

Алгоритм вычисления оптимального управления й(1) имеет вид

й{г) =

|+мтах, если Их > 0; 1-"шах> если Щ < 0,

а алгоритм вычисления возмущения £ (^) при фиксированной программе управления — вид

1+£

шах, если И2 > 0;

£ « ) =

Чг

если И2 < 0,

„ кпр к у

где И1 =-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и £

Результаты расчета ОД при начальных условиях V(0) = 1650 м/с, 9(0) = 0, (0) = 0, $(0) = 0, 5в (0) = 0, х(0) = 0 , у(0) = 6000 м представлены на рис. 3, а, б для моментов времени Т = 0,3 с и Т = 1,5 с соответственно, при этом управление и возмущение удовлетворяют огра-

ничениям: йшах = 20.

а)

£шах = 0,1. Точки границы ОД построены с шагом Дф =3,33°.

б)

-4

6 М

-10

-5

10 М

Рис. 3

Значения критерия (5), изменяющиеся в процессе применения предложенного алгоритма, приведены в таблице (для выделенной точки на рис. 3, б).

0

5

0

4

Номер итерации Начальные программы и(0 и £(/) Конечные программы и(0 и £(/) Б'

1 ^(0 = 0; £0« = 0 щ (/) Ф и0 (/); 101,11941

2 щ«); ^(Г) = 0 £:(') *£0(') 49,777366

3 П0«) = 0; £1 (^) й2 (/) Ф щ (/) 48,120109

4 й2Ц); £0«) = 0 £ 2 (^) Ф£) 48,099345

5 П0«) = 0; £ 2(Г) й3 (/) = й2 (/) 48,104495

6 й3(Г); £0«) = 0; £ вС)=£ 2 (^) 48,104495

Результаты расчета подтвердили работоспособность рассмотренного алгоритма вычисления ОД ЛА в плоскости ЫуОЫу с учетом действия возмущений. Из приведенных расчетов

следует, что ОД в плоскости ЫуОЫу является выпуклой.

Разработанный алгоритм может быть использован в процессе синтеза систем стабилизации скоростных ЛА при действии возмущений и помех с неизвестными статистическими характеристиками.

СПИСОК ЛИТЕРАТУРЫ

1. Красовский Н. Н. Теория управления движением. М.: Наука, 1968.

2. Крищенко А. П. Исследование управляемости и множеств достижимости нелинейных систем управления // Автоматика и телемеханика. 1984. № 6. C. 30—36.

3. Моисеев Н. Н. Математические задачи системного анализа. М.: Наука, 1981.

4. Хрусталев М. М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем // Автоматика и телемеханика. 1988. № 5. Ч. 1. C. 62—70; 1988. № 7. Ч. 2. C. 70—78.

5. Доррер Г. А. Оценка параметров динамических систем по их областям достижимости // Там же. 1986. № 1. C. 39—46.

6. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука, 1970.

7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.

8. Лебедев А. А., Чернобровкин Л. С. Динамика полета беспилотных летательных аппаратов. М.: Машиностроение, 1973.

9. Толпегин О. А. Области достижимости летательных аппаратов: Учеб. пособие. СПб.: БГТУ „Военмех", 2002.

10. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1983.

11. Толпегин О. А . Численные методы решения задач оптимального программного управления: Учеб. пособие. Л.: Ленингр. механ. ин-т, 1987.

Сведения об авторе

Анастасия Александровна Сизова — Балтийский государственный технический университет „Военмех"

им. Д. Ф. Устинова, кафедра процессов управления, Санкт-Петербург; ведущий инженер; E-mail: [email protected]

Рекомендована кафедрой Поступила в редакцию

процессов управления 10.07.08 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.