Sladkov Valery Yurievich, Doctor of Engineering Sciences, professor, professor of the Department of Missiles, info@,sau.tsu.tula.ru, Russia, Tula, Tula State University,
Myznikov D E, research engineer of 3d category, info@,sau.tsu.tula.ru, Russia, Tula, KBP named after academician A. Shipunov,
Shamin M S, chiefs deputy of department, info@,sau.tsu.tula.ru, Russia, Tula, KBP named after academician A. Shipunov,
Nikulina O A, head of sector, info@,sau.tsu.tula.ru, Russia, Tula, KBP named after academician A. Shipunov
УДК 623.546
ОПТИМАЛЬНОЕ ПО ПОТЕРЕ СКОРОСТИ УПРАВЛЕНИЕ ЛЕТАТЕЛЬНЫМ АППАРАТОМ В НЕОДНОРОДНОЙ АТМОСФЕРЕ
Ю.И. Орлов, В.Е. Семашкин
Рассматривается задача синтеза оптимального по потере скорости управления летательным аппаратом в неоднородной атмосфере с последующим численным моделированием и сравнением характера изменения скорости при движении по оптимальной, баллистической и прямой траектории.
Ключевые слова: оптимальное управление, летательный аппарат, траектория.
Введение
Рассмотрим следующую задачу. Имеется некоторый летательный аппарат (ЛА), приобретающий при старте начальную скорость и затем движущийся в атмосфере по инерции, без использования двигательной установки. ЛА снабжен рулевыми органами, благодаря которым создаёт поперечную перегрузку и изменяет направление своего движения. Требуется найти такое управление, при котором ЛА долетит из заданной точки А в заданную точку Б с минимальной потерей скорости.
Управление влияет на основные факторы потери скорости ЛА, такие как: лобовое сопротивление (меняется с высотой и скоростью); индуктивное сопротивление (меняется с высотой, скоростью и углом атаки); вклад силы тяжести (меняется с углом наклона траектории). В некоторой степени эти факторы взаимно противоречат друг-другу. Например, при наборе высоты, с одной стороны, растут потери на преодоление силы тяжести, а с другой стороны, появляется возможность дальнейшего полёта в менее плотной атмосфере. Это, в свою очередь, приводит как к снижению лобового сопротивления, так и к снижению располагаемой перегрузки ЛА. Поэтому строгий поиск оптимального управления, минимизирующего потерю скорости на траектории, является задачей не тривиальной. Её решению и посвящена настоящая работа.
Математическая модель
Будем считать, что в горизонтальной плоскости параметры атмосферы постоянны, поэтому направление движения ЛА по азимуту не влияет на потерю скорости. Значит, траектория движения будет располагаться в вертикальной плоскости, проходящей через две точки. Учитывая это, будем рассматривать в дальнейшем полёт ЛА в двухмерной системе координат без рассмотрения движения в горизонтальной плоскости.
Пусть ЛА представляет собой материальную точку, на которую действуют аэродинамические силы лобового и индуктивного сопротивления, подъёмная сила, а также гравитация. Угол атаки ЛА будет являться управляемым параметром. Тогда из [1] запишем следующую систему дифференциальных уравнений:
v = -С СДМ) + С^ЮаЧ—рУОъ2 - д sin *;
# = i^CAOff eostf J;
ft = гг sin 1?;
£ = PCGS0J
(1)
где T? — v(t) - скорость JIA, м/с; д ™ - угол наклона траектории; h=h{t) - высота над уровнем земли, м;5 - площадь Миделя, NT; i=f(C) - расстояние от точки пуска, м; or = it, Ltt) - угол атаки,
управляемая переменная; т - масса JIA, кг; p(h)~ местная плотность атмосферы, Па; д - ускорение свободного падения, м/с:; СХ(М) - коэффициент аэродинамического сопротивления; Ct {М) - коэффициент индуктивного сопротивления, вызванного углом атаки; Су{М) - коэффициент подъёмной
силы; М = -г- - число Маха; ft(fr) - местная скорость звука, м/с.
Примем условие, что координата I в процессе полёта монотонно возрастает. Тогда в системе дифференциальных уравнений можно уйти от независимой переменной времени t к независимой переменной Тем самым в системе сократится одно дифференциальное уравнение. Для этого в системе (1) поделим первые три уравнения на четвёртое, получим:
S НЪ) Q
2m cos £ h'=tg$,
v2'
где г' = -; S = -: ft'- -г.
Для сокращения написания формул, полагается, что V = i! =i(0, /t = ft tO являются функциями независимой переменной а управление сг является функцией фазовых переменных и далее это не указывается без необходимости.
Формализация задачи оптимального управления Введём обозначения:
v' = k fo * К = fz{v, hf = Л О, ft A, or),
где Afotf, it, а), /а(г; /j{vf - соответствующие правые час-
ти в системе уравнений (2). Функционал, оценивающий потерю скорости, имеет вид:
где =
Оптимальным управлением будет такое управление й, которое минимизирует значение функционала ¡(V, д, Ь, и) и приводит систему из начального положения /1(0} = 1(] в конечное Л(^) = удовлетворяя следующим граничным условиям:
(4)
где 4*, 0 - вектор-функции, определяющие граничные условия для начальной и конечной точек соответственно; г^ — начальная скрость. Решение задачи оптимального управления
Воспользуемся принципом максимума Понтрягина [2]. Составим функцию Понтрягина:
+ -/о -
где Фа ~~ фазовые координаты сопряжённой системы, описываемые
следующими дифференциальными уравнениями:
(5)
Учитывая тот факт, что значение угла атаки (X является ограниченной величиной, определим область допустимого управления:
—< ЙГ £ «й,
(6)
где — - балансировочный угол атаки.
Согласно принципу максимума, управление от будет оптимальным в том случае, если для каждой комбинации значений фазовых координат V. фч. ^ ; ■ч^ц, функция Понтрягина, как функция управляющего воздействия ос, принимает наибольшее значение (в своей области определения).
Подставив выражения (3) и (2) в функцию Понтрягина, получим:
Н = № + 1Х-Кг(Д0+ С<(Я)£Г2)— р№
V
9
СОЗ# V
Зафиксируем компоненты функции и будем рассматривать её далее как функцию одного переменного М = ИНайдём экстремум функции. Для этого приравняем нулю её производную:
= 0:
(7)
Управление от = сг0, являющееся экстремумом, будет оптимальным, если доказать, что при этом функция Н — достигает наибольшего
значения. Представим функцию (7) в виде степенного ряда относительно , получим:
V
н - -№1 + р(Л)
а2 + ф2Су{14) 9
£ Р(Ь3
2т срз Л 5
С£ —
(8)
г
X"
= Асг* + В& + С = Л (я +
—У - —
2А/ 4А+
Отсюда видно, что функция Я(сг) представляет собой параболу. Согласно свойству параболы, её экстремум будет являться максимумом, если Л ■■■ 0 (ветви параболы направленны вниз). Добавив к этому условие (6), можно сказать, что управление будет оптимальным, если число А < 0 и :■:; .1: - В противном случае значение оптимального управления следует искать на границе области определения а.
Получим условие оптимальности экстремального управления Од. Развернём условие А < Q:
+ СА0р(А) ——г < о.
2т
cos д
Выражение — всегда принимает положительное значение,
т.е. все его сомножители положительны по определению (при условии, что JIA движется). Коэффициент индуктивного сопротивления С (М) предполагается так же положительным, т.е. угол атаки никогда не приводит к уменьшению аэродинамического сопротивления. Косинус угла наклона траектории COS & так же положителен, при условии, что JIA движется в сторону увеличения координаты т.е. < j. Это верно, т.к. на этом условии выводилась система уравнений (2). Из этого следует, что неравенство можно свести к следующему:
А < 0Ц при > -1.
Так же не сложно убедиться, что А — 0, при = — 1, и А > 0, при < — 1.
Рассмотрим теперь граничные области управления. Как уже было сказано, оптимальное управление будет принимать граничные значения, если А < О, J tip | > ег^ или А > 0. Рассмотрим по порядку возможные случаи (рис. 1).
И' к
1 ! [ 1 ! I
а ¿7 I 1 1 1 1 Од
1-у | Л /\ f 1 |
/\ \ 1 . ч
1 ! 1 >. 1 1 % —<-т
-Ок о
а
■Ä о
Н' V
* ъ \ % V 1 1 -К . i ! [
В<0 * % /* 1 | t \j В>0
^ * ч \ J
\ / \ f \ \
в=о
/ 1 1 ' X
/ / 1_. 1 1 И I 1 к * * Л »
-Рб о
б
Щ в
Рис. 1. Возможные виды функции В {а} для случаев граничного
управления:
а-А< О или фг > -1; б - А > < 1; в - А = 0, ф± = -1
1-й случай. А < 0 шмат^ > — 1, | > В этом случае функция Я(ог) будет иметь вид, показанный на рис. 1, а. Как видно из характера поведения функции, максимальное значение её значение будет достигаться
на границе, знак которой совпадает со знаком экстремального значения. Т.е. оптимальное значение в этом случае будет равно:
_ ( «ь > 0;
< а.
Заметим, что если рассмотреть выражение (8) для рассматриваемого случая можно получить следующие неравенства:
> О.лри ф2 > 0; < 0(ттры ф* < 0.
2-й случай. А > 0 или < —1 (рис. 1, б). В этом случае знак граничного управления будет противоположен знаку экстремального значения. Если же экстремальное значение равно нулю, то нет разницы какое из граничных значений брать. Для определённости примем следующий оптимальный закон управления:
„ = { «а * 0
\-ай, огр > О"
Так же разложив выражение (8) для рассматриваемого случая , получим следующие неравенства:
йг0 <> 0,Ери Фг > > 0,при фг<0.
3-й случай. А = 0 или ^ = —1 (рис. 1, в). В этом случае функция вырождается в прямую, а экстремальное значение ег& не существует.
Знак граничного значения в этом случае будет соответствовать знаку числа В. В случае же, когда В = 0, функция И не зависит от ¿г, а значит, угол атаки может принимать любое значение. Примем в этом случае его максимальным из области определения. Тогда получим следующий закон управления:
Рассмотрим, что означает В > 0, согласно (8), получаем:
о.
Следуя тем же рассуждениям, что и выше, выражение ССМ)—— всегда будет принимать положительное значение. Следовательно, получаем, что:
В 2 О, при £ 0:
Скомбинировав выше полученные законы управления в частных случаях, получим следующий общий закон оптимального управления:
Известия ТулГУ. Технические науки. 2016. Вып. 12. Ч. 4 а IЬ а
^ -1V | огс.1 >
здесь НёРОДг) - дополненная функция взятия знака числа: 31цп(0) — 1. Функция ы0 так же дополнена для исключения выколотой точки в области её определения.
Вернёмся к определению фазовых координат сопряжённой системы (5). Найдём необходимые производные. Заметим, что число Маха М так же являет функцией фазовых координат М = М{V, к) = -7-, где а(К) - местная скорость звука на высоте И. После необходимых преобразований получим следующее:
5 Ъ&Ф
(9)
Система уравнений (2) и (9), а также замыкающий систему закон управления (8) в совокупности даёт модель оптимального движения ЛА. Итак, вид оптимальной траектории зависит от семи параметров, в соответствии с шестью значениями начальных условий и конечной координаты интегрирования. Последний параметр уже определён и равен 12. Ещё три параметра определяются начальной скоростью г(0) — и требуемыми
высотами в начальной и конечной точках: = и = й2 Остальные три параметра ¿(0), »(¡2), £££г} не фиксируются и должны выбираться таким образом, чтобы добиться наибольшей скорости ЛА в конечной точке траектории. Для этого используются условия трансверсальности, исходящие из граничных условий (4):
ф2 со)=^псна ад. вд)
& со) - ¡^мо,*®.
<3^
Й-
(10)
(11)
(12)
где ^ = г, V = (lfitiii.Pi)7 - вектор констант.
В соответствии с (10), получим:
Ы0) = л; = 0; & (0) = № ФгЫ = 0; ^ (¿2) = 0; ф2 {¿2} = 1-3.
Соответственно из полученных равенств определяется ещё три параметра траектории. Итого получаем полный набор параметров, определяющий вид траектории для конкретного случая. Выпишем все вместе необходимые условия:
1*» = 171; Од) = кй ф2т = 0;
ОД-^МЫ-ОгМЬ)-*
Представляет интерес одно замечание. Если сравнить условия (12) с законом оптимального управления (8), то при фг > — 1, что обычно выполняется, из условий (0) = 0и = 0 следует, что если управление сс оптимально, то в начальной и конечной точках траектории оно должно быть равно нулю:
ег(0) = 0; аОа) = О. (12, а)
Условие (12, а) можно принять как необходимое для оптимальности траектории.
Условия (12) определяют двухточечную краевую задачу, т.к. выдвигаются условия, как в начальной точке, так и в конечной. Решается она одним из численных методов.
Пример решения
На основе полученного оптимального закона управления проведём численное моделирование движения ЛА и сравним характер изменения скорости при движении по оптимальной, баллистической и прямой траектории. Зададимся некоторыми постоянными аэродинамическими коэффициентами Сх. С; и Су и значениями параметров. Модель атмосферы принята стандартная.
Сравнение полученной оптимальной траектории с баллистической и прямой представлено на рис. 2 и 3.
и, м Траектория, м
-Оптимальная • • - • Прямая — Баллистическая
У у у у у **
/ / / /у .••' S у
о
Рис. 2. Оптимальная, баллистическая и прямая траектории
Скорость V, м/с Время I, с
-Оптимальная
.....Прямая
Ч s v.
а
/// / У
/у
/ я"
¿Сё
У/'
/V!'
б
Угол атаки Alpha, 0
Перегрузка n, g
в
г
Рис. 3. Сравнение скорости (а), времени (б), угла атаки (в) и перегрузки (г)
Из графиков видно, что оптимальная траектория даёт выигрыш в скорости, как по сравнению с прямой траекторией, так и по сравнению с баллистической траекторией. Как было ранее замечено, оптимальная траектория действительно даёт нулевую перегрузку в начальной точке и конечной точке.
Установлено, что оптимальная траектория обладает заметным преимуществом над прямой только на достаточно большой дальности полёта.
Баллистическая траектория, хоть и удовлетворяет необходимому условию оптимальности, таковой не является и располагается ниже её.
Если траектория движения ЛА оптимальна в смысле потери скорости, то это не значит (но и не отрицается), что ЛА преодолеет путь за наименьшее время.
Изменяя краевые условия (4) можно получить специальные виды оптимальных траекторий, накладывая дополнительные требования к траектории.
Список литературы
1. Лебедев А.А., Чернобровкин Л.С. Динамика полёта беспилотных летательных аппаратов. М.: Машиностроение, 1973. 616 с.
2. Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление: учеб. пособие для вузов. 3-е изд. М.: Изд-во МГТУ им. Н.Э. Баумана, 2006. 488 с. (Математика в техническом университете. Вып. XV)
Орлов Юрий Игоревич, аспирант каф. САУ, smtp.iforand@,gmail.com, Россия, Тула, Тульский государственный университет,
Семашкин Валентин Евгеньевич, канд. техн. наук, начальник отделения, sveil@,mail.ru, Россия, Тула, АО "Конструкторское бюро приборостроения имени академика А.Г. Шипунова»
OPTIMAL FOR LOSS OF SPEED CONTROL OF AIRCRAFT IN AN INHOMOGENEOUS ATMOSPHERE
Y.I. Orlov, V.E. Semashkin
In this article considers the problem of synthesis of the optimal for loss of speed control system of aircraft in an inhomogeneous atmosphere followed by mathematical simulation and comparing the rate of character of speed changing when aircraft moves along optimal, ballistic and straight trajectory.
Key words: optimal control, aircraft, trajectory.
Orlov Yury Igorevich, postgraduate of Department of Automatic Control Systems, smtp.iforand@,gmail.com, Russia, Tula, Tula State University,
Semashkin Valentin Yevgenievich, Candidate of Engineering Science, Head of Department, sveil@mail.ru, Russia, Tula, KBP namedafter academician A. Shipunov
УДК 681.511.4
ОБ ОДНОМ МЕТОДЕ ЛИНЕАРИЗАЦИИ СИСТЕМ УПРАВЛЕНИЯ, РАБОТАЮЩИХ В РЕЖИМЕ ШИМ
Н.В. Фалдин, С.В. Феофилов, А.В. Козырь
Предлагается аналитический метод линеаризации следящих систем управления с широтно-импульсным регулятором и линейным объектом управления. Предлагаемый метод позволяет свести исследование точности режима слежения к исследованию некоторой линейной импульсной системы.
Ключевые слова: широтно-импульсным регулятор, линеаризация, импульсная система управления.
Регуляторы с широтно-импульсной модуляцией (ШИМ) получили широкое распространение в технических следящих системах управления. Эффективность, простота и надежность усилителей мощности, работающих в ключевом режиме, являются движущими факторами для построения на их основе высокоточных систем управления. Пропорциональность сигнала управления в таких системах обеспечивается с помощью широтной модуляции, поступающих на объект импульсов. Спектр выходного сигнала системы ШИМ, как правило, содержит высокочастотную составляющую. Перед проектировщиком следящих систем с ШИМ-управлением [3] на этапе синтеза ставится сложная задача анализа точности таких регуляторов. Возможно два подхода к решению этой проблемы, численное выделение полезной составляющей сигнала на выходе системы, либо использование приближенных методов линеаризации [2]. В настоящей работе предлагается достаточно точный метод линеаризации систем управления, работающих в режиме симметричного ШИМ с линейным объектом управления.
Систему управления с широтно-импульсной модуляцией можно рассматривать как релейную, функционирующую в режиме вынужденных колебаний (рис. 1).
На рис. 1 обозначено: ГС - генератор опорного сигнала, РЭ-релейный элемент, y0 = Hf0(t)- симметричный сигнал треугольной формы, имеющий частоту на порядок выше, чем модулирующий сигнал на выходе корректирующего устройства (КУ), КУ и ФУ - корректирующие и формирующие устройства.