Научная статья на тему 'Синтез оптимального автопилота переменной структуры'

Синтез оптимального автопилота переменной структуры Текст научной статьи по специальности «Физика»

CC BY
160
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
точность наведения / автопилот / алгоритм управления

Аннотация научной статьи по физике, автор научной работы — В. А. Малкин

В статье рассматривается возможность повышения точности наведения авиационной управляемой ракеты в условиях маневренного противодействия со стороны цели. Предлагается методика синтеза оптимального по быстродействию контура стабилизации переменной структуры. Данная методика является основой для разработки оптимальных алгоритмов управления структурой контура стабилизации, позволяющих обеспечить высокую эффективность ракеты в широком диапазоне условий боевого применения

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез оптимального автопилота переменной структуры»

2003

Доклады БГУИР

октябрь-декабрь

№ 4

УДК 681.514

СИНТЕЗ ОПТИМАЛЬНОГО АВТОПИЛОТА ПЕРЕМЕННОЙ СТРУКТУРЫ

В. А. МАЛКИН

Военная академия Республики Беларусь ВА РБ, Минск, 220057, Беларусь

Поступила в редакцию 29 апреля 2003

В статье рассматривается возможность повышения точности наведения авиационной управляемой ракеты в условиях маневренного противодействия со стороны цели. Предлагается методика синтеза оптимального по быстродействию контура стабилизации переменной структуры. Данная методика является основой для разработки оптимальных алгоритмов управления структурой контура стабилизации, позволяющих обеспечить высокую эффективность ракеты в широком диапазоне условий боевого применения.

Ключевые слова: точность наведения, автопилот, алгоритм управления.

Введение

Известно, что применение авиационных управляемых ракет в современном воздушном бою происходит при интенсивном маневренном и информационном противодействии со стороны противника [1]. Причем точность наведения авиационной управляемой ракеты существенно зависит от интенсивности маневра цели. Наиболее сложной является ситуация, когда маневр цели начинает выполняться на конечном участке траектории полета ракеты за 3-5 с до окончания наведения. Для обеспечения необходимой точности наведения в этих условиях кроме достаточной располагаемой перегрузки требуется еще и высокое быстродействие контура отработки управляющего воздействия (контура стабилизации ракеты). Быстродействие контура стабилизации влияет на динамику процесса наведения ракеты и в условиях интенсивного маневренного противодействия является существенным фактором обеспечения требуемых точностных характеристик.

В статье рассматривается методика синтеза оптимального по быстродействию контура стабилизации переменной структуры авиационной управляемой ракеты.

Постановка и решение задачи

Для обеспечения требуемых динамических характеристик контура стабилизации авиационных управляемых ракет средней и большой дальности используются принципы систем переменной структуры [3]. В контур стабилизации по перегрузке вводится нелинейный элемент (у-ячейка), обеспечивающий изменение структуры контура в зависимости от соотношения ошибки отработки перегрузки Ап = пд — пдд и ее производной Ап .

Упрощенная структурная схема контура стабилизации переменной структуры представлена на рис. 1. На этом рисунке р) — передаточная функция замкнутого контура демпфирования ракеты. Нелинейная функция у описывается следующей зависимостью:

у = ■

' 1 1'бе Апя > 0, -1 1'бе кт < 0,

(1)

^ = Ап + САп,

где С>0 — некоторый постоянный коэффициент.

Рис. 1. Упрощенная структурная схема контура стабилизации

В данной статье рассматривается методика синтеза оптимального управления фазовыми координатами и структурой контура стабилизации, в котором в переходном процессе реализован скользящий режим движения [3]. Поскольку в скользящем режиме практически отсутствует перерегулирование, в качестве критерия оптимальности переходного процесса может быть принята его длительность. Следовательно, рассматриваемая задача представляет собой синтез оптимального управления, обеспечивающего максимальное быстродействие в системе переменной структуры.

При построении математической модели контура стабилизации приняты следующие допущения:

объект управления (авиационная управляемая ракета) описывается системой линейных стохастических дифференциальных уравнений второго порядка;

коэффициенты уравнений являются медленно меняющимися функциями времени, что позволяет рассматривать объект управления как квазистационарную линейную систему;

устройство переключения структур считаем безынерционным; следовательно, движение изображающей точки в скользящем режиме происходит строго по линии переключения.

Поскольку мы оптимизируем движение системы в переходном процессе, принимаем задающее воздействие пд6 = 0 . Введем вектор фазовых координат, описывающих состояние

системы ХТ = (х1 ,х2), где х1=пр — нормальная перегрузка ракеты, х2 = х1 — скорость изменения нормальной перегрузки.

С учетом принятых допущений система уравнений, описывающих движение ракеты в переходном режиме, будет иметь вид

[ х! = Х2 + , I Х2 = -а1(q)x2 -а2(д)хг +а3(q)Ъд + Ъ£2

(2)

где 5р — управляющее воздействие (отклонение руля); а1 (q) = 2С, Т р1; а2(q) = Тр

"~2 . ;

аз (q) = К"5Тр2:

тл„,кп —

коэффициент

= к5тр ; тр,ър,к5 соответственно постоянная времени,

демпфирования и коэффициент передачи ракеты по перегрузке; >С2 — компоненты случайного векторного процесса, представляющего собой белый шум с известной матрицей интенсивностей G; И1,И2 — известные постоянные коэффициенты. На управляющее воздействие накладывается ограничение:

- «V (3)

Задача оптимального управления ставится следующим образом: требуется перевести систему (2) из начального состояния (х10, х20=0) в конечное состояние х1к=х2к=0 за минимально возможное время с учетом ограничения на управляющее воздействие (3).

Будем искать управление в форме линейной обратной связи. Это означает, что управляющее воздействие должно быть линейной функцией фазовых координат системы

Ъ(и) = —[К(и)]тх, (4)

где [К(и>]т = (к1у(и),к2) — вектор оптимальных коэффициентов; и - переменная, определяющая номер структуры системы; Т — символ транспонирования.

С учетом соотношения (4) система уравнений, описывающих свободное движение контура стабилизации, принимает вид

Г х1 = Х2 + ,

[х2 = — (а1 + к2а3 )х2 — (а 2 + к1у(и>а 3 )х1 + 2.

Система уравнений (5) является частным случаем стохастической системы с управляемой сменой структуры [5]. Управляемый индекс структуры принимает значения и=(1,2). Функция Уи) определяется по формуле:

, < Г 1 при п = 1,

у =Г 1 2 (6)

[— 1 при п = 2.

Для реализации обратных связей на борту ракеты имеются измерители параметров собственного движения. Уравнение измерений имеет вид

1Т = (21,27) = X + Ж,

где Жт=^1 ,^2) — вектор белого шума измерений с матрицей интенсивностей Q.

В результате обработки измерений в блоке формирования оценок (БФО) определяется

вектор [Х(и>]т = (х11u>,х2u>). Получение оценок фазовых координат является самостоятельной задачей и в рамках данной статьи не рассматривается. Задача определения оптимального управления фазовыми координатами в каждой из структур системы решается методом динамического программирования. При этом предполагается, что функции Беллмана зависят только от оценок фазовых координат системы. Структурная схема оптимизируемого контура стабилизации, в которой учтены принятые допущения и ограничения, представлена на рис. 2.

Задача оптимизации управления фазовыми координатами в каждой из структур системы заключается в выборе такого закона управления, который обеспечивает перевод изображающей точки за минимальное время из произвольного начального состояния на линию переключения.

Задача оптимизации управления переключением структур сводится к выбору такого значения крутизны линии переключения Се(Стт,Стах), при котором за минимальное время осуществляется перевод изображающей точки из произвольного начального состояния в начало координат.

р

Рис. 2. Структурная схема контура стабилизации

Суммарное время перевода системы из начального состояния (х10,0) в начало координат будет равно:

^(С) = ^(хю ,С) + гс(С), (7)

где t1( х10 ,С) — время движения системы в структуре и=1 до момента первого попадания на линию переключения; 1С( С) — время движения системы вдоль линии переключения.

Дифференциальное уравнение, описывающее движение системы вдоль линии переключения, записывается в виде

(8)

Решением уравнения (8) при начальных условиях х](^0)«х10 является функция

х(%) = хшехр(—С t), где ^ — время начала скользящего режима движения. Будем считать,

что момент окончания переходного процесса характеризуется коэффициентом и, определяющим степень приближения изображающей точки к началу координат (обычно

/=0,05). Тогда время tc будет определяться соотношением tc(C) = —(С)~ 1п и.

Для минимизации первого слагаемого в формуле (7) решается задача оптимизации по критерию максимального быстродействия для структуры и=1. Уравнение Беллмана в задаче о максимальном быстродействии для стационарного объекта управления записывается в следующем виде [2]:

х1 + Сх1 = 0.

Ш1П <

|5|

д?

дХ(

и )

А(и)(Х(и)) + 0,5 Тг

д2 ?

дХ(и)дХТ(

и)

В

(и)

= —1,

(9)

где А(и>(Х(и>) — вектор коэффициентов сноса; В (и) — матрица диффузии системы. Для системы (2) вектор коэффициентов сноса и матрица диффузии равны:

А(и)(Х(и)) = Аи)Х(и) + А25, В(и) = Н О НТ.

(10)

где А(и) =

У(и)а 2

1

— а

, А2Т = (0,а3), НТ = (И1,И2), О =

1 0 01

Подставляя выражения (10) в формулу (9) и учитывая соотношение (4) для управляющего воздействия, получим окончательное выражение для уравнения Беллмана:

Т

0

тт {-д1-х(2и> —д^-~[(а3к(,и )у(и> +а2)х[и> + (а, + к[и)а3)х(7и> ] + к1,к/ дх(и> 2 дх("> 31 21 1 2 3 2

д2 с Я2 V

0,5(^-^7 + )} = —1 • (11)

^ сХ[и>2 2 дх(2и>2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В результате анализа соотношения (11) определяются оптимальные значения коэффициентов ё[и>и ё(и. Оптимальными являются такие значения коэффициентов, которые обеспечивают минимум выражения в левой части уравнения (11). Для обеспечения минимального времени движения системы в каждой из структур к линии переключения коэффициент ё[и> должен удовлетворять соотношению к( 1 > = к[2 > = к1т . Коэффициент к2и>

при переходе из структуры и=1 в структуру и=2 должен скачкообразно изменяться от нуля до значения к2т.

Для определения оптимального положения линии переключения необходимо найти функцию Беллмана путем решения уравнения (11) для и=1 и с учетом оптимальных значений коэффициентов к21 > = 0, к1( 1 > = к1т . Уравнение Беллмана для этих условий принимает вид

дР^х2и> —дд^(а ^ +а1х2и>) + 0,5(^2+ ^ +1 = 0 (12)

где а 4 = а 3 к 1т + а 2.

Уравнение (12) является эллиптическим (во всей области существования решений) уравнением в частных производных. Аналитического решения такое уравнение не имеет и может быть решено численным методом прогонки с использованием трехслойной симметричной разностной схемы [4].

Анализ результатов

Результаты вычисления функции Беллмана (времени движения до линии переключения

полученные при численном решении уравнения (12) для различных значений параметра К Щ

и в зависимости от крутизны линии переключения, представлены на рис.3. На этом же рисунке приведен график изменения времени движения в скользящем режиме ¿с и графики суммарной длительности переходного процесса ¿п(С), определенной по формуле (7). Анализ приведенных результатов показывает, что графики зависимости ¿п(С) имеют явно выраженный минимум, соответствующий оптимальному значению крутизны линии переключения.

• • - время скппвзящего режима (tc) ____ - время движения до линии переключения ( t j ) о о - общее время переходного процесса (tn)

* * *

ï> '£>

V V:

V

V >о К=10

£> о •о о .(1 о .ООО V /Ь о « -

\ о о о < *. о . о о и ' „ О ° < о о О о °

* * ' * *

\/К=20

О 10 20 30 40 50 С, [1/с]

Рис. 3. Результаты вычисления критерия оптимальности

SYNTHESIS OF THE OPTIMUM AUTOPILOT OF VARIABLE STRUCTURE

VA. MALKIN

Absract

The opportunity of increase of missile guidance accuracy in maneuverable counteraction conditions is considered. The technique of synthesis of speed optimum variable structure contour of stabilization is offered. The given technique is a basis for development of optimum algorithms of a structure control of a stabilization contour allowing ensuring high efficiency of a missile in a wide range of conditions of battle application.

Литература

1. Краснов А. // Зарубежное военное обозрение. 1997. № 6.

2. Казаков И.Е., Артемьев В.М. Оптимизация динамических систем случайной структуры. М., 1980.

3. Теория систем с переменной структурой / Под ред. С.В. Емельянова. М., 1970.

4. Тихонов А.Н., Самарский А.А. Уравнения математической физики. М., 1972.

5. Малкин В.А. Анализ процессов и фильтрация в стохастических системах с управляемой сменой структуры. Мн., 2001.

i Надоели баннеры? Вы всегда можете отключить рекламу.