Научная статья на тему 'Методика синтеза кусочно программного управления маневром уклонения с учетом терминальных ограничений'

Методика синтеза кусочно программного управления маневром уклонения с учетом терминальных ограничений Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
81
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КУСОЧНО ПРОГРАММНОЕ УПРАВЛЕНИЕ ОБЪЕКТАМИ / ТЕОРИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР / ЛЕТАТЕЛЬНЫЕ АППАРАТЫ

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Щербань И. В., Иванов С. В.

Рассмотрена методика синтеза кусочно программного управления объектом, осуществляющим доставку полезного груза в заданную терминальную область пространства при одновременном совершении маневров уклонения от объекта нападающего, который имеет возможность наблюдать объект со юзника в реальном времени и корректировать свои средства, в то время как объект союзник имеет информацию только о начальном моменте функцио нирования объекта нападающего. Приведен пример, свидетельствующий о вычислительной эффективности представленной методики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Щербань И. В., Иванов С. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика синтеза кусочно программного управления маневром уклонения с учетом терминальных ограничений»

Методика синтеза кусочно-программного управления маневром уклонения с учетом терминальных ограничений

Ключевые слова:

кусочно-программное управление объектами, теория дифференциальных игр, летательные аппараты

Щербань И.В.,

профессор кафедры многоканальных телекоммуникационных систем Северо-Кавказского филиала Московского технического университета связи и информатики (СКФ МТУСиИ), д.т.н, shcheri@mail.ru

Иванов С.В.,

аспирант кафедры многоканальных телекоммуникационных систем Северо-Кавказского филиала Московского технического университета связи и информатики (СКФ МТУСиИ), s i v@rambler.ru

Введение

Алгоритмы управления объектами в конфликтных задачах, основанные на классических методах теории дифференциальных игр, требуют для реализации мощных вычислителей [1]. Особенно сложными являются комплексные задачи управления объектами, осуществляющими доставку полезного груза в заданную терминальную область пространства с заданными параметрами движения при одновременном совершении маневров уклонения от объектов нападающего. Причем, в большинстве практических случаев нападающий имеет возможность наблюдать управляемый объект союзника в реальном времени и корректировать свои средства, в то время как у объекта-со-юзника таких возможностей нет (например в случаях управления высокоскоростными летательными аппаратами специального назначения, преодолевающими активные средства

Рассмотрена методика синтеза кусочно-программного управления объектом, осуществляющим доставку полезного груза в заданную терминальную область пространства при одновременном совершении маневров уклонения от объекта нападающего, который имеет возможность наблюдать объект союзника в реальном времени и корректировать свои средства, в то время как объект-союзник имеет информацию только о начальном моменте функционирования объекта нападающего. Приведен пример, свидетельствующий о вычислительной эффективности представленной методики.

защиты нападающего). Алгоритмов решения таких задач, возможных для реализации в реальном масштабе времени современными бортовыми вычислителями, в настоящее время не существует [1,2].

Постановка задачи

Рассматриваемая конфликтная задача может быть формализована следующим образом. Пусть отрезок на числовой прямой [г0, гк ]е т — ограниченное ^ < T) время функционирования объектов; У — п-мерное, Z — т-мерное, и — г-мерное, №— р-мерное евклидовы пространства с элементами у, л, и, wсоответственно; Цу,1 gu(u,y,z.f) и М, д^луй

— соответственно п-мерные и т-мерные непрерывные нелинейные функции. Текущие состояния маневрирующего объекта (союзника) описываются фазовым вектором у() а состояния объекта-перехватчика — вектором т(^), и в фазовом пространстве задаются системой нелинейных дифференциальных уравнений [1-4]:

йу

— = /у (у, ') + (и у, 2 0, у(го) = у0 йг

йг

— = Л (z, г) + %м,( ^ 2 ^ г( 'о) = 2О йг

(1)

(2)

у,- )- ~ =ф ,■ (у, )= 0

(3)

(Ф; — вектор-функция размерности ^х1).

Органы управления объекта-союзника формируют ограниченные управляющие воздействия:

(4)

Объект у имеет целью приблизиться к некоторому заданному состоянию (3), а объект-перехватчик л — воспрепятствовать этому приближению, стремясь захватить объект союзника в некоторую область захвата, что определяется условием совпадения субвекторов размерности I (I < п, I < т) фазовых векторов у^) и (0< ^< Т, после чего объект у прекращает функционировать. Поэтому векторы управлений и, w должны одновременно обеспечивать оптимумы (максимум и минимум) некоторого заданного функционала характеризующего расстояние между противниками:

(5)

где и, w — управляющие функции объектов (и е Кг, wе Кр); ге [г0, гк] — ограниченное время решения задачи, 0 — начальный момент времени.

Заданы значения /-х (, = 1, п1, п1 < п) компонент вектора состояния объекта-союзника в конечный момент времени :

у (гк ) = Уг,

где у, — краевые значения, определяющие заданную конечную область пространства

где О — известная скалярная функция.

Тогда, учитывая ограниченность расходуемых на управление ресурсов — интенсивностей управления

'к г *к р

[Xи‘2(г)Л и [УwJ2(t) Л,

'ог=1 гО у=1

поиск оптимальных допустимых стратегий управления и0^) и №°(0 в сформулированной задаче необходимо осуществлять из условия минимакса [3]:

30

T-Comm #5-2009

JI u0, w0 (z, у, t )l = min max x

[ 1 w J )| <u j

x|q [у (tk), z(tk), tt ]+1 [ [ wT (t) Kw( t) - uT( t) K u t)] dt J =1 r, (6)

где K,(f), /^(f) — симметричные положительно определенные функции-матрицы соответствующих размерностей.

Решение задачи

При синтезе алгоритма воспользуемся подходом, изложенным в работах [3,4], позволяющем свести сформулированную игровую задачу к задаче одностороннего гарантированного управления аппаратом-союзником. В этом случае не требуется выполнение условия существования седловой точки, а также возможен синтез вычислительного алгоритма, реализуемого современными бортовыми вычислителями в реальном масштабе времени. Поиск оптимальной стратегии управления u0(f) осуществляется здесь из более узкого, в сравнении с (6), условия:

J\u 0; w (z, y, t )|= max {J Гм, w (z, y, t)},

L 1 |uj(t )| <Uj L J

j = 1, r,

(7)

(8)

w(x, Л, t) = K1 1

дw

Л;

dt дx

= ^[x(t),Л (t),t J

где f [x(t t ]=

с граничными условиями:

fy [x(t)t]+ gu [x(t), X(t), t] fz [x(t)t]+ gw [x(t), X(t), t]

xi(to) = x0i,i =1, n + m; x(td = ф( x t) = 0, , l < n, l < m

j=1, n1; Лі (tk )=-£

t=tk

(id

где ^(г, у, г) — допустимая функция управления объекта-нападающего. Предполагается, что противник формирует замкнутое управление по принципу обратной связи на основе собственных наблюдений "наихудшим" образом — может воспользоваться любым неоптимальным шагом, сделанным нашим объектом.

Вектор оптимального управления союзника находится при этом из условия максимума гамильтониана:

Решение двухточечной краевой задачи (ДТКЗ) (9-11) может быть получено на основе различных методов: коррекции краевых условий, прогонки, градиентного спуска и др. Данные методы требуют нескольких итерационных процедур в каждом такте решения ДТКЗ и, соответственно, значительных вычислительных затрат, поэтому в реальном времени управления объек-том-союзником реализованы быть не могут.

Тогда воспользуемся приближенными методами, сводящими ДТКЗ к решению задачи Коши в прямом времени. Наиболее широко используемым среди них является метод инвариантного погружения (МИП) [5]. Однако в МИП отсутствует возможность учета терминальных ограничений (например, вида (3)) и он не работоспособен в условиях, когда целевой функционал содержит ненулевой неквадратичный терминальный член, входящий аддитивно (как в (6)).

Поэтому воспользуемся методом сведения ДТКЗ к одноточечной задаче интегрирования системы обыкновенных дифференциальных уравнений, рассмотренным в работе [6] и свободным от указанных недостатков. В этом случае вместо ДТКЗ (9-11) в прямом времени интегрируется следующая система дифференциальных уравнений:

= M1 +f (x(t), Q( x(t)), t),

dt 1 dt

x, (to) = xo,,i = 1, n + m;

H (x(t), u 0(t), W(t),A( t), t) =

= max, {H(x(t), u(t),w(t), ^(t), t) }

|uj(t)| <u j

j = 1, r,

где x (t) = [ y(t )T z(t )T ]T — объединенный I тор состояния (т — знак транспонирования); d^o

dt

(12)

dMj df(x(t)), Q(t), t) M + дЛ x t)), Q t), t) M;. (13)

(14)

dt дx

dMг __ д<р(x(t)), Q(t), t) dt

дЛ

дx

M1+дМі)Ш4А M

дЛ

где

дQ(X(t)

Я(А - (п+т)-мерная вектор-функция, удовлетворяющая вместе с тройкой [хо, ио(^), W(') ] системе:

^=/[х ('), и0 (г), w (г), Я (г), г] = / [х (г) Я (г) г]; (9)

——=--—=ф[х (г), и0 (г) , w (г) ,Я (г), г 1 =

— г дх [ 1

дx

дQ ( x(t))

дx

■M1 - M г

f (x(t)), IQ(t), t) + q>(x(t), Q(x(t)), t)

Начальные условия для матриц чувствитель-

ности M = дx(Л0 (t),t) и M = дЛ(Лo(0, t) 1 дЛ0 M г ="

имеют вид:

M1 = 0, M г = E,

дЛ 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(15)

(10)

где Е — единичная матрица размера (n + m) x (n + m).

Путем интегрирования системы дифференциальных уравнений (12-15) получаем субоп-тимальную программную траекторию союзника х(г) = | ~ (г)т ~(г)т | т, реализующего маневр уклонения от объекта нападающего и доставку полезного груза в заданную конечную область (3). Траектория получена исходя из представления о наиболее вероятных действиях объекта-нападающего с целью поражения аппарата союзника и с учетом ограниченности энергетики союзника в общей задаче доставки груза к цели (3). Но реализация любой программной траектории ~ (г), рассчитываемой однократно для граничных условий (11,15) на всем интервале ^ - 0), как известно, не позволяет учитывать текущую ситуацию и на значительных временных интервалах непременно имеет существенные методические ошибки [1,2,7].

Известно, что алгоритмы с прогнозированием широко используются при управлении подвижными объектами, предназначенными для доставки полезного груза в заданную терминальную область. Это обусловлено основными достоинствами следующих алгоритмов: во-первых, задача управления решается непосредственно в процессе движения объекта (управление в форме синтеза), во-вторых, достаточно просто обеспечивается адаптивность синтезируемого управления к текущим условиям функционирования объекта по результатам идентификации его динамических характеристик. Наиболее эффективными, например, для беспилотных ЛА, функционирующих в условиях интенсивных возмущений, жестких ограничений на фазовые переменные и управление, являются так называемые методы оптимального терминального управления, реализующие адаптивные алгоритмы с прогнозом [7]. В силу указанных достоинств, окончательное решение сформулированной задачи может быть получено именно на основе использования идеологии алгоритмов с прогнозирующими моделями.

В этом случае блок-схема алгоритма синтеза управления объектом, осуществляющим доставку полезного груза в заданную терминальную область пространства с заданными параметрами движения при одновременном совершении маневров уклонения от объекта нападающего, имеет вид, представленный на рисунке.

Сущность его заключается в следующем. По текущей навигационной информации определяются начальные условия х(го ) = хО (/ = 0, 1, 2,... — номер итерации в медленном контуре) и в так называемом "медленном контуре" решения задачи прогнозируется субопти-мальная траектория х1 (г) на последующий интервал движения объекта-союзника

T-Comm #5-2009

зі

fy (y,t ) =

gu (U, У, t) =

Блок-схема алгоритма синтеза управления объектом союзника

ге [го,т],(го = ^ г0>го)- В быстром контуре решается задача стабилизации относительно субоптимальной траектории х(г )-

В течение одной итерации построения программной оптимальной траектории в медленном контуре по текущей навигационной информации у('о ), в быстром выполняется

несколько итераций. Соответственно, такт решения задачи в быстром контуре определяется динамическими характеристиками аппарата союзника (устойчивостью, управляемостью и т.п.), а такт медленного контура — вычислительными возможностями его бортового вычислителя. При уменьшении временного интервала решения задачи в медленном контуре формируемое таким образом кусочно-программное управление все более стремится к управлению в форме синтеза.

Пример

С целью обоснования реализуемости и оценки вычислительной эффективности представленного подхода было выполнено численное моделирование следующего практического примера. В качестве объекта союзника использовалась модель гипотетического беспилотного высокоскоростного ЛА В качестве противника (ПР) использовалась простейшая модель осе-симметричного ЛА ракетной схемы. Пространственное движение обоих ЛА задавалось в единой скоростной системе координат (СК) в виде (1, 2), где:

у№ = у Уу К х у 2|Т =

=1 у у2 уз у4 у5 у6 Г;

2(1) = И5 уу* У^ хпр у"* гпр|Т =

-в0у5 / 2 , 2

? V Уі + Уг + Уз

ЗУ -

-Soу* I г , 2

[ УУі + Уг + Уз о.. _т(п У5 - Ус .

-Яуг - m(gr

L Sy3- (g г'

?»-*■)

-в0у5 I г , 2

[ VУі + Уг + Уз д.. -fn Уб -Zc

У4

У5

Уб

Poe УІ + Уг2 + Уз2

; 2m

SУгUl

Poe УІ + Уг2 + Уз2

У 2m

Poe-SOy Уі2 + Уг2 + Уз2)

2m

Sy iui

Su

fz (z, t) =

'-S np z.

s/ZE

2mnp

-S np z

- Y^p)

m^

7Pcos^"p -уїО

s/ZE

gw (w, Z, t) =

2mnp

p-rf)-

-Snpzs - (gr-

■5VZT

WlSІn(фпp - y3np)

2mnp

■5>/Z1r+

2mnp

ч> Poe-

-S npZiw2

Z5( z. + zj-

u(t) =|а S\T = U u2|T;

w(t) = p(t)/ m ау ft| = |w. w2 w3|

з2

Vx, Vy V, VxIlp, Vf, V?, X, у, z, X* упР, z"P -

составляющие векторов скорости и координат летательных аппаратов в скоростной СК; а, в,

aup,pup(\a(t)\ < «max, |в(t) I < Slmax) — углы атаки

и скольжения ЛA союзника и ЛA нападающего соответственно; cx, су, c^p , с^ — аэродинамические коэффициенты аппаратов; m,m°p,s, s°p

—массы и площади миделя аппаратов; х,у,тс— координаты центра Земли в нецентральной стартовой СК; Р — удельная тяга двигательной установки ЛА противника; тзх , созу, со32 — составляющие угловой скорости вращения Земли по осям координат; г, (лр — расстояние от центра Земли до каждого ЛА; р0 — начальная плотность воздуха; дг — ускорение земного притяжения, направленное к центру Земли; дю — ускорение земного притяжения, направленное параллельно оси вращения Земли в экваториальной плоскости; Р0 — градиент плотности атмосферы; ф — широта точки старта противнику г3^р =Ю3/

Условия приведения ЛА-союзника в цель задавались следующими терминальными ограничениями — координатами цели в инер-циальной СК:

x(T) = x(T); z(T) = Zц(T); y(T) = 0.

(16)

Неотрицательная скалярная функция, характеризующая расстояние между объектами, имела вид:

0 [У (ч ), 2(4)] = л/(х - хпр)2 + (у - у пр)2 + ( г - гпр)2

(17)

Компоненты вектора управления w (г) ЛА-противника задавались уравнениями:

= Я С05(уз -ф) + . 8ш(уз -ф) . (у2С05ф-у151Пф)

— Л 1 Г P -S0-X„ Vx7 + X8 + X9 ,

w2 =Л7-CySPoe ---------------------'

(18)

w3 = Л 1cySPoe S0'xi 1

x.+X2 + x9

а вектора управления u0 (t) ЛA-союзника — уравнениями:

ui0 = y7 sign(H2(ui);

u° =П sign(нз(uг)), б

(19)

где

H 7(u 1 ) = Нз (u7) =

CyPoe S0'X4x1 + x7 + X3г

2m

Cyp0e в 5 I + x2 + %

2m

Su7.

Ввиду громоздкости соотношения (12-14) не приводятся.

При моделировании реальное "неизвестное" объекту союзника управление нападаю-

Т-Сотт #5-2009

m

m

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

m

т

z

z

w

щего синтезировалось оптимально по Веллману. Предполагалось упрощающее рассуждение, не влияющее на общность полученных результатов, что нападающему "мгновенно" известна текущая информации о взаимном расположении обоих объектов и его управление синтезируется без временной задержки.

Моделировались два практических случая управления союзником. В первом случае задавалось программное релейное управление. При этом объект нападающего поражал ЛА союзника на 61-й секунде. Во втором случае синтезировалось управление союзником на основе сформированной методики. Тогда аппарат союзника выполнял маневр уклонения и обходил ЛА нападающего за счет преимуществ в скорости и энергетике, а затем выходил в заданную конечную область пространства (16).

Размерность интегрируемой в прямом времени системы дифференциальных уравнений при этом была равна 300, а затраты на реали-

зацию одной итерации разработанного алгоритма решения задачи синтеза управления ЛА-союзника составляли ~0,0480 06 КОп, что при шаге интегрирования Ь = 0,1 с потребует быстродействия вычислителя =4,8^ 106 КОп/с, что соответствует сегодняшнему уровню развития бортовых вычислителей.

Известно, что использование классических методов теории дифференциальных игр и традиционных минимаксных подходов на основе решения уравнения в частных производных Айзекса требует существенно больших вычислительных затрат и в рассмотренном случае высоких размерностей уравнений динамических объектов практически нереализуемо.

Полученные результаты позволяют сделать вывод об эффективности рассмотренной методики и о возможности управления объектами, осуществляющими доставку полезного груза в заданную терминальную область пространства при одновременном совершении маневров уклонения от объектов нападающего.

ЭКОНОМИИ

Литература

1. Пантелеев А.В., Бортаковский АС Теория управления в примерах и задачах. М.: Высш. шк., 2003.

2. Справочник по теории автоматического управления / Под ред. А. Красовского. М.: Наука, 1987.

3. Щербань И-В. Эффективный субоптимальный алгоритм управления игроком-союзником в конфликтной задаче // Изв.РАН. ТиСУ 2007. — №1. — С. 7-12.

4. Соколов СВ., Щербань И.В. Решение задачи синтеза оптимального управления в конфликтной задаче // Изв.РАН. ТиСУ 2003. — №5. — С.35-40.

5. Первачев СВ., Перов АН Адаптивная фильтрация сообщений. М.: Радио и связь, 1991.

6. Барков В.В., Кочетков ЮА Краевая задача оптимального управления нелинейными детерминированными системами // Изв. РАН. ТиСУ, 1995. — №6. — С.184-193.

7. Буков ВН Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987.

"ЦентрТелеком" и "Скай Линк" подписали соглашение о намерениях по организации сетей МУЫО в Центральном Федеральном округе РФ

ОАО "ЦентрТелеком" и ЗАО "Скай Линк" подписали соглашение о намерениях по организации виртуальных сетей подвижной радиотелефонной связи (МУЫО) на основе использования ресурсов сети 1МТ-МС-450. Соглашение подписано в рамках выполнения Генерального соглашения о сотрудничестве, заключенного 24 марта 2008 г. между ОАО "ЦентрТелеком" и ЗАО "Скай Линк" в целях развития и реализации совместных проектов на территории Центрального Федерального округа Российской Федерации.

В подписанном документе стороны выразили намерение о строительстве и вводе в эксплуатацию новых сетей 1МТ-МС-450 в Брянской, Смоленской, Курской, Липецкой, Белгородской, Орловской и Тамбовской областях. Согласно договоренности, ОАО "ЦентрТелеком" приобретет оборудование необходимое для обеспечения покрытия сети 1МТ-МС-450 на соответствующей территории, а также осуществит необходимые работы по монтажу телекоммуникационных систем. ЗАО "Скай Линк" в свою очередь предоставит "ЦентрТелекому" радиочастотный ресурс для организации МУЫО на территории перечисленных регионов.

По словам Генерального директора ОАО "ЦентрТелеком" Ваагна Мартиросяна, реализация совместного пилотного проекта по предоставлению услуг связи с использованием сети стандарта 1МТ-МС-450 на территории Костромской, Ивановской и Ярославской областей доказала эффективность существующей схемы взаимодействия ЦентрТелекома и ЗАО "Скай Линк". "Менеджмент компании доволен достигнутыми в течение 2008 и 2009 гг. результатами нашего партнерства. В настоящее время мы прорабатываем технические и экономические условия развития

Т-Сотт #5-2009

сотрудничества со "Скай Линком". Но уже сегодня можно с уверенностью говорить о том, что совместная работа наших компаний не только даст нам возможности для расширения спектра предоставляемых услуг с использованием синергического эффекта от использования ресурсов, но и позволит сделать еще один существенный шаг на пути решения проблемы цифрового неравенства в регионах ЦФО".

Проект предусматривает совместное использование технического ресурса действующих сетей CDMA450 (ЗАО "Скай Линк"), а также совместное строительство новых сетей в регионах, где "Скай Линк" имеет лицензии и частотный ресурс. Это 14 субъектов Российской Федерации в ЦФО, где можно обеспечить покрытие не только крупных городов, но и более полное покрытие на территории всех интересующих регионов, с общей емкостью сети до 1 млн. абонентов.

ОАО "ЦентрТелеком" планирует в ближайшее время предоставить в регулирующие органы документы, необходимые для получения лицензии на использование бизнес-модели виртуальных сетей подвижной радиотелефонной связи без использования собственного радиочастотного ресурса (MVNO) на территории ЦФО. Таким образом, ОАО "ЦентрТелеком" станет первым в России оператором связи, внедряющим услуги MVNO на базе собственного оборудования.

Согласно положениям подписанного соглашения, "Скай Линк" предоставит "ЦентрТелекому" ресурсы уже существующих сетей IMT-MC-450 на территориях Москвы и Московской области, а также во Владимирской, Воронежской, Тверской, Калужской и Рязанской областях.

33

л

i Надоели баннеры? Вы всегда можете отключить рекламу.