Научная статья на тему 'Нелинейная задача адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе с несколькими преследователями'

Нелинейная задача адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе с несколькими преследователями Текст научной статьи по специальности «Математика»

CC BY
150
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ / ЗАДАЧА ПРЕСЛЕДОВАНИЯ-УКЛОНЕНИЯ / АДАПТИВНОЕ МИНИМАКСНОЕ УПРАВЛЕНИЕ / МИНИМАКСНАЯ ФИЛЬТРАЦИЯ / УПРАВЛЯЮЩИЕ И НАВИГАЦИОННЫЕ СИСТЕМЫ

Аннотация научной статьи по математике, автор научной работы — Шориков А. Ф.

В статье рассматривается задача адаптивного минимаксного управления для процесса преследования-уклонения с неполной информацией в динамической системе, которая состоит из нескольких управляемых объектов. Движения всех объектов 7» (г € {1, 2, п}) и II (управляемых п преследователями Р{ и уклоняющимся Е соответственно) описываются нелинейными дискретными рекуррентными векторными уравнениями. Значения информационных сигналов генерируются нелинейными дискретными векторными уравнениями при наличии соответствующих ошибок измерений. Предполагается, что множества, ограничивающие изменение всех априори неопределенных параметров рассматриваемой динамической системы, известны и являются выпуклыми, замкнутыми и ограниченными многогранниками (с конечным числом вершин) в соответствующих евклидовых векторных пространствах. Предполагается также, что в данном процессе существует преследователь Р, которому в каждый момент времени доступна вся информация, имеющаяся в распоряжении каждого преследователя Pi, г € 1,п,п он может предоставить каждому из них свои оценки возможных реализаций фазового вектора объекта II в этот момент времени. При сделанных предположениях формулируется и решается нелинейная задача адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе с неполной информацией при наличии нескольких преследователей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Шориков А. Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нелинейная задача адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе с несколькими преследователями»

НЕЛИНЕЙНАЯ ЗАДАЧА АДАПТИВНОГО МИНИМАКСНОГО УПРАВЛЕНИЯ ДЛЯ ПРОЦЕССА ПРЕСЛЕДОВАНИЯ-УКЛОНЕНИЯ В ДИСКРЕТНОЙ ДИНАМИЧЕСКОЙ СИСТЕМЕ С НЕСКОЛЬКИМИ ПРЕСЛЕДОВАТЕЛЯМИ

А.Ф. Шориков

В статье рассматривается задача адаптивного минимаксного управления для процесса преследования-уклонения с неполной информацией в динамической системе, которая состоит из нескольких управляемых объектов. Движения всех объектов 7* (г € {1, 2, • • • , п}) и II (управляемых п преследователями Р{ и уклоняющимся Е соответственно) описываются нелинейными дискретными рекуррентными векторными уравнениями. Значения информационных сигналов генерируются нелинейными дискретными векторными уравнениями при наличии соответствующих ошибок измерений. Предполагается, что множества, ограничивающие изменение всех априори неопределенных параметров рассматриваемой динамической системы, известны и являются выпуклыми, замкнутыми и ограниченными многогранниками (с конечным числом вершин) в соответствующих евклидовых векторных пространствах. Предполагается также, что в данном процессе существует преследователь Р, которому в каждый момент времени доступна вся информация, имеющаяся в распоряжении каждого преследователя /',. / 6- 1,п,и он может предоставить каждому из них свои оценки возможных реализаций фазового вектора объекта II в этот момент времени. При сделанных предположениях формулируется и решается нелинейная задача адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе с неполной информацией при наличии нескольких преследователей.

Ключевые слова: дискретные динамические системы, задача

преследования-уклонения, адаптивное минимаксное управление, минимаксная фильтрация, управляющие и навигационные системы.

Для организации минимаксного управления процессом преследования в выбранном классе допустимых стратегий адаптивного управления предлагается рекуррентная процедура, каждый шаг которой базируется на реализации процессов апостериорной минимаксной фильтрации [4; 5] и на решении задач линейного и выпуклого программирования.

Представленные в данной статье результаты базируются на исследованиях [1-6],могут быть использованы для компьютерного моделирования

сложных динамических процессов, а также для проектирования технологических и транспортных оптимальных цифровых управляющих и навигационных систем. Математические модели таких систем рассматриваются, например, в работах [1-9].

1. Описание задачи

На заданном целочисленном промежутке времени О, Т = {0,1, • • • , Т} (Т > 0) рассматривается дискретная динамическая система, которая состоит из (п + 1) управляемого объекта: п объектов (n G N, где N есть множество всех натуральных чисел) - объектов i G 1,п (управляемых преследователями Pjt соответственно) и объекта II (управляемого уклоняющимся Е). Движение каждого объекта Ц (г G 1,п) описывается нелинейным дискретным рекуррентным векторным уравнением вида

У«(*+1)=/«(*,У«(*),««(*)), (1)

а движение объекта II описывается следующим нелинейным дискретным рекуррентным векторным уравнением:

z{t + !) = f(t,z(t),v(t)). (2)

Здесь t G 0,Т- 1; y«(i) G Rri (yW(Û) = yf ) является фиксированным) и z(t) G Rs есть фазовые векторы объектов 1{ и II в момент времени t G 0, T соответственно (ri, s G N, для к G N, Rfc есть k-мерное евклидово векторное пространство векторов-столбцов); u^(t) G RPi и v(t) G R9 есть управляющие воздействия (управления) преследователя Pjt и уклоняющегося Е соответственно, удовлетворяющие ограничениям

u(i)(t) G и® С RPi, v(t) G Vi С Kq (pi, q G N); (3)

вектор-функция : 0, T — 1 x Rr* x RPi —)• Rr* для всех i G 1, n и t G 0, T — 1 является непрерывной по совокупности переменных вектор-функция / : 0, Т — 1 x Rs x R9 —> Rs для всех t G 0, T — 1 является непрерывной по совокупности переменных (z,v)\ предполагается, что для всех t G 0, Т фазовые векторы z(t) G Rs объекта II, формирующиеся согласно (2), (3), удовлетворяют ограничению

z(t) G Z* С Rs; (4)

все множества U®, для всех г G l,n, Vj и Z* есть выпуклые, замкнутые и ограниченные многогранники (с конечным числом вершин) в пространствах RW,R« Rs соответственно; для всех i G 1, п и (t, у®) G 0, T — 1 x Rr*

множество /М(£, уМ, 11^) = {/М(£, уМ, «М), € и^} С 11г* является вы-

пуклым; для всех (¿, г) € О, Т — 1 х И/ множество ¡'(1, г, Ух) = {,¡'(1, г, у), V € Ух} С К4 является выпуклым.

Опишем информационные возможности преследователей Р*, г € 1, гг, в процессе преследования-уклонения (адаптивного минимаксного управления в процессе преследования объекта II объектами /¿).

Пусть для некоторых момента времени д € 1, Т и целочисленного промежутка времени 0,1? С О, Т к моменту времени 1? в процессе преследования-уклонения (1)-(6) каждым из преследователей Р* (г € 1, тг) измеряются и запоминаются следующие величины: у «(0) = Уо) ~ начальный фазовый вектор объекта 7* ; и^(-) = (и^‘ ’(«)},да _ _ история реализаций управления преследователя Р* на промежутке времени 0,1?; ш®(-) = {^®(£)}<ео^ (ш®(£) € Кт‘; m¿ € Г*Т, т; < «) - история реализаций информационного сигнала ^ на промежутке времени 0,#, значение которого ш(£) (ш И(0) = является фиксированным) для всех I € 0,1? генерируются дискретным векторным уравнением вида

ш(г) ф = ^(¿) (у(г) (¿))г(*)) + ¿7« (¿)? (5)

где £®(£) есть ошибка измерений, удовлетворяющая ограничению

£%) € Н® С (*¿6 Г*). (6)

Допустим, что для всех % € 1,п, * € 0,Т и векторов у®(£) € Г1г* Е^(у^(^) и Р®(£) есть действительные матрицы размерностей (т; х «) и (т; х /¿) соответственно, и для всех у(* }(*) каждая матрица Е^(у^(1)) имеет ранг т;, который равен размерности вектора ш®(£); для каждого г € 1,гг множество ^ есть выпуклый, замкнутый и ограниченный многогранник (с конечным числом вершин) в пространстве И1{.

Предполагается также, что в рассматриваемом процессе существует преследователь Р, который располагает информацией, имеющейся в распоряжении всех преследователей Р*, 'I € 1, гг, в каждый момент времени

I € О, Т. Преследователь Р должен предоставлять каждому из преследователей Р* (г € 1, гг) все имеющиеся у него данные, касающиеся оценки фазовых векторов г(1) объекта II. которыми он располагает в момент времени £ € О/Г.

В течение рассматриваемого процесса преследования-уклонения преследователь Р и все преследователи Р*, г € 1, тг, знают множество ^(0) = г0 С г* С Л5 допустимых начальных фазовых векторов г(0) = го объекта

II, которые совместимы [1] со всеми начальными информационными сигналами оо$ \ г € 1,п. Предполагаются также известными для них все уравнения и ограничения, определяющие дискретную динамическую систему (1)-(6).

Качество процесса преследования-уклонения оценивается наименьшим значением из расстояний между объектами г € 1,тг, и объектом

II в конкретном пространстве 11А (к £ Т$; к < г^, для всех i £ 1,п;к < я) в момент времени Т.

Тогда для преследователя Р и всех преследователей Р*, г € 1 ,п, цель адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (1)-(6) может быть сформулирована следующим образом: на заданном промежутке времени О, Т требуется организовать все управления иМ(-) = {ц^(£)}<£0 Т_1 преследователей Рз, г € 1,п (для I € О, Т — 1, и®(£) € и^), позиционным образом (как реализации адаптивной минимаксной стратегии в выбранном классе допустимых адаптивных стратегий) используя возможные (согласно (1)-(6)) реализации информационных сигналов ш®(-) = (^)}*ео~т

совместно со всей другой доступной информацией об этом процессе таким образом, чтобы максимальное значение из расстояний между реализациями векторов {?/гНТ)}к = (Уг^Т),у^Т), • • • ,у^(Т)) € Ик и {г(Т)}к = (гх(Т), гг(Т), • • • , гк(Т)) € Ик, было минимальным. Здесь ?/г)(Т) есть реализация фазового вектора объекта 1{ в момент времени Т, соответствующая управлению и®(-) и г(Т) есть допустимая реализация фазового вектора объекта II в момент времени Т, которая может быть оценена в данном процессе только как элемент соответствующего информационного множества [1-5]

Предполагается, что уклоняющийся Е может иметь полную информацию о параметрах дискретной динамической системы (1) - (6) на заданном промежутке времени О, Т и его цель в процессе преследования-уклонения является диаметрально противоположной цели преследователя Р и преследователей Р*, г € 1,71.

2. Постановка задачи

Введем ряд определений, которые необходимы для строгой математической формулировки задачи адаптивного минимаксного управления процессом преследования-уклонения в дискретной динамической системе (1) -(6).

Для любых фиксированных натуральных чисел п € N и целочисленного промежутка времени т,1 С 0,Т (г < I) символом Э„(г,#) будем

обозначать метрическое пространство функций целочисленного аргумента ip : т, 1? ^ R”, в котором метрика рп определяется по формуле

/МЫ'КЫ')) = max II ||n

((Ы'КЫ')) e Sn(r,1?) X Sn(r,1?)),

и через comp(Sn(r, i9)) будем обозначать множество всех непустых и компактных в смысле этой метрики подмножеств пространства Sn(r, 1?). Здесь || • || п есть евклидова норма в R”.

Используя ограничение (3), определим множество £А*)(т, 1?) €

comp(SPi(r, 1? — 1)) всех допустимых управлений и^(-) = (¿)}

преследователя Pi (г G 1 , тг) на промежутке времени f,if С 0,Т (т < I) в виде

= {u(i)(-) : и(г)(-) G SPi(r,t? - 1), Vi G т, t? - 1, G U®}

___ ____ П ___________

и определим через U(l, П, T, 1?) = ?7®(т, 1?) множество всех допустимых

i=1

управлений и(-) = (•), (•),•• • г/”^(-)} G C/(l, тг, г, 1?) преследователя

Р на промежутке времени г,# (где для к G N и множеств Xj, г G l,fc, fc

множество X = J] Х{ есть множество Х\ хХ2 х • • • xXfc). Заметим, что тогда ¿=1

для фиксированного индекса г G 1,тг справедливо равенство U(i,i,T,i9) =

Аналогичным образом, используя ограничения (3) и (6), определим множества V(t,i9) G comp(S9(r, 1? — 1)) и нМ(т, 1?) G сотр(8/Дт + 1,$))

(г G 1, тг) всех допустимых управлений v(-) = {^(¿)}<£т уклоняющегося Е1 и всех допустимых ошибок измерений £®(-) = ^ информационного сигнала Jj (г G 1,тг) на промежутке времени т, 1? соответственно.

Для фиксированного i G 1, тг определим через 0®(т, 1?) С

STOj(r + l;^) множество всех допустимых, согласно (1) - (6), реализаций >(•) = -М ^(¿)}<£т+1 ^ информационного сигнала Jj на промежутке вре-

___ Л _______ п Л _ _________________

мени г,# и определим через 0(1,тг,т, 1?) = J|OW(r, ■$) множество всех

¿=1

допустимых наборов ш(-) = {w^^(-),w^(•),••• , u/”^(-)} G 0(1,тг,г, 1?) информационных сигналов Jj, % G 1, тг, на промежутке времени т, 1?. Заметим, что тогда для фиксированного индекса i G 1, тг справедливо равенство

fi(v*,M) = OW(i^).

Далее, назовем набор ад«(т) = (т,у^(т),И(т)} G 0,Т х Rr* х comp(Rs) (где ^(т) есть множество допустимых фазовых состояний z(r) G

Ш объекта II в момент времени Т, и) «(0) = = {0,у«,Яо})

и набор 1м(т) = {т,у(т),г(т)} е 0,Т х И/ х сотр(115) (у(т) =

П

{у{14т)^у{24т)г--,у{п4т)}^ г = ад(0) = = {0,уо,^о}, ^5 =

¿=1

{0,уо;-^о}> Уо = 2/(0) = {Уо^Уо^-" ,У?°}) т-позицией преследователя P¿ (* € 1, п) и г-позицией преследователя Р в дискретной динамической системе (1) - (6) соответственно, где непустое множество ZQ определяется следующим образом:

Я0* = {¿о : ¿о € г0, V* € Т~й, € 3«, и;« = С^(у^)г0 + £>«(0)$°}.

Для всех г € 1,тг и т € 0, Т определим также множества Ш^(т) = {т}х^ хсотр(115) (#«(0) = = {адМ(О) = го^ : = {0,уЦ\и0} €

{0} х ВЛ х сотр(115)}) и ]¥(Т~п,т) = {г} х И/ х сотр(115) (Ж(Т~й,0) = р!о(1, п) = {го(0) = изо '■ 1^0 = {0, уо, Z0} е {0} хЕГх сотр(11/)}) всех допустимых г-позиций преследователя Р* и преследователя Р соответственно. Заметим также, что для любого фиксированного индекса г € 1, тг справедливо равенство Й^(г, г,т) = Ш^(т).

Далее, для фиксированных промежутков времени г, 1? С

0,Т (г < 1?), допустимой, согласно (1) - (6), реализации г-позиции ™(т) = {Г>У(ГК^(Г)} е ~п,т) (у(т) = {у(1)(г),у(2)(г),--- ,у(п)(т)}) преследователя Р, его управления и(-) = (•), (•), — • ,

и(«)(.)} ^ 11(1, п, т, 1?) и набора информационных сигналов «7^, г € 1,тг: ш(.) = (-),и;(2) (•),••• ,и;( ”)(•)} € 0(1, гг, г, 1?) введем множество

Р(1, гг, г, 1?, го(т), гг(-), ш(-)) всех допустимых пар (5(т), #(•)) € Z(т) хУ(т,19), совместимых (см. [1; 3; 4]) с этой информацией на промежутке времени т, 1?, согласно следующему соотношению:

й(1,п,т,1?,ад(т), «(•),<*/(•)) = {(¿(г), £(•)) : (г{т),Ъ{-)) € £(т) х У(т,1?),

V* € 1, гг, Ш € т + 1,1?, 3|М(г) €

?(0

"1 !

ш«(г) = <7<%М(г))г(г) + £>«(*)|«(*)

(у%) = у«(^Ду«(т), ««(•)), г(*) = г,(М, ¿(г), «(•)))}, (7)

где у\^(т, $, у(^ (т), (■)) И ^(т, 1?, ¿(т), #(•)) есть сечения движений объ-

ектов 7* (г € 1,тг) и II на промежутке времени г,# в момент времени I € г + 1,1? соответственно. Согласно (1), (2), движения объектов 7* и II порождены парами (у(г)(г),гг(г)(-)) и (г(г),«(•))•

Назовем множество

= г#(т,д,г(т),у(-)), (г(т),у(-)) € Я(1 ,п,т,д,у}(т),и(-),ш(-))} (8)

информационным множеством преследователя Р в процессе апостериорной минимаксной фильтрации (см. [1; 3; 4]) на промежутке времени т, 1? для дискретной динамической системы (1) - (6), соответствующим моменту времени 1? и набору (го(т), и(-), ш(-)) € 1¥(1,п,т) х [/(1, п, т,&) х П(1, п, т,&). Заметим, что это есть множество всех допустимых реализаций фазового вектора объекта II в момент времени которые совместимы со всей информацией об этой системе, известной преследователю Р на промежутке времени т, 1?.

Аналогично этому для фиксированного индекса г € 1,тг назовем множество И^(г,г,т,19,ю^(т),и^(-),ш^(-)) информационным множеством преследователя Р* в процессе апостериорной минимаксной фильтрации на промежутке времени т,$ для дискретной динамической системы (1) - (6), соответствующим моменту времени д и набору

#М(т) х и(гЦт,§) х ПМ(т, 1?). Заметим, что это есть множество всех допустимых реализаций фазового вектора объекта II в момент времени 1?, которое совместимо со всей информацией об этой системе, известной преследователю Р* на промежутке времени г, •& без учета информации, которая может быть предоставлена ему преследователем Р.

Для фиксированных промежутка времени т, 1? С О, Т (г < 1?), г-позиции и)(т) = {т,у(т), Z(т)} € Ш(1 ,п,т) (у(т) =

{у(1Ч т), </2>( г), • • • ,у(п\т)}) преследователя Р и его управления и(-) = (•), (•),•• • ,«(”)(•)} € и(1, п, г, 1?) определим следующие множества:

П(1 ,п,т,1?,ад(т),«(-)) = (ш(-) : ш(-) = {ш(1)(•),ш(2)(•),•• • ,ш(п)(')} ^

€ 0(1, п, г, 1?), V* € 1, п, Ш € т + 1,1?,

0,(0(¿) = с<%«(*)М*) + о(г)№(гЧ*) (У(гЧ*) = УРЫ),У{гЧг),и(гЧ-)),

г (г) = гг(т,&,г(т),у(-)), £М(г) € н[г), (г(т),у(-)) € г(т) х У(т,§)}; (9)

И^(1, п, г, го(т), 1?, «(•)) = {го(1?) : го(1?) € 1^(1, п, ■$), ад(#) = {#,у(#),ад}, у(#) = {у«(#),у(2)(#),--- ,уЩ, уМ(#) = у^(т,’д,у^(т),и^(-)), 2-(#) = ^е)(1,п,г,#,ад(г),и(-),ш(-)),

ш(')еО(1,п,т,1),и1(т),н('))}. (10)

Назовем их множеством всех допустимых информационных сигналов г £

1, гг, на промежутке времени т,д и множеством всех допустимых ^-позиций преследователя Р, которые соответствуют г-позиции го(т) и управлению

«(О-

Используя определения (7) - (10) и условия, оговоренные для системы (1) - (6), можно доказать (см. [4]) справедливость следующего вспомогательного утверждения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 1. Для фиксированных промежутка времени т,§ С

О, Т (г < д) и допустимой, согласно (1) - (6), реализации набора (Ц), и(-), ш(-)) € И^о(1 ,п) х 1/(1, гг, 0,1?) х 0(1, тг, 0,1?, гоо, гг(-))

(„(•) = {«(!)(.),и^(-),--- ,«(">(•)}, ш(-) = _>«(•),и/2)(-),-- ,<>)(.)}),

соответствующего промежутку времени 0,1?, справедливы следующие соотношения:

72(1, гг, 0,1?, иоц, и(')', ш(')) = -й(1, и, г, ад*(г), й(-), ш(-)); (11)

гу’ (1,4,0,$,= £Г'(1,п,т,1?,г(;*(т), «(•),£;(•)); (12)

0(1, гг, 0,1?, го^, гг(-)) = 0(1, тг, т, 1?, го*(т), й(-));

(13)

И^(1, гг, 0, го^, и(')) = 1^(1, п, г, ад*(г), й(-)). (14)

Здесь для т-позиции го*(т) = {т,у*(т), ZІe\т)} € (1, гг, г) преследователя

Р и его управления й(-) € С/(1, гг, г, 1?) должны выполняться следующие соотношения:

у*(т) = {у[1)(т),у^(т), • • • ,у<п)(т)} € и/; V* € :

У*\т) = УтЧ®1'Г1Уо\и*\')) е ^ «*г)(') = {и(г)Шг&^1 е и(г)(0,т); ZІe\т) = Z[e\l,n,0,т,wl,uít(■),u)ít(■)) € сотр(115),

«*(•) = {гг^(-),«!^(-)> • • • ,гг1")(-)} € ¿7(1, гг, 0, т),

<*/*(•) = {и,11}(-),и,^2)(-), • • • , Ш*п)(-)} € 0(1, тг, 0, т,гио, «*(•));

«(•) = {й(1)(-),и(2)(•),"• ,«(п)(-)} € 17(Т~й,т,0),

V* € : ««(•) = {гг(г)(*)}<е^ € £^>М);

ш(.) = (•), ¿,(2) (•), • • • , (.)} G 0(1, т, tf),

V* G T^n : £/«(•) = {и;М(г)}<ета G 0«(^).

Пусть : W(l,n,r) х U(l, п, т, i?) х 0(1, n, т, i?) —> W(l,n, i?)

есть многошаговое нелинейное отображение, которое каждому набору (ги(т), гг(-), w(-)) G PF(l,n, г) х С/( 1, п, г, i?) х 0(1,тг, т, i?) ставит в соответствие ^-позицию we(d) = {$, ye(i?), Ze(i?)} € PF(l,n, i?) преследователя Р, а именно

We О?) = {1?, Уе($), ^е(^)} = F^(w(r), гг(-), w(-)), (15)

где

Уе(*?) = {у(еЧ'#)-,Уе Ч'#)-,--- ,yin) (*?)}, V* G ТТ^г :

У^($) = У^С^У^К^ОЖ ^e(i?) = (1,п,т,д,'ш(т),и(-),ш(-))

(ад(г) = {r,y(r),Z(r)} (w(0) = wo), у(т) = {у(1)(т),у(2)(г), • • • ,у(п)(т)},

«(-) = {«С1)(-), «(2) (•),••• ,«(п)(-)})- (16)

Далее сформулируем для преследователя Р следующую многошаговую нелинейную задачу построения всех его допустимых позиций в динамической системе (1) - (6).

Задача 1. Для каждой фиксированной реализации набора

(w(t),u(-),im(-)) G W(l, п, т, 1?) х U(l, п, т, 1?) х 0(1, п, т,§) (w(0) = Wq),

который соответствует дискретной динамической системе (1) (6) и из-

вестен преследователю Р в конце промежутка времени т, $ С О, Т (г < #); требуется сформировать многошаговое нелинейное отображение F^ путем реализации конечной последовательности только одношаговых операций.

Отметим, что информационное множество Z^(l, п, т, $, w(t), и(-), w(-)) С Rs является основным элементом решения задачи апостериорной минимаксной нелинейной фильтрации (см. [4; 5]) и необходимо для решения рассматриваемой задачи преследования-уклонения.

Тогда для оценивания качества процесса преследования-уклонения преследователем Р в динамической системе (1) - (6) на промежутке времени т,д С О, Т, введем функционал 7 : 2N х W(l,n, т) х U(l, п, т, 1?) х 0(1, п, т, 1?) —> R1 таким образом, что для любых фиксированных целочисленного множества J С l,n G 2N и реализации набора (ии(т),и(-),ш(-)) G W(l,n,r) х U(l, п, т, 1?) х 0(1, гг, г, 1?), его значение определяется на основании следующего соотношения:

7(J,t,$,w(t),u(-),uj(-)) = min max || {y(j)($)}k ~ {z($)}k life

jej {z(0)}k£{ZM(0)}k

(7=1,п, {у(Л(#)Ь = {4л(г,#,у(Л(г),«(Л(-))}ь {г^тк =

= {^е)(1,и!т^!^(г),и(-),ш(-))}й). (17)

Здесь и ниже, для пе^ к € 1, п, ж = (жх, Ж2, • • • , ж„)' € И” и X С И”, выражения {ж}^ = (ж1, Ж2, • • • , ж^)' € й/’ и = {^ : д € й/’. д = {ж}^, ж €

X} С 11/' определяют ¿-проекцию вектора ж и ¿-проекцию множества X соответственно; ги(т) = {т,у(т), И(т)} € ^(1,71, т) (го(0) = гоп), у(т) = (у^^Нт),--- ,У(п)(т)} € 1Г; «(•) = {«(!)(.),«(2)(-),-",«(п)(-)} е 17(1, п, т, д).

Введем несколько определений.

Допустимой стратегией адаптивного управления и преследователя Р для процесса преследования-уклонения в динамической системе _ (б) на промежутке времени О, Т будем называть отображение и : Ш(1 ,п,т) —> 17(1, п, т, т + 1), которое ставит в соответствие каж-

дому моменту времени г € О, Т — 1 и возможной реализации г-позиции ио(т) = {т, у(т),г(т)} € Ш(1 ,п,т) (ад(0) = гоо) множество и(го(т)) С

17(1,п,т,т + 1) управлений и(т) = {и^ (т),и^ (т), ■ ■ ■ ,и^п >(т)} е

_____________п

17(1,п, т, г + 1) = Л 11^ преследователя Р. Обозначим множество всех до-¿=1

пустимых стратегий адаптивного управления преследователя Р в рассматриваемом процессе преследования-уклонения через и*.

Введем стратегию адаптивного минимаксного управления преследователя Р для процесса преследования-уклонения в динамической системе (1) - (6) как реализацию специфической стратегии адаптивного управления и!е) = и!е)(ад(т)) е и* (г е О,Т — 1, ии(т) е 1¥(1^п,т), ад(0) =

?щ) из класса допустимых стратегий адаптивного управления процессом преследования-уклонения и*, которая формально описывается следующими соотношениями:

1) для всех т € О, Т — 1 и г-позиций 'Ш^(т) = {т, у^(т), Z^(т)} € Ш(1,п, 0, ?щ,т, и^т\-)) («^(О) = пусть

и 1е)(ад(е)(т)) = и(е)(и}(е)(т)) С и(йп,т,т+ 1); (18)

2) для всех г € 0,Т-1 и г-позиций го(т) = {т,у(т), Z(т)} € {}¥(!, п, т) \ Ш(1, п, 0, юа, т,и^(-))} (ю(0) ф год) пусть

П

и!е) Ыт)) = и(1^, туг+Т) = П и? • (19)

¿=1

Здесь Wq = {0,ijq,Zq} Є PFo(l,n); для допустимых на промежутке времени

О, т (т > 1) реализаций управления

uie4') = е и(1,п,0,т)

преследователя Р и информационного сигнала ш^(-) = {oo^(t)}teY^ Є

fi(l, П, 0, T, Wq, его г-позиция w^(t) = {т,у^ (т), (т)} формиру-

ется согласно (15), а именно

«,<'%) = {■m/'VkzWm} = F^M,«<?)(•),4‘>(-));

множество U^('Ш^(т)) должно удовлетворять следующему соотношению:

и(е)(ад(е)(т)) = {„(е)(т) : „(е)(т) є 1/(17^, г,г + 1),

тах 7(1, п, т, т + 1 ,w^(t),u^ (т),ш(т + 1)) =

ш(г+1)еП(1) (и(е)(т))

= min____________ тах 7(1, п, т, т + 1, w^(t), и(т), ш(т + 1)) =

к(т)ЄІ/(1,я,т,т+1) ш(т+1)єП(2) (и(г))

= (1,П,Т,Т + 1) (fiW(i/e^(r)) = il(l,n,T,T + 1,W^ (t),U^ (т)),

Q,^(u(t)) = fi(l ,п,т,т + 1,'W^(t),'u(t))}, (20)

где функционал 7 определен соотношением (17), а число c^\l,n, т, т + 1) есть оптимальный гарантированный результат, соответствующий реализации стратегии адаптивного минимаксного управления U^ Є U* преследователя Р на промежутке времени т, т + 1. Из сделанных выше предположений относительно элементов дискретной динамической системы (1) - (6) и свойств функционала 7 следует, что для всех моментов времени г Є 0, Т — 1 и r-позиций 'ш(т) Є W(l,n,r) (w(0) = wq) множества U(e^(w(r)) являются непустыми.

Пусть реализации управления и^еЦ-) = {и^ (t)}t& Т_1 Є U(l, п, 0, Т) преследователя Р и информационного сигнала ш^(-) = {uj^(і)}^ 0(1, п, 0, Т, г/е)(-)) являются результатом использования стратегии адаптивного минимаксного управления Є U* на промежутке времени 0, Т и информационный сигнал

w(e)(T) Є П(Цп,Т- 1,Т,ад(е)(Т - l),u(e)(T - 1))

удовлетворяет следующему соотношению:

7(М:,Т^ 1,Т,ад(е)(Т- 1),и(е)(Т^ l),w(e)(T)) =

= шах 7(1, п,Т- 1,Т,ад(е)(Т- 1),и(е)(Т- 1),и/(Т)),

ш(Т)єП(и(е)(Т—1))

(П(и(е)(Т - 1)) = П(Т“^,Т^ 1,Т,ад(е)(Т - 1),и(е)(Т - 1))), где (Т — 1)-позиция преследователя Р

■щ(е)(т — 1) = {Т-1,у(е)(Т-1),Я(е)(Т-1)} Є ИЛ(ї“д,0,ад2,Т-1,'4Є11(')); у^Л-) = «?-!(•),•••, е СА(М,0ТГ^Т),

V* Є Т^п : = {и(г,Є)(Щі&їт^2 е ^(і)(0, Т — 1);

у(е) (Т - 1) = (Т - 1), у^ (Т - 1), • • • , (Т-1)}еГ,

V* Є Т^п : у^(Т - 1) = у^ОД^у^ї-ІО) Є И-Гі!

^(е)(т _ 1) = ^(Т^од^Ц^іОДІїО),

^т-і(') = {ш(е)(*)}<еТ7г31 Є 0(1, п, О, Т — І,^,^!^-)). Тогда назовем число

4е) (1^, О/Г) = 7(М, О/Г, ,«(е) ('■) ^(е) ('))

оптимальным гарантированным, результатом, соответствующим реализации стратегии адаптивного минимаксного управления Є и* преследователя Р на промежутке времени О, Т.

На основании приведенных выше определений можно сформулировать следующую основную задачу адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (1) - (6) с неполной информацией при наличии нескольких преследователей.

Задача 2. Для фиксированной начальной позиции ги(0) = =

{О, уо;-^о} Є И^о(1 ,п) преследователя, Р в дискрет,ной, динамической системе (1) - (6) требуется сформировать его стратегию адаптивного минимаксного управления, иі^ Є и* и оптимальный гарантированный результат сіе)(1, п, О, Т); соответствующий реализации этой стратегии на промежутке времени О, Т в процессе преследования-уклонения, в виде реализации, конечной последовательности только одношаговых операций.

3. Заключение

В данной работе приводится строгая математическая постановка задачи 2 адаптивного минимаксного управления для процесса преследования-уклонения в нелинейной дискретной динамической системе (1)-(6) с непол-

ной информацией при наличии нескольких преследователей. На основании результатов работы [6] и решения задачи 1 (нелинейной минимаксной фильтрации по схеме из работы [4]) для организации адаптивного е-минимаксного управления процессом преследования в выбранном классе допустимых стратегий адаптивного управления предлагается рекуррентный алгоритм, который сводит исходную многошаговую задачу к реализации конечной последовательности только одношаговых оптимизационных задач линейного и выпуклого программирования. Данный алгоритм реализован в виде программного комплекса для персонального компьютера. Следует отметить, что действие предлагаемого алгоритма не зависит от размерности векторов, входящих в систему (1)—(6), а также от числа шагов процесса преследования-уклонения и ограничивается только ресурсами компьютера, который используется для его реализации.

Список литературы

1. Красовский H.H. Теория управления движением. М.: Наука, 1968.

2. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

3. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.

4. Шориков А.Ф. Минимаксные фильтры для оценивания состояний нелинейных дискретных систем // Автоматика и телемеханика. 1991. №4. С. 112-122.

5. Шориков А.Ф. Минимаксное оценивание и управление в дискретных динамических системах. Екатеринбург: Изд-во Урал, ун-та, 1997.

6. Шориков А.Ф. Алгоритм адаптивного минимаксного управления для процесса преследования-уклонения в дискретных системах // Тр. ин-та математики и механики УрО РАН. 2000. Т. 6, № 1-2. С. 515-535.

7. Tabak D. Optimal Control of Nonlinear Discrete-Time Systems by Ma,them,a,tica,I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Programming // J. Franklin Inst. 1970. 289. P. 111-119.

8. Tabak D., Kuo B.C. Application of Ma,them,a,tica,I Programming in the Desing of

Optimal Control Systems // Intern. J. Control. 1969. 10. P. 545-552.

9. Ho Y.C., Bryson A.E., Jr., Baron S. Differential Games and Optimal PursuitEvasion Strategies // IEEE Trans. Automat. Control. 1965. Vol. 10, 4. P.

385-389.

10. Рокафеллар P. Выпуклый анализ. М.: Мир, 1973.

11. Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.: Мир, 1982.

Уральский государственный экономический университет

i Надоели баннеры? Вы всегда можете отключить рекламу.