Научная статья на тему 'Дифференциальная игра поочередного преследования с критерием "промах по истинной цели"'

Дифференциальная игра поочередного преследования с критерием "промах по истинной цели" Текст научной статьи по специальности «Математика»

CC BY
76
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ГРУППОВАЯ ЦЕЛЬ / ЛОЖНАЯ ЦЕЛЬ / ПООЧЕРЕДНОЕ ПРЕСЛЕДОВАНИЕ / ТЕРМИНАЛЬНЫЙ ПРОМАХ / DIFFERENTIAL GAME / GROUP TARGET / FALSE TARGET / ALTERNATE PURSUIT / TERMINAL MISS

Аннотация научной статьи по математике, автор научной работы — Рубинович Евгений Яковлевич

На плоскости рассматривается дифференциальная игра одного преследователя против двух согласованно уклоняющихся целей и , образующих коалицию, одна из котрых ложная. Игроки обладают простыми движениями. Преследователь, имея преимущество в скорости, не знает, какая из целей является ложной, т.е. обе цели для него идентичны. В задачу преследователя входит поимка истинной цели или минимизация промаха до нее в худшем для преследователя случае, когда первоначально он поймал ложную цель. Оказывается, в игре всегда существует последний момент принятия решения преследователем о начале поочередного преследования, т.е. такой момент , начиная с которого порядок поочередного преследования или уже не меняется до конца игры. Специфика постановки состоит в том, что в этот момент преследователь теряет из виду вторую по порядку преследовния цель и, если первая цель оказывается ложной (что определяется в момент встречи), то единственной информацией о второй цели, которой обладает преследователь, являются ее координаты в момент начала поочередного преследования. По этой причине преследователь вынужден двигаться в ту точку, где он видел вторую цель последний раз таким образом, чтобы минимизировать терминальный промах по второй цели в этой точке. Поскольку выбор момента начала поочередного преследования осуществляется преследователем, то момент является по сути его управлением. Этот момент можно выбирать программно, т.е. в момент начала игры (при этом очередность встреч фиксируется с самого начала и не меняется до конца игры) или позиционно, т.е. в процессе преследования, как функцию текущих позиций игроков. В рассматриваемой постановке момент перехода на поочередное преследование осуществляется позиционно и показывается, что в этом случае собственно этапу поочередного преследования предшествует этап совместного преследования двух целей на нтервале , в течение которого преследователь держит цели в условиях неопределенности относительно предстоящего порядка преследования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A DIFFERENTIAL GAME OF ALTERNATE PURSUIT WITH CRITERION "A MISS ON THE TRUE TARGET"

On the plane the differential game of one pursuer against two consistently evading targets and , one of which is false, is considered. Players have simple movements. The targets form a coalition. The pursuer, having an advantage in speed, does not know which of the targets is false, i.e. both targets are identical for him. The task of the pursuer is to capture the true target or minimize the miss to it in the worst case for the pursuer, when he initially caught a false target. It turns out that in the game there is always the last moment of the decision of the pursuer about the beginning of the alternate pursuit, i.e. the instant from which the order of the alternate pursuit or does not change until the end of the game. The specificity of the statement is that at this instant the pursuer loses sight of the second in order of the pursuit target and if the first target is false (which is determined at the time of the meeting), the only information about the second target, which has a pursuer, are its coordinates at the instant of the beginning of the alternate pursuit. For this reason, the pursuer is forced to move to the point where he saw the second target last time in such a way as to minimize the terminal miss on the second target at this point. Since the choice of the instant of the beginning of the alternate pursuit is carried out by the pursuer, the instant is in fact his control. This instant can be chosen programmatically, i.e. at the beginning of the game (the sequence of meetings is fixed from the very beginning and does not change until the end of the game) or positionally, i.e. during the pursuit, as a function of the current positions of the players. In the considered statement the instant of transition to alternate pursuit is carried out positionally and it is shown that in this case the stage of alternate pursuit is preceded by the stage of joint pursuit of two targets on the interval during which the pursuer holds the targets in the conditions of uncertainty concerning the forthcoming order of pursuer.

Текст научной работы на тему «Дифференциальная игра поочередного преследования с критерием "промах по истинной цели"»

Пшихопов Вячеслав Хасанович - НИИ робототехники и процессов управления Южного федерального университета; e-mail: pshichop@rambler.ru; 347900, г. Таганрог, ул. Шевченко, 2; тел.: 88634371694; д.т.н.; профессор; директор.

Медведев Михаил Юрьевич - e-mail: medvmihal@sfedu.ru; д.т.н.; в.н.с.

Соловьев Виктор Владимирович - e-mail: soloviev-tti@mail.ru; с.н.с.

Pshikhopov Viacheslav Khasanovich - R&D Institute of Robotics and Control Systems; e-mail: pshichop@rambler.ru; 2, Shevchenko street, Taganrog, 347900, Russia; phone: +78634371694; dr of eng. sc.; professor; director.

Medvedev Mikhail Yur'evich - e-mail: medvmihal@sfedu.ru; dr of eng. sc.; leading researcher.

Solovjev Viktor Vladimirovich - e-mail: soloviev-tti@mail.ru; senior researcher.

УДК 681.283 DOI 10.23683/2311-3103-2019-1-176-188

Е.Я. Рубинович

ДИФФЕРЕНЦИАЛЬНАЯ ИГРА ПООЧЕРЕДНОГО ПРЕСЛЕДОВАНИЯ С КРИТЕРИЕМ «ПРОМАХ ПО ИСТИННОЙ ЦЕЛИ»

На тоскостп рассматривается дифференциальная игра Г?пг8Я одного преследователя Р против двух согпасованно утоняющихся целей ЕЛ и Ев, образующих коалицию, одна из котрых - ложная. Игроки обладают простыми движениями. Преследователь, имея преимущество в скорости, не знает, какая из целей является ложной, т.е. обе цели для него идентичны. В задачу преследователя входит поимка истинной цели или минимизация промаха до нее в худшем для преследователя случае, когда первоначально он поймал ложную цель. Оказывается, в игре всегда существует последний момент принятия решения преследователем о начапе поочередного преследования, т.е. такой момент в, начиная с которого порядок поочередного преследования Е,\ —Ев «ли Ев н> Ел уже не меняется до конца игры. Специфика постановки состоит в том, что в этот момент 0 преследователь теряет из виду вторую по порядку преследовния цель и, если первая цель оказывается ложной (что определяется в момент встречи), то единственной информацией о второй цели, которой обладает преследователь, являются ее координаты в момент 9 начала поочередного преследования. По этой причине преследователь вынужден двигаться в ту точку, где он видел вторую цель последний раз таким образом, чтобы минимизировать терминальный промах по второй цели в этой точке. Поскольку выбор момента 9 начала поочередного преследования осуществляется преследователем, то момент 9 является по сути его управлением. Этот момент можно выбирать программно, т.е. в момент t — 0 начала игры (при этом очередность встреч фиксируется с самого начала и не меняется до конца игры) или позиционно, т.е. в процессе преследования, как функцию текущих позиций игроков. В рассматриваемой постановке момент 9 перехода на поочередное преследование осуществляется позиционно и показывается, что в этом случае собственно этапу поочередного преследования предшествует этап совместного преследования двух целей на нтервале [0. 0], в течение которого преследователь держит цели в условиях неопределенности относительно предстоящего порядка преследования.

Дифференциальная игра; групповая цель; ложная цель; поочередное преследование; терминальный промах.

E.Ya. Rubinovich

A DIFFERENTIAL GAME OF ALTERNATE PURSUIT WITH CRITERION «A MISS ON THE TRUE TARGET»

On the plane the differential game of one pursuer P against two consistently evading targets Ел and Ев, °ne of which is false, is considered. Players have simple movements. The targets form a coalition. The pursuer, having an advantage in speed, does not know which of the targets is false, i.e. both targets are identical for him. The task of the pursuer is to capture the true target or minimize the miss to it in the worst case for the pursuer, when he initially caught a false target. It turns out that in the game there is always the last moment of the decision of the pursuer about the beginning of the alternate pursuit, i.e. the instant 9 from which the order of the alternate pursuit Ел —Ев or Ец E \ does not change until the end of the game. The specificity of the statement is that at this instant 9 the pursuer loses sight of the second in order of the pursuit target and if the first target is false (which is determined at the time of the meeting), the only information about the second target, which has a pursuer, are its coordinates at the instant 9 of the beginning of the alternate pursuit. For this reason, the pursuer is forced to move to the point where he saw the second target last time in such a way as to minimize the terminal miss on the second target at this point. Since the choice of the instant 9 of the beginning of the alternate pursuit is carried out by the pursuer, the instant 9 is in fact his control. This instant can be chosen programmatically, i.e. at the beginning t — 0 of the game (the sequence of meetings is fixed from the very beginning and does not change until the end of the game) or positionally, i.e. during the pursuit, as a function of the current positions of the players. In the considered statement the instantO of transition to alternate pursuit is carried out positionally and it is shown that in this case the stage of alternate pursuit is preceded by the stage of joint pursuit of two targets on the interval [0. в] during which the pursuer holds the targets in the conditions of uncertainty concerning the forthcoming order ofpursuer.

Differential game; group target; false target; alternate pursuit; terminal miss.

Введение. Дифференциальные игры преследования-уклонения с групповой целью на плоскости, когда преследователей меньше, чем целей, давно привлекают внимание исследователей. Дело в том, что плоский случай с одной стороны позволяет, как правило, получать наглядные аналитические решения, а с другой стороны - вполне приемлем для моделирования конфликтного взаимодействия реальных динамических объектов. Критериями эффективности подобного взаимодействия могут быть традиционные в теории игр преследования-уклонения платежные функционалы типа «Время» или типа «Промах». Математические формализации таких игр допускают учет информационной дискриминированности игроков, в частности, наличие ложных целей, не полную информацию о начальных условиях и т.п. Игры преследования групповой цели при наличии ложных целей подразделяются на дифференциальные игры поочередного и совместного преследования. В первом классе, как правило, в задачу преследователя входит поочередная поимка всех целей или же всех истинных целей, если преследователь имеет возможность классифицировать цели с определенной дистанции или при непосредственном контакте. В случае совместного преследования в задачу преследователя входит сближение непосредственно с группой целей. Задачи совместного преследования двух целей рассматривались в [1, 7, 8]. Задачи поочередного преследования двух целей исследовались в [2-6, 9]. В [5] решались задачи использования мобильной ложной цели для отвлечения преследователя в предположении известных законов наведения и круговой зоны захвата (обнаружения) у преследователя. Работы [10-21] относятся к новому и быстро развивающемуся направлению дифференциальных игр трех игроков типа Атакующий-Цель-Защитник (Attacker-Target-

Defender или Missile-Target-Defender, соответственно ATD или MTD игры). В этих постановках атакующий игрок стремится поймать (поразить) убегающую цель, в то время как задача мобильного защитника, роль которого может играть и ложная цель, - успеть перехватить атакующего игрока. Принципиальное отличие постановки задачи в [21] от [10-20] - неполнота априорной информации о преследователе. Цель знает только начальный пеленг на преследователя и величину его скорости. Само же направление вектора скорости преследователя цели не известно.

Исследуемая в настоящей работе дифференциальная игра Г„,., s поочередного преследования на плоскости преследователем Р двух согласованно уклоняющихся целей Ел я Ев (одна из которых ложная) при простых движениях игроков отличается от рассматриваемых ранее постановок [2-4, 9] на минимизацию времени поочередного преследования двух целей (игра ТитР). В нашей постановке принципиально наличие ложной цели, причем какая именно цель ложная преследователю не известно. Поэтому, как было оговорено выше, в задачу преследователя входит поимка истинной цели или минимизация промаха до нее в худшем для преследователя случае, когда первоначально он поймал ложную цель.

Как отмечалось в [2], выбор очередности поимки целей может осуществляться двумя способами:

1) в момент t — 0 начала преследования, т.е. программно;

2) в процессе преследования, в зависимости от текущей позиции игроков, т.е. позиционно.

Ясно, что в обоих случаях происходит обязательная первая встреча с одной из целей. Следовательно, существует момент в > 0 (в — 0 в первом случае) когда преследователь принимает окончательное решение о том, с какой именно целью встречаться в первую очередь. Специфика рассматриваемой игры состоит в том, что преследователь теряет из виду вторую цель после момента В и, если первая по порядку преследования цель оказалась ложной, он вынужден организовывать программное преследование второй цели на основании информации о ее положении в момент 9.

Постановка Задачи 1. Случай 1 соответствует программному выбору очередности встреч.

Зафиксируем точку Р° - начальное положение преследователя Р. Пусть Zjit ), i = А. В и z(t) - двумерные радиус-векторы направленные от Р° к Е\ и Р'\ соответственно, где Е\ и Р' - текущие позиции игроков. Обозначим через Ti момент первой встречи, а через Т - момент окончания игры. Цель, выбранную преследователем для первой встречи, будем отмечать индексом 1, другую цель - индексом 2. Если цель Е\ является истинной, то Т = Ту. Если Е\ - ложная цель, то преследователь Р движется (после момента Т\) в точку Е) - начальное положение цели Е'2. координаты которой в момент В запоминаются преследователем. В этом случае игра оканчивается тогда, когда преследователь Р достигает точки Е®. Плата при этом равна дистанции q{T) между точками E':J и Ел. Следуя принципу гарантированного результата, преследователю необходимо строить свою стратегию управления так, чтобы в худшем для него случае (когда истинной оказывается вторая по порядку преследования цель Ео) промах до истинной цели был бы минимален. Таким образом, преследователю необходимо минимизировать q{T).

В данных обозначениях математическая модель игры, соответствующей Случаю 1 имеет следующий вид.

Уравнения движения игроков: до момента Т\

после момента Т\

(1)

Начальные условия:

Уравнения поверхности разрыва правых частей уравнений (1) (встреча Р и Е]):

Терминальное условие: Критерий:

(3)

(4)

(5)

Ограничения на управления:

где константа в задана.

Замечание 1. Необходимость движения преследователя в точку Е2 (если цель Е1

оказалась ложной) следует из решения простейшей дифференциальной игры программного преследования [22].

Решение игры в Случае 1. Решение игры в Случае 1 (Задача 1) опирается на принцип максимума для задач с игровой ситуацией [1, 2]. Нетрудно убедиться, что имеет место следующее

Утверждение 1. Оптимальные движения игроков осуществляются по прямым с максимальными по модулю скоростями.

Из этого следует, что критерий (5) принимает вид:

где т\2~ время движения преследователя из точки РТ] в точку Е^.

Этот критерий аналогичен критерию С'(Т) 7\ — Туг для простейшей игры поочередного преследования двух целей на минимум общего времени преследования, рассмотренной в [2] (игра Г4„,,, ). где Т\ -л интервал времени между встречами. Имеет место простое соотношение между т\2 и Т12, а именно:

Т12 = 712 -

+т12)

Это влечет

Подставляя Т12 в (7), находим

Опуская постоянный множитель ,3(1 — ;3). получаем критерий С(Т).

Из этого следует, что оптимальные траектории игроков Ри^в Задаче 1 и в игре Тцте совпадают. Траектория уклонения цели Е-г после момента 0 в Задаче 1 (заметим, что 0 = 0 в Задаче 1) отличаются от траекторий уклонения цели в игрсГ^,,,, . Этот факт является следствием программности движения преследователя на отрезке РТх Щ. Как показано в [22], стратегия уклонения цели Е^ является смешенной и состоит, в частности, в движении по прямой под углом а+ — агссоэ 3 или под углом а~ — — агс'сок 3 по отношению к направлению движения преследователя на интервале [Т\, Т]. Углы а+ и а~ выбираются с вероятностью 0.5.

Теперь дадим ответ на вопрос: "Каким образом в момент t — 0 выбирать цель для первой встречи?"

Пусть игра начинается из начальной позиции {гд(0), ^п(О). г(0)} и пусть 6л(^а(0),^в(0),2г(0)) и ¿)п(~л(0),2л(0),.г(0)) - цены игры (как функции начальных позиций), соответствующие программному выбору очередности встреч Еа —т Ев или Еб —г Е \. соответственно. Оптимальная последовательность встреч определяется в момент £ = 0 из условий

В нашем случае эти условия означают, что первоначальная встреча осуществляется с той целью, расстояние до которой в начальный момент меньше. Эта цель отмечается индексом 1, более удаленная цель отмечается индексом 2.

Известно, что геометрическое место точек встречи игроков Р и Е1 при их движениях по прямым со скоростями 1 и в есть окружность Апполония. Уравнение этой окружности в системе координат ХОУ. начало которой совпадает с начальной позицией Р° — 0 преследователя, а ось ОХ направлена вдоль вектора имеет вид [2]:

Предположим, что лежит в верхней полуплоскости в системе координат

Ел Er. если ,

Ев —? Еа. если .

\())' (рис. 1).

Рис. 1. Оптимальные траектории игроков в Задаче 1 при 3 — 0.5

Как показано в [2], оптимальные траектории преследователя в точке встречи /'' — !■'.[ удовлетворяют закону "отражения" от окружности Апполония: угол "падения" и равен углу "отражения" //,. В свою очередь углы и и /; равны углу под которым уклоняется цель Е-: и — /г — фI (Рис. 1).

Для случая в — 0.5 оптимальные траектории игроков Е' и Е показаны на рис. 1, пунктирными стрелками показаны два возможных направления движения цели Ео.

Постановка Задачи 2. Задача 2 отвечает Случаю 2, т.е. позиционному выбору очередности встреч.

Как и выше, отметим нижним индексом 1 первую по порядку встреч цель. Ей соответствует плата

Другую цель отметим индексом 2. Первой встрече с этой целью отвечает плата

В процессе движения игроков знак разности плат (как функции текущих позиций игроков (£), г2{1),

вообще говоря, может меняться на интервале [0,61]. Позиционный выбор последовательности встречи позволяет учитывать тот факт, что всякий раз, когда в некоторый момент ( в процессе игры реализуется равенство

цели Е\ и Е-2 для преследователя становятся идентичны в смысле платы. Это означает, что в этот момент . плата (как функция текущего состояния -11:. :■_■! <; -:; 1 ) не зависит от выбора очередности преследования и преследователь может произвести переиндексацию целей, т.е. поменять порядок предстоящей очередности встреч. Возможность такой переиндексации позволяет гарантировать сохранение знака неравенства

на интервале [0, в]. Неравенство (8) задает связь между уравнениями движения игроков и позиционным управлением последовательностью встреч.

В рассматриваемом Случае 2 неравенство (8) равносильно следующему

и играет роль фазовых ограничений. Индексом 1 всегда отмечается ближайшая к преследователю цель.

Решение игры в Случае 2. Решение игры в Случае 2 (Задача 2) аналогично решению игры Г4,те рассмотренной в [2]. Как показано в [2] множество возможных начальных положений Е® дальней цели Е-2 (внешность круга радиуса .г,1 с центром Р° — 0) разбивается на две зоны С и Г> (рис. 2).

Если Е'; 6 С, то в 0 (Задача 1), т.е. очередность встреч с целями фиксируется в момент £ = 0. Как отмечалось выше, оптимальные траектории игроков Р и ЕI при К% е С совпадают с оптимальными траекториями этих игроков в игре ГНте из [2]. Поэтому граница между зонами С и п одна и та же, как для рассматриваемой игры, так и для игры Тцте. Эта граница /." представляет собой отрезок М°№ касательной к окружности радиуса .-у | с центром Р° в верхней полуплоскости (рис. 2).

Y

О

рп

Рис. 2. Разбиение на зоны области возможных начальных положений дальней цели

Е'2 в Задаче 2 при 3 — 0.5

Касательная описывается уравнением:

где у>2 = т: — íp — 2ф± и t'l > 0, а <р > 0 является единственным решением системы уравнений

eos íp — ¡3 eos v'i = sin 2ф\. Угловая координата ¿ точки касания М° удовлетворяет уравнению

Пусть t D - криволинейный треугольник АЕ°М°№ (рис. 2). Как и в [2], введем подвижную систему координат X'O'Y1, начало О' которой связано с текущим положением Р1 преследователя, а ось X1 направлена вдоль вектора i ' í :!.':. Текущий масштаб по осям выбирается таким образом, чтобы | z\ (i) — 1 /) = 1. В каждый момент времени í строится криволинейный треугольник AE[MtNt с границей

В этом случае условие (3) эквивалентно следующему условию: 1^2(Tí )| — оо. Это означает, что точка EÍ,. характеризующая позицию дальней цели, покидает зону D в некоторый момент т. Согласно принятому правилу индексации целей, точка Eh может покинуть зону D только через границу í,!. Как показано в [2], L1 есть отрезок оптимальной траектории, т.е. после попадания на I.' в некоторый момент т — inf{í : E.¿ с L'} изображающая точка Е'> будет двигаться вдоль L1 в направлении к точке М1 и в момент

будет реализовано равенство = Мв. Следовательно, для всех Е° е D существует такой момент времени 0. что в этот момент будут выполняться условия

где «жирная» точка между векторами обозначает скалярное произведение, a ¿ определена выше.

Момент 9 разделяет игру на два этапа: [0, в] и \0, Т\. Пусть Е?2 = Мв. Принимая 9 за начальный момент (т.е. полагая /<, = О, = E't). рассмотрим игру на интервале _<>. IJ.

По определению границы /Л в игре, начинающейся при Еа, = М" е Ев очередность встреч фиксируется в момент t — 9. Согласно (11), у преследователя есть две эквивалентные (в смысле критерия) альтернативы: первоначально преследовать цель Ей затем Е, или наоборот. Как следует из рис. 2 (с заменой 0 на 9) плата в игре, начинающейся в момент 9, равна

В масштабе \zi (в) — z(0)\ = |.г2(0) — z{6) \ = 1 имеем

где <р и Vi из (10). Из этого уравнения следует, что

В реальном масштабе дв = /3tan_1 ф^ \хл (0) — z(6) \ = const. • R(6), где

Эти соотношения дают возможность сформулировать вспомогательную игру на интервале [0. в\ Игра на интервале [0. в] может быть интерпретирована, как игра совместного преследования игроком Р группы целей {Е\, Е-2\ [1] с динамикой (1), начальными позициями (2), терминальным критерием (12) и терминальными условиями (11). Решение этой игры рассматривается в следующем разделе.

Заметим, что терминальный критерий в аналогичной вспомогательной игре в [2] имеет вид С (в) = в + cr¡z¡ (в) - z(6) |, где а = (1 — 0)~г оа&фх = const, а ф\ из (10). Поэтому оптимальные траектории игроков на этапе совместного преследования в рассматриваемой задаче отличаются от аналогичных траекторий в [2], но физический смысл этапа совместного преследования такой же. А именно, на интервале совместного преследования [0, в] преследователь Р держит цели /-;, и е2 в условиях неопределенности относительно предстоящей очередности встреч. Окончательное решение об очередности встреч преследователь принимает только в момент 9. Создавая эту неопределенность, преследователь уменьшает цену игры.

На интервале [в, Т] оптимальные траектории игроков находятся из решения Задачи 1 с начальными условиями (11).

Решение вспомогательной игры совместного преследования. Для упрощения обозначений положим z,.(í) = : (/) — z{t), г = 1,2.

В этих обозначениях математическая модель вспомогательной игры имеет следующий вид.

Уравнения движения игроков с начальными условиями:

Терминальные условия:

где cos 5 задан (здесь Л - терминальный угол визирования, см.(10)).

Критерий:

ЩО) = |zi((?)| —¥ tnin max

(15)

Ограничения на управления имеют вид (6).

Согласно необходимым условиям оптимальности, опуская временной аргумент, рассмотрим гамильтониан н:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где А, — А,;(0 удовлетворяют сопряженной системе

Седловая точка гамильтониана реализуется на управлениях

(16)

(17)

(18)

Из (17) и (18) следует, что игроки движутся по прямым с максимальными по модулю скоростями.

Далее, условия трансверсальности в момент в имеют вид

дЯ + • 5ъ\ + А2 • Ьъ2 - Н69 = 0, (19)

где в силу (15),

' 6Я = е1»б21. (20)

Здесь и далее е,: = (в) |г,(9) \ ~1, г = 1,2.

Из терминальных условий (14) вытекают соотношения накладываемые на оъ,. и единичные вектора е,:, г = 1,2:

в1 • — в2 • 5ъ2, (21)

где

(22)

(23)

Подставляя (20) в (19) и разрешая (21) и (22) относительно rtzv. с учетом того факта, что вариации Ив и 6ъ\ независимы, получаем

Обозначая h, = —At|Аг|—1 и = |А,|(|Л| + |А3|)_1, г = 1,2, получаем из (18)и(24) ,, t . с

Уравнение (26) определяет вектограмму скоростей игроков (рис. 3). Из век-тограммы следует, что

sin а — \/¡32 — eos'2 с

íi =

где

2 sin а

í2 = l"íb

(27)

Здесь а, - направляющий угол единичного вектора h,. i — 1,2.

_1_[_^ >hf / * 'и

Y/a ] )

1■/ \

л

Рис. 3. Вектограммы скоростей игроков на интервале [0. в]

Пусть 71 и направляющие углы единичных векторов ei и с2. т.е.

где

с заданным углом ó — ёТГе^ из (14), причем ei = Лег.

Определим следующие единичные вектора.

Из (25) следует, что эти вектора удовлетворяют уравнению

»Ы =bei*h2. (30)

Теперь проинтегрируем уравнения движения игроков (13) на интервале [0.9\ Получаем

Подставляя далее и* из (26) в (31) и заменяя в формуле (27) для , £2 угол а из (28), мы получаем совместно с (30) и (29) систему 6 уравнений относительно неизвестных R{0), 0,71,72, сц, «2.

Рис. 4 иллюстрирует решение Задачи 2, когда z° — В этом случае а-2 — а+ — arceos ¡3, a ai = а~ — — arceos /?. Отрезок р°рд на рис. 4 соответствует совместному преследованию игроком Р групповой цели {Е\, Е-2}. Как и на Рис. 1, пунктирные стрелки обозначают возможные направления убегания цели Е-2 после момента в окончания совместного преследования.

Заключение. Рассмотрена постановка и решение простейшей дифференциальной игры поочередного преследования одним преследователем двух целей с критерием типа «Промах» при программном и позиционном выборе очередности встреч с целями. Показано, что структура решения аналогична структуре решения аналогичной постановки с критерием типа «Время». В обеих постановках при определенных начальных условиях этапу поочередного преследования предшествует этап совместного преследования групповой цели. В явном виде выделены области начальных позиций игроков, где этап совместного преследования всегда имеет место.

У

О

ро

Р1

~Р'=Е]

Рис. 4. Оптимальные траектории игроков при z± - и в — 0.5

БИБЛИОГРАФИЧЕСКИМ СПИСОК

1. Ольшанский В.К., Рубинович Е.Я. Простейшие дифференциальные игры преследования системы из двух объектов // Автоматика и телемеханика. - 1974. - № 1. - С. 24-34.

2. Абрамянц Т.Г., Маслов Е.П., Рубинович Е.Я. Простейшая дифференциальная игра поочередного преследования // Автоматика и телемеханика. - 1980. - № 8. - С. 5-15.

3. Breakwell J. V., Hagedorn P. Point Capture of two Evaders in Succession // J. Opt. Theory and Appl. - 1979. - Vol. 27, No. 1. - P. 89-97.

4. Шевченко И.И. О поочередном преследовании // Автоматика и телемеханика. - 1981.

- № 11. - С. 54-59.

5. Маслов Е.П., Иванов М.Н. О сравнении двух методов преследования в задаче о поочередной встрече // Автоматика и телемеханика. - 1983. - № 7. - С. 38-43

6. Абрамянц Т.Г., Маслов Е.П., Рубинович Е.Я. Управление подвижными объектами в условиях искусственно организованной неполноты информации // Проблемы управления.

- 2005. - № 4. - С. 75-81.

7. Рубинович Е.Я. Дифференциальная игра преследования-уклонения двух целей с ограничением на разворот преследователя // Известия ЮФУ. Технические науки. - 2018. - № 1 (195). - С. 118-128.

8. Rubinovich E.Ja. Two targets pursuit-evasion differential game with a restriction on the targets turning // Preprints, 17th IFAC Workshop on Control Applications of Optimization. Yekaterinburg, Russia, October 15-19, 2018. - P. 503-508.

9. Петросян Л.А., Ширяев В.Д. Групповое преследование одним преследователем нескольких преследуемых // Вестник ЛГУ. - 1980. - № 13. - С. 50-57.

10. Маслов Е.П., Иванов М.Н. Об одной задаче уклонения // Автоматика и телемеханика.

- 1984. - № 8. - С. 56-62.

11. Boyell R.L. Defending a Moving Target against Missile or Torpedo Attack // IEEE Trans. Aerosp. Electron. Syst. - 1976. - Vol. AES-12. - P. 582-586.

12. Boyell R.L. Counterweapon Aiming for Defence of a Moving Target // IEEE Trans. Aerosp. Electron. Syst. - 1980. - Vol. AES-16. - P. 402-408.

13. Eloy Garcia, David W Casbeer, Khanh Pham, and Meir Pachter. Cooperative aircraft defense from an attacking missile // Proc. 53th IEEE Conference Decision and Control (CDC). - 2014. Dec. 15-17, Los Angeles, USA. - P. 2926-2931.

14. Meir Pachter, Eloy Garcia, and David W Casbeer. Active target defense differential game // 52nd Annual Allerton Conf. Communication, Control, and Computing. - IEEE, 2014. - P. 46-53

15. Andrey Perelman, Tal Shima, and Ilan Rusnak. Cooperative differential games strategies for active aircraft protection from a homing missile // Journal of Guidance, Control, and Dynamics. - 2011. - Vol. 34(3). - P. 761-773.

16. Shima T. Optimal cooperative pursuit and evasion strategies against a homing missile // AIAA Journal of Guidance, Control, and Dynamics. - 2011. - Vol. 34 (2). - P. 414-425.

17. Yamasaki Takeshi and Balakrishnan Sivasubramanya N., and Takano Hiroyuki. Modified command to line-of-sight intercept guidance for aircraft defense // Journal of Guidance, Control, and Dynamics. - 2913. - Vol. 36 (3). - P. 898-902.

18. Naiming QI, Qilong SUN, Jun ZHAO. Evasion and pursuit guidance law against defended target // Chinese Journal of Aeronautics. - 2017. - Vol. 30 (6). - P. 1958-1973.

19. Weissyand Martin, Shimazand Tal, Rusnak Ilan. Minimum effort intercept and evasion guidance algorithms for active aircraft defense // Journal of Guidance, Control, and Dynamics. - 2016. - Vol. 39 (10). - P. 2297-2311.

20. Eloy Garcia, David W. Casbeer, Meir Pachter. Active Target Defense Differential Game with a Fast Defender // IET Control Theory and Applications. - 2017. - Vol. 11 (17). - P. 2985-2993.

21. Rubinovich E.Ja. Missile-Target-Defender Problem with Incomplete a priori Information // Dynamic Games and Applications (Special Issue). - 2019. On open access: https://rdcu.be/bhvyh. DOI: https://doi.org/10.1007/s13235-019-00297-0.

22. Maslov E.P., Olshanski W.K. and Rubinovich E.Ya. On a Piecewise Open-Loop Control Differential Game // Proc. of the Third IFAC Symposium on Sensitivity, Adaptivity and Optimality. - 1973. - June 18-23, Ischia, Italy. - P. 364-372.

REFERENCES

1. Ol'shanskiy V.K., Rubinovich E.Ya. Prosteyshie differentsial'nye igry presledovaniya sistemy iz dvukh ob"ektov [Simplest Differential Games of Pursuieing a System of Two Plants], Avtomatika i telemekhanika [Automation and Remote Control], 1974, No. 1, pp. 24-34.

2. Abramyants T.G., Maslov E.P., Rubinovich E.Ya. Prosteyshaya differentsial'naya igra poocherednogo presledovaniya [The simplest differential game of alternate pursuit], Avtomatika i telemekhanika [Automation and Remote Control], 1980, No. 8, pp. 5-15.

3. Breakwell J.V., Hagedorn P. Point Capture of two Evaders in Succession, J. Opt. Theory and Appl, 1979, Vol. 27, No. 1, pp. 89-97.

4. Shevchenko I.I. O poocherednom presledovanii [On alternate pursuit], Avtomatika i telemekhanika [Automation and Remote Control], 1981, No. 11, pp. 54-59.

5. Maslov E.P., Ivanov M.N. O sravnenii dvukh metodov presledovaniya v zadache o poocherednoy vstreche [On the comparison of two methods of prosecution in the problem of alternate meeting], Avtomatika i telemekhanika [Automation and Remote Control], 1983, No. 7, pp. 38-43

6. Abramyants T.G., Maslov E.P., Rubinovich E.Ya. Upravlenie podvizhnymi ob"ektami v usloviyakh iskusstvenno organizovannoy nepolnoty informatsii [Management of mobile objects in conditions of artificially organized incompleteness of information], Problemy upravleniya [Control Problem], 2005, No. 4, pp. 75-81.

7. Rubinovich E.Ya. Differentsial'naya igra presledovaniya-ukloneniya dvukh tseley s ogranicheniem na razvorot presledovatelya [Differential game of pursuit-evasion of two goals with a restriction on the turn of the pursuer], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2018, No. 1 (195), pp. 118-128.

8. Rubinovich E.Ja. Two targets pursuit-evasion differential game with a restriction on the targets turning, Preprints, 17th IFAC Workshop on Control Applications of Optimization. Yekaterinburg, Russia, October 15-19, 2018m pp. 503-508.

9. Petrosyan L.A., Shiryaev V.D. Gruppovoe presledovanie odnim presledovatelem neskol'kikh presleduemykh [Group pursuit one of several pursued pursuer], VestnikLGU [LGU Bulletin], 1980, No. 13, pp. 50-57.

10. Maslov E.P., Ivanov M.N. Ob odnoy zadache ukloneniya [On a problem of evasion], Avtomatika i telemekhanika [Automation and Remote Control], 1984, No. 8, pp. 56-62.

11. Boyell R.L. Defending a Moving Target against Missile or Torpedo Attack, IEEE Trans. Aerosp. Electron. Syst, 1976, Vol. AES-12, pp. 582-586.

12. Boyell R.L. Counterweapon Aiming for Defence of a Moving Target, IEEE Trans. Aerosp. Electron. Syst, 1980, Vol. AES-16, pp. 402-408.

13. Eloy Garcia, David W Casbeer, Khanh Pham, and Meir Pachter. Cooperative aircraft defense from an attacking missile, Proc. 53th IEEE Conference Decision and Control (CDC). - 2014. Dec. 15-17, Los Angeles, USA, pp. 2926-2931.

14. Meir Pachter, Eloy Garcia, and David W Casbeer. Active target defense differential game, 52nd Annual Allerton Conf. Communication, Control, and Computing. IEEE, 2014, pp. 46-53

15. Andrey Perelman, Tal Shima, and Ilan Rusnak. Cooperative differential games strategies for active aircraft protection from a homing missile, Journal of Guidance, Control, and Dynamics, 2011, Vol. 34 (3), pp. 761-773.

16. Shima T. Optimal cooperative pursuit and evasion strategies against a homing missile, AIAA Journal of Guidance, Control, and Dynamics, 2011, Vol. 34 (2), pp. 414-425.

17. Yamasaki Takeshi and Balakrishnan Sivasubramanya N., and Takano Hiroyuki. Modified command to line-of-sight intercept guidance for aircraft defense, Journal of Guidance, Control, and Dynamics, 2013, Vol. 36 (3), pp. 898-902.

18. Naiming QI, Qilong SUN, Jun ZHAO. Evasion and pursuit guidance law against defended target, Chinese Journal of Aeronautics, 2017, Vol. 30 (6), pp. 1958-1973.

19. Weissyand Martin, Shimazand Tal, Rusnak Ilan. Minimum effort intercept and evasion guidance algorithms for active aircraft defense, Journal of Guidance, Control, and Dynamics, 2016, Vol. 39 (10), pp. 2297-2311.

20. Eloy Garcia, David W. Casbeer, Meir Pachter. Active Target Defense Differential Game with a Fast Defender, IET Control Theory and Applications, 2017, Vol. 11 (17), pp. 2985-2993.

21. Rubinovich E.Ja. Missile-Target-Defender Problem with Incomplete a priori Information, Dynamic Games and Applications (Special Issue), 2019. Available at: https://rdcu.be/bhvyh. DOI: https://doi.org/10.1007/s13235-019-00297-0.

22. Maslov E.P., Olshanski W.K. and Rubinovich E.Ya. On a Piecewise Open-Loop Control Differential Game, Proc. of the Third IFAC Symposium on Sensitivity, Adaptivity and Optimality, June 18-23, Ischia, Italy, 1973, pp. 364-372.

Статью рекомендовал к опубликованию д.т.н., профессор А.А. Галяев.

Рубинович Евгений Яковлевич - Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук (ИПУ РАН); e-mail: rubinvch@ipu.ru; 117997, г. Москва, Профсоюзная, 65; тел.: 84953303733; д.т.н.; профессор; г.н.с.

Rubinovich Evgeny Yakovlevich - V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences; e-mail: : rubinvch@ipu.ru; 65, Profsoyuznaya str., Moscow, 117997, Russia; phone: +74953303733; dr. of eng. sc.; professor; chief researcher.

УДК 519.816 Б01 10.23683/2311-3103-2019-1-188-199

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г.В. Горелова

МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ПРОЕКТИРОВАНИИ И УПРАВЛЕНИИ ОБЪЕКТАМИ В УСЛОВИЯХ ВЕРОЯТНОСТНОЙ НЕОПРЕДЕЛЕННОСТИ

Рассмотрены вопросы обоснования решений при проектировании и управлении техническими объектами в условиях вероятностной неопределенности. Предлагается использовать модели вероятностных задач об оптимуме номинала для поисковых и прогнозных исследований, прикладных НИР и ОКР, направленных на развитие систем и моделирования робототехнических комплексов. Кратко изложены основные идеи, модели и методы Д.В. Свечарника, автора задач оптимума номинала. В моделях задач оптимума номинала учитывается полезность распределения вероятностей выходных характеристик технических объектов, характеризуемых как сложные системы. Теория и практика моделирования задач оптимума номинала успешно развивалась с середины прошлого века в двух направлениях: исследованиях технологических процессов и в проектировании изделий. Проанализированы имеющиеся результаты и представлены новые математические модели в виде обобщенной функции эффективности оптимума номинала в одномерном и многомерном случаях, а также статические и многошаговые задачи при «управлении» параметрами

i Надоели баннеры? Вы всегда можете отключить рекламу.