Научная статья на тему 'Противоборство (дифференциальная игра) между подвижными управляемыми объектами'

Противоборство (дифференциальная игра) между подвижными управляемыми объектами Текст научной статьи по специальности «Математика»

CC BY
271
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ПРОТИВОБОРСТВО / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ПОДВИЖНЫЕ ОБЪЕКТЫ / ФУНКЦИЯ ВЫИГРЫША / СТРАТЕГИИ ИГРОКОВ / MATHEMATICAL MODEL / CONFRONTATION / DIFFERENTIAL GAME / MOVING OBJECTS / GAME FUNCTION / GAMERS STRATEGIES

Аннотация научной статьи по математике, автор научной работы — Потапов Виктор Ильич

Дана постановка и разработана математическая модель игровой задачи противоборства между подвижными объектами, управляемыми двумя игроками. Дифференциальная игра сведена к матричной, решение которой ищется в смешанных стратегиях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Потапов Виктор Ильич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Confrontation (differential game) between moving controlled objects

Approach and mathematical model of the game task of confrontation between moving objects controlled by two gamers are given and developed. Differential game is led to matrix solving of which is finding in mixed strategies.

Текст научной работы на тему «Противоборство (дифференциальная игра) между подвижными управляемыми объектами»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014

20

УДК 519.711.3:004.94

В. И. ПОТАПОВ

Омский государственный технический университет

ПРОТИВОБОРСТВО (ДИФФЕРЕНЦИАЛЬНАЯ ИГРА)

МЕЖДУ ПОДВИЖНЫМИ УПРАВЛЯЕМЫМИ ОБЪЕКТАМИ____________________

Дана постановка и разработана математическая модель игровой задачи противоборства между подвижными объектами, управляемыми двумя игроками. Дифференциальная игра сведена к матричной, решение которой ищется в смешанных стратегиях. Ключевые слова: математическая модель, противоборство, дифференциальная игра, подвижные объекты, функция выигрыша, стратегии игроков.

Работа выполнена в соответствии с заявкой на грант РФФИ, проект № 14-08-00555.

В работе [1] разработана математическая модель и алгоритм для решения игровой задачи типа «нападение — защита» для двух игроков, располагающих подвижными (нападающими) и неподвижными (защищающимися) объектами (системами) соответственно. При этом при приближении подвижного объекта к неподвижному на определенное расстояние противоборствующие системы начинают целенаправленно воздействовать друг на друга, увеличивая интенсивность отказов системы противника, т.е. уменьшать функциональную надежность соответствующей противоборствующей системы.

Дифференциальная игра между противоборствующими объектами сведена к минимаксной игре в смешанных стратегиях с функцией выигрыша, равной разности сумм вероятностей безотказной работы объектов нападения и объектов защиты в течение времени игры. При этом множеством стратегий, для выбора из них оптимальной, для нападающего игрока является набор траекторий движения подвижных объектов к местам нападения, а множеством стратегий для защищающегося игрока, для выбора из них оптимальной, является целенаправленный выбор места расположения объектов защиты в заданной области расположения защищающихся — неподвижных объектов.

Используя (по возможности) систему обозначений и основные положения, изложенные в [1], развивая эти положения, рассмотрим следующую игровую задачу противоборства между подвижными управляемыми объектами.

Игроки 1 и 2, участвующие в игре, располагают Ь1 и Ь2 подвижными объектами (системами) соответственно, которые в начале игры находятся в точках г10, 1 < к < Ь1 и г20, 1 < к < Ь2. В дальнейшем под понятиями подвижный объект и подвижная система будем понимать одно и то же — противоборствующий объект. Обозначим через tkf время движения (полета) к-го объекта, управляемого д-м игроком, д=1,2, от точки ткд0, до точки . Очевидно, что число tkf (время движения к-го объекта) зависит от траектории Тд = тя, выбираемой в процессе игры д-м игроком для управления к-м подвижным объектом, причем тд (0) = тд0 и Тд ) = тд . На траектории всех подвижных объектов тд (^ , д=1,2; 1 <к< Ьд

и законы их движения наложим те же ограничения, что и в [1 ] .

Противоборствующие стороны динамически активно влияют друг на друга при приближении к-го объекта, управляемого д-м игроком, к подвижному объекту противоборства на расстояние дальности активного взаимодействия, используя для этого соответствующие механизмы воздействия на увеличение интенсивности отказов противоборствующей системы, то есть уменьшая вероятность ее безотказной работы (функциональную надежность), приводящую, в конечном итоге, к отказу системы в целом.

Обозначим через ркд вероятность безотказной работы к-го подвижного объекта, управляемого д-м игроком; д=1,2; 1<к<Ьд ; 1 кд — интенсивность отказов соответствующего к, д-объекта. Тогда, при аппроксимации поведения в процессе игры противоборствующих подвижных объектов неоднородным марковским процессом [2], игра может быть описана следующей системой дифференциальных уравнений Колмогорова:

Ркд Ю = -1 кдР кд М. я = 1 2

с начальными условиями р д(0)=1, где

(1)

к =

1, 2, • , Ц при q = 1, 1, 2, • , Ь2 при q = 2,

а интенсивность отказов 1кд определяется из указанных выше условий противоборства подвижных систем следующим образом (2):

1 и =1к (і< тк)+2

1 к2 = ^\ Гк) + 2

|а(г,2)

іа(а)

(2)

(3)

при этом величина

0, если х > укд ;

1, если х < укд .

(4)

(=1

к

Г2 - Г1

ь

1

=1

к

В приведенных выражениях (2), (3), (4)

Укд — дальность действия к-го объекта, управляемого д-м игроком в процессе взаимодействия с противником;

{а(к,1)}, {а (к ,2)} — заданные последовательности действительных чисел, где а (к, д) определяется типом к-го подвижного объекта, управляемого д-м игроком;

1к (^, Гд) — интенсивность отказов к-го объекта д-го игрока, определяемая объективными факторами: временем t, влияющим на старение системы, и траекторией движения к-й системы, выбираемой д-м игроком в процессе противоборства с учетом имеющихся «препятствий» на пути движения системы;

X, МІГ? - Г,

——* X -

іа(г,2) '

а(!,1)

интенсивности

отказов, зависящие от функции взаимодействия подвижных объектов игрока 1 с подвижными объектами игрока 2 и объектов игрока 2 с объектами игрока 1 соответственно в пределах дальности действия каждого противоборствующего объекта.

В связи с тем, что дифференциальные уравнения в системе уравнений (1) имеют переменные коэффициенты, поскольку интенсивность отказов противоборствующих систем зависит от многих переменных и изменяется в пространстве и времени, то получить аналитическое решение для вычисления безотказной работы ркд каждого к-го подвижного объекта 1 <к<Ьд, управляемого д-м (д = 1,2) игроком, не представляется возможным.

Поэтому для решения системы дифференциальных уравнений (1) удобно использовать математический аппарат метода дискретизации, разработанный для решения подобных задач в [3].

Очевидно, что в рассматриваемой дифференциальной игре множеством стратегий Ш д-го игрока является множество траекторий гд ^) соответствующего подвижного объекта, участвующего в противоборстве, то есть

Шд = { Гдд р)| 1 £ к £ Ьд}, д = 1, 2.

В качестве функции выигрыша примем

А ^ Ь ^

-2 ] = Е Рк1(^ ) "Е Р к 2 (t^),

к=1 к=1

где - еШ1, а t — заданное время игры.

Решением рассматриваемой задачи, так же как и в [1], является вычисление оптимальных стратегий ~ и г2, для которых

К[~1,~2]= тт тах К[21,22].

-2 -1

В результате дифференциальная игра сводится к матричной и ее решение ищется в смешанных стратегиях [4].

Алгоритм численного решения рассматриваемой задачи противоборства между подвижными управляемыми объектами в значительной мере совпадает с алгоритмом, противоборства подвижных и неподвижных объектов, разработанным в [1], который может быть реализован на современных профессиональных персональных компьютерах. Для этого после ввода исходных данных выполняются процедуры 2 — 4 и 6—15, разработанного в [1] алгоритма последовательно для д =1,2.

Очевидно, что рассматриваемая модель предусматривает возможность объединения нескольких подвижных объектов, управляемых одним игроком, для достижения единой цели. Подобная задача будет рассмотрена в другой работе.

Библиографический список

1. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными объектами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2012. - № 3 (113). - С. 268-271.

2. Вентцель, Е. С. Исследование операций / Е. С. Вентцель. — М. : Сов. радио, 1972. — 550 с.

3. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. — Иркутск : Изд-во Иркут. ун-та, 1986. - 112 с.

4. Оуэн, Н. Г. Теория игр и игровое моделирование / Н. Г. Оуэн // Исследование операций. Методологические основы и математические методы. - М. : Мир, 1972. -С. 513-549.

ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.

Адрес для переписки: ту! @ omgtu.ru

Статья поступила в редакцию 18.11.2013 г.

© В. И. Потапов

і=і

(=і

к

к

Книжная полка

Певзнер, Л. Д. Теория систем управления : учеб. пособие для вузов по направлению подгот. 220400 «Управление в технических системах» / Л. Д. Певзнер. - 2-е изд., испр. и доп. - СПб. [и др.] : Лань, 2013. - 420 с.

Учебное пособие включает основные разделы современной теории управления динамическими системами, снабжено многочисленными примерами и иллюстрациями, даны упражнения для практических занятий. Книга в значительной мере автономна, в ее приложении содержатся достаточные сведения для понимания математического аппарата современной теории управления. Для студентов, обучающихся по специальности «Управление и информатика в технических системах» направления подготовки «Автоматизация и управление», «Управление в технических системах» и смежных направлений при изучении дисциплин «Теория автоматического управления», «Основы теории управления», «Автоматизация технологических процессов», а также для аспирантов.

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

i Надоели баннеры? Вы всегда можете отключить рекламу.