Математические модели и программный комплекс для компьютерной реализации задач оптимального управления противоборствующими подвижными и неподвижными объектами

Потапов Виктор Ильич; Горн Ольга Анатольевна

УДК 004.94:519.711.3

В. И. ПОТАПОВ О. А. ГОРН

Омский государственный технический университет

МАТЕМАТИЧЕСКИЕ МОДЕЛИ И ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ КОМПЬЮТЕРНОЙ РЕАЛИЗАЦИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

ПРОТИВОБОРСТВУЮЩИМИ ПОДВИЖНЫМИ И НЕПОДВИЖНЫМИ ОБЪЕКТАМИ_

Поставлена задача и разработана математическая модель противоборства двух избыточных технических систем, участвующих в конфликтной ситуации. Разработан программный комплекс для численного решения поставленной задачи на компьютере, которая сведена к дифференциальной игре между противоборствующими подвижными и неподвижными объектами и подвижными объектами.

Ключевые слова: математическая модель, противоборство, подвижные объекты, неподвижные объекты, дифференциальная игра, программный комплекс.

Введение. Будем рассматривать задачу, когда подвижная система, участвующая в конфликтной ситуации, в течение времени конфликта и положения в пространстве должна защищаться за счет собственных ресурсов — средств защиты (как правило — избыточности) от воздействия другой из участвующих в конфликте сторон, стремящейся своими средствами нападения увеличить вероятность отказа подвижного объекта в течение конфликта в пространстве взаимодействия, то есть уменьшить надежность подвижного объекта с системой его управления и надежность аппаратных компонентов подвижного объекта (подвижной системы).

Таким образом, в качестве причины отказа участвующего в конфликтной ситуации управляемого подвижного объекта являются отказы его аппаратных компонентов, отказы системы управления и особенности свойств пространства в котором перемещается управляемый объект, на которые оказывает соответствующее негативное влияние противоположная сторона, участвующая в конфликте.

Формализация объекта исследования и общая постановка задачи противоборства. Будем считать, что участвующий в конфликтной ситуации подвижный объект представляет собой перемещающуюся в трехмерном евклидовом пространстве Я3 избыточную Бд (п, т, s, ц, , г), т) — систему, состоящую из п основных модулей, разбитых на ц групп по п1, п2, ..., пц (п(>1) модулей в каждой. Интенсивности отказов модулей, входящих в соответствующую группу 11 ^, г), 12 ^, г), ..., 1 ц ^, г), являются функциями времени и точки пространства, в которой находится система. В состав подвижной системы входят, по числу основных ц групп, резервные модули: по в1, я2, ..., (в1>0) модулей в каждой группе

= т интенсивность отказов каждого из которых также является функцией времени и точки пространства 10 (^ г). В каждой ц-ой группе основные модули при их отказе мгновенно замещаются резервными из этой же группы. Как только резервный модуль подключается вместо отказавшего основного в своей группе, он начинает_функционировать с интенсивностью отказов 11 ^, г), (1<г < ц).

Считаем, что вектор резервирования Я=(я1, Я2 , ..., ) является переменным во времени, т.е. в моменты времени т1, т2, ..., т1 по командам может происходить перераспределение резервных модулей между группами, которое назовем настройкой системы, а соответствующие моменты времени т0 (1<ст<I) — моментами настройки и, соответственно, т = (т1, т 2, ..., то) — вектором настройки. Каждому моменту настройки то соответствует вектор резервирования Яп =(яп1, Яп2 , ..., Я). Количество настроек за время движения системы t_ ограничено I (¿>0).

Рассматриваемая задача может быть формально сформулирована следующим образом.

При заданных 1 ^=11 ^, г), (0<г<ц) для системы

(п, т, я, ц, 1(1, г), т), участвующей в конфликтной ситуации, разработать алгоритм оптимального управления, включающий алгоритмы вычисления траектории ее движения г=г ^) , вектора настройки {т1, т2, ..., ть} и векторов резервирования Яп =(яп1, Яп2, ..., Япд ), (0<у<1), отвечающих моментам настройки то , максимизирующих вероятность безотказной работы подвижной конфликтующей системы в момент t_ прибытия ее в заданную точку г I пространства. То есть решить задачу оптимизации выбора траектории и пространственно-временной стратегии резервирования избыточной подвижной системы, участвующей в конфликте, с целью мак-

симизации ее вероятности безотказной работы Р(Ц при движении по выбранной траектории, включая конечную точку движения [1].

В приведенной выше постановке рассматриваемая задача сводится к задаче оптимального управления подвижной системой 5Л, где (в терминах теории оптимального управления [2]) в качестве максимизирующего функционала качества управления является Р(!), в качестве управления используются г, х, 5 п , в качестве внешнего воздействия на систему используются 1 =1 (г, г), при ограничениях 1 <I <д, 0<у<Ь и естественных ограничениях на параметры движения подвижной 5л-системы, которые приведены в [3].

Очевидно, что аналитическое решение поставленной задачи оптимального управления, участвующей в конфликтной ситуации подвижной ^-системой, не представляется возможным, поэтому для решения задачи следует пользоваться приближенным численным методом, основанным на методе дискретизации, подробно рассмотренном в [4].

Суть этого метода, применительно к рассматриваемой задаче, состоит в том, что систему дифференциальных уравнений, описывающих поведения противоборствующей 5л-системы, коэффициенты которой являются функциями времени и точки пространства, в которой находится подвижная система, необходимо заменить системой дискретных аналогов, у которых коэффициенты можно рассматривать как постоянные (с заранее установленной степенью точности) на дискретных интервалах времени и пространства, в котором движется участвующая в конфликтной ситуации 5л-система.

Перейдем теперь к рассмотрению задач противоборства в конфликтной ситуации между подвижными и неподвижными объектами и между подвижными объектами, для решения которых разработан рассматриваемый в данной работе программный комплекс.

Противоборство (дифференциальная игра) между подвижными и неподвижными объектами. В данном разделе работы разработана математическая модель для решения игровой задачи типа «нападение-защита» для двух игроков, располагающих подвижными (нападающими) и неподвижными (защищающимися) объектами (системами) соответственно. При этом при приближении подвижного объекта к неподвижному на определенное расстояние противоборствующие системы начинают целенаправленно воздействовать друг на друга, увеличивая интенсивность отказов компонентов системы противника, то есть уменьшать функциональную надежность соответствующей противоборствующей системы [5].

Дифференциальная игра между противоборствующими объектами сведена к минимаксной игре в смешанных стратегиях с функцией выигрыша, равной разности сумм вероятностей безотказной работы объектов нападения и объектов защиты в течение времени игры. При этом множеством стратегий, для выбора из них оптимальной, для нападающего игрока является набор траекторий перемещения подвижных объектов к местам нападения, а множеством стратегий для защищающегося игрока, для выбора из них оптимальной, является целенаправленный выбор места расположения объектов защиты в заданной области расположения защищающихся — неподвижных объектов.

В соответствии со сказанным, рассмотрим следующую игру двух лиц. Игрок 1 располагает Ь управляемыми объектами, находящимися в начальных точках г к о, 1<к <Ь . Игрок 2 — N единицами защиты,

которые он может расставлять в заданной области Г, причем г к о еГ . Игрок 1 старается поразить к-м управляемым объектом 1<к<Ь заданную точку г к! еГ , которую защищает игрок 2, а игрок 2 старается помешать этому. Обозначим через к время полета к-ого объекта от точки г к о до г к!. Число к зависит от траектории = г к (), выбираемой к-м объектом, причем г к (0) = г к 0, г к (^ ) = г к!.

Пусть, далее, множество пунктов защиты игрока 2 может быть расположено в О точках О) с заданными координатами С{ =(си , с2{, с3{), 1<г<О .

Обозначим множество {с 1, С2, ..., Со } через С.

Итак, игроки 1 и 2, которые обладают каждый Ь Яд [1, 1 кд (г, 1к )] — системами соответственно (д = 1, 2), поведение которых, при аппроксимации марковским процессом, описывается дифференциальными уравнениями Колмагорова с переменными коэффициентами.

В качестве функции выигрыша возьмем

К [г1 2 ] = ЕРк 1 (1к! Рк 2 (1к! :

к=1 к=1

(1)

где е№', а Ш — множества стратегий д-го игрока (д=1, 2). Ясно, что

ш 1 ={гЛ0, ^).....гь (г)},

Ш2 =(81, 62.....8Ж),

(2)

где К =

Решением задачи является вычисление стратегий ~ и ~2, для которых

К[~1, ~2 ]=шш тахК[zx, z2 ].

(3)

В основу разработанного программного комплекса для решения этой задачи положен разработанный в [6] численный алгоритм.

Противоборство (дифференциальная игра) между подвижными управляемыми объектами. Используя (по возможности) систему обозначения и основные положения, изложенные в [6], развивая эти положения, рассмотрим следующую игровую задачу противоборства между подвижными управляемыми объектами.

Игроки 1 и 2, участвующие в игре, располагают Ь1 и Ь2 подвижными объектами (системами) соответственно, которые в начале игры находятся в точках г к о, 1<к<Ь1 и г к 0, 1<к<Ь2 пространства противоборства. В дальнейшем, под понятиями подвижный объект и подвижная система будем понимать одно и то же — противоборствующий объект. Обозначим через к время движения (полета) к-го объекта, управляемого д-м игроком (д = 1, 2), от точки г"к 0 до точки г к! .

Очевидно, что число к (время движения к-го объекта) зависит от траектории г! = г! (() , выбираемой в процессе игры д-м игроком для управления к-м подвижным объектом, причем г к (0) = г^0 и г к (! ) = га. _

На траектории всех подвижных объектов гк ({), д=1, 2, 1 <к <Ьд, и законы их движения наложим те же ограничения, что и в [6].

Противоборствующие стороны динамически активно влияют друг на друга при приближении к-го объекта, управляемого д-м игроком, к подвижному объекту противоборства на расстояние дальности активного взаимодействия, используя для этого

д

соответствующие механизмы воздействия на увеличение интенсивности отказов противоборствующей системы, то есть уменьшая вероятность ее безотказной работы (функциональную надежность), приводящую, в конечном итоге, к отказу системы в целом.

Обозначим через ркц вероятность безотказной работы к-го подвижного объекта, управляемого ц-м игроком; ц=1, 2; 1<к<Ьц ; 1кц — интенсивность отказов соответствующего к, ц-объекта. Тогда, при аппроксимации поведения в процессе игры противоборствующих подвижных объектов неоднородным марковским процессом [7], игра может быть описана следующей системой дифференциальных уравнений Колмогорова:

Р кц а ) = -1 кцРкц а ), ц=1, 2

с начальными условиями рк0(0) = 1, где

к-

1, 2, ..., 11 при ц = 1, 1, 2, ..., 12 при д = 2,

(4)

(5)

— 1

1 = ^ (I, Тк ) + £■

К

—1 -2 Тк - Т(

-2 -1 а( 1,2) Г к - Т,

-2 -1 Тк - Т,

1к 2 = 1к (I, Тк )

а( 1,1)

при этом величина

Ькц (I ) =

0, если х>укц ;

1 если х < У кц .

(6)

(7)

(8)

Тогда решением рассматриваемой задачи, так же как и в предыдущем разделе, является вычисление оптимальных стратегий и , для которых

К[, ~2 ]=ш1п шахК[zl, г2 ].

(11)

а интенсивность отказов 1кц определяется из указанных выше условий противоборства подвижных систем следующим образом:

В связи с тем, что дифференциальные уравнения в системе уравнений Колмогорова имеют переменные коэффициенты, поскольку интенсивность отказов противоборствующих систем зависит от многих переменных и изменяется в пространстве и времени, то получить аналитическое решение для вычисления безотказной работы ркц каждого к-го подвижного объекта 1<к<Ь1}, управляемого ц-м (ц = 1, 2) игроком не представляется возможным.

Поэтому для решения этой системы дифференциальных уравнений следует использовать математический аппарат метода дискретизации, разработанный для решения подобных задач в [5].

Очевидно, что в рассматриваемой задаче противоборства между подвижными объектами, описываемой дифференциальной игрой, множеством стратегий ц-го игрока является множество траекторий гк ^) соответствующего подвижного объекта, участвующего в противоборстве, то есть

Ш" = {Рк ^)| 1<к< , ц = 1, 2. (9)

В качестве функции выигрыша примем

К[г 1,22 )-£Рк2 (t¿f), (10)

где г е№' , а tí — заданное время игры.

В результате дифференциальная игра сводится к матричной и её решение ищется в смешанных стратегиях [7].

Описание программного комплекса для решения двух поставленных задач. Разработанный программный комплекс (далее ПК) для проведения вычислительных экспериментов реализует разработанные авторами работы численные алгоритмы для решения задач оптимального управления противоборствующими подвижными и неподвижными объектами и оптимального управления противоборствующими подвижными управляемыми объектами. ПК разработан в среде «С#», для которой характерны универсальность, широкие возможности решения инженерных задач и удобство работы с интерфейсом.

За основу разработки ПК принята математическая модель и алгоритм решения игровой задачи типа «нападение — защита» для двух игроков, располагающих подвижными (нападающими) и неподвижными (защищающимися) объектами (системами) соответственно, которая подробно описана в [6].

ПК выполняет следующие основные функции:

— ввод исходных параметров игровых задач;

— расчет интенсивности отказов подвижного объекта;

— расчет вероятности безотказной работы противоборствующего подвижного объекта;

— вычисление траектории движения управляемых подвижных объектов, с указанием значения вектора расположения объектов;

— вычисление оптимальной стратегии каждого из игроков, с указанием координат, задающих начальную точку, время полета и значения интенсивности отказов игрока.

Общий алгоритм работы программы представлен на рис. 1.

Работа ПК осуществляется следующим образом. Программа ожидает нажатие кнопки «Рассчитать» от пользователя, после чего запускает алгоритм «рассчитать». Данные, введённые пользователем, считываются из соответствующих элементов и проверяются на соответствие входному формату. Если все данные введены корректно, то программа начинает определение наилучших стратегий поведения для атакующих и защищающихся объектов.

Данный ПК выполняет расчет интенсивности отказов подвижного объекта, вероятности безотказной работы противоборствующего подвижного объекта, вычисление траектории движения управляемых подвижных объектов, с указанием значения вектора расположения объектов, вычисление оптимальной стратегии каждого из игроков, с указанием координат, задающих начальную точку, время полета и значения интенсивности отказов игрока.

Интерфейс ПК имеет следующий вид (рис. 2). В ПК предусмотрено пять окон:

— окно ввода данных первого игрока;

— окно ввода данных второго игрока;

— окно «Пункты защиты второго игрока»;

— «Результаты вычислений»;

— «Игровое поле».

После загрузки программы откроется окно ввода параметров (рис. 2), где необходимо задать основные

1=1

Ь

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и

Тк Т

к=1

Нажатие на кнопку «рассчитать»

Вызов метода readFirstData

Вызов метода readSecondData

Вызов метода readServiceData

Вызов метода calculateDiscrets

Вызов метода calculating

Вызов метода outputResult \

Считывает начальные параметры моделируемой системы

Рассчитывает шаг и время дискретизации

Рассчитывается основной алгоритм, интенсивности отказов, точки перемещения объектов

Выводит

результат в таблицу главного окна программы

Сalculating

_zn_

Инициализация массивов

I Z

Определение минимального времени и скорости

I '

Для каждого вектора £

Для каждого атакующего объекта

j=0, j<1, ++j V

Вызвать метод processlPoints

Вызвать метод calculateFailurity

Вычисляет вероятности отказов ¿1 и Я2, определяет следующую точку передвижения. Записывает полученные результаты (координаты (х,у), ^ и ,2) в массив

Рис. 1. Общий алгоритм работы программы

щ] Дифференциальная ['[

Первый игрок Второй игрок Пункты защиты Результаты |

. т |—|

Исходные данные первого игрока Список атакующих объектов

Добавить

Начальная точка первого игрока {гкО)

X = У =

г-

Начальнан скорость (^0)

Ускорение (Мк)

Конечная точка первого игрека (rftf) Координата Х =

У = Z =

Сохранить изменения

Время игры №

Выбор алгоритма

Со>ранить начальные данные

Загрузить начальные данные

Исходные данные Эпсилон

Рис. 2. Интерфейс ПК

параметры игроков, обеспечивающих оптимальное решение:

— координаты атакующего объекта;

— интенсивность отказов;

— начальная скорость;

начальное ускорение; время игры ^;

координаты защищаемых объектов; количество точек защиты; точность измерения е.

Оптимальный вектор расположения объектов :[ 1 } ;

Рис. 3. Результаты расчета ПК

Затем из выплывающего окна кнопки «Выбор алгоритма» нужно выбрать дифференциальную игру, алгоритм которой будет выполнять программа. После нажатия кнопки «Рассчитать» программа переходит в окно расчетов (рис. 3).

На рис. 3. формируется отчет о результатах расчета программы.

Результатом вычислений программы является максимальное значение функции выигрыша K., т.е. определение оптимальной пространственно-временной стратегии резервирования подвижного объекта. Указывается значение, вероятности безотказной работы противоборствующего подвижного объекта, координаты вектора расположения объекта.

Затем идут основные вычисления оптимальной стратегии первого игрока:

— номер объекта;

— координаты объекта;

— время полета атакующего объекта;

— интенсивность отказов.

Стоит еще раз отметить, что все вычисления проводятся на каждом j-ом шаге до тех пор, пока не произойдет максимальное приближение подвижного объекта к неподвижному на заданное расстояние, т.е. вычисление максимального значения функции выигрыша.

Для повышения надежности и эффективности проведения исследования, правильной интерпретации результатов, а также чтобы не загромождать окно программы результатами вычислений, выходные данные программы задаются для шага, на котором определена оптимальная стратегия подвижного объекта.

В ходе экспериментов изменять значения параметров можно как с помощью вызова окна ввода параметров, так и непосредственно на панели изменения основных параметров системы главного окна программы.

Заключение. На разработанный программный комплекс для оптимального управления противоборствующими объектами получено свидетельство о государственной регистрации электронного ресурса № 2014617425 [8]. Данный ПК может использоваться как в исследовательских, так и в практических целях. В основу разработанного ПК был заложен модульный принцип построения программ, что обеспечивает возможность дальнейшего расширения его функциональных возможностей.

Библиографический список

1. Потапов, В. И. Постановка двух задач оптимального управления подвижной, структурно-перестраиваемой избыточной системой, управляемой по каналам связи / В. И. Потапов // Динамика систем, механизмов и машин : материалы VII Междунар. науч.-техн. конф., посвящ. 70-летию ОмГТУ. — Омск : ОмГТУ, 2012. - С. 276-278.

2. Красовский, Н. Н. Управление динамической системой / Н. Н. Красовский. - М. : Наука, 1985. - 517 с.

3. Потапов, В. И. Математическая модель и алгоритм оптимального управления подвижным объектом в конфликтной ситуации / В. И. Потапов // Мехатроника, автоматизация, управление. - 2014. - № 7 (160). - С. 16-22.

4. Потапов, В. И. Противоборства (дифференциальная игра) двух нейрокомпьютерных систем / В. И. Потапов, И. В. Потапов // Информационные технологии. - 2005. - № 8. -С. 53-57.

5. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. - Иркутск : Изд-во Иркутск. ун-та, 1986. - 112 с.

6. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными объектами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. -2012. - № 3 (113). - С. 268-271.

7. Оуэн, Н. Г. Теория игр и игровое моделирование. Исследование операций. Методологические основы и математические методы : в 3-х т. / Н. Г. Оуэн. - М. : Мир, 1981. - Т. 1. -С. 513-549.

8. Горн, О. А. Программа для решения задач оптимального управления противоборствующими подвижными объектами / В. И. Потапов, О. А. Горн // Свидетельство о регистрации электронного ресурса № 2014617425 от 22.07.2014 г. - М. : ФИПС, 2014.

ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.

ГОРН Ольга Анатольевна, аспирантка, ассистент кафедры «Информатика и вычислительная техника».

Адрес для переписки: Апа1;о1е4ка@уап<Зех.га

Аннотация научной статьи по математике, автор научной работы — Потапов Виктор Ильич, Горн Ольга Анатольевна

Похожие темы научных работ по математике , автор научной работы — Потапов Виктор Ильич, Горн Ольга Анатольевна

Mathematical models and computer software system for implementation of optimal control problems confronting the moving and fixed objects