Научная статья на тему 'Математическая модель и алгоритм решения задачи противоборства в конфликтной ситуации двух восстанавливаемых после отказов систем'

Математическая модель и алгоритм решения задачи противоборства в конфликтной ситуации двух восстанавливаемых после отказов систем Текст научной статьи по специальности «Математика»

CC BY
280
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / КОНФЛИКТНАЯ СИТУАЦИЯ / ПРОТИВОБОРСТВО / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / СТРАТЕГИЯ ИГРОКА / ФУНКЦИЯ ВЫИГРЫША / MATHEMATICAL MODEL / CONFLICT SITUATION / COUNTERACTION / DIFFERENTIAL GAME / PLAYERS STRATEGY / PRIZE FUNCTION / ATTACK

Аннотация научной статьи по математике, автор научной работы — Потапов Виктор Ильич

Поставлена задача и разработана математическая модель противоборства двух, восстанавливаемых после отказов, избыточных технических систем, участвующих в конфликтной ситуации. Разработан алгоритм решения поставленной задачи, которая сведена к дифференциальной игре между двумя конфликтующими системами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Потапов Виктор Ильич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical model and algorithm of solving problem of counteraction in conflict situation of two restored systems after failure

Mathematical model of counteraction of two restored technical systems after failure in conflict situation is developed and the problem has been provided. The algorithm of solving provided problem is carried out and the given task has been connected to differential game between two conflicting systems.

Текст научной работы на тему «Математическая модель и алгоритм решения задачи противоборства в конфликтной ситуации двух восстанавливаемых после отказов систем»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014

УДК 519.711.3:004.94

В. И. ПОТАПОВ

Омский государственный технический университет

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ ПРОТИВОБОРСТВА В КОНФЛИКТНОЙ СИТУАЦИИ ДВУХ ВОССТАНАВЛИВАЕМЫХ ПОСЛЕ ОТКАЗОВ СИСТЕМ____________________________

Поставлена задача и разработана математическая модель противоборства двух, восстанавливаемых после отказов, избыточных технических систем, участвующих в конфликтной ситуации. Разработан алгоритм решения поставленной задачи, которая сведена к дифференциальной игре между двумя конфликтующими системами. Ключевые слова: математическая модель, конфликтная ситуация, противоборство, дифференциальная игра, стратегия игрока, функция выигрыша.

Работа выполнена в соответствии с заявкой на грант РФФИ, проект №14-08-00555.

Введение. Конфликтные ситуации обычно возникают тогда, когда сталкиваются интересы двух или более враждующих сторон, преследующих различные цели, и между ними возникает противоборство за достижение собственных целей вопреки враждебным действием противоборствующей стороны. Подобные ситуации чаще всего имеют место в военном деле и в области экономики, да и другие области деятельности не являются исключением.

В данной работе в качестве конфликтующих сторон будем рассматривать две идентичные по структуре избыточные технические системы, содержащие основные и резервные компоненты (блоки), подключаемые вместо отказавших основных, для восстановления функциональных возможностей соответствующей системы, участвующей в противоборстве. Каждая из участвующих в конфликте сторон в процессе противоборства систем стремится ослабить противодействующую систему, уменьшая вероятность ее безотказной работы, путем целенаправленного воздействия (атаками) на ее компоненты, увеличивая интенсивность их отказов в течение времени взаимодействия.

В задачу каждой из противоборствующих сторон входит выбор оптимальной стратегии поведения в конфликтной ситуации с целью максимизации соответствующей функции выигрыша за счет оптимального использования резервных компонентов.

Математическая модель противоборствующих систем. Будем полагать, что каждая из двух участвующих в конфликте систем Б9(п, т, в),9=1, 2 состоит из п (п = п1+п2+...+пд) основных и т (т = в1 + в2+... ...+вд) резервных блоков, разбитых на д групп, в каждой из которых возможна замена отказавших основных только резервными блоками из этой группы. При этом целочисленный вектор в = ^1, S2,..., вд), соответствующий распределению резервных блоков в д группах каждой из систем, будем называть вектором резервирования. В процессе противоборства вектор резервирования каждой из Б9 (п, т, в) систем может целенаправленно изменяться в соответству-

ющие моменты времени т1 с целью перераспределения (настройки) резервных т блоков между д группами для максимизации вероятности безотказной работы соответствующей системы последовательно в моменты настройки и к моменту окончания противоборства. Вектор т = (т0, т1, т2, • , х1), элементы которого соответствуют моментам перераспределения резервных блоков в соответствующей системе, будем в дальнейшем называть вектором настройки системы и считать, что перераспределение резервных блоков в системе, то есть восстановление работоспособности ^-системы после отказов основных блоков в соответствующей д группе и замена их резервными блоками из числа т происходит с интенсивностью №?(£).

Постановка задачи. При постановке и решении задачи противоборства двух конфликтующих динамических систем Б9 (п9, т9, в9), д=1,2 будем пользоваться в дальнейшем терминологией и понятиями теории игр [1^3]. __

Пусть системой Б 1(п1, т1, в1) располагает и управляет игрок 1, а системой Б2(п2, т2, в2) располагает и управляет игрок 2. Как указано выше, системы

-,9 т9 7я

Б (п9 , шд , в9 j, <7=1,2 являются восстанавливаемыми

после отказов с интенсивностями восстановления №7(ї), одинаковыми для всех д блоков соответствующей системы. Игрок 1 располагает множеством

стратегий Ш1 = {в1 ,12, т1}, а игрок 2 располагает множеством стратегий Ш2 = {в2, I1, т2}, где в9 — вектор резервирования д-го игрока; I9 = (190^), 19(0.19ч М) —

вектор интенсивностей отказов в д группах системы

Б9 (п9, т9, в9) (в дальнейшем с целью упрощения систему Б9 (п9, т9, в9) иногда будем обозначать 5д).

В [4] показано, что поведение восстанавливаемой системы Б9 (п9, т9, в9) может быть описано векторным уравнением вида

— Pg(t) = Dg(mg(t))Pg(t),

(1)

с начальными условиями

Pg

(2)

K(Zl, Z2)=P‘(tf)-P2(tf),

где хдеШд — стратегия д-го игрока (д= 1,2) из множества возможных стратегий Ш7.

Решение задачи противоборства двух & систем.

Для решения поставленной задачи воспользуемся методом дискретизации. Будем полагать, что каждому моменту настройки т^ (0 < ст < I) системы Бд со-

gg а1' аа2'

q).

ответствует вектор резервирования ssg = (s Введем интервалы настройки Dtg =[tg, x^+j], причем xL+1=tf. Функции интенсивности отказов 1s(t) и интенсивности восстановления ms(t) будем считать кусочно-постоянными с возможными точками разрыва первого рода в моментах настройки. Обозначим для t е Ax1, I2 (t) = (i2„0, , • , i2) и m1 (t) = m,,

а для t е Ат, 1(t) = ^) и m (0 = mS.

Таким образом, игрок 1, управляющий систе-

C1

,:,Lq

(L + 1)х q

Л2 — матрица, составленная из координат векторов 12s:

где Pg(t) — вероятность безотказной работы системы Бд в течение времени t,

а т9 (£) = (т9 (f), т 9 (О т9 (0) — вектор интенсивности

восстановления после отказов в д группах системы Бд , то есть векторное управление, а матрица Dg(llg(t)) определена в [4].

Будем считать, что число д групп для игроков 1

и 2 одинаково, то есть векторы в1 и в2 имеют одинаковую размерность д. В процессе противоборства (игры) рассматриваемых систем положим, что игрок 1 старается максимизировать величину P1(t[)— P2(t[), где t[ — время окончания игры, а игрок 2 старается минимизировать эту величину. Обозначим через Рк9({), 1<к<тд вероятность того, что в б9(п9, т9, в9) системе к моменту времени t произошло к отказов.

Будем считать, что за время игры t[ игрок д (д= 1,2) имеет право не более чем Ь (Ь>1) раз изменять свой вектор резервирования в9 , не считая момента t=0, управляемой им динамической системы

Б9(п9, т9, в9). Наконец, вектор т9 = (т9, т9, •••, т9), т9 = 0 назовем вектором настройки д-го игрока. Очевидно,что т9 < tf.

Итак, для исследования задачи противоборства

двух систем БЯ (п9, т9, в9) получена игра двух лиц с нулевой суммой с функцией выигрыша

)2 ^oo l2o1 • 12oq

Л2 = i2o 122 • ^q

iLo 12L1 * iLq (L + 1)x(q + 1)

т1 — вектор интенсивности восстановления: ц1 =

= (т0 - т1- • - ) .

Для игрока 2, управляющего системой 52, множество стратегий Ш2 ={т2, С2, Л1, ц2} строится аналогично.

Введем теперь последовательность {^, t1,..., ^+1}, которая получается объединением последовательностей {т0 , т1 т!+1} и {т2 , т2 т!+1}, элементы

в которой расположены в порядке возрастания. Ясно,

что ^0 = 0, а ^2i+l = ^f .

Обозначим Дt =[t , t , ,].

у 1 у у+1-1

Таким образом, исходя из уравнений (1) и (2), получим дифференциальную игру между двумя системами Б9 (п9, т9, в9), описываемую уравнениями

— = D1 Is1 dt

- = d1 [s1, i1(t), m1(t)]p1,

)]P

(З)

£ = D2 [s2, 12(t), m (t)JP2

с начальными условиями

P ‘(o) =

1 1

o o

o , p2(o)= o

M M

o (m1 +1) o

(4)

(m2 +1)

где Pg (t) =

Pog (t)

P! (t)

P!g t)

(mg +1)

вектор — столбец размерности (тд+ 1); Бд — матрица размерности (тд +1)х(тд +1), определенная

г— т9

мой 51, получает множество стратегий Ш1 ={т1, С \ в [4]. Очевидно, что Р9 (() = X р9П(д=1,2).

Л2, ц1} , где т1 — вектор настройки игрока 1, С1 —

матрица, составленная из координат векторов резервирования sS ;

Решение уравнений, подобных (3), для оптимального восстановления работоспособности противоборствующей системы после отказов, обеспечивающего оптимизацию вероятности безотказной работы 5д-системы дано в [4].

Управления игроков систем 5д, участвующих в игре, подчиним следующим ограничениям.

s

s

o1

s

s

11

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014

18

тах тах

19 £ M

0<а^ 0</<я М9 ■

(5)

Данное условие показывает, что ресурсы нападения игроков ограничены.

2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

тт

0<ст^ (Т"+1 -Т") “а9

(6)

3. ті + 2 ^ = Ь1»; ті + 2 = Ь2і ! 0 < СТ < L . (7)

/= 0

4.

где ф9

я

2

І=1

-фі, 0<а<L,

(8)

т9+1

2 кР9«)

а число 1 и величина РЛ9? +1# (ті) находятся из условий:

т9

Рт>+,- (Ті) = 1 “і Рк. (Ті),

Это условие запрещает каждому игроку делать две последовательные настройки «слишком быстро».

Данное условие отражает тот факт, что в любой момент времени невозможно превосходить соперника и в нападении и в защите и что сумма своих ресурсов нападения и защиты каждому игроку в любой момент времени известна.

стратегий, где <1 (ф?) — число целых неотрицательных решений уравнения (8).

/ \ (а + т9 -ф?-1^

Известно [5], что 1(ф?) = I I.

I т-ф? 0

Итак, рассматриваемая дифференциальная игра двух систем Б9 (п9, т9, в9) свелась к матричной игре (К(~1;., ~2])) размерности у1ху2, где е ШИ1 — г-я

стратегия игрока 1, г2]- е ИИ2 — /-я стратегия игрока 2. Более того, обозначив “] = К (~1г, ~2].), получим нормальную форму матричной игры А=(а/) без ограничений на стратегии игроков, так как все ограничения (5) — (8) учтены при построении матрицы А и множеств И\ И2. Как известно [6], нормальная форма матричной игры всегда имеет решение если не в чистых, то в смешанных стратегиях.

Будем искать решение матричной игры А в смешанных стратегиях, так как выяснить существование седловой точки в матрице А практически невозможно даже для небольших чисел ю, Ь и достаточно малых е1, е2.

Для решения применим метод фиктивного разыгрывания [6], который, по существу, является имитацией многократного повторения игры. В соответствии с этим методом определяются две последовательности векторов {х“ }, {у“ } следующим образом.

Первоначально

=ті •

Четвертое условие (8) указывает, что к моменту настройки ті количество резервных элементов игрока д уменьшается на величину фі , представляющую собой математическое ожидание числа отказавших элементов в Бд системе.

~ я ~

Из формулы (7) вытекает, что ті = Ь9 - 2 ,

і=0

~ [1, если 9=2,

0<а<L , где 9=!

[0, если 9=1.

Теперь множество стратегий игроков, управляющих системами Бд , можно сузить так, что для д-го

игрока V/9 ={т9, п 9, 19}.

Покажем, что рассматриваемая дифференциальная игра между двумя системами Б9 (п9, т9, в9) сводится к матричной игре.

Пусть а = тіп {а1, а2} . На интервале [0, t[[ введем множество % = {0, а, 2а, 3а, ..., ша|, где ю = [^/а — 1]. Далее, пусть точность определения управления 19 ()

равна ед. Тогда каждая координата вектора 19 () может принимать [ Мд/ ед ] + 1 значений. Последовательность моментов настроек {т9 , т2, ..., тI} на

Ы

точках множества % можно распределить І I способами.

Таким образом, для д-го игрока существует

У9 =

М.

Г

+1

П 4рі)'

(д=1, 2)

Х° =0, і=1, 2, ..., т, У° =0, ;=1, 2, ..., п.

Далее, действуя по индукции, полагают, что X “ 1 и У “_1 выбраны и найдены такие г и / , что

У 2

к(а)=1, максимизирует 2

]-1

У1 1

и с (а )=/, минимизирует 2 “ ] Х .

1-1

Если существует набор решений, при которых указанные выше выражения достигают максимума или минимума, то любую из этих стратегий (максимизирующую или минимизирующую) можно взять в качестве решения [6].

При этом

Xа 1, если і Ф к(а)

1 | тла-1

(9)

4 Ї Г“-1 +1, } = с(а) . (10)

Две последовательности векторов определяют стратегии ха и уа :

ха 1 +1, если і = к(а),

7а =]7/Х1, если 1 Ф с(а)

х а= - Xа, у а= - У а .

а а

Очевидно, что при а>1 стратегии х“ и у“ будут смешанными.

Как отмечено в [6], не существует никаких гарантий, что последовательность {х“ } или { у“ } схо-

1

I=0

У

т

к=0

к=0

СО

L

є

і=1

у

дится, но поскольку она лежит в компактном множестве стратегий, то она должна содержать сходящуюся последовательность. Предел любой сходящейся последовательности { х“ } и { у“ } является оптимальной стратегией.

Данный метод требует большого числа итераций, но итерации достаточно простые и удобны для программирования.

Численный алгоритм решения задачи противо-

(п9, т9, в9).

18. Вычислить Xа, Уа по формулам (9) и (10).

і=1

19. Вычислить ха=—Xа , уа=—Уа

аа

считая, что

хи = Xи, у1

20. Если

= У0.

борства двух систем Б п9, т9, в9). На основании

изложенного предлагается следующий алгоритм решения поставленной задачи противоборства двух технических восстанавливаемых после отказов Бд-систем, который нетрудно реализовать на современных профессиональных персональных ЭВМ.

Алгоритм.

1. Задать е1, е2, а1, а2, М1, М2, ^ Ь, {Ь1о}, {Ь2о}, 0<о<Ь.

2. Вычислить а = шт {а1, а2,} и ю=[tf /а—1].

3. Сформировать множество % = {0, а, 2а, ..., юа}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Задать вектор тд = (тд, тд, тЬ), д=1 2, где т? е с.

5. Задать матрицуЛ9 =(19) <7=1, 2,0<ст<1, 0<г<д, где

I9,. = У9а169, а <е{э, 1, 2. [М9]}.

6. Вычислить т9, 9=1, 2, по формулам (7).

7. Вычислить целочисленное неотрицательное решение в9 , д=1,2, уравнения (8).

8. Вычислить Pg(tf), д= 1,2, по рекуррентной процедуре, данной в [4] формулами (2.7) и (2.8).

P1(tf); P2(tf) — решения системы уравнений (3) с начальными условиями (4).

9. Вычислить а/=Р1^[) — Р2(у.

10. Выполнить процедуру пп. 7 — 8 для всех целых

неотрицательных я1,Я 2 решений уравнения (8).

11. Выполнить процедуру пп. 5— 10 для всевозможных комбинаций уд е {0, 1, 2, ..., [ Мд ]}, д = 1, 2.

12. Выполнить процедуру пп. 4—11 для всевозможных т9,9=1, 2, где т? е с, 0 < ст < I .

13. Сформировать матрицу А=(а] )ч,1хУ2 .

14. Задать число е>0 (точность решения).

15. Положить X0 = 0, У0 = 0.

16. Положить а=1.

44

17. Вычислить к(а) = г, максимизирующее 2

^ X “-х “ 1 |+| у “-у “ ^ <6 , идти к п. 23.

Здесь 11 Х| — евклидова норма вектора х.

21. Положить а = а +1

22. Идти к п. 17.

23. Конец (х“, у“ — оптимальные стратегии).

В заключение следует отметить, что если в конфликте участвуют подвижные противоборствующие системы, то задача оптимального управления усложняется и для ее решения могут быть использованы методы и приемы, изложенные в [7, 8].

Библиографический список

1. Гермейер, Ю. Б. Введение в теорию исследования операций / Ю. Б. Гермейер. — М. : Наука, 1971. — 383 с.

2. Оуэн, Н. Г. Теория игр / Н. Г. Оуэн. — М. : Мир, 1971. — 226 с.

3. Дюбин, Г. Н. Введение в прикладную теорию игр /

Г. Н. Дюбин, В. Г. Суздаль. — М. : Наука, 1981. — 336 с.

4. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. — Иркутск : Изд-во Иркут. ун-та, 1986. — 112 с.

5. Сачков, В. Н. Комбинаторные методы дискретной математики / В. Н. Сачков. — М. : Наука, 1977. — 320 с.

6. Оуэн, Н. Г. Теория игр и игровое моделирование / Н. Г. Оуэн // Исследование операций. Методологические основы и математические методы. — М. : Мир, 1981. — Т. 1. — С. 513-549.

7. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными системами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2012. — № 3 (113). — С. 268 — 271.

8. Потапов, В. И. Разработка математической модели и алгоритма оптимального управления подвижной структурно-пере-страиваемой избыточной системой, управляемой по каналам связи / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2013. — № 3 (123). — С. 13 — 18.

с(а)= 1, минимизирующее 2 а^а 1.

ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.

Адрес для переписки: гу! @ omgtu.ru

Статья поступила в редакцию 29.10.2013 г.

© В. И. Потапов

=1

Книжная полка

Новиков, Д. П. Некоторые новые методы конечнозонного интегрирования солитонных уравнений / Д. П. Новиков, Р. К. Романовский, С. Г. Садовничук ; ОмГТУ. - Новосибирск : Наука, 2013. - 251 с. - 1БВЫ 9785-02-019138-9.

Основное содержание книги — изложение результатов проведенных авторами исследований по математической теории солитонов. Предлагаемые методы конечнозонного интегрирования проиллюстрированы на ряде фундаментальных уравнений математической физики. Приведены базовые сведения по алгебраической геометрии и аналитической теории тэта-функций. В Приложении построен класс изомонодромных решений уравнения Белавина— Полякова—Замолодчикова. Для научных работников — математиков, физиков, а также для студентов и аспирантов соответствующих специальностей.

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

i Надоели баннеры? Вы всегда можете отключить рекламу.