Научная статья на тему 'О минимаксных подходах в задачах безопасности'

О минимаксных подходах в задачах безопасности Текст научной статьи по специальности «Математика»

CC BY
230
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БЕЗОПАСНОСТЬ / УПРАВЛЯЕМЫЙ ПОЛУМАРКОВСКИЙ ПРОЦЕСС С КАТАСТРОФАМИ / ОДНОРОДНАЯ МАРКОВСКАЯ РАНДОМИЗИРОВАННАЯ СТРАТЕГИЯ УПРАВЛЕНИЯ / НАДЕЖНОСТЬ / БЕЗОТКАЗНОСТЬ / РЕМОНТОПРИГОДНОСТЬ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / НЕПОЛНАЯ ИНФОРМАЦИЯ / SAFETY / CONTROLLED SEMI-MARKOV PROCESS WITH ACCIDENTS / HOMOGENEOUS MARKOV RANDOMIZED CONTROL STRATEGY / RELIABILITY / NON-FAILURE OPERATION / MAINTAINABILITY / INCOMPLETE INFORMATION

Аннотация научной статьи по математике, автор научной работы — Каштанов Виктор Алексеевич, Зайцева Ольга Борисовна

В статье исследуется модель управляемого полумарковского процесса с катастрофами применительно к проблеме безопасности. Вводятся характеристики (показатели) безопасности. Математичекая модель используется для анализа характеристик безопасности технической системы, которая обеспечивает защиту объекта (информации, территории и т. п.). Устанавливается связь характеристик надежности (безотказности и работоспособности) и характеристик безопасности. Анализируется ситуация выбора оптимальной стратегии управления в условиях неполной информации о характеристиках надежности системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON MINIMAX APPROACHES TO PROBLEMS OF SAFETY

The model of a controlled semi-Markov process with accidents is investigated as applied to a safety problem. The characteristics (indicators) of safety are introduced. A mathematical model is used to analyze the safety characteristics of the technical system responsible for the security of the facility (information, premises, etc.) The relationship between the reliability characteristics (non-failure operation and operability) and the safety characteristics is investigated. The situation of choice of the optimal control strategy given incomplete information about the reliability characteristics of a system is analysed.

Текст научной работы на тему «О минимаксных подходах в задачах безопасности»

Труды Карельского научного центра РАН № 1. 2013. С. 55-67

УДК 519.218

0 МИНИМАКСНЫХ ПОДХОДАХ В ЗАДАЧАХ БЕЗОПАСНОСТИ

В. А. Каштанов1, О. Б. Зайцева2

1 Московский институт электроники и математики, Национальный исследовательский университет «Высшая школа экономики»

2 Армавирская государственная педагогическая академия

В статье исследуется модель управляемого полумарковского процесса с катастрофами применительно к проблеме безопасности. Вводятся характеристики (показатели) безопасности. Математичекая модель используется для анализа характеристик безопасности технической системы, которая обеспечивает защиту объекта (информации, территории и т. п.). Устанавливается связь характеристик надежности (безотказности и работоспособности) и характеристик безопасности. Анализируется ситуация выбора оптимальной стратегии управления в условиях неполной информации о характеристиках надежности системы.

Ключевые слова: безопасность, управляемый полумарковский процесс с катастрофами, однородная Марковская рандомизированная стратегия управления, надежность, безотказность, ремонтопригодность, оптимальное управление, неполная информация.

V. A. Kashtanov, O. B. Zaytseva. ON MINIMAX APPROACHES TO PROBLEMS OF SAFETY

The model of a controlled semi-Markov process with accidents is investigated as applied to a safety problem. The characteristics (indicators) of safety are introduced. A mathematical model is used to analyze the safety characteristics of the technical system responsible for the security of the facility (information, premises, etc.) The relationship between the reliability characteristics (non-failure operation and operability) and the safety characteristics is investigated. The situation of choice of the optimal control strategy given incomplete information about the reliability characteristics of a system is analysed.

Key words: safety, controlled semi-Markov process with accidents, homogeneous Markov randomized control strategy, reliability, non-failure operation, maintainability, incomplete information.

ВВЕДЕНИЕ

Практическая значимость проблемы безопасности во всех сферах деятельности отдельного человека и общества в целом трудно переоценить. В связи с этим возникает острейшая проблема создания математических

моделей анализа безопасности, которые позволили бы оценивать количественные характеристики и показатели безопасности, осуществлять прогноз развития опасных ситуаций, принимать аргументированные решения, обеспечивающие безопасное развитие процессов функционирования различных систем (технических, экономических, политических и

т. д.). В настоящей работе мы понимаем безопасность как свойство процесса функционирования системы, которая является объектом исследования и управления. Именно создание математических моделей дает возможность прогнозирования развития опасных ситуаций, выработки стратегии управления, которая обеспечит безопасное течение прогнозируемых преоцессов, построить количественные оценки последствий опасного и безопасного развития реальных процессов. Основу нормативных документов в России составляет Федеральный закон "О безопасности" от 28.12.2010 №390-Ф3. В этом законе безопасность определяется как состояние защищенности жизненно важных интересов личности, общества и государства от внутренних и внешних угроз. Другими словами, есть объект, который должен находиться во множестве безопасных состояний, и есть угрозы, выводящие процесс из этого множества. Основная проблема заключается в выработке стратегии управления процессами функционирования и существования (эволюции) субъектов, которая обеспечивала бы оптимальное в каком-то смысле течение этих процессов. Когда говорят о смысле оптимизации, то тем самым определяют количественный показатель (один или несколько), характеризующий качество управления. В условиях неопределенности (в частности, стохастической неопре-делености) эффективной моделью для исследования характеристик безопасности может служить класс управляемых полумарковских процессов с катастрофами, введенный и исследованный в [7, 9]. Ранее аналогичные математические проблемы исследовались А. Д. Соловьевым для процессов восстановления [3, 4], причем в своих работах автор использует терминологию "неблагоприятное событие"вместо термина "катастрофа".

Определение управляемого полу-мАрковского процесса с катастрофами

Исходным объектом для конструктивного построения управляемого полумарковско-го процесса с катастрофами является однородная четырехмерная Марковская цепь или однородный управляемый процесс Марковского восстановления с катастрофами

(Спо @n, Un, П«,) , П ^ 0, £п € ^, Qn, Цп € ^+

= [0, то), ип € и. (1)

В этих обозначениях считаем:

• Е = {1, 2,..., N}, N < то, — конечное множество состояний, первая компонента £п однородного управляемого процесса Марковского восстановления с катастрофами принимает дискретные значения из этого множества (ограничимся случаем конечного множества);

• Я+ = [0, то) — множество положительных действительных чисел, поэтому вторую компоненту 9п и последнюю компоненту Пп однородного управляемого процесса Марковского восстановления с катастрофами отождествляем со временем, на пространстве Я+ = [0, то) задаем борелевскую алгебру;

• и есть некоторое пространство управлений с ст-алгеброй А подмножеств этого пространства;

Однородная Марковская цепь (£п, 0п, ип, пп) определяется переходными вероятностями и начальным распределением

Р{£о = ¿, ^0 < ¿, ио € В, по < ж}.

В рассматриваемом случае предполагаем, что Марковская цепь задается переходными вероятностями специального вида

Р{Сп+1 = ;, 0п+1 < ■£, и-п+1 € В, Пп+1 < х|£п = ¿,

0п = Т, Пп = и, Пп = Т, Пп = у} = Р{£п+1 = ^, @п+1 < ^, ип+1 € В Чп+1 < х|£п = *},*,.? € Е, ¿,т, ж, у € Я+, В € А, и € и,

в которых нет зависимости от параметров т, и и у — значений второй, третьей и четвертой компонент на предыдущем шаге и номера шага п. Сдедовательно, будущее поведение однородного управляемого процесса Марковского восстановления с катастрофами зависит только от значения первой компоненты и имеет место однородность этого управляемого Марковского процеса восстановления. При этих дополнительных ограничениях в качестве начального распределения можно задавать константы

Рг = Р{£о = ;, ^0 < то, ио € и, По < то},

Е Р; = 1, (2)

ЗеЕ

поскольку событие {ио € и} является достоверным, а относительно $о и пп далее полагаем Р{0о = 0} = 1, Р{по > 0} = 1.

В дальнейшем будем использовать обозначения

5г,;(¿, В, ж) = Р{Сп+1 - ;', ^п+1 ,£, ип+г € В, Пп+1 < ж|Сп = ¿}.

(3)

Из равенства (3) следует, что модель можно усложнить и считать, что область определения функции Q j(t, B,x) по переменной B зависит от состояния i. Это значит, что для каждого i £ E задано множество управлений Ui и ст-алгебра Ai подмножеств этого пространства Ui. Функция Qj(t, B, ж), определяемая равенством (3), задана для i,j £ E, t, ж £ R+, B £ Aj.

Семейство функций Qj(t, В,ж) порождает на измеримом пространстве (Ui, Ai) вероятностную меру

Gi(B) = P{un+i £ В|Сга = i}

= Е Qj(то, B, то), i £ E, B £ Ai, (4)

jee

где обозначено Qij(t, B) = Qij(t, B, то) = lim Qij(t, B,x),

Qij(то, B, то) = lim Qij(t, B, то).

Так как для любых j £ E, t, ж £ R+, B £ Ai справедливо неравенство Gi(B) ^ Qij, то мера (Qi,-(t,B,x) абсолютно непрерывна относительно меры Gi(B), и на основании теоремы Радона-Никодима, существуют непрерывные измеримые функции Qi,(t, u, ж), u £ Ui, для которых имеет место равенство

(Qi,(t, B, ж) = / Qi,(t, u, x)Gi(du). (5)

Jb

Функции Qij (t, u, ж) есть условные вероятности

Qij(t u, ж) — P{Cra+i — j\ ^ra+i < t, П«+Ь ж|Сга

— i, un+i — u}. (6)

Таким образом, однородный управляемый процесс Марковского восстановления с катастрофами может быть задан семейством матриц

{Qij(t, u, ж)}, t, ж £ R+, u £ Ui, i, j £ E,

множеством вероятностных мер G + i(B),i £ E, B £ Ai и начальным распределением вероятностей состояний Pi, i £ E.

Семейство матриц {Qij(t,u,ж)}, определяемое равенствами (6), будем называть по-лумарковским ядром управляемого полумар-ковского процесса с катастрофами, а семейство вероятностных мер Gi(B), определяемое равенствами (4), будем называть семейством управляющих мер или Марковской однородной стратегией управления.

Для введенных выше характеристик справедливо равенство

Qij (t,u) = Qij(t, u, то) = lim Qij(t,u,x),

которое устанавливает связь полумарковского ядра Qij(t,u, x) управляемого полумарковского процесса с катастрофами со стандартным полумарковским ядром Qij (t, u) управляемого полумарковского процесса [3, 7].

В дальнейшем будем использовать общепринятые обозначения [7, 10]:

Pij(u) = Qij(то,и) = lim Qij(t,u),

n—>00

Fij (t,u) =

Qij (t, u) Pij(u) 1

Qij (t) = / Qij (t, u)Gi(du), (7)

JueUi

Pij = Qij (то) = lim Qij (t), Fij (t) = Qij (t)/pij,

если pij > 0,pij(u) > 0, в противном случае функции Fj(t), fij (t,u) можно доопределить произвольным образом.

Вероятностный смысл введенных обозначений вытекает из определения полумарковско-го ядра (6), в частности, матрицы

P

P (u) =

Pli .

PN 1 .

Pii(u)

PN l(u)

PlN

PNN,

. PlN

. PNN (u)

определяют переходные вероятности вложения цепи Маркова, характеризующей эволюцию первой компоненты исследуемого процесса, а функции Р; (¿), Р; (¿, и) определяют условное распределение второй компоненты этого процесса

^¿3 = Р{^п+г , ¿|£п = *,Сп+1 = ^),

Ру (t, и) = Р{0п+1, ¿|£п = ^, Сп+1 = ^, ип+1 = и).

Из равенств (6) и (7) получаем условное совместное распределение второй и четвертой компонент управляемого процесса Марковского восстановления с катастрофами:

Р{^п+1 < t, Пп+1 < ж|£п = ^ £п+1 = ^, ип+1 = и}

5г,3 (^ u, ж)

Pi,j (u)

(8

В силу монотонности функции (8) по переменной х получаем неравенство

Р{0п+1, t, пп+1, х|Сп = ' ип+1 = и}

^¿3 (ъ,и,х)

= ■ (9) Следовательно, мера

Р { 0п+1 < ^, пп+1 < х | Сп = 'Ь Сп+1 = ^, ип+1 = и}

абсолютно непрерывна относительно меры Р;(¿, и), и на основании теоремы Радона-Никодима существуют измеримые функции

Р;(х, ¿, и) = Р{Пп+1|Сп = ',£« + I

= ;,^пг = ¿,ип+г = и}, (10)

для которых имеет место равенство

Р{0п+1 < ¿, пп+1 < х|£п = ' Сп+1 = ^, ип+1 = и}

= / РгЗ(х, ¿, и)^уРгЗ(у, и). (11)

Jo

Приведенные рассуждения позволяют сде-лаать вывод о том, что однородный управляемый процесс Марковского восстановления с катастрофами можно задавать стандартными характеритиками управления процесса Марковского восстановления [3, 7] - равенствами

(4) и (7) и условными распределениями момента катастрофы, которое определяется равенством (10).

Далее определим управляемый полумар-ковский процесс с катастрофами У (¿) как случайный процесс с четырьмя компонентами:

У СО = (С u(t), ^ (12)

где {(¿) = &(*),и(г) = и^)+г,0(*)^(*)=г,п(^) = П^(*)+1, а считающий процесс V(¿) определяется равенством V(¿) = 8ир{п : ^к<п ^ ¿},

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

00 = 0. <

Заметим, что процесс {(¿) совпадает со стандартным полумарковским процессом [10], вторая компонента управляемого полумарков-ского процесса и(£) определяет траекторию принимаемых решений.

Эта пара совпадает с управляемым полумарковским процессом X(¿) = ({(¿),и(£)) [3]. Третья и четвертая компоненты 0(£) и п(^) принимают значения из пространства Я+ = [0, то) и определяют длительность периода между соседними моментами изменения состояния первой компоненты и характеристику развития катастрофы на данном периоде.

Компоненты управляемого полумарковско-го процесса с катастрофами У (¿) и введенный

выше считающий процесс v (t) имеют ступенчатые траектории, для которых совпадают моменты изменения состояний (изменения состояний происходят в моменты tn = fc<n , n ^ 1).

Построение функционала и его анализ. Построение оптимальной стратегии

Компоненты 0(t) и n(t) увяжем с моментами появления некоторого события A, называемого катастрофой (неблагоприятное событие). Если для некоторого t > 0 выполняется неравенство

0(t) = 0v(t)+i > n(t) = nv(i)+b

то считаем, что на периоде [tv(t),tv(¿)+г] произошла катастрофа в момент tv(t) + n(t). Значение процесса v (t) + l определяет номер периода, на котором произошла катастрофа.

Таким образом, получаем последовательность (поток) моментов катастроф при t > 0. В частности, если Z = inf{t : 0(t) > n(t)}, то тг = Z + n(C) есть момент первой катастрофы.

Объектом исследования в моделях безопасности является математическое ожидание момента первой катастрофы Mj = М(тг |{(0) = i). При исследовании этого функционала, построенного на траекториях управляемого полумар-ковского процесса, возникают следующие проблемы:

• Определение условий, при которых это математическое ожидание существует;

• Определение зависимости этого математического ожидания от вероятностных мер, определяющих Марковскую однородную рандомизированную стратегию;

• Определение оптимальной стратегии, обеспечивающей максимум математического ожидания времени до катастрофы.

Используя принятые выше обозначения, поставим задачу исследовать зависимость условного математического ожидания Mj = М(тг|£(0) = i) от исходных характеристик, определяющих управляемый полумарковский процесс с катастрофами. Решение этих вопросов зависит от свойств поведения вложенной цепи Маркова, определяющей эволюцию первой компоненты £(t).

Известно [11], что конечное множество состояний марковской цепи разбивается на непе-ресекающиеся подмножества: подмножество невозвратных состояний, для которых вероятность возвращения строго меньше единицы, и конечный набор неразложимых классов, попав

в любой из которых цепь не может из него выйти.

Обозначим через Ез8 множество состояний, составляющее один неразложимый класс, в — номер класса, в = 1,2,..., п, п — число классов, Е30 — множество невозвратных состояний. Очевидны равенства

П

Е = Е30 и ^ Ез5,

8=1

Езг п Езз = 0, г = ;, г,; е {0,1,..., п}.

Если цепь Маркова стартует из состояния, принадлежащего некоторому неразложимому множеству, то блуждание будет только по этому множеству и отдельно можно изучать цепь. Если цепь стартует из невозвратного состояния, то некоторое конечное число шагов цепь проведет в подмножестве невозвратных состояний, затем перейдет в одно из неразложимых подмножеств и там останется. Эта эволюция вложенной цепи Маркова будет использована при исследовании проблемы существования условного математического ожидания Мг = М(тг|£(0) = г).

В исследуемой модели с катастрофами введем другую классификацию состояний вложенной цепи Маркова.

Обозначим через вг;/ условную вероятность того, что процесс £(£) перешел в состояние ] (следующим состоянием будет состояние _?’), и за время этого перехода не произошло катастрофы при условии, что на этом переходе процесс находился в состоянии г. Тогда, используя введенные выше обозначения, получим равенство для введенной вероятности:

(13)

Из определения вероятности (13) следует, что сумма

вг = Е в*.? (14)

3=Е

есть вероятность того, что на периоде не произойдет катастрофы при условии, что процесс этот период проводит в состоянии г.

Если для состояния г выполняется равенство вг = 0, то на этом периоде катастрофа произойдет с вероятностью единица. Назовем такое состояние особо опасным и обозначим множество таких особо опасных состояний через Е0.

Если для состояния г выполняется равенство в» = 1, то на этом периоде катастрофа

{1-Ру (¿, ¿,и)}^0,'(¿,и)Сг(^и)

СО

0

произойдет с вероятностью ноль. Назовем такое состояние безопасным и обозначим множество таких безопасных состояний через Е2.

Если для состояния г выполняется неравенство 0 < вг < 1, то на этом периоде катастрофа произойдет с положительной вероятностью 1—вг > 0, отличной от единицы. Назовем такое состояние опасным и обозначим множество таких опасных состояний через Е1. Величина вероятности 0 < вг < 1 характеризует степень опасности.

Очевидны соотношения

Е = Е0 и Е1 и Е2, ЕгЕ? = 0,

г = ;',г,; = 0,1,2.

Ответ на вопрос о существовании математического ожидания

Мг = М(Т1|£(0) = г)

дает теорема, доказательство которой приведено в статье [6].

Теорема 1. Если в каждом неразложимом классе состояний вложенной цепи Маркова управляемого полумарковского процесса с катастрофами и конечным множеством состояний есть хотя бы одно опасное или особо опасное состояние ] е Е0 и Е1, то математическое ожидание Мг = М(т1|£(0) = г) существует и представляется как решение алгебраической системы уравнений

(1 — вгг)Мг — в»3 ^ (15)

3€Ё,3=г

где

Ьг = Е / / п/^[ / (¿, Ж, и)

/го

¿4,^(¿, Ж, «)]^0,-(¿, «)Сг(^«).

Таким образом, получаем, что искомые математические ожидания отыскиваются как решения неоднородной системы линейных алгебраических уравнений с коэффициентами, зависимыми от исходных характеристик. Заметим, что коэффициент Ьг есть условное математическое ожидание минимума двух случайных величин — длительности периода и случайной величины, определяющей момент катастрофы на периоде, при условии, что процесс провел период в состоянии г.

Решение системы (15) представляется отношением определителей Мг = Дг/Д, где Д — определитель матрицы (/ — В), (здесь

I — единичная матрица, В — матрица с элементами вг?,*,.?' е Е), Дг,г е Е, — определитель матрицы (/ — В), в которой г-й столбец заменяется столбцом из свободных членов Ь = (Ь^ Ь2,..., Ьм)т, где N — число состояний полумарковского процесса. В теореме 1 сформулированы достаточные условия того, что определитель Д отличен от нуля. Известно [11], что матрица переходных вероятностей имеет клеточную (блочную) структуру: диагональные клетки (блоки), соответствующие переходам в эргодических множествах и переходам в множестве невозвратных состояний, клетка, соответствующая переходам из невозвратных состояний в эргодические, и, наконец, клетка, соответствующая переходам из эрго-дических состояний в невозвратные. Так как переходы из эргодических состояний в невозвратные состояния невозможны, то последняя клетка состоит из нулевых элементов.

Из определения вероятностей Рз и вг? следует естественное неравенство ^ вг?. Поэтому делаем вывод, что матрицы В и (/ — В) также имеют блочную (клеточную) структуру. Блочная структура матрицы (/—В) показывает, что система (15) разбивается на блоки, соответствующие эргодическим подмножествам и невозвратным состояниям. Для эргодическо-го подмножества справедливо равенство

Мг = взМ? + Ьг, г е Е3й,

или, в матричном виде, при к = 1, 2,..., п,

вектор-столбец элементов Мі, і Є вектор-столбец элементов Ьі, і Є

где М(к)

Езй, Ь(к)

Е3й.

Справедливы следующие два утверждения Следствие 1. Для состояний из фиксированного неразложимого класса г е Е3& решение системы (16) определяется отношением

Мі = А(к)/А(к)

(17)

где А( - определитель матрицы Вд., в кото-

ром і-й столбец заменен столбцом Ь(к).

Следствие 2. Если состояние і Є Е° — особо опасное состояние, то

£

І ЄЄ'

(¿,«)Сі(^«). (18)

(I - Вк)М(к) = Ь(к),

(16)

Элементы матрицы І-В, определяемые равенством (13), являются линейными функционалами относительно распределений Сі(В), і Є Е, В Є Лі, где і — номер строки. Тогда [3] определители А, Аі, і Є Е, являются линейными функционалами относительно этих распределений. Поэтому решения (15) и (16) — это дробно-линейные функционалы, а решение (17) есть линейный функционал относительно вероятностных мер Сі(В), і Є Е, Б Є Лі, определяющих марковскую рандомизированную стратегию управления.

Исследованная структура характеристики безопасности позволяет построить оптимальную стратегию управления. Известно [9], что максимум дробно-линейного функционала

і

О©

0

І (<5) =

(М) А(«1,«2, . . . ,и^)^Сі(иі)^(С2(М2) . . . («^)

да В(«і, «2,... ,«м)ЙСі (иі)Й(^2(«2). . .^С„(и^)

достигается на вырожденных распределениях, если этот максимум существует и пространство О, по которому определяется экстремум, содержит все вырожденные распределения. В последнем соотношении

іЄЕ

Тогда задача сводится к поиску максимума отношения подинтегральных функций

^ А(и1,и2,... ,им)

тах I (и) = тах —--------------------

СеП «¿Л,г€Е В(«1,И2, . . . , им)

А(«і, «2, . . .

, «

0) N )

В (и0,«°,..., uN )■

Модель защиты

прямое произведение пространств решений в каждом состоянии, (5 = {С1,...,См} - вероятностные меры, определяющие Марковскую однородную рандомизированную стратегию управления.

Далее используем изложенную выше модель управляемого полумарковского процесса с катастрофами для анализа и оценки характеристик безопасности и увязки этих характеристик с характеристиками надежности.

Связь проблем надежности и безопасности была очевидна специалистам давно. При низких характеристиках надежности (безотказности и ремонтопригодности) нельзя обеспечить высокую безопасность функционирования различных технических систем. Примером могут служить транспортные системы, энергетические системы, вычислительные системы и т. п. В ряде работ исследовалась зависимость показателей безопасности от характеристик надежности и стратегии технического обслуживания, поддерживающей систему в работоспособном состоянии [8]. При построении таких математических моделей учитывались характерные особенности ситуации, такие как наличие противоборствующих сторон, случайный характер возникновения отказов, наличие управления (управляющих воздействий), позволяющего улучшать показатель безопасности, ставить и решать оптимизационную задачу. При построении случайного процесса, описывающего эволюцию системы, и постановке задачи оптимизации предполагается, что характеристики надежности известны.

Описание процесса атак на систему защиты

При описании этого процесса, прежде всего, заметим, что он носит дискретный характер, т. е. атаки или попытки пройти систему защиты осуществляются периодически через некоторые, возможно, случайные, интервалы времени. В настоящей работе будем предполагать, что этот процесс описывается процессом Пуассона с параметром Л. У пуассоновского процесса интервалы п между соседними атаками независимы в совокупности и распределены по экспоненциальному закону с параметром Л:

Р{п < ж}

0,

1 — е

— Аж

ж ^ 0, ж > 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пуассоновский процесс является Марковским процессом. Для произвольного момента Т время ожидания момента следующей попытки (атаки) распределено также по экспоненциальному закону с тем же параметром. Это свойство будет использовано при выводе основных соотношений.

Описание процесса эволюции системы защиты

Пусть задана система, у которой время безотказной работы_£ распределено по закону Е(ж) = Р{£ < ж}, Е{ж} = 1 — Е(ж) = Р{£ ^ ж}. Предположим, что появившийся при функционировании системы отказ самостоятельно обнаруживается (проявляется) мгновенно.

В начальный момент ¿о = 0 начинается эксплуатация системы защиты и начинается плановое предупредительное обновление (профилактика) системы через время V ^ 0, распределенное по закону

С(ж) = Р^ < ж}, С(0) = 0.

Назначение плановых предупредительных обновлений системы через случайное время

V ^ 0 означает введение рандомизации в процесс принятия решений, т. е. в тот момент, когда нужно принимать решение, строится реализация т случайной величины V, {V = т}, распределенной по закону С(ж), и плановое предупредительное обновление системы производится через время т. Если к назначенному моменту V ^ 0 система не отказала (произошло событие {V < т}), то в момент

V ^ 0 начинается плановое предупредительное обновление системы, которое по предположению полностью обновляет систему. Обозначим длительность этого планового предупредительного (профилактического) обновления 71, а Е1 (ж) = Р{71 < ж} обозначим функцию распределения этой длительности, Ё(ж) = Р{71 ^ ж}.

Наконец, если отказ системы наступил до назначенного момента времени V ^ 0 (произошло событие {V ^ £}), то в момент обнаружения отказа £ начинается внеплановое аварийное обновление системы. Длительность этой восстановительной работы обозначим 72, а закон распределения обозначим Е2(ж) = Р{72 < ж}, = Р{72 ^ ж}.

После проведения возможных восстановительных работ, когда по предположению система полностью обновляется, осуществляется перепланирование момента проведения следующей предупредительной восстановительной работы независимо от прошлого течения процесса и весь процесс обслуживания повторяется заново.

Описанная выше физическая модель полностью укладывается в математическую модель управляемого полумарковского процесса с катастрофами.

Построим этот управляемый полумарков-ский процесс с катастрофами. Алгоритм построения этого процесса включает следующие этапы: определение Марковских моментов и пространства состояний, построение пространства управлений и стратегий управления, определение полумарковского ядра управляемого полумарковского процесса, определение условных распределений моментов катастроф и, наконец, построение математического ожидания момента катастрофы.

61

В рассматриваемом случае Марковксие моменты — это моменты начала и окончания восстановительных работ. По определению первая компонента управляемого полумарковско-го процесса с катастрофами £(£) между Марковскими моментами не изменяется.

Будем считать, что £(£) = 1, если в ближайший Марковский момент, предшествующий ¿, началась плановая предупредительная профилактика системы.

Будем считать, что £(£) = 2, если в ближайший Марковский момент, предшествующий ¿, началось внеплановое аварийное восстановление системы.

Наконец, полагаем £(£) = 0, если ближайший Марковский момент, предшествующий т, является моментом обновления системы. Следовательно, первая компонента управляемого полумарковского процесса с катастрофами £(£) принимает значения из конечного множества Е = {0; 1, 2}.

Определение множества управлений и стратегии управления. Из физического описания процесса функционирования системы следует, что решение о назначении периода проведения плановых предупредительных профи-лактик принимается только в моменты окончания восстановительных работ (процесс £(£) находится в состоянии ноль, £(£) = 0). В этом состоянии можно назначить проведение плановой предупредительной профилактики через любое положительное время. Множество управлений Цо совпадает с множеством положительных чисел, Цо = [0, то).

Следовательно, по определению, С0(и) = С(и).

Построение полумарковского ядра. Из описания процесса функционирования системы следует, что при г = 1, 2 справедливы равенства

Фго(^,«) = Р{Тг < ¿} = ^(¿),

(¿, и) = 0, ; = 1, 2. (19)

Для перехода в состояние ноль необходимо и достаточно, чтобы до момента £ закончилась проводимая восстановительная работа, а последние равенства в (19) справедливы, поскольку Марковские моменты начала и окончания восстановительных работ чередуются.

При г = 0 справедливы равенства:

• если ] = 1, то

^01(£, и) = Р^ < ¿, V ^ £^ = и}

= /°, и>£, (20)

\Е(и), и < ¿, (0)

поскольку при u > t не выполняется первое неравенство и, следовательно, вероятность такого события равна нулю, а при u ^ t необходимо и достаточно выполнения неравенства £ ^ U, вероятность которого равна F(u).

Заметим, что при указанных условиях перехода решение совпадает с интервалом между Марковскими моментами с вероятностью единица, т. е.

P{0n+1 = Un+i|£n = 0,£п+1 = 1} = 1; (21)

• если j = 2, то

Q02(t, u) = P{v > £, t > £|v = u}

= (F (t),u>t, (22)

\ F(u), u < t. (22)

Пояснения аналогичны предыдущим: при u > t необходимо и достаточно выполнения неравенства t > £, вероятность которого равна F (t), а при u ^ t необходимо и достаточно выполнения неравенства t > £, вероятность которого равна F(u).

Заметим, что при указанных условиях перехода решение также совпадает с интервалом между Марковскими моментами с вероятностью единица, т. е. справедливо равенство, аналогичное равенству (21):

P{6ra+1 = ura+l|£n = 0, £га+1 =2} = 1. (23)

• если j = 0, то

Qoo(t,u)=0, (24)

поскольку переход в состояние ноль невозможен.

Нетрудно проверить очевидное равенство, справедливое при любом u > 0:

lim Qj (t, u) = 1.

t——<^ *—/ jeE

Из равенств (19)-(24) получаем интегрированием по мере G0(u) = G(u) полумарковское ядро стандартного полумарковского процесса

Qi0 = Fi(t), Qij(t)=0, j = 1,2, (25)

поскольку нет зависимости от управления и функций (19);

Qoo(t) = 0, Qo,1(t) = / F(u)dG(u),

0

(26)

Qo2(t)= f F(u)dG(u) + F(t)[1 - G(t)].

Jo

Предельным переходом при t ^ то получаем переходные вероятности состояний вложенной цепи Маркова

Pij = lim Qij(t), i, j e E = {0,1, 2}.

Для исследуемой модели из равенств (25) и (26) находим, что

/*ГО

Р00 = 0, ро,1 = F(u)dG(u),

Г ГО

Р02 = / F (u)dG(u), (27)

Jo

Pío = 1, Pj = 0, i,j = 1,2.

Нетрудно проверить очевидное равенство при i = 0,1, 2

Д™ £ (t) = £ pj =1.

jeE

jeE

0, x ^ t,

1 — gA(x-i), x ^ t.

(29)

Таким образом, получается равенство (28).

Для г = 0, ] =2 система защиты также в течение всего периода £ находится в работоспособном состоянии и способна парировать возникающие угрозы. Переход из состояния г = 0

в состояние і = 2 означает выполнение неравенства £ ^ V. В этом случае интервал между Марковскими моментами совпадает с моментом появления отказа £. Поэтому из определения (10) условного распределения Е0з(£,ж,и) следует, что справедливы соотношения £ < V; £ = £; V = и. Следовательно, получаем равенство

Ео2(ж,і,и) = Еоі(ж,і,и)

0, x ^ t,

1 — e-A(x-í),x ^ t.

(30)

Отметим, что вложенная цепь Маркова имеет один замкнутый класс сообщающихся состояний с периодом й = 2.

Распределение моментов катастроф. Характеристики катастрофы задаются условными вероятностями (10).

Для рассматриваемой модели при і = 0, і =

1 справедливо равенство

Еоі(ж,і,и) = Р{Пп+і < ж|£„ = 0, £п+і = 1,

^га+І — ^, ига+1 — и} (28)

0, Ж ^ £,

1 - е-Л(х-і), ж ^ £.

Поясним соотношение (28). При переходе из состояния і = 0 в состояние і = 1 система защиты в течение времени £ исправно функционирует и, следовательно, по предположению успешно парирует угрозы. Поэтому момент возникновения угрозы равен сумме постоянной величины £ или и и некоторой случайной величины (, распределенной по экспоненциальному закону (свойство процесса Пуассона). Следовательно,

Е01(ж, £, и) = Р{( + £ < ж}

Наконец, если учесть, что в состояниях, когда проводятся ремонты, г = 1, 2, система защиты не способна парировать угрозы, получаем для этих состояний, что любое возникновение угрозы означает наличие катастрофы.

Поэтому при г = 1, 2

F¿o(t,x,u) = 1 — e

— Аж

(31)

Далее покажем, что состояние i = 0 — безопасное состояние, а состояния i = 1, 2 — опасные состояния. Из определений (13) и (14) и равенства (19), определяющего полумарков-ское ядро, следует, что при i = 1, 2

ГГО

0 < вго = e-AidFi(i) < 1, (32)

J0

так как Л > 0.

Для i = 0 покажем, что во = 1, т. е. состояние i = 0 безопасное.

Для вероятности во1 справедливо равенство

ГО

во1 = Poi = / F(u)dG(«). (33)

о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для вероятности в02 справедливо равенство

ГО

во2 = Р02 = F (u)dG(u). (34)

о

Таким образом, доказано, что для i = 0 справедливо равенство во = 1 и, следовательно, состояние i = 0 безопасное.

Выше приведенными рассуждениями доказано выполнение всех условий теорем и следствий, приведенных ранее.

Тогда получаем выражение математического ожидания времени до катастрофы через исходные характеристики:

0

M = fo°°l/o*i?(y)dy + F(u) J0Te AtFi(t)dt + E(u) J0Te AiF?2(t)dtJdG(u) ()

0(G) /o°°[1 — FX«) /о00 e-AtdFi(t) — F(u) /000 e-AtF2(t)]dG(u) (35)

Перечислим основные выводы, которыми мы воспользуемся при последующем анализе модели защиты:

1. Математическое ожидание времени до катастрофы есть дробно-линейный функционал.

2. Оптимальную стратегию управления можно искать в классе детерминированных

стратегий

од={?;Х >и: (36)

Предположим, что процесс стартует из состояния ноль, когда система защиты новая.

Тогда из равенств (35) и (36) получаем, что соотношение

Г Е(У)йУ + и)Г е ^і^ + Е(и) /о°° е

1 - і^(и) Г Є-ЛЙіі(і) - і (и) /0° Є-Л*ЙІ2(І)

Мо (и) =

определяет математическое ожидание времени до катастрофы при условии, что процесс стартует из состояния і = 0 и предупредительные профилактики начинаются через время и.

Математическая задача сводится к определению максимума функции (37) и точки ио, в которой этот максимум достигается,

V) (ио) = тах Мо (и). (38)

«^о

ВЫВОД. Нужно назначать проведение предупредительных профилактик через время ио, тогда получим максимальное математическое ожидание времени до катастрофы.

Управление при неполной информации

Однако реальная ситуация такова, что характеристики надежности, как правило, точно не известны, а получаются в результате статистических испытаний и обычно на практике имеются только оценки неизвестных характеристик. Следовательно, точно не известны ве-

роятностные характеристики случайного процесса, описывающего эволюцию исследуемой системы. Поэтому в реальной ситуации управлять приходится по неполным данным, что меняет постановку математической задачи.

Сначала исследуем структуру функционала (35) относительно распределения Е(х) =

Р{£ < х}.

Величины

/*ГО

а^ = е-Л*^^(£), г = 1,2.

Уо

определяют вероятность того, что во время восстановительной работы г-го вида не произойдет катастрофы. Естественно считаем, что справедливо неравенство а1 ^ а2, так как аварийный ремонт длится дольше предупредительного. Тогда

^ е-Лад^ = 1—^

и из (1) получаем, что

М (і С) = Г[А/о« і(У)йУ + (1 - а0 - (а2 - а0 /0«(У)]йС(и)

о , А /0°[(1 - аі) - (а2 - аі) /“ ¿і(у)]^С(и)

ГОО Г

Jo Jc

оо . О

тіп(у,и)йі (у)^С(и) 1

ГГ В(У,и)йі(У)йС(и) + А

(39)

где

В(у, и) = (1 - а2)/(у ^ и) + (1 - а1)1 (у > и)

1 - а2,у < и, (40)

1 — а1, у > и,

I(А) обозначает индикатор события А.

Равенство (39) показывает, что математическое ожидание Мо (Е, С) есть дробнолинейный функционал относительно распределения С, определяющего периодичность

проведения плановых восстановительных работ, и распределения Е — распределения времени безотказной работы:

Мо (і, С) =

ГГ А(у,и)йі (у)йС(и)

ГГ в(у,и)йі(У)йС(и)'

Как указывалось выше, точные значения распределений і неизвестны, а известны оценки каких-то характеристик этого распределения. Опишем некоторые конкретные ситуации:

©'

• В результате статистических испытаний определяются значения функции распределения в отдельных точках. Пусть Ш = О(п,", ") есть множество распределений, которые в п заданных точках

" = (Уо = 0, Уl, У2,..., Уп Уп+1 = то)

принимают заданные значения " = (по =

0,пьп2,... ,пп,пп+1 = 1), Е(Уг) = Пг. Для введенных параметров справедливы соотношения

Уо =0 < У1 < У2 < . . . < Уп < Уп+1 = ТО,

по =0 ^ П1 ^ П2 ^ ... ^ Пп ^ Пп+1 = 1.

Тогда при постановке задачи можно считать, что Е е Ш.

• В результате статистических испытаний определяются оценки математического ожидания. Пусть Ш = О(^) есть множество распределений с фиксированным математическим ожиданием ^

/* ОО

О(^) = {Е : ^ = [1 — Е(ж)]^ж}.

Jo

Тогда можно считать, что Е е Ш.

Теперь сформулируем математическую задачу.

Так как характеристики времени безотказной работы определяются по результатам статистических испытаний и после их обработки получают оценки этих характеристик, то считаем, что функция распределения времени известна неточно, а известно множество распределений Ш, которому она принадлежит, Е е Ш. Если обозначить через О множество распределений положительных случайных величин, то задачу можно сформулировать так.

Найти

тах т1 Мо (Е, С) (41)

СеП Ееж

и распределения Ео, Со, на которых этот максимум достигается.

Решение задачи (41) зависит от структуры множества распределений Ш и структуры исследуемого функционала Мо(Е, С). Как показано выше, исследуемый функционал дробнолинеен относительно распределений Е, С.

Пусть Е е Ш = О(п,","). При поиске внутреннего экстремума (минимума) при фиксированном С е О воспользуемся доказанным в [1] утверждением: если существует минимум дробно-линейного функционала

/о° А(У^Е(У) (42)

/0° £(у)^(У) ( )

по множеству функций распределения F £ W = Q(n, ", "), то он достигается на ступенчатой функции, имеющей в каждом интервале

y £ [yfc ,yfc+q), k = 0,1, 2,...,n, не более одной точки роста

min / (F) = min / (F)

F €Q( о)(га,1^,1^)

= min EL° A(zk )(nfc+1 - nfc)

Zfc €[yfc ,yk+i),fc=0,1,...,«. Efc=° B(zk)(nfc+1 - )

= ELo A(z°)(nfc+1 - nfc) EL°B(z° )(nfc+1 - ).

Если использовать этот результат для рассматриваемого случая, когда F £ W = Q(n,","), то

f ГО

A(y) = / A(y,u)dG(u),

Jo

Г ГО

B(y) = B(y,u)dG(u)

Jo

и, следовательно, точка (z° , z°,..., z°) зависит от распределения G(u), поэтому поиск внешнего экстремума затруднен, поскольку неизвестна структура исследуемого функционала.

При решении этой проблемы воспользуемся результатом, изложенным в [1].

Пусть задан функционал

1(F G) = /рГО A(y,u)dF(y)dG(u)

, Г B(y,u)dF(y)dG(u)

Если функция A(y, u) не убывает по переменной y при любом u, а функция B(y,u) не возрастает по переменной y при любом u, то при любом распределении G справедливо неравенство

.(F G) = Г Г A(y,u)dF1(y)dG(u)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

( 1 ,G) /оГО /оГО B(y,u)dF1(y)dG(u)

< /°ГО /рГО A(y,u)dF2(y)dG(u)

< Г Г B(y,u)dF2(y)dG(u)

= I (F2,G),

функция F1(y) мажорирует функцию F2(y), F1(y) ^ F2(y), y £ [0, то).

Это утверждение позволяет сделать общий вывод: если в пространстве W существует распределение F , мажорирующее любое распределение F, F° ^ F £ W, то для значений функционала справедливо неравенство /(F°,G) < /(F, G). Значит на мажорирующем распределении достигается минимум.

Таким образом, получаем, что при выполнении сформулированных выше условий на подынтегральные функции, функционал

I(F°,G) = min I(F,G),

FeW

дробно-линеен относительно распределений G £ Q. Поэтому, если максимум этого функционала существует, то оптимальную стратегию управления можно искать в классе детерминированных стратегий Q(0) [3]

G(x) =

0, ж ^ u,

1, ж > u.

(43)

Таким образом, получаем равенство

max min I(F, G) = max I(F0,G)

GeQ FeW Gen«»

= max Д - )) (44)

u^0 Efc=0 B(z°!, u)(nfc+i - nfc)

= ЕП A(z0,u0)(nfc+i - nfc)

ELoB (z0 ,u0 )(nfc+i- nfc) ’

В пространстве W = Q(n, ", 7П) существует мажорирующее распределение

(0, ж ^ 0,

F0(ж) = < nfc, ж е (yfc,yfc+i], (45)

[1, ж > у„,

k = 0,1, 2,...,n - 1,

у которого скачки расположены в крайних левых точках интервала (у& , y^+ij.

Для функционала (39) подынтегральная функция числителя определяется равенством A(y,u) = min(y,u), а подынтегральная функция знаменателя определяется равенством (40). Подынтегральная функция числителя — неубывающая функция по переменной у при любом и, а функция B(y,u) — невозрастающая функция по переменной у при любом и, так как естественно предполагать выполнение неравенства а1 ^ а2. Таким образом, доказано, что выполняются все условия, при которых внутренний минимум задачи (41) достигается на мажорирующем распределении F0(ж), определяемом равенством (45).

Следовательно,

M0 (F0, G0) max min M0 (F, G) = max M0 (F0, G) Gen FeW Gen

Профилактики надо проводить через время жо, и равенство (46) дает значение гарантированного уровня безопасности в этих условиях неопределености.

Рассмотрим другой пример, когда управлять приходится при наличии неполной информации. Часто по результатам статистических испытаний получают довольно точные оценки моментов распределений, в частности, математичского ожидания.

Пусть Ш = О(^) есть множество распределений положительных случайных величин с фиксированным математическим ожиданием ^,

О

Ш = О(^) = {Е : ^ = [1 — Е(ж)]^ж}.

Jo

Для технических систем естественно считать, что распределение стареющее, т. е. интенсивность отказов А(ж) = /(ж)/(д — Е(ж)) -неубывающая функция, где /(ж) - плотность распределения.

Тогда известно [2], что существует распределение

Fo (ж) =

1 - e-x/^, 0 < ж < ß

1, ж > ß,

(47)

которое мажорирует все распределения множества

Г О

О(^) = {Е : ^ = [1 — /(ж)]^ж}.

Следует заметить, что распределение Ео(ж), определяемое соотношением (47), не принадлежит множеству Ш = О(^). Следовательно,

inf Mo(F,G) ^ Mo(Fo,G) /ЄП(м) v '

[ß(1 - e- min(u,M)/M)]

Л (1 — а) — (а2 — ai)Fo(u) ’ Отсюда получаем, что

max inf M0(f, g) ^ maxM0(F0,G) Gen Fen(ju) Gen

или, с учетом равенства (48),

max inf M0 (F, G)

Gen Fen(ju)

(48)

max ELo min(ж, yfc)(nfc+i - nfc) + 1

xe[0,oc) E^= o B(ж,Ук)(nfc+i - nfc) A

(46)

= Efc=o min([o, yfc)(nfc+i - nfc) + 1 Efc=o -^o^fcX^fc+i - nfc) A.

,1 [ß(1 - e- min(u,M)/M)l 'I

^ max ^ ----7---------, , , }

m^o I A (1 - ai) - (a2 - ai)Fo(u) J

1

= -г +

(49)

[ß(1 - e-i)l

A (1 - ai) - (a2 - ai)Fo(u)

и достигается этот максимум при щ =

Таким образом, получаем следующий вывод: если распределение времени безотказной работы системы защиты — стареющее распределение и известно только его математическое ожидание ^, то предупредительные профилактики целесообразно начинать через u0 = ^, при этом гарантированное значение математического ожидания времени до катастрофы равно

max inf M0 (F, G)

Gen Fen(ju)

> 1 | Ml — e-1)] .

Л (1 — а1) — (а2 — ai)F0(u)

Литература

1. Барзилович Е. Ю., Каштанов В. А. Организация и обслуживание при ограниченной информации о надежности системы. М.: Советское радио, 1975. 136 с.

2. Барлоу Р., Прошан Ф. Математическая теория надежности. М.: Советское радио, 1969. 448 с.

3. Вопросы математической теории надежности / Под ред. Б. В. Гнеденко. М.: Радио и связь, 1983. 376 с.

4. Гнеденко Д. Б., Соловьев А. Д. Одна общая модель резервирования с восстановлением / Известия АН СССР // Техническая кибернетика. 1974. № 6. С. 113-118.

5. Зайцева О. Б. Анализ безопасности функционирования технических систем // Обозрение прикладной и промышленной математики. 2011. Т. 18, вып. 1. С. 94-95.

6. Зайцева О. Б. Анализ полумарковской модели безопасности // Обозрение прикладной и промышленной математики. 2011. Т. 18, вып. 2. С. 223-225.

7. Каштанов В. А. Элементы теории случайных процессов. М.: МИЭМ, 2010. 113 с.

8. Каштанов В. А., Зайцева О. Б. О построении математических моделей безопасности // Труды IV Всерос. научно-практической конференции, Армавир, 30-31 марта 2010. С. 45-49.

9. Каштанов В. А., Янишевский И. М. Исследование функционалов на траекториях процесса с конечным множеством состояний // Кибернетика и системный анализ. АН Украины. 1998. № 1. С. 145-156.

10. Королюк В. С., Турбин А. Ф. Полумарков-ские процессы и их приложения. Киев: Наукова думка, 1976. 182 с.

11. Ширяев А. Н. Вероятность - 2. М.: МЦН-МО, 2004. 408 с.

СВЕДЕНИЯ ОБ АВТОРАХ:

Каштанов Виктор Алексеевич

зав. каф. исследования операций, д. ф.-м. н., профессор

Московский институт электроники и математики, национальный исследовательский университет «Высшая школа экономики»

Б. Трехсвятительский пер., д. 3, Москва, 109028 эл. почта: vakashtan@yandex.ru тел.: (8495) 9168813

Зайцева Ольга Борисовна

доцент кафедры «Информатики и информационных технологий обучения», к. ф.-м. н.

Армавирская государственная педагогическая академия

Кирова, 50, Армавир, Россия, 352900 эл. почта: o_zaiceva@mail.ru тел.: (86137) 39756

Kashtanov, Victor

Moscow State Institute of Electronics and Mathematics, Higher School of Economics

3 B. Trehsvyatitelsky St., 109028 Mosccow, Russia e-mail: vakashtan@yandex.ru tel.: (8495) 9168813

Zaytseva, Olga

Armavir State Pedagogical Academy 50 Kirova St., 352900 Armavir, Russia e-mail: o_zaiceva@mail.ru tel.: (86137) 39756

i Надоели баннеры? Вы всегда можете отключить рекламу.