УДК 517.972.8+65.012.8
ВАРИАЦИОННЫЕ ЗАДАЧИ В ПРОБЛЕМЕ БЕЗОПАСНОСТИ И МЕТОДЫ ИХ РЕШЕНИЯ
Т. И. Филимоненкова
VARIATIONAL TASKS IN A PROBLEM OF SECURITY AND METHODS OF ITS SOLUTION
T.I. Filimonenkova
Рассматривается математическая постановка задач безопасности охраняемого объекта в терминах вариационного исчисления. Описывается «волновой» алгоритм решения возникающих при такой постановке задач. Предлагается подход к определению наиболее эффективной системы безопасности охраняемого объекта.
Ключевые слова: безопасность, функционал, оптимизация.
The mathematical statement of tasks of security of plant in the terms of variational calculus is considered. The wave algorithm of a solution of tasks, originating at such statement, is described. The approach to definition of the most effective system of security of plant is offered.
Keywords: a safety, a functional, an optimization.
1. Задача об эффективности системы безопасности охраняемого объекта
Рассмотрим задачу об эффективности системы безопасности охраняемого объекта от несанкционированного доступа. Внутри охраняемой зоны В расположен объект С, являющийся целью предполагаемого нарушителя, проникающего на территорию Б. Вероятность обнаружения нарушителя является показателем эффективности системы безопасности. Согласно математической модели этой задачи, основные идеи которой предложены В.В. Ба-шуровым, [1 -5], вероятность обнаружения нарушителя при его движении вдоль пути Г определяется величиной
где криволинейный интеграл первого рода берется от некоторой неотрицательной функции /(М) - функции обнаружения, которая определена внутри охраняемой зоны, М £ Б. При данной вооруженности противника, расстановки средств обнаружения нарушителя (часовых, видеокамер наблюдения и т.п.), а также с учетом рельефа, растительности, застройки местности, функция обнаружения вычисляется заранее.
Мерой эффективности системы безопасности объекта естественно считать вероятность обнаружения нарушителя при его движении от границы области И к объекту (7 вдоль такой кривой Г, вдоль которой эта вероятность наименьшая:
(1)
Из (1) следует, что задача определения эффективности средств обеспечения безопасности равносильна вариационной задаче нахождения глобального экстремума функционала
Экстремальная кривая Г, доставляющая функционалу (2) глобальный минимум, является наименее защищенной траекторией нарушителя от границы области Б к границе цели (7. К поиску минимума функционала вида (2) сводятся и многие другие задачи, например, задача о безопасности перемещения по городу [5].
Существует много методов, которые в чистом виде, или в виде их комбинаций, или модифицированные, используются для нахождения минимума функционала любого вида. Но, при попытке решения задачи (2) некоторыми из этих методов мы столкнулись с ограничениями в их применении к задачам с реальными функциями обнаружения. Эти методы, в своем большинстве, базируются на необходимых условиях экстремума. В результате полученные решения требуют дополнительной проверки на экстремальность.
В поставленной задаче безопасности в реальной ситуации получить аналитический вид функции /(М) - задача практически неосуществимая, мы можем только вычислить эту функцию в любой точке области I). В этом случае об аналитическом решении вариационной задачи не может быть и речи, надо применять численные методы. Для численных методов проблема выбора начального приближения зачастую становится отдельной трудноразрешимой задачей. В реальности подынтегральная функция /(М) оказывается весьма сложной, негладкой и даже разрывной, границы областей £) и С? имеют сложный вид. Поэтому применение численных методов затруднено и зачастую невозможно из-за проблем сходимости.
В нашей задаче надо найти глобальный экстремум. В свете того, что в реальной ситуации вариационную задачу надо решать численным методом, успех которого во многом зависит от удачно выбранного начального приближения, нахождение всех локальных экстремумов вариационной задачи осложнено перебором всевозможных начальных приближений. Можно использовать глобальные методы оптимизации, например, генетический алгоритм. Но все равно мы в итоге приходим к «случайности> получения искомого глобального минимума вариационной задачи (2).
Для решения вариационной задачи (2) разработан волновой метод. Метод основан на замеченной В.В. Башуровым [3, 4], аналогии между задачей безопасности и задачами геометрической оптики, в которой минимум функционала (2) равен времени распространения света, двигающегося в оптически неоднородной среде с местной скоростью
Этот метод свободен от проблемы выбора начального приближения, ограничений на подынтегральную функцию и вид границ областей £) и (?, и позволяет гарантированно находить глобальный минимум функционала вида (2). Подчеркнем, что этот метод применим только к функционалам, у которых неотрицательная подынтегральная функция /(М) не зависит от производной.
Основная идея волнового метода. Пусть в области I) задана неотрицательная функция обнаружения /(М). Для двух подмножеств X и У области О надо найти кривую Г, лежащую в Б, один конец которой принадлежит X, а другой - У, для которой криволинейный интеграл (2) принимает наименьшее возможное значение. Для задачи определения
(2)
эффективности системы безопасности охраняемого объекта множеством X является граница области Б, а множеством У - граница области (7.
Зададимся некоторой малой величиной Д > 0, которую будем называть шагом волны. В интерпретации «распространения света» эту величину можно назвать и «временем распространения световой волны». Для точки М обозначим через Уд (М) множество таких точек области Б, до которых существует путь Г из точки М, для которого
J /(М)е^< А.
Введем следующие обозначения:
Ьо - граница множества X,
Х0 = Х,
Хг = Хг_1 иМ£Ь;_! Уа(М), где х - граница множества Х^\.
Область Б разбивается на подмножества - волны. Будем называть % -ой волной множество Хг \ Х{—\. Если к - наименьший номер волны, которой принадлежат точки множества У, мы получаем оценку минимума нашего функционала
(* — 1) - А < ппп/(Г) <к-А.
Из определения фронта ВОЛНЫ следует, ЧТО ДЛЯ любой ТОЧКИ е Ьг среди путей, соединяющих М{ и Ь{-1, существует путь ГМг от некоторой ТОЧКИ Мг_ 1 € Ьг-1, являющий экстремалью функционала / /(М)с/з. на которой функционал принимает наименьшее значение, равное Д. Аналогично, если на к-ой волне мы достигли точек множества У, то для какой-то точки Мк € У существует путь Гмк от некоторой точки Мк_\ £ являющий
экстремалью функционала / среди путей, соединяющих Ь/с-1 и У, и принимаю-
щий наименьшее значение 6 < Д. Теперь, двигаясь обратно по фронтам волны от точки Мк-1 Е ьк-1 К точке Мк-2 е Ьк-2, ПО пути Гм*_!, такому что / ¡{М)4в = А, и т.д., и объединяя все ЭТИ пути В ОДИН, получим путь Г ОТ Мо € 1/0 до точки Мк € У, являющийся экстремалью функционала (2) с экстремальным значением
£/(М№ = (к-1)-А + 6.
Если величина Д достаточно мала, то Гд^ приближенно является отрезком прямой, что позволяет упростить нахождение областей Уд, а значит и очередного фронта волны Таким образом, весь экстремальный путь Г приближенно заменяется ломаной.
На основе описанного метода разработана программа, позволяющая по вводимой в плоской области Б функции /(М) находить минимальное значение функционала (2) и соответствующую ему экстремаль, [6]. Тестирование программы показывает, что волновой метод успешно работает и находит приближенно глобальный минимум функционала и соответствующую ему ломаную, аппроксимирующую экстремаль, для любых функций обнаружения /(М) и любых конфигураций областей Б и (2 .
Пример 1. Рассмотрим случай, когда функция обнаружения является центральной, то есть ее значения зависят только от расстояния г до некоторой точки О £ Б. Конкретнее, пусть
/(г) = 1/г.
Такого вида функция обнаружения в первом приближении описывает естественную ситуацию: в точке О, начале системы координат, находится «часовой», и значения определяемой им функции обнаружения убывают с увеличением расстояния до «часового».
Экстремаль функционала (2), соединяющая точки с полярными координатами у4(100; 0) и jB(10\/2; 37г/4) , может быть найдена аналитически и задается уравнением
ф(г) = Ci lnr + С2,
где Ci = — § ГгПю ’ ^2 = Tfln2. Интеграл (2) вдоль экстремальной кривой находится непосредственным интегрированием и равен
^ \/97г2 + 4 In2 50 = 3,0623.
Значение минимума функционала, найденное волновым методом, равно 3,0667. Абсолютная погрешность составляет 0,0044; относительная погрешность соответственно равна 1,4 х 10-3. Найденный волновым методом экстремальный путь удовлетворительно близок к точной экстремали.
2. Задача оптимизации системы безопасности охраняемого объекта
Некоторые параметры системы безопасности, влияющие на значения функции обнаружения, такие, например, как места расположения часовых, могут выбираться при организации системы безопасности. Таким образом, система безопасности задается набором параметров а, принимающих значения из некоторой области возможных значений. Функция риска зависит от системы безопасности, и мы будем обозначать функцию обнаружения при системе безопасности с набором изменяемых параметров а через f(M;a). Соответственно, подынтегральная функция функционала (2) также будет зависеть от набора параметров а. Таким образом, мы приходим к стандартной задаче теории игр для двух игроков: нарушителя и службы безопасности. Функцией выигрыша в этой игре можно считать величину
1{Т;а) = J f(M;a)da.
Стратегией нарушителя является выбор пути Г, вдоль которого он будет двигаться от границы области D к границе охраняемого объекта G. При данном значении а оптимальной стратегией нарушителя будет являться кривая Гс>:, дающая минимум функции выигрыша. Значение функции выигрыша вдоль этого пути, наиболее уязвимого с точки зрения системы безопасности, будем называть эффективностью системы безопасности:
F (а) = min 1(Г; а).
Стратегией службы безопасности является организация системы безопасности, то есть выбор значений для параметров из набора а. Стратегия, при которой эффективность системы безопасности принимает наибольшее значение
F = max F (а) — тахшіп/(Г;а),
а а Г
должна быть признана оптимальной системой безопасности.
Метод определения оптимальной стратегии службы безопасности при известной функции обнаружения основан на теореме, которая дает возможность свести задачу нахождения этой оптимальной стратегии к системе нелинейных уравнений. Для формулировки теоремы поставим рассматриваемую выше задачу теории игр в более общем виде, попутно вводя дополнительные обозначения.
Пусть Б - область в пространстве Пп+], А - область возможных значений параметров, являющаяся подмножеством пространства Вгп. Пусть П\ и ¡72 две подобласти области £), границы которых задаются уравнениями ф(¿, а?х,..., хп) = 0 и ?/>(£, жх, • ■ •, хп) = 0. Рассмотрим множество кривых Г, задаваемых уравнениями
( - кусочно-гладкие функции), лежащих в области Б и соединяющих области II\ и
Последнее условие означает выполнение граничных условий
Мы будем предполагать, что функции фиф являются кусочно-гладкими.
Обозначим через Га такую кривую, которая при фиксированном наборе параметров а = («х,..., ат) Є А дает минимум функционалу:
где / - неотрицательная функция, непрерывно зависящая от своих параметров и имеющая по ним непрерывные частные производные. Параметрические уравнения кривой Га зависят от набора параметров а :
С точки зрения вариационного исчисления задача поиска пути Га является задачей с подвижными концами. Значение функционала /(Г; а) вдоль кривой Га обозначим через Р(а):
Требуется найти такой набор значений параметров а = (ах,..., ат), при котором величина Р(а) принимает наибольшее значение
Будем рассматривать случай, когда функция обнаружения /(М; а) является непрерывно дифференцируемой по всем своим аргументам. Тогда и функция -Р(а) будет непрерывно дифференцируемой по своим аргументам (что, впрочем, не означает, что оптимальная кривая Га непрерывно изменяется с изменением а). Эта функция может оказаться неограниченной в области А возможных значений параметра а. С точки зрения нашей игры это означает, что, выбирая значения а, при которых Р(а) принимает все большие значения, мы создаем систему безопасности, при которой нарушитель будет обнаружен с вероятностью, все более близкой к 1 - независимо от того, какой путь он изберет. Такая система безопасности является идеальной. Если же функция Р(а) ограничена сверху, то мы не можем выбрать идеальную систему безопасности. Однако в этом случае Р(а) обязательно имеет супремум, и существует набор значений а, при которых Р(а) либо достигает этот супремум, либо принимает значения, сколь угодно близкие к этому супремуму. Такую систему безопасности стоит считать оптимальной.
Оптимальное значение набора параметров а может находиться либо на границе области А допустимых значений параметров, либо в стационарных точках, в которых выполняются необходимые условия экстремальности
хз = Xj(t), j = 1,... ,п, а <і <Ь,
ф(а;хі{а),...,хп(а)) = 0 и ф(Ь; хі(Ь),..., хп{Ь)) = 0.
жхОО, ■ • •, хп(і); х[ (і),..., х'п{і)-,а](1і,
-Р(а) = пііп7(Г; а) = 1(Га; а).
Р(а) = тахіна).
а
а=а
Приведенная ниже теорема позволяет свести поиск стационарных точек и соответствующих им кривых Га, (которые мы будем называть также стационарными), к решению системы нелинейных уравнений. Поиск оптимальных значений параметров а на границе области А и выбор среди точек, подозрительных на экстремум глобального максимума функции Р(а). требуют дополнительных усилий, и в этой статье не рассматриваются.
Теорема 1. Вдоль стационарной кривой равны нулю интегралы Ма)
/ _ 1сч{^,Х1{г,а),...,хп(Ь,а)-,х'1Ц,а),...,хп(Ь,а)-,а)(И = О,
о а(й)
где /сц обозначает частную производную от / по параметру % — 1,... ,т.
Доказательство. Проведем для простоты доказательство в случае п = 1, т = 1, учитывая, что доказательство в общем случае не несет принципиальных отличий.
Поскольку при каждом а кривая Га является локальной экстремалью вариационной задачи
гЬ(а)
1( Г;а)= / /[¡;а;({);а;'(<);а](1Мтт,
Л а(а)
ф(а,х(а)) = О, ф(Ь, х(Ъ)) = О,
для каждой такой кривой должны выполняться уравнение Эйлера:
— + /ж — 0;
условия трансверсальности:
1х' = ^Фх\^=а: /х' = /¿Фх |)
условия стационарности:
/ = \{фг + фхх') |<=а, / = ц(фг + фхх') |4=6.
Если фх |4 = 0, то условие трансверсальности имеет вид /' |1=д — 0 (аналогично при
t = Ь). Иначе, избавляясь в условиях трансверсальности и стационарности от Ли//, получим следующие условия экстремальности кривой:
, , {Фь + фХх')
J — Jx'
/ = Л
фх
{Фг + Фхх')
(3)
í=a
(4)
¿“6
Ф:
Кроме того, кривая Га дает максимум функции Р(а) = 1(Га,а), поэтому должно вы подняться необходимое условие экстремума
<1
iaF(a)
0.
Раскроем это равенство, используя формулу дифференцирования интеграла по параметру:
d, ( fb{a) г{а)
j í rb(a) >
0=— / /[í;a;(í,aí);a;'(í,G:);a]íft
\Ja(a) i
гЬ(сс)
= Аь=ЪЬ'с*- ?\^аа'сх + / + 1хХа+ /х'(х[Уа)М.
./ а(а)
Покажем, что сумма всех слагаемых, кроме /асЙ, равна нулю. Тогда /а^ /а& = 0, что
и требуется доказать.
Рассмотрим сначала подынтегральное выражение
[ (/х^а + /х'04)а)^-
J а(а)
Поменяем в выражении (х[)'а порядок дифференцирования, и проинтегрируем по частям слагаемое, содержащее это выражение, получим
^ ^ (1хх'а + 1х'{х[)'а)М = I ^ Хх'а - * + 1х'х'а\Ь^у
В этом выражении подынтегральная функция нулевая в силу уравнения Эйлера, значит, и интеграл равен нулю. Таким образом, нам осталось доказать равенство
№ + 1х'х'а)\1=ь - {/а'а + ¡х'Ха)^ = 0.
На самом деле, нулю равно каждое из двух слагаемых в отдельности. Докажем это для одного слагаемого (/Ь'а + /Х1х'а)\ь_ь, для второго слагаемого доказательство аналогично. Здесь возможны два случая.
Если фх\^ь = 0; то граничное условие в точке не зависит от ж, то есть является уравнением на г. Решением этого уравнения является некоторое постоянное значение I = Ь, одинаковое для всех а, откуда Ь'а = 0. Кроме того, как показано выше, условие трансверсальности имеет вид $'х, | 6 = 0. Таким образом, требуемое равенство выполнено.
Если Фх\г=ь Ф 0, используя полученное выше из условий трансверсальности и стационарности равенство (3) получим
(/ь'сх + ¡х'х'а)\г=:Ь = ¡х' ( Ь'а + х[) + х'а
То, что выражение в скобках равно нулю, можно получить, дифференцируя по а граничное условие ф(Ь(а),х(Ь(а),а)) = 0. Теорема доказана. □
Эта теорема дает возможность свести задачу нахождения оптимальной системы безопасности а = (&1,..., ат) и пути Га к решению системы нелинейных уравнений, которые могут быть решены численными методами.
Пример 2. Для численного решения задачи определения эффективной системы безопасности охраняемого объекта рассмотрим плоскую область простой формы. Пусть охраняемый объект С и охраняемая зона О представляют собой концентрические круги радиусов а и Ь, а < Ь , и в области Б задана функция /(М; а) > 0. Поскольку охраняемые объект и область являются концентрическими кругами, удобно ввести полярные координаты (г,(р), выбрав в качестве центра системы координат общий центр областей (?, И.
Мы будем искать при каждом а оптимальную для нарушителя кривую Га среди графиков непрерывных функций 1р(г;а), то есть нарушитель при движении будет постоянно удаляться от границы цели. Учитывая выражение для дифференциала длины дуги в полярных координатах ____________
с1в = у!г21р,2(г) + 1 (1г,
получим следующее выражение для функции выигрыша:
гЬ
/(Г; а) = 1(<р(г,а);а) = / /(г; <р(г, а); а)^г2(р'г2{г, а)
«/ а
+ 1 йг.
Для численного решения задачи нахождения экстремали разобьем отрезок [а, 6] на п равных частей точками го = а, г\, ..., гп = Ъ, где г* = а + к • г и Л = (Ь — а)/п - шаг разбиения. Заменим интеграл интегральной суммой
1((р(г,а)\а) &'^2/{гг;(р(г{,а)-,а)\/г?ср'2(п,а) + 1 • к.
г=1
Обозначая (р(г{,а) = <рг, и заменяя производную конечной разностью
фг 1
ч>'Ап,<х)
к
сведем при фиксированном наборе параметров а задачу поиска экстремали к поиску минимума функции от п + 1 переменных </5г:, г = 0,...,«:
1((р0,(р1,...,(рп-,а) = X) / (п; (Рг\ [<р1 - <^_х)2 + к2. i=1
Необходимыми условиями экстремума функции многих переменных является обращение в нуль частных производных. В нашем случае это дает нам систему из п 4-1 уравнения
97
-— = 0, г = 0, (5)
о^р%
Стратегия службы безопасности, то есть набор параметров а = («х,..., ат), должен удовлетворять, согласно сформулированной выше теореме, т уравнениям
/
г/ а
/а,- {г-, <р(г, а); ах, • • •, От) ^г2^,2 + 1 <1г = 0, j = 1,...,т.
! а
Снова заменяя интегралы конечными суммами, а производные - конечными разностями, мы получим систему из т уравнений
¿(/г)а,- ф2 (щ - Щ-\)2 + к2 = 0, 3 = 1,..., т, (6)
¿=1
где
I (гц <рц оси ..., щ ат) — / (г*; ах,..., ау + е, ...,ат) _
(1г)а^ — 2б ~
«/аД»'г;^г;ах,---,ат)-
В совокупности получаем систему т + п + 1 нелинейных уравнений (5) и (6) на т + п + 1 неизвестных. Одно из решений этой системы уравнений даст нам оптимальную стратегию а = (ах,..., ат) для службы безопасности и оптимальный путь щ,..., <рп для нарушителя при такой стратегии службы безопасности. Для решения нелинейных систем, какой является указанная система уравнений, применимы численные методы решения.
Описанный в примере 2 метод решения задачи определения эффективной системы безопасности охраняемого объекта был реализован программно на примере системы безопасности с одним параметром. Вычисленные с помощью этой программы стратегии системы
безопасности действительно оказываются экстремальными для эффективности системы безопасности F (а).
Система безопасности состоит из двух часовых. Так как области G и D являются концентрическими кругами радиусов а и Ъ , используется полярная система координат, начало которой совпадает с общим центром областей G, D. Положение первого часового фиксировано в точке (Ь, 0). Второй часовой может быть расположен в любой точке окружности с радиусом а < с < Ь, его полярный угол является параметром а, то есть положение второго часового описывается координатами (с, а). Функции обнаружения fi(M) и /2(М;а), создаваемые соответственно первым и вторым часовыми, убывают по мере удаления точки М от часового. Функция обнаружения f(M;a) является суммой двух функций, задаваемых двумя часовыми
/(М; а) = fi(M) + /2(М; а).
То, что функции обнаружения, создаваемые часовыми, складываются в общую функцию обнаружения, означает, что часовые действуют независимо друг от друга, то есть обнаружение нарушителя одним из часовых не зависит от обнаружения другим часовым.
Оптимальная с точки зрения системы безопасности расстановка часовых ясна из соображений симметрии: оптимальным является положение второго часового со значением параметра а = 7г, то есть в оппозиции к первому часовому. Такая расстановка часовых дает функцию обнаружения, имеющую наименьшие «бреши» в системе безопасности, и оптимальный для нарушителя путь оказывается для него более трудным по сравнению с оптимальными путями при других расстановках часовых.
Входными данными программы являются начальное приближение параметра а для уравнения (6) и некоторый путь нарушителя - начальное приближение вектора р для системы уравнений (5). При одних значениях входных данных вычисленное значение параметра а достаточно точно приближает число тг. Вычисленный минимальный путь нарушителя при этом значении а пролегает по области, интуитивно оптимальной для его передвижения. При некоторых других значениях входных данных программа вычисляет дислокацию часовых и путь нарушителя, соответствующие другому очевидному экстремуму этой задачи, на этот раз наименее благоприятному для системы безопасности и наиболее благоприятному для нарушителя. В этом случае второй часовой наиболее сближается с первым, то есть а = 0, что дает нарушителю возможность двигаться в области с небольшой функцией риска по отрезку (р = 7г. Заметим, что такое расположение часовых действительно доставляет экстремум, на этот раз минимум, эффективности системы безопасности F(а). Поэтому оно тоже является решением системы уравнений (5) и (6), а значит его появление при некоторых начальных приближениях искомых параметров вполне естественно.
Выражаю благодарность научному руководителю, проф. В. В. Вашурову, за постановку задач и плодотворные обсуждения.
Литература
1. Некоторые подходы к разработке методики компьютерного анализа уязвимости установок с ядерными материалами / В.В. Башуров, И.Н. Самоваров, Г.С. Цыганков и др. // Российская международная конференция по учету, контролю и физической защите ядерных материалов: программа и тезисы докладов. - Обнинск, 1997. - С. 60 - 61.
2. Problem of security system / V.V. Bashurov, V.O. Filimonenkov, A.A. Yaroslavtsev et al. // J. of nuclear materials management. - USA, Fall 2004. - Volume XXXIII, № 1. - P. 31 - 35.
3. Башуров, В.В. Применение методов геометрической оптики к решению задачи безопасности объекта / В.В. Башуров // Вычисл. технологии. - Новосибирск, 2006. - Т. 11, № 4. - С. 23 - 28.
4. Башуров, В.В. Аналогия между оптикой и проблемой безопасности объекта / В.В. Башуров // Обозрение прикладю и пром. математики. - 2006. - Т. 13, вып. 4. - С. 597 - 600.
5. Башуров, Вл.Вит. Математические модели безопасности / Вл.Вит. Башуров, Т.И. Фи-лимоненкова. - Новосибирск: Наука, 2009. - 87 с.
6. Филимоненкова, Т.И. Описание волнового алгоритма определения эффективности системы безопасности / Т.И. Филимоненкова // Снежинск и наука - 2006. Трансфер технологий, инновации, современные проблемы атомной отрасли: сб. науч. тр. Междунар. науч.-практ. конф. - Снежинск: Изд-во СГФТА, 2006. - С. 203 - 206.
Филимоненкова Татьяна Ивановна, кафедра социально-экономических и естественнонаучных дисциплин, Южно-Уральский государственный университет, филиал в г. Трехгорном, [email protected].
Поступила в редакцию 15 октября 2010 г.