I ЗАДАЧА О ПОКРЫТИИ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ
Гордеев Э.Н.'
Задача о покрытии является существенной частью математических моделей, возникающих в проблемах информационной безопасности. Примеры использования задач дискретной оптимизации в таких математических моделях можно найти в [1]. В статье приведено два таких примера. В силу NP-трудности задачи интерес представляют оценки мощности минимального покрытия. Более адекватное использование задачи в математических моделях осуществляется путем обобщения за счет введения «веса» покрытия. В работе рассматривается известное обобщение задачи о покрытии - задача об а-глубине матриц. В реальных моделях есть определенные закономерности в расположении элементов матрицы, связанные со свойствами «покрывающих» и «покрываемых» объектов. Приведены примеры таких закономерностей, получена верхняя оценка мощности покрытия в общем случае, а также рассмотрены два класса матриц, для которых, для которых можно уточнить и упростить эту оценку. Результаты работы достаточно естественно применяются в задачах большой размерности. Однако, на сегодня точные алгоритмы позволяют решать задачу на матрицах, размер которых не превышает 40-50. Поэтому полученные в работе оценки являются полезным инструментом для проверки качества эвристических алгоритмов.
Ключевые слова: система защиты информации, качество эвристики, а-глубина матриц, оценка мощности минимального покрытия.
Введение
Пусть А прямоугольная матрица размеров тхп. Элементы матрицы принимают значения из множества целых чисел: 0,1,.. .^-1.
Определение. а-глубиной матрицы А называется минимальное число строк этой матрицы такое, что в образованной этими строками подматрице сумма элементов каждого столбца не менее, чем а.
Обозначим эту величину через ^ (А). Если А-(0,1)-матрица, то ее а-глубина обозначается через С,а(А). В этом случае вместо задачи об 1-глубине употребляется термин задача о покрытии.
Задача является известной ЫР-трудной проблемой, поэтому для ее решения используются либо эвристические алгоритмы, либо методы направленного перебора. Та же сложность задачи остается, если вместо требования точности ограничиваться 8-приближенными алгоритмами. Однако в общем случае даже методы направленного перебора не позволяют решать задачи, в которых размеры матриц больше 50-60. В разных же прикладных областях при математическом моделировании проблем эта задача возникает очень часто.
Возможная интерпретация задачи в области информационной безопасности) следующая. Пусть N = {1,..., п} - множество угроз ; М = {1,..., т} - множество контрмер. Требуется обеспечить условия покрытия угроз:
аих +... + ап1хт >1
а12Х1+. + ап2Хт >1 а1пХ1 + .•• + аптХт >1
где а.у - коэффициенты покрытия, такие что ау=1, если I - я контрмера покрывает у - ю угрозу, ау=0, в противном случае, а х - искомый булевский вектор размерности т. На практике более естественно вводить оценки качества покрытия угрозы у контрмерой I. В этом случае матрица перестает быть булевской. Задача об а-глубине возникает, если необходимо варьировать качеством всего покрытия. Тогда требования покрытия следующие:
аих +... + ап1хт >а
аих! +... + ап2хт >а .
а1пХ1 + .•• + аптХт >а
Другой пример частого возникновения задачи об а-глубине - моделирование систем физической защиты объектов. Например, размещение видеокамер на большой площади в области с препятствиями (обозреваемыми объектами) так, чтобы со всех сторон видеть все объекты. В частности, здесь большой интерес представляет этап моделирования самой области и препят-
1 Гордеев Эдуард Николаевич, доктор физико-математических наук, профессор, профессор кафедры ИУ8 МГТУ им. Н.Э. Баумана, Москва, tatmigor@gmail.com
ствий, сводящийся, как правило, к оптимизационной задаче вычислительной геометрии. (См., например, [2]).
В этом случае возникает аналогия: обозреваемый объект - угроза, обозревающий объект - контрмера (средство защиты). Вновь из содержательной постановки следует, что более еспественна на практике модель, когда можно обозревать только часть объекта одной камерой; когда критичные объекты необходимо обозревать, возможно- несколькими камерами; когда общее качество системы защиты может варьировзться.
Для описания всех этих ситуаций уже не до с та-точно простой задачи о покрытии, а возникает задача об а-глубине.
Верхняя оценка a-глубины одного класса (0,1)-матриц
Пусть Tm - класс бинарных прямоугольных матриц размеров mxn, q - натуральное число, 0<q<n. Введем некоторые параметры:
1. ßi - число строк в матрице, содержащих более (i-1) единицы, i=1,.. ,n. ß(A)=(ßi,ß2,...,ßn).
2. ßt(q) - число единиц в k-м столбце, которые принадлежат строкам, содержащим более (q-1) единицы. ß1(A,q)=( ß\(q) , ß\(q) ßn(q)).
3. ßc0(q) - число нулей в k-м столбце,которые принадлежат строкам, сооержащим более (q-1) единицы. ß0(A,q)=( ß0(q) ,ß20(q) ,...,ß»).
4. Через P(A) обозначим 3п-мерный вектор, компонентами которого являются последовательно записанные_компоненты зрех вышеприведенных векторов:P(A) = (ß(A), ß1(AX°aq[), ß0(A, ф).
5. Через T(P(A)) обозначим подкласс T^ -, содержащий матрицы с одинаковыми векто|еами P( A).
Определение. а-глубиной подкласса матриц T( P( A)) называется максимальная а-глубина матрицы A из этого подкласса.
Обозначим ее Z (P(A)), а ее верхнюю оценку через С( P( A)).
Если ввести еще одну группу параметров (они нам понадобятся исключительно из технических соображений):
6. Aq - подматрица A, состоящая из строк, содержащих более (q-1) единицы, q=1,.,n. E(Aq) и Z(Aq) - количества единиц и нулей в этой подматрице;
7. Пусть li(A) (Xi(A)) число строк в содержащих ровно i единиц (нулей). l(A)=( l1(A), l2(A),..., ln(A)). X(A)=( Xc(A), Xi(A),., Vi(A)). Заметим, что X(A)=( ln(A), ln-i(A),., li(A));
то это позволит указать очевидные связи между введенными ранее параметрами виде ниже-
приведенных двух типов равенств (а), и b)) о одно-готипа неравенств - c). n
Д^^ействититьно, так: как: E(Aq) = ZOX.(A)
n-q
]=q
и Z(Aq) = ^ГуЛДA), но с другой стороны
1=00
E(Aq)=¿ ß]{q) о Z(Aq)= ¿ß0(g), а l°=ßi-ßi+i, i=l i=l }ai=ln-i=ß11-i-(5n-i+1, i=1,...,n, то отс юда и получаем ограничения:
a) Z М -ß-i) = £ß/(q),0 < #(?) < Т = I-,п.
j=q 1=1
b) Z Äß„-J- ß„-j+1) = Z ß°(q),0 < ß0(q) < m,i = 1,..., n.
j=0 i=1
n
c) (31=m, 0:<ßi<m, i=2, ,.,,n. m<Zß <mn.
i=1
Теорема 1. Справ едливо неравенство
----a n a-1
Za( P (A)) < min minis +—YVCv ^ Cs - v J,
aV V " „ , 1 r<s ¿—¡¿—i ß\(q) ßS(q)>
Cs
^ ß k=1 v=00
где минимумы берутся по множествам нату-ральныхчисел из отрезков [1,ш] для б и [1,п] для с, а параметры Р(Л), р!(А^), удовлетворяют
ограничен иям а), Ь),с).
Доказательство. Зафикси руем с[. Рассмотр им произвольную матрицу Л=(а1р) ии класса Т(Р(А)). В ней берем подматрицу Ад, в которой выбираем произвольные 8 строк. Для краткости эту последнюю обозначим просто А'.
Пусть теперь число Н(Л ) - количество столбцов в АО каждый из которых содержит не болеи (а-1) единицы. Пусть Нл(ы, д,а) - среднее значение Н(АП на множестве всех подматриц матриты А , содержащих ровно 8 строк. Тогда
Ha (s, q,a)=X H (1),
ßq A'eAq
(1)
гди суммисование ироизводится по всесоз-можным наборам из 8 строк матрицы Ад.
Из (1) вытекает, что в Ад существует подматрица А0 из 8 строк такая, что число столбцов в ней, содержащих менее, чем а единиц не превосходит На (я, д, а). Отсюда следует, что
С(P(A)) <s+aHa (s, q,a). Введем теперь ÑS функций вида:
Pq
s
1Z aik <а;
(2)
Jk ~
0 Z artk
Задача о покрытии и математические модели
Если подматрица Д состоит из строк: ы{ ,г ,...,щ ,тогд^а
Н(А)= £ •
к=1
Из (2) и (5) следует 1
На (q, а) =
Г"
С ч к=1 {
Е К ¡г
ь}
Внутренняя сумма в (6) равна числу выборов совокупности строк {и{ ,иI ,...,ы{ } таким образом, чтобы для элементов к-го нтнббца матрицы А выполнялось неравенство
<а;
что эквивалентно одному из следующих равенств:
£
£ а1к = V, где у=0,1 ,...,а-1. (3)
-=1
Но к-й столбец содержит ровно Р\{о) единиц, лежащих в строках, составляющих Ад, и ровно в?НЦ)нулей в этих же строках. Тонда у-е равенство в (3) выполнимо С, С" — способами. Так
е , вЧ( Н вН(н) „/ ч
как у строк выбирается произвольно изрк(<<)
строк, которые содержат в се(3е все единицы к-го
столбца подматрицы Ат, а остальные 8-у строк
можн о выбирать произвольно и независимо из
Р1(с[) строк, содержащих ну/ли этого столбца, то
отсюда следует равенство:
а-1
£ С
{АС у=0
Е/П V ъ-у
вС) вв( ч)
Но тогда
1
п а-1
с:
££с в
г~г 5-У
ч) РСч).
'в к=1 У=0
Теперь, используя (2), минимизируем по 8 и по д. Окончательно получаем
п а-1
Са(Р(А)) < ш1пш1п{*-
а
££св
с*
^ в к=1 V=0
ч) вв(чГ
Теорема доказана.
Прием доказательства, который здесь используется. Является классическим. (См. [3, 100 с.]).
Частные случаи закономерностей расположения единиц матрицы
Определенные интерес представляет ситуация, когда доказанная выше теорема упрощается за счет учета закономерностей расположения единиц матрицы. При этом для оценки качества эвристик, которые могут применяться при решении задачи интересно было бы иметь не только верхнюю, но и нижнюю оценку мощности мини-
мального покрытия. Рассмотрим здесь два таких примера.
Класс Т*.
Пусть подкласс Т* вышеопределенного класса матриц, задавается следующими параметрами:
1. Р(А)=(т, {т-п},.. ,,{т-п(1+1/2+.. .+1/(1-1))},..., {т-п(1+1/2+.. ,+1/(р-1))}Д.. .0).
2. в1(А,1)=(р,.,р), в1(А,2)=(р-1,.,р-1),., (31(А,1)=(р-1+1,.,р-1+1),., р1(А,р-1)=.= Р1(А,п)=(0,.,0).
3. р°(АД)=(т-р,...,т-р), ,..., Р°(А,1)=({т-р+1-1-п(1+1/2+...+1/(1-1))},...,),..., р°(А^)=...= Р1(А,п)=(0,.,0).
Здесь {х}- целая часть с избытком, а в 3. w - минимальный индекс, при котором компоненты вектора обнуляются.
Этот подкласс содержит множество матриц Т*(р) следующего вида. Матрица из Т*(р) состоят- из расположенных друг под другом р блоков: А1тн ,Ар. В любом столбце блока Ак ровно одна единица. Во всех строках, кроме последней - к ееин иц. В последней от 1 до к единиц. (Так как мы ищем верхнюю оценку, то этой последней строкой тоже можно считать строку с к единицами, чтобы не загромождать выкладки).
1...1 0...0 ... 0...0
А = 0...0 1...1 0...0 0...0
к
0... 0 ... 0... 0 1... 1
Очевидно, что 1-глубина блока Ак равна {п/к}.
Лемма. Минимальная 1-глубина для матриц из Т* достигается матрицах из Т*(р).
Теорема 2. Для класса Т* выполняется неравенство
£а (Р(А)) < т1п{ (т / р) 1п(пр / т) , ((т-п8^*))/ (р+1-Я*){1+1п(п(р+1^*)/(т-п8^*))},
ч-1 1
где е^)=£-, а q*=q*(p,m,n) - решение уравнения 1=1 1
q-8(q)=p+1-m/n.
Доказательство. Из теоремы 1 следует:
1 ^ с:
На (s, д,1) =
£ с
Г™* ,
срц к=1
в0( 9)
= п-
'ф-Н
С'
< п(1 - Н / ф)',
где h=p-q+1, ф= m-n8(q) при д>1 и ф=т при д=1. Отсюда следует
Са(Т*) < штшт{5 + пехр(-$И/ ф)}.
ч *
Минимизируя эту функцию по 8, получаем экстремум в точке s*=(ф/h) 1п(пЫф). Отсюда следует
*) < шт(ф/И){\ + Ы(пк/ ф)}.
г=1
Минимизируя эту функцию по q, при q>1 получаем уравнение, корень которого является экстремумом: nh=9, а для случая q=1 имеем (pi h){1 + \n(nh / ф)} = (m / p)\n(np / m) .
Отсюда следует
(P(A)) < min{ (m / p) ln(np / m), ((m-ne(q*))/ (p+1-q*){1+ln(n(p+1-q*)/(m-ne(q*))}.
Теорема доказана.
Класс T0.
Рассмотрим матрицу размеров kx k(k+1)/2 следующего вида
A0=
1 0 0 0
0 11 0 0
0 0 111 0 ... 0
0 0 0 1111 0 0
0 0 0
0 1...1
где q*=q*(k) - решение уравнения
2q-1
1 -
= ln
q + k
(q + k)
Доказательство. Из теоремы 1 следует: 1
Ha (q,1) = -L-£ С
Cs
p-h
С
Pq k=1
s 0 = W(q)+V(q)
(4)
где 9=n+(k+1)(q-1)/2, h=(k+1)/2, W(q)=q(q-1)/2, V(q)=n-q(q-1)/2.
Из теоремы 1 имеем:
Za (P(A)) < min min{s -
a
C
X 1 X 1 s~iv s~is-v -к qq.
В ней в первой строке 1 единица, во второй - 2,
в к-й - к единиц. Запишем теперь друг под другом (к+1)/2 таких матриц. Получим матрицу размеров пхп, где п= к(к+1)/2 х к(к+1)/2. Обозначим это множество матриц через Т°(к).
Эти матрицы входят в класс Т° с параметрами:
1. Р(А)=(к(к+1)/2, {(к-1)(к+1)/2},...,{(к-1+1) (к+1)/2},., {(к+1)/2}).
2. р1(А,1)=((к+1)/2,...,(к+1)/2), Р1(А,2)=(0, (к+1)/2,., (к+1)/2),..., Р1(А,1)=(0,.,0, (к+1)/2,..., (к+1)/2),..., Р1(А,у)=.= Р1(А,п)=(0,.,0).
3. р°(А,1)=(п-(к+1)/2,...,п-(к+1)/2), ,..., Р°(А,1)=({п-(к+1)(1-1)/2},.,{ п-(к+1)(1-1)/2},{ п-(к+1)1/2}.,{ п-(к+1)1/2}),., Р°(А,к)=({(к+1)/2},.,{(к+1)/2},0,.,0),., Р°(А^)=. = Р1(А,п)=(0,.,0).
Здесь {х}- целая часть с избытком, а в 2 и 3 у и w - минимальные индекс, при котором компоненты вектора обнуляются. В Р1(А,1) последний 0 находится на месте с индексом 1(1-1)/2, а в Р°(А,1) на этом месте - последний элемент вида п-(к+1) (1-1)/2. В Р°(А,к) последний ненулевой элемент находится на месте с индексом к(к-1)/2.
Лемма. Класс Т° удовлетворят ограничениям а), Ь), с).
Лемма. Минимальная 1-глубина для матриц из Т° достигается матрицах из Т°(к).
Теорема. Для класса Т° выполняется неравенство:__
Са(Р{А)) < (k+1-q*){1n(k+q*)/2}+(k-q* + 1)+ q*(q*-1)/2,
в к=\ V =0
Рассмотрим выражение в скобках с учетом (4):
— С"
s+ На (д, 1) < s+W(q)+V(q) < s+W(q)+V(q)
ф
(1-h/ф)s<s+W(q)+V(q)exp(-sh/ф).
Минимизируя эту функцию по 8, получаем экстремум в точке s*=(ф/h) 1п(У^)Мф). Отсюда следует
*) < Ш1и[(ф/И)Ы(Г(д)И/ ф) + Ж(д) + ф/И].
д
Минимизируя эту функцию по д, при д>1 получаем уравнение для точки экстремума:
2 q -1
2
1 -
2( k - q +1) 2 n + q - q
= ln
n( n - q( q -1)/2) kn(1 - (q -1)/k)
Подставляя n=k(k+1)/2, после упрощений получаем:
2q-1
1 —
(q + к)
= ln
q + к
корень которого д* является экстремумом.
Окончательно получаем:
Са(Р(А)) < (k+1-q*){1n(k+q*)/2}+(k-q* + 1)+ q*(q*-1)/2.
Теорема доказана.
Выводы
На основе полученных в работе результатов можно в какой-то степени преодолеть невозможность точного решения оптимизационной задачи, возникающей при моделировании некоторых прикладных проблем информационной безопасности.
Так как задача о покрытии ЫР-трудна и точно решается лишь для небольших размерностей, то вместо точного решения можно применять эвристики, для оценки качества при подборе эвристи-
Задача о покрытии и математические модели.
ки можно сравнивать полученные нею результат с верхними и нижними оценками мощности покрытия или а-глубины.
Безусловно, данный метод корректен, если сама исходная ситуация моделируется матрицами из рассматриваемых классов. Учитывая, что стро-
ки и столбцы можно менять местами, а также факт использования эвристических методов, некоторым дополнительным эвристическим аргументом может служить «степень похожести» матрицы из модели на матрицы рассматриваемых классов. Однако, это тема отдельного разговора.
Рецензент: Матвеев Валерий Александрович, доктор технических наук, профессор, заведующий кафедры ИУ8 «Информационная безопасность» МГТУ им.Н.Э.Баумана, Москва, v.a.matveev@bmstu.ru
Литература:
1. Гордеев Э.Н. Использование радиуса устойчивости задач для скрытия и проверки корректности информации // Инженерный журнал: наука и инновации. 2013. № 11 (23). С. 3.
2. Артеменко В.И., Гордеев Э.Н., Журавлев Ю.И. и др. Метод формирования оптимальных программных траекторий робота-манипулятора // Кибернетика и системный анализ. 1996. № 5. С. 84-106.
3. Леонтьев В.К. Комбинаторика и информация. Часть 1. Комбинаторный анализ. М.: МФТИ, 2015. 173 с.
COVERING PROBLEM AND MATHEMATICAL MODELLING IN INFORMATION SECURITY
Gordeev E.N.2
The minimum covering problem is an important part of some mathematical models, arising from information security. Examples of the use of discrete optimization problems in such mathematical models can be found in [1]. In this article are given two such examples. By virtue of NP-hardness of the problem, interest objectives are bounds of the minimum value of the covering. A more appropriate use of the problem in mathematical models carried out by generalization by introducing the «weight» of the covering. The paper deals with the well-known generalization covering problem - the problem of a-depth matrices. In real models, there are certain patterns in the arrangement of elements of the matrix associated with the properties of «covering» and «covered» objects. Examples of such laws, upper bounds for coverage of power in general, as well as two classes of matrices are considered, for which you can refine and simplify this assessment. The results quite naturally apply to large-scale problems. However, today the exact algorithms allow solving the problem in the matrices, the size of which does not exceed 40-50. Therefore, obtained results are a useful tool for checking the quality of heuristic algorithms.
Keywords: information security, quality of heuristics, a-depth of matrices, upper bounds in the covering problem.
References:
1. Gordeev E.N. Ispol'zovanie radiusa ustoychivosti zadach dlya skrytiya i proverki korrektnosti informatsii, Inzhenernyy zhurnal: nauka i innovatsii. 2013. No 11 (23), P. 3.
2. Artemenko V.I., Gordeev E.N., Zhuravlev Yu.I. i dr. Metod formirovaniya optimal'nykh programmnykh traektoriy robota-manipulyatora, Kibernetika i sistemnyy analiz. 1996. No 5, pp. 84-106.
3. Leont'yev V.K. Kombinatorika i informatsiya. Chast' 1. Kombinatornyy analiz. M.: MFTI, 2015. 173 P.
2 Eduard Gordeev, Dr.Sc. (Math), Professor, Professor at Bauman Moscow State Technical University, Moscow, tatmigor@gmail.com