А.В. Данеев,
доктор технических наук, профессор, ВСИ МВД России
А.А. Воробьев,
доктор технических наук, НПО «Орион»
Д.М. Лебедев,
НПО «Орион»
ИССЛЕДОВАНИЕ ДИНАМИКИ ПОВЕДЕНИЯ СЛОЖНЫХ ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМ В УСЛОВИЯХ ВОЗДЕЙСТВИЯ НЕБЛАГОПРИЯТНЫХ ФАКТОРОВ
INVESTIGATION OF DYNAMICS OF BEHAVIOUR OF COMPLEX ORGANIZING TECHNICAL SYSTEMS IN CONDITION OF THE INFLUENCE OF DISADVANTAGE FACTORS
Рассмотрены практические решения по исследованию динамики поведения сложной организационно-технической системы (СОТС), функционирующей в условиях воздействия неблагоприятных факторов, с применением простейших теоретикоигровых методов. Использование таких решений позволяет выявлять уязвимые места СОТС с целью дальнейшего проведения мероприятий по их нейтрализации.
Practical decisions are considered in article on investigation of dynamics of behaviour of complex organizing technical system (COTS), functionning in condition of the influence of disadvantage factors with using the most simplest game-theoretical methods. Using such decisions allows to reveal the weak points COTS for the reason the further undertaking action upon their neutralizations.
Современные сложные организационно-технические системы (СОТС) широко используются в существующей информационной инфраструктуре Российской Федерации и в значительной степени влияют на обеспечение жизнедеятельности и формирование условий для дальнейшего развития государства. В зависимости от реализации конкретных информационных технологий СОТС представляют собой достаточно жёстко определённую совокупность программных, аппаратных и организационных (информационных, математических, лингвистических и других) средств и включают:
- информационные ресурсы, содержащие информацию, необходимую для реализации основных процессов;
- средства и системы информатизации, программные средства (операционные системы, системы управления базами данных, и др.), автоматизированные системы управления, системы связи и передачи данных, осуществляющие приём, обработку, хранение и передачу информации, их информативные физические поля;
- технические средства и системы, обрабатывающие информацию, а также сами помещения, предназначенные для обработки такой информации;
- персонал, обеспечивающий деятельность СОТС;
- систему нормативно-технических документов, регламентирующих применение и функционирование сложных систем.
Прогрессирующее усложнение современных СОТС, резко повышая возможности реализации основных технологических процессов, одновременно определяет их уязвимость от воздействия неблагоприятных факторов (НФ) самой различной природы. Под НФ в широком смысле понимается комплекс мероприятий (явлений), приводящий
к нарушению, дезорганизации или полному прекращению (срыву, выводу из строя) функционирования СОТС. Достаточно очевидно, что для большинства специализированных СОТС ущерб от проявления НФ может исчисляться сотнями миллионов рублей и привести к необратимым последствиям, оказывая влияние на качество функционирования СОТС и жизнедеятельность государства. Данное обстоятельство определяет актуальность анализа и прогнозирования динамики поведения сложных систем в условиях воздействия НФ различной природы.
В общей постановке процесс функционирования СОТС в условиях воздействия НФ может рассматриваться как конфликтная ситуация. Для исследования подобных конфликтных ситуаций традиционно эффективным является использование теоретикоигровых подходов. При этом следует учитывать, что характерная особенность игр, являющихся моделями реальных конфликтных ситуаций экономического, политического, военного и социального характера, заключается в том, что игроки получают лишь вероятностную информацию о результатах своих действий, действиях противника и о правилах игры. В частности, у игроков может отсутствовать информация относительно других игроков или их функций выигрыша, о физических возможностях и стратегиях участников конфликта, о различных аспектах игры и т. п. Игра, в которой одной из сторон неизвестны все стратегии предыдущих ходов другой стороны, классифицируется как игра с неполной информацией. учёт неполноты информации в игре приводит к серьёзным математическим трудностям, возникающим как при формулировке правил игры, так и при её решении.
Вопросу исследования игр с неполной информацией посвящена достаточно обширная литература (например, [1, 2, 4]), однако имеющиеся на сегодняшний день теоретические результаты не объединены единой методологической основой. С практической точки зрения наибольший интерес представляют исследования игр с ограничениями информационного типа, состоящими в задании определённых условий на информированность игроков о стратегиях и функциях выигрыша на языке математической теории информации [5], игр с запаздыванием информации на фиксированный отрезок времени, а также модель Харсаньи [8]. В последней рассмотрен алгоритм построения для широкого класса игр с неполной информацией эквивалентных им игр с полной информацией. Существенным ограничением модели Харсаньи является наличие условий, характерных для кооперативных игр, в которых интересы сторон не противоположны.
В общем случае сложность принятия решений в условиях конфликта обусловлена, во-первых, отсутствием информации о возможных стратегиях «противника», а во-вторых, отсутствием информации о степени их опасности или вероятности появления. Широко используемым в настоящее время методом «снятия» неопределённости первого рода является применение экспертных систем, что позволяет перейти от игры с неполной информацией к игре с «несовершенной» информацией. Согласно [4], последняя отличается тем, что стороны не знают предыдущих ходов в игре, но полностью информированы о всех параметрах, характеризующих игровую ситуацию в начале игры, когда еще не сделан ни один ход. В этих условиях получение дополнительной информации о наиболее вероятных действиях «противника» состоит в многократном проигрывании конфликтной ситуации и сборе статистических данных. Результатом обработки статистических данных является определение самых опасных стратегий, которые можно рассматривать как наиболее вероятные.
Наиболее простым и достаточно эффективным способом исследования статической (без учёта динамики развития, или одношаговой) конфликтной ситуации является представление её в виде матричной игры. Основным методом решения игр с нулевой суммой является сведение их к задачам линейного программирования (ЛП) [6]. При
этом коэффициенты fe игровой матрицы отражают выигрыш одной из сторон и неотрицательны. Каждой игре с платежной матрицей Ф = (fe),(fe > 0) соответствует следующая пара взаимосопряжённых задач ЛП: n
Z
и
-> J, > V, e = i,...,w,
i=1 e '
n
ZXi=1 i=1
X > 0, i = 1,..., n,
w —
z f.he£v, i=i,..,n
e=1 ie e
w
z he = 1, e=1 e 0, e=1,...,w
(1)
(2)
где X — вероятность применения стратегии г первой стороной;
1)е — вероятность применения стратегии в второй стороной;
V — нижняя цена игры (выигрыш первой стороны);
V — верхняя цена игры (проигрыш второй стороны);
п — количество стратегий первой стороны;
Н — количество стратегий второй стороны.
Аналогично каждой паре взаимосопряжённых задач ЛП можно привести в соответствие матричную игру, цена и оптимальные стратегии которой позволяют вычислить оптимальные планы двойственных задач. В общем случае решение задач основано на применении симплекс-метода (СМ) и его модификаций.
Решение задач (1) и (2) СМ позволяет получить значения вероятностей выбора смешанных стратегий и цены игры, равной, в силу основной теоремы теории игр, совпадающим экстремумам целевых функций Ф(г, в) и -Ф(г, в).
СМ обладает хорошей сходимостью и даёт точное решение, однако его практическое использование ограничено рядом существенных недостатков:
- с ростом размерности задачи объем вычислений значительно увеличивается;
- получение решений задач большой размерности требует значительных временных затрат;
- для решения задач требуется большой объём оперативной памяти.
Учитывая недостатки численных методов решения задач ЛП, а также необходимость применения в большинстве случаев приближённых исходных данных для построения платежной матрицы, формализующей конфликтную ситуацию, целесообразно использовать итеративные методы решения матричных игр. На сегодняшний день наиболее исследованным и получившим широкое практическое применение является итеративный метод решения игр, предложенный Брауном [7] и обоснованный Дж. Робинсон [3].
Итеративный метод Брауна — Робинсон (ИМБР) представляет собой многошаговый процесс, характеризующийся тем, что на каждом шаге существует некоторое приближённое решение, точность которого всё возрастает по мере увеличения числа шагов. Несмотря на медленную сходимость, метод имеет ряд серьёзных преимуществ по сравнению с численными методами ЛП:
- цикличность метода;
- простота выполнения отдельных циклов и реализации на ЭВМ;
- наглядность процесса получения дополнительной информации о характеристиках стратегий в ходе игры;
- возможность получения приближённого результата в любой момент времени;
- с ростом размерности задач объём вычислений возрастает незначительно;
- для решения задач не требуется большой объем оперативной памяти.
Для нахождения решения задач большой размерности последнее обстоятельство часто является решающим.
Основная идея ИМБР состоит в том, что одна из сторон строит гипотетическую последовательность партий, пытаясь в каждой из них улучшить используемую смешанную стратегию как свою, так и другой стороны путём учёта опыта розыгрыша всех предшествующих фиктивных партий. В результате проведения ряда итераций относительные частоты применения чистых стратегий приближённо можно принять в качестве оптимальных смешанных стратегий участников конфликта, а средний выигрыш является приближённым значением цены игры.
Практически решение удобно искать, воспользовавшись таблицей.
Промежуточные результаты решения матричной игры
ИМБР
u i Rii R12 Riw 0 R2i R22 R2n V V V
1
Здесь и— номер итерации (номер партии игры);
і — номер выбранной стратегии первой стороны;
Я1в— суммарный выигрыш первой стороны при использовании второй стратегии в; в— номер выбранной стратегии второй стороны;
Я2і — суммарный проигрыш второй стороны при использовании первой стратегии і;
V — средний выигрыш первой стороны на $ итерациях;
V — средний проигрыш второй стороны на $ итерациях;
V — средняя цена игры.
Входящие в таблицу значения находятся по формулам
RM = R(u
Riq Riq
0=i,..., w.
i = 1,
, n.
(3)
(4)
min
v[V)=-q-----------------------------------------------------------------. (5)
J
_VV maxR2i
v [V)=-L--------. (6)
J
t/(V) , TV
v m = V1 V (7)
2
Процесс последовательного совершенствования стратегий может продолжаться сколь угодно долго. С увеличением количества итераций значения смешанных стратегий Х=||Х|| и ^=||^q|| и цена игры всё более приближаются к истинным. Признаком окон-
чания итеративного процесса может быть достижение требуемой точности полученного результата или выполнение заданного количества итераций. Как правило, предпочтение отдается первому варианту. При этом достаточно актуальной является задача оценивания точности решений, получаемых в ходе итеративного процесса.
Существующие итеративные методы, применяемые для решения матричной игры, в зависимости от реализации процедуры выбора в партиях фиктивной игры можно разделить на два класса. К первому классу относятся итеративные процессы, в которых стратегии обеих сторон определяются одновременно. При этом стороны одновременно делают первый выбор и, получая информацию о решении противника, одновременно выбирают в каждой последующей партии чистую стратегию, наиболее выгодную против сформированной до этого смешанной стратегии противника.
В ряде случаев описание реальных конфликтов предполагает поочерёдный выбор стратегий сторонами, что соответствует итеративным процесса второго класса. К ним относится ИМБР, реализующий процедуру поочередного выбора.
Хотя итеративные методы обоих классов имеют много общего, накопленный опыт решения игр показывает, что процедура с поочерёдным выбором стратегий сходится гораздо быстрее второй процедуры.
Практическое использование итеративного метода обусловливает необходимость исследования его сходимости для оценивания точности результата, полученного на любом шаге итеративного процесса. Робинсон доказала, что после большого числа партий выигрыш в фиктивной игре с поочерёдным выбором стратегий стабилизируется и стремится к цене игры. Задача получения теоретических оценок сходимости ИМБР нашла отражение в ряде работ [6]. Известна достаточно слабая априорная оценка по-
U ~ гт
грешности 1 в определении цены игры после V итераций, предложенная в [9]:
1
d0V) = J n+w~2 (8)
На практике итеративный процесс сходится гораздо быстрее, чем этого можно было ожидать по оценочной формуле (8). Сложность получения хороших теоретических оценок состоит в том, что сходимость ИМБР сильно зависит от элементов платёжных матриц и, таким образом, существуют задачи, для которых процесс сходится достаточно медленно.
Обозначим разность DV получаемых на итерации J значений верхней и нижней цены игры
DV V)= V(V)- V(V), (9)
тогда, согласно [3],
lim DVV)= 0. (10)
J®¥
Это позволяет сделать вывод о возможности практического использования значения погрешности , вычисляемого в ходе итеративного процесса по формуле т V(V)- V1V DV V
4 = V v_ V = 2 (11)
В качестве примера рассмотрим решение матрицы
О (1,0) =
4 1 3
5
6
Путём сведения матричной игры к двойственной задаче ЛП и ее решения СМ было получено точное решение:
£=(0,489; 0,40; 0,111);
//=(0,556; 0,20; 0,244);
К=3,1555556.
При требовании к точности результата ¿£0,05, удовлетворительное решение при использовании оценки (11) достигалось уже после 28 итераций:
X =(0,464; 0,429; 0,107);
/=(0,571; 0,143; 0,286);
К=3,20.
В то же время расчёты с использованием априорной оценки (7) показывают, что требуемая точность может быть достигнута лишь после 160000 итераций.
Анализ результатов решения матричной игры ИМБР с использованием оценок (7) и (11), приведённых на рис. 1—3, и сравнение их с результатами решения задачи СМ, позволяет сделать вывод о целесообразности использования оценки (11).
Рис. 1. Значение цены игры, полученное СМ и ИМБР
Необходимо отметить, что принятие решений в конфликтных ситуациях с неоп-ределённостью связано с двумя проблемами, которые могут значительно повлиять на исход конфликта. Первой проблемой является невозможность реализации смешанной стратегии. Выбор наилучшего варианта 0, имеющего наибольшее значение
*
£0 = пах <%0, имеет тот недостаток, что при этом существует такая стратегия /, применение которой против 0 приводит к потерям, большим, чем V . Вторая проблема состоит в следующем. При моделировании конфликта предполагается, что «противнику» неизвестно множество используемых стратегий и их характеристики.
Рис. 2. Динамика изменения значения разности верхней и нижней цены игры А V в ходе итеративного процесса
Рис. 3. Зависимость изменения значе-
И
ний априорной ¿0 ' и апостериорной
И
оценок погрешности результата от количества итераций
Учитывая нецелесообразность одновременного использования нескольких стратегий, выбираемых в соответствии с полученными значениями 0 > 0, логично предположить, что для решения описанных проблем характеристики стратегий должны иметь возможность модификации и адаптации. При этом под модификацией понимается совокупность мероприятий, направленных на изменение ключевых параметров используемых стратегий. Соответственно, адаптация — совокупность мероприятий, целью которых является оперативное реагирование на изменение стратегий «противника». Следовательно, возможность модификации и адаптации позволяет скрыть информацию о характеристиках стратегий, используемых в конфликтных ситуациях, и является гарантией того, что реальный проигрыш не превысит величины V (выигрыш будет не менее V ).
При исследовании динамики поведения СОТС как конфликтной ситуации с нестрогим соперничеством необходимо осуществить достаточно несложный переход от матричной игры к биматричной посредством задания различных платёжных функций для каждого участника конфликта. Поиск решения биматричных игр возможен также с использованием известных математических алгоритмов, например на основе алгоритма Лемке Хаусона.
Таким образом, рассмотрены практические решения по исследованию динамики поведения СОТС, функционирующей в условиях воздействия неблагоприятных факторов, с применением простейших теоретико-игровых методов. Использование таких решений позволяет выявлять уязвимые места СОТС с целью дальнейшего проведения мероприятий по их нейтрализации.
ЛИТЕРАТУРА
1. Гаврилов В.М. Оптимальные процессы в конфликтных ситуациях. — М.: Сов. радио, 1969. — 160 с.
2. Крапивин В.Ф. Теоретико-игровые методы синтеза сложных систем в конфликтных ситуациях / В.Ф. Крапивин. — М.: Сов. радио, 1972. — 192 с.
3. Робинсон Дж. Итеративный метод решения игр // Матричные игры. — М.: Физматгиз, 1961. — С. 110—118.
4. Саати Т. Л. Математические модели конфликтных ситуаций. — М.: Сов. радио, 1977. — 280 с.
5. Стратонович Р.Л., Гришанин Б.А. Игровые задачи с ограничениями информационного типа // Известия АН СССР. Техническая кибернетика.— 1968.— №1.
6. Юдин Д.Б., Гольштейн Е.Г. Линейное программирование. Теория, методы и приложения. — М.: Физматгиз, 1969. — 424 с.
7. Brown G.W. Iterative Solutions of games by fuctitions play // Activity Analysis of Production and Allocation, ed. by Koopmans, Cowles Commission for Research in Economics Monograph, №13, Wiley, New York, 1951.
8. Harsanyi I. C. Games with incomplete information played by “Bayesian” players. «Management Sei», 1968, v.14, pt. I: №3, p.159—182; pt.II, №5, p.320—334; pt.III, №7.
9. Shapiro H. N. Note on a computation method in the theory of games. Comm. Pure and Appl. Math. 11, 4, 1958.