Научная статья на тему 'Компьютерная поддержка принятия решений по прогнозированию действий противодействующей стороны'

Компьютерная поддержка принятия решений по прогнозированию действий противодействующей стороны Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
99
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / ПРИНЯТИЕ РЕШЕНИЙ / НЕЧЕТКОЕ МОДЕЛИРОВАНИЕ / ЛИНГВИСТИЧЕСКИЕ МОДЕЛИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пинчер Д. В., Токарев В. Л.

Предлагается метод прогнозирования очередного противника в задаче принятия решений в условиях противодействия. Приводятся математическое описание данного метода и обоснование эффективности его применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPUTER SUPPORT FOR MAKING DECISIONS ON FORECASTING THE OPPOSITE’S ACTIONS

A method of forecasting the next opponent’s actions in the problem of decision making in the face of opposition is proposed. А mathematical description of the method and rationale for the effectiveness of its appl ication was given.

Текст научной работы на тему «Компьютерная поддержка принятия решений по прогнозированию действий противодействующей стороны»

УДК 004.832

Д.В. Пинчер, асп., 89207476737, pincher.Denis@gmail.com (Россия, Тула, ТулГУ), В.Л. Токарев, д-р техн. наук, проф., (4872) 33-24-10, tokarev@tsu.tula.ru (Россия, Тула, ТулГУ)

КОМПЬЮТЕРНАЯ ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПО ПРОГНОЗИРОВАНИЮ ДЕЙСТВИЙ ПРОТИВОДЕЙСТВУЮЩЕЙ СТОРОНЫ

Предлагается метод прогнозирования очередного противника в задаче принятия решений в условиях противодействия. Приводятся математическое описание данного метода и обоснование эффективности его применения.

Ключевые слова: прогнозирование, принятие решений, нечеткое моделирование, лингвистические модели.

В настоящее время существует большое количество востребованных прикладных областей, работа в которых основана на принятии решений в условиях противодействия. К таким сферам человеческой деятельности, в частности, относятся экономика, политика, бизнес, информационная безопасность, ведение переговоров и другие. Эффективность принимаемых решений в каждой из них напрямую зависит от достоверного прогноза действий противодействующей стороны. Зачастую такой прогноз может быть получен только на основе анализа доступной для наблюдений информации. Поэтому задача разработки методов, способных повысить эффективность анализа наблюдений, всегда является актуальной.

Рассматривается система, относительно которой принимаются решения в условиях противодействия сторон: Лица, Принимающего Решения (ЛПР) и Противодействующей Стороны (ПС). Каждая из сторон стремится достичь поставленной цели - то есть, привести систему к какому-либо выгодному для себя состоянию. Движение ЛПР и ПС к цели осуществляется посредством «ходов» - то есть, каких-либо действий (информационных, физических, экономических и т.п.), способных повлиять на состояние системы. Действия третьей стороны - Окружающей Среды (ОС) - также влияют на состояние системы. Отличие ОС от ЛПР и ПС заключается в том, что действия этой стороны имеют нецеленправленный характер.

Задача прогнозирования в данной системе сводится для ЛПР к задаче оценивания следующего хода ПС по доступной для наблюдений информации. Существующие методы прогнозирования (методы анализа временного ряда, адаптивные методы прогнозирования, методы статистики нечисловых данных, методы теории распознавания образов, методы, основанные на аппарате теории игр и методы, основанные на моделировании)

270

не позволяют получить достоверный прогноз, так как действия ПС имеют целенаправленный характер, и потому не могут быть точно описаны каким-либо математическим законом.

При этом можно сказать, что знание стратегии ПС может существенно повысить точность прогнозирования его очередных ходов за счёт выделения области, внутри которой необходимо искать его следующий «ход». Потому целью настоящего исследования является разработка метода оценивания стратегии ПС в задаче принятия решений.

Предлагается подход к оцениванию стратегии ПС, заключающийся в следующем. По имеющейся априорной информации определяются все возможные в рассматриваемой проблемной ситуации стратегии ПС, направленные на достижение предполагаемых целей. То есть, каждой паре <ситуация - цель> соответствует множество О стратегий, каждая из которых в формализованном виде помещается в базу знаний системы поддержки принятия решений (СППР). Этот процесс выполняется в обучающем режиме СППР. При этом 1-ая стратегия & представляется в виде некоторой модели, определенной на множестве значений признаков стратегий. Так что набор значений признаков позволяет идентифицировать конкретную стратегию из множества О.

В рабочем режиме определяются значения предложенных признаков по некоторой совокупности «ходов» взаимодействующих Лица, Принимающего Решения (ЛПР) и ПС. По предложенному решающему правилу выбирается одна из стратегий О на основе сравнений текущих значений признаков, полученных в результате наблюдений на фазе принятия решений, с соответствующими значениями признаков, хранящихся в БЗ СППР. Используя выбранную стратегию, делается прогноз очередного «хода» ПС. Совпадение очередного хода ПС с прогнозируемым свидетельствует о правильности полученной оценки стратегии ПС. Иначе, полученные данные пополняют массив наблюдений, размещаемый в БД СППР, и вновь повторяется процедура выбора стратегии ^еО. Количество таких итераций должно быть небольшим.

Для реализации данного подхода необходимо решение следующих задач: а) формализация задачи оценивания стратегии; б) выбор формы представления стратегии в базе знаний; в) определение метрики, позволяющей сравнивать стратегии между собой; г) разработка метода выбора текущей стратегии ПС из некоторого конечного множества на основе анализа начальной последовательности ходов ПС; д) разработка метода прогнозирования очередного хода ПС, используя оценку текущей стратегии ПС.

К основным сложностям задачи оценивания стратегии относятся: 1) качественный характер имеющейся априорной информации; 2) разнотипность данных, содержащих информацию о предыстории взаимодействия сторон; 3) необходимость предварительного определения множества

271

стратегий, которые может использовать ПС при наступлении проблемной ситуации; 4) недоступность для непосредственного наблюдения или оценивания стратегии - доступными для наблюдений являются только «ходы» ПС, которые зависят не только от выбранной ПС стратегии, но и от «ходов» других сторон.

Формализовать задачу оценивания стратегии ПС предлагается следующим образом. Система, относительно которой принимаются решения, представлена в виде (рис.1).

9

Рис. 1. Взаимодействие сторон

На рис. 1 х - ход ПС, действие, принимающее одно из значений В={Ъ1, Ъ2, ..., Ът}; и - ход ЛПР, w - действия ОС, я - состояние системы Р. Под ходом понимается какое-либо действие (информационное, физическое, экономическое и т.п.), способное повлиять на состояние системы.

¡к = Р (ч-ь хк, ик, wk). (1)

Каждый ход направлен на осуществление определенной стратегии

(2)

4+1 = 8 (°к!С ) сПС = (¡¡к, ик, Wк, гПС

8 № )е О № ) *ПС к е 8,

ПС

где Ск - текущая ситуация игры; Е - конечное множество возможных

для ПС ситуаций игры; ¡СПС) - некоторая 1-я стратегия; О (сПС ) - множество стратегий, применение которых возможно в текущей ситуации; 8 -

ПС

конечное множество допустимых состояний системы Р; гк - ресурсы, имеющиеся в распоряжении ПС в момент времени к.

Выбор стратегии (сПС О зависит как от сложившейся к моменту к ситуации, так и от цели т е Т, которую преследует ПС. При этом множество Т конечно.

Предлагается стратегию gj ] представить как множество близких

траекторий достижения цели т=я*, где я* - желаемое состояние для ]-го участника (] = ЛПР, ПС, ОС) процесса взаимодействия (1).

Исходя из этого, выбранную ПС стратегию gj (оПС) можно представить в пространстве ситуаций следующим образом:

„ (оПС) {о ПС оПС о ПС оПС } оПС о*

gi \оп М00 , °1 ,..., 0п-1 , оп > оп = о* (3)

где о* = хп,,- ситуация, соответствующая достижению цели

ПС s

*ПС

ПС

Предполагается, что значения переменных sk, xk, Wk, r^ , описы-

ПС

вающих ситуацию ôjç , доступны для наблюдений, из которых можно составить матрицу Vm, представляющую собой набор кортежей вида

Vm(snC) = |(аПС,xk+i), k = 0,1,...,m -l}, g S, (4)

ПС

где So - исходная ситуация.

В предположении, что ЛПР известна цель ПС, задача идентификации стратегии сформулирована как задача построения модели:

(ПС

sk ,ub wk, rk , s * sПС ^ v iLne ) (sne ) (sne )} (5)

sk G Vm =Fo ,xl/S ,x2^,к,^m-bxmЦ удовлетворяющей условию

J(y-) = med(p(Xk+i, Cxk+i)|)< e > 0, (6)

где J (y ) - критерий качества модели y-, p( Xk+i, Cxk+i) - метрика - количественная характеристика, позволяющая оценивать различие между Xk+i и Cxk+i и удовлетворяющая условиям

Г0, если x + = Cx, +, p( x Cx ) = 1 k+i k+i

[ ae, ae N иначе. (/)

ПС

С учётом разнотипности входных переменных Sk, Uk, Wk, ^ , s *,

для решения данной задачи выбран аппарат лингвистического моделирования, основной идеей которого является возможность с разнотипными (лингвистическими) переменными [i].

Лингвистическая модель представляет собой нечёткое отношение

LIN : (Xm ) ^ (Yn ), или LIN : Xm ^ Yn, имеющее вид лингвистического описания процесса. [2] Общий вид модели

О1 = и Сёк1, С8к/ = ®(2) ^ Щ (х ^ О1 С О, к

п (8)

) = и П (2), Щк е Лг С А; Ъ е 5/ с в, / /=1

где г1=^еЛ1; z2=wеЛ2; 23=иеЛ3; г4=геЛ4; 25=£*еЛ5; хеВ.

Значениям лингвистических переменных а/ 7 е Л/ соответствуют

нечёткие множества с функцией принадлежности (X /), а значениям

// J

лингвистических переменных Ъ/ е В/ - нечёткие подмножества с функцией принадлежности т^ (*/).

У

Предложен метод построения модели (5) лингвистического типа с использованием алгоритма ЬШМ [2], заключающийся в следующем.

В режиме обучения системы выполняется формирование выборки

наблюдений Уу (сПС , т). После этого значения каждого из элементов матрицы Уу (сПС , т) переводятся в форму лингвистических переменных:

Л1 = Ф(у), Л2 = Ф(w), Л3 = Ф(и), Л4 = Ф(г), Л5 = Ф(т), В = Ф( х), (9)

то есть, множеств нечетких подмножеств, определенных на базовых множествах 8, Ж, и, Я, Т, X.

В результате матрица Уу (сПС, т) преобразуется в матрицу Цу, каждый элемент которой представляет собой двойку (ю,))^, к = 1,...,N,

где ю - имя терма соответствующей лингвистической переменной; ) -значение функции принадлежности базовой переменной г терму ю.

Полученная таким образом матрица содержит нечеткие продукционные правила

(гфЛ^Л/ &)' =1,...,п)®хжеЪь (10)

При наличии достаточного количества априорной информации о системе Р и о ПС, такие правила могут быть получены непосредственно

ЛПР, а выборка данных Уу (сПС , т) в этом случае может быть использована для уточнения правил.

Затем для каждого правила (строки матрицы Цу) определяется информационная мера 1(ю>7 (г)), оценивающая соответствие каждого антецедента набора правил (10) требованию (6). Образуется матрица Ну' = Цу \ (2) I М®// (2))< а, где а - относительное пороговое значение.

Число строк N' матрицы Ну' меньше N. Эта процедура предназначена для фильтрации влияния на ходы ПС ходов ЛПР и ОС.

КI ПС \

Затем по контрольной выборке данных У1 1а ° , т1 определяется значение тестового критерия (6). Если полученное значение не удовлетворяет требуемому значению, в выборку У^ (оПС, т) включается новая информация и описанная процедура повторяется. Иначе - полученная матрица НN включается в базу знаний (8).

Выполнено исследование предложенного алгоритма построения моделей у- по информации, получаемой в ходе игры, в которой в роли ОС выступали правила игры, а в роли ЛПР и ПС - её участники. Исследование показало, что данный алгоритм обеспечивает выполнение требования (6).

Задача распознавания по результатам наблюдений стратегии О] - некоторого множества траекторий, разветвляющихся под воздействием ходов участников взаимодействия поставлена следующим образом.

Принято допущение, что по ходу игры ПС будет придерживаться выбранной им стратегии О] = \gk-j }. Задача распознавания стратегии сформулирована следующим образом.

Как показано ранее, множество моделей траекторий разделено на классы О[, !=1,...,п и для описания моделей используются значения ходов ПС. Полный набор таких моделей хранится в базе знаний (8) и поэтому доступен для анализа.

Набор возможных стратегий плюс пустая стратегия составляет алфавит классов. Количество таких классов определяется исходя из особенностей конкретной предметной области.

Априорная информация представлена в виде матрицы НN '(оПС, т), содержащей все модели возможных траекторий, принадлежащих различным классам. Алгоритм распознавания сравнивает начальный участок траектории длиной й (количеством сделанных шагов), полученный в результате наблюдений с начальными участками всех моделей траекторий, содержащихся в базе знаний (8), и принимает решение о том, к какому классу отнести текущую траекторию.

Классификация основана на вычислении степени похожести распознаваемой траектории на траектории, принадлежность которых к классам известна. Степень похожести у предложено вычислять сопоставлением определенных сочетаний ходов ПС, входящих в начальный участок текущей

траектории и моделей траекторий:

й

уй)=^чА, а =а +8к, 8е{0,0.1,...,1.0},

к=1

А =

1 если хк еВП; (11)

0, если хк £ ВС. Здесь а - линейно возрастающие весовые коэффициенты.

Затем выбирается стратегия СО/, содержащая траекторию

8/г (сПС , т), для которой полученное значение у(<&) оказалось максимальным. По используемой модели рассчитывается коэффициент достоверности полученной оценки.

На основе полученной оценки стратегии СО/ и имеющейся конечной последовательности Сё/ (ка) делается прогноз Сх(ка +1). Полученное

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

попадание значения Сх(ка +1) во множество В^^+Ц свидетельствует об адекватности выбранной стратегии СО/, иначе вновь последовательность Сё/ (ка) пополняется новым набором С®/(ка), полученным в результате наблюдений, и процедура распознавания повторяется.

ПС

Рассмотрены случаи, когда переменные и/или г. могут быть

Sj и/или Tj

оценены приблизительно и когда о значениях этих переменных известно только то, что они принадлежат известным конечным множествам S и Rnc.

Предложенный подход, использующий вычислительный аппарат ЭВМ, позволит повысить точность прогнозирования очередных действий ПС в различных предметных областях, работа в которых связана с принятием решений в условиях противодействия.

Список литературы

1. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. 167 с.

2. Токарев В. Л. Основы теории обеспечения рациональности решений: монография. Тула: Изд-во ТулГУ, 2000. 122 с.

D. V. Pincher, V.L. Tokarev

COMPUTER SUPPORT FOR MAKING DECISIONS ON FORECASTING THE OPPOSITE'SACTIONS

А method of forecasting the next opponent's actions in the problem of decision making in the face of opposition is proposed. А mathematical description of the method and rationale for the effectiveness of its application was given.

Key words: forecasting, decision-making, Indistinct modeling, linguistic models.

Получено 16.09.11

i Надоели баннеры? Вы всегда можете отключить рекламу.