УДК 519.81
Подход к формализации задач поддержки принятия решений при информационных ограничениях
А.В. Жариков, Е.В. Матюнин, Н.М. Оскорбин Алтайский государственный университет (Барнаул, Россия)
An Approach to Formalization of Decision-making Problems under Informational Constraints
A. V. Zharikov, E. V. Matyunin, N.M. Oskorbin Altai State University (Barnaul, Russia)
Подход к формализации условий информированности лиц, принимающих решения (ЛПР), состоит в задании вектора неконтролируемых параметров для каждого участника игры. В данной работе рассматриваются случайные неконтролируемые факторы, определяющие информационную обстановку игры. Большое внимание уделяется введению субъективного представления игровой ситуации для каждого игрока. Данное субъективное представление влияет на описание информационного вектора неконтролируемых параметров, определяющего информационную обстановку, и выбор стратегий каждого участника игры. Также описаны подходы к формализации задач с двумя ЛПР в зависимости от изменения вектора информационных параметров. Показаны приемы формализации игры для вектора информационных параметров, имеющего случайную природу. Рассмотрено возможное сведение таких игр к одномерным и многомерным задачам вариационного исчисления. Множества стратегий игроков в подобных задачах могут описываться некоторой областью в функциональных пространствах. Дан подход к формализации задачи с двумя ЛПР как Байесовской игры с асимметричной информированностью игроков в виде частного случая определения информационной обстановки игры.
Ключевые слова: неполная информированность, формализация игровых моделей, неконтролируемые случайные параметры, задачи поддержки принятия решений.
An approach to formalization of decision-makers awareness conditions is that a vector of uncontrolled variables should be defined for each participant of a game. In this paper, we consider random uncontrolled factors that determine the information situation in the game. Much attention is given to an introduction of subjective representation of the game situation for each player. This subjective representation affects the vector of uncontrolled variables that determines the information situation and, consequently, a choice of strategy of each participant of the game. Also, approaches to formalization of problems with two decision-makers depending on changes of the vector of information parameters are proposed. We demonstrate formalization techniques for the game with the vector of informational parameters of random nature. Such techniques are based on reduction of the game problem to one-dimensional and multi-dimensional vari-ational calculus problems. Sets of player's strategies in similar problems can be described by some area in functional spaces. We also present an approach to problem formalization with two decision-makers as a Bayesian game with an asymmetric awareness of players as a special case of the game information situation definition.
Key words: incomplete awareness, formalization of game models, uncontrolled random parameters, problems of decision-making support.
DOI 10.14258/izvasu(2014)1.2-15
Общее описание игры с неполной информированностью участников. Игры с неполной информацией описывают ситуации, возникающие при принятии решений игроками в условиях дефицита информации о стратегиях и целевых функциях
других игроков. Информационная обстановка в подобных играх может определяться неполной или асимметричной информированностью игроков о предпочтениях, условиях, множестве допустимых решений всех участников игры.
Подход к формализации задач поддержки принятия решений.
Ю.Б. Гермейер в работе «Игры с непротивоположными интересами» указывает на тот факт, что общую формализацию игровой ситуации разумно давать в двух вариантах [1]:
1) объективная формализация — общее описание игры, возможно неточно известное игрокам;
2) субъективная формализация — описание информации, известной конкретному игроку о других игроках (субъективная информация соответствует исходной ситуации, возникающей при принятии решения игроком).
Общая формализация информационной игровой обстановки в бескоалиционной игре должна включать в себя, помимо критериев эффективности (функций цели), также и ограничения (множества возможных значений), которые наложены на контролируемые и неконтролируемые параметры участников.
Параметры, которыми может оперировать игрок, называются контролируемыми. Неконтролируемые параметры определяются в зависимости от информированности о них игроков. Рассмотрим неопределенные и случайные неконтролируемые параметры. Под неопределенными параметрами понимаются те, о которых игроку может быть известно только множество их возможных значений.
Положим, w — вектор случайных неконтролируемых параметров. Игрокам известно множество возможных значений W и вероятностная мера / (м) случайного вектора w (вероятностная мера либо известна точно, либо известно лишь множество О возможных вероятностных мер).
Объективное описание игровой ситуации. Пусть N = {1,...,п} — множество игроков и х = (х1,...,хп), — вектор контролируемых параметров. В работе [1] рассматриваются ограничения М{ , которые может накладывать каждый игрок на вектор (хх,...,хп) е М{, где М{ принадлежит некоторому множеству Х0 х... х Х0 . Описываются случаи совпадения ограничений и разложения на отдельные независимые ограничения, где х{ е Х°. Рассмотрим общее для всех игроков ограничение: х е Х1 хХ2 х...хХп, где Х1,Х2,...,Хп — некоторые множества возможных значений контролируемых параметров.
Введем вектор неконтролируемых (случайных либо неопределенных) параметров м = (м1,...,мт), где также м е W1 хШ2 х...хШт ( Ш1,Ш2,...,Шт — некоторые множества возможных значений неконтролируемых параметров).
В этом случае критерии эффективности игроков имеют вид
gi = Н(х^..,хп,мх,..,мт), I = {1,...,п}.
Получаем, что объективное описание игры задается четверкой О = (ы, х, м, ^ , а стремление игроков
к достижению цели описывается максимизацией критериев эффективности
gi = H (Xl>-> Xn 'Wl'-'Wm ) ^ maX- (!)
x>
Субъективное описание игровой ситуации с точки зрения конкретного игрока. С точки зрения первого игрока, игру можно представить критериями эффективности g1 = H1(x1,..., xn ,w1,...,wm) — для первого игрока и gi = H (х1У...,xn,z1,...,zm), i = {2,...,n} — для остальных игроков, где вектор параметров z еZx хZ2 x...xZn отражает как введенные в (1) неопределенные и случайные параметры w , так и неполную информированность первого игрока о функциях цели остальных игроков. Поэтому рациональные игроки должны стремиться к выполнению
(xv...,xn,w1,...,wm) = (xv...,xn,z1,...,zm), i = {2...n},
например, путем расширения множества Z XZ2 x...xZn [1].
Данного рода формализацию также возможно применять и при введении игр с неполной информацией, описанных Дж. Харшаньи в работе [2].
Рассмотрим ситуации и стратегии, возникающие при взаимодействии игроков и, учитывая их, опишем информационную обстановку игры. Ситуация в игре — сложившееся состояние вектора (x, w), выбор i-го игрока определяется выбором значения x{. Неполная информация у i-го игрока о конкретных значениях wj, j = 1,...,m и xt, i = 1,...,n , соответственно, и о значениях x1(x2,..., xn ,w1,...,wm) = x1(x-1, w) = x1, определятся субъективным описанием игры и указывает на неполное представление об игре, в которой он участвует. Данное ограничение не позволяет производить достаточно точное прогнозирование значений величины g1 при определенном выборе стратегии x1 . Поэтому только конкретная формализация игровой обстановки и неполной информированности определяет правильное представление о возможных способах принятия решений. Кроме того, могут возникать ситуации, при которых информация, известная в начальный момент игры, может изменяться по ходу игры в результате взаимодействия игроков или в результате собственных усилий конкретного игрока. В работе [3] предлагается вводить информационную функцию R, описывающую информационную обстановку. Для первого игрока эта функцияимеетвид: R1: X2x,...,xXn х W1x,...,xWm ^ Emn, где Emn — евклидово пространство размерности mn. Таким образом, функция R определяет множество всех возможных значений неконтролируемых параметров для определенного игрока, которые в свою очередь и составляют информационную обстановку игры для данного игрока.
Поведение первого игрока есть функция, зависящая от информации, которой он располагает о значениях
w1,...,wm и x2,...,xn (под стратегией далее будем понимать правило выбора значения x{, в зависимости от информации, которую получает игрок). Следовательно, с точки зрения игрока, принимающего решение, его стратегией является некоторая функция:
xl(x2,..., Xn, wr..., Wm) = xl(x_l,w) = xl. (2)
Переходя к функциональным стратегиям, укажем, что X1 е X1, где X1 - некоторое функциональное пространство. Формально в данном случае можно считать, что целевая функция gi, определенная на множестве X1x,...,xXn xW1x,...,xWn, может быть доопределена на множество X1x,...,xXn xW1x,...,xWn, причем H {хх,..., Xn, w!,..., Wm) = H (X (x_!,w),..., Xn (x_n, w), w), i = {1,...,n}, где x_l = x2,...,xn, x-n = xl,...,xn-1. В случае же, когда игрок не имеет никакой информации о неконтролируемых параметрах, множество возможных стратегий состоит только из функций-констант X = x е X0.
Таким образом, игру с неполной информированностью участников об игровой обстановке можно свести к следующему виду:
gj = H (xi,...,Xn,w1,...,wm) = h (X,w) ^ max, (3)
Xi
где X{ е X, w е W, i = {1,...,n}. Здесь X1,...,Xn будем понимать как стратегии игроков с точки зрения самих игроков, зависящие от их информированности об игровой ситуации (которая определяется неконтролируемыми параметрами критерия эффективности игрока).
Далее рассмотрим более подробно задачу (3) со стратегиями игроков X1,..., Xn. Если предполагать, что все параметры w имеют случайный характер и допустимо осреднение случайных параметров, тогда критерии эффективности задачи (3) можно записать в виде gi = MW[Ht(X,w)], или более подробно
gj = J* Ht (X, w)dF(w)=
W
= J ...J Ht (Xl,..., Xn ,wl,..., wm )dFl(wl)...dFm (wm), (4)
где i = {1,...,n},X е X,w е W , а F1(w1),...,Fm(wm) — функции распределения случайных величин w1,...,wm — соответственно. В случае совместного распределения величин w1,...,wm имеют место функции условного распределения: F1(w11 w-1),...,Fm(wm | w m).
Рассмотрим случай игры двух лиц с критериями эффективности вида
g1 = H1(Xr ^ w); g 2 = H 2(Xr ^ w),
где X1 = x1(x2,w) — стратегия первого игрока, зависящая от параметров x2,w (неконтролируемых в субъективном представлении 1-го игрока). Аналогично X2 = x2(x1, w) — стратегия-функция, зависящая от параметров xl,w (w — вектор случайных параметров). Рассмотрим следующие возможные случаи информированности игроков относительно случайных параметров:
1. Пусть вектор w = w1 (состоит из одной компоненты, w1 — непрерывная случайная величина, распределенная на интервале [w1, w1] ). Стратегии игроков X1 е X1 с С2[щ w j, X2 е X2 с С^ w j. Для этого случая рассмотрим еще две возможных информационных ситуации:
а) предположим, w1 — случайная величина, от которой зависят критерии эффективности и первого, и второго игроков:
g1 = ^^ Х2 , w1);, g2 = H2 (x2 , Xr w1).
Предполагая, что осреднение критерия эффективности по случайному параметру допустимо, максимизируем (минимизируем) критерии эффективности:
w1
g1 = MWl [Hl(Xl,X2,w^] = JHl(Xl,X2,w^dF^) ^max;
W1
g2 = Mw [H2(x2,xvw1)]= J H2(x2>xvw^dF(w^^ max,
w1 J x2
где w1 е[w1, w2], X1 = x1(w1), X2 = x2(w1), F (w1) — функция распределения случайной величины (неконтролируемого информационного параметра). Таким образом, мы переходим к задаче вариационного исчисления, находя оптимальные стратегии игроков в виде решающих функций xX1 и xX2 , доставляющих экстремум функционалам
JH1(X1,X2,w1)dF(w1) и JH2(X2,X1,w1)dF(w1)
соответственно;
б) предположим, w1 — случайная величина, от которой в явном виде зависят критерий эффективности только второго игрока (например, задача «Государство-Wпредприниматель» [4]):
g1 = H1(Xr X2 g2 = H2 (x2 , ^ w1).
В данном случае игра с неполной и информацией примет вид
Wl
g1 = Mw, [H^,x2(w1))]= JH1(x1,x2(w^)dF(w^ ^max;
J X
Подход к формализации задач поддержки принятия решений...
g 2 = Mwt[H 2(X2, Х1, Wl)] = = fH2(x2(w1)2,x, wi)dF(wi) ^ max. (5)
—I
Задача первого игрока в (5) не является вариационной, так как стратегия xx1 не зависит от случайного параметра w1 , т.е. первый игрок не имеет никакой информации о неконтролируемых параметрах (x1 = x1 е X0 является стратегией-константой). Для второго игрока нахождение оптимальной стратегии, напротив, является вариационной задачей получения оптимальной решающей функции x2 [5].
2. Пусть вектор w = (wx,w2), где w1 — непрерывная случайная величина, распределенная на интервале [w1, w1 }, w2 — непрерывная случайная величина, распределенная на интервале [w2, w2 }. Стратегии игроков: x1 е XX1 с C2[w w j, Х2 е X2 с C2[w w j Рассмотрим также несколько информационных ситуаций, возникающих в данном случае:
а) критерий эффективности первого игрока явно зависит от случайного параметра w1 и не зависит от параметра w2. Аналогично критерий эффективности второго игрока зависит от параметра w2 и не зависит от параметра w1. Критерии эффективности игроков в данном случае имеют вид
g1 = H1(xr х^ w1);, g 2 = (x2 , xr w2). Запишем возникшую игровую ситуацию:
g 1 = Mw [Hl(xl,x2, wj)} =
w1 w2
= ff H1(x1(w1),x2(w2), wi)dF(w2)dF(wi) ^max; g2 = Mw [H2(x2,x1, w2)\ =
w1 w2
= ff H2(x2(w2),xl(wl),w2)dF(w2)dF(wl) ^ max. (6)
Данные задачи также являются одномерными вариационными для игрока 1 и игрока 2. Задача (6) будет иметь наиболее простое решение, если функции H1 и H2 возможно представить как произведение функций
H1 = щ(х1,w^ • n1^2), H2 = m2(x2,w2) • n2(x1) либо как сумму
H1 = ml(xcl,w1) + nl(xc1), H2 = m2(x2,w2) + n2(x^). Кроме того, в задачах с неполной информацией разную информированность игроков возможно задать, используя то свойство, что первая производная стратегии по параметру, о котором игрок не информирован, равняется нулю. Для задачи (6) данные условия выглядят следующим образом:
д\_ = 0; ^ = 0;
dw.
dw1
б) критерии эффективности и первого, и второго игрока зависят от параметров w1,w2:
g 1 = H1(Xr X2,wr w2); g 2 = H 2 (x2 , x1,wr w2).
Задача нахождения оптимальных стратегий имеет вид
_ _ g1 = Mw [H1(x1, x2, w1, w2))] =
w1 w2
ЯH1(x1(w1, w2),x2(wv w2), wvw2)dF(w2)dF(wl) ^ max ; g 2 = Mw [ H 2(x2, x, wp w2)] =
w1 w2
ЯЩ^^,w2),xl(wl,w2),wpw2)dF(w2)dF(w1)^ max .
(7)
Выражения (7) определяют двумерные вариационные задачи нахождения оптимальных стратегий игроков в виде функций о1 = o1(w1,w2) и о2 = o2(w1,w2);
в) критерий эффективности первого игрока зависит от параметра , второго игрока — от параметров w1,w2 и, следовательно, имеют вид
g1 = ^(X^ x2,w1 g 2 = H 2 (x2, x1,wr w2).
Максимизация (минимизация) оптимальных критериев приводит к выражениям
g 1 = Mw [H1(°1, x2, wp w2))] =
w1 w2
f f Hi(xi(wi),x2(w1, w2), wi)dF(w2)dF(wi) ^max; g2 = Mw [H2(x2,x1, w1,w2)\ =
w1 w2
nH2(x2(wvw2),xl(wl),wpw2)dF(w2)dF(wl) ^ max , (8)
x2 (w, ,w2)
Из (8) следует, что игрок 1 решает одномерную вариационную задачу нахождения стратегии 51 = o1(w1), игрок 2 решает двумерную вариационную задачу поиска стратегии Ъ2 = o2(w1,w2).
3. Еще один частный случай исследуемых игр с неполной информированностью игроков — Байесовские игры (Bayesian games). Информационная гипотеза в данных играх основывается на субъективном представлении игроков о неконтролируемых информационных параметрах друг друга. Рассмотрим игру со следующим видом критериев эффективности:
g1 = x°2 , w1);; g 2 = (x°2 , ^ w2).
Параметры w1 и w2 определяются как возможные типы игроков 1 и 2 соответственно. Предполагается, что первый игрок точно знает свой тип, определяемый параметром w1 , второй игрок не знает точного
значения типа первого игрока, но считает, что w1 — случайная величина, распределенная на интервале [wiyw1] c функцией распределения F1(w1\w2) . Аналогично второй игрок точно знает свой тип w2, первый игрок считает, что информационный параметр w2 — случайная величина, распределенная на интервале [w2,W2} c плотностью распределения F2(w2 \ w^ (в случае независимости случайных величин wv w2 функции распределения данных информационных параметров примут вид F1 (w1 \ w2) = F1(w1), F2(w2 \ w1) = F2(w2) ). В итоге получаем следующую задачу с неполной информацией:
g 1 = Mw [H1(xvХ2, w1))} =
w2
= JH1(x1(w1)iХ2^2),w1)dF2(w2) ^ max;
—2
g2 = Mw [H2(x2,x1, w2)\ =
wl
I H2(x2(w2),x^w^), w^dF^wJ ^ max. (9)
Выражения (9) не являются вариационными задачами, так как стратегия о1 не зависит в явном виде от случайного параметра w2, а стратегия о2 не зависит от случайного параметра w1 , причем если функции H1 и H2 представимы как произведение функций
H1 = m1(x1,wx) ■ n1(x2), H2 = m2(x2,w2) ■ n2(x1), то выражения (9) имеют вид
w2
g1 = Mw [H1(X1,Х2,w1))} = m1(x1, w1) Jn1(X2)dF2(w2) ^ max;
J x1 (w1)
—2
g2 = Mw [H2(x2,x1, w2)\ =
wl
= m2(x2,w2) I n^x^dF^w!) ^ max. (10)
J x2(w2)
— I
Соответственно, стратегии игроков в задаче (10) являются стратегиями-константами x1 = x1 е X0, x2 = x2 е X°2.
Таким образом, в рассмотренных нами задачах показан переход от конечномерных стратегий игроков к стратегиям, являющимся элементами функциональных пространств. Рассмотрено введение вектора параметров, имеющего случайную природу и описывающего информационную обстановку игры, показано влияние данного вектора случайных параметров на асимметрию информированности игроков. Описаны информационные различия Байесовских игр (оптимальные стратегии и нахождение равновесий подробно рассматривается, например в работах [6, 7]) и игр, сводящихся к решению вариационных задач.
Библиографический список
1. Гермейер Ю.Б. Игры с непротивоположными интересами. — М., 1976.
2. Harsany J. Games with incomplete information. Nobel Lecture // Haas School of Business, 1994.
3. Морозов В.В., Сухарев А.Г., Федоров В.В. Исследование операций. — М., 1986.
4. Жариков А.В. Равновесие Нэша в игре двух лиц для вариантов информированности игроков // Известия Алт. гос. ун-та. — Барнаул, 2008. — №1(57).
5. Matyunin E.V., Zharikov A.V. Decision Support Problems under Conditions of Information Asymmetry // International Youth Academic Conference. Current issues in modern economics: a fresh look and new solutions. — Tomsk, 2013.
6. Aumann R.J., Heifet A. Incomplete information. Review // Handbook of Game Theory with Economic Applications, 2002. — Vol. 3.
7. Cardaliaguet P., Rainer C. Games with incomplete information in continuous time and for continuous types // Universit'e Paris Dauphine. — 2012.