Равновесие Нэша в игре двух лиц для вариантов информированности игроков
УДК 519.862.8
A.B. Жариков
Равновесие Нэша в игре двух лиц для вариантов информированности игроков
Рассматривается оператор управления состояниями объектов, которые функционируют в динамической случайной среде. Управление проводится с использованием принципа осреднения входных переменных [1]. Предполагается, что управление выбирается из условий максимизации некоторого функционала и разной информированности субъектов [2-5].
Особенность постановки данной задачи позволяет свести ее к задаче теории игр. Причем количество игроков соответствует количеству управляемых объектов.
Пусть 5 = {1,2,...,л} - индексы всех компонент вектора х\ 5,5 с 5 - совокупность индексов, определяющих информационную структуру для /-ого игрока, имеющего стратегию и, = и, (с/,), (11 = (х/) ;
/ 6 / = {1,2} - множество игроков.
Условие разной информированности игроков:
du (d ) ox,
где и.
и.:
ди,{х)
дх.
= 0 ,Ü?S,),u,eC2(X)
а'„< 0, VI'. (3)
Задача (2) при условии (1), по сути, является вариационной задачей, тогда соответствующие уравнения Эйлера запишутся в виде
1> ь ( 2 2+л
a a W=1 J=!
Ф(х)с{р, = 0,i£l, (4)
где р, = {ху}^гЛ ,с/, = {х;} ,€Л . Таким образом, задача
нахождения равновесия по Нэшу сводится к решению системы (4) при условии (3).
Далее, решение (4) будем искать для частных случаев информационной структуры игроков и характера входного случайного вектора х.
Множество индексов компонент вектора* 5= {1,2}
и = {х2},^ = {*,}.
Компоненты х[Гх2 - независимые случайные величины с плотностью распределения Ф(лг ) = ^(х,) (р2(х2), тогда оптимальные управления отыскиваются
в классе линейных функций и‘(х2) = (?1хг + ,
Соответственно, функция полезности г-го игрока запишется в виде интегрального выигрыша:
/ =!■■■! Р1(х,и)ф(х)сЬс,1€1,
а а
где х е X и имеет плотность распределения Ф(л).
Следовательно, игровая постановка задачи примет вид:
Л ь
J,(u) = /.../^ (х,м)Ф(х)с£с —> шах,г £ I,
u2(x¡) = Q2д-1+Л2, при условии Вы-
а\ 1 а22
ражения для соответствующих коэффициентов можно найти в [4].
Случайные величины х^2 имеют общую зависимость и функцию распределения Ф(;г1Гх2), тогда (4) можно свести к системе интегральных уравнений Фредгольма 2-го рода
и(у) - Х\К{х, y)u{x)dx = /(.у),
(5)
Рассмотрим случай квадратичной структуры Ft(x,u),iel, т.е. F,(x,u)=(A'(u,x),(u,x)},ieI -
квадратичная форма с матрицей А' = (о£т) t (2+ Таким образом, получаем следующую задачу
Jt(u) = f-f(A'(u,x),(u,x))<$(x)dx—>max,i£/, (2)
а а ’
при условии (1).
Согласно [2], равновесие по Нэшу в задаче (2) при условии (1) существует, если
гДе
а\ \ агг
*,(*,,*,) = а^’хг) , К2(х„хг) = al,J<b(xt,x2)dx,
К2(х,,х2) О
а|,Ф(дг,,дс2)
Мхг)
а12[Ф(х,,л;2)dx2
а
-al3f xfi(x,,x2)dx, - al4x2f Ф(х„х2)сЬ,
A(xi) =
a‘nf Ф(х„х2)ей,
a
A h
~а1гх\ 1ф(хP X2 №2 ~ «24 I х2ф(х<, X2 )dx2
a22f Ф(х„х2)0х1
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
Как показано в [3], решение системы (5) может быть представлено в виде
где Z = (*а.......jr„). Ц,,,.....х2к) — (V|.....V1). -Y = (X,....
О Kt(x,y,z)'
»(■*) = f(x) + jR(x,y,X)f( y)dy,
а
при условии
(¿-а) шах
alj<è(x,.x2)dx,
ап$(х,,х2)
Ф(х,. лг2 )с6г2
(6)
<1, (7)
К2{х,у,:) О
а‘,Ф(д:, V. г)
a,J'P(x,y,:)dx
а1п) Ф(х,у,z)dy
, 2+/»
где Щх,уЛ) = А-,(л-,у) + ДА^2(*,у)+ ... +Я”'1 А'я(.т,>')+... (резольвента ядра К (дг,д2)).
Множество индексов компонент вектора х 5 = {1,...,«} и с/| — {дг^,,сі2 = = А є {1.2,...,и/2}.
Пусть функция распределения входного вектора .г имеет вид
тогда, аналогично пункту 1.1, Оптимальные управления отыскиваются в классе линейных функций
и‘(^,)= £ 0‘/х1 + /?,./ = 1,2, при условии 1.
"!і 4
Коэффициенты £?' находятся из (4).
Компоненты случайного вектора х имеют общую зависимость и функцию распределения <!>(*,,...дл). Уравнения Эйлера (4) примут вид
-¡■■■¡Еа1,х1_^Ф(х,у,:)ск
/,1у.=) = я"я^------------—------------.
аиФ(х,у,:)с1х
а
-/■■■/Еа1х^и1Ф(х,у.1)с/у
/2(*.г) = -*—^------------------------
а2 2/Ф(х.у.г)с/у
Ч
Аналогично случаю 1.2, решение системы (9) представимо в виде
и(х,-) =/{х,2) + \...\Н(х,у,2,\)/{у,:)({у. . (10)
п и
при условии
(b-af шах
а'п/Ф(х,у,:)ііх
а2п/Ф(хгу,:)Лу
<1,
h л а' Ф< г)
и,Ы,)+ I —;-----------Ф,
н. \ и' Ф( t)
МЛ.Н I —;-------:—-<Jp: =
' * ““ Ï S'H-'W;
-f-J E“!,*. . ,Ф(л)</р,
f...J‘P(x)ilp, -/.../‘¿о;,.», , ,Ф(.г)ф, > 1
І /Ф(л)ф,
(8)
Систему (8) можно свести к системе, аналогичной системе (5)
u(y,z)~ I JK(х,у, 2)к(х, г)<& = /(.у, г).
(9)
где Я(х,у,2,Х) = К1(х.у,2)+ ХК2(х,у^)+...+ Я"''А'п(х,у,г)+...
Остальные случаи являются следствиями рассмотренных выше. Следует отметить, что система (4) не всегда может быть сведена к системе интегральных уравнений Фредгольма 2-го рода. Данное преобразование возможно при определенном виде информационной структуры игроков, а именно
{х1:^1,...гх2к,...тхп}, с/2 - {х^,...^к, ••>■*„}
к е {1,2,...,я/2}.
Таким образом, при остальных видах информационной структуры, уравнения (4) не могут быть сведены к системе интегральных уравнений Фредгольма 2-го рода.
Библиографический список
1. Гермейер, Ю.Б. Введение в теорию исследования операций / Ю.Б. Гермейер. - М., 1973.
2. Жариков, A.B. О существовании равновесия по Нэшу в игровой постановке задачи управления при разной информированности субъектов / A.B. Жариков // Материалы десятой региональной конференции по математике. - Барнаул. 2007.
3. Жариков. A.B. Применение принципа сжатых отображений в задаче управления игры двух лиц при разной
информированности игроков / A.B. Жариков // Известия АлтГУ. -2007. -№1.
4. Жариков, A.B. О решении частной задачи управления в случае разной информированности субъектов / A.B. Жариков, A.B. Максимов // Известия АлтГУ. - 2006. - № 1.
5. Максимов, A.B. Многопользовательские информационные системы: основы теории и методы исследования / A.B. Максимов, Н.М. Оскорбин. - Барнаул. 2005.