Научная статья на тему 'Применение принципа сжатых отображений в задаче управления игры двух лиц при разной информированности игроков'

Применение принципа сжатых отображений в задаче управления игры двух лиц при разной информированности игроков Текст научной статьи по специальности «Математика»

CC BY
158
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение принципа сжатых отображений в задаче управления игры двух лиц при разной информированности игроков»

УДК 519.862.8

А.В. Жариков

Применение принципа сжатых отображений

в задаче управления игры двух лиц

при разной информированности игроков

В данной статье рассматривается применение принципа сжатых отображений при решении задачи управления игры двух лиц при разной информированности игроков.

Рассмотрим оператор управления состояниями субъекта, который функционирует в динамической случайной среде. Управление проводится с использованием принципа осреднения входных переменных [2]. Предположим, что управление выбрано из условий максимизации некоторого критерия.

Пусть x = (x1, x2,...,xn) - случайный вектор с функцией распределения Ф = Ф(x1,...,xn), а множество S = {1,2,.,п} - индексы всех компонент вектора x; множество S. с S - совокупность индексов, определяющих информационную структуру г-й управляющей переменной, г = 1,2,., т. Введём также вектор управления (стратегии

игроков) V = (у1,у2,.,ут), где V. = п.(<1), ^ = (х}-),

{е! = {1,2,.,т}, I - множество игроков. Таким образом, задача примет вид:

J1 = Ы[^. (х, V(йг))] ® тах, ге!, (1)

где символ М[-] означает операцию вычисления математического ожидания, функционал Р.(х,п) -критерий максимизации, J¡ - интегральный выигрыш г-го игрока. Формализация условий разной информированности приводит к равенству нулю частной производной по соответствующей переменной [7]:

дп1 (4 ) 0

— - °' (2)

Рассмотрим задачу (1) при п = т = 2. Тогда задача примет вид:

M[Fj(х, y, u (y), v(х))] ® max,

U

M[F2(х, y, u(y), v(х))] ® max

при условиях

^ = o, ^ = o.

дх dy

(3)

(4)

Возьмём конкретный вид функционалов

Fj = (ä{u, v, х, y\ (u v, х, y)) , F2 = (b(u>vхy)> iU’v’хy)) , где A = AT = (аг] )4x4 , B = bT = (bij )4x4, т.е. Fv F2 -

квадратичные формы с переменными u, v, x, y. Пусть информационный вектор (x, y) распределён на квадрате [а, Ь]х[а, Ь] с плотностью Ф(х, у). Считаем, что Ф(х, у) обладает стандартными свойствами плотности распределения.

Задача (3) при условиях (4) примет вид

b b

J = JJ(auu2 + 2a12uv + 2al3ux +... + a44 y2)

a a

Ф(x, y)dxdy ® max,

UGU

bb

J2 = JJ (b11 u 2 + 2b12uv + 2b13ux +... + b44 y2) (5)

aa

Ф(x,y)dxdy ® max.

veV

Задача (3) при условиях (4), по сути, является игрой двух лиц, где J (u,v), J (u,v) - функции выигрыша, а u, v - стратегии игроков. Множество допустимых стратегий U, V будут произведением пространств С:([а, Ь]х[ а, Ь]) х С:([а, Ь]х[ а, Ь]). Нахождение решения игры зависит от понимания рациональности и оптимальности поведения игроков.

Предположим, что игроки имеют непротивоположные интересы. Одной из распространённых концепций решения некооперативных игр является ситуация равновесия по Нэшу [6, 7, 9], суть которой заключается в невозможности увеличения выигрыша игрока при его отклонении от данного равновесия.

Определение 1. Ситуация x* = (x*, x*,..., x*,) называется ситуацией равновесия по Нэшу, если для всех xi еXi,i е{1,...,п} справедливо неравен-

К1 (х1 , х2,..., х„,) > К1 (х] ,..., х,-_1> х, хг+1,...х„).

Для задачи (5) определение 1 представится в виде неравенств

J1(u,v*)<J1(u*,v*),

J2(u,v*)<J2(u*,v*), где u*, V* - ситуация равновесия по Нэшу.

В [3, 4] был найден конкретный вид решения задачи (5), (4) в концепции равновесии по Нэшу, когда входные переменные х и у являлись независимыми случайными величинами.

Наряду со случаем независимых х и у можно рассматривать и общий случай зависимости

55

v

х и у. Необходимые условия существования решений, согласно [1, 3, 4], при этом не изменятся. Тогда нахождение п и V будет зависеть от разрешимости системы интегральных уравнений

a11u Jf( x, y)dx + a12 J v( x)F( x, y)dx +

a a

b b

+ a13 JxF( x,d)dx + a.uj J F(x,y)dx = 0,

a a

b b

b22vJ®( x,y)dy + bnJu{y)( (x,y)dy +

+ b23 xjF( x, y)dJ + b24 J yF( x, y)dy = 0.

(6)

Вопрос существования решения (6) не является очевидным и требует некоторых пояснений.

Для начала определим тип данной системы. Путём несложных преобразований система (6) сводится к виду

О

u( У) + ¿J v( x) K-( x, y)dx = f-( y),

a

b

v(x) + lJ4 (J) K2( x, J)dJ = f2( x)

a

b

4 (у) + я J v( x) K- (x, y)dx = f- (y),

a

b

v(J) + ^J4 (x)K2 (У, x)dx = f2(УX

(6')

Ь22Ф( x, y) a110(x, y)

где K-(xy) =--------b2-----L----, K2(x,y) =-----11 V ,y}

b21 J Ф( x, y)dx a12 J Ф( x, y)dy

a a

b b -a13 JxF(x,y)dx - a14yJf(x,y)dx

f-( y) =-----:

a11 Jf ( x, y) dx

a

b b -b23 xJF( x, y)dy - b24 J уФ( x, y)dy

■ f2( x) =

b22 Jf( x, y)dy

я = OlL . Al a11 b22

В ведём обозначения: K(x,=) =

K-(x, y) 0

0 *2(y, x)

-() _Гм (у)'1 - () -I у1(у) 1

Ф(у)-1 ^(у) I, Vх(у) I у (у) I, тогда система (6') может быть записана в векторной форме

j(y) - ¿JK(x, y)j(x)dx = y(y).

(7)

Уравнение (7) является уравнением Фред-гольма второго рода, записанное в векторной форме.

Согласно существующей теории, можно выделить несколько путей для доказательства условий существования и единственности решения интегральных уравнений.

Принцип сжатых отображений. Большое достоинство этого принципа состоит в том, что он не только гарантирует при определённых условиях однозначную разрешимость уравнения, но и может служить для получения приближённых решений [5, 6, 10].

Пусть х есть пространство С([а, Ь], R2). Предположим, что ядро K(x, у) непрерывно в замкнутом квадрате D = {(x, y):(x, y) е [a, b] х х [a,b],a,b е R} и, следовательно, ограничено на нём, т.е. ||^(x, y)/|< М||/||_. V/ е X, где M - норма оператора К(х, у). Тогда ||^| = sup ||.Kx||X =

llxlL =1 X

= sup K1x1, K2 x2

, где x - непрерывная на квад-

рате D вектор-функция. Напомним, что

Vx-2(x, y) + x22(x, y)

. Зафиксируем Xj

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x = max

X x, y

и х2, в силу непрерывности х на прямоугольнике Б. Тогда условие ||х||х= 1 примет вид х12 +х22 -1. Таким образом,

\\К\ |= sup ((K.x^K^,) _. =

x.2 + x22 =1 X

= sup I max

x.2 + x2 =1V x>y

-v/k-2( x, y) x-2 + K22( y, x) x

= sup I max

x.2 + x2 =lV xy

V K-2 (x, y) x-2 + Kl (y, x)(- - x-2)

Данное преобразование допустимо в силу свойств Ф(х, у).

= max

x. j

{I K-( x, У ^,1K 2 (J, x)|}

О

О

||K|| = max {I K-( x, y)|,| K,( y, x) j}.

(8)

Полученное выражение (8) опирается на следующую лемму.

Лемма 1. Пусть f(x, у) определена на множествах х - (х1,х2) е К1,у - (у1,у2) е К2 , где К1, К2 -

и

56

компакты в R2. Тогда supsup /(x,y) =

xeK1 yeK2

= supsup / (x, y).

yeK2 xeK1

Доказательство. Рассмотрим функцию g (y) = sup / (x, y). Очевидно, что f(x, у)является

xeK,

равномерно непрерывной функцией, т.к. К1, К2 -компакты в R2. Покажем, что д(у) является непрерывной функцией по у. Запишем условие равномерной непрерывности f (x, у):

Ve >0,35 >0:|x'-x"| <5,y'-y’\<8 /(x',y')-/(x\y’)| <e/2

для любых x', x'' , у’, у’' . Пусть, x = x'' = x', тогда неравенство перепишется в виде

\.f(xy') - У(xy " ^ < e / 2 ^ У(xy " ) - e / 2 < У(xy ') <

< /(x, y") + e /2. Возьмем от обеих частей sup, име-

xeK!

ем g(y " ) - e /2 < g(y) < g(y") + e /2 »|g(y ') - g(y ")| <

< e/2< e. Из последнего неравенства следует непрерывность функции д, значит 3supg(y) =

y

= supsup/(x,y) = N. Обозначим через M = sup /(x,y).

yeK2 xeK, x^eK^K

Ясно, что M > /(x,y) ^ M > N. По определению M - e< /(x,y), следовательно, M - e< /(x,y) <

< sup/(x,y) < supsup/(x,y) = N ^M < N. Из пос-

xeK1 yeK2 xeK1

леднего неравенства следует, что M = N. Аналогично показывается, что sup / (x, y) =

x, yeKj хK 2

= sup sup /(x, y). Лемма доказана.

xeKj yeK2

Пусть y(x)e X. Тогда решение (7) будем искать среди элементов пространства X. При этом, как и в одномерном случае, решением интегрального уравнения (7) будем называть произвольную функцию ф0(у)е X , подстановка которой в уравнение (7) обращает его в истинное тождество для любого уе[а,Ь]:

jo(J) = AJ K (x У) jo( x)dx + У(У).

(9)

Ясно, что при 1 = 0 уравнение (9) имеет единственное непрерывное решение ф0(у)= -(у).

Покажем, что уравнение (7) однозначно разрешимо и при всех 1, достаточно малых по абсолютной величине. Введём следующий оператор А ф , определённый в пространстве X ,

Aj ° AJK(x,y)j(x)dx + y(y)

(10)

Оператор (10) переводит функцию j(y)e X в некоторую функцию j(y), определённую на

том же отрезке [а, Ь]. Тогда существование решения ф0(у) уравнения (7) сводится к вопросу

о наличии у оператора А неподвижной точки, т.е. такой функции ф0(у), которая при действии

оператором переходит в саму себя: Аф0 = ф0.

Покажем, что оператор А действует из полного пространства X опять в X, т.е. если g(y) = Аф(у) , где ф(у) єХ , то и g(y) єХ .

Для этого возьмём произвольную точку у є [а, Ь], и пусть Ау - любое, лишь бы выполнялось у + Ау є [а, Ь]. Имеем

g (У + Ау) - g (y) X =

K (x, у + Dy)j( x)dx -

+ У (У + Ay) - A J K (x, у) j (x)dx -

a

b

-y (у)|| X £ AlJll K (x, У + Ay) - K (x, у )|| D || j( x)|| X dx -

+ ||y(y + Ay)-y (j)||x.

(11)

Из условия ц (х) е С ([а, Ь], К2) следует, что для любого е< 0, 351 > 0 такое, что

||ц(у + Ау)-ц(у)||х< - при "Ау :|Ду| < 51. (12)

Ядро К(х, у) непрерывно в замкнутом квадрате Б и, значит, равномерно непрерывно в Б. Следовательно, по выбранному е > 0 найдем 52 > 0 такое, что

||K (x, у + Ау1 - K (x,.

(13)

2|ф(уЦх (Ь -а)\1

при |Ау| < 52 и любом х е [а, Ь].

Возьмём 5 - т1и{51,52} . Тогда при "Ау таких, что |Ду| > 5 , будут одновременно выполняться неравенства (12) и (13) и, учитывая неравенство (11), получим,

||я(у + Ау) -g(у)||х <е"Ау :|Ау| <5 ,

которое и доказывает непрерывность функции д(у) в любой точке у е [а, Ь].

Итак,

С ([а, Ь], К 2) ——® С ([а, Ь], К 2).

Выясним теперь, при каких условиях оператор А будет сжимающим. Для этого определим рассто-

a

a

a

57

яние между двумя элементами х, как норму разности данных элементов, т.е. "х,у е X - С([а,Ь],К2),

р(х,у) -||х - у||х . Данное определение уместно

в силу нормированности пространства С([а, Ь], И2). Имеем

р(jЛщ) = I\Лj - Яj||s =

b b

lj K(x,y)j1(x)dx - lj K(x,y)j2(x)dx =

a a s

b

lj K ( x, y)(j( x) - j2( x))dx <

a s

< I^M (b - a)| ( x) - j2( x)|| s = |Я|М (b - a')p(j1,j2).

Перепишем данное неравенство в следующем виде:

р(Аф, АФ2) < 11м (Ь - а)р(ф1,ф2), (14)

I -1 < 1 _

откуда видно, что при |-| < ^ф - а) оператор А

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

будет сжимающим.

Из принципа сжатых отображений заключаем, что для любого 1 такого, что

—|М(Ь - а) < 1, (15)

уравнение Фредгольма в векторной форме (7) с непрерывным ядром К(х, у) и непрерывным свободным членом ц(у) имеет единственное решение. С другой стороны, из уравнения (9) следует, что

Il M (b - a) < 1-

û (b - a)max

x, y

a12F ( x, y ) b12F ( x y)

b a11 Jf( x, y )dx è a b b^22 Jf ( x, y)dy a 0

< 1. (15')

Последовательные приближения j0(y),..., jn (y),... к этому решению определяются из соот-

ношении

Фп+1 (у) = 11К (е, у )Фп (е^е + у (у), п = 0,1,...,

а

где в качестве ф0(у) можно взять любую непрерывную вектор-функцию на [а, Ь]. Данный итерационный процесс является сходящимся к некоторой функции, которая и будет являться решением уравнения (9).

Также можно найти решение, используя резольвенту ядра. Для этого приведём вспомогательные сведения.

Теорема 1. Пусть А - линейный ограниченный оператор, отображающий банахово пространство Е в себя, и ||А|| < q < 1. Тогда оператор (I + А),

где I - единичный оператор, имеет обратный линейный ограниченный оператор.

Доказательство теоремы можно найти, например в работе [6]. В результате получим, что (I + А )-1 - линейный ограниченный оператор. При этом

(I + Л)-1 = I - А + А2 - А3 +... + (-1)п Ап +... (16) Применим результат теоремы к интегральному уравнению (9). Положим

Aj ° ljK(x,y)j(x)dx

Тогда уравнение (9) перепишем в виде Ф = ІАф +у ^ (I - ІА)ф =у. (17)

Используя приведённую теорему, получаем,

что если ЦА|| < 1, то уравнение (9) имеет единственное решение, которое определяется равенством

Ф = (I -1А )-1у = У +1 Ау +12 А V + ■

+ Х3Я3У +... + 1пАпу +... (18)

Полученный нами ряд называется рядом Неймана.

Выясним, при каких значениях 1ряд (18) сходится. Для этого рассмотрим неравенство

ИА|| < 1. Учитывая изложенный выше результат (8) оценки нормы ядра К, получим условие (15). Далее, будем считать, что выполняется условие (15) для 1. Выясним, что представляют в рассматриваем случае степени оператора А.

Имеем Л y Л(Яу) jK(t,s)

j K (s,T)y(t)dT

ds =

=j

y(t)ds

j K (t, s)K (s,t)dt

a _

b

Обозначим j K (t, s) K (s,t)hds = K2(t,t)h, где вектор

Ъ является пробным вектором из С([а,Ь], И2). Оператор К2({, т) называется повторным ядром, или второй итерацией ядра К({, s).

Следовательно, ЯУ ° jK2(x,y)y(x)dx.

Ана-

логично проделывая процедуру для произволь-нои степени оператора, имеем

b

ЛПУ ° jKn (x, y)y(x)dx,

(19)

a

a

a

58

где Кп(х, у) - п-я итерация ядра К(х, у), опреде-

Ь

ляемая формулой Кп(х,у)И -|К(х,т)Кп-1(т,у)Мт .

а

Заметим, что все итерированные ядра непрерывного ядра К(х, у) также непрерывны.

Решение уравнения (7) запишем в следующем виде:

Ь

ф(у) - ц(у) + К1 (х, у)ц(х)йх +... +

а

Ь

+ Кп(х,у)Ц(х)йх +... (20)

а

Причём, данный ряд сходится равномерно при выполнении условия

—М (Ь - а) < 1 О

û (b - a)max

x,y

a12F( x, y ) \ b12F( x у )

b a11 j® ( x, y)dx è a b b22 Jf ( x, y)dy a 0

< 1.

Запишем полученное решение в более компактной форме. Рассмотрим ряд

К[( х, у) + 1К2(х, у) +... + ХпЛКп (х, у) +... (21)

Этот ряд также равномерно сходится при условии —|М (Ь - а) < 1.

Действительно, предположим, что ||^||х -1 , получим

Ь

||К2(х у^| < Ц|К(х,т)||||К(т,у'Цйт <м2(Ь - а),

а

Ь

|К'з(х,у)\\ <|||К(х,т)||||К2(т,у)\\йт <М\Ь - а)2, и вообще,

\\Кп(х,у)|| < |||К(х,т)||||Кп-,(т,у)||йт <Мп(Ь - а)п-1.

а

Отсюда |1п-1Кп(х,у)|| < |1п-1|М"(Ь - а)п-1 -Мдп-1,

где д - —М(Ь - а) < 1.

Таким образом, члены ряда (21) по абсолютной величине не превосходят членов сходящегося

числового ряда

,откуда следует сходимость

ряда (21). Введём новый оператор Я(х, у, 1):

К(е, у,1) = К1(е, у) + 1К2(е, у) +... + 1п-1Кп (е, у) +.... (22) Умножим обе части на у и, интегрируя ряд почленно, получим

Ь

ф(е) =у(е) +К(е, у,1)у(у)^у. (23)

а

В результате приведённых выкладок пришли к существованию решения задачи (5), при ус-

ловии (b - a)max

a12F ( x, y ) \ b12F( x y)

b a11 j® ( x, y)dx è a b b22 jF (x>y)dy a 0

<1.

Сформулируем данный результат в виде утверждения.

Утверждение 1. Решение задачи (5) при условиях (4) в концепции равновесия Нэша существует и единственно, если выполняются условия:

1 а1Р Ь22 < 0.

2. (b - a)max

x,y

a12F( x, y ) b12F( x У )

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

b a11 j® ( x, y)dx è a b ¿22 Jf ( x, y)dy a 0

<1.

n=1

Литература

1. Гельфанд И.М. Вариационное исчисление / И.М. Гельфанд, С.В. Фомин. - М., 1961.

2. Гермейер Ю.Б. Введение в теорию исследования операций. - М., 1973.

3. Жариков А.В. О решении задачи управления в концепции теории игр при разной информированности игроков // Материалы девятой региональной конференции по математике «МАК-2006». - Барнаул, 2006.

4. Жариков А.В. О решении частной задачи управления в случае разной информированности субъектов / А.В. Жариков, А.В. Максимов // Известия Алт-ГУ. - 2006. - №4.

5. Колмогоров А.Н. Элементы теории функций и

функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М., 1968.

6. Краснов М.Л. Интегральные уравнения. (Введение в теорию). - М., 1975.

7. Максимов А.В. Многопользовательские информационные системы: основы теории и методы исследования / А.В. Максимов, Н.М. Оскорбин. - Барнаул, 2005.

8. Оуэн Г. Теория игр. - М., 1971.

9. Петросян Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкович, Е.А. Семина. - М., 1998.

10. Полянин А.Д. Справочник по интегральным уравнениям / А.Д. Полянин, А.В. Манжиров. - М., 2003.

i Надоели баннеры? Вы всегда можете отключить рекламу.