Научная статья на тему 'Одна неантагонистическая игра поиска с распределением ресурсов'

Одна неантагонистическая игра поиска с распределением ресурсов Текст научной статьи по специальности «Математика»

CC BY
85
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Гарнаев А. Ю., Сидярто Т. П.

Исследована одна неантагонистическая игра поиска двумя игроками спрятанного объекта на целочисленном интервале. Известны ценность объекта и стоимость поиска. В случае одновременного обнаружения объекта игроки делят его между собой. Целью игроков является максимизация ожидаемой прибыли за вычетом затрат. Найдены равновесия по Нэшу.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A non-zero sum resource allocation search game

In this paper a non-zero sum allocation game is investigated. Two players look for an object bidden at the integer interval. The value of the object and the search cost are given. In the case of founding of the object by both players they share its value. The aim of the players is to maximize the expected found value minus search cost.

Текст научной работы на тему «Одна неантагонистическая игра поиска с распределением ресурсов»

УДК 519.8

А. Ю. Гарнаев, Т. П. Сидяртпо

Вестник СПбГУ. Сер. 10, 2006, вып. 1

ОДНА НЕАНТАГОНИСТИЧЕСКАЯ ИГРА ПОИСКА С РАСПРЕДЕЛЕНИЕМ РЕСУРСОВ *)

1. Введение. В данной статье исследована одна неантагонистическая игра поиска объекта, обобщающая задачу, рассмотренную Сакагучи [1].

Имеются два игрока (1 и 2), ищущих’неподвижный объект, спрятанный в одной из п точек целочисленного интервала [1,п], причем игроки знают вероятности р^,г е [1, гг], с которыми объект спрятан в этих точках. Каждая точка г характеризуется двумя положительными параметрами поиска А{ (/*,) такими, что если игрок 1 (2) использует т ресурсов для поиска объекта в точке г, то вероятность обнаружения данного объекта при условии, что он находится в этой точке, равна 1 — ехр(—А,т) (1 — ехр(—Цгт)). Все параметры поиска А,,//*, г € [1,гг], известны обоим игрокам. В распоряжении игрока 1(2) имеется Х(У) ресурсов поиска, которые он может распределять по точкам. Также предполагается, что осуществление поиска связано с некоторыми затратами, а именно, использование г ресурсов обходится С\т (С^т) игроку 1 (2), где С\, С-2 ^ 0. Выигрыш игрока равен 1, если он обнаружит объект, а его противник нет. Здесь 1 может быть интерпретирована как ценность спрятанного объекта. Если ни один из игроков не найдет объект, то их выигрыш равен 0. Если объект выявлен обоими игроками, то игрок 1 получает а игрок 2 получает ^2, где <?1 + </2 ^ 1-

Сакагучи [1] исследовал вариант данной игры в предположении, что Сь = Цк — 0 для к — 1, 2, т. е. он не учитывал стоимость использованных ресурсов, а в случае обнаружения объекта считал, что он не достанется ни одному из игроков. Кроме того, Сакагучи предполагал, что все ресурсы поиска обязательно должны быть использованы игроками. В связи с задачами распределения ресурсов стоит также упомянуть статью Мазалова и Сакагучи [2], в которой был рассмотрен другой аспект, а именно, оптимальное местоположение ресурсов.

Кроучер [3] исследовал антагонистическую игру с распределением ресурсов, моделирующую атаку ракетных шахт и их защиту. Она может быть описана следующим образом. В одной из п точек спрятан объект, причем известны вероятности р;, с которыми объект спрятан в точках. Имеются два игрока: ищущий и прячущий. Ищущий, имея в своем распоряжении X ресурсов, распределяет их х — (х\,... ,хп) по точкам, где Х{ = X, с целью найти спрятанный объект. Прячущий, имея в своем распоряжении У ресурсов, распределяет их у — (у 1,..., уп) но точкам, где у{ = У, чтобы

препятствовать обнаружению этого объекта. Предполагается, что вероятность обнаружения объекта равна £^1(1 — ехр(—А,^)) ехр(—АЧУг) где А* и щ - параметры поиска и защиты в точке г, г Е [1, п\. Цель ищущего - максимизация вероятности обнаружения указанного объекта. Бастон и Гарнаев [4] исследовали неантагонистический вариант данной игры, учитывающий стоимости поиска Су и защиты С2, а также предполагая, что игроки могут использовать только часть имеющихся в их распоряжении ресурсов. В этой игре целью ищущего игрока является максимизация ожидаемой стоимости найденного объекта (не умаляя общности можно предполагать, что стоимость спрятанного объекта равна 1 за вычетом затрат), а целью защищающегося игрока - минимизация

*) Работа частично финансирована из средств гранта Президента РФ по поддержке ведущих научных школ РФ (№ НШ-2174.2003.1).

© А. Ю. Гарнаев, Т. П. Сидярто, 2006

ожидаемой стоимости найденного объекта за вычетом затрат. Тогда выигрыши ищущего М\ и защищающего М2 игроков равны

Мі(х,у) = -е ХіХі)е ^іУі -

і=1 г=1

п ТІ

Мз(х,у) = ~^2рі{1 - е~ХіХі)е~^іУі - С2 ^2 ї

1=1 i=l

Эта игра использовалась Бастоном и Гарнаевым для моделирования военно-технологического конфликта «Звездные войны», который произошел в 80-е годы XX в. между США и СССР. ‘

2. Формулировка игры. Исследуем следующую неантагонистическую игру с распределением ресурсов.

Имеются два игрока (1 и 2), ищущих неподвижный объект, находящийся в одной из п точек целочисленного интервала [1,гг], причем игроки знают вероятности р^, с которыми объект спрятан в точках i € [1, п]. Кроме того, каждая точка г характеризуется двумя положительными параметрами поиска А, (/лг) для игрока 1 (2) такими, что если игрок 1 (2) использует т ресурсов для поиска объекта в точке i, то вероятность его обнаружения при условии, что он находится в этой точке, равна 1 — ехр(—А^т) (1 — ехр(—11{т)). Все параметры А*,/^, г е [1,гс], известны обоим игрокам. В распоряжении игрока 1(2) имеется X(У) ресурсов поиска, которые он может распределять по точкам. Использование т ресурсов игроками связано с некоторыми финансовыми затратами, а именно, оно обходится С\т (Сгт) игроку 1 (2), где С\, Сг 2? 0. Выигрыш игрока равен 1, если он обнаружит объект, а его противник нет. Здесь 1 может быть интерпретирована как ценность объекта. Если ни один из игроков не найдет объект, то их выигрыш равен 0. Если объект обнаружен обоими игроками, то выигрыш игрока 1 равен </1, а игрока 2 - д2, где ?1 + ^ 1? т. е. в данном случае игроки делят стоимость

найденного объекта и при этом допустима выплата какой-то части стоимости третьей стороне, которая обеспечивает соблюдение правил игры.

Чистые стратегии игрока 1 описываются векторами х — (ж1,... ,хп), где Х{ - ресурсы, размещаемые игроком 1 в точке г, причем

Х{ ^ X, Хі ^ 0 для і — 1,... ,п. (1)

І—1

Чистые стратегии игрока 2 описываются векторами у — {у\,-. ■ ,Уп), где у% - ресурсы, размещаемые игроком 2 в точке г, причем

£:

Ух ^ 0 для г = 1,..., п. (2)

г=1

Пусть 51 и - множества всех чистых стратегий игроков. Кроме того, пусть М\ и М2 - выигрыши игроков при условии, что они используют чистые стратегии х и у. Тогда

Мі(х,у) = £>і(1 - + 51 Х>(1 - е-л‘*')(1 - Є-'“И) - Сі ]ГX,,

і—1 г= 1 г= 1

п п п

М2(Х, у) = £>(1 - Є-™*)е->«« + д2 £Р<(1 - е-Л;*;)(1 ~ Є-™*) ~ С2 £>•

г=1 г= 1 г=1

Будем искать равновесие по Нэшу, т. е. такую пару стратегий (х*,у*) € 51 х 5г, что

М\(х,у*) ^ М\(х*,у*) для любого ж € 51,

М2(х* ,у) ^ М2(х*,у*) для любого 1/ 6 52.

3. Решение игры. В силу вогнутости М\{х,у) по х при фиксированном у и М2(х,у) по у при фиксированном х из теоремы Куна-Таккера (см. [5]) получаем утверждение, представляющее необходимое и достаточное условие того, что пара стратегий (х*,у*) является равновесием по Нэшу.

Теорема 1. Пара стратегий (х*,у*) является равновесием по Нэшу тогда и только тогда, когда существуют неотрицательные а и /3 такие, что

£-м1(*',у')=р,Ке-’"’Чя1 + - сг

где

( ^ 0, если £”=1 х) =

|=0, если £”_1 х] < X

и

-~—М2(х*,у*) = Р№в~ту* + (1 -Ч2)е~Х{Х<) ~ С2

ОУг

где

|^0, если £”=1 у* = У,

|=0, если Х)"=1 < У-

Опишем структуру оптимальных стратегий игроков.

Лемма 1. Предположим, что (х*,у*) - равновесие по Нэшу. Пусть -А(а) = а + С\, В(0) = 0 + С2- Тогда

(г) если х* = 0 и у* = 0, то

Рг\г ^ Л (а) и РгШ ^ £(/?),

(й) если х* > 0 иу* = 0, то

< = Т1пТГ7 4 Л(а)<р,\1, и/ч<й + £(1-<вИ(<*КВ(Л,

А* А*

(ш) если х* — 0 и у* > 0, то

и Р<Р№> Р^1 + “(1 -91)Я(£) ^ -А(а), т в(р) щ

(гг?) если х* > 0 и у* > 0, то

х- = 1 ь____________________________,

1 —9192 — ©191 + П(в2 + \/^Л

♦ _ _1_ 1п___________2д291__________

* Мг —91^2 + 01^1 —

если ж* > 0, если ж* =0,

= /3, если у* > 0, ^ /3, если у* = 0,

(3)

(4)

здесь .

А = 9192 (9192 + 2(<?2^г + 91 ©<)) + (<?2^г- - 91 ©г)5

Л(а) < РгХи В{/3) < Ргт, В(Р) < рщт + — (1 - ®)Л(а),

Л*

А(а) < рЖд: 1 + —(1 - Ч\)В{Р),

где д = 1 - 9 и = А(а)/(р.Л{); 0* = В{р)Црцн).

Доказательство. (1) непосредственно следует из (3) и (4) при ж* = у* = 0. (11) Предположим, что х? > 0 и у* = 0. Тогда из (3) вытекает, что

р^е~х<х< = Л(а).

Таким образом, ргХ{ > а и

* 1 . Рг>^1

X; = — 1П

А« А(а)' Потому из (4) имеем

рщ{е ^У<(Я2 + (1 - дг)е Х<х<) = рЩгЯ2 + -^(1 - ъ)А(а) ^ Л09),

что и доказывает (II).

Случай (111) может быть доказан аналогично (и).

(1у) Пусть х* > 0 и у* > 0. Тогда из (3) и (4) вытекает, что

р^е~Х{Х* (^1 + (1 - Я1)е~^у<) = А(а), рцце~1**у* (д2 + (1 - Я2)е~Х{Х<) = В(/3).

Эта система уравнений равносильна следующей:

¥>*(91 + (1 - 91М) = ^г, ЫЯ2 + (1 - дг)^) = 01,

где

Поэтому

у?» = е~х‘х<, гр1 = е~^у<.

~ 9291^г = 92 «г - ?10г 9291 ^ + (9291 + «*92 - 0г91 ~ ©*91 = О

ИЛИ

QlQ2^Pi + (9291 - «г92 + 0г91)9г “ «г92 = 0.

В силу ТОГО, ЧТО 1/>г > 0 И <£»* > 0, имеем

-9192 - 0г91 + Пг92 + \А[192(9192 + + 91 ©г)) + (92«г ~ 91 ©г)2

'Фг =

29192

-9192 + 0191 - «г92 + \/9192(9192 + 2(д2«г + 91©г)) + (92«г ~ 91©г)

4>х = ------------------------------------------~----=------------------------------------------•

29192

Более того, так как ^ < 1 и ^ < 1, то

<?2 + «г(1 - 92) ~ ©г > О, 91 + 0,(1 - 91) - О, > О,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

что и завершает доказательство (1у) и леммы. .

Для пары неотрицательных чисел (а,(3) определим следующие четыре подмножества интервала [1, п\:

Лю = Лю (<*,/?) ={г € [1,гг] : р{А(а), рщ{ ^ В((3)},

Ло = До(а>^) ={г € [1,гг] : Л(а) С^А*, РгЫ + ^д2Л.(а:) ^ 5(/3)},

Лп = /<ц(а,0) ={* € [1,п] : В(0) < рщи РгХгШ + —^ВЦЗ) ^ Л(а)},

Мг

/и =1п(а,Р) ={* € [1,гг] : А(а) < р*А*, В(/3) < рщи

РШЛ2 + ^92А(а) > В09), РгАг91 + —ЧхВЦЗ) > Л(а)}.

А* //г

В силу теоремы 1 пара стратегий (х*,у*), являющаяся кандидатом на то, чтобы быть равновесием по Нэшу, может быть рассмотрена как пара (х*(а, 0), у*(а, (3)) — (х(а,/3),у(а,/3)), где х(а,/3) и у(а,/3) - функции, описанные в лемме 1 (1)-(1у) и зависящие от параметров а и /?, причем значения этих параметров определяются условиями (1)-(4). Тогда лемма 1 в терминах множеств I может быть переформулирована. Лемма 2. Пусть (х*(а,/3),у*(а,13)) является равновесием по Нэшу, тогда (г) если I Е 1оо, то х* = у* = О,

(и) если г € 1ю, то х* > О = у*,

(иг) если г € /01, то у* > 0 — х*,

(ги) если i е 1ц, то х* > 0 и у* > 0.

Очевидно, что отрезок [1, п] разбивается на четыре непересекающихся подмножеств Лхь До) /01 и Лъ на каждом из которых компоненты стратегий (х*(а,(3),у*(а,/3)) определены единственным образом. В системе координат (р\,ри) для фиксированной пары (а, (3) эти подмножества могут быть представлены, как показано на рис. 1. Пусть

К(а,р)= V 1ь^-+ V 1ш-----------------------------------------------т=.

\г А(а) “А, -9192 - ©г<?1 + 0;д2 +

1^110 1ЫИ

Я(а,/9)= V -1п^±+ V 11п--------------------------------------------т=.

•“ Ш В(/3) Щ -9!92 + 0^9! - 0,92 + х/А

гЕ^01 ^с-/ц

Следующая теорема непосредственно следует из теоремы 1 и лемм 1 и 2, представляющих конструктивное описание равновесия по Нэшу.

Теорема 2. Пусть (х*,у*) является равновесием по Нэшу. Тогда (х*,у*) — (х(а,(3),у{а,/3)), где а и /3 определяются в (1), (2) из условия, что К(а,/3) ^ X и

Я(а,ЖУ. '

Из теоремы 2 получается следствие, говорящее о том, что если стоимость поиска достаточно велика, то игроку не имеет смысл осуществлять поиск.

Следствие 1. Если тах{р.;Аг} ^ С\, тогда а = 0 и х* — (0, ...,0); если тах{р^;} ^ С2, тогда /3 = 0 и у* = (0,..., 0).

Рис. 1. Подмножества loo, ho, Ioi и 1ц.

4. Примеры. Рассмотрим численные примеры нахождения оптимальных стратегий. Пусть А = ц = (0,1; 0,4; 0,3), X = Y = 10, р = (0,3; 0, 4; 0,3) и С\ = С2 — О, т. е. игроки обладают равными возможностями и отсутствует необходимость платить за поиск. Пусть qi = 0,2 и q2 — 0,8, т. е. игроки могут рассчитывать на разные доли при дележе. Тогда а — 0,01715, /3 — 0,02382 с вектором выигрышей (0,2968; 0,4766) и х* = (4,35; 2,87; 2,78), у* — (1,58; 4,39; 4,03) являются оптимальными стратегиями. Таким образом, при разных долях игроки пытаются действовать асимметрично. Пусть Qi — <?2 = 1/2, т. е. игроки могут рассчитывать на одинаковые доли в случае дележа. Тогда их оптимальные стратегии симметричны, а именно, а — (3 = 0,0206 с вектором платежей (0,3835; 0,3835) и оптимальными стратегиями х* = у* = (2,55; 3,87; 3,58).

Пусть игроки имеют разные ресурсы, а именно, Л = ц = (0,1;0,4;0,3), р = (0,3; 0,4; 0,3), тогда игрок 2 может рассчитывать на большую долю, но игрок 1 имеет большие ресурсы. Например, q\ = 0,2 и q2 = 0,8, X — 40 и Y = 10. Тогда а = 0,00259, 3 — 0,021386 с вектором выигрышей (0,1444; 0,8214) и оптимальными стратегиями х* = (23,4; 7,55; 9,05) и у* — (1,4; 4,5; 4,1). Этот удивительный факт, что игрок 1, несмотря на большие ресурсы, получает меньше, вызван тем, что игрок 2 имеет определенное преимущество, несмотря на меньшие ресурсы, а именно он выигрывает в двух случаях - или сам найдет объект, или объект найдут оба, в то время как выигрышной ситуацией для игрока 1 является ситуация, при которой только он обнаружит объект.

5. Заключение. Сакагучи [1] исследовал неантагонистическую игру поиска с распределением ресурсов в предположении, что qi — q2 — С\ = С2 — 0. Он показал, что оптимальные стратегии определяются следующими соотношениями:

(i) если г G loo, то х* - у* = 0,

(и) если г е ho U 1ц, то х* > 0 — у*,

Рис. 2. Подмножества іоо, ііо> Ли и /ц.

(ііі) если г Є Ли и Лі, то у* > 0 = ж*,

(іу) если г Є /ц, то х* > 0 и у* > О,

где

Лю = {* Є [1,п] : Рі < а/Аі, р{ ^ /?/М>

Ло = {г Є [1, л] : а <р{/Хь ща < А*/?},

Л)і = {г Є [1, п] : /3 < РіЦі, Хф ^ /г*аг},

Лі ={*Є [1, го] : а/іріХі) = Р/ІРіЦі) < 1}

и

* 1 і РіХі . т

х{ — — 1п------ при г Є /ю,

А і а

* 1 1 РіЦі ■ г т

Уі = -1п — при гЄЛп,

щ /З

> * і * і РіХі , РіЩ

ХіХі + ЩУі - 1п — = 1п —

* ^ 1 РіХі * Л

или Х{ = — 1п------------, Уі = 0,

Лі Ос

* л * 1 1 РіЦі ■ т

или а^=0, у і = 1п при г Є /ц.

№і Р

В системе координат (рХ,рі/) для фиксированной пары (а, /3) подмножества Лхъ ДО) /оі и Іц имеют вид, показанный на рис. 2. Очевидно, что в этом случае множество Іц вырождается в линию, на которой оптимальные стратегии определяются неоднозначно.

Как показано в данной статье, введение естественного обобщающего предположения, разрешающего игрокам делить выигрыш при его одновременном обнаружении, позволяет избежать неопределенности в определении оптимальных стратегий, которую мы видим у Сакагучи.

Summary

Garnaev A. Y., Szigyarto Т. P. A non-zero sum resource allocation search game.

In this paper a non-zero sum allocation game is investigated. Two players look for an object hidden at the integer interval. The value of the object and the search cost are given. In the case of founding of the object by both players they share its value. The aim of the players is to maximize the expected found value minus search cost.

Литература

1. Sakaguchi M. A two-sided resource allocation game in search for a stationary object // Math. Japonica. 1987. Vol. 32. P. 979-991.

2. Mazalov V., Sakaguchi M. Location game on the plane // Intern. Game Theory Rev. 2003. Vol. 5. P. 13-25.

3. Croucher J.S. Application of the fundamental theorem of game to an example concerning antiballistic missle defence // Naval Research Logistics Quarterly. 1975. Vol. 22. P. 197-203.

4. Baston V. J., Garnaev A. Y. A search game with a protector // Naval Research Logistics. 2000. Vol. 47. P. 85-96.

5. Mangasarian O. L. Nonlinear programming. New York: McGraw-Hill, 1969. 220 p.

Статья поступила в редакцию 24 ноября 2005 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.