Научная статья на тему 'Игра наилучшего выбора двух объектов с полной информацией'

Игра наилучшего выбора двух объектов с полной информацией Текст научной статьи по специальности «Теория игр и ее применение в кибернетических системах»

232
18
Поделиться
Ключевые слова
ЗАДАЧА НАИЛУЧШЕГО ВЫБОРА / ОПТИМАЛЬНАЯ СТРАТЕГИЯ / МНОГОШАГОВАЯ ИГРА / МНОГОКРАТНАЯ ОСТАНОВКА

Аннотация научной статьи по кибернетике, автор научной работы — Ивашко Анна Антоновна

Рассматривается игровая модель выбора двух секретарей с полной информацией и критерием оптимальности в виде максимума суммы ожидаемых значений качеств претендентов. Данная задача исследована в двух вариантах: игра m лиц с возможностью отказа претендента от предложения и игра двух лиц с доминирующим игроком. Получены оптимальные стратегии игроков. Доказано, что в задаче с возможностью отказа претендента от предложения выигрыш каждого игрока не зависит от общего числа игроков

We consider a full-information best-choice game in which each player wants to hire two secretaries. The aim of a player is to maximize the sum of expected applicant' quality values. Two models are considered: m-person best-choice game with the possibility for an applicant to refuse an offer and two-person best-choice game with dominant player. Optimal strategies are obtained. We prove that in the best-choice game with the possibility for an applicant to refuse an offer the players' payoffs don't depend on the total number of players in the game.

Текст научной работы на тему «Игра наилучшего выбора двух объектов с полной информацией»

УДК 519.833 ББК 22.18

ИГРА НАИЛУЧШЕГО ВЫБОРА ДВУХ ОБЪЕКТОВ С ПОЛНОЙ ИНФОРМАЦИЕЙ 1 2

Ивашко А. А. 3

(Учреждение Российской академии наук Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск)

Рассматривается игровая модель выбора двух секретарей с полной информацией и критерием оптимальности в виде максимума суммы ожидаемых значений качеств претендентов. Данная задача исследована в двух вариантах: игра т лиц с возможностью отказа претендента от предложения и игра двух лиц с доминирующим игроком. Получены оптимальные стратегии игроков. Доказано, что в задаче с возможностью отказа претендента от предложения выигрыш каждого игрока не зависит от общего числа игроков.

Ключевые слова: задача наилучшего выбора, оптимальная стратегия, многошаговая игра, многократная остановка..

Введение

В данной работе рассматривается игровая модель выбора двух секретарей в двух вариантах: игра т лиц с возможностью

1 Работа выполнена при поддержке гранта РФФИ (проект 08-01-98801-р-север-а) и гранта ОМН РАН (программа "Математические и алгоритмические проблемы информационных систем нового поколения").

2 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. №3».

3 Анна Антоновна Ивашко, кандидат физико-математических наук, (afalco@krc.karelia.ru).

270

отказа претендента от предложения и игра двух лиц с доминирующим игроком.

Пусть имеется т фирм, каждая из которых хочет нанять на работу двух секретарей. Всего имеется N претендентов на свободное место, и качество каждого определяется равномерно распределенной на отрезке [0, 1] случайной величиной. Директора фирм (игроки) по очереди беседуют с каждым претендентом и после этого выносят решение принять его на место секретаря или отвергнуть. Если ^’-ый игрок решает предложить претенденту работу, то претендент соглашается принять предложение с вероятностью р^, ] = 1, 2,...,т, р\ + р2 +... + рт ^ 1. Если ]-ый игрок принимает двух секретарей, то он выходит из игры. При этом его выигрыш равен сумме значений качеств выбранных секретарей. Если все игроки отвергают текущего претендента, то рассматривается следующий, причем, отвергнув претендента, к нему нельзя будет вернуться в дальнейшем. Если фирма не приняла ни одного секретаря, то она терпит убытки С, С € [0,1]. Каждый игрок стремится максимизировать свой выигрыш.

Во второй части статьи рассматривается постановка задачи с двумя игроками, каждый из которых хочет выбрать двух секретарей из множества N претендентов. Исследуется вариант задачи, в которой один из игроков имеет преимущество при принятии претендента.

Данная задача относится к классу задач наилучшего выбора, исследуемых теорией оптимальной остановки и теорией игр. В зависимости от имеющейся у наблюдателя информации о значениях качеств поступающих объектов различают задачи с обсутствием информации, частичной и полной информацией. Неигровые постановки задачи наилучшего выбора двух объектов с различной информированностью о значениях качества поступающих объектов были рассмотрены в работах [2, 3, 5, 10]. Игровые задачи, в которых необходимо выбрать одного секретаря исследованы в [1, 7, 8, 11, 13, 14, 16]. Постановки с возможностью отказа претендента от предложения рассмотрены в работах [4, 9, 15, 17]. В работе [12] решена задача с арбитром, в которой два игрока хотят

271

совместно выбрать двух секретарей.

1. Игра т лиц наилучшего выбора одного секретаря с возможностью отказа от предложения

Имеется т фирм, каждая из которых хочет нанять секретаря из множества N претендентов. Качество каждого претендента — случайная величина, равномерно распределенная на отрезке [0,1]. Директора фирм (игроки) по очереди беседуют с каждым претендентом, и после этого выносят решение принять его на место секретаря или отвергнуть. Если ^’-ый игрок решает предложить претенденту работу, то претендент соглашается принять предложение с вероятностью р-, ] = 1, 2,...,т, р\ +р2+...+рт ^ 1.Если ] -ый игрок принимает претендента, то он выходит из игры. При этом его выигрыш равен ожидаемому среднему значению качества выбранного секретаря. Если все игроки отвергают текущего претендента, то рассматривается следующий, причем, отвергнув претендента, к нему нельзя будет вернуться в дальнейшем. Если фирма не приняла секретаря, то она терпит убытки С, С € [0,1]. Каждый игрок стремится максимизировать свой выигрыш.

В работе [9] был исследован сценарий выбора одного секретаря для одного и двух игроков. В случае с одним игроком каждый претендент имеет качество х, которое определяется равномерно распределенной на отрезке [0, 1] случайной величиной. Вероятность того, что претендент согласится принять предложение равна р, р ^ 1. Тогда р = 1 — р есть вероятность отказа от предложения. Если на шаге г игрок отказывает претенденту, то он переходит к собеседованию с (г + 1)-ым претендентом. Обозначим ^(р) - ожидаемый выигрыш игрока на шаге г , г = 1, 2,..., N.

Если г = N, то игрок должен предложить претенденту работу независимо от его качества, так как в противном случае он потерпит убытки. Тогда, учитывая, что значение качества равно-

272

Управление в социальных и экономических системах мерно распределено на [0, 1], получим

1 1

У px dx + J p(—C )dx = p — pC.

0 0

На шаге i игрок примет текущего претендента с качеством х, тогда и только тогда, когда х ^ v1+1(p). Следовательно,

vi+i(p) 1

Vi(p) = / V+1 (p) dx + / (px + pv+^p)) dx.

0 v1+i(p)

Получим выражение для вычисления выигрыша игрока

(1) v1(p) = p (1—Vi+1 (p))2 +vi+1(p),v1+1 (p) = —C,i = ^ 2,...,N. Если на каком-нибудь шаге vi1+1(p) < 0, то

1

V1 (p) = J (px + ^v1+1(p))dx = 2 + pv+^p).

0

Далее будем рассматривать случай, когда все функции выигрыша неорицательны, т. е. при 0 ^ C ^ 2(1-Р).

Рассмотрим случай двух игроков. Вероятность того, что претендент согласится принять предложение игрока j, равна pj, где j = 1, 2, p1 + p2 ^ 1, pj = 1 — pj.

Обозначим выигрыш j-го игрока на i-ом шаге в случае двух игроков v2,j, j = 1, 2, i = 1,..., N. Заметим, что vNj = Vv(pj),j =

1, 2, так как каждый игрок заинтересован принять последнего претендента.

Пусть р1 ^ р2, тогда V2,1 ^ V2,2. Стратегия «принять» доминирует стратегию «отклонить» для игрока о', о' = 1, 2 тогда и

\ 2,]

только тогда, когда х ^ ^¿+1.

В работе [6] доказано, что г2,] = г1^-); О = 1, 2. Докажем, что в игре т лиц справедлива аналогичная формула.

В игре т лиц обозначим ожидаемый выигрыш о -го игрока на г-ом шаге ^™,], О' = 1, 2,..., т, и пусть р1 ^ р2 ^ ... ^ рт.

Предположим, что г1^'1 = ^1(р]); О = 1, 2,..., т. Докажем,

что г™+1,'?' = ^!(р]); j = 1, 2,..., т + 1.

На последнем шаге ^т+1,] = (р]); j = 1, 2,..., т + 1.

На шаге N — 1 получим, что о'-ый игрок примет претендента, если х ^ г^'. Например, в игре трех лиц в ситуации П1О2П3, где стратегиями игрока j являются П,- — принять , О] — отклонить

(О = 1, 2, 3), первый игрок получит р1х + р3%Д + (1 — р1 —

РзК+1,1 = р1х + Р1«т+1,1, а в ситуации О1О2П3 его выигрыш

т,1 , ч т+1,1 т+1,1 /-1

равен р3г^ + (1 — Р3)г^ = . Следовательно, первый

т+1,1

игрок примет претендента, если х ^ гN .

Учитывая, что х равномерно распределено на отрезке [0,1] и

г™+1,] = г1 (р]);О = 1,2,..., т + 1, получим

V

т+1,3 м-1

„т+і,і «дг

I

^Х + / (рз'X + р 3^) ¿X =

т+1,.7

д

= V1 (Рз); 3 = 1,2,..., т + 1.

Рассуждая аналогично для г™+1,], О = 1, 2, ...,т + 1, получим, что для О-го игрока оптимально принять г-го претендента, если х ^ г”++1,], г = 1, 2,..., N — 1. Справедлива следующая теорема 274

Теорема 1. В игре т лиц наилучшего выбора с возможностью отказа претендента от предложения каждый игрок ведет себя независимо от числа игроков в игре, т. е. г™,] =

г1(Р])О = 12,...,т;г = ^...^; гг1(Р]) = Ц(1 — гЫр-))2 + г1+1(Р] ),г1+1(Р]) = —с.

2. Игра т лиц наилучшего выбора двух секретарей с возможностью отказа от предложения

В данном разделе рассматривается игровая модель выбора двух секретарей с возможностью отказа претендента от предложения игрока.

Пусть сначала в игре присутствуют два игрока. Если оба игрока сделали предложение претенденту, то претендент согласится принять предложение первого игрока с вероятностью р1, а предложение второго — с вероятностью р2, Р1 + Р2 ^ 1. Если один игрок уже выбрал себе двух специалистов, то другой игрок остается один. В этом случае претендент примет предложение игрока с вероятностью р], р] = 1 — р], О = 1, 2. Найдем выигрыш игрока. Обозначим гг1(р]) — ожидаемый выигрыш игрока на шаге г, если он выбирает первого претендента, г1г (р]) — ожидаемый выигрыш игрока на шаге г, если он выбирает второго претендента при условии, что первого он уже выбрал на шаге г.

Тогда ожидаемые выигрыши игрока удовлетворяют следующим выражениям:

г1(р])= Е (тах{р]О^г1^(р]))+р]г+^р]); гг+1(р], г = № г1+1(р]) = —с; ч

г1,г (р])=Е (шах{ р]х+р] г1^ (р]); Чт (р] )}), г =

г!,N+1 (р]) = —с

Игрок примет претендента на шаге г (при условии, что он уже выбрал первого секретаря), если значение качества претендента х ^ г1г+1 (р]). Аналогично, игрок примет первого претендента , 275

на шаге г, если значение качества претендента х ^ г1+1(р]) — ,1

гг,г+1 (р] ).

Вычислим значения выигрышей

(2) vг1 =

«І+1-«¿,*+1 1

= V,1,« + / «1 -^>н)<іх+ I (рх +Рз-^»¿х

«І+1-«¿,*+1

1 , , 1 1 ^ , 1 - (^+1- Чт)2

= ^,¿+1 + (^г+1 - '\г+1) + РЗ-------------------2-----

+ (1 - рЗ )('иІН - ^,¿+1 - (vІ^-1 - ) 2 )= 'иІН + РЗ (1 - (vІ^-1 - )) 2;

V1

^г,г

«1,г+1 1

= J^гн^+Уь,-х+(1-РзК1,^^=^+1+рз^^О2;

0 «1

«г,г+1

г^ = г^ (р]); г* = г* (р ),г = 1,...^ — 1,г = г + 1,...,М

Теперь перейдем к игре двух лиц. Обозначим ожидаемые выигрыши о'-го игрока при выборе первого секретаря на г-ом шаге г2,], и при выборе второго на г-ом шаге — г2;, О = 1, 2. Найдем выигрыши по индукции с последнего шага. На последнем шаге каждый игрок заинтересован в принятии последнего претендента, поэтому г^' = г1 (р^) и г2] = г1^(р^), О = 1,2. На шаге N — 1 276

получим

2,3 V- \т і,№

-1 =у ¿х+ ^ (РЗх + (1 -РЗК2,’м) ¿х = (РЗ),І = 1, 2

0 «2,3'

1

N

независимо от того, выбрал ли другой игрок первого секретаря. Продолжая рассуждения аналогично для произвольного шага г, получим г2;' = г1;(р]), О = 1, 2. Если оба игрока уже выбрали по одному секретарю, то задача сводится к рассмотренной в разделе 2.

Далее г] 1 = г1_1 (р]), о’ = 1, 2, так как каждый игрок заинтересован принять двух последних претендентов независимо от поведения другого.

На шаге N — 2 в случае, если первый игрок еще не выбрал первого секретаря, а второй уже выбрал на шаге г, матрица игры будет иметь вид:

м2-2(х) = П1

Оі

П2

(т-1,т2і)

О2

(ш12,Ш22)

(т22,

где

т11 = Р1(х + V2 —2,м-1) +Р2V-—-(р-) +(1 - Р1 - Р2>21--

= Р1(х + ‘и2- 2,м-1) +(1 - Рі^--і(рі);

ш?1 = Р2х+РlVг2;J2-1+(1 - Р1 - Р2И22-- = Р2х + p2V-N - і Ср2>;

ш,2 = Рі(х + V2-2,м-,) + (1 - Рі^--;

т22 = Р-^М-1(Р2) + Рі^’М-,;

т2, = Р2V1_l(pl) + p2V2;_l;

2 2,2 -

т2і = Р2х + Р 2 V* N-,;

, 2,1

т22 = V^V-1;

2 2,2

т22 = --.

Из матрицы видно, что первый игрок примет претендента, если значение качества претендента х ^ г1_1(р1) — г1_2 1(р1), а

второй игрок примет претендента, если х ^ г1^_ 1(р2).

Продолжая рассуждения аналогично для произвольного шага г, получим, что при выборе секретаря каждый игрок ведет себя независимо от поведения другого.

Для игры т лиц обозначим ожидаемые выигрыши О-го игрока гГ’], г”Г’] О = 1,2,..., т, г = 1,2,..., N — 1, г = г + 1,..., N для выбора первого и второго секретаря соответственно. На двух последнем шагах каждый игрок заинтересован в принятии

т,7 1 / \ т,7

двух последних претендентов, поэтому г^ = г1^(р]), г^_ 1 =

г1 -1(р] ^ о =l, 2,...,т.

Перейдем к шагу N — 2. Обозначим А множество игроков, которые решили принять ^—2)-го претендента, В С А — множество игроков, которые уже приняли первого секретаря. Выигрыш игрока о' € А \ В, в ситуации, когда он решил принять претендента, равен

Рз (х + %-2,м-1) + £ р*<:-,з + (1 -£ Р^ 1=

кЄА\Ш V кеА /

кеА\{з}

= Рз(х + 1) + (1 - Рз^Т^і

а в ситуации, когда игрок отказал претенденту —

Е Рк%—-,з + (1 - Е Рк ^т ^

кеА\{з} V кеА\{з}

%—1 = % —1.

Получаем, что игрок о' примет ^ — 2)-го претендента, если х ^

т,7 т,7

гМ-1 — гМ- 2,М—1.

Ожидаемый выигрыш игрока і Є А \ В равен

т,з

%—2 =

т,3 N,3

«Л---1'Л—2,Л—1

= / %—-¿х+ / (рз О^^м—1)+(1 ^О^—2) ^х =

0 «N3—«у-

= <—2 Ы.

т,з т,з

«М-1—«N-2^-1

Аналогично, выигрыш игрока О € В в ситуации, когда он решил принять претендента, равен

, V'' т—1, 7 , I -1 V'' \ т, 7

р]х + £ ркгМ——1 + 1 — £ рм гЛТ—2,М —1 =

кеА\{]} V к€А /

= р]х + (1 — р])гт— 2,М —1, а в ситуации, когда игрок отказал претенденту —

Е р^ гт—1,,м — 1 + ( 1 — Е р^

кеА\{]} \ кеА\Ш

Следовательно, игрок О примет ^ — 2)-го претендента, если х ^

т, у %—2,М —1.

Ожидаемый выигрыш игрока о' € В равен

т, з т, з

2,М— 1 = 2,М— 1.

т,

У*,М -2

vVV-_1dx +

Рзх+(1 - Рз ктм—,) ¿х=—2(рз ).

1,М-1

1

/V- 1

Рассуждая аналогично для произвольного г, получим, что при выборе первого секретаря на шаге г игрок О примет претендента,

т,] т,] г \ т,]

если х ^ г^+’1 — г^^+1, а при выборе второго, если х ^ г^^+1. Таким образом, приходим к следующей теореме.

Теорема 2. В игре т лиц наилучшего выбора двух секретарей каждый игрок ведет себя независимо от числа игроков в

i + 1,..., N; (Pj) = j - PjC, j = 1, 2,..., m.

3. Игра двух лиц с доминирующим игроком

Рассмотрим игру двух лиц, в которой каждая фирма хочет принять на работу двух секретарей. Всего имеется N претендентов, которые поступают последовательно в случайном порядке. Качество каждого претендента определяется случайной величиной, равномерно распределенной на единичном отрезке. Первый игрок доминирует, т. е. на каждом шаге претенденты сначала идут в первую фирму, и только получив отказ, обращаются во вторую. В данной игре каждый игрок стремится максимизировать сумму качеств выбранных секретарей.

Рассмотрим случай одного игрока. Обозначим ожидаемые выигрыши игрока Vi и Vi,r при выборе первого секретаря на шаге i, а второго на шаге г, где i = 1, 2,...,N, r = i + 1,...,N. Ожидаемые выигрыши игрока удовлетворяют следующим соотношениями:

Vi = E (max {x + vi)i+i; v*+i}), i = 1, 2, ...,N, vw+i = 0;

Vi,r = E (max {x; Vi^+i}), r = i + 1,..., N, Vi,N+i = 0.

Учитывая, что x имеет равномерное распределение на отрезке [0,1], получим

игре, т.е. ), i = 1,...,N - 1; = v1^(pj), r

Vi+1-

1

0

Vi + 1- Vi,i+1

vi.i+1

Vi

0

Vi,r + 1

Рассмотрим игру с двумя участниками. Обозначим г1 и г*г — ожидаемые выигрыши первого игрока при выборе первого секретаря на шаге г и второго на шаге г. В силу его преимущества, он будет действовать так, как если бы он делал выбор один, следовательно, г*г = г^, г, г1 = г^. Также г1 г и г1 являются выигрышами второго игрока в случае, когда первый игрок выбывает из игры, выбрав себе обоих секретарей.

Обозначим г2 г и г2 — ожидаемые выигрыши второго игрока в случае, когда в игре участвуют два игрока. Так как его выигрыш зависит от того, выбрал ли первый игрок первого секретаря, то введем следующие обозначения:

г2 г (В) — выигрыш второго игрока в случае, когда оба уже выбрали по одному секретарю;

г2 г (Н) — выигрыш второго игрока в случае, когда первый игрок еще не выбрал первого секретаря, а второй выбрал;

г2 (В) — выигрыш второго игрока в случае, когда первый игрок выбрал первого секретаря, а второй нет;

г2(Н) — выигрыш второго игрока в случае, когда оба игрока не выбрали ни одного секретаря.

Последовательно выпишем формулы для вычисления выигрышей второго игрока:

(Б) = Е (тах{ж; и?г+1 (Б); ^ г+1}) »2

г,т+1 1

= I К>+1(Б ))ЙЖ + I + I (иі,г+1)йж

0 ^>+і(Б) ^1,г+1

= („.2 (Б))2 , К>+1)2-К>+1(В))2 1 1 , 1

(Иг , г+1(Б)) + 2 , г+1Иі , г+1 + , г+1

„л , (^2,г+і(в))2 (^1,г+1 )2

уг,г+1 + 2 ’

Иі,г(Н) = Е (тах{ж; ^>+1(Н); ^>+1(Б)})

*>+1(Я) *1+1—*1,г+1 1

= I К>+1(Н))Йж + I + I К>+1(Б))Йж

0 ^г,г+1(я)

г+1(н) *г + 1 *г,г+1

(^1+1-^1,г+1)2-(^? +1(Н ))2

= «г+1 (Н ))2 + (^Г+1-^Г,Г+1)2-(^І,Г+1(Л -и2г+1(В)^+1-<+1)

+и2;г+1(Б) = и2г+1(Б) + ^^+1(й ))2

-г'і,г+1(Б)(г’Г:+1 - и1,г+1),

V2(Б) = Е (тах{ж + и2і+1(Б);и2+1(Б);^+1})

*2+1 (В)-«?,4+1(В)

= И!,г+1(Б) + / (и2+1(Б) - и2г+1(Б))^Ж

0

*1,)+1 1

+ / ж^ж + / (и1+1 - Иг2г+1(Б))^ж

^г+1(в)-^г,і+1 (в) <г+1

= (Б)Н-(и2+1(Б) - и2г+1 (Б))2 + ^ )2-(^г+12Б)-^г,г+1(Б))2

-<г+1(и!+1 - ^2г+1(Б)) + и1+1 - И!,г+1(Б)

= и1 , (^?+1(В)-^,)+1(в))2+(^,)+1)2 и1 л и2 ГБ)1

= Иі+1 + 2----------Иг,г+1(Иг+1 - Иг,г+1(Б))>

^2(Я) = Е (та^ж + ^¿+1(Я); ^2+1(б); и2+1(Н^ )

V 2+1 (н)—^?,)+1 (н)

= ^2г+1(Я)+ I (и2+1(Н) - и2і+1(Н))ЙЖ

0

*1+1—*!,)+1 1

+ / ж^ж + / (иг2+1(Б) - Иг2г+1(Н))^ж

*2+1 (» )— <)+1(Я ) «1+1—«1,)+1

=»2,.+1(н)+(»2+1(я) -<й+1(я ))2+а»-*1»1

-(иі+1 - Иі,г+1)(и2+1(Б) - Иг2г+1(Н)) + ИІ+1(Б) - Иг2г+1(Н)

и2 л , (*1+1—*1,)+1)2+(*?+1(»)—*?,)+1(»))2

иг,г+1(Н ) + 2

І+1 - Чг+1)(и2+1(Б) - ^2г+1(Н)) + ^+1(Б) - ^2г+1(

1

1

В таблице 1 представлены значения оптимальных порогов принятия претендента для обоих игроков и N = 10.

282

Таким образом, для N = 10 ожидаемый выигрыш первого игрока в начале игры равен г{ = 1,636, а выигрыш второго равен г2(Н) = 1,31.

Таблица 1. Значения оптимальных порогов для N = 10

і иІ+1-V1, і+1 Ч і+1 Иг2+1(Н )-ИМ+1(Н ) Иг2+1(Б)- ИМ+1(Б) <і+1(Я ) <і+1(£)

1 0,757 0,850 0,584 0,669 0,669 0,757

2 0,735 0,836 0,546 0,639 0,639 0,735

3 0,708 0,820 0,5 0,603 0,603 0,708

4 0,676 0,8 0,442 0,558 0,558 0,676

5 0,634 0,775 0,366 0,5 0,5 0,634

6 0,579 0,742 0,258 0,421 0,421 0,579

7 0,5 0,695 0 0,305 0,305 0,5

8 0,375 0,625 0 0 0 0,375

9 0 0,5 0 0 0 0

10 0 0 0 0 0 0

Лемма 1. Для оптимальных порогов принятия претендента справедливы следующие равенства г^+1 — г1г+1 = гг2г+1(В) и

гг+1(В) — гг>+1(В) = г*2,г+1(Н)> Г = 2, ..., N•

Доказательство.

Докажем первое равенство по индукции.

Для г + 1 = N — 1 данное равенство справедливо. Докажем

283

его для г, г = 2,..., N — 2. Получим

,2 (в) — „1 + (У?,г+1(в))2-(у1,г+1)

;г,г(в ) — „і,г+1 + 2

_ „1 I К+1-«г>+1)2-К>+1)2 — 1_ „1

_ „і,г+1 "Г" 2 — „г „і,г.

2

Аналогично доказывается второе равенство

„*> (н) — „2,г+1(в) + (^г+1 ^-,г+1)2+(^2,г+1(н))

-„2,г+1(В)(„г1+1 - „г1,г+1)

— „2 (В) , («2+1 (В)-^2г + 1(В))2-(^2г+1(В))2

— „і,г+1(в )+ 2

—„2(в) - „2,г (в).

С учетом Леммы 1 формулу выигрыша ^2(Н) можно упростить следующим образом:

„2(Я) — „2+1(в) - («2і+1(В))2+(«+1(ЯЬ«+1(в)+^+1 (в))2

Литература

1. МАЗАЛОВ В. В., ВИННИЧЕНКО С. В. Моменты остановки и управляемые случайные блуждания. - Новосибирск: Наука, 1992. - 104 с.

2. НИКОЛАЕВ М. Л. Об одном обобщении задачи наилучшего выбора // Теория вероятностей и ее применения. -1977. - Т. 22. - №1. - С. 191-194.

3. НИКОЛАЕВ М. Л. Оптимальные правила многократной остановки // Обозрение прикладной и промышленной математики. - 1998. - Т. 5. - №2. - С. 309-348.

4. ФАЛЬКО А. А. Игра наилучшего выбора с возможностью отказа от предложения и перераспределением вероятностей // Методы математического моделирования и информационные технологии. Труды ИПМИ. - 2006. - №7. -Петрозаводск: КарНЦ РАН. - С. 87-94.

5. ФАЛЬКО А. А. Задача наилучшего выбора двух объектов // Методы математического моделирования и информационные технологии. Труды ИПМИ. - 2007. - №8. -Петрозаводск: КарНЦ РАН. - С. 34-42.

6. BASTON V., GARNAEV A. Competition for staff between two department // Game Theory and Applications. - 2005. -V. 10. - P. 13-20.

7. ENNS E.G., FERENSTEIN E.Z. On a multiperson time-sequential game with priorities // Sequential Anal. - 1987.

- V. 6. - P. 239-256.

8. FUSHIMI M. The secretary problem in a competitive situation // J. Oper. Res. Soc. Japan. - 1981. - V. 24. - P. 350358.

9. GARNAEV A., SOLOVYEV A. On a two department multi stage game / Extended abstracts of International Workshop “Optimal Stopping and Stochastic Control”, August 22-26, 2005. - Petrozavodsk, Russia. - P. 24-37.

10. SOFRONOV G., KEITH J., KROESE D. An optimal sequential procedure for a buying-selling problem with independent observations // J. Appl. Prob. - 2006. - V. 43.

- P. 454-462.

11. SAKAGUCHI M. Non-zero-sum games related to the secretary problem // J. Oper. Res. Sos. Jap. - 1980. - V. 23. -№3. - P. 287-293.

12. SAKAGUCHI M. Non-zero-sum best-choice games where two stops are required // Scientiae Mathematicae Japonicae. -2003.-V. 58. -№1.-P. 137-176.

13. SAKAGUCHI M. Optimal stopping games where players have weighted privilege // Annals of the International Society of Dynamic Games, Advances in Dynamic Games Application to Economics, Finance, Optimization and Stochastic Control. -2005. -V. 7. - P. 116-131.

14. SAKAGUCHI M., MAZALOV V. A non-zero-sum noinformation best-choice game // Mathematical Methods of Operation Research. - 2004. - V. 60. - P. 437-451.

15. SMITH M. A secretary problem with uncertain employment // J. Appl. Probab. - 1975. - V. 12. - №3. - P. 620-624.

16. SZAJOWSKI K. On non-zero-sum game with priority in secretary problem // MathJaponica. - 1992. - V. 37. - P. 415426.

17. TAMAKI M. Minimal expected ranks for the secretary problems with uncertain selection / Game Theory, Optimal Stopping, Probability and Statistics, ed. Bruss F.T. and Cam L.Le, Institute of Mathematical Statistics. - 2000. - P. 127139.

FULL-INFORMATION BEST-CHOICE GAME WITH TWO STOPS

Anna Ivashko, Institute of Applied Mathematical Research Karelian Research Center of RAS, Petrozavodsk Cand.Sc. (afalco@krc.karelia.ru).

Abstract: We consider a full-information best-choice game in which each player wants to hire two secretaries. The aim of a player is to maximize the sum of expected applicant’ quality values. Two models are considered: m-person best-choice game with the possibility for an applicant to refuse an offer and two-person best-choice game with dominant player. Optimal strategies are obtained. We prove that in the best-choice game with the possibility for an applicant to refuse an offer the players’ payoffs don’t depend on the total number ofplayers in the game.

Keywords: best-choice game, optimal strategy, multistage game, multiple stopping .