ИГРА СО СЛУЧАЙНЫМ ВТОРЫМ ИГРОКОМ И ЕЕ ПРИЛОЖЕНИЕ К ЗАДАЧЕ О ВЫБОРЕ ЦЕНЫ ПРОЕЗДА

Тимофеева Галина Адольфовна; Завалищин Дмитрий Станиславович

Известия Института математики и информатики Удмуртского государственного университета

2021. Том 57. С. 170-180

УДК 519.83

ИГРА СО СЛУЧАЙНЫМ ВТОРЫМ ИГРОКОМ И ЕE ПРИЛОЖЕНИЕ К ЗАДАЧЕ О ВЫБОРЕ ЦЕНЫ ПРОЕЗДА

Выбор оптимальной стратегии для значительного числа прикладных задач выбора оптимальных решений может быть формализован как задача теории игр, в том числе в условиях неполной информации. В статье рассмотрена иерархическая игра со случайным вторым игроком, в которой первый игрок выбирает детерминированное решение, а второй игрок представлен множеством лиц, принимающих решения. Изучаются стратегии игроков, обеспечивающие равновесие по Штакельбергу. Стратегия второго игрока формализуется как вероятностное решение задачи оптимизации с целевой функцией, зависящей от непрерывно распределенного случайного параметра. Во многих случаях выбор оптимальных стратегий проходит в условиях, когда лиц, принимающих решение, много, каждый из них выбирает решения на основе своего критерия. Математическая формализация таких задач приводит к исследованию вероятностных решений задач стохастической оптимизации. В частности, вероятностные решения используются для математического описания выбора пассажиром вида транспорта. Исследуется задача об оптимальном выборе цены проезда для нового маршрута на основе вероятностной модели предпочтений пассажиров. В этой формализации перевозчик, назначающий цену, рассматривается как первый игрок, множество пассажиров — как второй игрок. Стратегия второго игрока формализуется как вероятностное решение задачи со случайной целевой функцией. Рассмотрен модельный пример.

Ключевые слова: иерархическая игра, равновесие по Штакельбергу, случайный второй игрок, вероятностное решение, выбор маршрута, оптимальная цена проезда.

Б01: 10.35634/2226-3594-2021-57-08 Введение

Задачи выбора оптимальных стратегий в условиях, когда целевая функция (выигрыш первого игрока) описывается случайной величиной, рассматриваются как принятие решений «в условиях риска» и находят широкое применение в различных областях. Применение аппарата математической теории игр в таких задачах позволяет построить оптимальную стратегию поведения лица, принимающего решения (ЛПР), обычно рассматриваемого как первый игрок.

В теории игр длительное время исследуются задачи со случайной матрицей выигрышей [1]. В работах [2,3] изучаются свойства решений задач теории игр, в которых матрица выигрышей является случайной, то есть выигрыш первого игрока описывается как случайная величина, зависящая от выбираемого решения. Актуальным подходом к игровым задачам с неопределенностью являются модели скрытых стохастических игр, в которых игроки наблюдают прошлые действия и получают информацию о текущем состоянии [4], различные формализации игровых задач в условиях неопределенности рассмотрены в статье [5].

При математическом моделировании поведения участников рынка часто используются иерархические модели теории игр, в которых игроки находятся в несимметричных информационных условиях. В этом случае интерес представляют стратегии игроков, обеспечивающие равновесие по Штакельбергу [6-8]. Близкие проблемы рассматриваются в теории двухэтапного стохастического программирования, если предполагается, что решения на

разных этапах принимают различные ЛПР, имеющие возможно различные целевые функции. Исследованию таких задач с вероятностным и квантильным критериями посвящена работа [9].

§ 1. Постановка задачи

Формализация задач о выборе оптимальной стратегии в рамках теории игр широко применяется в различных экономических и технических системах, в том числе используются модели, в которых второй игрок выбирает свое решение случайным образом (игры с природой). В отличие от этой формализации в статье рассматривается модель, в которой второй игрок представлен множеством лиц, принимающих решение.

Предполагается, что целевая функция второго игрока (множества ЛПР) имеет вид f2(x, y, С) и зависит от выбора первого игрока x, выбора второго игрока £ Y и случайного параметра С, характеризующего «случайного выбранного» ЛПР. В рассматриваемой формализации выбор второго игрока (обозначим его y*(C,x)) является вероятностным решением задачи минимизации с целевой функцией, зависящей от случайного параметра:

f2(x,y,c) м min,

V&Y

и зависит от случайного параметра С и выбора 1 -го игрока.

Существует значительное количество прикладных задач оптимизации, в которых решение принимается многократно, многими лицами, независимо друг от друга. В этих случаях для моделирования используются вероятностные решения задач стохастической оптимизации [10,11]. Определение и свойства вероятностного решения задачи оптимизации функции, зависящей от случайного параметра, исследуются в работе [12].

В статье рассматривается иерархическая игра, в которой равновесие определяется по Штакельбергу.

Рассматривается случай, когда целевая функция первого игрока Fi(x) является математическим ожиданием некоторого функционала, зависящего от решения второго игрока, и является, таким образом, детерминированной функцией. Первый игрок максимизирует среднее ожидаемое значение некоторой целевой функции

Fi(x) = E (fi(x,y*(C))) м max.

Здесь и далее En означает математическое ожидание случайной величины п.

В данной статье рассматривается игровая задача, в которой выигрыш первого игрока не является математическим ожиданием проигрыша второго игрока, представленного множеством лиц, принимающих решение.

§ 2. Вероятностные решения задачи оптимизации. Равновесие по Штакельбергу в игре со случайным вторым игроком

Рассмотрим задачу оптимизации со случайным параметром

min f (y,c) (2.1)

где Y С Rn — компактное множество, функция f (y, b): Y x Rm м R1 непрерывна по совокупности переменных, С = С(ш) — случайный вектор, определенный на вероятностном пространстве (П, F, P) со значениями в Rm.

Обозначим множество решений задачи (2.1) при фиксированном значении С = b через Y*(b) = Argmin{f (y,b)|y £ Y}.

Пусть случайный вектор £ = £(ш) определен на вероятностном пространстве П и принимает значения из множества B С Rm. Предполагаем, что для параметрической задачи оптимизации

min / (y,b)

V&Y

выполнены условия теоремы Бержа о существовании решения параметрической задачи оптимизации и его полунепрерывности сверху по параметру (см. [13]). Таким образом, определена функция минимума

F(b) = min / (y,b).

y&

и полунепрерывное сверху отображение Y*(b): B м- Y, где

у* Е Y*(b) ^ /(y*,b) = F(b) = min/(y,b),

У&

то есть Y*(b) = Arg min /(y,b). В этом случае определено случайное компактное множе-

У&

ство Y*(£) в смысле [14].

Определение 2.1 (см. [12]). Случайное компактное множество Y *(£ (ш)) будем называть вероятностным решением задачи стохастического программирования (2.1).

Определение 2.2. Будем говорить, что задана иерархическая игра со случайным вторым игроком

G(P ) = (X,Y,/1(x,y),/2(x,y,£), Pg),

если:

(1) заданы множества X и Y возможных стратегий первого и второго игрока соответственно;

(2) заданы целевые функции первого и второго игрока /1(x, y) и /2(х, y, £), причем функции /¿(x,y,£) зависят от переменных x,y, а функция /2(x,y,£) зависит еще от случайного параметра £;

(3) задано распределение Pg случайного параметра £.

Далее будем предполагать, что выполняется следующее условие.

Условие 2.1. При любом фиксированном x Е X функция /2(х,у, £) и распределение Pg таковы, что вероятностное решение задачи

min /2(х,У,£), (2.2)

y&Y

состоит из единственной точки с вероятностью 1.

В этом случае вероятностное решение задачи является случайным вектором, который будем обозначать y*(x,£).

Определение 2.3. Набор стратегий первого и второго игрока {x*,y*(x*,£)}, где y*(£) является вероятностным решением задачи (2.2) при x = x* и заданном распределении Pg случайного параметра £, а вектор x* Е X является решением задачи

max E (/i(x,y*(£))),

будем назвать равновесием по Штакельбергу в иерархической игре со случайным вторым игроком G(P) = (X, Y,/1 (x, y),/2(х, у, £), Pg), а стратегии x* Е X и y*(x*,£) — оптимальными стратегиями первого и второго игрока.

§ 3. Выбор предпочтительного маршрута случайным пассажиром

В статье [10] предложена модель выбора оптимального маршрута пассажиром как вероятностное решение задачи со случайной целевой функцией. Будем использовать эту модель для описания выбора второго игрока, роль которого выполняют пассажиры (множество ЛПР).

Пусть у потребителя (пассажира) есть выбор между п возможными альтернативами (маршрутами). Обозначим множество альтернатив У = {е1;...,еп}, где е^ — базисные векторы в Яга. Через вектор у € У будем обозначать индикатор выбора маршрута (элемента множества альтернатив), т. е. у = е^ означает выбор пассажиром ¿-го маршрута.

Обозначим через а^ стоимость проезда г-м маршрутом, г = 1,..., п, Ь — время проезда. Тогда время А (у) и стоимость проезда В (у) для произвольного элемента у € Е0 можно записать соответственно

А (у) = ат у, В(у) = Ьт у, (3.1)

где а = {аь ..., а„}, Ь = {Ьь ..., Ь„}.

Задача выбора маршрута пассажиром рассматривается, как задача минимизации функционала, зависящего от времени поездки и ее стоимости. Следуя предложенному ранее подходу [10, 11] в качестве критерия будем использовать «обобщенную цену проездки» / (А, В, £), которая в простейшем случае представляет линейную свертку двух критериев:

/ (у; £ ) = А(у)+ £В (у), (3.2)

где £ ^ 0 — индивидуальная «ценность» единицы затраченного времени. Этот параметр считается зависящим от «случайно выбранного» пассажира, то есть случайным.

Анализ данных о ценах и времени перевозок показывает, что можно использовать нелинейные (выпуклые) функции обобщенной цены поездки, однако в данной статье ограничимся линейной сверткой критериев (3.1), (3.2).

Получаем, что выбор случайного ЛПР (пассажира) описывается решением задачи оптимизации, зависящей от случайного параметра £

/ (у;£) = аТу + £ьТ у ^ т1'п. (3.3)

у&Уо

Вероятностное решение этой задачи обозначим через у*(£).

Предполагается, что случайная величина £ имеет непрерывное распределение на интервале [¿^¿г] ^ [0, В этом случае решение задачи (3.3) у*(£) состоит из единственной точки с вероятностью 1 [11]. Таким образом, у*(£) — случайный вектор, имеющий дискретное распределение, которое зависит от распределения случайного параметра £ и параметров всех маршрутов а и Ь.

§ 4. Формализация игры. Выбор оптимальной цены проезда

Рассмотрим задачу о назначении перевозчиком цены на один из маршрутов, например, на вновь вводимый маршрут. Обозначим новый маршрут через ега+1, а расширенное множество альтернатив через У1. Выбор пассажиром вновь введенного маршрута записывается как у* (£) = ега+1. Формализуем выбор оптимальной цены проезда в рамках рассматриваемой модели. Первым игроком является перевозчик нового типа транспорта (или нового маршрута), его задача — выбор цены проезда х = ага+1 для нового маршрута так, чтобы оптимизировать доход от продажи билетов.

В этом случае время проезда Ьга+1 считается заданным и известным. Отметим, что предлагаемая модель является упрощенной: для каждого вида транспорта существует, как

правило, несколько тарифов (первого и остальных классов, для часто ездящих пассажиров и т. п.), кроме того время поездки, вообще говоря, не является детерминированной величиной, а имеет некоторый разброс.

Доход от обслуживания пассажиров на новом маршруте будем считать пропорциональным произведению дохода от обслуживания одного пассажира на новом маршруте на количество пассажиров выбравших этот вид транспорта. Увеличение потока клиентов за счет предоставления более удобного проезда в данной формализации задачи не учитывается, поэтому ожидаемое количество пассажиров будет равно

N„+1 = N • дп+1(х),

где N — общее число пассажиров, использующих данное направление, д„+1 — вероятность выбора нового маршрута случайным пассажиром

5„+1(х) = рг{у*(£,х) = е„+1}. Здесь у*(£,х) — вероятностное решение задачи

/2(х, у,£) = а(х)Ту + £ЬТу ^ тт (4.1)

уе^х

при а(х) = {а1;..., а„, х}, Ь = {Ь1;..., Ь„+1}.

Отметим, что вероятность выбора нового маршрута в рассматриваемой формализации зависит от параметров конкурирующих маршрутов а, Ь, времени перемещения по новому маршруту Ь„+1 и назначенной цены х проезда по (п + 1)-му маршруту.

Кроме того, эту вероятность можно записать, как математическое ожидание (п + 1)-й координаты вероятностного решения задачи стохастической оптимизации (4.1)

Рг{у*(£,х) = е„+1} = Е (е„+1у*(£,х)),

где Е — знак математического ожидания.

Обозначим /1(х,у) доход перевозчика по новому маршруту, получаемый от проезда отдельного пассажира по маршруту у € У1,

/1(х, у) = (х - а0)е„+1у, (4.2)

через а0 обозначены затраты на обслуживание одного пассажира на новом маршруте.

Таким образом, при выборе цены проезда х = а„+1 перевозчик (первый игрок) решает задачу максимизации функционала в форме математического ожидания

Е(/1(х,у*(£,х))) = Е((х - а0)(е„+1у*(£,х))) = (х - ао)5„+1(х) ^ тах. (4.3)

х>0

Отметим, что в рассматриваемой постановке речь идет о иерархической игре со случайным вторым игроком. Также особенностью задачи является то, что число возможных состояний природы совпадает с Я+ = [0;т.е. не является конечным. Распределение р случайной величины £ предполагается заданным и непрерывным. В этом случае выполняется условие 2.1 для задачи (4.1). Возможные решения первого игрока описываются интервалом возможных цен X = Я+ = [0;

Полученную игру можно записать в форме

С(Р ) = <Я+ ,У1,/1(х,у),/г(х,у,£), р >, где функции /1(х,у) и /2(х,у,£) удовлетворяют соотношениями (4.1) и (4.2).

Оптимальные стратегии игроков для игры ) определяются в соответствии с определением 2.3.

Отметим, что хотя целевая функция для второго игрока зависит от случайного параметра £ линейно (см. (4.1)), тем не менее оптимальное значение у*(£,х) описывается нелинейной зависимостью решения второго игрока от случайного параметра £ и цены нового маршрута х, и имеет место неравенство

Е (/1(х,у*(£,х)) = Л(х,Е (у*(£,я))) = /1(х,у*(£ (£ ),х)),

так как

E (y*(£,x)) = E (Argmin / )) = Argmin / (£)).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

v&Yq yeYo

Утверждение 4.1. Вероятность выбора (n + 1)-ом альтернативы

qra+i(x) = Pr{y*(£,x) = era+i}

равна

qn+i(x) = Pr{£ G [L(x),R(x)]},

где

, , I x a j I , v I x a j L(x) = max _< 0, -->, R(x) = min _< --,

bj >b„+i,j=1,ra [ bj — bn+1 J bj <bn+i,j=1,ra [ bj — bn+1

Утверждение 4.1 следует из соотношений для вероятностей альтернатив [10]. Отметим, что отрезок [L(x),R(x)] может быть пустым множеством, так как возможно выполнение неравенства L(x) > R(x). В частности,

Pr{£ G [L(x),R(x)]} = 0,

в случае, если (n + 1)-й маршрут является доминируемым по критериям {A(y), B(y)}, то есть существует другой маршрут y = ej G Y0 такой, что

(aj ^ x) Л (bj < bn+1) или (aj < x) Л (bj ^ bn+1). (4.4)

Условие (4.4) ограничивает интервал возможных значений для выбора оптимальной цены для нового маршрута.

Утверждение 4.2. При x ^ а, где

а = max aj, (4.5)

j: bj <bn+1

вероятность выбора (n + 1)-й альтернативы равна нулю

Pr{y*(£, x) = e„+1} = 0,

где y*(£,x) — вероятностное решение задачи стохастической оптимизации (4.1), а £ — случайная величина, принимающая с вероятностью 1 значения из интервала (0;

Доказательство. Действительно, пусть x ^ а. Обозначим k G {1,..., n} номер на котором достигается максимум в (4.5), тогда

x ^ а = afc, bfc < bn+1.

При любом фиксированном значении £ = с > 0 выполняется неравенство

/(еЛ; с) = атек + сЬТек = ак + сЬк ^ х + сЬ„+1 = /(е„+ьс).

А значит, у = е„+1 не является решением задачи стохастической оптимизации при любом фиксированном положительном значении £. Так как случайная величина £ с вероятностью 1 принимает значения из интервала (0, то вероятностное решение задачи (4.1) равно е„+1 с нулевой вероятностью. □

Пример 4.1. Рассмотрим модельный пример. Пусть было три возможных маршрута (вида транспорта) с заданными значениями цен билетов и времени перемещения:

{а*; Ь^}, г = 1, 2, 3,

и к ним добавляется еще один маршрут (вид транспорта) с заданным временем перемещения Ь4. Задача первого игрока (перевозчика по новому маршруту) — выбор оптимальной цены проезда х = а4 для получения максимальной прибыли в предположении, что второй игрок (случайно выбранный пассажир) выбирает оптимальный с точки зрения обобщенной стоимости (4.1) маршрут.

Пусть значения цен упорядочены по возрастанию

а1 ^ а2 ^ а3, (4.6)

и до введения нового маршрута все три существующих имели ненулевой поток пассажиров, то есть среди маршрутов не было доминируемых по двум критериям (время и цена поездки). Предполагается также, что на плоскости критериев нет совпадающих значений {а^; Ь^}. Из этих предположений следует, что время проезда по маршрутам 1-3 упорядочено по возрастанию

Ь1 > Ьг > Ьз,

и все неравенства в (4.6) — строгие.

Решение задачи о выборе оптимальной цены разобьем на 2 этапа:

(1) нахождение значения а по формуле (4.5);

(2) выбор оптимального значения х € [0; а] как решения задачи (4.3) с использованием имитационного моделирования и численных методов.

Расчеты проводились для следующих данных для трех существующих маршрутов:

К; Ь1} = {1; 4}, {аг; Ьг} = {2; 3}, {аз; Ьз} = {4; 2}.

Предполагалось, что случайный параметр £ имеет логнормальное распределение с параметрами ^ = 2, о = 1.

Рассматривалась задача определения оптимальной цены для маршрута с временем перемещения Ь4 = 2.5. Для рассматриваемых данных а = 4, и при х = 4 третий маршрут становится очевидно предпочтительнее вновь вводимого и вероятность выбора пассажиром нового маршрута равна 0.

На рис. 1 приведено изменение вероятности выбора нового маршрута д4 в зависимости от изменения цены билета на вновь введенный маршрут х = а4. На графике видно, что в рассматриваемых условиях д4(х) = 0 при всех х ^ 3. Проверка показывает, что ¿(3) = = Я(3) = 2 и, следовательно, д4(3) = 0 (см. утверждение 4.1).

На рис. 2 приведен график изменения функции полезности первого игрока ^\(х) без учета затрат на перевозку, то есть при а0 = 0 (сплошная линия), и для затрат на перевозку, составляющих а0 = 1 (пунктирная линия). Без учета затрат на перевозку оптимальное решение (цена билета) равна х* = 1.79, а максимальное значение целевой функции равно *\(х*) = 0.535. Если учесть затраты, то оптимальной ценой билета за проезд будет х* = 2.2, максимальное значение целевой функции равно ^\(х*) = 0.27.

Рис. 1. Зависимость вероятности выбора нового маршрута 44 от цены билета х

f / * ' s\

/ у'

0 12 3 4

Рис. 2. Зависимость прибыли первого игрока от цены билета

Выводы

В статье рассматривается иерархическая игра двух лиц со случайным вторым игроком, изучены оптимальные в смысле равновесия по Штакельбергу стратегии игроков. Под случайным вторым игроком понимается случайно выбранное лицо из однородного набора лиц, принимающих решение. Модель применяется к задаче о назначении оптимальной цены проезда, в качестве второго игрока выступает случайно выбранный пассажир, предполагается, что функция его предпочтений зависит от случайного параметра. Рассмотрен модельный пример.

Финансирование. Исследования выполнены за счет средств федерального бюджета РФ в рамках госзаказа, проект «Оптимизация транспортно-логистической системы на основе моделирования развития транспортной инфраструктуры и моделей потребительских предпочтений»

СПИСОК ЛИТЕРАТУРЫ

1. фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970.

2. Rass S., Konig S., Schauer S. Uncertainty in games: using probability-distributions as payoffs // Decision and game theory for security. Cham: Springer, 2015. P. 346-357. https://doi.org/10.1007/978-3-319-25594-1_20

3. Song T. On random payoff matrix games // Systems and Management Science by Extremal Methods. Boston: Springer, 1992. P. 291-306. https://doi.org/10.1007/978-1-4615-3600-0_19

4. Renault J., Ziliotto B. Hidden stochastic games and limit equilibrium payoffs // Games and Economic Behavior. 2020. Vol. 124. P. 122-139. https://doi.org/10.1016/j.geb.2020.08.001

5. Bergemann D., Morris S. Bayes correlated equilibrium and the comparison of information structures in games // Theoretical Economics. 2016. Vol. 11. Issue 2. P. 487-522. https://doi.org/10.3982/TE1808

6. Le Cadre H., Mezghani I., Papavasiliou A. A game-theoretic analysis of transmission-distribution system operator coordination // European Journal of Operational Research. 2019. Vol. 274. Issue 1. P. 317-339. https://doi.org/10.1016/j.ejor.2018.09.043

7. Wang Ch., Fan X., Yin Zh. Financing online retailers: Bank vs. electronic business platform, equilibrium, and coordinating strategy // European Journal of Operational Research. 2019. Vol. 276. Issue 1. P. 343-356. https://doi.org/10.1016/j.ejor.2019.01.009

8. Funaki Y., Houba H., Motchenkova E. Market power in bilateral oligopoly markets with non-expandable infrastructures // International Journal of Game Theory. 2020. Vol. 49. P. 525-546. https://doi.org/10.1007/s00182-019-00695-z

9. Иванов С. В., Кибзун А. И. Общие свойства двухэтапных задач стохастического программирования с вероятностными критериями // Автоматика и телемеханика. 2019. Вып. 6. С. 70-90. https://doi.org/10.1134/S0005231019060047

10. Timofeeva G. A., Martynenko A. V., Zavalishchin D. S. Probabilistic modeling of passengers and carriers preferences via bicriterial approach // IFAC-PapersOnLine. 2018. Vol. 51. Issue 32. P. 496-498. https://doi.org/10.1016/j.ifacol.2018.11.469

11. Timofeeva G. Investigation of mathematical model of passenger preferences // AIP Conference Proceedings. 2019. Vol. 2172. Issue 1. 080001. https://doi.org/10.1063/1.5133559

12. Тимофеева Г. А. Вероятностные решения задач условной оптимизации // Труды Института математики и механики УрО РАН. 2020. Т. 26. № 1. С. 198-211. https://doi.org/10.21538/0134-4889-2020-26-1-198-211

13. Aliprantis C. D., Border K. C. Infinite dimensional analysis: A Hitchhiker's guide. Springer, 2006. https://doi.org/10.1007/3-540-29587-9

14. Матерон Ж. Случайные множества и интегральная геометрия. М.: Мир, 1978.

Поступила в редакцию 15.02.2021

Тимофеева Галина Адольфовна, д. ф.-м. н., профессор, Уральский государственный университет путей сообщения, 620034, Россия, г. Екатеринбург, ул. Колмогорова, 66;

профессор, Уральский федеральный университет, 620002, Россия, г. Екатеринбург, ул. Мира, 19. ORCID: https://orcid.org/0000-0002-0688-3882 E-mail: [email protected]

Завалищин Дмитрий Станиславович, к. ф.-м. н., старший научный сотрудник, Институт математики и механики им. Н. Н. Красовского УрО РАН, 620108, Россия, г. Екатеринбург, ул. С. Ковалевской, 16; доцент, Уральский государственный университет путей сообщения, 620034, Россия, г. Екатеринбург, ул. Колмогорова, 66.

ORCID: https://orcid.org/0000-0002-4117-8329 E-mail: [email protected]

Цитирование: Г. А. Тимофеева, Д. С. Завалищин. Игра со случайным вторым игроком и еe приложение к задаче о выборе цены проезда // Известия Института математики и информатики Удмуртского государственного университета. 2021. Т. 57. С. 170-180.

G. A. Timofeeva, D.S. Zavalishchin

Game with a random second player and its application to the problem of optimal fare choice

Keywords: hierarchical game, Stackelberg equilibrium, random second player, probabilistic solution, route selection, optimal fare.

MSC2020: 91A27, 91A65

DOI: 10.35634/2226-3594-2021-57-08

The choice of the optimal strategy for a significant number of applied problems can be formalized as a game theory problem, even in conditions of incomplete information. The article deals with a hierarchical game with a random second player, in which the first player chooses a deterministic solution, and the second player is represented by a set of decision makers. The strategies of the players that ensure the Stackelberg equilibrium are studied. The strategy of the second player is formalized as a probabilistic solution to an optimization problem with an objective function depending on a continuously distributed random parameter. In many cases, the choice of optimal strategies takes place in conditions when there are many decision makers, and each of them chooses a decision based on his (her) criterion. The mathematical formalization of such problems leads to the study of probabilistic solutions to problems with an objective function depending on a random parameter. In particular, probabilistic solutions are used for mathematical describing the passenger's choice of a mode of transport. The problem of optimal fare choice for a new route based on a probabilistic model of passenger preferences is considered. In this formalization, the carrier that sets the fare is treated as the first player; the set of passengers is treated as the second player. The second player's strategy is formalized as a probabilistic solution to an optimization problem with a random objective function. A model example is considered.

Funding. The study was funded by federal budget of the Russian Federation within the framework of the state order, the project «Optimization of the transport and logistics system based on modeling the development of transport infrastructure and models of consumer preference».

REFERENCES

1. von Neumann J., Morgenstern O. Theory of games and economic behavior, Princeton, N. J.: Princeton University Press, 1944.

2. Rass S., Konig S., Schauer S. Uncertainty in games: using probability-distributions as payoffs, Decision and game theory for security, Cham: Springer, 2015, pp. 346-357. https://doi.org/10.1007/978-3-319-25594-1_20

3. Song T. On random payoff matrix games, Systems and Management Science by Extremal Methods, Boston: Springer, 1992, pp. 291-306. https://doi.org/10.1007/978-1-4615-3600-0_19

4. Renault J., Ziliotto B. Hidden stochastic games and limit equilibrium payoffs, Games and Economic Behavior, 2020, vol. 124, pp. 122-139. https://doi.org/10.1016/j.geb.2020.08.001

5. Bergemann D., Morris S. Bayes correlated equilibrium and the comparison of information structures in games, Theoretical Economics, 2016, vol. 11, issue 2, pp. 487-522. https://doi.org/10.3982/TE1808

6. Le Cadre H., Mezghani I., Papavasiliou A. A game-theoretic analysis of transmission-distribution system operator coordination, European Journal of Operational Research, 2019, vol. 274, issue 1, pp. 317-339. https://doi.org/10.1016/j.ejor.2018.09.043

7. Wang Ch., Fan X., Yin Zh. Financing online retailers: Bank vs. electronic business platform, equilibrium, and coordinating strategy, European Journal of Operational Research, 2019, vol. 276, issue 1, pp. 343-356. https://doi.org/10.1016/j.ejor.2019.01.009

8. Funaki Y., Houba H., Motchenkova E. Market power in bilateral oligopoly markets with non-expandable infrastructures, International Journal of Game Theory, 2020, vol. 49, pp. 525-546. https://doi.org/10.! 007/s00182-019-00695-z

9. Ivanov S.V., Kibzun A.I. General properties of two-stage stochastic programming problems with probabilistic criteria, Automation and Remote Control, 2019, vol. 80, issue 6, pp. 1041-1057. https://doi.org/10.1134/S0005117919060043

10. Timofeeva G. A., Martynenko A. V., Zavalishchin D. S. Probabilistic modeling of passengers and carriers preferences via bicriterial approach, IFAC-PapersOnLine, 2018, vol. 51, issue 32, pp. 496-498. https://doi.org/10.1016/j.ifacol.2018.11.469

11. Timofeeva G. Investigation of mathematical model of passenger preferences, AIP Conference Proceedings, 2019, vol. 2172, issue 1, 080001. https://doi.org/10.1063/L5133559

12. Timofeeva G. A. Probabilistic solutions of conditional optimization problems, Trudy Instituta Matem-atiki i Mekhaniki UrO RAN, 2020, vol. 26, no. 1, pp. 198-211 (in Russian). https://doi.org/10.21538/0134-4889-2020-26-1-198-211

13. Aliprantis C.D., Border K.C. Infinite dimensional analysis: A Hitchhiker's guide, Springer, 2006. https://doi.org/10.1007/3-540-29587-9

14. Matheron G. Random sets and integral geometry, New York: Wiley, 1975.

Received 15.02.2021

Timofeeva Galina Adol'fovna, Doctor of Physics and Mathematics, Professor, Ural State University of

Railway Transport, ul. Kolmogorova, 66, Yekaterinburg, 620034, Russia;

Professor, Ural Federal University, ul. Mira, 19, Yekaterinburg, 620002, Russia.

ORCID: https://orcid.org/0000-0002-0688-3882

E-mail: [email protected]

Zavalishchin Dmitrii Stanislavovich, Candidate of Physics and Mathematics, Senior Researcher, N.N. Kra-sovskii Institute of Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620108, Russia;

Associate Professor, Ural State University of Railway Transport, ul. Kolmogorova, 66, Yekaterinburg, 620034, Russia.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ORCID: https://orcid.org/0000-0002-4117-8329 E-mail: [email protected]

Citation: G. A. Timofeeva, D. S. Zavalishchin. Game with a random second player and its application to the problem of optimal fare choice, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2021, vol. 57, pp. 170-180.

ИГРА СО СЛУЧАЙНЫМ ВТОРЫМ ИГРОКОМ И ЕЕ ПРИЛОЖЕНИЕ К ЗАДАЧЕ О ВЫБОРЕ ЦЕНЫ ПРОЕЗДА Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Тимофеева Галина Адольфовна, Завалищин Дмитрий Станиславович

Похожие темы научных работ по математике , автор научной работы — Тимофеева Галина Адольфовна, Завалищин Дмитрий Станиславович

GAME WITH A RANDOM SECOND PLAYER AND ITS APPLICATION TO THE PROBLEM OF OPTIMAL FARE CHOICE

Текст научной работы на тему «ИГРА СО СЛУЧАЙНЫМ ВТОРЫМ ИГРОКОМ И ЕЕ ПРИЛОЖЕНИЕ К ЗАДАЧЕ О ВЫБОРЕ ЦЕНЫ ПРОЕЗДА»