Задача динамического перераспределения автомобилей каршеринг-сервиса

Багров Н.С.; Денисов Д.В.

Н.С. Багров, Д.В. Денисов

Аннотация — В работе рассматривается задача динамического перераспределения неиспользуемых автомобилей каршеринг-сервиса с целью достижения согласования спроса и предложения.

В качестве критерия оптимизации выбирается минимизация потерь от неудовлетворенности спроса при минимальных затратах на перемещение автомобилей. В работе получены аналитические результаты относительно политики оптимального перемещения неиспользуемых автомобилей. Предложенная структура решения может быть применима к практическим задачам благодаря своей вычислительной эффективности, а также способности обрабатывать зависящие от времени требования.

Изначальная постановка задачи формулируется в терминах стохастического динамического

программирования. На первом этапе рассматривается упрощенная двухэтапная модель распределенной робастной оптимизации (ОКО), служащая в качестве иллюстрации используемого подхода. Далее демонстрируется вычислительно эффективная

многоступенчатая модель с расширенным линейным правилом принятия решения (ЕЬБК).

Результат, полученный в вычислительных экспериментах показывает, что масштабируемое численное решение ЕЬБК близко к оптимальному решению задачи динамического программирования.

Ключевые слова — каршеринг, оптимизация автопарка, динамическое программирование.

I. ВВЕДЕНИЕ

В последнее время в транспортной отрасли больших городов все более активно набирает популярность экономика совместного использования (Sharing economy). Почти в каждом крупном городе мира существует сервис, где пользователи могут взять в аренду автомобили, свободно припаркованные на улицах. Все это стало доступно благодаря развитию интернет-технологий, смартфонов, iOT устройств. Такие сервисы называются каршерингом. В ранних сервисах каршеринга пользователи должны были возвращать автомобили на те же станции, где автомобиль брался изначально, количество случаев, когда автомобиль возвращался на другую стоянку было минимальным, следовательно задачи по перераспределению транспортных средств не стояло.

В сервисах со свободной парковкой (free floating) клиенты могут использовать любые парковочные места на улицах в пределах гибкого региона обслуживания. Таким образом, могут возникать ситуации, когда распределение автомобилей по городу становится непропорциональным распределению потенциальных

точек спроса и эффективность работы сервиса для оператора сильно снижается.

В бизнесе каршеринга очень важным параметром является динамика изменения местоположения автопарка. Эту динамику необходимо тщательно исследовать для того, чтобы учитывать долгосрочные эксплуатационные факторы при управлении автопарком и при оптимизации принятия стратегических решений [18], [24].

В данной работе мы сконцентрируем внимание на операционной проблеме перемещения автопарка свободного (free-floating) каршеринг-сервиса с целью удовлетворения случайного спроса «в нужном месте» и «в нужное время».

II. Задача перераспределения автомобилей

Мы рассматриваем задачу перераспределения автомобилей каршеринг-сервиса, который работает в четко определенном регионе обслуживания. В отличие от систем на основе станций, в нашем случае доступны поездки в один конец: клиент может взять любую доступную машину. Клиент не сообщает системе назначение своей поездки и может вернуть машину в любой точке обслуживания.

Обозначим N количество зон, обслуживаемых оператором каршеринг-сервиса. Клиент может переместиться между любыми двумя зонами за одну поездку. Обозначим [N] множество натуральных чисел

от 1 до N. Обозначим WH число поездок клиентов из зоны i в зону j, Wj — число поездок, которые клиенты начинают и заканчивают в зоне i, Т^ — число

перегонов автомобилей компанией-оператором из зоны i в зону j .

На практике, компания-оператор совершает перегоны с некоторой периодичностью. Будем считать, что перегоны совершаются T раз в день. Так как число периодов T обычно невелико, мы можем предполагать, что как поездки клиентов, так и перегоны могут быть выполнены в течение одного периода. Например, если T = 4, то период в среднем составляет 6 часов, чего должно быть достаточно для поездки по городу. В целях удобства изложения мы не рассматриваем время, проведенное клиентом в поездке.

В дальнейшей записи будут использоваться

стандартные обозначения векторов и матриц. xi — i -й

элемент вектора х £ К . — единичным вектор с

единицей в -й координате. 1 — вектор, все координаты

которого равны 1. А £ КМхМ — матрица. Векторы со штрихами (напр. п') обозначают векторы-строки, без штрихов — столбцы.

Мы ставим задачу перераспределения автомобилей как задачу стохастического динамического программирования с горизонтом планирования в Т периодов.

Для каждого периода г:

• — случайное значение спроса на выезд из

зоны !;

• ^ = (dit) — вектор значений спроса на выезд

из всех зон;

• ^ = ,..., ^ ) — матрица значений спроса

до периода t включительно.

Предполагается, что спрос во всех областях в течение всего горизонта планирования определен и

описывается известным совместным распределением вероятности Р.

В начале периода t управляющей компании доступны

данные по распределению автомобилей: xt = (хи), где

X,,

автомобилей: r =

( ri ),

где

- автомобили,

= а^и с условием Е а^ = 1. Далее, средний

£ N ]

штраф за необслуженные заказы на поездки из зоны i мы обозначаем ри = Е ЩцРгц. Сформулируем

М N ]

стохастическую задачу динамического

программирования (1) для минимизации ожидаемой полной стоимости перегона автомобилей и штрафов за необслуженные заказы:

(х, 1 Е %+ер [л (х, г, й[4])]к1)

0^2 V äx,

ie[N]

i, je[N ]

В уравнении (1) матожидание берётся по условной вероятности при условии выполнения ^_1], и

3 (Х> Г> ) = Е р (^ _ ^ ) + ^+1 (Х+1> d[t])>

е[ N ]

где

''(<+1)

x,.., ^ X, +2 i - 2 Гц, + 2 ai«wfi - w<t, у е [N], < е [Т]

ie[JV] ie[N] Це[«]

w = min j d<t, xit + 2 j - 2 ri< f 'Vi е [N] ' <е [T]

[ i'e[N ] je[N ] f

— количество автомобилей в зоне i. Также

и окончательная стоимость

доступны предыдущие данные спроса d[t_1].

Перед прибытием очередных клиентов компания принимает решение о перераспределении

"г \'/> уг

перемещенные из зоны i в зону ] по стоимости > 0 за перегон.

После перераспределения клиенты, количество

которых равно djt, прибывают в зону i и занимают

свободные автомобили. Мы предполагаем, что каждый автомобиль используется для совершения не более, чем одной поездки в каждый период (аналогично [5]).

Заказ клиента, которому не досталось автомобиля в зоне i, считается потерянным со штрафом р^ > 0 (]

— зона назначения для данного клиента). Следует обратить внимание, что в системах со свободной парковкой компания-оператор не всегда может знать, в какой именно пункт назначения собирается ехать пользователь. Однако мы предполагаем, что компания-оператор знает вероятность а^, с которой поездка пользователя из зоны i в период г закончится в зоне ] . Таким образом, обозначив wit количество выполненных поездок из зоны i и WjJ-t количество выполненных поездок из i в ], мы можем записать равенство

УТ+1 (ХТ+1 ) = 0

Условие Е ] < хи в (1) обеспечивает, что общее

]£[М ]

количество перегонов автомобилей из зоны i не превышает количества доступных автомобилей хи до

перегона. В выражении (xt, г, d[t]) количество

доступных автомобилей Хг(г+1) на следующий период является суммой количества доступных автомобилей

после перегона: хи + Е ] _ Е ] и чистого притока

]£[ N ] ]£[м]

автомобилей после выполненных заказов:

Е а^^р _ wit. Количество выполненных заказов в

]£[N ]

зоне i равно меньшему из двух чисел: количеству всех заказов dit или количеству доступных автомобилей

Г

V •

после пеРегона xit + е rpt_ е

je[N] ;e[N]

Для упрощения записи обозначим л и v операторы минимума и максимума соответственно:

a л b = min (a, b) и a v b = max (a, b ) для

вещественных a и b. Мы покажем, как при определённых ограничениях на параметры стоимости

Pyt и syt, Функдия цены Vt (xt, d[t_!])

является

выпуклой по xt для всех

' -[г ].

Лемма 1. Предположим, что pit > Zs ни

для

1

всех i е[N] и t g [Г ]. Тогда,

J, (xt, rt, d[t] ) = mm 1 Z Pi> (dt - wit ) + Vt+i (xt+i, d[t] )J,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Wt L'g[N] J

при xi(t+i) = xi, + Z1- Z rm + Z aß'wß - wi,, Viе [N], (2)

wt, ^ ditЛ

je[N] jG[N] je[N]

( \ xu + Z1-Z, Vi G[ N]

l'e[N ] je[N ]

Vt (xt, d[t-1]) выпукла по xt для любых t G [Г ] и

d

[t-i]-

Условие pit > +1)aijt в Лемме 1 аналогично

j *i

условию в ([5]) и говорит о том, что средняя выгода от выполненного заказа из зоны i должна быть больше, чем средняя затрата на перегон автомобиля обратно в зону i в следующий период времени. В частности, это условие выполнятся в случае стационарной системы, т.

е. Pj = Pj , sjt = Sj и Pj ^ sji : выгода от выполненного заказа из зоны i в зону j должна превосходить стоимость перемещения автомобиля обратно из j в i. С этим условием, выражение (2) констатирует, что даже если управляющая компания имеет возможность ограничивать спрос, удерживая автомобили, лучшей тактикой является максимальное удовлетворение спроса в текущем периоде. В последующем изложении мы будем придерживаться этого условия.

Несмотря на выпуклость Vt (xt, d[t-1]), переменные

состояния в (1) имеют размерность N + (t — 1) и

страдают от «проклятья размерности». В этой связи в литературе, посвящённой снабжению с перевалкой грузов, отмечается: «оптимальная стратегия перевалки может быть найдена преимущественно при малом числе дислокаций по причине большой размерности, присущей большому числу дислокаций» ([29]). Большое количество работ посвящено случаю двух локаций (зон), например: [32], [11], [1]. В разделе 3 будет показана оптимальная стратегия для системы с 2 зонами при отсутствии зависимости спроса от времени. Затем будут рассмотрены практические применения для системы общего вида с N зонами и, в разделе 4, вариант с зависимостью спроса от времени.

III. Оптимальная стратегия перераспределения в

СИСТЕМЕ С 2 ЗОНАМИ

В этом разделе рассматривается система с двумя зонами 1 и 2. Для периода времени t, достаточно

обозначить г( количество перегнанных автомобилей из зоны 1 в зону 2, если г > 0 , и из зоны 2 в зону 1, если Г < 0. (Перегон в двух направлениях одновременно не

может являться оптимальным.) Далее, Г* = Г{ V 0 — количество автомобилей, перегнанных из зоны 1 в зону 2, а Г =-(Гл0) — количество автомобилей,

перегнанных из зоны 2 в зону 1. Обозначим snt и $2и

стоимость перегона из 1 в 2 и из 2 в 1, соответственно. Обозначим средние штрафы за необслуженный заказ

Ри = Р\\а\И + Ршаш и P2t = р2«а2» + p22ta22t . В этом разделе будет действовать предположение, что спрос не зависит от периода времени и что выполняется условие Леммы 1.

Обозначим общее количество автомобилей С = x1t + x21 (константа, единая для всех периодов t).

Это позволит снизить размерность пространства состояний до 1, используя в векторе состояния лишь число автомобилей в первой зоне Хи и помня, что

X2t = С Xt •

Обозначим

y = xt - r

число

автомобилей в зоне 1 после перегона. Оптимальная стратегия перераспределения выглядит следующим образом:

Утверждение 1. Предположим, что ри > для у £ {1,2} и у Ф1. Для каждого периода t,

существуют x и X, такие, что

1 ( xt ) =

X G

0, X

■У*( x, ) =

x, - x, , x, е [ x, , С ),

X е

0, x

x,, x, е[x,,С).

X и Х( обозначают нижний и верхний пороги

-1

оптимального перераспределения, соответственно. Они определены следующим образом:

х, = аг®00+ Ер Р^ (y,<1,)]},Х = ^ + Ер [Jt (y,(1,)]}.

Оптимальная стратегия перераспределения интуитивно понятна и похожа на политику управления базовым запасом в литературе, посвящённой теории управления запасами и управлению балансом наличности. Так, ([12]) рассматривают модель накопления запаса, соответствующую линейному изменению состояния; однако, в настоящей работе рассматривается двухпороговая стратегия со штрафами за потерянные заказы и нелинейным изменением состояния. Когда объём запаса в зоне 1 становится ниже

порога Х , оптимальным действием является перегон

-1

автомобилей из зоны 2 до достижения значения X ;

и

когда объём запаса в зоне 1 становится выше порога х(, то оптимальным действием является перегон автомобилей из зоны 1 до достижения значения х,; в

пределах «зоны комфорта»

x , xt

-1

оптимальным

является отсутствие действия. Как можно ожидать, с увеличением стоимости перегона в период t

расширяется интервал x , xt ,, т. е. управляющая

L -1 J

компания с большей вероятностью сочтёт бездействие оптимальным. Эти интуитивные рассуждения подтверждаются следующим следствием:

Следствие 1. Предположим, что p > S^^M^ для

i, j G{1,2} и j Ф i . Для каждого периода t x

-1

уменьшается с ростом s21t и увеличивается с ростом

При Т = 1 оптимальная стратегия перераспределения может быть выражена в замкнутой форме (индекс , опущен для ясности):

Следствие 2. При, Т = 1 пусть Ё (•) будет

функцией надёжности для di (I = 1,2 ) и пусть х и

- о

х0 будут решением двух следующих уравнений соответственно: *21 + РЁ (У) + РгЁ (С - У) = 0, -512 + РЁ (У) + РгЁ (С - у) = 0. периоды <

по причине «проклятья размерности». В имеющейся литературе предложены приближённые методы, позволяющие обойти вычислительную сложность задачи; однако, более значительным препятствием

является оценка совместного распределения ], т. е.

спроса во всех зонах во все периоды времени. Такую оценку трудно, если вообще возможно, получить на практике. В данном разделе для решения задачи в условиях ограниченной информации о спросе будет применён подход распределённой робастной оптимизации (БЯО), в котором нет чёткой информации о распределении; считается, что распределение принадлежит некоторой области неопределённости. Сформулированная в итоге задача многопериодной робастной оптимизации, однако, является вычислительно сложной. Для преодоления вычислительной сложности будут предложены приближённые решения, основанные на расширенном линейном правиле принятия решений (БЬБЯ).

V. Множество неопределённости Пусть КN,М — пространство измеримых функций

RN пМ

в К , ограниченных на компактных множествах. Аналогично тому, как сделано в разделе 3,

мы обозначаем ^ = (^) , где ^ =(dit) и ^0] = 0. Таким образом, хранит весь спрос в

с 1 по t . Пусть P0 ( RNT )

множество всех

Тогда нижний и верхний пороги оптимального

перераспределения равны соответственно X = X+ Л С

- - 0

и х = х0+ л С.

Из следствия 2 можно видеть, что оптимальная стратегия перераспределения и, соответственно, оптимальная ожидаемая полная стоимость зависит лишь

от безусловного распределения d1 и d2, но не из

совместного распределения. То есть, в случае Т = 1 оптимальная стратегия не зависит от корреляции спроса между зонами. При Т > 1 это утверждение уже не является истинным, что подтверждается численными экспериментами.

В завершение данного раздела отметим, что простая двухпороговая стратегия, изложенная в Утверждении 1, работает лишь при 2 зонах и в предположении независимости спроса от времени. Так, ([5]) показывают, что для системы с многими зонами, оптимальная стратегия перераспределения уже не может быть описана с помощью порогов. Тем не менее, анализ этой простой системы поможет оценить эффективность приближённых алгоритмов в сложных системах.

IV. Подходы, связанные с распределённой

РОБАСТНОЙ ОПТИМИЗАЦИЕЙ

Как отмечалось выше, динамического стохастического программирования трудноразрешима

распределений случайного вектора длины N x T и W — носитель распределения d[T ]. Вместо предположения

точного знания совместного распределения d[T ],

обозначаемого P е Pn ( RNT ) , будем предполагать, что

P лежит в множестве неопределённости

F с P0 ( RNT ), заданной частичной информацией о

распределении, оцениваемой по имеющимся данным.

Выбор множества неопределённости F существенно влияет на разрешимость задачи в робастной постановке. Как отмечается в ([7]) представление множества неопределённости в виде конуса второго порядка (second order cone, SOC, или конуса Лоренца) даёт возможность сформулировать задачу DRO в виде задачи конического программирования второго порядка (second order cone programming, SOCP), которая может быть эффективно решена коммерческими решателями, например CPLEX или Gurobi. Мы задаём множество неопределённости в следующим образом:

Ep (d) = ц

Ep ( (dt-ми )2 )<^2 v/ е [ N ], t е [T ]

( / , Л2л

F =\

P g P0 ( RN )

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

£l'(d/ - ц/ ) vk,t g [T ], k < t

/=k

(d g(d,d ))

=1

s12t .

Данное множество представимо в виде SOC, т. к.

носитель W =

d, d

представимо в виде SOC и все

используемые функции представимы в виде SOC. Такое множество неопределённости требует лишь простой описательной статистики входных данных и позволяет моделировать богатое многообразие структурной информации о случайном спросе. В частности, используется ограниченный носитель:

= 1 ; информация о матожидании

P (d е (d, d ))

EP (d) = ц и о втором EP ( (dit - jUit )2 ) < < • Наконец, информация о

моменте

P

частичном

EpÎ4'

I=k

Zl'(di -Ц,)

смешанном <- '2

моменте

— Уы чувствительна к

^ — ^ J

корреляциям спроса между зонами и периодами времени, характерными для передвижения на автомобиле.

Аналогично ([7]), мы вводим дополнительные случайные вектора и и V и рассматриваем т. н. «поднятое множество неопределённости» О :

Е0 (1) = ц

G =

Q е P

Г (Г+1)

RNr х RNr х R

Eq ((»it-Uit)2)<<2 Vi е [ N ], t е[Г] Eq ( Vkt )<y2 Vk,t е [Г ], k < t

Q ((d, u, v )c W ) = 1

Здесь W — это «поднятый носитель», определяемый

как

W =

d < d < d

Г(Г+1) D

'd, u, v) е Rш х Rш х R~ (dit -U)2 ) < U, < »

Vi е [N], t е[Г] Z1'(d, - ц, )|< vt < vkt, Vk,t е[Г ], k < t

где uit = max

vkt = max'

{(dt-U )2, (dit-Ut )2}

Z 1'(d,-ц, ))2, Z 1'(d,-ц ))2}

l=k v l ' l=k

VI. «БЛИЗОРУКОЕ» робастное решение

Рассмотрим однопериодную задачу (T = 1). Решение этой задачи может служить «близоруким» (Myopic) вариантом решения многопериодной задачи, в котором управляющая компания анализирует лишь стоимость перегона и штрафа за необслуженные заказы на текущем периоде, не учитывая будущие периоды. Эта простая робастная модель служит одновременно иллюстрацией различных подходов и техник, используемых в DRO и эталоном для сравнения при разработке общей многопериодной модели. Для ясности в дальнейшем изложении опущен индекс t.

Исходя из множества неопределённости вероятностных распределений F, управляющая компания стремится минимизировать оценку стоимости, соответствующую наиболее неблагоприятному случаю в

F :

min Z sr.. + sup EP r >0 ¿—i 1 1 „ i P

i, Je[N ]

w.

Z pt (dt - w, (d))

Zr. < x,, Vi е [N](3)

Je[N ]

f I

(d)< dt л x +Z1 -Z r1 - , Vd е W, i g[N]

^ Je[ n ] 1е[ N ] )

Задачу (3) можно рассматривать как двухэтапную: г = (Ту ) — это решение о перераспределении «здесь и

сейчас», до обслуживания заказов, а (1) —

адаптивное решение после обслуживания заказов, на

втором этапе. Аналогично Лемме 1, wi (1) можно

трактовать как решение по объёму удовлетворения спроса, и, поскольку будущий спрос не учитывается в анализе, оптимальным считается максимальное удовлетворение текущего спроса. Данная двухэтапная задачу БЯО может, с использованием «поднятого» множества неопределённости, быть преобразована следующим образом:

Лемма 2. Двухэтапная задача распределённой робастной оптимизации (3) эквивалентна следующей задаче оптимизации:

Ч? X ^ + п'Ц Г2Я(4)

Утверждение 2. Множество безусловных распределений О под О для всех О £ О , т. е. П □, эквивалентно множеству неопределённости Р. То есть, Р = П □ О .

Отметим, что О — это множество распределений

случайного вектора (1, и, V), в то время как

изначальное множество неопределённости Р состоит из распределений только 1. Утверждение 2 расширяет теоремы «поднятия» из ([7]) путём ввода верхних границ для дополнительных переменных и и V .

Л,ц e,r >о,5>о

при

, 1e[n ]

e[N ]

А + n'd+ Ze,»+ôv > Z P,i d, - x, - Z 1 + Z r I , V(d, u, v )e W

,e[N] ,E[N] ^ JE[N] JE[N]

Z r < x,, V, E[ N ]

je[n]

Задача оптимизации (4) непосредственно в такой постановке не является разрешимой по причине использования кусочно-линейных функций в суммах и бесконечного количества ограничений.

Переформулируем эту задачу в терминах задачи выпуклой оптимизации.

Утверждение 3. Пусть Р (N) — множество всех подмножеств [[Ы]. Точное решение двухэтапной оптимизационной задачи (3) можно получить, решив следующую задачу конического программирования второго порядка:

An ]

g[N ]

min

P( S),p( S),p( S),ß0(S ),p, ( S),p0( S)

y,= x, + S r, -Sr,'V g[N ]

,g[N] ,g[N]

Л + Spy > в(S)'d- P(S)'d+ il'P(S) +1 ßo (S)-Sp, (S)'b, - Po (S)bo,VS G P (N)

,gs - 2 2 ,g[ n ]

f n - p (S Г 'P(S)-P (S f

9 = 0 + S (A',p,(S) + ß (S)c,) + A'0 P0 (S) + ß0C0, VS g P (N)

0 ,G[n]

□ p,(S ) □ <ß( S ), V, g [ N ], VS g P ( N )

□ p0 (S)□ < ß0 (S), VS g P (N) S r, < x,, Vi g [N]

,g[n ]

9 > 0,S> 0, r > 0,p(S), P(S)> 0, VS g P (N)

где

0 0

1' 0'0 fl'^1 e', 0' 0 M 1

0' 0'1 , b0 =1 1 1, c0 = 0 , A, = 1 , b, =1 1 1, c = —e,

0 -e' 0 2 '

2_ l 2 ) 1 , 2 2 ' l 2 ) 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vi G [N], p(S) = (p,(S)),g[

(Pi (S) = Pi, если i e S, и 0 в противоположном случае).

В таком виде предложенная «близорукая» модель разрешима коммерческими решателями, такими как CPLEX и Gurobi, с использованием формулировки SOCP из Утверждения 3. Однако число параметров принятия решения и ограничений экспоненциально растёт от N из-за множества всех подмножеств

P (N) . Следовательно, получение точных оптимальных решений по этой модели ограничено случаями малого N. Как отмечают ([2]), задачи, в постановке которых участвуют кусочно-линейные функции, как правило, NP-трудны. В этой связи часто используется приближение кусочно-линейной функции в виде линейного правила принятия решений (linear decision rule). В настоящей работе данная идея используется при построении эвристики для многопериодной задачи. В разделе 6 будет показано, что предложенный приближённый алгоритм находит точное оптимальное решение для однопериодной задачи, при выполнении некоторого мягкого условия.

VII. МНОГОПЕРИОДНОЕ РОБАСТНОЕ РЕШЕНИЕ

Как уже показано в разделе 4, даже в однопериодной задаче адаптивные решения являются кусочно-линейными функциями спроса, и постановка робастной модели (5) имеет экспоненциально большое число переменных и ограничений. В многопериодной задаче,

перераспределение rijt, состояние системы xit и число

выполненных заказов wit являются результатом

адаптивного выбора, представляемого функциями общего вида от всего предыдущего спроса, из-за чего

задача становится ещё сложнее, чем в однопериодном варианте. Особо отметим, что мы считаем адаптивный выбор «не заглядывающим в будущее», т. е. адаптивный выбор rit, xit, wit представляется в виде функций:

rjt (d[t]-1), xit (d[t]-1) и . Wt (d[t]) зависит от d[t], в

то время как rijt и xit зависят от d[t]-1, выбор wit

производится после удовлетворения спроса в период t .

Известна техника аппроксимации адаптивного выбора под названием «линейное правило принятия решений» (linear desicion rule, LDR). Данная техника ограничивает выбор аффинными функциями случайных переменных, участвующих в постановке задачи. В описанном случае достаточно наложить условие линейности на

rm (d[t]-i), xit (d[t]-i) и wit (dt):

Xt (•) E LN (dH-i),r (.) E LN2 (dM-i),w, (•) E LN(dt), Vt E [T].

LM (dt) обозначает множество всех измеримых

отображений RNt в RM, аффинно зависящих от спроса во всех зонах и всех периодах, до t включительно:

LM (dt ) = Ь G R

Зу0, у'е КМ, i е [ N ], I е[,]: у (ё,) = у0 + £ уАЦ

В дальнейшем изложении используются одинаковые обозначения для аффинных отображений и соответствующих им линейных коэффициентов; однако, для последних будут дополнительно использоваться верхние индексы. Так, в ЬБЯ для периоде ,

аддитивный вектор аффинного отображения х, (•)

а вектор наклона аффинного Г (•), соответствующего d и,

обозначается х,

отображения

обозначается г]и.

Для определения «поднятого» множества неопределённости О из раздела 4.1 важно соответствующим образом улучшить ЬБЯ-

приближение. К примеру, вместо задания wit (•) линейной функцией лишь от , можно использовать и информацию из дополнительных случайных переменных и и V, сделав линейной функцией от

(d[t],иМ, ^]) , где и[,] ' = (и1 .. и, ') . и, = К )].

V[t] ' = (Уы ^а . Vt е[Т].

Формально говоря, накладываются следующие ограничения:

х(> ^м.иИ].V[t_1]).Г(•)е Р^.и^-,])^.и^). где

1(1+1)

\ 2Nt+—-¿M

L (^[,],И[,],Г[,])= {yGR 2

y (d[tj ,u[tj ,v[t]) =y0 +

^y0,yil,y,2l,ykl g rM :

i E [Nj ,k E [lj ,l E [t j :

Z y1ldil+

'e[ N j

Z y2lun+

¡£[N],1£[1]

ZZy3klvkl

(для любого положительного М) — множество

t(t+1)

2 Nt +—--'- М

измеримых функций из К 2 в к , которые являются аффинно зависимыми на данных, полученных

. е. d[tjG R

Nt

u[tj . R

Nt

на настоящий момент, т

г (t+1)

V[t] £ 1К 2 . Вышеописанное правило принятия

решений, использующее дополнительную информацию из «поднятого» множества неопределённости, в литературе встречается под названием «расширенное линейное правило принятия решений» (ЕЬБЯ). Эмпирически показано, что ЕЬБЯ имеет намного большую эффективность, чем ЬБЯ ([7]).

Определив аффинные отображения для адаптивного выбора, переходим к постановке многопериодной БЯО, которая минимизирует ожидаемую (по всему горизонту планирования) полную стоимость для наиболее неблагоприятного случая, в рамках «поднятого» множества неопределённости С с использованием Е1ЛЖ:

т.п XX р (у)(6)

Ун = Х.1 + X/ £ [N] / - X £ [N] Ту1, V/ £ [ N]

X Т/1 — Х/1, V/ £ [ N ]

/£[N ]

где

F (У1 ) = minsup Ес

zzp, (d't - W, (-))+ Z Zv+i-^O

t.[T j'e[wj t.[T—1]je[Nj

i7)

при

Z rjit+I) (•) s Xj(t+1 (•), V(d,u, v) g W ,j g [ N]j g [t —1]

Je[n]

0 s Г,м(-) ,v(d,u, v).W ,i, j g[ N ],t g [T —1]

Xj(t+1) (•) = x, (-)+Z (ai.Wlt (•)+ j ОЬ«^^г, (•)),v(d, u, v) g W, j g[n ],t g[t—1]

JE[N]

У,(,+■) = X (,+■)(•)+ Z-,(,+■)(•)— ZW^i^u v)gW,j g[ N]j g[t—1]

,G[N] j£[N]

где x.

,0E p id[t], u[t], v[t] )И wti-). p iu[t], v[t] ).

W

Л

(•) = d,t л x,t • +Zj g [N] j (.)-Z j (•)

'v Je[n] )

является нелинейной функцией, что приводит к тому,

что постановка неразрешима. Напротив, вскоре будет показано, что что наложение условия аффинности на

wt (•), xt (•) и г. (•) обеспечивает решение с

помощью ЕЬБЯ (6) с хорошим быстродействием.

Аналогично Лемме 2, выразим Р (у1) как решение

задачи минимизации:

Лемма 3. Многопериодная задача ВЯО Р (у1) эквивалентна следующей задаче:

п'ц +X^+ XrA(8)

' ' /£[N] к,ЦТ]

x,+I, xi,(,+l), xi,(,+I),x ü(í+i)

r 0 rI r 2 r3

rt+I,ril(t+ï) ,ril(t+I),rkl(t+I)

t.[T j

k S t

удовлетворяющей ограничениям из (7) и

X + n'd + Zu + Z Sv, > ZP, (d, — W, (•))+ Z Sj(,+I)rj(,+1) (•), V(d,u, v) g W j.[N ] k .'£T ] 'G N] j.->E[N ]

t£ T] kSt íe[T] ie[ T—l]

где x,,

По сравнению с задачей стохастического динамического программирования (2) из раздела 3, многопериодная БЯО в постановке (6) стремится минимизировать целевой показатель в худшем случае по всем возможным распределениям О в множестве

неопределённости О . Заметим, что на функции ^ (•)

не наложено вышеуказанное условие аффинности, то тем не менее по Лемме 1 выбор оптимального удовлетворения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г

.(•)£LN(d[t],U[t],V,]), Г+1 0£ ^ (йИ,иИ,д и

wt+l 0£ L N (d[t] ,u[t], v[t]).

Параметры, участвующие в ЕЬБЯ, на первом этапе являются параметрами принятия решения, с целью минимизации стоимости для худшего случая. Более того, ограничения в задаче (8) линейны, поскольку адаптивный выбор х, г, w в ЕЬБЯ линеен по

(1, и, V) £ W . Таким образом, задача (8) является

задачей линейной оптимизации с бесконечным числом ограничений. Аналогично тому, как сделано в Утверждении 3, можно преобразовать робастную оптимизационную задачу (8) и следом за ней задачу (6) в 8ОСР, которая может быть решена стандартными коммерческими решателями.

Отметим, что в практической реализации (и в численных экспериментах в разделе 5) решение задачи (6) происходит со скользящим горизонтом планирования. В каждый период реализуется решение по принципу «здесь и сейчас». К примеру, в первый период из решения задачи (6) используется лишь г1 , без

обязательств использовать г2 во втором периоде. По достижении второго периода задача (6) решается вновь с горизонтом [Т — 1] и из получившегося решения

берётся г2 . Подобная техника широко применяется в

эвристических алгоритмах динамической оптимизации. Подход на базе ЕЬБЯ не только позволяет поставить задачу в разрешимом виде, но даёт и некоторые другие полезные результаты. В частности, в системе с 2 зонами, стратегия перераспределения, полученная из ЕЬБЯ в разделе 5, сохраняет двухпороговую структуру из Утверждения 1.

VIII. Оптимальность ЕЬБЯ для случая т=1

В разделе 4 был предложен подход с получением «близорукого» робастного решения однопериодной

двухэтапной задачи DRO (3). В постановке этой задачи в виде SOCP число параметров принятия решения и ограничений экспоненциально растёт, что препятствует эффективной реализации задач большого размера. В данном разделе будет показано, что предложенная эвристика на базе ELDR приводит к оптимальному решению (3) при выполнении одного мягкого

технического условия. Предположим, что Z является оптимальным решением задачи (3). ELDR, применённый к задаче (3), выдаёт следующий результат:

ZELDR = X W + sup eq [л (d - W (duv))]

" i, je[N ] QeG L 4 /J

w(-)eL N (d,u ,v)

X rv < x,, Vie[N]

je[N ]

( Л -

wi (d, u, v)< dt л x, + X rp-X Гц , V(d, u, v) e W, i e[ N].

^ je[N ] je[N ]

В данной постановке корректирующее решение w (•)

должно быть линейной функцией от d, u и V, в то

время как в (3), w (•) является функцией только от d ,

но не обязательно линейной. (Благодаря Лемме 1, мы знаем, что оптимальное корректирующее решение является кусочно-линейной функцией, например

w.

( d ) = di

л

■I

HN ]

r —

j'

I

\

). Тем не менее,

V ] зЦх] У

можно показать, что при отсутствии сильной антикорреляции между разными зонами, ЕЬБЯ выдаст оптимальное решение (3).

т-ЕЬЭК гу* = А .

Утверждение 4. Если Y

Техническое ограничение

<7; не является

необходимым для достижения АЕЬШ = А , что было показано в численных экспериментах. Также, однако, были найдены случаи при малых у, в которых

А * < АЕЬЖ.

Утверждение 4, на фоне скудной литературы, посвящённой ЬБЯ, является стартовой точкой для новых исследований на тему применимости ЬБЯ к задачам робастной оптимизации. В частности в ([20]) предложены ограничения для оптимальности ЬБЯ для случая, когда множество неопределённости содержит лишь информацию о носителе, а ([15], [7]) доказывают оптимальность ЕЬБЯ для двухэтапной задачи с осуществлением выбора на втором этапе в одномерном пространстве. Ни один из этих двух результатов не применим к (3), где множество неопределённости содержит в т. ч. информацию о моментах и на втором этапе выбор производится в -мерном пространстве. Используя особенности нашей задачи, Утверждение 4 доказывает, что ЕЬБЯ может быть оптимальным и для двухэтапной БЯО с произвольным количеством корректирующих решений.

IX. Численные эксперименты

Были проведены численные эксперименты с различными настройками для оценки эффективности решения многоэтапной робастной ELDR (для краткости будет называть его ELDR-решением) и предварительных выводов в т. з. управления автопарком. В первом эксперименте ELDR-решение в двухзонной системе сравнивается с оптимумом, полученным решением задачи динамического программирования.

Используются симулированные данные с известным распределением. Далее, обсуждается влияние автокорреляции спроса по времени и эффективность использования информации о частичном смешанном моменте в множестве неопределённости.

Помимо изучения работы метода на симулированных данных, были предварительно рассмотрены две модификации метода для изучения следующих вопросов: (1) может ли ELDR быть улучшен посредством учёта корреляций во времени и пространстве? (2) какова эффективность ELDR при наличии ограничения на количество перегонов в один период времени?

Все эксперименты проводились в пакете CPLEX на ОС Windows с частотой процессора 3.2 ГГц и 32 ГБ оперативной памяти. Помимо представленных в настоящей работе методов, для сравнения также использовался метод, решающий задачу средних значений (Mean Value Program, MVP), в которой каждая переменная фиксируется на своём средним значении

/ ,iN, tT. (Задача MVP решается как задача

динамического программирования, см. Приложение Б.1) Аналогично ELDR-решению, во всех численных экспериментах MVP-решение применялось со скользящим горизонтом планирования.

X. Система с двумя зонами

В данном разделе сравниваются решения, полученные из разных моделей стохастического динамическое программирование (DP), MVP, «близорукой» (Myopic) и ELDR. Рассматривается система с 212 автомобилями и двумя зонами (большее количество зон не представлялось возможным протестировать из-за «проклятья размерности», присущего DP). Горизонт

планирования был выбран T = {1,2,3,4} . Для каждого

периода t , матожидание спроса в двух зонах равно

/ = 176 и /2t = 36. Распределение поездок, штраф

за невыполненный заказ и стоимость перегона приведены в Приложении Б. 2.

Оценка эффективности проводилась с моделированием спроса по разным распределениям: усечённое нормальное, равномерно и пуассоновское. В нормальном распределении было выбрано среднее /ли и

стандартное

отклонение

Для

равномерного распределения был выбран интервал

[0.5/,1.5/ ]. Средняя интенсивность поступления заказов в распределении Пуассона также была равна /. Было проведено 20000 численных экспериментов с

симулированными данными, имеющими вышеуказанные распределения. Результаты были сравнены по общей стоимости при одинаковых начальных количествах автомобилей в двух зонах.

В Таблице 1 приведенные разности между средней общей стоимостью по каждой из трёх моделей (MVP, Myopic, ELDR) и DP, относительно средней общей стоимости DP. Эффективность ELDR отличается от DP, выдающего точное оптимальное решение, не более чем на 6%, и в большинстве случаев не более 2%. Примечательно, что относительная эффективность ELDR не имеет зависимости от вида распределения спроса. При T = 1, Myopic и ELDR совпадают, что было показано в Утверждении 4. Однако, при более долгом горизонте планирования, MVP и ELDR «обгоняют» Myopic, в котором не учитывается влияние решения, принятого в текущий период, на будущую ситуацию.

Таблица 1: Измерения эффективности трёх моделей относительно DP при трёх видах распределения спроса

На Рис. 2 изображена вневыборочная средняя дневная стоимость с использованием БР, ЕЬБЯ и ЕЬБЯ-2. При всех трёх подходах дневная стоимость увеличивается с ростом автокорреляции по времени. Кроме того, ЕЬБЯ-2 существенно уступает ЕЬБЯ по эффективности. Разрыв между ЕЬБЯ и ЕЬБЯ-2 увеличивается с ростом автокорреляции по времени, что явно свидетельствует о необходимости учитывать информацию о частичном смешанном моменте. Более того, при масштабирующих факторах больше 2 ЕЬБЯ демонстрирует лучшие результаты, чем БР, игнорирующий корреляции по времени.

Масштабирующий коэффициент

Распределение T Улучшение по сравнению с DP

MVP Myopic ELDR

Нормальное 4 7.51% 40.20% 5.21%

3 10.15% 35.13% 5.33%

2 8.12% 22.66% 1.76%

1 20.10% 1.23% 1.23%

Пуассоновское 4 8.35% 14.51% 4.67%

3 6.74% 11.86% 2.63%

2 6.51% 7.60% 1.34%

1 7.23% 1.52% 1.52%

Равномерное 4 12.80% 38.27% 3.62%

3 9.12% 31.03% 1.20%

2 13.37% 21.36% 3.28%

1 27.35% 1.32% 1.32%

Следующий эксперимент посвящён исследованию временных корреляций при нормальном распределении спроса и Т = 4. Спрос в зоне / в период / выражается

- 2

в виде =/ +£■+ ПЦ, где £ - N(0,СТ;) и

Т ~ N (0, ст2 ). Случайная переменная ^ зависит

- 2

только от зоны, но не от времени. Её дисперсия <гг-имеет масштабирующий множитель:

- 2

Gi е

Л

Er

ч2Л

Sl'(d, — ft )

J=k

^ •

{0.5 х ст2,ст2,1.5 х ст2,2 х ст2,2.5 х ст2,3 х ст2} .

Большие масштабирующие множители приводят к увеличению автокорреляции спроса по времени. Для оценки эффективности включения в Р информации о частичном смешанном моменте, был реализован вариант метода (ЕЬБЯ-2), в котором множество неопределённости не имело ограничения

Рисунок 2: Сравнение DP, ELDR и ELDR-2 с автокорреляцией по времени

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

XI. Заключение

В настоящей работе изучается задача перераспределения автомобилей при свободной (free-float) системе парковки. Сначала задача формулируется как задача стохастического динамического программирования. Показано, что двухпороговая стратегия перераспределения является оптимальной для системы с двумя зонами. Для решения задачи с большим числом зон и учёта зависимости спроса от времени, предлагаются две модели распределённой робастной оптимизации (DRO): «близорукая» (Myopic) двухэтапная модель и многоэтапная модель ELDR. Доказана оптимальность ELDR при решении однопериодной задачи DRO. С помощью численных экспериментов показано, что ELDR в случае двух зон по эффективности близка к оптимальному решению, полученному как решение задачи стохастического динамического программирования.

Несмотря на то, что предложенная методика и рассмотренные практические применения касаются систем со свободной парковкой, модель ELDR может быть распространена и на системы, в которых автомобили перемещаются между станциями, путём добавления ограничений на вместимость станций. Забегая ещё дальше, представляет интерес не только централизованное управление автопарком, но и предоставление самим клиентам скидок или премий за перемещение автомобилей. Это можно считать ещё одним потенциальным направлением для исследования.

XII. Библиография

[1] Abouee-Mehrizi, Hossein, Oded Berman, Shrutivandana Sharma. 2015. Optimal joint replenishment and transshipment policies in a multi-period inventory system with lost sales. Operations Research 63(2) 342-350.

[2] Ardestani-Jaafari, Amir, Erick Delage. 2016. Robust optimization of sums of piecewise linear functions with application to inventory problems. Operations research 64(2) 474-494.

[3] Bellos, Ioannis, Mark Ferguson, L Beril Toktay. 2017. The car sharing economy: Interaction of business model choice and product line design. Manufacturing & Service Operations Management 19(2) 185-201.

[4] Benjaafar, Saif, Guangwen Crystal Kong, Xiang Li, Costas Courcoubetis. 2018. Peer-to-peer product sharing: Implications for ownership, usage and social welfare in the sharing economy. Management Science.

[5] Benjaafar, Saif, Xiang Li, Xiaobo Li. 2017. Inventory repositioning in on-demand product rental networks. Working paper, University of Minnesota.

[6] Bertsimas, Dimitris, Melvyn Sim. 2003. Robust discrete optimization and network flows. Mathematical programming 98(1-3) 49-71.

[7] Bertsimas, Dimitris, Melvyn Sim, Meilin Zhang. 2018. Adaptive distributionally robust optimization. Management Science.

[8] Bimpikis, Kostas, Ozan Candogan, Saban Daniela. 2016. Spatial pricing in ride-sharing networks. Working paper, Stanford Graduate School of Business.

[9] Boyaci, Burak, Konstantinos G Zografos, Nikolas Geroliminis. 2015. An optimization framework for the development of efficient one-way car-sharing systems. European Journal of Operational Research 240(3) 718-733.

[10] Cachon, Gerard P, Kaitlin M Daniels, Ruben Lobel. 2017. The role of surge pricing on a service platform with self-scheduling capacity. Manufacturing & Service Operations Management 19(3) 368-384. car2go. 2016. https://www.car2go.com/.

[11] Chen, Xin, Xiangyu Gao, Zhenyu Hu. 2015. A new approach to two-location joint inventory and transship- ment control via L-convexity. Operations Research Letters 43(1) 65-68.

[12] Eppen, Gary D, Eugene F Fama. 1969. Cash balance and simple dynamic portfolio problems with propor- tional costs. International Economic Review 10(2) 119-133.

[13] Erera, Alan L, Juan C Morales, Martin Savelsbergh. 2009. Robust optimization for empty repositioning problems. Operations Research 57(2) 468-483.

[14] Febbraro, Angela, Nicola Sacco, Mahnam Saeednia. 2012. One-way carsharing: solving the relocation prob- lem. Transportation Research Record: Journal of the Transportation Research Board (2319) 113120. Financial Times. 2017.

[15] China's bike-sharing boom in charts. https://www.ft.com/content/

[16] Forbes. 2017. China's Innovative Smartbike Sharing Startups are Hitting Obstacles At Home And Abroad. https://www.forbes.com/sites/bensin/2017/04/05/chinas-innovative-station-less-bike-shares-hit-obstacles-at-home-and-abroad/

[17] Fraiberger, Samuel P, Arun Sundararajan. 2015. Peer-to-peer rental markets in the sharing economy. NYU 1 Stern School of Business Research Paper.

[18] He, Long, Ho-Yin Mak, Ying Rong, Zuo-Jun Max Shen. 2017. Service region design for urban electric vehicle sharing systems. Manufacturing & Service Operations Management 19(2) 309-327.

[19] Hu, Ming, Yun Zhou. 2016. Dynamic type matching. Working paper, Rotman School of Management.

[20] Iancu, Dan A, Mayank Sharma, Maxim Sviridenko. 2013. Supermodularity and affine policies in dynamic robust optimization. Operations Research 61(4) 941-956.

[21] Jiang, Baojun, Lin Tian. 2016. Collaborative consumption: Strategic and economic implications of product sharing. Management Science.

[22] Kabra, Ashish, Elena Belavina, Karan Girotra. 2016. Bike share systems: Accessibility and availability. Working paper, INSEAD.

[23] Kek, Alvina GH, Ruey Long Cheu, Qiang Meng, Chau Ha Fung. 2009. A decision support system for vehicle relocation operations in carsharing systems. Transportation Research Part E: Logistics and Transportation Review 45(1) 149-158.

[24] Lu, Mengshi, Siqian Shen, Zhihao Chen. 2017. Optimizing the profitability and quality of service in carshare systems under demand uncertainty. Manufacturing & Service Operations Management.

[25] Nair, Rahul, Elise Miller-Hooks. 2011. Fleet management for vehicle sharing operations. Transportation Science 45(4) 524-540.

[26] New York Magazine. 2015. Can car2go transform new york into a city of drivers? http://nymag.com/daily/intelligencer/2015/01/car2go-car-sharing-new-york.html

[27] Nourinejad, Mehdi, Sirui Zhu, Sina Bahrami, Matthew J Roorda. 2015. Vehicle relocation and staff rebalancing in one-way carsharing systems. Transportation Research Part E: Logistics and Transportation Review 81 98-113.

[28] O'Mahony, Eoin, David B Shmoys. 2015. Data analysis and optimization for (citi) bike sharing. AAAI. 687-694.

[29] Paterson, Colin, Gudrun Kiesmüller, Ruud Teunter, Kevin Glazebrook. 2011. Inventory models with laterale transshipments: A review. European Journal of Operational Research 210(2) 125-136.

[30] Shu, Jia, Mabel C Chou, Qizhang Liu, Chung-Piaw Teo, I-Lin Wang. 2013. Models for effective deployment and redistribution of bicycles within public bicycle-sharing systems. Operations Research 61(6) 1346-1359.

[31] Simchi-Levi, David, Xin Chen, Julien Bramel. 2005. The logic of logistics. Theory, Algorithms, and Applications for Logistics and Supply Chain Management.

[32] Tagaras, George. 1989. Effects of pooling on the optimization and service levels of two-location inventory systems. IIE transactions 21(3) 250-257.

[33] Tang, Christopher S, Jiaru Bai, Kut C So, Xiqun Michael Chen, Hai Wang. 2016. Coordinating supply and demand on an on-demand platform: Price, wage, and payout ratio. Working paper, UCLA Anderson School.

[34] Taylor, Terry. 2017. On-demand service platforms. Manufacturing & Service Operations Management.

Багров Никита Сергеевич, аспирант кафедры исследования операций факультета вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова.

Россия, 119992, г. Москва, ГСП - 1, Воробьевы горы, МГУ им. М.В. Ломоносова.

E - mail: nikitacmc@gmail.com

Денисов Дмитрий Витальевич, доцент кафедры исследования операций факультета вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова.

Россия, 119992, г. Москва, ГСП - 1, Воробьевы горы, МГУ им. М.В. Ломоносова.

E - mail: dvden@bk.ru

Dynamic fleet redistribution in carsharing

N. S. Bagrov, D. V. Denisov

Abstract - The paper deals with the problem of dynamic redistribution of unused cars in order to achieve a harmonization of supply and demand in carsharing service. The optimization criterion is minimization of losses from demand dissatisfaction with minimal costs for operating vehicles. The paper obtained analytical results regarding the policy of optimal movement of unused vehicles. The proposed solution structure can be applied to practical problems due to its computational efficiency, as well as the ability to handle time-dependent requirements.

The initial formulation of the problem is formulated in terms of stochastic dynamic programming. The first stage considers a simplified two-stage model of distributed robust optimization (DRO), which serves as an illustration of our approach. The following demonstrates a computationally efficient multi-stage model with an extended linear decision rule (ELDR).

The result obtained in computational experiments shows that the scalable ELDR numerical solution is close to the optimal solution of the dynamic programming problem.

Keywords - carsharing, fleet optimization, dynamic programming.

References

[1] Abouee-Mehrizi, Hossein, Oded Berman, Shrutivandana Sharma. 2015. Optimal joint replenishment and transshipment policies in a multi-period inventory system with lost sales. Operations Research 63(2) 342-350.

[2] Ardestani-Jaafari, Amir, Erick Delage. 2016. Robust optimization of sums of piecewise linear functions with application to inventory problems. Operations research 64(2) 474-494.

[3] Bellos, Ioannis, Mark Ferguson, L Beril Toktay. 2017. The car sharing economy: Interaction of business model choice and product line design. Manufacturing & Service Operations Management 19(2) 185-201.

[4] Benjaafar, Saif, Guangwen Crystal Kong, Xiang Li, Costas Courcoubetis. 2018. Peer-to-peer product sharing: Implications for ownership, usage and social welfare in the sharing economy. Management Science.

[5] Benjaafar, Saif, Xiang Li, Xiaobo Li. 2017. Inventory repositioning in on-demand product rental networks. Working paper, University of Minnesota.

[6] Bertsimas, Dimitris, Melvyn Sim. 2003. Robust discrete optimization and network flows. Mathematical programming 98(1-3) 49-71.

[7] Bertsimas, Dimitris, Melvyn Sim, Meilin Zhang. 2018. Adaptive distributionally robust optimization. Management Science.

[8] Bimpikis, Kostas, Ozan Candogan, Saban Daniela.

2016. Spatial pricing in ride-sharing networks. Working paper, Stanford Graduate School of Business.

[9] Boyaci, Burak, Konstantinos G Zografos, Nikolas Geroliminis. 2015. An optimization framework for the development of efficient one-way car-sharing systems. European Journal of Operational Research 240(3) 718-733.

[10] Cachon, Gerard P, Kaitlin M Daniels, Ruben Lobel.

2017. The role of surge pricing on a service platform with self-scheduling capacity. Manufacturing & Service Operations Management 19(3) 368-384. car2go. 2016. https://www.car2go.com/.

[11] Chen, Xin, Xiangyu Gao, Zhenyu Hu. 2015. A new approach to two-location joint inventory and transship- ment control via L-convexity. Operations Research Letters 43(1) 65-68.

[12] Eppen, Gary D, Eugene F Fama. 1969. Cash balance and simple dynamic portfolio problems with propor- tional costs. International Economic Review 10(2) 119-133.

[13] Erera, Alan L, Juan C Morales, Martin Savelsbergh. 2009. Robust optimization for empty repositioning problems. Operations Research 57(2) 468-483.

[14] Febbraro, Angela, Nicola Sacco, Mahnam Saeednia.

2012. One-way carsharing: solving the relocation prob- lem. Transportation Research Record: Journal of the Transportation Research Board (2319) 113-120. Financial Times. 2017.

[15] China's bike-sharing boom in charts. https://www.ft. com/content/

[16] Forbes. 2017. China's Innovative Smartbike Sharing Startups are Hitting Obstacles At Home And Abroad. https://www.forbes.com/sites/bensin/2017/04/05/chinas-innovative-station-less-bike-shares-hit-obstacles-at-home-and-abroad/

[17] 1Fraiberger, Samuel P, Arun Sundararajan. 2015. Peer-to-peer rental markets in the sharing economy. NYU 1Stern School of Business Research Paper.

[18] He, Long, Ho-Yin Mak, Ying Rong, Zuo-Jun Max Shen. 2017. Service region design for urban electric vehicle sharing systems. Manufacturing & Service Operations Management 19(2) 309-327.

[19] Hu, Ming, Yun Zhou. 2016. Dynamic type matching. Working paper, Rotman School of Management.

[20] Iancu, Dan A, Mayank Sharma, Maxim Sviridenko.

2013. Supermodularity and affine policies in dynamic robust optimization. Operations Research 61(4) 941-956.

[21] Jiang, Baojun, Lin Tian. 2016. Collaborative consumption: Strategic and economic implications of product sharing. Management Science.

[22] Kabra, Ashish, Elena Belavina, Karan Girotra. 2016. Bike share systems: Accessibility and availability. Working paper, INSEAD.

[23] Kek, Alvina GH, Ruey Long Cheu, Qiang Meng, Chau Ha Fung. 2009. A decision support system for vehicle relocation operations in carsharing systems. Transportation Research Part E: Logistics and Transportation Review 45(1) 149-158.

[24] Lu, Mengshi, Siqian Shen, Zhihao Chen. 2017. Optimizing the profitability and quality of service in carshare systems under demand uncertainty. Manufacturing & Service Operations Management.

[25] Nair, Rahul, Elise Miller-Hooks. 2011. Fleet management for vehicle sharing operations. Transportation Science 45(4) 524-540.

[26] New York Magazine. 2015. Can car2go transform new york into a city of drivers? http://nymag.com/daily/intelligencer/2015/01/car2go-car-sharing-new-york. html