УДК 519.863
А. В. Гасников1'2'3, Е.В. Гасникова1, С. В. Мациевский4, И. В. Усик4
1 Московский физико-технический институт (государственный университет) 2Центр исследований транспортной политики, Институт экономики транспорта и транспортной
политики НИУ ВШЭ 3Институт проблем передачи информации им. А. А. Харкевича РАН 4Балтийский федеральный университет им. И. Канта
О связи моделей дискретного выбора с разномасштабными по времени популяционными
играми загрузок
Предложен универсальный прямодвойственный способ описания равновесия в иерархических популяционных играх загрузок. В основе подхода лежит иерархия вложенных друг в друга транспортных сетей и соответствующие этим сетям разномасштабные (по времени) логит-динамики, отражающие ограниченную рациональность агентов. Поиск равновесия сводится к решению мгногоуровневой задачи выпуклой оптимизации. Результаты могут быть использованы при описании и численном поиске равновесий (стохастических равновесий) во всех известных многостадийных моделях транспортных потоков.
Ключевые слова: логит-динамика, многостадийная модель транспортных потоков, энтропия, равновесное распределение потоков.
A. V. Gasnikov1'2'3, E. V. Gasnikova1, S. V. Matsievsky4, I. V. Usik4
1 Moscow Institute of Physics and Technology (State University) 2Research Centre for Transport Policy Studies, Institute for Transport Economics and Transport Policy Studies, National Research University Higher School of Economics 3Kharkevich Institute for Information Transmission Problems RAS 4 Immanuel Kant Baltic Federal University
Searching of equilibriums in hierarchical congestion
population games
A universal primal-dual approach of description equilibriiums in a large class of hierarchical congestion population games is proposed. The very core of the approach is the hierarchy of enclosed to each other transport networks. In different time-scales the corresponding logit dynamics on this networks is considered. This dynamics reflect the restricted rationality of the agents. Searching of an equilibrium configuration to the multilevel convex optimization problem is reduced (in other words the variational principle of this class of games models is formulated). Then the dual problem is formulated. This problem has natural interpretation in turn and it is more computationally attractive than the primal one. So an effective primal-dual method for this problem is proposed. This method is based on the composite fast gradient method. Due to primal-duality the solution of the primal problem from the dual iterative process is recovered. To fulfil one iteration of this method a rather complex problem of the calculation characteristic function on the graph is solved. A special technique (smooth version of the Bellman-Ford approach to the shortest path problem) is proposed (based on some ideas of Yu. Nesterov), which allows one to do it in a cheap manner. Also, it should be mentioned that different tricks of small parameters methods are actively used.
Key words: logit dynamics, multistage model of traffic flows, entropy, equilibrium.
1. Введение
В работах [1—4] было анонсировано, что в последующем цикле публикаций будет приведен общий способ вариационного описания равновесий (стохастических равновесий) в популярных моделях распределения транспортных потоков. Также отмечалось, что планируется предложить эффективные численные методы поиска таких равновесий. В данной работе предпринята попытка погрузить известные нам подходы к многостадийному моделированию потоков на иерархических сетях (реальных транспортных сетях или сетях принятия решения - не важно) в одну общую схему, сводящую поиск равновесия к решению многоуровневой задачи выпуклой оптимизации. В основе схемы получения вариационного принципа для описания равновесия лежит популяционная игра загрузки с соответствующими логит-динамиками (отвечающими моделям дискретного выбора [5]) пользователей на каждом уровне иерархии [6] (см. п. 2). Для решения описанной задачи выпуклой оптимизации в статье изучается двойственная задача, представляющая самостоятельный интерес (см. п. 3). Основным инструментом изучения двойственной задачи является аппарат характеристических функций на графе [1, 7, 8] и ускоренные прямодвойственные методы в композитном варианте [9, 10].
Отметим, что общность результатов статьи достигается за счет введения большого числа параметров, которые можно вырождать, устремляя их к нулю или бесконечности. Игра на выборе этих параметров позволяет, например, получать различные многостадийные модели транспортных потоков [2-4, 11, 12]. Приводимые далее результаты можно обобщать и на потоки товаров в случае, когда имеется более одного наименования товара [12]. Однако в данной статье не будем касаться этого обобщения. Мы также не планируем приводить конкретные примеры получения многостадийных транспортных моделей согласно изложенной в статье общей схеме. Всему этому планируется посвятить отдельные публикации.
2. Постановка задачи
Рассмотрим транспортную сеть, заданную ориентированным графом Г1 = (V 1,Е. Часть его вершин О1 С V1 - источники, а другая часть вершин И1 С V1 - стоки. Множество всех пар источник-сток обозначим ОИ1 С О1 ® И1. Пусть каждой паре -ш1 € ОИ1 соответствует своя корреспонденция := -М (М ^ 1) пользователей, которые хотят в единицу времени перемещаться из источника в сток, соответствующих заданной корреспонденции -ш1. Пусть ребра Г1 разделены на два типа: Е1 = Е1 Ц Е1. Ребра типа Е1 характеризуются неубывающими функциями затрат (/е\) := (/е\/М). Затраты тД (/Д) несут те пользователи, которые используют в своем пути ребро е1 € Е1 в предположении, что поток пользователей по этому ребру равен . Пары вершин, задающие ребра типа Е1, являются, в свою очередь, парами источник-сток ОИ2 (с корреспонденци-ями = /1, ы2 = е1 € Е1) в транспортной сети следующего уровня Г2 = (у2,Е2), ребра которой вместе с тем разделены на два типа: Е2 = Е2 Ц Ё2. Ребра типа Е2 характеризуются неубывающими функциями затрат т22 (/22) := т22 (¡^1М). Затраты т22 (/22) несут те пользователи, которые используют в своем пути ребро е2 € Е2 в предположении, что поток пользователей по этому ребру равен /22. Пары вершин, задающие ребра типа Е2, являются, в свою очередь, парами источник-сток ОИ3 (с корреспонденциями (Р 3 = /22, -ш3 = е2 € Е2) в транспортной сети более высокого уровня Г3 = (V3, Е3) и т. д. Будем считать, что всего имеется т, уровней: Ет = Ет. Обычно в приложениях число т, небольшое [1—5]: 2—10.
Каждый пользователь в графе Г1 выбирает путь 1 е Р1 1 (последовательный набор проходимых пользователем ребер), соответствующий его корреспонденции и)1 € ОИ1 (Р11 — множество всех путей, отвечающих в Г1 корреспонденции w1). Задав р11, можно однозначно восстановить ребра типа Е1, входящие в этот путь. На каждом из этих ребер
€ Е пользователь может выбирать свои пути р 2 € Р22 (Р2 2 — множество всех путей, отвечающих в Г2 корреспонденции 'Ш2) и т. д. Пусть каждый пользователь сделал свой
выбор. Обозначим через х11 величину потока пользователей по пути р1 е Р1 = Ц Р11,
4 ^ о 1 _ тт о 1
ш1
т1еОП1
х22 — величина потока пользователей по пути р2 е Р2 = Ц Р^ и т. д. Заметим что
ш2е<002
х\ ^ 0, рК еРК, у хкк =йК, е ОБк, к = 1,..,т,
кк и еР\
что для компактности мы будем далее записывать
х\ к А<1шк).
^ ™к) кк ъ еРкъ \ ™к \
Отметим, что здесь и везде в дальнейшем
™к+1 (= ек) е ОБк+1 (= Ек) , = I%, к = 1,..., т — 1.
Введем для графа Гк и множества путей Рк матрицу (Кирхгофа)
к и и Г 1, е рк
в = и 5еккк Щ еЕк,кк ер к , £>еккк = | 0 ек / рк , к = 1,...,т.
Тогда векторы потоков на ребрах $к на графе Гк однозначно определяются векторами
потоков на путях хк = I хкк\ :
I к") кк ерк
}к = вкхк, к = 1,..., т.
Положим
х = {*)11 • Н^ • в = ■
т
<к = { шкеопк , = Ц Р\\(«Шк), Х = И^М,
'оеоок 1 1 к=1
а через
^РЩцк , {ркш+к¿1 }г
РШк = ( рк,кЛрк+11\ ,... I, к = 1,...,т, —
Г'к \ Г,ШК1 | Гк]Ь +1 | 1екк 111 111
к
полное описание возможного пути (в графе Гк и графах следующих уровней), соответствующего корреспонденции wк е ОИк. Множество всех таких путей будем обозначать Ршк.
р__' к р__' к
Введем также множество путей Р = Ц Ршк и соответствующий вектор распределенной к
ния потоков по этим путям х.Рк. Определим функции затрат пользователей на пути ршк
р
по индукции:
^т | хрт I — у ^ ие'^к"' 1 е" (J е"
ОРп ^'х рт ^ = ^ 5етктТт ( /е"), етеЁт
Орк (х.рк) = Ткек ) + £ Ор+11 (х.рк+А , к = 1,..., т — 1.
р ^л р; ьи,е р К ' *к к> тк+Л р )
Опишем марковскую логит-динамику (также говорят гиббсовскую динамику) в повторяющейся игре загрузки графа транспортной сети [6, 8]. Пусть имеется ТЖ шагов (Ж ^ 1). Каждый пользователь транспортной сети, использовавший на шаге Ь путь рШ1 независимо от остальных, на шаге Ь + 1 (все введенные новые параметры положительны)
е
с вероятностью
д1 ехр(-С*-у7 О " Е ехр (-а!1/,1)
рер »1
пытается изменить свой путь р,ш1 нар € Р11, где Ср = Ср I х^1 ) — затраты на пути
р на шаге £ (С^Р'1 = 0);
равновероятно выбирает w2 € р11 П Е1 и затем с вероятностью
Л2 ^ П Е 1| ехр (-СР'У
£ ехр (-Ср2/,2)
N
Р^Р »2
пытается изменить в своем пути р\и1 = I р11
пЁ1 )
■ш1 /
1 1 1
2
участок пути 1 2 ,
выбирая путь р € Рт2, где Ср — Ср I х^2 I — затраты на пути р на шаге 1(Ср2 = 0);
и т. д.;
г /
с вероятностью 1 — Лк / N решает не менять тот путь, который использовал на к=1
шаге .
Такая динамика отражает ограниченную рациональность агентов (см. замечание 5 п. 3) и часто используется в теории дискретного выбора [5] и популяционной теории игр [6]. В основном нас будет интересовать поведение такой системы в предположении
Л2/Л1 ^ те, Л3/Л2 ^
оо,
т т 1 т
Л /Л ^ те, N /Л ^ те.
(1)
Эта марковская динамика в пределе N ^ те превращается в марковскую динамику в непрерывном времени [13]. Далее мы, как правило, будем считать, что такой предельный переход был осуществлен.
В пределе М ^ те эта динамика (концентраций) описывается зацепляющейся системой обыкновенных дифференциальных уравнений (СОДУ):
/
йх^ 1
р ы1 = л1 .
М '
1 ехр (_(хр 1 )Д)
\
£ ехр (-С1 (х„ 1 )/71) Х^
\ р£Р-и
рш1 € РШ1, и]1 € ОБ1,
2
р т2 (И
= Л2
г]2
а-12
ех^ _П12 (хр')/''2)
\ р£Р^2
£ ехр {—О2^2)/,2)
_ х.^2 2\ р ™2
р1Ш2 €Р12, и;2 € ОИ =Е1,
1
1
1
1
Применяя по индукции (ввиду условия (1)) теорему Тихонова к этой СОДУ [14, 15], можно получить описание аттрактора СОДУ — глобально устойчивой (при Т ^ те) неподвижной точки. Для того чтобы это сделать, введем обозначение
0
Рассмотрим задачу
ек
4(Ä) = ¡4М* *
Ф(х, /):-Ф1 (х)- Е alel {f!) + Ф2 (х) +
Ге1 ( f е1 е1еЕ1
+ 71 У У X1 lnix11 dl А ^ min ,
1 w1toD1 Р1 ГР\Р W) f_mxex'
Ф2 (X)- Е^ (/2) +Ф3 (х)+ l"2 Е Е X2P2 ln (х^/dWw^j , d2w2 -/
e2e Е2 W^E1 p2eP 22
(2)
ф*
(X) - Е 4 {/*) + Ф*+1 (X) + lk Е Е х£ l^Xp\/dW^ , dkwih - /
fk
!Wk+1 ,
<eEk
pk ePk
W
к
Ф (x) — ^ ^ U ffm (/fm ) + 7 ^ ^ ^ ^ Xpm ln {^Xmpm jdfm^J , dfm — fwm . eme Em wm^Em-1 pm £Pmm
Эта задача эквивалентна следующей цепочке зацепляющихся задач выпуклой (многоуровневой [16]) оптимизации:
Ф1 {d1) - min { Е и!1 {/!1) + Ф2 {d2) +
f 1=e1x1, X1ex1(d1) U^S1
#1 =f11. eW (3)
/ Л
+71 E E хР, ln (х^/dW1)), W eOD1 pi eP 11 v ;>
Ф2 {d2) - min ( E 4 {¡2) +Ф3 {d3) +
f 2_&2x2.x2CX2(d2) U2PR2
d<2 =f ¿2 . e
+72 E E х^2 ln (X2p2/dW2)},
2
V2e e1 p2eP2,
Ф k (dk) - min I E (fy) + Фк+1 (dk+1) +
fk=&kxk ,xk<pXk (dk) ^ek^Ek e e
dk+1=f\. ek eEk
ек ек
+7k E E x2pk ln (х^ /dkwk)},
wkeEk-1 pkePk
к
fm=@mxm. xmeXm(dm)
Фт (df)= min i E ^ (/fm )+7f E E Xffm ln {Xffm / dfm )} .
f m_(^mxm xm ¿zxm (dm ) I ' * ' * ' * I
yem€Em Wm(zE,m-1 2m€Pmm J
~-emeEm Wm eEm-1 pmeP
То, что эти задачи выпуклые, сразу может быть не очевидно. Чтобы это понять, заметим, что ограничения хк € Хк с помощью метода множителей Лагранжа можно убрать, добавив в функционал слагаемые
xtk - dkk ), к = 1,...,т.
Е ' Е хр*—
тк £Ек-1 ™к \ ркеРк\ '
Каждое такое слагаемое есть выпуклая функция по совокупности параметров хк, (к (см., например, [17, с. 96, формула (3.1.8)]). Следовательно (см., например, [17, с. 92, теорема 33.1.2], и [17, с. 96, формула (3.1.9)]), Фт ((т) - выпуклая функция, но тогда и Фк - выпуклая функция, поскольку (по индукции) Фк+1 ((к+- выпуклая функция (к = 1,..., т — 1).
Теорема 1. 1. Задачи (2) и (3) являются эквивалентными задачами выпуклой оптимизации, имеющими единственное 'решение.
2. Введенная марковская логит-динамика при N ^ ж - эргодическая. Ее финальное распределение (возникающее в пределе Т ^ ж) совпадает со стационарным. В предположении (1) стационарное распределение экспоненциально сконцентрировано в окрестности решения задачи (3) (в пределе М ^ ж стационарное распределение полностью сосредотачивается на решении задачи (3)).
3. Введенная марковская логит-динамика при пределах N ^ ж, М ^ ж описывается СОДУ. В предположении (1) любая допустимая траектория СОДУ (соответствующая вектору корреспонденций (1) сходится при Т ^ ж к решению задачи (3).
Замечание 1. Утверждения 1, 2 теоремы 1 (кроме единственности решения) остаются
к
верными и в предположении, что по части параметров сделаны предельные переходы (от стохастических равновесий к равновесиям Нэша) 7к ^ 0+ (важно, что эти переходы осуществляются после предельных переходов, указанных в соответствующих пунктах теоремы 1). К этому же результату (с точки зрения того, к какой задаче оптимизации в итоге сводится поиск равновесий) приводит рассмотрение на соответствующих уровнях вместо логит-динамик имитационных логит-динамик [6, 18].
Замечание 2. Утверждения теоремы 1 и замечания 1 остаются верными, если на части ребер (любого уровня) сделать предельные переходы (важно, что эти переходы осуществляются после предельных переходов, указанных в соответствующих пунктах теоремы) вида (предел стабильной динамики [2, 12])
rß ( f ) _v J fe < fe>
([te, ж) , fe = fe
с дополнительной оговоркой, что существует такой х € Х, что условие f = Эх совместно с {¡е < и)е. При этом
и _ _
ае (fe)= lim fr» (z)dz = ( U ^
ß^O+J e { Ж, fe > fe.
Величину te = lim Te ( fe) ^ te можно понимать как затраты на проезд по ребру е (см. также п. 3), а lim Те (fe) — te — как дополнительные затраты, приобретенные из-за наличия «пробки» на ребре е [2; 19], возникшей из-за функционирования ребра на пределе пропускной способности fe. Эти дополнительные затраты в точности совпадают с множителем Лагранжа к ограничению fe ^ fe [2; 19]. Их также можно понимать как оптимальные платы за проезд (для обычных ребер эти платы равны fedTe (fe)/dfe [3; 20; 21]), взимаемые согласно механизму Викри-Кларка-Гроуса [21].
Если для некоторых 1 ^ р ^ д ^ т имеют место равенства 7р = ... = 7я, то можно
я
свернуть Гр, ..., Г9 в один граф Ц Гк. Это следует из свойств энтропии (см. свойство 3
к=р
§ 4 главы 2 [22]).
Далее отдельно рассмотрим специальный случай 71 = ... = 7т = 7, где у нас есть граф
/ т \
Г = I I Гк = (у,Е = ТТ ^
т / т \
ЦГк = ые = НЕМ , к=1 \ к=1 /
который имеет всего один уровень, а задачу (1) можно переписать следующим образом:
Ф(ж) = (¡е)+7 Е Е ХР1п (ХРКО т1псу . (4)
ееЕ
реРт1
Теорема 2. При 71 = ... = 7т = 7:
1) задачи (2) и (4) являются эквивалентными задачами выпуклой оптимизации, имеющими единственное решение;
2) введенная марковская логит-динамика при N ^ ж - эргодическая. Ее финальное распределение (возникающее в пределе Т ^ ж) совпадает со стационарным, которое пред-ставимо в виде (представление Санова)
~ ехр^-М ' (Ф(х)+о(1))^ , М » 1.
Как следствие, получаем, что стационарное распределение экспоненциально сконцентрировано в окрестности решения задачи (4) (в пределе М ^ ж стационарное 'распределение полностью сосредотачивается на решении задачи (4));
3) введенная марковская логит-динамика при пределах N ^ ж, М ^ ж описывается СОДУ. Функция Ф (х) является функцией Ляпунова этой СОДУ (принцип Больцмана). То есть убывает на траекториях СОДУ. Как следствие, любая допустимая траектория СОДУ (соответствующая вектору корреспонденций (I1) сходится при Т ^ ж к решению задачи (4).
Замечание 3. К теореме 2 можно сделать замечания, аналогичные замечаниям 1, 2 к теореме 1.
3. Двойственная задача
Рассмотрим граф
т / т \
г = ЦГк = ые = ЦЕМ . к=1 \ к=1 /
Положим = те (/е) (здесь специально упрощаем обозначения, поскольку (см. раздел 2) контекст должен восстанавливаться однозначным образом). Запишем в пространстве t = {1е}е^Е двойственную задачу к (3) [1, 2, 8] (далее мы используем обозначение ёош а* - область определения сопряженной к а функции):
ш1п {Ф(х,/): / = вх, х еХ} = - ш^п ЬV (¿/71) + Еа* (*е)), (5
^ ееЕ }
где
/е
а* (¿е) = шах|¡еЪе - J те (г) (г | 0
da* (te) d
u
^fet e - j Te ( Z) dzI
dt = ~dt~ fete - J Te (z) dz } = fe : te = Te (/e) , e G E
0
g™m (t) — ^ ^ 5empm tem — ^ ^ 5empm tem , eme Em emeEm
(t)= E W^ - E ^(t/lk+l), k = 1,...,m - 1,
ek e E k ekeEk
(*) = ln( E exP (-$ (*))), k — l,...,m,
k k
pk ePkk
wk
Ф1 (i)= E d^ii (i).
i^eOD1
Теорема 3. Имеет место сильная двойственность (5). Решение задачи выпуклой оптимизации (5) t ^ 0 существует и единственно. По этому решению однозначно можно восстановить решение исходной задачи (3) (если какой-то из jk ^ 0+, то однозначность восстановления х может потеряться):
f = вх = -Чф1 (i/71) ,
k k exp Ugkk (t)/ik) k k
xkk =dkwk-Цр--, pk GPkk, wk G ODk, к = 1,...,m. (6)
£ exp hkk vh")
pkePkk
Верно и обратное. Пусть f = вх - 'решение задачи (3), тогда t = {те (¡е)}ееЕ - единственное решение задачи (3) (если какой-то из ^ 0+, то решение х может быть не единственно, однако это никак не сказывается на возможности однозначного восстановления ).
Замечание 4. К теореме 3 можно сделать замечания, аналогичные замечаниям 1, 2 к теореме 1. При этом оговорки, возникающие при ^ 0+, частично уже были сделаны в формулировке самой теоремы. Дополним их следующим наблюдением. Слагаемое 71ф>1 (¿/7^ в двойственной задаче (5) имеет равномерно ограниченную константу Липшица градиента в 2-норме:
1
^ < • k Е dk
k
k У, -w1 maX
mm k p1 p1
k=1,..,m w1eOD1 p m1 ePw1
p1
P w1
где
p1 P w1
— число ребер в пути р 1и1. Эта гладкость теряется при ^ 0+:
- lim lkitfwk(thk) = mink 9p>k (*) -
чk->0+ w V/ J pk^Pk, p
длина кратчайшего пути в графе Г к, отвечающего корреспонденции -шк € ОИк, ребра ек € Ек которого взвешены величинами 7к+1фк1+1 {ъ/7к+1^, которые можно понимать как «средние» затраты на е € Ек (см. замечание 5). Заметим также, что в пределе (стабильной динамики) ^ ^ 0+ (см. замечание 2) получаем
ae (ie)=jm max{ Uu -f < (z) dz} = { t •
(te ^e) , ^e ^ ^e,
/el J J It, te < te,
2
При этом — в точности совпадает с множителем Лагранжа к ограничению te ^ te [2, 19].
Замечание 5. Формулу (6) можно получить и из других соображений. Предположим, что каждый пользователь I транспортной сети, использующий корреспонденцию ,шк е ОИк на уровне к (ребро ек-1 (= е Ек-1 на уровне к - 1), выбирает маршрут следования рк е Ркк на уровне к, если
рк = arg да Ь £ (i)+ $ } '
qkeP\ 1 q
где независимые случайные величины £ к имеют одинаковое двойное экспоненциальное распределение, также называемое распределением Гумбеля [5, 6, 8]:
Р < с) = ехр {-еАк-е} .
Отметим также, что если взять Е ~ 0, 5772 — константа Эйлера, то
М
С =0, D i
= (I' )2-2/б.
Распределение Гиббса (логит-распределение) (6) получается в пределе, когда число агентов на каждой корреспонденции wk £ ODk, к = 1,...,т стремится к бесконечности (случайность исчезает и описание переходит на средние величины). Полезно также в этой связи иметь в виду, что [5, 9]
(t/7*) =М{. } {-9> № + ф }
с у и L wk
wk
Таким образом, если каждый пользователь сориентирован на вектор затрат t на ребрах Е (одинаковый для всех пользователей) и на каждом уровне (принятия решения) пытается выбрать кратчайший путь, исходя из зашумленной информации и исходя из усреднения деталей более высоких уровней (такое усреднение можно обосновывать, если, например, как в п. 2, ввести разный масштаб времени (частот принятия решений) на разных уровнях, а можно просто постулировать, что пользователь так действует, как это принято в моделях типа Nested Logit [5]), то такое поведение пользователей (в пределе, когда их число стремится к бесконечности) приводит к описанию распределения пользователей по путям/ребрам (6). Равновесная конфигурация характеризуется тем, что вектор t породил, согласно формуле (6), такой вектор f, что имеет место соотношение t = {те ( /е)}ееЕ. Поиск такого t (неподвижной точки) приводит к задаче (5).
Замечание 6. Сопоставить формуле (4), теореме 2 и замечанию 3 (отвечающих случаю 71 = ... = 7т = 7) вариант двойственной задачи (5) чрезвычайно просто (мы здесь опускаем соответствующие выкладки). Собственно, понять формулу (4) как раз проще не из свойств энтропии (как это было описано в п. 2), а с помощью обратного перехода от двойственного описания (5). Теорема 3 и замечание 5 в случае 71 = ... = 7т = 7 наглядно демонстрируют отсутствие какой бы то ни было иерархии и возможность работать на одном графе с естественной интерпретацией функций затрат на путях gp (t) (без всяких «средних» оговорок).
Перейдем к конспективному обсуждению численных аспектов решения задачи (5). Как правило, выгоднее решать именно задачу (5), а не (3) [8]. На эту задачу удобно смотреть, как на гладкую (с Липшицевым градиентом) задачу композитной оптимизации [9, 10] c евклидовой прокс-структурой (задаваемой 2-нормой). При этом даже если по ряду параметров 7к требуется сделать предельный переход 7к ^ 0+, то, как правило, лучше считать,
к
что численно мы все равно решаем задачу со всеми 7к > 0 [8]. Этого можно добиться обратным процессом: энтропийной регуляризацией прямой задачи — сглаживанием двойственной. Некоторые детали того, как именно и в каких случаях полезно сглаживать задачу (5), описаны в работе [8] (см. также [23]).
Композитный быстрый градиентный метод (и различные его вариации с адаптивным подбором константы Липшица, градиента, универсальный метод и др. [9, 10, 24]) обладает прямодвойственной структурой [25-27]. Это означает, что генерируемые этим методом последовательности {£и {?} обладают следующим свойством:
71Ф1 Г/У) + £ < (¿Т) -
— Ш1П
ь
е£Е
£ аг ■ Ь1Ф1 (ё/71) + (УФ1 (¿Ь1), I — гг))
N
£
'=0
+ £< (*е)| < ^,
ееЕ ) '
(7)
где С - небольшая (как правило, ^10) константа, зависящая от метода, aN ~ N, N
AN = £ aí, AN ~ N2, К2 - евклидов размер решения задачи (5).
'=0
Теорема 4. Пусть задача (5) решается прямодвойственным методом, генерирующим последовательности и{?} с оценкой скорости сходимости (7), тогда
0 Л 71Ф1 Г /71) + Е (¿Г )} + Ф , ) < ^Ат2,
К ееЕ ) N
где
гкА = (]к ,
Хрк = атк
Р = вх' = —УФ1 (¿771) , ехр (~дкк (*')/7к)
(I')/7к) '
£ ехр ( — д1кк
ркеРк
С 1 ■ Л к=1,...,т
' _ I к,' I ' '
X — л X ь. г ,
I рЧ ркеРкк,-шкеоок
рк еРкк, гшк еОБк, к = 1,..,т,
1
N
1 AN =п
'=0
XN =
А
N
N
£
=0
Замечание 7. В общем случае описанный выше подход представляется наиболее предпочтительным. Однако для различных специальных случаев приведенные оценки, по-видимому, можно немного улучшить [4, 28].
Замечание 8. Некоторые оговорки в описанном подходе требуются в случае осуществления по ряду ребер предельного перехода стабильной динамики (см. замечание 2). В этом случае требуется дополнительно компактифицировать ¿. Поскольку мы заранее не знаем размер решения К2, то приходится делать логарифмическое число рестартов [27]. Это ухудшает приведенную оценку на число итераций на небольшую мультипликативную константу «10).
Приведенная теорема 4 оценивает число необходимых итераций. Но на каждой итерации необходимо считать УФ1 {ъ/71Л), а для ряда методов и Ф1 {ь/71^ (например, для всех адаптивных методов, настраивающихся на параметры гладкости задачи [9, 10, 24]). Подобно [1, 7, 8] можно показать (с помощью сглаженного варианта метода Форда-Беллмана), что для этого достаточно сделать О^О1]^ шах^ р1 ^ арифметических операций. Однако необхо-
р 1£р
димо обговорить один нюанс. Для возможности использовать сглаженный вариант метода Форда-Беллмана [1, 7, 8] необходимо предположить, что любые движения по ребрам графа с учетом их ориентации являются допустимыми, т.е. множество путей, соединяющих заданные две вершины (источник и сток), - это множество всевозможных способов добраться из источника в сток по ребрам имеющегося графа с учетом их ориентации. Сделанная
к
1
оговорка не сильно обременительная, поскольку нужного свойства всегда можно добиться раздутием исходного графа в несколько раз за счет введения дополнительных вершин и ребер.
В целом хотелось бы отметить, что прием, связанный с искусственным раздутием исходного графа путем добавления новых вершин, ребер, источников, стоков является весьма полезным для ряда приложений [2-4, 12]. В частности, достаточно популярным является введение фиктивных (с нулевыми затратами) путей-ребер, которые дают возможность ничего не делать пользователям (не перемещаться [3], не торговать [12] и т.п.), что, в свою очередь, позволяет рассматривать ситуации с нефиксированными корреспонденциями ( 1 [3, 12]. Также популярным приемом является перенесение затрат на преодоление вершин (узлов) графа (перекрестков [3], сортировочных станций [12]) в затраты на прохождение дополнительных ребер, появляющихся при «распутывании» узлов. Но, пожалуй, наиболее важным для большинства приложений является введение фиктивного общего источника и общего стока, соединенных дополнительными ребрами с уже имеющимися вершинами графа [3, 4, 12].
Исследования первого автора, связанные с п. 3, выполнено в Институте проблем передачи информации им. А. А. Харкевича РАН за счет гранта Российского научного фонда (проект № 14-50-00150).
Исследования в других пунктах выполнены при поддержке грантов РФФИ 15-31-70001 мол_а_мос, 15-31-20571-мол_а_вед, 14-01-00722-а, 13-01-12007-офи_м.
Данная статья представляет собой запись нескольких лекций, прочитанных первым автором в рамках курса «Математическое моделирование транспортных потоков» студентам Московского физико-технического института (государственного университета) и Балтийского федерального университет им. И. Канта в осеннем семестре 2015/2016 учебного года.
Литература
1. Введение в математическое моделирование транспортных потоков / под ред. Гасникова А.В. М.: МЦНМО, 2013.
2. Гасников А.В., Дорн Ю.В., Нестеров Ю.Е, Шпирко С.В. О трехстадийной версии модели стационарной динамики транспортных потоков // Математическое моделирование. 2014. Т. 26, вып. 6. C. 34-70.
3. Гасников А.В. Об эффективной вычислимости конкурентных равновесий в транспор-тно-экономических моделях // Математическое моделирование. 2015. Т. 27, № 12. С. 121-136. arXiv:1410.3123
4. Бабичева Т.С., Гасников А.В., Лагуновская А.А., Мендель М.А. Двухстадийная модель равновесного распределения транспортных потоков // Труды МФТИ. 2015. Т. 7, № 3. С. 31-41.
5. Andersen S.P., de Palma A., Thisse J.-F. Discrete choice theory of product differentiation. Cambridge: MIT Press, 1992.
6. Sandholm W. Population games and Evolutionary dynamics. Economic Learning and Social Evolution. Cambridge: MIT Press, 2010.
7. Nesterov Yu. Characteristic functions of directed graphs and applications to stochastic equilibrium problems // Optim. Engineering. 2007. V. 8. P. 193-214.
8. Гасников А.В., Гасникова Е.В., Двуреченский П.Е., Ершов Е.И., Лагуновская А.А. Поиск стохастических равновесий в транспортных моделях равновесного распределения потоков // Труды МФТИ. 2015. Т. 7, № 4. C. 114-128. (принята к печати.)
9. Nesterov Yu. Gradient methods for minimizing composite functions // Math. Prog. 2013. V. 140, N. 1. P. 125-161.
10. Nesterov Yu., Nemirovski A. On first order algorithms for li nuclear norm minimization // Acta Numerica. 2013. V. 22. P. 509-575.
11. OrtUzar J.D., Willumsen L.G. Modelling transport. New York: John Wiley & Sons Inc., 2011.
12. Ващенко М.П., Гасников А.В., Молчанов Е.Г., Поспелова Л.Я., Шананин А.А. Вычислимые модели и численные методы для анализа тарифной политики железнодорожных грузоперевозок. М.: ВЦ РАН, 2014.
13. Ethier N.S., Kurtz T.G. Markov processes. New York: John Wiley & Sons Inc., 1986.
14. Тер-Крикоров А.М. Нелинейный анализ и асимптотические методы малого параметра. М.: МФТИ, 2007.
15. Разжевайкин В.Н. Анализ моделей динамики популяций. М.: МФТИ, 2010.
16. Multilevel optimization: algorithms and applications. Nonconvex optimization and its applications / Ed. by Migdalas A., Pardalos P.M., Varbrand P. - Dordrecht, Boston: Kluwer Academic Publishers, 1998.
17. Жадан В.Г. Методы оптимизации. Часть 1. Введение в выпуклый анализ и теорию оптимизации. М.: МФТИ, 2014.
18. Гасников А.В., Лагуновская А.А., Морозова Л.Э. О связи имитационной логит-динамики в популяционной теории игр и метода зеркального спуска в онлайн оптимизации на примере задачи выбора кратчайшего маршрута // Труды МФТИ. 2015. Т. 7, № 4. C. 104-113. (принята к печати).
19. Nesterov Yu. Stable traffic equilibria: properties and applications // Optimization and Engineering. 2000. V. 1. P. 29-50.
20. Sandholm W.H. Evolutionary implementation and congestion pricing // Review of Economic Studies. 2002. V. 69. P. 81-108.
21. Algorithmic game theory / Ed. by Nisan N., Roughgarden T., Trados E., Vazirani V.V. Cambridge Univ. Press, 2007.
22. Яглом А.М., Яглом И.М. Вероятность и информация. М.: КомКнига, 2006.
23. Nesterov Yu. Smooth minimization of non-smooth function // Math. Program. Ser. A. 2005. V. 103, N 1. P. 127-152.
24. Nesterov Yu. Universal gradient methods for convex optimization problems // CORE Discussion Paper 2013/63.
25. Nesterov Yu. Primal-dual subgradient methods for convex problems // Math. Program. Ser. B. 2009. V. 120(1). P. 261-283.
26. Nemirovski A., Onn S., Rothblum U.G. Accuracy certificates for computational problems with convex structure // Mathematics of Operation Research. 2010. V. 35, N 1. P. 52-78.
27. Гасников А.В., Двуреченский П.Е., Нестеров Ю.Е. Стохастические градиентные методы с неточным оракулом. е-print. 2015. arXiv:1411.4218
28. Гасников А.В., Двуреченский П.Е., Камзолов Д.И., Нестеров Ю.Е, Спокойный В.Г., Стецюк П.И., Суворикова А.Л., Чернов А.В. Поиск равновесий в многостадийных транспортных моделях // Труды МФТИ. 2015. Т. 7, № 4. C. 143-155. (принята к печати).
References
1. Introduction to mathematical modeling of traffic flows. Ed. by Gasnikov A.V. M.: Moscow Center for Continuous Mathematical Education, 2013. (in Russian.)
2. Gasnikov A.V, Dorn Yu.V., Nesterov Yu.E., Shpirko S.V. On the three-stage version of stable dynamic modelro Math. Mod. 2014. V. 26:6. P. 34-70. (In Russian.)
3. Gasnikov A.V. About reduction of searching competetive equillibrium to the minimax problem in application to different network problems. Math. Mod. 2015. V. 27, № 12. P. 121-136. arXiv:1410.3123 (In Russian.) (In print.)
4. Babicheva T.S., Gasnikov A.V, Lagunovskaya A.A., Mendel M.A. Two-stage model of equilibrium distributions of traffic flows. Trudy MIPT. 2015. V. 7, N 3. P. 31-41. (In Russian.) (In print.)
5. Andersen S.P., de Palma A., Thisse J.-F. Discrete choice theory of product differentiation. Cambridge: MIT Press, 1992.
6. Sandholm W. Population games and Evolutionary dynamics. Economic Learning and Social Evolution. Cambridge: MIT Press, 2010.
7. Nesterov Yu. Characteristic functions of directed graphs and applications to stochastic equilibrium problems. Optim. Engineering. 2007. V. 8. P. 193-214.
8. Gasnikov A.V., Gasnikova E.V., Dvurechensky P.E., Ershov E.I., Lagunovskaya A.A. Search for the stochastic equilibria in the transport models of equilibrium flow distribution. TRUDY MIPT. 2015. V. 7, N 4. P. 114-128. (In Russian.) (In print.)
9. Nesterov Yu. Gradient methods for minimizing composite functions. Math. Prog. 2013. V. 140, N 1. P. 125-161.
10. Nesterov Yu., Nemirovski A. On first order algorithms for l\ nuclear norm minimization. Acta Numerica. 2013. V. 22. P. 509-575.
11. Ortuzar J.D., Willumsen L.G. Modelling transport. New York: John Wiley & Sons Inc., 2011.
12. Vaschenko V.P., Gasnikov A.V., Molchanov E.G., Pospelova L.Ya., Shananin A.A. Analysis of tariff policy of a railway cargo transportation. M.: Computing Centre RAS, 2014. (In Russian.)
13. Ethier N.S., Kurtz T.G. Markov processes. New York: John Wiley & Sons Inc., 1986.
14. Ter-Krikorov A.M. Nonlinear analysis and asymptotic methods of small parameter. M.: MIPT, 2007. (In Russian.)
15. Razzhevaikin V.N. Analysis of models of population dynamics. M.: MIPT, 2010. (In Russian.)
16. Multilevel optimization: algorithms and applications. Nonconvex optimization and its applications. Ed. by Migdalas A., Pardalos P.M., Varbrand P. Dordrecht, Boston: Kluwer Academic Publishers, 1998.
17. Zhadan V.G. Optimization methods. Part 1. Introduction to convex analysis and optimization theory. M.: MIPT, 2014. (In Russian).
18. Gasnikov A.V., Lagunovskaya A.A, Morozova L.E. On the relationship between imitative logit dynamics in the population game theory and mirror descent method in the online optimization using the example of the Shortest Path Problem. TRUDY MIPT. 2015. V. 7, N 4. P. 104-113. (In Russian). (In print.)
19. Nesterov Yu. Stable traffic equilibria: properties and applications. Optimization and Engineering. 2000. V. 1. P. 29-50.
20. Sandholm W.H. Evolutionary implementation and congestion pricing. Review of Economic Studies. 2002. V. 69. P. 81-108.
21. Algorithmic game theory. Ed. by Nisan N., Roughgarden T., Trados E., Vazirani V.V. Cambridge Univ. Press, 2007.
22. Yaglom A.M., Yaglom I.M. Probability and information. M.: KomKniga, 2006. (In Russian.)
23. Nesterov Yu. Smooth minimization of non-smooth function. Math. Program. Ser. A. 2005. V. 103, N 1. P. 127-152.
24. Nesterov Yu. Universal gradient methods for convex optimization problems. CORE Discussion Paper 2013/63.
25. Nesterov Yu. Primal-dual subgradient methods for convex problems. Math. Program. Ser. B. 2009. V. 120(1). P. 261-283.
26. Nemirovski A., Onn S., Rothblum U.G. Accuracy certificates for computational problems with convex structure. Mathematics of Operation Research. 2010. V. 35, N 1. P. 52-78.
27. Gasnikov A.V., Dvurechensky P.E., Nesterov Yu.E. Stochastic gradient methods with inexact oracle. e-print. 2014. arXiv:1411.4218 (In Russian.)
28. Gasnikov A.V., Dvurechensky P.E., Kamzolov D.I., Nesterov Yu.E. Spokoiny V.G., Stetsyuk P.I., Suvorikova A.L., Chernov A.V. Universal method with inexact oracle and its applications for searching equillibriums in multistage transport problems. Trudy MIPT. 2015. V. 7, N 4. P. 143-155. (In Russian.) (In print.)
Поступила в редакцию 10.11.2015.