Научная статья на тему 'О возможной динамике в моде- ли ранжирования web-страниц PageRank и модернизированной модели расчета матрицы корреспонденций'

О возможной динамике в моде- ли ранжирования web-страниц PageRank и модернизированной модели расчета матрицы корреспонденций Текст научной статьи по специальности «Математика»

CC BY
184
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭРГОДИЧЕСКАЯ ТЕОРЕМА / ФУНКЦИЯ ЛЯПУНОВА / ЭНТРОПИЯ / РАНЖИРОВАНИЕ WEB-СТРАНИЦ PAGERANK / ГРАВИТАЦИОННАЯ МОДЕЛЬ РАСЧЕТА МАТРИЦЫ КОРРЕСПОНДЕНЦИЙ / КОНЦЕНТРАЦИЯ ИНВАРИАНТНОЙ (СТАЦИОНАРНОЙ) МЕРЫ / КАНОНИЧЕСКИЙ СКЕЙЛИНГ / УСЛОВИЕ ДИНАМИЧЕСКОГО РАВНОВЕСИЯ / ПРИНЦИП ДЕТАЛЬНОГО РАВНОВЕСИЯ / LYAPUNOV'S FUNCTION / GOOGLE'S PAGERANK / CONCENTRATION OF INVARIANT OF (STATIONARY) MEASURE PHENOMENA / ERGODIC THEOREM / ENTROPY / GRAVITATIONAL MODEL FOR CORRESPONDENCE MATRIX / CANONICAL SCALING / DYNAMIC BALANCE CONDITION / DETAILED BALANCE PRINCIPLE

Аннотация научной статьи по математике, автор научной работы — Гасников Александр Владимирович, Гасникова Евгения Владимировна, Федько Ольга Сергеевна

Приводится основной аппарат, необходимый для исследования динамики макросистем (систем, описывающих динамику взаимодействия большого числа агентов) при больших значениях времени. В основе динамики лежит эргодическая марковская цепь с огромным числом состояний. При больших значениях времени распределение макросистемы по макросостояниям будет близко к стационарному. С ростом размерности макросистемы (количества состояний марковской цепи) стационарное распределение будет концентрироваться в окрестности наиболее вероятного макросостояния, которое и принимается за равновесное для данной макросистемы. В качестве примеров применения описанного формализма приводится вывод известного способа ранжирования web-страниц PageRank и вывод модернизированной статической энтропийной модели расчета матрицы корреспонденций исходя из «разумной» (индивидуально выгодной) динамики обменов местами жительства. В конце статьи приводится общая схема исследования равновесий макросистем, отличительной особенностью которой является возможность учитывать рост размерности пространства макросостояний системы вместе с ростом числа агентов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гасников Александр Владимирович, Гасникова Евгения Владимировна, Федько Ольга Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On possible dynamics in Google's PageRank and a new model for a ocorrespondence matrix

In this paper, the basic technique for research of macrosystems dynamics at large time values is developed. In the core of the dynamics lies the ergodic markovian chain with a huge number of states. At large time values the macrosystem distribution over macrostates is close to a stationary one. With growth of macrosystem dimension (the number of markovian chain states), the stationary distribution is concentrated in a small vicinity of the most probable macrostate accepted for the given macrosystem equilibrium. As an example of application of the described formalism, we give the derivation of the static Googles PageRank model and the modernized gravitational model for calculating a correspondence matrix from the ≪reasonable≫ (individually favorable) dynamics of residences exchanges. At the end of the paper we describe the general scheme of macrosystem equilibriums investigation. This scheme allows us to increase the dimension of macrostates space when the number of agents increases.

Текст научной работы на тему «О возможной динамике в моде- ли ранжирования web-страниц PageRank и модернизированной модели расчета матрицы корреспонденций»

УДК 519.214.6, 519.722, 519.876

А. В. Гасников, Е. В. Гасникова, О. С. Федько

Московский физико-технический институт (государственный университет)

О возможной динамике в модели ранжирования \¥еЬ-страниц PageRank и модернизированной модели расчета матрицы корреспонденций

Приводится основной аппарат, необходимый для исследования динамики макросистем (систем, описывающих динамику взаимодействия большого числа агентов) при больших значениях времени. В основе динамики лежит эргодическая марковская цепь с огромным числом состояний. При больших значениях времени распределение макросистемы по макросостояниям будет близко к стационарному. С ростом размерности макросистемы (количества состояний марковской цепи) стационарное распределение будет концентрироваться в окрестности наиболее вероятного макросостояния, которое и принимается за равновесное для данной макросистемы. В качестве примеров применения описанного формализма приводится вывод известного способа ранжирования ■теЬ-страниц PageRank и вывод модернизированной статической энтропийной модели расчета матрицы корреспонденций исходя из «разумной» (индивидуально выгодной) динамики обменов местами жительства. В конце статьи приводится общая схема исследования равновесий макросистем, отличительной особенностью которой является возможность учитывать рост размерности пространства макросостояний системы вместе с ростом числа агентов.

Ключевые слова: эргодическая теорема, функция Ляпунова, энтропия, ранжирование ■теЬ-страниц PageRank, гравитационная модель расчета матрицы корреспонденций, концентрация инвариантной (стационарной) меры, канонический скейлинг, условие динамического равновесия, принцип детального равновесия.

Введение

После работ Е. Т. Джейнса (конца 50-х годов XX века) [1], А. Дж. Вильсона (конца 60-х годов XX века) [2], И. Пригожина с коллегами, Г. Хакена (70-е годы XX века) [3,4] в литературе достаточно прочно укрепилась концепция о плодотворности перенесения термодинамического формализма (см., например, [5-14] и цитированную там литературу) на различные макросистемы (в частности, встречающиеся в экономике, биологии, социальной сфере [2-4; 15-24]). В России систематические исследования в этом направлении были предприняты Л. Н. Розоноэром в начале 70-х гг. XX века [25] (см. также [26-34] и цитированную там литературу). Упомянутая концепция часто используется для нахождения равновесия макросистемы. А именно, по аналогии с феноменологической термодинамикой, вводится вероятностное распределение на множестве состояний, в которых может пребывать макросистема. Такое распределение может, например, совпадать с инвариантной мерой эргоди-ческой динамической системы, порождающей рассматриваемую макросистему [11], или с финальным (равным стационарному) распределением эргодического (например, марковского) случайного процесса, порождающего рассматриваемую макросистему [35-40]. Если размерность макросистемы увеличивается, то, как правило, распределение сосредотачивается в окрестности наиболее вероятного макросостояния1. Таким образом, с ростом времени наблюдения за макросистемой и размерности макросистемы следует ожидать нахождения макросистемы с большой вероятностью в

1 Заметим, что отмеченное обстоятельство (концентрация) может быть по-разному обосновано (как правило, достаточно элементарных комбинаторных соображений и формулы Стирлинга [1, 2, 30, 33]).

малой окрестности наиболее вероятного макросостояния вне зависимости от того, в каком состоянии макросистема находилась сначала (иначе говоря, большую часть времени (иногда и просто на больших временах) макросистема будет пребывать в малой окрестности наиболее вероятного макросостояния). Естественно поэтому под равновесием макросистемы понимать наиболее вероятное макросостояние. Задача нахождения наиболее вероятного макросостояния часто сводится (асимптотически по размерности системы) к задаче максимизации энтропийно подобного функционала при ограничениях (в термодинамике таким образом можно получить статистики Больцмана, Ферми-Дирака, Бозе-Эйпштейпа [1, 5]). Подробнее о приложениях этой концепции см., например, [1, 2, 30, 33; 41-45].2

В данной статье мы уделяем особое внимание тому случаю, когда эволюция макросистемы описывается законами стохастической химической кинетики (равноправие агентов) [47], причем число химических реакций и размерность пространства макросостояний системы могут расти с ростом числа агентов в системе. Но при этом, вообще говоря, не предполагается возможность осуществления термодинамического предельного перехода, т.е. не предполагается, что рост прямо пропорциональный [47, 48]. Часто мы будем считать, что число агентов должно расти быстрее, чем размерность пространства макросостояний.

Статья построена следующим образом. В разделе 2, по-видимому, впервые известная модель ранжирования web-страниц, положенная в основу работы поисковой системы Google в начале XXI века, обосновывается исходя из концепции равновесия макросистемы. В разделе 3 в ответ на запрос прикладников: предложить более адекватную модель расчета матрицы корреспонденции крупного мегаполиса (г. Москва), предлагается и обосновывается (с точки зрения концепции равновесия макросистемы) модернизация известной энтропийной модели, лучше описывающая реальные данные. В разделе 4 приведена общая схема, в которую ложатся модели, описанные в разделах 2 и 3.

1. Возможная динамика, приводящая в асимптотике (по времени) к новой интерпретации известного способа ранжирования web-страниц PageRank

Хорошо известно, что поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина [49]. В 1996 году они работали над поисковой системой BaekRub, а в 1998 году на её основе создали новую поисковую систему Google [50]. В статье [49] был предложен определенный способ ранжирования web-страниц. Этот способ, так же как и довольно большой класс задач ранжирования возникающих, например, при вычислении индексов цитирования ученых или журналов, сводится к нахождению левого собственного вектора р некоторой стохастической матрицы Р: ff = рР. Обоснование этому дает теория цепей А. А. Маркова (1906). Точнее, эргодичеекая теорема для конечных однородных неразложимых и непериодических марковских цепей:

3! р : ff = ff Р, и если f (п + 1) = р (п) Р, п G N, то

2Укажем некоторые часто встречающиеся в приложениях [41-45] формализмы, также приводящие к задачам оптимизации энтропийно подобных функционалов: принцип наибольшего правдоподобия (при оценке неизвестных параметров по простой выборке); принцип максимума апостериорной вероятности; наименьшее отклонение в смысле расстояния Кульбака-Лейблера (энтропийное расстояние) [46]; принцип наименьшей неопределенности (энтропия — мера неопределенности) в теории информации (рассуждения опираются в ряде случаев на теорему Шеннона-МакМиллана-Вреймана). Важно также отметить, что энтропийно подобный функционал часто является функцией Ляпунова для динамической системы (например, системы обыкновенных дифференциальных уравнений, итерационного процесса, уравнения(-ий) в частных производных эволюционного типа и т.п.), порождающей рассматриваемую макросистему [12; 17-20]. Пожалуй, наиболее ярким примером этого тезиса является кинетическая теория (Л. Вольцман [8]).

V pF (1) ^ lim fF (п) = fF (здесь все векторы, являются распределениями вероятностей).

Цель настоящего раздела предложить другое обоснование ранжирующему вектору р {fF = fFР), базирующееся на концепции равновесия макросистемы [47].

Имеется ориентированный граф G = (V, Е) сети Интернет (вершины — web-страницы, ребра — ссылки: запись (i,j) Е Е означает, что па i-й странице имеется ссылка на j-ю страницу), N — число пользователей сети (это число не меняется со временем, N ^ \V\ ^ 1),3 Р = (1 — а) Е + аР, где Е — единичная матрица, р^ = l{k : (г, к) Е Е}|-1, i = j, иначе = 0, а Е (0,1) (часто полагают а = 0.85). Пусть ni (t) — число посетителей web-страницы i в момент времени t. За один такт времени каждый посетитель с вероятностью apij переходит по ссылке на web-страницу j,4 Считаем стохастическую матрицу Р неразложимой и апериодической. Ниже приведен основной результат, позволяющий по-другому интерпретировать вектор р (PageRank): pF = fFР, согласно которому и происходит ранжирование web-страниц.

Теорема 1. V q = 0, ..., \V| 3 Xq > 0, Tq = O (Poly (\V|)) : V t ^ Tq

P

(

nk (t) _ 1

^ ^¿E, к = 0, ...,Q\ > 0.99

V-N

Npk

3 Л > 0, T = O (Poly (\V|)) : V к = 0, ..., \V|, t > Tq ^ P

nk (t) _ i

Npk

< > 0.99

Vn

где fF = fFP (решение единственно в классе распределений вероятностей ввиду неразложимости). При этом здесь для удобства считаем, р1 ^ р2 ^ ... ^ P\v\.

Эффективный итерационный алгоритм поиска вектора р (PageRank), основанный на методе стохастического субградиентного зеркального спуска, описан в работе [51] (см. также [52]).

Рассмотрим теперь, следуя работе [53], другую (Network flow) модель, предложенную Дж. А. Томлиным в 2003 г., также описывающую распределение WWW-трафика. Далее с помощью формализма теории макросистем мы эволюционно проинтерпретируем статический способ ранжирования web-страниц, предложенный в [53], вводя разумную динамику и получая в равновесии желаемую статическую модель Томлина.

Обозначим через nij (t) число пользователей WWW, которые в момент времени t находятся на web-странице г, при этом каждый из них (независимо ни от чего) склонен перейти только на web-страницу j и делает это в промежутке времени [i, t + At) (при условии, что к моменту времени i ^ t от еще не перешел) с вероятностью XAt + о (At). При этом в момент перехода i пользователь с равной вероятностью выбирает, к какому классу njk (?), к Е V: (j, к) Е Е ему примкнуть.

Далее описывается процедура построения такого \ п* > , что в некотором (уточненном ниже) смысле, {ni(t)},- лс -> \ п*,• ^

' у , j)eь I v J (i, j)eе

Определим множество A = {ni -)eь следующим образом: 1) Yl(i j)eе = ^ = const — закон сохранения активности пользователей;

3Иногда считают Р = (1 — а — Е + аР + (Р/ | V|) 1У где I — матрица, все элементы которой равны 1.

Дискретность во времени предложенной выше динамики несущественна. Несложно предложить (см. примеры ниже) вариант схожей динамики в непрерывном времени. Более того, в непрерывном времени все становится даже проще. Скажем, не требуется «задумываться» об условии апериодичности марковского процесса, порождающего изучаемую макросистему (см., например, модель П. и Т. Эренфестов [8]). Впрочем, с периодичностью довольно легко разбираться (в случае малых периодов, как в уже упомянутой модели П. и Т. Эренфестов, про это условие часто можно просто «забыть», в общем случае с помощью ослабления понятия сходимости (используя сходимость по Чезаро)).

2) V г е V (к пкг = (г к)еЕ пгк — закон сохранения числа посетителей г-й

страницы.

Заметим, что уравнения I, II линейно зависимы и, если забыть про ограничение цело-численности п^, то А — выпуклое (аффинное) множество с непустой внутренностью.

Заметим также, что |У | + 1 уравнения I, II, вообще говоря, не однозначно определяют | неизвестных {п^}^ е: поскольку больше |Упричем, как правило, в несколь-

ко раз (типично в пять, шесть раз). Для того чтобы определить {п* Л , введем

еще определение. Будем понимать под исходами всевозможные инъективные отображения в : {1,..., А} ^ Е, такие что {п^ = |{г : в (г) = (г, е А. Предположим,

IЕ1

что все исходы равновероятны. Тогда вероятность трафика {п^}^ -)еЕ е К+ 1 есть

Р ({Щ}(г,Лее) = ^-1 ■ N! ( П

ф, 3)€Е

где Z-1 - определяется из условия нормировки. Отсюда, с учетом формулы Стирлинга 1п

п 1п (п/е) (обоснование см. ниже), имеем

In Р (К^, ^ пц Ы (пц/е).

(г, з)еЕ

Таким образом, поиск наиболее вероятного трафика сводится к задаче максимизации энтропии

н [{п^}(г, ¿)ее) = - ^ па1п па

(г, лее

IЕ1

на неотрицательном ортанте М+ 1 при аффинных ограничениях А. Положим

V (г, з) е Е ^ рц = щ/И. (1)

Считая

N »|Я| > IV|» 1, (2)

«забудем» далее про рациональность рг j.

В результате приходим к задаче энтропийно-линейного программирования

Н ({Рг3}(г, Я£е) = - ^ Pü ln РЦ ^ max_ ,

V ( ' У (г, з)еЕ h,ßeE^АП

A : Pii = 1, Pki - Pik = °,i G V.

(г, j)eЕ k:(k, i)eE k: (i, k)eE

Из формул (1), (2) и того факта, что решение задачи (*) достигается во внутренней ~ I El

точке множества AQ R+ 1 [2], следует, что V (i, j) е Е ^ п^ ^ 1 для слагаемых, дающих основной вклад в сумму ln Р т'е' пРименение асимптотической формулы

Стирлинга было «вполне законным».

Поясним теперь, чем примечательно наиболее вероятное распределение трафика. Оказывается, в предположении равновероятности всех исходов, возникать будут в основном те распределения {рг^}^ е е -Afl«+') которые «близки» к

(обоснование см. в разделе 4).

Вернемся к задаче (*). Её решение можно явно выписать (см. раздел 4):

V (i, j) е Е ^ ргj = вхр(-\о)вхр(-\г) / exp(-\j),

где Ао - множитель Лагранжа (двойственная переменная) к ограничению E(i pij = 1, а _ множитель Лагранжа к ограничению Ек- (к ры (i к)еЕР^к = 0. Приведенную

связь можно интерпретировать как наличие у web-страниц «потенциалов значимости» — рангов ^i, определенных с точностью до одного и того же положительного множителя: щ = exp (—Aj) — «Температура» (НОTness) i-й страницы.

Чем больше «температура» web-страницы с номером i и чем меньше «температура» web-страницу с номером j ((i, j) £ тем интенсивнее поток р^ (тем больше пользователей переходит в единицу времени с web-страницы г на web-страницу j).

Важно обратить внимание на общее правило: полученное попутно (при поиске равновесия макросистемы, путем решения задачи энтропийно-линейного программирования) решение двойственной задачи будет представлять самостоятельную ценность. Это обстоятельство хорошо известно в математической экономике (интерпретация Л. В. Канторовича множителей Лагранжа (двойственных переменных) к ресурсным ограничениям как цен ресурсов [54]) и в статистической физике (например, при выводе статистик Л. Больцмана, Ферми-Дирака, Бозе-Эйнштейна [5, 8, 9]). При этом возникающие в статистической физике множители Лагранжа также получают впоследствии интерпретацию и размерность, например, величина, обратная к температуре [5]. Используя эту аналогию, Дж. А. Томлин предложил ранжировать web-страницы (в поисковой системе) по их «температуре». Более посещаемые web-страницы «нагреты» сильнее, как следствие, имеют больший ранг.

Сформулируем теперь более аккуратно основной результат. Для этого предварительно введем такую перестановку ij (■), что Р*л ^ P*j(2) ^ ••• ^ P*j(|е|)> а затем введем обозначение Пк (t) = п^(к) (t), к = 1, •••,\Е|.

Теорема 2. V q = 0, •••, \Е\ 3 \д > 0, Tq = O (Poly (\V\)) : V t ^ Tq

Р

(

Пк (t)

Np,

1

ij(k)

< ,k = l,..,q) > 0^99;

Vn ' ' 'V '

p*

3 \> 0, T = O (Poly (\V\)) : V к = 0, •••, \E\ ,t ^ T ^ P

\j(k)

Рассмотрим теперь общую задачу энтропийно-линейного программирования:

(

Пк (t) _ 1

< 1 ^ 0^99^

Vn

т

— у ^ хк ln (хк/е) ^ max A : Л (х) = q — Tx = 0^,F (х) = d — Gx ^ 0^ (3)

к=1 П R+

В работе [55] для отыскания единственного решения (3) было предложено семейство двойственных барьерно-мультипликативных итерационных алгоритмов, которое содержит алгоритмы Брэгмана-Шелейховского, MART, GISM, Ю. С. Попкова и др. [30, 45]:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ХП = exP (— Т!Р=1 ЧкХр — Eg=i 9дк^ , к = 1, •••, т; х;+1 = хр — 49$ (qp — тт=1 Чк%П), р = 1, •••, I; (4)

Рк+1 = рр — арпрдд (dq — Ет=19дкхр), Q = 1, •••, W,

где шаги ^ > 0 а > 0 достаточно маленькие, а дважды гладкие функции (■)} {gq (■ )}™=1 монотонно возрастают и равны нулю в нуле. Например, часто выбирают

9$ (у) = — ln (1 — y/qp) ,Р = 1,:;1; (у) = y/dq ,q =

Однако, как правило, разумно (с точки зрения эффективности счета) обнулять на каждом шаге большую часть случайно выбранных компонент этих векторов, причем вероятностный отбор осуществляется исходя из текущего состояния итерационного процесса (отметим, что согласно алгоритму Кнута-Яо [56] задача разыгрывания случайной величины, принимающей п различных значений, требует в среднем log2 (п — 1) + 2 подбрасываний

симметричной монетки, значит, может быть довольно быстро решена), при этом после обнуления большинства компонент и соответствующего вытягивания по оставшимся (чтобы сохранить приблизительно длину) получившейся вектор должен быть довольно близким к градиенту [57]. То есть разумно осуществлять в двойственном пространстве своеобразный стохастический субградиентный спуск (для более глубокого погружения в эту тематику можно рекомендовать работы А. С. Немировского [58] и Ю. Е. Нестерова [59]).

Глобальная сходимость итерационного процесса (4) была установлена в [55] при следующих предположениях:

1)3 г>0т : д-Тг = 0Ь й-Сг ^

2) Строки матриц Т = \\tpkЦр™-^ О = \\ддк1 линейно независимы в совокупности.

При этом было замечено, что предположение 2 не всегда выполняется в прикладных задачах (см., например, модель ранжирования \\'еЬ-страниц Дж. А. Томлина). Оказывается, что от предположения 2 можно отказаться. А именно, если справедливо только предположение 1, то найдутся такие достаточно маленькие шаги (в зависимости от начального приближения), что итерационный процесс (4) будет сходиться (глобально, поскольку начальное приближение может быть любым допустимым ограничением задачи) к единственному решению задачи (3). Доказательство в целом аналогично случаю регулярных ограничений. Однако в случае зависимых ограничений решение двойственной задачи, вообще говоря, будет не единственно (более того, множество решений будет представлять собой линейно-выпуклое множество). Поэтому исследовать итерационный процесс следует в должным образом факторизованном пространстве.

Итерационные алгоритмы (4) особенно эффективны:

• для сильно разреженных матриц Т и С;

• при I + и> ^ т.

При этом время работы (число арифметических операций типа умножения двух чисел с плавающей точкой) детерминированного алгоритма (4) оценивается соответственно как О (т, + I + -м) ш О (т ■ (I + -ш)). Стохастические варианты, о которых мы говорили выше, работают заметно быстрее.

2. Возможная динамика, приводящая в асимптотике (по времени) к новой версии статической модели А. Дж. Вильсона расчёта матрицы корреспонденций

В некотором городе имеется п районов, Ьг > 0 — число жителей г-го района, > 0 — число работающих в ^'-м районе (число рабочих мест), х^ (к) ^ 0 — число жителей, живущих в г-м районе и работающих в м в момент времени £ ^ 0. Со временем пронумерованные жители (количество которых не меняется5 и равно N = ^1 Ь^ = ^™= 1 меняют места жительства (квартиры). Считается, что отмеченные изменения могут происходить только за счёт обмена квартирами, т.е.

хгз (к) ^ 0 1 хгз (к) = Ьг, 1 ху (*) = wj, г, 3 = 1, ..., п, 1 < п2 < N. (А)

Пусть в момент времени £ ^ 0 г-й житель живет в к-м районе и работает в т-м, а в-й житель живет в р-м районе и работает в д-м. Тогда \к т. (¿) ДЪ + о (Дк) есть вероятность того, что жители с номерами г и 8 (1 ^ г < 8 ^ А) поменяются квартирами в промежутке времени (Ь, £ + Дк). Естественно считать, что вероятность в единицу времени обмена местами жительства зависит только от мест проживания и работы обменивающихся.

5Поскольку мы будем следить за системой на больших временах, то сделанное предположение кажется неестественным. Заметим, однако, что если «номер жителя» передаётся его потомкам (номер папы передаётся сыну, номер мамы — дочери), то предположение о постоянстве состава жителей выглядит разумным в первом приближении. Здесь мы также пренебрегаем миграционными потоками (город изолирован).

Например, можно считать, что расстояние от района г до района ] есть Iц > 0, а

^к,т; р,д (?) = ^к,т; р,д = ^— ехР ( ^ (1кт) + (1рд) - № (1рт) + Я (¡кд)) ) ,

4-*-' *--'

суммарные затраты суммарные затраты до обмена после обмена

где Л > 0 характеризует интенсивность обменов, функция К (I) = — ш 1п ¿) /2, а > 0, @ > 0 ш > 0 отражает затраты в пути (первое слагаемое) и одновременно возможность найти подходящую работу на расстоянии порядка I от места жительства: чем больше I, тем больше территория для поиска ~ 2ж1А1, тем больше вероятность успеха (найти подходящую работу), тем меньше должны быть затраты К (I) (второе слагаемое). Анализ данных по г. Москва (на базе опыта А. В. Кулакова (МЛД11)). проведенный осенью 2011 г. в Лаборатории прикладного моделирования транспортных систем НИМ им. М. В. Келдыша РАН (зав. лаб. В. П. Осипов), показывает, что ш ~ 2 — 4 (надо заметить, что эта оценка предварительная и нуждается в перепроверке). В классической статической энтропийной модели (второй половины 60-х годов XX века) А. Дж. Вильсона ш = 0 [2, 32, 47]. Однако по Москве наблюдается заметно лучшее соответствие реальных данных рассматриваемой модели, если допускать ш > 0 и оптимально его подбирать. При весьма общих предположениях считают, что @ ~ 1. По поводу выбора а см., например, [32]. Отметим также, что ряд специалистов по расчету матрицы корреспонденций (например, В. И. Швецов (ПСА РАН)), с которыми мы консультировались, склонны считать, что вместо слагаемого в формуле для К (I) правильнее писать:

( ы13, 0 <1 < у, у« , у

< , , , у V > ш, = V 1пу

\у 1п I, I > I, ' '

Можно показать (см. раздел 4), что

у {хи}7= I з=1 е (А) ^ ¿1™ р (хч (?) = хи, г, з = 1,...,п) =

= П ехр[[Ш 1п1гз — а ■ Хц) ■ (хгз\)-1^р ({хгз}^]=1) ,

г=1, 3=1

где статсумма 2 находится из условия нормировки получившейся «пуассоновской» вероятностной меры. Отметим, что распределение р ^{Хг3 }™= ™ удовлетворяет условию детального равновесия (частный случай более общего условия инвариантности):

(%кт + 1) (%рд + 1) Р ({^1Ъ %кт + -1, %рд + -1, %рт 11, %кд -1, %пп}) ^к,т; р,д =

п

%рт%кдР ^}г=\, ^

V }г=1, ]=1) лр,т; к,д.

Распределение р ({х^}™= 1 -=1) на множестве (А) сконцентрировано при N ^ 1 (см. раз-

дел 4) в окрестности наиболее вероятного значения < х*,• > , которое находится, как

13 1 í=l, ]=1

п, п

решение задачи энтропийно-линейного программирования (по поводу ограничения цело, з=

численности {х13}™"==1 =1 см. [2, 47] и предыдущий раздел):

п, п п, п

^ Хц 1п (Х%3/е) + ^ (а ■ (1г3) — Ш 1п 1г3) Х^3 ^ т1^ / (5)

г=1,3 = 1 г=1,]=1

Решение задачи (5) можно представить как

Xг3 = ехр ^ — 1 — Л% — ^ + Ш 1п Iг3 — (1 ■ (1^,

где множители Лагранжа (двойственные переменные) и определяются

из равенств системы (А). На практике мы имеем информацию о Решив задачу (А), мы найдем

{хкт ({Ll,Wl}P= 1; {1ц}П=

р, р

к=1 , т 1

Такой способ расчета матрицы корреспонденции с ш = 0 в литературе часто называют (энтропийной) гравитационной моделью:

хгз = AiBjLiWj (1гз)ш exp a ■

где {Ai}p= 1 и {Bj}п_ 1 определяются из соотношений, аналогичных [2, 30, 32]:

1

I п

А, = ( £ В3 Wj (kjf exp [—а ■ (l^f)

В3 =

\3 = 1

^ АгЬг (1г,)ш exp [—а ■ (lt,f fj

1

Приведем теперь оценку концентрации стационарного распределения р (^{х^}П= П в

п, п

окрестности наиболее вероятного значения \ x*,j f . Для этого предварительно введем

I J i=1, j=1

такую перестановку ij (■), что ^ x*j(2) ^ ••• ^ xij(n2)> а затем введем обозначение

Пк (t) = х^(к) (t) ,к = 1, •••,n2• г2 3 Xq > 0, Tq = O (Poly (N)) : V t ^ Tq

Пк (t)

Теорема 3. V q = 0,

P

1

ij( к)

<

Aq П

JN,

к = 1, ..,q\ ^ 0-99

3 A > 0, T = O (Poly (N)): V к = 0,

n

t > T -+P

(

Пк (t)

1

Ъг](к)

<

Xn

Стоит обратить внимание, что выше был описан лишь один из возможных способов (энтропийный) получения модели расчета матрицы корреспонденций. Существуют и другие подходы. Например, модель С. А. Стауффера [61], также называемая моделью промежуточных возможностей, и модель конкурирующих центров [62, 63]. Хотелось бы также обратить внимание на предложенную в статье [64] объединенную «гравитационно-конкурирующую» модель энтропийного типа. Примечательно, что обоснование таких популярных на практике моделей может быть получено подобно только что изложенной схеме, где в стохастическую динамику вводится больше специфики, в частности, вводится учет новых факторов, определяющих формирование корреспонденций [32].

В последнее время в крупных мегаполисах крайне остро встают вопросы о том, какие меры надо предпринимать, чтобы разгрузить автотранспортную сеть города. Например, важно уметь отвечать на следующие вопросы: где и какую дорогу следует построить при заданных бюджетных ограничениях? Каким образом (в каком размере) взимать плату за проезд с трасс в центре города? На каких трассах стоит в первую очередь увеличивать число полос? Где стоит в первую очередь переделывать развязки - делать новые? Ниже (на базе модели расчета матрицы корреспонденций) мы приведем (мотивируя и аргументируя) некоторый математический аппарат (оставаясь в рамках того же формализма, в котором мы изложили предыдущие примеры), который может пригодиться в изучении описанных выше вопросов [32, 47, 65, 66].

Ориентированный граф Г = (V., Е) — транспортная сеть города (V — узлы сети (вершины), Е С V х V — дуги сети (рёбра графа)). Пусть Ш = {"Ш = (г, ]) : г,.] € V} — множество

пар источник^сток; р = {у\,у2, ..., Ут} — путь из если , ^+1) Е Е,к = 1,..., т — 1,

т ^ 1 (как будет видно в дальнейшем (см. пример В. И. Швецова), иногда для задания пути может быть недостаточно указания только набора вершин, в общем случае нужно также указывать, какое именно ребро, соединяющее заданные вершины, выбирается); Рт — множество путей, отвечающих корреспонденции ад Е Р = УР™ — совокупность всех путей в сети Г хр — величина потока по пути р, х = {хр : р Е Р}; Ор (ж) — удельные затраты на проезд по пути р, С (ж) = {Ор (ж) : р Е Р}; уе — величина потока по дуге е:

Уе = Ерер5еРХр,ще 5ер = { 0, ^р ^ = 0 = {5еР}ееЕ,Рер)'>

те (уе) — удельные затраты на проезд по дуге е (как правило, возрастающие, выпуклые, гладкие функции), естественно считать, что Ср (ж) = Ееее(Уе) ^р (х) = 0Тт (у))-Заметим, что в приложениях часто требуется учитывать и затраты на прохождения вершин графа (в свою очередь эти затраты могут зависеть от величин всех потоков, по путям, проходящим через рассматриваемую вершину) [32]. Пусть также известна матрица корреспонденции с!т, ад Е Ш (см. предыдущий пример). Тогда вектор ж, характеризующий распределение потоков, должен лежать в допустимом множестве:

X = <х ^ 0 : ^ хр = йу}, ад Е Ш

{ реРы

Это множество может иметь и другой вид, если дополнительно учитывать, например, конечность пропускных способностей рёбер (ограничения сверху на уе).

Рассмотрим игру, в которой каждому элементу ад Е Ш соответствует свой, достаточно большой {йы ^ 1), набор однотипных «игроков» («сидящих на корреспонденции ад»). Множеством чистых стратегий каждого такого игрока является Рт, а выигрыш (потери со знаком минус) определяется формулой -Ср (ж) (игрок «выбирает» путь следованияр Е Рш, при этом он пренебрегает тем, что от его выбора также «немного» зависят 1Р.| компонент вектора ж и, следовательно, сам выигрыш -Ср (ж)). Можно показать, что отыскание равновесия Нэша(-Вардропа) х* Е X (макроописание равновесия) равносильно решению задачи нелинейной комплементарности (принцип Дж. Г. Вардропа (1952)), что равносильно решению вариационного неравенства:

V ад Е р Е Рш ^ х*р ^ Ср (ж*) - шт Оя (ж*)^ = 0 ^ V ж Е X ^ (б (ж*), (ж - ж*)^ ^ 0.

Несложно показать, что если С (ж) — строго монотонное преобразование, т.е.

V х,х Е X (ж = г) ^ (<б (ж) - б (г), х - ^ > 0,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

то равновесие Нэша-Вардропа единственно. Также несложно показать, что задача отыскания равновесия Нэша-Вардропа сводится к решению следующей задачи выпуклого программирования:

ЕГ^реР хр$ер

/ те (г) ёг ^ шт.

/п х£Х

ееЕ и 0

Отсюда видно, что если

V е Е Е ^ т'е (■) > 0, то V (у) = Ееее ^ (*) dz

— строго выпуклый функционал, и равновесие у* — единственно. Отметим, что это еще не означает единственность равновесия ж*. Действительно, при весьма естественных условиях вектор-функция удельных затрат пользователей на проезд С (ж) может не быть строго монотонной:

3 х,у Е X (ж = у) : б (ж) = б (у) ^ (б (ж) - б (у), х - у^ = 0.

Связано это может быть, например, с тем, что С (х) = Втт (у), у = Вх, где вектор У = {Уе}ееЕ описывает загрузку ребер (дуг) графа трапспортной сети, т (у) = {те (уе)}ееЕ — вектор-функция затрат на проезд по ребрам графа транспортной сети, В — матрица инцидентности ребер и путей, и разные векторы распределения потоков х могут соответствовать одному и тому же вектору у = Вх.

Пример (пенсне Швецова). На рис. 1 показано равновесное распределение потоков для любого значения параметра х € [0, 0.5] и любой строго монотонной функции затрат, одинаковой для всех дуг графа.

0.5 0.5

Рис. 1

Численные методы поиска равновесного распределения потоков описаны, например, в работах [32, 47]. Отметим среди этих способов один из первых: итерационный алгоритм Франка Вульфа. Примечательно, что этот численный алгоритм, впрочем, как и ряд других, может быть содержательно проинтерпретирован (как динамика нащупывания равновесия Нэша в соответствующей повторяющейся игре) подобно приведенному ниже тексту. Далее мы приводим способ взаимодействия участников дорожного движения (игроков), приводящий к стохастическому равновесному распределению потоков [67], «вырождающемуся» в равновесное распределение Нэша Вардропа.

Предположим, что свой путь на (п + 1)-м шаге6 игрок, сидящий на корреспонденции w, выбирает согласно смешанной стратегии (в независимости от всех остальных): с вероятностью

Prob™ (п + 1) = 7exp (-Gp (х (п)) /Т) /Z™, w е W, (6)

выбрать путь р е Pw (0 < j ^ 1, 7 — маленькое), а с вероятностью 1 — 7 — действовать согласно стратегии, использованной на предыдущем п-м шаге. Здесь хр (п) — количество игроков, сидящих на корреспонденции w и выбравших на n-м шаге стратегию р е Pw,

ZW = £ exp (—Gp (x (n))/T),

pePw

T > 0 — «температура» (горячность) игроков. Это хорошо известное logit-распределение [47]. Оно может быть проинтерпретировано, как выбор каждым игроком наилучшей стратегии вчерашнего дня, если игрок «переносит» затраты вчерашнего дня Gp (х (п)) на день сегодняшний, но допуская при этом случайные флуктуации Gp (х (п)) + £р, где £р — независимые случайные величины, имеющие одинаковое двойное экспоненциальное распределение (Гумбеля). Тогда arg min [Gp (х (п)) + £р} как раз имеет указанное выше logit-

pZPw

распределение.

Теорема 4. Пусть V е е Е ^ те (■) > 0 и хр >> 0 —^ хр ^^^ 1

.марковская динамика (6) «сходится» на больших временах к некоторому стационарному

''Например, шаг с периодом в день можно проинтерпретировать как выбор утром маршрута следования (пути) из дома па работу, исходя из «опыта» вчерашнего дня. Заметим, что информацию о Ср (х (те)) водители (игроки) черпают из открытых источников типа Яндекс.Пробки.

распределению вероятностей, которое называют, «стохастическим равновесием, в транспортной сет,и». В предположении, что Т > 0 и ^ > 0 ^ должным образом малы, это стационарное распределение сконцентрировано в малой окрестмост,и, такого равновесия Нэша Вардропа:

Эта теорема отвечает на некоторые вопросы, поставленные в работах [68, 69].

Отметим, что предложенную динамику (6) можно трактовать как стохастическую динамику наилучших ответов в эволюционной (популяционной) игре [70-72], при этом полученное равновесие может также быть проинтерпретировано как «quantal response equilibria» [73]. Близкой к предложенному итерационному процессу (6) является концепция генетических алгоритмов [74] и эффективный приближенный вероятностный (с гиббсовским («logit») распределением вероятностей) алгоритм Григориадиса-Хачияна [75].

Довольно близкое к теореме 4 утверждение имеется в недавней работе [76]. Отметим также работы [77, 78], в которых предлагается схожая с (6) содержательная стохастическая динамика на базе стохастического субградиентного зеркального спуска, которая почти наверное приводит к равновесию Нэша-Вардропа.

Описанный выше формализм позволяет пойти и дальше. В частности, рассмотреть модели равновесного распределения для нескольких классов пользователей (в том числе модели расщепления потоков по типу передвижений), модели равновесного распределения потоков с переменным спросом на потоки, динамические модели равновесного распределения [32, 69]. На счет последнего, пока имеющийся здесь задел совсем не велик, и работа в этом направлении является, на наш взгляд, сейчас наибольшим вызовом в этой области.

Отметим также, что описанная выше модель равновесного распределения потоков (BMW-модель [47]) хотя и является очень популярной (достаточно сказать, что эта базовая модель, зашитая практически во все наиболее популярные сейчас пакеты моделирования

транспортных потоков: ЕММЕ/3, MITSIM, PTV(VISSUM), TRANSNET, AIMSUN и др.),

тем не менее у неё есть и свои довольно существенные недостатки, о которых, например, написано в статье [79]. В этой же статье была предложена оригинальная модель равновесного распределения потоков (менее требовательная к качеству располагаемых данных), получившая впоследствии название модели Нестерова-де Пальмы или модели стационарной динамики. В [47] описан способ вычисления стохастических равновесий в этой модели. Здесь мы бы хотели лишь отметить, что, так же как выше для ВМХУ-.модс. ш. можно было провести соответствующие рассуждения и для модели Нестерова-де Пальмы.

В заключение этих двух разделов хотелось бы также упомянуть то обстоятельство, что в довольно большой класс математических моделей в биологии может быть введена динамика подобно описанным выше примерам [15]. При этом интересно отметить, что введенная динамика получает содержательную интерпретацию: «естественный отбор». С помощью функционалов Ляпунова такой динамики формулируются условия «эволюционной оптимальности». В этой связи можно рекомендовать работы В. Н. Разжевайкина, см., например, [80] и цитированную там литературу.

3. Общая схема исследования равновесий макросистем

Ниже приводится (во многом под влиянием работ [18, 19, 47, 48, 81-83]) общая схема (в непрерывном времени), в которую «ложатся» примеры разделов 2 и 3.

где у* - единственное решение задачи

Предположим, что некоторая макросистема может находиться в различных состояниях, характеризуемых вектором п с неотрицательными целочисленными компонентами. Будем считать, что в системе происходят случайные превращения (химические реакции). Пусть п ^ п — (а, Д^ € ■] — все возможные типы реакций. Введем, следуя М. А. Леонтовичу

(1935) [19], интенсивность реакции (случай дискретного времени рассматривается аналогичным образом):

\а,Ц)(п) = Л(«,Д) ^ Н — « + = м 1-Ег"гкр (й) П •... • (пг — + 1),

г: а1>0

где Кр ^ 0 — константы реакции (в химической кинетике — постоянные, а в социодинамике (В. Вайдлих [20]) — необязательно); при этом часто считают Ег пг (¿) = М,т.е. ^(р/) —

вероятность осуществления в единицу времени перехода п ^ п — а + единицу времени равновероятно выбираются («приближение среднего поля») любые два жителя города и в зависимости от того, в каких состояниях они находились, «случайно» переводятся в новые состояния. На макроуровне все это соответствует принципам химической кинетики (закон действующих масс Гульдберга-Вааге, 1864 [18]). Таким образом, динамика макросистемы задается линейной полугруппой (однородный дискретный марковский случайный процесс), инфинитезимальный оператор которой определяется интенсивностями реакций ^(р/)

Следующая теорема отображает (немного обобщая) известные результаты а) В. В. Веденяпина [18], б) С. А. Пирогова, В. А. Малышева, А. Н. Рыбко [19, 81] и в) обобщает результаты В. Вайдлиха и др. [20] на случай, когда рассматривается более общая схема, чем модель миграции населения.

Теорема 5. а) (р,п (¿)) = (р,п (0)) ^ Д±Ып < а — . (то).

у J (й , ¡3)£-1

б) Пусть выполняется условие динамического равновесия, которое, следуя В. В. Веденяпину, будем далее называть условием Штмкельберга-Батищевой-Пирогова:

3 £>°: V й К* П, ф = £/: 4 П, (Н) = кр. (ШБП)

Тогда «пуассоновская» мера и (п) = Пг Х™г е-Л^щ! (точнее говоря, мера, индуцированная пуассоновской мерой на множестве (вообще говоря, конечном!), задаваемом, условиями (ту)), где Хг = ЦМ, а, — произвольное решение (ШБП), будет инвариантной относительно предложенной стохает,ической марковской динамики. Эта мера экспоненциально быстро концентрируется, с ростом М, в окрестности наиболее вероятного состояния (также удовлетворяющего условию (ШБП)), которое и, принимается за положение равновесия макросистемы. Задача, поиска наиболее вероятного макросостояния асимптотически эквивалентна задаче максимизации энтропийного функционала, (воспользовались п

! = (п/е)п (1 + о (1)) — формулой Стирлинга):

Е (п) К — Пг • (1П (Пг/Хг) — 1)

г

на множестве, задаваемом, условием (ту). Отметим, что условие (ШБП), называемое также условием унитарности [19], обобщает хорошо известное в физике и экономике условие детального равновесия [20, 38]:

3 £>в: V (ЧД) € J ^ Кр П = КрП £.

з з

в) Пусть

V € 3 ^ £аг = £рг] аг,рг € {0,1} ,= ,

КI (Й)=к| ехр I £ щ (щ + 1) - иг (пг)\ ,щ (пг) < 0.

\г: ^=1 г: а{=1 )

Тогда мера V (п) = ехр (Ег иг (пг)) ■ Пг (пг!)-1, г<9е иг (пг) = 2 ЕП= 1 иг (и) будет инвариантной относительно предложенной стохает,ической марковской динамики. Эта м,ера, экспоненциально быстро концентрируется, с рост,ом, М = Егпг (¿), в окрест,пост,и наиболее вероятного состояния, которое и, принимается за положение равновесия макросистемы. Задача поиска наиболее вероятного макросостояния асимптотически эквивалент,на задаче максимизации энтропийного типа функционала

Е (п) ~ ^ {-пг 1п (пг) + Щ (пг)}

на множестве, задаваемом, условием (ту).

Замечание б) и в). В пунктах б) и в) предполагалось, что марковский процесс неразложим (неприводим) в классе (ту): из любого состояния можно со временем прийти в любое другое (по-прежнему оставаясь на множестве (ту)). Отсюда следует единственность инвариантной меры. Это условие не выполняется, например, для хорошо известной модели «хищник-жертва» (кролики-трава) [3, 15, 17, 22], в которой имеется поглощающее состояние: без хищников.

Замечание б). Будем считать, что ограничения (законы сохранения) (ту) задаются СЛАУ Ап = где А = \\Aki|| - матрица максимального ранга. Обозначим через А множество неотрицательных целочисленных векторов п, удовлетворяющих Ап = d. Тогда равновесие п* = {п*}г=1 находится как решение задачи Е (п) ^ тах (поскольку функционал

п €Л

строго вогнутый и считаем п* ^ 1, то целочисленностью переменных можно пренебречь, то есть произвести релаксацию задачи). Используя принцип Лагранжа, можно показать, что решение этой задачи представляется в виде

п* = Щ (у*) = Xi exp

(^Е AkiУ*^ ,

где двойственные переменные (множители Лагранжа) у* определяются из системы Ап (у) = Исследуем концентрацию меры р ({щ}— 1) в окрестности наиболее вероятного значения {п*}—г Для этого прежде всего заметим, что из определения {п*}—1 следует

V {„г}- ! е (А) ^ ± «Ш - „.) < 0.

1

Поэтому

v [Ui}Zi G (A) 3 в G [0,1] :

Vni дп2

.» р ({ni}E,)< .» р (К>т,) + £д 2 ln ' (w +;;r(1 - *)>s i> • ^

ni (ln(Ui/\i) - 1)j

i=l

Но

д2 д2

^ (ln р «п^Ь» = Щ * (ln<«i/Ai) - 4j = - -

Следовательно, приходим к «неравенству о концентрации меры»:

_ (ni - <Г 2

=i

v l >0,v (ui,m=i G(A) „*> >L ^*((ni>rn=i)«e-L"((«>rn=i)

из которого получаются теоремы 1 и 3. Скорость сходимости к равновесию (mixing time [84]) оценивается в п. б) (с помощью аппарата, описанного в работах [35, 38, 85, 86]), при

довольно общих предположениях, как O (poly (М)). Отсюда получаются соответствующие оценки в теоремах 1 и 3. Причем, как показали результаты численных экспериментов, возникающие там полиномы имеют невысокую степень (O (poly (М)) = O (М)). Открытой задачей является оценка mixing time в общей схеме М. А. Леонтовича. Перспективным в этой связи представляется использование некоторых конструкций работ [87, 88].

Отметим, что ряд моделей разделов 2 и 3 демонстрируют ситуацию, когда число состояний (m = dim п) и число реакций d<J|) растут вместе с ростом числа агентов М. Это

обстоятельство, равно как и зависимость К* (п), не позволяют напрямую использовать ап-

ß

парат, разработанный в [18, 19, 47, 81-83], связанный с анализом системы обыкновенных дифференциальных уравнений, возникающей при каноническом скейлинге (М Л ж так, что 3 limM^^ п (0) /М = с > 0) стохастической марковской динамики. Отметим также, что в приведенных выше рассуждениях нам даже не потребовалось существование при термодинамическом предельном переходе М Л ж, IJI Л ж «ненулевого» («близкого к равномерному») финального распределения [89, 90]. Как следствие концентрация получилась не такая плотная, как в моделях, в которых это условие выполняется (см., например, модель Вильфредо Парето «Кинетика социального неравенства» [23,47, 91]).

Контрпример б) (С. А. Пирогов). Условие (ШБП) является только достаточным условием инвариантности «пуассоновской» меры. Действительно, рассмотрим систему уравнений химических реакций (константы реакций К одинаковы и постоянны):

А + В* Л А* + В-, В + С * Л В* + С] С + А* Л С * + А, причем

ПА (t) + ПА* (t) = пв (t) + пв* (t) = пс (t) + пс* (t) = N. Заметим, что есть и еще один независимый закон сохранения:

па (t) + пв (t) + пс (t) = const.

Можно проверить, что «пуассоновская» мера («~» — знак пропорциональности)

и (п) ~ CnNA • CnNB • CnNc ~ (1^е-1/па!) • ... • {1пс* е-1/по*!)

будет инвариантной, хотя условие (ШБП), очевидным образом, не выполняется.

В связи с этим контрпримером заметим, что понятие равновесия макросистемы «не завязано» на условие (ШБП). Так, в контрпримере С. А. Пирогова равновесие будет существовать:

па (ж) « па* (ж) « пв (ж) « пв* (ж) « по (ж) « по* (ж) « N/2.

Утверждения теорем 2 и 4 не ложатся в рамки теоремы 5. Чтобы лучше понять, каким образом эти теоремы могут быть получены, приведем другой подход.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если в первом подходе мы сначала делали предельный переход по времени (стремится к бесконечности), а потом по числу агентов (стремится к бесконечности), то во втором подходе предлагается осуществить предельные переходы в обратном порядке.

Предположим теперь, что множество J не зависит от М, и в начальный момент времени для любого i существует предел Ci (0) = lim щ (0) /М, К™ (п) := К™ (п/М). Тогда

М^те р ß

(Малышев-Пирогов-Рыбко [81]) в произвольный момент времени t > 0 и для люб ого г существует предел по вероятности (заметим, что Hi (t) — случайные величины, тем не менее

d (t) - уже те случайные величины) Ci (t)=- lim ni (t) /M. Описанный выше приём назы-

М

вается каноническим скейлингом. В результате такого скейлинга приходим к «динамике квазисредних» (терминология В. Вайдлиха [20]):

% = E(a>ß)€J (ßi - *) к* (ё) п, (дк)

Эти же уравнения можно получить и по-другому. А именно, как приближенную динамику средних Ci (t) = Е [т (t) /М]. Приближенную в том смысле, что при выводе (ДК)

используется приближение: F (ci (t)) ~ Е [F (т (t) /М)] для «достаточно хороших» функций F (например, полиномов). Это верно в случае пикообразного распределения щ (t)7

Можно показать [18, 82], что если выполняются условия (ШБП), то траектория (ДК) сходится к неподвижной точке (какой именно, зависит, вообще говоря, от «точки старта»; но можно сказать и точнее: к той единственной неподвижной точке из семейства неподвижных точек, которая принадлежит аффинному многообразию (inv), инвариантному относительно (ДК)).8 Для этого вводится (минус) энтропия: Н = £ici • (ln(cj/£i) — 1) и показывается, что она является функцией Ляпунова для системы (ДК). Обратим внимание, что инвариантная мера (при каноническом скейлинге) «породила» функцию Ляпунова (см. п. б) теоремы 5). Эта не случайно. Подобные закономерности наблюдаются для рассматриваемых моделей и без условия (ШБП), и даже без предположения о том, что инвариантная мера концентрируется около единственного положения равновесия, то есть аттрактором может быть множество куда как более сложной структуры.

Естественно (в виду примера С.А. Пирогова) теперь задаться над вопросом: а что будет, если условия (ШБП) не выполняются, однако система (ДК) имеет на внутренности пересечения неотрицательного ортанта и инвариантного аффинного многообразия (inv) единственную неподвижную точку? Оказывается, имеет место

Теорема 6. Если эта точка экспоненциально глобально устойчива, то 1) все законы сохранения (ДК) определяются (inv)] 2) около положения равновесия инвариантная, мера, будет экспоненциально быстро концентрироваться (с ростом М)\ 3) скорость сходимости к равновесию (mixing time [84]) оценивается как O (poly (М)); 4) элементы корреляционной матрицы случайного вектора п (t) равномерно ограничены по времени; 5) предельные переходы lim и lim перестановочны: lim lim * = lim lim *.

М^те t^-те М^те t^-те t^-те М^те

В основе доказательства теоремы 6 (а также ряда утверждений работ [81, 89, 90]) лежит следующий результат [92]: если последовательность марковских полугрупп слабо сходится к предельной полугруппе, то любая предельная точка из множества инвариантных мер для допредельных полугрупп является инвариантной мерой для предельной полугруппы.

Обратим внимание, что модель «хищник-жертва» в изложении п. 7.3 книги [22] является хорошим примером того, что может быть, если не выполняется условие устойчивости равновесия. В этой модели аттрактором (ДК) является цикл, которому соответствует ин-

lim

М ^те

lim

t^-те

Томлина из раздела 2 с фиксированным числом web-страниц | VДаже в этом случае теорема 6 неприменима к модели Дж. А. Томлина, в которой в результате скейлинга появляются новые линейные законы сохранения. Соответствующая система (ДК) имеет инвариантным целое аффинное многообразие, чтобы определить, что будет происходить на этом многообразии, нужен более аккуратный анализ соответствующей инвариантной меры. Весьма похожая ситуация наблюдается и в BMW-модели равновесного распределения потоков из раздела 3, в случае, когда равновесие Нэша-Вардропа (по потокам на путях) не единственно. При этом здесь все происходящее еще отягощается необходимостью выбора достаточно малого параметра этой динамики Т > 0.

Результаты [17, 19, 20] и ряда других работ наталкивают на гипотезу: аттрактор динамической системы (ДК), который, как мы отмечали выше, может быть сколь угодно сложным множеством (например, в приложениях типичны случаи предельных циклов, нескольких положений равновесия и даже хаотических аттракторов), является таким множеством, в малой окрестности которого на больших временах с большой вероятностью будет пребы-

7Заметим, что этот переход и возможность его использования нуждаются в строгом обосновании (и далеко не всегда правомочны). В качестве примера укажем популярный в литературе [3, 17, 22] марковский процесс «рождения-гибели» (приводящий к системе уравнений «хищник-жертва»), для которого «флуктуации играют решающую роль, качественно меняя выводы макроскопического анализа».

8Стоит заметить, что аттрактор системы (ДК) даже с постоянными коэффициентами реакции, по-видимому, в общем случае может быть сколь угодно сложным множеством [19, 20].

вать рассматриваемая макросистема.

Причем тут возможны разные варианты поведения. Например, в случае двух притягивающих равновесий [20] динамика системы «притянется» к каждому из них с вероятностями, зависящими от точки старта, и далее система может пребывать в малой окрестности равновесия длительное время, до большой флуктуации (вероятность такой флуктуации может быть ничтожна мала на фиксированно конечном временном отрезке), которая сможет перебросить её в другое положение равновесия [93]. Другой тип поведения: постоянно циркулировать (перемешиваться) по аттрактору. Такая картина наблюдается, например, с «кратером вулкана» в модели «хищник-жертва». Возможен, конечно, и симбиоз отмеченных типов поведения.

Для доказательства ряда утверждений этой статьи полезным инструментом является аппарат производящих функций из статьи [94].

Авторы выражают благодарность Сергею Анатольевичу Пирогову, Вадиму Александровичу Малышеву, Александру Николаевичу Рыбко, Борису Теодоровичу Поляку, Евгению Алексеевичу Нурминскому, Аркадию Семеновичу Немировскому, Юрию Евгениевичу Нестерову, Владимиру Ивановичу Швецову, Ивану Станиславовичу Меньшикову, Юрию Соломоновичу Попкову, Владимиру Петровичу Осипову, Андрею Валентиновичу Козлову, Сергею Павловичу Тарасову, Сергею Валерьевичу Шпирко, Юрию Владимировичу Дорну, Тиграну Артуровичу Нагапетяну за ряд ценных замечаний.

Работа выполнена при поддержке грантов РФФИ 10-01-00321-а, 10-07-00620-а, 11-01-00494-а, Лаборатории структурных методов анализа данных в предсказательном моделировании, ФУ ИМ МФТИ, грант правительства РФ дог. 11.G34.31.0073.

Литература

1. Jaynes Е. Т. Probability theory. The logic of science. — Cambridge: Cambridge University Press, 2003; Papers on probability, statistics and statistical physics. Dordrecht: Kluwer Academic Publisher, 1989.

2. Вильсон А. Док.. Энтропийные методы моделирования сложных систем. — М.: Наука,

1978.

3. Николис Г., Пригожим И. Самоорганизация в неравновесных системах. — М.: Мир,

1979.

4. Хакен Г. Информация и самоорганизация. Макроскопический подход к сложным системам. - М.: УРСС, 2005.

5. Шредингер Э. Статистическая термодинамика. — М.: ИЛ, 1948.

6. Крылов Н. С.Работы по обоснованию статистической физики. — М.-Л.: Издательство АН СССР, 1950.

7. Хинчин А. Я. Математические основания статистической механики. — М.-Ижевск: НИЦ «РХД», IIKII. 2003.

8. Кац М. Вероятность и смежные вопросы в физике. — М.: Мир, 1965.

9. Хуанг К. Статистическая механика. — М.: Мир, 1966.

10. Рюэль Д. Статистическая механика. Строгие результаты. — М.: Мир, 1971.

11. Корнфельд И. П., Синай Я. Г., Фомин С. В. Эргодическая теория. — М.: Наука, 1980.

12. Evans L. С. Entropy and partial differential equations. Department of mathematics, UC Berkeley, 2003. http://math.berkelev.edu/~evans/

13. Минлос P. А. Введение в математическую статистическую физику. — М.: МЦНМО, 2002.

14. Козлов В. В. Ансамбли Гиббса и неравновесная статистическая механика. — М.Ижевск: НИЦ «РХД», IIKII. 2008.

15. Марри Док.. Нелинейные дифференциальные уравнения в биологии. — М.: Мир, 1983.

16. Свирежев Ю. М. Нелинейные волны, диссипативные структуры и катастрофы в экологии. — М.: Наука, 1987.

17. Гардинер К. В. Стохастические методы в естественных науках. — М.: Мир, 1986.

18. Веденяпин В. В. Кинетическая уравнения Больцмана и Власова. — М.: Физматлит, 2001.

19. Малышев В. А., Пирогов С. А. Обратимость и необратимость в стохастической химической кинетике // УМН. — 2008. — Т. 63, № 1. — С. 3-36.

20. Вайд лих В. Социодинамика: системный подход к математическому моделированию в социальных науках. — М.: УРСС, 2010.

21. Castellano С., Fortunato S., Loreto V. Statistical phvsics of social behavior // Review of modern phvsics. - 2009. - V. 81. - P. 591-646. arXiv:0710.3256v2

22. Занг В.-Б. Синергетическая экономика: время и перемены в нелинейной экономической теории. — М.: Мир, 1999.

23. Drágulescu A., Yakovenko V. М. Statistical mechanics of monev // The European Phvsical Journal. B. - 2000. - V. 17. - P. 723-729. arXiv:cond-mat/0001432v4

24. Baldi Р., Frasconi Р., Smyth P. Modeling the Internet and the Web: Probabilistic methods and algorithms. — Published bv John Wiley k, Sons, 2003.

25. Розоноэр Л. И. Обмен и распределение ресурсов (обобщенный термодинамический подход) I, II, III // Автоматика и телемеханика. — 1973, — № 5, № 6, № 8.

26. Горбань А. Н. Обход равновесия. — Новосибирск: Наука, 1984.

27. Опойцев В. П. Нелинейная системостатика. — М.: Наука, 1986.

28. Малишевский А. В. Качественные модели в теории сложных систем. — М.: Наука, 1998.

29. Сергеев В. М. Пределы рациональности. — М.: Фазис, 1999.

30. Попков Ю. С. Теория макросистем: равновесные модели. — М.: УРСС, 1999.

31. Цирлин А. М. Методы оптимизации в необратимой термодинамике и микроэкономике. — М.: Физматлит, 2003.

32. Швецов В. И. Математическое моделирование транспортных потоков // Автоматика и телемеханика. — 2003. — № 11. — С. 3-46.

33. Маслов В. П. Квантовая экономика. — М.: Наука, 2006.

34. Олемской А. П. Синергетика сложных систем: Феноменология и статистическая теория. _ м.: КРАСАНД, 2009.

35. Веретенников А. Ю. Параметрическое и непараметрическое оценивание для цепей Маркова. — М.: Изд-во ЦПИ при механико-математическом факультете МГУ, 2000.

36. Боровков А. А. Эргодичность и устойчивость случайных процессов. — М.: УРСС, 1999.

37. Булинский А. В., Ширяев А. Н. Теория случайных процессов. — М.: Физматлит; Лаборатория базовых знаний, 2003.

38. Кельберт М. Я., Сухов Ю. М. Вероятность и статистика в примерах и задачах. — Т. 2. - М.: МЦНМО, 2010.

39. Вишневский В. М. Теоретические основы проектирования компьютерных сетей. — М.: Техносфера, 2003.

40. Ивницкий В. А. Теория сетей массового обслуживания. — М.: Физматлит, 2004.

41. The maximum entropy formalism, ed. by R. D. Levin, M. Tribus // Conf. Mass. Inst. Tech., Cambridge, 1978. MIT Press, 1979.

42. International workshops on Bavesian inference and maximum entropy methods in science and engineering. AIP Conf. Proceedings (holds every year from 1980).

43. Карт J. N. Maximum — entropy models in science and engineering. — John Wiley k. Sons, Inc., 1989.

44. Golan A., Judge G., Miller D. Maximum entropy econometrics: Robust estimation with limited data. Chichester, Wiley, 1996.

45. Fang S.-C., Rajasekera J. R., Tsao H.-S. J. Entropy optimization and mathematical programming. — Kluwer's International Series, 1997.

46. Маслов В. П., Черный А. С. О минимизации и максимизации энтропии в различных дисциплинах // ТВП. - 2003. - Т. 48, № 3. - С. 466-486.

47. Гасников А. В., Кленов С. Л., Нурминский Е. А., Холодов Я. А., Шамрай Н. Б. Введение в математическое моделирование транспортных потоков / под ред. А.В. Гасникова с приложениями М.Л. Бланка, Е.В. Гасниковой, А.А. Замятина и В.А. Малышева, А.В. Колесникова, Ю.Е. Нестерова и С.В. Шпирко, A.M. Райгородского. - М.: МЦНМО, 2012. http://zoneos.com/traffic/

48. Гасников А. В., Гасникова Е. В. О возможной динамике в модели расчета матрицы корреспонденций (А. Дж. Вильсона) // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков, под ред. акад. В.В. Козлова). - 2010. - Т. 2. № 4(8). - С. 45-54.

49. Brin S., Page L. The anatomy of a large-scale hvpertextual web search engine // Comput. Network ISDN Svst. - 199K. V. 30(1-7). - P. 107-117.

50. Langville A. N., Meyer C. D. Google's Page Rank and Beyond: The Science of Search Engine Rankings. — Princeton University Press, 2006.

51. Назин А. В., Поляк Б. Т. Рандомизированный алгоритм нахождения собственного вектора стохастической матрицы с применением к задаче PageRank // Автоматика и телемеханика. — 2011. № 2, — С. 131-141.

52. Nesterov Y. Е. Subgradient methods for huge-scale optimization problems // CORE Discussion Paper 2012/2, 2012. http://www.uclouvain.be/32349.html

53. Tomlin J. A. A new paradigm for ranking pages on the World WTide Web / / Proceedings of the \Y\Y\Y2l)l)3. CitvplaceBudapest, countrv-regionHungarv, pages ACM 1-58113-680-3/03/0005, May 20-24, 2003. http: / / www2003.org/cdrom/papers/refereed / p042/ paper42_html/p42-tomlin.htm;

http: / / www.stanford.edu / group / SOL / software/pdco.html

54. Шананин А. А. Математические модели в экономике // Годовой курс лекций для студентов ФУПМ МФТИ, ВМиК МГУ и РУДН http://dame.mipt.ru/video/matmodeli/

55. Гасникова Е. В. Двойственные мультипликативные алгоритмы для задач энтропийно-линейного программирования // ЖВМ и МФ. — 2009. — Т. 49, № 3. — С. 453-464.

56. Кнут, Д., Яо Э. Сложность моделирования неравномерных распределений // Кибернетический сборник. Новая серия. Вып. 19. — М.: Мир, 1983. — С. 97-158.

57. Ермольев Ю. М. Методы стохастического программирования. — М.: Наука, 1976.

58. http://www2.isve.gatech.edu/~nemirovs/

59. http://www.core.ucl.ac.be/~nesterov/

60. Гасникова Е. В. Исследование задач энтропийного программирования: диссертация на соискание звания магистра по специальности 05.13.18. ФУИМ МФТИ, ИСА РАН, 16 июня 2009.

61. Stouffer S. A. Intervening opportunities: a theory relating mobility and distance // Amer. Sociolog. Rev. - 1940. - V. 5. - P. 845-867.

62. Fotheringham A. S. A new set of special-interaction models: the theory of competing destinations // Envir. & Plan. A. - 1983. - V. 15. - P. 15-36.

63. Fotheringham A. S. Modelling hierarchical destination choice // Envir. k, Plan. A. — 1986. _ у. 18. _ p. 401-418.

64. Gongalves M. В., Ulyssea-Neto I. Equilibrium values and dynamics of attractiveness terms in production-constrained spatial-interaction models // Envir. k, Plan. — A. 1993. — V. 25.

- P. 817-826.

65. Стенбринк П. А. Оптимизация транспортных сетей. — М.: Транспорт, 1981.

66. Patriksson М. The traffic assignment problem. Models and methods. — Utrecht, Netherlands: VSP, 1994.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

67. Sheffi Y. Urban transportation networks: Equilibrium analysis with mathematical programming methods. — N.J.: Prentice-Hall Inc., Englewood Cliffs, 1985.

68. Bar-Gera H. Origin-based algorithms for transportation network modeling // Report. Univ. of Illinois at Chicago, 1999.

69. Швецов В. И. Проблемы моделирования передвижений в транспортных сетях // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков, под ред. акад. В.В. Козлова). — 2010. — Т. 2. № 4(8). — С. 169-179.

70. Foster D., Young P. Stochastic evolutionary game dynamics // Theoretical population biology. - 1990. - V. 38, N 2.

71. Cressman R. Evolutionary game theory and extensive form games. — Cambridge, Mass.: MIT Press, 2003.

72. Hofbauer J., Sigmund K. Evolutionary game dynamics // Bulletin of the AMS. — 2003. — V. 40, N 4. - P. 479-519.

73. McKelvey R. D., Palfrey T. R. Quantal response equilibria for extensive form games // Experimental economics. — 1998. — V. 1. — P. 9-41.

74. Fogel D. B. Evolutionary Computation: Towards a New Philosophy of Machine Intelligence.

- New York: IEEE Press, 2000.

75. Хачияп Л.P. Избранные труды / сост. С. П. Тарасов. — М.: МЦНМО, 2009. — С. 38-48.

76. Сото С., Salva К., Acemoglu D., Dahleh М.А., Frazzoli Е. Stability analysis of transportation networks with multiscale driver decisions // e-print arXiv:1101.2220vl, 2011.

77. Gasnikova E. V., Nagapetyan T. A. About new dynamical interpretations of entropic model of correspondence matrix calculation and Nash-Wardrop's equilibrium in Beckmann's traffic flow distribution model // Ninth International Conference on Traffic and Granular Flow, 28 September - 1 October 2011. - Moscow: Springer, 2012. arXiv:1112.1628v3

78. Juditsky A., ban G., Nemirovski A., Shapiro A. Stochastic approximation approach to stochastic programming // SIAM Journal on Optimization. — 2009. — V. 19, N 4. — P. 1574-1609.

79. Nesterov Y., de Palma A. Static equilibrium in congested transportation networks // Networks Spatial Econ. - 2003. - N 3(3). - P. 371-395.

80. Разжевайкин В. H. Эволюционная оптимальность и построение функционалов отбора в моделях структурированных биосистем // Труды VI Всероссийской научной конференции «Математическое моделирование развивающейся экономики и экологии»

(ЭКОМОД-2011), Киров, 27 июня - 3 июля 2011. — Киров: Изд-во ВятГУ, 2011. — С. 309-316.

81. Malyshev V. A., Pirogov S. A., Rubco А. N. Random walks and chemical networks // Mosc. Math. J. - 2004. - V. 4, N 2. - P. 441-453.

82. Батищева Я. Г., Веденяпин В. В. II закон термодинамики для химической кинетики // Мат. мод. - 2005. - Т. 17, № 8. - С. 106-110.

83. Веденяпин В. В., Орлов Ю. Н. О законах сохранения для полиномиальных гамильтонианов и для дискретных моделей уравнения Больцмана // ТМФ. — 1999. — Т. 121, № 2. - С. 307-315.

84. Montenegro R., Tetali P. Mathematical aspects of mixing times in Markov chains. 2006. http://people.math.gatech.edu/~tetali/PUBLIS/survey.pdf

85. Diaconis P. The Markov chain Monte Carlo revolution // Bulletin (New Series) of the AMS. - 2009. - V. 49, N 2. - P. 179-205.

86. Joulin A., Ollivier Y. Curvature, concentration and error estimates for Markov chain Monte Carlo // Ann. Prob. - 2010. - V. 38, X 6. P. 2418-2442.

http: / / www.vann-ollivier.org/rech / pubis / survevcurvmarkov.pdf

87. Sinclair A., Jerrum M. Approximate counting, uniform generation and rapidly mixing Markov chains // Information and Computation. — 1989. — V. 82, N 1. — P. 93-133.

88. Dyer M., Frieze A., Kannan R. A random polynomial-time algorithm for approximating of the volume of convex bodies // Journal of ACM. — 1991. — V. 38, N 1. — P. 1-17.

89. Rybko A., Shlosman S. Poisson hypothesis for information networks I, II // e-prints http://arxiv.org/abs/math/0406110vl; http://arxiv.org/abs/math-ph/0410053vl, 2004.

90. Рыбко A. H. Пуассоновская гипотеза для больших симметричных коммуникационных сетей // Глобус. Общематематический семинар / под ред. М. А. Цфасмана и В. В. Прасолова. № 4. - М.: МЦНМО, 2009. - С. 105-126.

91. Богданов К. Ю. Прогулки с физикой. Библиотечка «Квант» В. 98. — М.: Бюро Квантум, 2006. Глава 18.

92. Лигетт Т. Марковские процессы с локальным взаимодействием. — М.: Мир, 1989.

93. Вентцель А. Д., Фрейдлин М. И. Флуктуации в динамических системах под действием малых случайных возмущений. — М.: Наука, 1979.

94. Калинкин А. В. Марковские ветвящиеся процессы с взаимодействием // УМН. — 2002. - Т. 57:2(344). - С. 23-84.

Поступила в редакцию 14-03.2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.