Научная статья на тему 'ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ ДЛЯ ОЦЕНКИ МАТРИЦЫ ТРАНСПОРТНЫХ КОРРЕСПОНДЕНЦИЙ'

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ ДЛЯ ОЦЕНКИ МАТРИЦЫ ТРАНСПОРТНЫХ КОРРЕСПОНДЕНЦИЙ Текст научной статьи по специальности «Математика»

CC BY
46
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТРАНСПОРТНАЯ СЕТЬ / МАТРИЦА КОРРЕСПОНДЕНЦИИ / МАРКОВСКИЕ ЦЕПИ / ОЦЕНКА МАТРИЦ ПЕРЕХОДНЫХ ВЕРОЯТНОСТЕЙ ПО АГРЕГИРОВАННЫМ ДАННЫМ

Аннотация научной статьи по математике, автор научной работы — Хабаров Валерий Иванович, Теселкин Александр Александрович, Косолапов Кирилл Павлович

Задача планирования наблюдений для оценки транспортных корреспонденций рассматривается как задача распределения ресурса на узлах транспортной сети. Транспортная сеть представляется как граф, вершины которого ассоциированы с узлами транспортной сети, а дуги - с возможными путями сообщений. Задача распределения ресурса для наблюдения решается с применением методов оптимального планирования эксперимента. Используются минимаксные D-оптимальные планы. Модель наблюдения предполагает фиксацию количества переходов транспортных средств из одной вершины транспортного графа в другую. Данная модель описывается цепью Маркова с дискретным временем. Матрица переходных вероятностей цепи оценивается на основе наблюдений за цепью в дискретные моменты времени. Для оценки переходных вероятностей используется метод максимального правдоподобия в предположении, что марковская цепь стационарна. Строится информационная матрица Фишера для предлагаемой модели наблюдений. Решение задачи планирования приводится в общем аналитическом виде. Предлагается интерпретация для задачи подсчета интенсивности транспорта и некоторые рекомендации для использования результатов в практических целях.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESIGN OF EXPERIMENTS FOR TRANSPORT CORRESPONDENCE MATRIX ESTIMATION

The problem of study planning for transport correspondence estimation is considered as a problem of resource distribution at the nodes of the transport network. The transport network is considered as a graph whose vertices are associated with the nodes of the transport network, and edges are associated with possible routes. The resource distribution problem is solved using optimal experimental design methods. Minimax D-optimal designs are used. Recording the number of vehicle transitions from one vertex of the transport graph to another is taken as an observation model. This model is described by the Markov discrete time chain. The transition matrix is estimated using observations of the chain at discrete time points. The maximum likelihood method is used for the estimation of transition probabilities assuming that the Markov chain is steady. The Fisher information matrix for the proposed model is constructed. The solution of the experimental design problem is given in general analytical form. The interpretation for calculating the traffic intensity is proposed and some recommendations for practical applications of the results are given.

Текст научной работы на тему «ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ ДЛЯ ОЦЕНКИ МАТРИЦЫ ТРАНСПОРТНЫХ КОРРЕСПОНДЕНЦИЙ»

_ДОКЛАДЫ АН ВШ РФ_

2015_июль-сентябрь_3(28)

ТЕХНИЧЕСКИЕ НАУКИ

УДК 519.242.5

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ ДЛЯ ОЦЕНКИ МАТРИЦЫ ТРАНСПОРТНЫХ КОРРЕСПОНДЕНЦИЙ

В.И. Хабаров1, А.А. Теселкин2, К.П. Косолапов1

1 Сибирский государственный университет путей сообщения 2Новосибирский государственный технический университет

Задача планирования наблюдений для оценки транспортных корреспонденций рассматривается как задача распределения ресурса на узлах транспортной сети. Транспортная сеть представляется как граф, вершины которого ассоциированы с узлами транспортной сети, а дуги - с возможными путями сообщений. Задача распределения ресурса для наблюдения решается с применением методов оптимального планирования эксперимента. Используются минимаксные Б-оптимальные планы. Модель наблюдения предполагает фиксацию количества переходов транспортных средств из одной вершины транспортного графа в другую. Данная модель описывается цепью Маркова с дискретным временем. Матрица переходных вероятностей цепи оценивается на основе наблюдений за цепью в дискретные моменты времени. Для оценки переходных вероятностей используется метод максимального правдоподобия в предположении, что марковская цепь стационарна. Строится информационная матрица Фишера для предлагаемой модели наблюдений. Решение задачи планирования приводится в общем аналитическом виде. Предлагается интерпретация для задачи подсчета интенсивности транспорта и некоторые рекомендации для использования результатов в практических целях.

Ключевые слова: транспортная сеть, матрица корреспонденции, марковские цепи, задача планирования эксперимента, оценка матриц переходных вероятностей по агрегированным данным.

Б01: 10.17212/1727-2769-2015-3-109-116

Введение

Матрица корреспонденции является фундаментальной характеристикой транспортной сети, поскольку она определяет общий объем транспортного потока. Поэтому задача оценки матрицы корреспонденции является важнейшей задачей для исследования транспортной сети и транспортных потоков [1]. Один из методов оценки матрицы корреспонденций заключается в восстановлении матрицы корреспонденции на основе наблюдений за транспортным потоком [2]. В качестве наблюдений можно рассматривать интенсивности транспортных потоков на участках сети. Для качественной реализации методов оценки необходимо, чтобы наблюдения были максимально информативны. Возникает задача оптимального планирования наблюдений.

Таким образом, в работе рассматривается задача планирования наблюдений за транспортными потоками для оценки транспортных корреспонденций.

1. Марковская модель транспортных корреспонденций

Имеется граф транспортной сети, или транспортный граф О(V, Е), состоящий из т узлов. Данный граф описывается стационарной неприводимой апериодической марковской цепью с дискретным временем и с матрицей переходных вероятностей Р = {р„ }, (/,] = 1,...,т), причем каждое состояние цепи ассоциировано

© 2015 В.И. Хабаров, А.А. Теселкин, К.П. Косолапов

с некоторой вершиной графа О. Рассматривается задача подсчета трафика для автотранспорта на транспортной сети О.

С точки зрения теории марковских цепей рассматривается задача оценивания переходных вероятностей на основе наблюдений за цепью в моменты времени / = {0,1,..., Т} на основе статистики

т

n,

= X n,, (t).

1J '

t=0

где nj (t) - количество переходов цепи из состояния i в состояние J в момент времени t. Пусть

m

n, = X n,j

J=1

- общее число переходов цепи за время T в состоянии i,

m

N = Xn, i=1

- общее число переходов за время T.

Далее будет полезна следующая интерпретация для данной модели наблюдения. Рассматриваются некоторые микрообъекты, переходящие из одного состояния в другое в моменты времени t = {0,1,...,T} . Имеются наблюдатели, которые ассоциированы с состояниями цепи. Каждый наблюдатель в состоянии с номером i в некоторый момент времени t фиксирует n, (t) - количество переходов из состояния с номером i в момент t в состояние с номером J в момент t + 1. Для задачи подсчета трафика наблюдатель, находящийся в узле i, в некоторые дискретные моменты времени t = {0,1,...,T} фиксирует перераспределение автотранспорта.

Здесь уместно отметить специфику транспортных сетей и задач, связанных с оценкой матриц переходных вероятностей для этих сетей. Транспортный граф с известной структурой дает априорную информацию о том, какие переходы в каком состоянии разрешены. Для учета этой информации далее будет использоваться понятие «емкость состояния». Под емкостью состояния si,i = 1,...,m , будем

понимать количество выходящих дуг mi из вершины графа сети с номером i. Очевидно, что

mi

X Pij =1 , Pij > 0 i =1m. (1)

J=1

Это избавит в дальнейшем от необходимости оговаривать условия использования выражений типа pij-1 или log p, .

В качестве метода оценивания матрицы P = {p-}, (i,J = 1,.,m) рассмотрим

метод максимального правдоподобия. Функция правдоподобия в этом случае есть [3-6]

mi-1

/ , \ni - X nij

I mi -1 \ i iJ

1 -X Pij 1 . (2)

m mi

L(n, p)=nn J =№ p;22... pmrn-n

i=1J =1 i=1 i

J=1

/

Логарифмическая функция правдоподобия, соответственно, будет иметь вид

Шг -1

L{n, Р) = ХХ пг] 1о§ Ри +

г=1 и=1

п - X пи

г -1 ^ г 1ои

]=1

г -1 ^

1 -X Ри

. и=1

(3)

Оценка максимального правдоподобия (ОМП) является решением уравнения

■ЧГ'Ш,-1

д Пи п -Е ,=1 пг}

-1оя L( п, Р) = --

дРги Рги 1 -X Ш= -1Рг

= 0, г = 1,...,ш;и = 1,...,шг -1,

-и=1'Ч

при условии (1). Решением (4) относительно р„ являются оценки вида

(4)

* "'г]

Ри = , г = 1,., ш; ] = 1,., шг. пг

(5)

Такая оценка состоятельна и асимптотически нормальна [3-6]. 2. Планирование наблюдений

Задачу планирования экспериментов для модели наблюдений, рассмотренной выше, можно интерпретировать следующим образом. Наблюдатели фиксируют переходы микрообъектов, находясь в состояниях {з!,...,} в моменты времени

/ = {0,1,...,T}. На весь эксперимент отведен ресурс в N наблюдений. Каждый

наблюдатель получает часть этого ресурса {пг, г = 1,..,ш} таким образом, что

Ш

Хп = N . Требуется найти распределение п = {пг,г = 1,..,ш} , максимизирующее

г=1

некоторый функционал от информационной матрицы Фишера

I (Р, п) = -Е

дР2

(6)

Известно [7], что Б-оптимальный план минимизирует обобщенную дисперсию оценок параметров, полученных на основе уравнения (4). Следует, однако, ожидать (смотри далее), что информационная матрица Фишера будет зависеть от истинных значений параметров Р. Для исключения этой зависимости далее будем рассматривать минимаксные Б-оптимальные планы, для которых

п = А^ тах тт 1og det I (Р, п).

п Р

(7)

Рассмотрим структуру информационной матрицы Фишера более детально [9]. Для этого сначала необходимо найти элементы матрицы вторых производных:

д L(n, Р)

дРгк дРг1

пгк - пт, к=I ргк рШ

к Ф I,

г = 1,...,ш; к,I = 1,...,шг.

(8)

Ш

Далее согласно (6)

где с учетом (8)

I (P, n) = E

п,1 , nm

A O

O

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Am

(9)

A =

2 + " 2

p,1 p,m_

(10)

nimi-1 nimi

~ + 2

p i p

rimi-1 rimi

для всех г = 1,...,т . Выше предполагалось, что

т-1

Ргтг = 1 - X Рг) , )=1

тг-1

пгт = Пг - X П). )=1

Для мультиномиального распределения известно (см. [8]), что Е[пц ] = щру V/ = 1,..., т; ) = 1,..., тг, отсюда следует, что

" 1 + _1_ -

рг1 ргтг ргт

1 -

E[ A ] = п,

1 1

-+-

pimi-1 pit

(11)

1

p,1 0

0

1

pimi -1

pimi pimi

Vi = 1,..., m.

Далее необходимо найти выражение для logdet I(P, n). Учитывая блочно-ди-агональную структуру матрицы (9), имеем:

m m

logdet I (P, n) = log П det E [a, ] = X logdet E [a, ]. (12)

i=1 i=1

Воспользуемся результатом [10] для вычисления определителя матрицы, которая представима в форме (11), известной как диагональное разложение. Тогда

det E[ A, ] = n"1

m,-1

' m,-1

U 1

n-1m, -1

К 1 1

П — +ЕП

y=1 Pij k=1 j*k pim Pij

m -1 D = n, B, ,

где

m,-1

1

-1mi-1

B, = П —+ Z П

1 1

)=1 рг) к=1)Фк рт рг) Последнее выражение дает основание утверждать, что

(13)

logdet I (P, n) = (ш, -1) X log nt +X log в, .

i=1 i=1

Возвращаясь к экстремальной задаче (7), найдем

minlogdet I (P, n) = min

P P

f m m \

(m,- 1)Zlogn, +ZlogBi i=1 i=1

(14)

(15)

Учитывая выпуклость логарифмической функции, а также независимость первого слагаемого в (14) от матрицы Р, можно утверждать, что решением экстремальной задачи (15) будут стохастические матрицы Р размерности т, с равными элементами в строках.

Таким образом, экстремальную задачу (7) можно свести к более простой экстремальной задаче вида

n = Arg max (m, - 1)Z log nt.

Zn = N, n, >0 ,=1 ,=1

Используя функцию Лагранжа

m f m \

L (n, X) = (m, - 1)Z logn, + X N - Zn ,=1 I ,=1 у

(16)

найдем решение (16), решая систему уравнений

I

--Х = 0 V/ = 1,...,т,

dL _ (m, -1)

dn,

ЙГ m

^ = Zn - N = 0.

(17)

SX

,=1

Решением (17) является

* N (m, -1) V , 1 n, =-;-V, = 1, ..., m.

Zm1(m -1)

(18)

Таким образом, план эксперимента (распределение ресурса) можно интерпретировать следующим образом: общий объем наблюдений N перераспределяется между наблюдателями марковской цепи пропорционально тг -1 (г = 1,...,т), где тг - количество возможных переходов в состоянии .

Интерпретация для транспортной задачи может быть следующей: если дана транспортная сеть с некоторым количеством узлов не меньше, чем m, то следует ограничиться m узлами и N возможных наблюдений за микрообъектами перераспределить согласно (18).

Заключение

В данной работе рассмотрена проблема организации мониторинга транспортных потоков с целью оценки транспортных корреспонденций, которая сводится к задаче распределения ресурса по узлам марковской цепи с дискретным временем. Такая задача была интерпретирована как задача оптимального планирования наблюдений за марковской цепью. В работе поставлена задача планирования экспериментов с использованием минимаксных D-оптимальных планов (7). Получена информационная матрица Фишера (9). Решение задачи планирования получено в аналитическом виде.

Результаты, полученные в данной статье, могут быть использованы в практических целях для оценки матриц корреспонденции, для калибровки транспортных моделей и для проведения системного мониторинга интенсивностей транспорта, что увеличит информативность собираемой информации о транспортных потоках.

ЛИТЕРАТУРА

1. Введение в математическое моделирование транспортных потоков: учебное пособие / А.В. Гасников, С.Л. Кленов, Е.А. Нурминский, Я.А. Холодов, Н.Б. Шамрай, М.Л. Бланк, Е.В. Гасникова, А.А. Замятин, В.А. Малышев, А.В. Колесников, А.М. Райгородский; под ред. А.В. Гасникова. - М.: МФТИ, 2010. - 360 с.

2. Хабаров В.И., Молодцов Д.О., Хомяков С.В. Марковская модель транспортных кор-респонденций // Доклады ТУСУР. - 2012. - № 1, ч. 1. - С. 113-117.

3. Ли Ц.-Ч., Джадж Д.Г., Зельнер А. Оценивание параметров марковских моделей по агрегированным временным рядам. - М.: Статистика, 1977. - 221 с.

4. Kendall M.G., Stuart A. The advance theory of statistics. Vol. 2. Inference and Relationship. - London: Carles Griffin and Company Limited, 1961. - 758 p.

5. Hoel P.G. A test for Markoff chains // Biometrika. - 1954. - Vol. 41, iss. 3-4. - P. 430-433. -doi: 10.1093/biomet/41.3-4.430.

6. Кельберт М.Я., Сухов Ю.М. Вероятность и статистика в примерах и задачах. Т. 2. Марковские цепи как отправная точка теории случайных процессов и их приложения. -М.: МЦНМО, 2010. - 560 с.

7. Федоров В.В. Теория оптимального планирования эксперимента. - М.: Наука, 1971. -312 с.

8. Хабаров В.И. Марковская модель процесса последовательного планирования экспериментов // Машинные методы планирования эксперимента и оптимизации многофакторных систем: межвузовский сборник научных трудов. - Новосибирск: Изд-во НЭТИ, 1987. - С. 62-65.

9. Справочник по прикладной статистике. В 2 т. Т. 1: пер. с англ. / под ред. Э. Ллойда, У. Ледермана; пер. с англ. под ред. Ю.Н. Тюрина. - М.: Финансы и статистика, 1989. -510 с.

10. Сирл С., Госман У. Матричная алгебра в экономике / пер. с англ. и науч. ред. Е.М. Четыркина и Р.М. Энтова. - М.: Статистика, 1974. - 368 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

DESIGN OF EXPERIMENTS FOR TRANSPORT CORRESPONDENCE MATRIX ESTIMATION

Khabarov V.I.1 , Tesselkin A.A.2, Kosolapov K.P.1

1 Siberian Transport University, Novosibirsk, Russian Federation 2Novosibirsk State Technical University, Novosibirsk, Russian Federation

The problem of study planning for transport correspondence estimation is considered as a problem of resource distribution at the nodes of the transport network. The transport network is considered as a graph whose vertices are associated with the nodes of the transport network, and edges are associated with possible routes. The resource distribution problem is solved using optimal experimental design methods. Minimax D-optimal designs are used. Recording the number of vehicle transitions from one vertex of the transport graph to another is taken as an observation model. This model is described by the Markov discrete time chain. The transition matrix is estimated using observations of the chain at discrete time points. The maximum likelihood method is used for the estimation of transition probabilities assuming that the Markov chain is steady. The Fisher information matrix for the proposed model is constructed. The solution of the experimental design problem is given in general analytical form. The interpretation for calculating the traffic intensity is proposed and some recommendations for practical applications of the results are given.

Keywords: transport network, correspondence matrix, Markov chains, design of experiments, estimation of correspondence under aggregated data.

DOI: 10.17212/1727-2769-2015-3-109-116

REFERENCES

1. Gasnikov A.V., Klenov S.L., Nurminskii E.A., Kholodov Ya.A., Shamrai N.B, Blank M.L., Gasnikova E.V., Zamyatin A.A., Malyshev V.A., Kolesnikov A.V., Raigorodskii A.M. Vvedenie v matematicheskoe modelirovanie transportnykh potokov [Introduction to the mathematical modelling of traffic flows]. Moscow, MFTI Publ., 2010. 360 p.

2. Khabarov V.I., Molodtsov D.O. Khomyakov S.V. Markovskaya model' transportnykh korre-spondentsii [Model Markov chains for transport correspondence]. Doklady TUSUR - Proceedings of TUSUR, 2012, no. 1, pp. 113-117.

3. Lee T.C., Judge G.G., Zellner A. Estimating the parameters of the Markov probability model from aggregate time series data. Amsterdam, London, Publishing Company, 1970. 254 p. (Russ. ed.: Li Ts.-Ch., Dzhadzh D.G., Zel'ner A. Otsenivanieparametrov markovskikh modelei po agregirovannym vremennym ryadam. Translated from English A.D. Kasavin, V.A. Lototskii, A.S. Mandel'. Moscow, Statistika Publ., 1977. 221 p.).

4. Kendall M.G., Stuart A. The advance theory of statistics. Vol. 2. Inference and Relationship. London, Carles Griffin and Company Limited, 1961. 758 p.

5. Hoel P.G. A test for Markoff chains. Biometrika, 1954, Vol. 41, iss. 3-4, pp. 430-433. doi: 10.1093/biomet/41.3-4.430

6. Kel'bert M.Ya., Sukhov Yu.M. Veroyatnost' i statistika v primerakh i zadachakh. T. 2. Mar-kovskie tsepi kak otpravnaya tochka teorii sluchainykh protsessov i ikh prilozheniya [Probability and Statistics in the examples and problems. Vol. 2. Markov chain as the starting point of the theory of stochastic processes and their applications]. Moscow, MTsNMO Publ., 2010. 560 p.

7. Fedorov V.V. Teoriya optimal'nogoplanirovaniya eksperimenta [The theory of optimal design of experiments]. Moscow, Nauka Publ., 1971. 312 p.

8. Khabarov V.I. Markovskaya model' protsessa posledovatel'nogo planirovaniya ekspe-rimentov [Markov model of sequential design of experiments]. Mashinnye metody planirovaniya eksperimenta i optimizatsii mnogofaktornykh system: mezhvuzovskii sbornik nauchnykh trudov [Machine methods of the expermental design and the multifactor system optimization: interu-niversity collection of scientific papers], 1987, pp. 62-65.

9. Ledermann W., ghief ed. Handbook of applicable mathematics. Vol. 6, pt. A. Statistics. Ed. by E. Lloyd. Chichester, John Wiley & Sons, 1984. 580 p. (Russ. ed.: Lloid E., Lederman U., eds. Spravochnikpo prikladnoi statistike. V 2 t. T. 1. Translated from English, ed. by Yu.N. Tyu-rin. Moscow, Finansy i statistika Publ., 1989. 510 p.).

10. Searle S.R., Hausman W.H. Matrix algebra for business and economics. New York, Wiley, 1970. 362 p. (Russ. ed.: Sirl S., Gosman U. Matrichnaya algebra v ekonomike. Translated from English and sci. eds. E.M. Chetyrkin, R.M. Entov. Moscow, Statistika Publ., 1974. 368 p.).

СВЕДЕНИЯ ОБ АВТОРАХ

Хабаров Валерий Иванович - родился в 1951 году, д-р техн. наук, профессор, член-корреспондент Академии Высшей школы, заведующий кафедрой «Информационные технологии транспорта» Сибирского государственного университета путей сообщения. Область научных интересов: искусственный интеллект, математическое моделирование транспортных потоков, планирование эксперимента. Опубликовано около 120 научных работ. (Адрес: 630049, Россия, Новосибирск, ул. Дуси Ковальчук, 191. Email: [email protected]).

Khabarov Valeriy Ivanovich (b. 1951) - Doctor of Sciences (Eng.), professor, corresponding member of the Russian Higher School Academy of Sciences, Head of IT in Transport Department of Siberian Transport University. His research interests are currently focused on artificial intelligence, mathematical modelling of traffic flows, design of experiments. He is author of about 120 scientific papers. (Address: 191 D. Kovalchuk St., Novosibirsk, 630049, Russian Federation. Email: [email protected]).

Теселкин Александр Александрович - родился в 1992 году, аспирант Новосибирского государственного технического университета. Область научных интересов: математическое моделирование транспортных потоков. Опубликовано 8 научных работ. (Адрес: 630073, Россия, Новосибирск, пр. Карла Маркса, 20. Email: [email protected]).

Tesselkin Alexandr Alexandrovich (b. 1992) - postgraduate of Novosibirsk State Technical University. His research interests are currently focused on mathematical modelling of traffic flows. He is author of 8 scientific papers. (Address: 20, Karl Marks Av., Novosibirsk, 630073, Russia. Email: [email protected]).

Косолапов Кирилл Павлович - родился в 1991 году, аспирант Сибирского государственного университета путей сообщения. Область научных интересов: математическое моделирование транспортных потоков. Опубликованы 4 научные работы. (Адрес: 630049, Россия, Новосибирск, ул. Дуси Ковальчук, 191. Email: [email protected]).

Kosolapov Kirill Pavlovich (b. 1991) - postgraduate of Siberian Transport University. His research interests are currently focused on mathematical modelling of traffic flows. He is author of 4 scientific papers. (Address: 191 D. Kovalchuk, Novosibirsk, 630049, Russia. Email: [email protected]).

Статья поступила 05 августа 2015 г.

Received August 05, 2015

To Reference:

Khabarov V.I., Tesselkin A.A., Kosolapov K.P. Planirovanie eksperimentov dlya otsenki matritsy transportnykh korrespondentsii [Design of experiments for transport correspondence matrix estimation]. Doklady Akademii nauk vysshei shkoly Rossiiskoi Federatsii - Proceedings of the Russian higher school Academy of sciences, 2015, no. 3 (28), pp. 109-116. doi: 10.17212/1727-27692015-3-109-116

i Надоели баннеры? Вы всегда можете отключить рекламу.