Научная статья на тему 'Прогнозирование транспортной загруженности дорог'

Прогнозирование транспортной загруженности дорог Текст научной статьи по специальности «Физика»

CC BY
774
123
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ

Аннотация научной статьи по физике, автор научной работы — Вялых К. М., Павлов Ю. Н., Степанова М. Б.

В работе описаны три модели прогнозирования, способы оценки качества прогноза и методология выбора модели для конкретной ситуации.Точность предсказания оценивается с помощью сравнения моделей между собой. Для всех описанных моделей точность предсказания получилась выше, чем прогнозирование экстраполяцией средней скорости.В дальнейшем планируется провести тестирование на большем интервале времени и ввести в рассмотрение новые модели и факторы, влияющие на дорожную обстановку.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по физике , автор научной работы — Вялых К. М., Павлов Ю. Н., Степанова М. Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Прогнозирование транспортной загруженности дорог»

НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н.Э. БАУМАНА

НАУКА и ОБРАЗОВАНИЕ

Эл № ФС 77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408

электронный научно-технический журнал

Прогнозирование транспортной загруженности дорог

# 07, июль 2012

DOI: 10.7463/0712.0418480

Вялых К. М., Павлов Ю. Н., Степанова М. Б.

УДК. 004.021

Россия, МГТУ им. Н.Э. Баумана [email protected] [email protected] [email protected]

Введение

Загруженность автомобильных дорог стала в настоящее время глобальной проблемой. Особенно остро она ощущается в мегаполисах.

Данная статья посвящена разработке системы прогнозирования дорожной обстановки, которая будет предоставлять информацию о характерной загруженности дорог, наиболее вероятной дорожной ситуации в текущий момент времени, а также строить прогноз изменения дорожной ситуации.

В разрабатываемой системе прогнозирования в качестве источника первичной информации используются данные о передвижении автомобилей, полученные от портативных спутниковых навигаторов. Информация включает данные о маршруте следования автомобиля и времени пересечения им узлов на графе дорог.

Сейчас в России основным источником информации о загруженности дорог являются системы, которые отображают текущую дорожную обстановку и характерную загрузку дорог [1].

За рубежом существует ряд систем, которые предоставляют прогноз изменения дорожной обстановки на основе известной предыстории и данных о текущей ситуации, используя информацию с датчиков, установленных под дорожным полотном или у обочины. Поэтому таким системам доступна полная информация о числе и скорости движения автомобилей на каждом участке трассы. Одной из самых известных разработок является система Traffic Prediction Tool (TPT) корпорации IBM [2].

Разрабатываемая авторами статьи система, в отличие от существующих зарубежных аналогов, строит прогноз изменения дорожной ситуации на основе зашумленных и неполных данных о скорости движения автотранспорта. Неполнота данных обусловлена тем, что мы знаем дорожную ситуацию только на тех дорогах, где находятся автомобили, оборудованные портативными спутниковыми навигаторами. А зашумленность обусловлена ошибками измерения местоположения и скорости движения этих автомобилей. В отличие от известных российских разработок, при построении прогноза учитываются не только исторические данные о скоростях, но и ситуация, сложившаяся в городе в данный момент.

Система использует ряд математических моделей, каждая из которых имеет большую или меньшую предсказательную способность при определенных условиях. Ниже описаны модели и критерии, на основе которых происходит выбор наиболее эффективной модели для сложившейся ситуации.

Научная новизна работы заключается в разработке алгоритма прогнозирования дорожной ситуации, который показал себя лучше аналогов в условиях неполноты и зашумленности исходных данных.

1. Количественные характеристики дорожных ситуаций

Дорожной ситуацией будем называть совокупность местоположений, скоростей и габаритных размеров всех транспортных средств на рассматриваемой дороге. Однако используемый тип датчиков позволяет получить информацию только о средней скорости движения. Дорожную ситуацию будем характеризовать метрикой - непрерывно дифференцируемой функцией М(У), зависящей от скорости движения транспортного потока V и выбранной так, чтобы разность значений метрики, соответствующих двум ситуациям на дороге, несла информацию о различии этих ситуаций. Метрика должна обладать свойствами.

1. Так как водителей интересует относительная погрешность прогнозирования времени движения Т, вычисляемая по соотношению

где индексами р и г обозначены соответственно прогнозируемые и реальные величины, то разность метрик М^р) - М^г) должна быть пропорциональна отношению Vp/Vг.

2. Так как на разгруженной дороге скорости зависят в большей степени от характера вождения и типа транспортного средства, чем от дорожной ситуации, то чувствительность метрики к скорости должна быть тем меньше, чем больше значение самой скорости, то есть

3. Абсолютная погрешность разности метрик М^р) - М(Ц-), обусловленная погрешностью измерения времени движения Т, не должна зависеть от длины рассматриваемого участка дороги.

Перечисленные требования оставляют некоторую свободу в выборе конкретного вида функции М(У), однако среди основных элементарных функций им удовлетворяет только логарифмическая метрика вида М(^) = \^.

Меру различия 7 некоторых дорожных ситуаций 1 и 2, относящихся к группе дорог и отстоящих по времени на интервал Дґ, будем оценивать средним квадратом разности их метрик:

где N - число измерений, I - число рассматриваемых дорог, tbeg и tend - начало и конец временного интервала, на котором производятся измерения. Время t меняется дискретно с постоянным шагом дискретизации.

При оптимизации прогнозирующих моделей необходимо сравнивать прогнозируемую и фактическую ситуацию за один и тот же интервал времени, то есть исследовать величину

где Vr - реальная скорость на дороге i; Vp - прогнозная скорость на дороге i.

2. Взаимосвязь между дорогами

Заторы на одних улицах провоцируют заторы на других. При этом от структуры развязок и схемы организации движения будет зависеть и скорость транспортного потока, и величина взаимовлияния. Для повышения точности прогноза нужно учитывать эти связи между дорогами.

Поскольку на скорость движения потока влияют такие факторы, как часы пик, праздники и т.д., то чтобы минимизировать это влияние, требуется исследовать отклонения скорости от ее характерной величины для данного времени суток, дня недели и времени года

и = V - УсЬаг,

где и - отклонение скорости, V- текущая скорость, Vchar - характерная скорость (п. 3).

Примем, что взаимное влияние отклонений скорости движения транспорта на двух дорогах си с1 имеет линейный закон. Любую ситуацию, отвечающую этому линейному закону, будем называть равновесной. Всякое отклонение скорости от равновесной скорости, связанное с изменением дорожной ситуации, на одной из дорог распространится на другие дороги с некоторым запаздыванием т, тем самым обеспечив восстановление равновесия, но уже при иных величинах скоростей. Таким образом, математическая модель взаимосвязи имеет вид

иМ = а ид(г - т) + е($, где а - коэффициент взаимосвязи, е - остаточное отклонение скорости.

Всякое отклонение скорости от равновесной скорости, не связанное с изменением дорожной ситуации, не будет влиять на скорость движения на других дорогах, однако с течением времени будет убывать и тем самым восстанавливать равновесие при тех же величинах скоростей, которые были изначально. Если принять, что скорость затухания случайного отклонения скорости пропорциональна самому отклонению, то получим выражение

- £^-1) = Ь -1) + -1).

Физически осмысленным является лишь случай Ь < 0, поскольку в противном случае уравнение описывает неограниченное возрастание отклонения е. Если в расчёте получено положительное значение Ь, то это может быть объяснено недостаточностью накопленных статистических данных.

Силу взаимосвязи между дорогой с и дорогой С оцениваем отношением коэффициента затухания Ь к стандартной ошибке определения этого коэффициента БЕЬ. Стандартная ошибка определения коэффициента линейной регрессии вычисляется как отношение среднеквадратичного отклонения остатка к среднеквадратичному отклонению фактора, следовательно

ь ^О(О)

-

где а(^) - среднеквадратичное отклонение.

Для каждого значения т из определенного интервала рассчитывается значение величины цс,С. Затем отыскивается такая величина * при которой взаимосвязь цс,С максимальна. Если т* < 0, то дорога с влияет на дорогу С, при * > 0 дорога С влияет на дорогу с. В случае * близкого к нулю, имеет место как влияние с на С, так и влияние С на с.

Скорость движения при отсутствии заторов зависит не столько от дорожной ситуации, сколько от характера вождения и вида транспортного средства. Поэтому в расчете параметров о и Ь участвуют только те отсчеты, в которых скорости на обеих дорогах ниже определенного порога.

3. Прогнозирование на основе характерной скорости движения

п у V

В основе предлагаемой модели прогнозирования лежит расчет медианной скорости движения с учетом цикличности действия внешних факторов на дорожную обстановку по времени суток, дням недели и времени года. Эту скорость будем называть характерной скоростью.

Экстраполяция характерной скорости может использоваться как самостоятельный инструмент прогнозирования. Однако в этом случае никак не учитывается дорожная ситуация, сложившаяся в городе на момент построения прогноза, поэтому точность такого прогноза невелика (п. 6). Вычисление характерной скорости может выступать и в качестве составной части более сложных моделей прогнозирования, рассмотренных ниже.

4. Прогнозирование на основе характерной скорости движения с

учетом отклонений

При построении прогноза было бы некорректно рассматривать пару взаимосвязанных дорог изолированно от дорожной сети всего города. Между дорогами существуют множественные связи, и их учёт необходим для корректного предсказания дорожной обстановки. На одних дорогах текущая скорость может быть выше характерной, а на других ниже, но из-за влияния дорог друг на друга транспортный поток будет перераспределяться: скорости на недогруженных дорогах будут падать, а на перегруженных расти.

Обобщая линейный закон взаимосвязи отклонений скоростей от характерной скорости (п. 2) на случай нескольких дорог с, С,... у, г, можем записать его в виде

ис(ґ) = ос,С иС(ґ — тс,С) + ос,е ие(ґ — тс,е) +•••+ ос,г иг(ґ — тс,г) + ^c(t),

и

ис/№) = а<С,с иё(^ Чс) + а<С,е ие(^ т<С,е) +•••+ аё,г иг(^ тС,г) + еcl(t), и1(£) = а1,с ис(^ - т1,с) + а1,С иС(^ - т1,С) + ••• + аг,у иу(^ - т1,у) + еz(t).

В построенную многомерную модель включаются лишь те дороги, для которых характеристика взаимосвязи ц оказывается выше определённого порога.

Поиск коэффициентов взаимосвязи ац осуществляется с помощью метода главных компонент [3], использующего сингулярное разложение матрицы данных.

На вход алгоритма подается матрица, содержащая отклонения скоростей от характерной скорости для всех дорог, включённых в модель, с соответствующими смещениями по времени т :

ис( 0) ис{ 1) ис( 2) - и&у

^(0) ил 1) ил 2) - ил О-'

В случае отсутствия данных о скоростях для некоторого момента времени, скорость принимается равной характерной и, следовательно, отклонение равным нулю.

Сингулярное разложение позволяет представить матрицу и в виде

и = ЬБРт,

где I. - матрица собственных векторов, Б - матрица квадратов собственных чисел, Р -матрица поворота. Величины, обратные к собственным числам матрицы и, характеризуют рассеяние данных в направлениях, задаваемых матрицей поворота. Благодаря этому они могут использоваться для выявления главных и второстепенных факторов, определяющих рассеяние данных. Это, в свою очередь, позволяет выделить среди коэффициентов взаимосвязи дорог ац лишь те, которые существенны для построения прогноза.

Число главных компонент определяется экспериментально. Собственные числа, соответствующие остальным компонентам, в матрице Б обнуляются. После перемножения матриц Ь, Б и Рт, содержащих только главные компоненты, получим матрицу иЬа/. В ней содержатся отклонения скорости, «сбалансированные» относительно предположения о линейном законе взаимосвязи между дорогами.

Прогнозная скорость Vр для дороги с через время в рассчитывается с помощью уравнения вида

^р (* + &) = ^сЬаг № + &) + (3( &) и<сьа/ (t),

где Vеchar - характерная скорость на дороге е; Ucbal - «сбалансированное» отклонение скорости для дороги е; Д<9) - функция, описывающая влияние «сбалансированного» отклонения скорости от характерной на прогнозную скорость для каждого в.

Функция /3(0) принимается равной единице при в = 0 и равной нулю при больших значениях в. Последнее означает, что на длительных интервалах прогнозирования нивелируется любое начальное отклонение скорости и, следовательно, прогноз строится исходя из одной лишь характерной скорости движения. Для всех промежуточных значений в величина в@) рассчитывается из условия минимизации меры J (п. 1).

5. Прогнозирование на основе значимости и определенности истории

В основе этого метода лежит предположение, что если разделить все дорожные ситуации на группы со схожей историей, то у всех ситуаций внутри группы будет схожее развитие [4]. В качестве метода кластеризации может быть выбран метод к ближайших соседей [5]. В качестве «расстояния» может выступить мера различия двух ситуаций на дороге

Мера различия ситуаций, вычисленная по множеству дорог, имеющих наибольшее влияние на данную дорогу, равна сумме мер различия для всех дорог этого множества с весами, равными силе взаимосвязи дорог:

I

}area —

¿ = 1

Здесь l - число пар отсчетов, в которые известно значение скорости для обеих сравниваемых ситуаций, J'roaci - мера различия двух ситуаций на дороге I; I - число дорог, имеющих наибольшее влияние на данную дорогу.

Мера схожести ситуаций является величиной, обратной мере их различия

В случайном процессе V(t) присутствует явная цикличность по времени суток, по дню недели и по времени года. Будем искать схожие ситуации с различным шагом цикличности р.

Ситуации подразделяются на группы с помощью метода к ближайших соседей по метрике ]агеа, рассчитанной на интервале [(£ - Т- пр), (£ - пр)], где п - целое число. Кластеризации подлежат только ситуации, для которых выполнен ряд условий: полнота истории, значимость истории и определенность истории.

Полнота истории Р оценивается числом измерений и равна

N

где N - число отсчетов в течение времени T. Значимость истории S оценивается числом ситуаций, попавших в группу. Определенность истории D оценивается близостью развития ситуации внутри группы и равна дисперсии величины Jarea[(t- T- пр), (t- пр)] по множеству ситуаций в группе.

Прогнозная скорость вычисляется как взвешенная сумма экстраполированных характерных скоростей с весами Warea:

6. Результаты численного эксперимента

Для экспериментального исследования точности предсказания скорости транспортных потоков был разработан программный комплекс, реализующий описанные в статье прогнозирующие модели. Исходный код программного комплекса написан на интерпретируемом языке Python [6]. Код состоит из 15 функционально замкнутых модулей и соответствующих модульных тестов. Для первоначальной отладки прототипов всех прогнозирующих моделей использовался специализированный язык математического моделирования R [7].

В качестве исходных данных была использована информация о скорости движения транспорта по наиболее загруженным дорогам Санкт-Петербурга за сентябрь-октябрь 2010 года по данным компании «СитиГИД» [8].

Абсолютные значения меры погрешности прогноза J (п. 1) лишь опосредованно характеризуют точность предсказания скорости, но позволяют сравнивать применяемые прогнозирующие модели между собой. В табл. 1 приведены значения меры J и соответствующие им оценки относительной погрешности расчёта времени движения 5T для прогноза скорости согласно описанным в статье моделям.

Погрешности прогнозирования

Таблица 1.

Модель прогноза і 61, %

Прогноз на основе средней скорости с учётом цикличности 0,081 33

Прогноз на основе характерной скорости 0,061 28

Прогноз на основе характерной скорости с учетом отклонений 0,041 22

Прогноз на основе значимости и определенности истории 0,034 20

Из табл. 1 видно, что использование характерной (медианной) скорости движения (п. 3) вместо средней позволяет повысить точность прогноза за счёт устранения влияния случайных выбросов скорости на получаемые предсказания. Тем не менее, дальнейшее увеличение достоверности прогноза обеспечивается лишь использованием более сложных математических моделей, учитывающих «сбалансированные» отклонения скорости от характерной (п. 4) либо использующих сравнение дорожной обстановки с аналогичными ситуациями в прошлом (п. 5). Последняя прогнозирующая модель является наиболее точной, однако предъявляет самые жёсткие требования к полноте истории и, следовательно, применима лишь для наиболее загруженных дорог города.

Заключение

Сравнение полученных результатов позволяет сделать вывод, что предложенные в статье математические модели прогноза обеспечивают в среднем более высокую точность, чем методы, основанные на экстраполяции средней или характерной скорости движения.

В дальнейшем планируется продолжить разработку новых моделей и протестировать уже существующие модели на большем интервале времени. Также планируется проверить работоспособность системы на данных, полученных в Москве и других городах.

Литература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Как работают Яндекс.Пробки. иКЬ: http://company.yandex.ru/technologies/yaprobki/ (дата обращения: 01.03.2012)

2. IBM Traffic Prediction Tool. URL: http://www.ibm.com/smarterplanet/us/en/traffic_congestion/nextsteps/index.html (дата обращения: 01.03.2012)

3. Jolliffe I.T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002, - 487 p. - P. 64-68.

4. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989. -587 с. - С. 282-291.

5. MacQueen J. Some methods for classification and analysis of multivariate observations.In Proc. 5th Berkeley Symp.on Math. Statistics and Probability, 1967, p. 281-297.

6. Python Programming Language - Official Website. URL: http://www.python.org/ (дата обращения: 01.03.2012).

7. The R Project for Statistical Computing. URL: http://www.r-project.org/ (дата обращения: 01.03.2012).

8. СитиГИД. Навигационная служба. URL: http://www.probki.net/news.aspx (дата обращения: 01.03.2012).

SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU

SCIENCE and EDUCATION

EL № FS 77 - 4821 1. №0421200025. ISSN 1994-0408

electronic scientific and technical journal

Prediction of traffic situation

# 07, July 2012

DOI: 10.7463/0712.0418480

Vyalyh K.M., Pavlov Y.N., Stepanova M.B.

Russia, Bauman Moscow State Technical University

[email protected]

[email protected]

[email protected]

Several prediction models, methods of qualitative assessment of predictions and model selection methodology are presented in this article. Prediction accuracy was evaluated by comparing models with one other. Prediction accuracy of the described models was higher than the prediction of extrapolated average speed. Longtime testing, new models and factors affecting the traffic situation are planned to be considered.

Publications with keywords: congestion forecasting, time-series analysis, principal component analysis, road traffic

Publications with words: congestion forecasting, time-series analysis, principal component analysis, road traffic

References

1. KakrabotaiutIandeks.Probki [How does Yandex.Traffic Jams work]. Available at: http://company.yandex.ru/technologies/yaprobki/. Accessed March 01, 2012.

2. IBM Traffic Prediction Tool. Available

at: http://www.ibm.com/smarterplanet/us/en/traffic congestion/nextsteps/index.html. Accessed March 01, 2012.

3. Jolliffe I.T. Principal Component Analysis. 2nd ed. New York, Springer, 2002. 502 p. (Springer Series in Statistics).

4. Aivazian S. A., Bukhshtaber V.M., Eniukov I.S., Meshalkin L.D. Prikladnaia statistika: Klassifikatsiia i snizhenie razmernosti [Applied statistics: Classification and dimension reduction]. Moscow, Finansy i statistika Publ., 1989. 587 p.

5. MacQueen J. Some methods for classification and analysis of multivariate observations. Proc. 5th Berkeley Symp. on Mathematical Statistics and Probability. Vol. 1. Berkeley, Univ. of Calif. Press, 1967, pp. 281-297.

6. Python Programming Language. Available at: http://www.python.org/. Accessed March 01, 2012.

7. The R Project for Statistical Computing. Available at: http://www.r-project.org/. Accessed March 01, 2012.

8. SitiGID. Navigatsionnaia sluzhba [City guide. Navigation service]. Available at: http://www.probki.net/news.aspx. Accessed March 01, 2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.