КРАТКИЕ СООБЩЕНИЯ X
УДК 519.652
метод прогнозирования дорожной ситуации в условиях неполноты и зашумленности данных
К. М. Вялых1,
аспирант
Московский государственный технический университет им. Н. Э. Баумана
Рассмотрен общий подход к прогнозированию загруженности городских транспортных магистралей, приведены предварительные результаты экспериментальных исследований. Описан алгоритм прогнозирования дорожной ситуации в условиях неполноты и зашумленности сигнала. Для оценки качества прогнозирования системы производилось сравнение с предсказанием экстраполяцией средней скорости.
Ключевые слова — дорожное движение, прогнозирование заторов, анализ временных рядов, метод главных компонент.
Введение
Сейчас в России основным источником информации о загруженности дорог являются системы, которые отображают текущую дорожную обстановку и характерную загрузку дорог [1].
За рубежом существует ряд систем, которые предоставляют прогноз изменения дорожной обстановки в будущем на основе известной предыстории и данных о текущей ситуации. Однако они используют информацию с датчиков, установленных под дорожным полотном или у обочины. Поэтому таким системам доступна полная информация о количестве и скорости движения автомобилей на каждом участке трассы. Одной из самых известных разработок является система Traffic Prediction Tool (TPT) корпорации IBM [2].
Разрабатываемая система, в отличие от ныне существующих зарубежных аналогов, строит прогноз изменения дорожной ситуации на основе неполных данных о скорости движения автотранспорта. От российских разработок отличие заключается в учете при построении прогноза не только исторических данных, но и ситуации, сложившейся в городе в данный момент.
Система использует ряд математических моделей, каждая из которых имеет большую или меньшую предсказательную способность при определенных условиях.
1Научный руководитель — доктор технических наук, профессор кафедры ИУ-3 Ю. Н. Павлов.
Методика прогнозирования дорожных ситуаций
Критерии качества предсказания
При выборе наилучшей математической модели прогнозирования дорожной обстановки необходимо задаться некоторой численной характеристикой качества прогноза. Тем не менее, в рамках решаемой задачи невозможно предложить единственно верный критерий точности предсказания ввиду сложности процесса и неоднородности требований пользователей к системе. Ни средняя абсолютная ошибка, ни средняя относительная ошибка, ни среднеквадратическая ошибка прогнозирования скорости не совпадают с интуитивным представлением о погрешности прогноза, что легко показать на следующем примере. Пусть при реальной скорости транспортного потока 80 км/ч две сравниваемые математические модели получили прогнозную скорость 140 и 20 км/ч соответственно. Для обеих моделей абсолютные ошибки прогнозирования равны 60 км/ч, относительные ошибки равны 75 %, а среднеквадратические ошибки равны 60 км/ч. Однако, с точки зрения пользователя, эти результаты не являются равноценными, поскольку применение второй модели приводит к принципиально неверному выводу о наличии затора.
Для решения этой проблемы введем метрику М(У), которая является некой функцией от скорости движения транспортного потока У. Абсолютная ошибка прогнозирования этой метрики несет информацию об ошибке прогнозирования
ситуации. Как было сказано выше, эта задача принципиально не имеет оптимального решения, поэтому будем определять способ ее расчета, опираясь на ряд естественных требований.
Требование 1. Так как водителей интересует относительная погрешность прогнозирования времени движения Т, вычисляемая по соотношению Т —Т Т V
Р г _± р — і _ _^р — і
Т Т V ’
Аг г уг
где индексами р и г обозначены соответственно прогнозируемые и реальные величины, то разность метрик М(Ур) - М(Уг) должна быть пропорциональна отношению Ур/Уг.
Требование 2. Так как на разгруженной дороге скорости зависят в большей степени от характера вождения и типа транспортного средства, чем от дорожной ситуации, то чувствительность метрики к скорости должна быть тем меньше, чем больше значение самой скорости, т. е.
!1ш М!_ 0.
V dV
Требование 3. Погрешность разности метрик М(Ур) - М(Уг), обусловленная погрешностью измерения времени Т, не должна зависеть от длины рассматриваемого участка дороги.
Перечисленным требованиям удовлетворяет метрика вида М(У) = 1пУ
При расчете параметров моделей и выборе моделей оптимизируется среднеквадратическое отклонение метрики М(У).
Прогнозирование на основе характерной скорости движения
В основе предлагаемого алгоритма прогноза лежит предположение о стационарности характеристик распределения скорости. В качестве прогнозного значения скорости используется медиана распределения скорости с учетом периодичности по времени суток, дням недели и времени года. Эта модель наиболее проста, но она не позволяет извлечь никакой дополнительной информации из текущей дорожной обстановки и поэтому наследует все недостатки, свойственные существующим системам предсказания загруженности магистралей.
Взаимосвязь между дорогами
Ситуация на одних участках движения влияет на ситуации на других участках движения. Эта связь наиболее очевидна, когда все автомобили с определенного участка могут выехать только на одну дорогу. Затор на этой дороге повлияет на дорожную ситуацию всего участка. Величина этой взаимосвязи зависит от структуры развязки и схемы организации движения.
Поскольку на скорость движения потока влияют внешние факторы, такие как часы пик, праздники и т. д., то чтобы минимизировать это влияние, требуется исследовать отклонения скорости от ее характерной величины для данного времени суток, дня недели и времени года:
V = V - VI.
cur char’
где V — отклонение скорости; Vcur — текущая скорость; Vchar — характерная скорость.
Рассмотрим пару дорог с и d. Предположим, что взаимное влияние одной дороги на другую имеет линейный закон и распространяется с некой задержкой т. Если т < 0, то дорога с влияет на дорогу d. Если т > 0, то дорога d влияет на дорогу
c. Если т* близко к нулю, то имеет место как влияние с на d, так и влияние d на с. То есть имеется взаимосвязь вида
Vc'(t) = a Vd'(t - т) + E(t),
где Ус' — отклонение скорости для дороги с; Vd' — отклонение скорости для дороги d; a — величина взаимосвязи; е — остаточное отклонение скорости.
Остаточное отклонение e(t) состоит из двух составляющих: случайного отклонения, которое затухает при неизменных значениях V'^t) и Vd(t - т), и неслучайного отклонения, которое затухает с изменением значений V(t) и Vd(t - т). Априорно разделить эти отклонения не представляется возможным, однако величину взаимосвязи характеризуют скорости затухания этих отклонений. Поэтому вне зависимости от изменения Vc(t) и Vd(t - т) взаимосвязь характеризуется затуханием величины e(t). Если принять, что скорость затухания случайного отклонения скорости пропорциональна самому отклонению, то получим выражение
e(t) - e(t - 1) = be(t - 1) + 5(t - 1).
Сила взаимосвязи между дорогой с и дорогой
d, тс d, будет оцениваться как отношение коэффициента затухания b к стандартной ошибке определения этого коэффициента SEb. Стандартная ошибка определения коэффициента линейной регрессии вычисляется как отношение среднеквадратического отклонения остатка к среднеквадратическому отклонению фактора, следовательно:
b Ьа(є)
СО bE о- a(S)
где ст(-) — среднеквадратическое отклонение.
Значение силы взаимосвязи между дорогами ц зависит от значения задержки т. Оптимальное значение т не выводится аналитически, поэтому определяется перебором. Выбирается такая ве-* <•» личина т , при которой взаимосвязь ц максимальна.
Скорость движения при отсутствии заторов зависит не столько от дорожной ситуации, сколько от характера вождения и вида транспортного средства. Поэтому в расчете параметров а и Ь участвуют только отсчеты, в которых скорости на обеих дорогах ниже определенного порога.
Прогнозирование на основе характерной скорости движения с учетом отклонений
Для прогнозирования дорожной ситуации на дороге с используется информация о ситуации на дорогах с силой взаимосвязи больше определенного порога. Величина взаимосвязи рассчитывается с помощью метода главных компонент [3], использующего сингулярное разложение матрицы отклонений скоростей от характерной скорости У .
После перемножения компонентов разложения получим матрицу У^. В ней содержатся отклонения скорости, «сбалансированные» относительно предположения о линейном законе взаимосвязи между дорогами.
Прогнозная скорость Ус р для дороги с через время 9 рассчитывается с помощью уравнения вида
Ус р ^ + 9) = Ус «*аГС + 9) + Р(9)У bal(t),
где Ус р — прогнозная скорость на дороге с; Ус ^аг — характерная скорость на дороге с; у ьа1 — отклонение скорости для дороги с, содержится в строке матрицы УЬа1, соответствующей дороге с; Р(9) — функция, описывающая влияние «сбалансированного» отклонения скорости от характерной на прогнозную скорость для каждого 9.
Прогнозирование на основе прецедентов
В основе метода лежит следующее предположение: если дорожная ситуация в определенном районе подобна ситуации в прошлом, то она получит сходное развитие. Для уменьшения влияния случайных факторов исследуется аналогия не с одной ситуацией-прецедентом, а с группой таких ситуаций. В качестве метода разбиения ситуаций по группам используется метод & ближайших соседей [4]. В качестве «расстояния» выступает мера различия двух ситуаций на дороге
<Л-оа*= Е (ЧУсиг(#))-И) ’
^ tbeg
где Усиг — текущая скорость; Ураз1 — соответствующая скорость в прошлом.
Мера различия ситуаций вычисляется по множеству дорог с силой взаимосвязи, большей определенного порога:
1 к
Jarea Т Е /М- Jroad к ’
1 к=1
где I — количество пар отсчетов, в которых известно значение скорости для обеих сравнивае-
мых ситуаций; ^гоай & — мера различия двух ситуаций на дороге &; К — число дорог, имеющих наибольшее влияние на данную дорогу.
Мера схожести ситуаций считается величиной, обратной мере их различия:
W =- 1
' а то а
f area j
J area
В случайном процессе V(t) присутствует явная цикличность по времени суток, по дню недели и по времени года. Будем искать схожие ситуации с различным шагом цикличности р.
Ситуации подразделяются на группы с помощью метода k ближайших соседей по метрике Jarea, рассчитанной на интервале [t - T - пр, t - пр], где п — целое число. Кластеризации подлежат только ситуации, для которых выполнен ряд условий: полнота истории, значимость истории и определенность истории.
Полнота истории P оценивается количеством измерений:
р=N,
т
где N — количество отсчетов в течение времени T.
Значимость истории S оценивается количеством ситуаций, попавших в группу.
Определенность истории D оценивается близостью развития ситуации внутри группы и равна дисперсии величины Jarea[t - T - пр, t - пр] по множеству ситуаций в группе.
Прогнозная скорость вычисляется как взвешенная сумма экстраполированных характерных скоростей с весами Warea:
Vp (t + 0) =
Е ЙЬвgWarea [t -пр’t + 0 - пр] Vchar (t + 0 -пр)
Е ^gWarea [t - пр> t + 0 -пр]
Метод k ближайших соседей не гарантирует малой меры различия дорожных ситуаций. Однако благодаря тому, что Warea экспоненциально растет при уменьшении Jarea, влияние существенно отличающихся ситуаций на прогноз будет пренебрежимо мало.
Борьба с неполнотой и зашумленностью данных
Борьба с неполнотой:
• при расчете взаимосвязи между дорогами алгоритму для получения новой информации о взаимосвязи достаточно двух релевантных последовательных измерений на обеих дорогах;
• при прогнозировании на основе характерной скорости движения на небольшом количестве измерений влияние выбросов нивелируется благо-
даря оценке медианой распределения вместо среднего значения;
• при прогнозировании на основе характерной скорости движения с учетом отклонений можно выявлять множественные взаимосвязи при небольшом количестве измерений;
• при прогнозировании на основе прецедентов при расчете меры схожести между ситуациями нет необходимости иметь информацию о ситуации на всех участках области.
Борьба с зашумленностью:
• погрешность разности метрик М(Ур) - М(УГ) не зависит от длины рассматриваемого участка дороги, что позволяет равномерно учитывать ошибку измерения времени;
• благодаря возможности объединить дороги в группы по силе взаимосвязи и рассматривать группы как единое целое, ошибка прогнозирования уменьшается.
Результаты численного эксперимента
Для оценки качества предсказания системы производилось сравнение с предсказанием экстраполяцией средней скорости.
Критерием качества предсказания было выбрано относительное отклонение фактического времени движения автомобиля по маршруту от предсказанного времени. В качестве реального времени движения использовалось время движения автомобиля по маршруту по данным компании «СитиГид» [5] для дорог Санкт-Петербурга за сентябрь—октябрь 2010 года.
При предсказании экстраполяцией средней скорости получено среднее относительное отклонение времени движения автомобиля, равное 37 %. Аналогичная величина при прогнозировании с помощью разрабатываемой системы получилась равной 22 %.
В дальнейшем планируется провести тестирование на большем интервале времени и ввести
в рассмотрение новые модели и факторы, влияющие на дорожную обстановку.
Заключение
Таким образом, разработанные методы прогнозирования имеют точность существенно выше, чем предсказание экстраполяцией средней скорости, которую используют большинство ныне существующих в России систем. Это свидетельствует об эффективности использования данных о сложившейся ситуации при построении краткосрочного прогноза, даже в условиях неполноты и зашумленности этих данных. Результаты данной работы в перспективе могут позволить более рационально использовать имеющиеся транспортные ресурсы, в частности, максимально равномерно распределять транспортный поток по различным магистралям.
1. Описание системы «Яндекс Пробки». http:// help.yandex.ru/maps/informer.xml (дата обращения: 01.03.2012).
2. Описание системы Traffic Prediction Tool (TPT). http://www.ibm.com/smarterplanet/us/en/traffic_ congestion/nextsteps/index.html (дата обращения: 01.03.2012).
3. Jolliffe I. T. Principal Component Analysis, Series: Springer Series in Statistics. 2nd ed. — NY.: Springer, 2002. — P. 64-68.
4. MacQueen J. Some methods for classification and analysis of multivariate observations // Proc. 5th Berkeley Symp. on Math. Statistics and Probability. 1967. Р. 281-297.
5. Описание системы «СитиГид». http://www.probki. net/news.aspx (дата обращения: 01.03.2012).