Научная статья на тему 'Алгоритм оценки времени прибытия общественного транспорта с использованием адаптивной композиции элементарных прогнозов'

Алгоритм оценки времени прибытия общественного транспорта с использованием адаптивной композиции элементарных прогнозов Текст научной статьи по специальности «Математика»

CC BY
698
128
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
ОБЩЕСТВЕННОЕ ТРАНСПОРТНОЕ СРЕДСТВО / ПРОГНОЗИРОВАНИЕ ВРЕМЕНИ ПРИБЫТИЯ / ОЦЕНКА ВРЕМЕНИ ПРИБЫТИЯ / КОМПОЗИЦИЯ АЛГОРИТМОВ / ИЕРАРХИЧЕСКОЕ РАЗБИЕНИЕ / ДЕРЕВО РЕГРЕССИИ / CITY PUBLIC TRANSPORT / ARRIVAL TIME PREDICTION / ARRIVAL TIME ESTIMATION / ALGORITHMS COMPOSITION / HIERARCHICAL DECOMPOSITION / REGRESSION TREE

Аннотация научной статьи по математике, автор научной работы — Агафонов Антон Александрович, Мясников Владислав Валерьевич

Работа посвящена решению задачи построения прогноза времени прибытия общественных транспортных средств на остановки общественного транспорта. Предложен оригинальный алгоритм прогнозирования, основанный на модели адаптивной композиции элементарных алгоритмов прогнозирования, каждый из которых характеризуется малым числом настраиваемых параметров. Адаптивность подразумевает зависимость параметров конструируемой композиции от ряда управляющих параметров модели, к которым относятся следующие актуальные (определённые на текущий момент) факторы: погодные условия, плотность транспортного потока, динамика движения, горизонт прогноза и др. Адаптивность достигается введением иерархического разбиения области значений управляющих параметров, применяемого в дереве регрессии. Проведено исследование предложенного алгоритма на данных движения городского пассажирского транспорта в г. Самаре, показавшее преимущество предлагаемого решения по сравнению с существующими.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Агафонов Антон Александрович, Мясников Владислав Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN ALGORITHM FOR CITY TRANSPORT ARRIVAL TIME ESTIMATION USING ADAPTIVE ELEMENTARY PREDICTIONS COMPOSITION

The problem of precise arrival time of public transport is considered in this paper. There is proposed a new prediction algorithm based on adaptive composition model using elementary prediction. A small number of adaptive parameters characterizes each elementary prediction algorithm. Adaptability means that parameters of the constructed compositions depend on a number of control parameters of the model, which includes the following factors: weather conditions, traffic density, driving dynamics, prediction horizon, etc. Adaptability is achieved by introducing a hierarchical decomposition range of control parameters used in regression tree. We made experimental investigations on real routes of city public transport in Samara to evaluate the prediction accuracy of the proposed algorithm. We also explain the advantages of the proposed solution in comparison with existing ones.

Текст научной работы на тему «Алгоритм оценки времени прибытия общественного транспорта с использованием адаптивной композиции элементарных прогнозов»

АЛГОРИТМ ОЦЕНКИ ВРЕМЕНИ ПРИБЫТИЯ ОБЩЕСТВЕННОГО ТРАНСПОРТА С ИСПОЛЬЗОВАНИЕМ АДАПТИВНОЙ КОМПОЗИЦИИ ЭЛЕМЕНТАРНЫХ ПРОГНОЗОВ

Агафонов АЛ.1, Мясников В.В.1,2 1 Институт систем обработки изображений РАН, 2 Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет)

Аннотация

Работа посвящена решению задачи построения прогноза времени прибытия общественных транспортных средств на остановки общественного транспорта. Предложен оригинальный алгоритм прогнозирования, основанный на модели адаптивной композиции элементарных алгоритмов прогнозирования, каждый из которых характеризуется малым числом настраиваемых параметров. Адаптивность подразумевает зависимость параметров конструируемой композиции от ряда управляющих параметров модели, к которым относятся следующие актуальные (определённые на текущий момент) факторы: погодные условия, плотность транспортного потока, динамика движения, горизонт прогноза и др. Адаптивность достигается введением иерархического разбиения области значений управляющих параметров, применяемого в дереве регрессии. Проведено исследование предложенного алгоритма на данных движения городского пассажирского транспорта в г. Самаре, показавшее преимущество предлагаемого решения по сравнению с существующими.

Ключевые слова: общественное транспортное средство, прогнозирование времени прибытия, оценка времени прибытия, композиция алгоритмов, иерархическое разбиение, дерево регрессии.

Введение

Развитие современных средств глобального позиционирования сделало возможным решение целого ряда задач анализа транспортных систем, моделирования и прогнозирования [1]. Среди этого ряда задач одной из наиболее востребованных и понятных для конечного потребителя - участника дорожного движения - является задача прогнозирования времени движения транспортных средств. В настоящей работе рассматривается одна из возможных постановок такой задачи, заключающаяся в прогнозировании времени прибытия общественного транспортного средства (ОТС) на остановки. Решение этой задачи необходимо как для управления движением и внесения свовременных корректировок диспетчерскими службами, так и для оповещения пассажиров о времени прибытия ОТС на остановочные пункты.

Задаче прогнозирования времени прибытия ОТС и связанной с ней задаче оценки времени прохождения транспортными средствами (ТС) сегментов улично-дорожной сети (УДС) посвящено большое количество работ. Существующие методы можно условно разделить на две большие группы:

- статистические методы [2], использующие архивные данные и данные в реальном времени,

- методы моделирования [3], использующие модели транспортных потоков и модели распространения транспортных заторов.

Методы моделирования являются не столь распространёнными, как статистические методы, т.к. требуют актуальной модели транспортных потоков [3]. Статистические методы основываются на использовании различных моделей, учитывающих как архивные данные и данные в реальном времени о движении транспортных средств непосредственно, так и косвенную информацию, влияющую на дорожную ситуацию в целом. Ниже представлен их краткий обзор.

Модели на основе архивных данных строят прогноз скорости движения транспорта в определённый период времени по средней скорости в тот же период в предыдущие дни. Результаты этих моделей являются достоверными только тогда, когда схема движения транспорта является относительно стабильной в рассматриваемой области; в случае возникновения заторов и аварий точность этих моделей может сильно ухудшиться [4, 5].

Модели регрессии строятся как функции регрессии от набора независимых переменных, которые могут включать данные о прохождении дорожных сегментов в реальном времени, архивные данные, дорожные условия, пассажиропоток, погодные условия, задержки на остановках [6, 7]. Необходимое условие независимости переменных ограничивает применимость регрессионных моделей для транспортных систем, где переменные могут быть сильно коррелированы.

Также в оценке времени прибытия широко используются модели, основанные на фильтрации Калмана [8, 9, 10]. Хотя основной функцией моделей такого рода является прогноз текущего состояния системы, они могут служить основой для оценки будущих значений или для исправления предыдущих прогнозов. Модель может адаптироваться к колебаниям транспортного потока с зависящими от времени параметрами [9]; является эффективной для составления краткосрочных прогнозов.

Модели искусственных нейронных сетей применяются в транспортных задачах с начала 1990-х годов [11]. Популярность этих моделей объясняется их способностью моделировать сложные нелинейные отношения между временем прохождения сегментов сети и независимыми переменными, характеризующими дорожную ситуацию [10, 12].

Метод опорных векторов представляет собой набор алгоритмов вида «обучение с учителем», используемых для задач классификации и регрессии. Метод применялся для прогноза времени прибытия общест-

венного транспорта в работах [13, 14]; является вычислительно сложным, требует дальнейших исследований в вопросах выбора входных переменных и определения параметров алгоритма.

Гибридные модели являются объединением двух и более моделей для прогноза времени прибытия. В [15] используется объединение модели линейной регрессии и модели локально взвешенной линейной регрессии для повышения точности и надёжности прогнозов. В [16] показывается, что комбинация байесовской модели и модели нейронных сетей может давать хорошую оценку времени прохождения сегмента дорожной сети. Схожий подход к построению прогноза использовался в [17]. В работах [18, 19] предложен алгоритм прогноза, использующий фильтр Калмана для отслеживания местоположения транспортного средства и статистические оценки для прогнозирования времени прибытия. В [20] используется комбинированная схема из нейронной сети и фильтра Калмана.

В настоящей работе предложен новый оригинальный алгоритм оценки (прогнозирования) времени прибытия ОТС на остановки общественного транс -порта, основанный на модели адаптивной композиции элементарных алгоритмов прогнозирования. Адаптивность подразумевает зависимость параметров конструируемой композиции от ряда управляющих параметров модели, к которым относятся следующие актуальные (определённые на текущий момент) факторы, влияющие на движение ТС и/или результат требуемого прогноза напрямую или косвенно: плотность транспортного потока, динамика движения, погодные условия и освещение, горизонт прогноза и др. В качестве используемых элементарных алгоритмов композиции могут быть выбраны алгоритмы достаточно произвольной природы, при этом в данной работе используются элементарные прогнозы по данным реального времени, прогнозы по архивным данным, расписанию движения транспорта и актуальному движению транспортного средства.

Работа построена следующим образом. В первом разделе вводятся основные понятия, выводятся основные соотношения, связывающие прогнозное временя прибытия ОТС на остановку и время прохождения ОТС сегмента сети, даётся постановка задачи. Второй раздел посвящён описанию предлагаемой модели алгоритма оценки времени прохождения ОТС сегмента УДС, основанного на адаптивной комбинации элементарных алгоритмов прогноза. Третий и четвёртый разделы посвящены вопросам оценки параметров как элементарных алгоритмов, так и их композиции - агрегирующей функции. В пятом разделе приводится экспериментальное исследование разработанного алгоритма. В завершение работы приводятся выводы и благодарности, даётся список используемой литературы.

1. Основные обозначения и постановка задачи

Транспортную сеть определим как ориентированный граф, дуги которого соответствуют реальным участкам дорог (ниже - сегментам сети), а вершины

представляют собой разделяющие участки дорог узлы. Направление дуги определяет направления движения ТС на соответствующем участке сети. Введём дополнительные обозначения:

- ш - конкретный сегмент сети, длину сегмента обозначим |ш|;

- 5 - тип (сорт) ТС/ОТС; множество типов ТС/ОТС на конкретном сегменте ш обозначим Бш;

- т - номер маршрута ТС/ОТС; пара (5, т) определяет «маршрут» ТС/ОТС, при этом все маршруты считаются различными; на конкретном сегменте ш множество номеров маршрутов с конкретным типом 5 ОТС обозначим Мш;

- Щ,т - множество сегментов сети, соответствующих (по которым проходит) конкретному маршруту ОТС (5, т);

- уММах(5т) (С,0 - максимальная скорость прохождения сегмента ш дорожной сети ОТС конкретного маршрута т и конкретного типа 5 в определённый день сС и определённое время t (определяется дорожными знаками);

-]ш (С) - индекс, используемый для задания формального порядка прохождения конкретного сегмента ш всеми ОТС. Далее для сокращения записи будет использоваться просто ];

- 1^(0) - множество индексов на сегменте ш в конкретный день сС;

- 5 (ш,]), т (ш,]), - тип и маршрутный номер ]'-го ОТС из множества Т(с1);

- Ю - уникальный идентификатор ОТС. Может быть получен, например, по индексу прохождения ОТС конкретного сегмента: Ю(ш,]). Тип и номер маршрута этого конкретного ОТС: 5 (1Ю), т(1Ю);

- с - день, однозначно идентифицируемый набором (год, день); всё множество дней обозначим ¥ (С е¥);

- 2,..., ¥ ь - разбиение всего множества дней ¥ (С е ¥) на эквивалентные классы (например, дни недели). Должны выполняться соотношения: ¥ = и , ^ П ¥' = 0 . Дополнительно опреде-

«=1,Ь

лим функцию у (С) е ¥, которая выдаёт класс/тип конкретного дня, называемого далее «типодень»;

- ] - момент времени (начальный), в который ]-ое ОТС из множества Т'(сС) появляется (въезжает) на сегмент ш в день С;

- Т] (/) - длительность (в единицах времени) нахождения ]-го ОТС из множества Т'(сС) на сегменте шв день сС на момент I Здесь возможны две принципиально различные ситуации. В первой ситуации в текущий момент t ОТС полностью проехало (миновало) сегмент и не находится на этом сегменте. В этой ситуации длительность Т] (/) - это время прохождения сегмента. Во второй ситуации ОТС в момент t находится на сегменте. В этом случае длительность Т] - это время нахождения на сегменте (последнее из учтённых);

- Dj (t) е [0,1] - относительное положение j-го ОТС из множества Jw (d) на сегменте w в день d на момент (текущий) времени t. В случае, если в текущий момент t ОТС полностью проехало сегмент, величина А j (t) = 1. Если ОТС в момент t находится на сегменте,

величина Aj (t) показывает относительное положение ОТС на сегменте (последнее из учтённых);

- Jsw(d) = {jе Jw(d): s(j) = s} - множество индексов из Jw (d) ОТС конкретного типа s;

- Jim(d) = {jе Jw(d): s(j) = s л m(j) = m} - множество индексов ОТС конкретного типа и маршрута;

- Jw (d) = { j е Jw (d): ID(w, j) = id} - множество индексов конкретного ОТС;

- tc - текущий момент времени (момент, на который составляется прогноз);

- vj (t) - средняя скорость j-го ОТС в момент времени t (рассчитывается как средняя скорость за последние 30 минут);

- T0w(sm)(d,t) - нормативное время прохождения

сегмента w дорожной сети, рассчитанное по расписанию движения ОТС конкретного маршрута m и конкретного типа s;

- T>ws)(d, t) - среднее нормативное время прохождения сегмента w дорожной сети, рассчитанное по расписанию движения ОТС конкретного типа s. Определяется по формуле:

T«(d,t) = üb X Wd,t),

\Ms | meM*

где |Msw| - мощность множества;

- Tw(sm)(d,t), TS(s) (d,t) - среднее (статистическое)

время прохождения сегмента w дорожной сети ОТС (конкретного маршрута, или конкретного типа, или произвольного ТС) в определённый день d и определённое время t. Определяются по формулам:

1

w

TS(s,m)

(d t ) =

X ш(d-d)

dey(d)

X w(t- tj) Tj (t) X X v(d- d)(d)

dey(rf)

X w(t-tj)

jeJ'„m (d)

d,t ) =

X v(d-d)

dey(rf)

X w(t- tj) Tj (t)

x X v(d-d)( ) .

«Md) v ' X w(t-tj)

je Jw(d)

Здесь ю (?) - весовая функция по времени со свойствами: симметричная, положительная, невоз-растающая по мере роста модуля аргумента, ограниченная по значению и носителю. Играет роль временного «окна». Например, можно задать в виде:

®(t ) =

1 --

t

А_

0,

t < А

I I ma

11| >А„

Функция V (?) - это весовая функция по дням с необходимыми свойствами: симметричная, положительная, невозрастающая по мере роста модуля аргумента. Примеры: V (?) = 1; V (?) = ехр (-а| ?|). В первом случае на результат собственно конкретный день не влияет, влияет только типодень.

Положение произвольного объекта на транспортной сети задаётся парой (сегмент, относительное положение в сегменте) ^,Д), где А е [0,1].

Постановка задачи

Пусть в конкретный момент 1С конкретное 7-ое ОТС находится в положении (и0, Д0). Необходимо определить время, через которое оно будет находиться в заданном положении (на остановке) (ик, Дк).

Считаем, что маршрут между двумя положениями (и0, Д0) и (ик, Дк) включает в себя следующие сегменты из множества Шв (И0, д т (И0, ]

(и0,Д0) ® и1 ® и2 ®... ®

® ик_2 ® ик-1 ®(ик ,Дк),

при этом следующие положения считаются равными (Ик, 1) = (иш,0).

Для представления формальной записи окончательного выражения используем ещё два обозначения:

2,Дк 2)(*, , ?), 1 (1)

TDL, j)( d, tc, t)° Twi )r(wi1,1)( d, tc, t),

первое из которых обозначает прогнозное время прохождения интервала транспортной сети (шк1,Дк1) ®... ® (ик2,Дк2) конкретным ОТС с Ю(и0,]). Прогноз рассчитывается в момент времени ?С в предположении, что ОТС попадёт в положение (ик1, Ди) в момент времени ?. Вторая величина есть прогнозное время прохождения конкретного сегмента ик1 транспортной сети конкретным ОТС с Ю(и^]). Параметры 1С и ?имеют то же значение, что и выше.

Нас интересует прогнозное время прихода ОТС Ю(и0,]) на остановку (ик, Дк), рассчитываемое на момент ?С и обозначаемое далее:

).Д0)®(ик ,Дк) (л г И 2Ю(и,]) \и, 1с , 1с) .

Справедливы следующие рекуррентные соотношения, связывающие прогнозные времена «вхождения в сегменты» для ОТС:

7<w0,A0 )®( wK ,AK) t ri f \ — ji w

TID(w,j) \U, Lc)~ TID

т(и&А)®(и;.») / л г \ _

1ю(ш0, у) \и. 1с)~

_ л. «с. -с)+

г-1

+У ^пГ0)®{ и1 (-. - + Т^0)®1 и .0) (-)).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Щ и», у) I ' с' с Ю^у) \ > С/

к _1

Используя обозначение для прогнозируемого времени прохождения сегмента. получаем:

т^ио.До)®(

1Ш(шо,у) . 1с> _

_ ТЩИ°^®(',0)(л.-с.«с)+ (2)

г-1

+У ТЮ( , (ё. Г + тЩУ^ .0) (л.«)).

Щ Иб.уН ' с' с Ю^.У) V ' с)

к_1

Окончательно искомое время прихода заданного ОТС на остановку имеет вид:

т^чА)®(икЛк) С,/ , \ _

1ID(wо,у) . «с )_

_ ТЮи;0^®(ик .0)( * ^)+ (3)

+ ^0)®^.Ак) ( ё. ^ « + .0) ( 6. 1с )) .

Предполагая монотонность движения (движение без ускорения) на каждом из сегментов и/или их частей. выражения (2) и (3) (в части первого и последнего слагаемых) преобразуются к виду:

Т- и'о,Aо)®("Ь0) ¡А г \ _

ТЮ(и0.у) . «с)~

_(!-Ао) ТЮ( "о. у) (4 с. -с) + (4)

г-1

+У ТЮ. , (й, - . Г + тЩу".0) (л. -)).

Щ "о.у^ ' с' с Ю( Ш".у) V ' с>]

к _1

т( "оА)®("к .Ак) (л г \ _

Ю(и0,у) \и^с)~

_ тЩо,;А;у5®(и'к '0) (4 <с)+ (5)

+ А кТИ(у)( ^. -с . -с + Т^ * .0)( *. -с )) .

Как видно из приведённых выражений. их основными составляющими являются слагаемые. характеризующие время прохождения отдельных сегментов ти ( )

Ю(ио.у) V") ■

Частный случаи (однородная по времени модель)

Если допустить независимость прогнозируемого времени прохождения сегмента (что в общем случае неверно) от момента «вхождения» в этот сегмент (для обозначения такой модели будем использовать понятие «однородная по времени»). то есть допустить равенство

ио.у) ( d. с . -с ) _ ТЮ( ио.у) ( л. -с . -с + 0 " - > 0. (6)

тогда выражения (4) - (5) преобразуются в простую взвешенную сумму прогнозных величин по сегментам (без рекурсивной зависимости по задержкам вхождения):

4 -с)_ У А кТ^. у)( d. -с). (7)

к _0

где А0 _ 1 - А0. Ак _ Дк. Ак _ 1. к _ 1. к-1.

Модель (4) - (5) в отличие от (7) будем называть «неоднородной по времени».

Таким образом. основной задачей при прогнозировании времени прибытия (4) - (5) или (7) с использованием предложенной модели является оценка времени прохождения конкретного сегмента ик конкретным ОТС Ю (ио. у) в конкретное время

тю{%у)(^ -с. О. - ^ -с. (8)

то есть построение следующей оценки

-с. О. -^ -с. (9)

2. Оценка времени прохождения ОТС

конкретного сегмента. Модель адаптивной композиции элементарных прогнозов

Конструируемая оценка (9) должна учитывать следующие специфики величины (8). Во-первых. эта величина характеризует время прохождения сегмента ик совершенно конкретным транспортным средством с идентификатором Ю (ио. у) . При этом на том же сегменте может выполняться движение других транспортных средств. в частности:

- ОТС того же маршрута 5(и0.у). т(и0.у).

- ОТС того же типа 5(и0.у).

- ОТС других типов и другие ТС. то есть все ТС из множества УХ..). причём произвольные ТС (в том числе индивидуальные ТС) для упрощения могут рассматриваться как ТС некоторого специального типа - маршрутными номерами в этом случае могут являться их регистрационные номера.

Замена прогнозного времени для конкретного ОТС с идентификатором Ю(w".j) на величину прогнозного времени другого ОТС того же типа или ТС другого типа сопровождается. с одной стороны. потенциальным увеличением используемых в построении оценки (9) числа ТС и. с другой стороны. игнорированием в конструируемой оценке специфики движения. присутствующей у конкретного ОТС. конкретного маршрута и т. д. Ниже даны некоторые комментарии. отражающие такую специфику.

1) Замена прогнозного времени для конкретного ОТС с идентификатором Ю(ио.у) на прогнозное время произвольного ОТС конкретного маршрута 5 (и. у). т (и. у) игнорирует в конструируемой оценке (9) специфику конкретного ОТС. Поскольку различными ОТС управляют различные водители и сами ОТС могут быть сконструированы на различных платформах (например. автобусы разных производителей). их движение происходит по-разному. Фактически это выражается в различиях в скорости движения различных ОТС одного маршрута. Соответствующее изменение может быть модельно описано следующим образом:

Щч,А , ') =

= а®(и0,у){ М)• Т

(и0.Лш( иw)

л , '),

(10)

где аЩ (ё, ')е Я + - некоторый коэффициент, учитывающий специфику движения конкретного ОТС (специфику конкретного ОТС и водителя) по сравнению с ОТС того же маршрута, а ^^ - среднее

время прохождения конкретного сегмента ОТС конкретного маршрута. Выражение (10) дополнительно показывает, что различия в этих величинах не зависят от сегмента, а зависят только от идентификатора ОТС.

2) Замена прогнозного времени для ОТС конкретного маршрута 5(и,]), т(и,I) на прогнозное время произвольного ОТС конкретного типа 5(и,I) игнорирует в конструируемой оценке (9) специфику конкретного маршрута. Такой спецификой для конкретного сегмента может являться:

- наличие дополнительных остановок, приводящих к дополнительной задержке по времени на конкретном сегменте сети (пример: автобусные маршруты «обычный» и «скорый», где у второго исключён ряд остановок первого);

- различия в нагрузке на маршрут (его полезности), выражающиеся в различном числе пассажиров на остановках, осуществляющих посадку на ОТС соответствующих маршрутов, также приводят к дополнительной задержке по времени на конкретном сегменте сети.

Вышеназванные различия могут быть отражены в математической модели следующим образом:

Л ё, 'с , ' ) =

Т"

^ИО.-ЛЧИО.-/) ^ "с

= Ьи ,,( ,(ш( ё), ')Ти л( ё,Л,

(11)

ЩЩ,I) 5

где Ь<)Ы„ () (у(ё), 0 - коэффициент, мультипли-

т(щ,1 )/ 5(и&.1)

кативно учитывающий специфику движения ОТС конкретного маршрута по сравнению с ОТС конкретного типа, а Т"" )(...) - среднее время прохождения

конкретного сегмента ОТС конкретного типа.

3) Величина Т"(ё,'с,') определяет прогнозное время прохождения конкретного сегмента и ОТС типа 5 в момент времени ' дня ё при условии, что прогноз вычисляется в момент времени £> Очевидно, построение такой прогнозной величины может производиться с использованием различных моделей и различной информации. Перечислим вначале состав информации, которая (неочевидным образом и в неочевидной степени) оказывает влияние на значение Т"(ё, ^,'). Для удобства введём индекс «последнего» по порядку ОТС на сегменте и конкретного типа 5:

к ° ки (ё,') = а^шах{I: Iе ^(ё) л ^ < . (12)

В частности, в момент построения прогноза индекс к"(ё, 'с) совпадает с индексом последнего ОТС того же типа 5, прошедшим сегмент и.

Т_ ,((,) ° Г ,(£)/А _ ^ - «наивная»

КГ(ё,'с Г с <(ё.'с Г с КГ(ё,'с )

Тогда состав искомой информации может быть определён следующим образом:

1) тГё) ° - ) + Т<Шс)('-)) - диапазон

времени, прошедший с момента прохождения сегмента последним ОТС того же типа (на момент построения прогноза);

2) ' - ^ - требуемый горизонт прогноза;

3) Тк,(<] г) ('с) - время нахождения на сегменте последнего (на момент построения прогноза) ОТС;

4)

оценка времени прохождения сегмента ОТС с порядковым номером к^(ё, ^), совпадающая с реальным временем нахождения указанного ОТС на сегменте в случае, если ОТС уже оказалось на другом сегменте, и элементарным образом экстраполирующая время прохождения сегмента в противном случае;

5) Т0м (ё,') - нормативное время прохождения сегмента и ОТС того же типа 5;

6) Т*5) (ё,') - статистическое время прохождения сегмента и ОТС того же типа 5;

7) Т£)(ё,') =| и|/шш(у,('), уМах(з,ш)(ё,')) -

предположительное время прохождения сегмента с учётом средней скорости конкретного ОТС;

8) {('- ^, Т('с), АI('с))}.еГ(ё) - множество прецедентов, отражающих моменты и время прохождения сегмента различными ОТС к моменту прогноза ^;

9) у( ё,')е [0,1] - условное значение, интегрально характеризующее на момент прогноза ' сложность вождения при данном освещении и при данных погодных условиях;

10) р* (ё,')е [0,1] - условное значение, характеризующее плотность потока транспортных средств на участке сети в конкретное время;

11) 5 - тип ОТС.

Указанные величины несут различную содержательную информацию, влияющую на способ её использования, а именно: величины 3-8 отражают отдельные или статистически агрегированные «прецеденты» временных затрат. Очевидно, что указанные величины могут быть использованы (вместе или отдельно, напрямую или косвенно) при построении искомой оценки как некоторые реализации искомой оценки (неискажённые или искажённые заранее определённым образом).

Величины 1- 2 и 9 -11 непосредственно оказывают влияние на искомую величину. Однако ни одна из этих величин не может быть рассмотрена как прецедент временных затрат. Как следствие, указанные величины можно рассматривать как управляющие, характеризующие алгоритм композиции и/или его параметры. Учитывая сделанные замечания, величину Т5и (ё,'с,')

целесообразно рассматривать в виде некоторой функции следующего вида:

Т' () =

= /

в,т' (6, с ),г-гс, у( 6,л), р' (6,л)

) ( Т< (6,, )(Лс ) , ^ (6,, )('с ) . ТЫ 6 ) . ^)( 6 ) . Ш 6 Л) ^ - ^ , Т (лс ) , А ^ (лс ))} ^ (6) }

(13)

Вид этой функции оказывается, естественно, неизвестным. Выбор конкретного вида этой функции -это вопрос выбора соответствующей математической модели с последующим решением вопросов идентификации и верификации. В данной работе предлага-

ется следующий её вид, удовлетворяющий формальному соотношению (13) и основанный на композиции алгоритмов, выполняющих элементарные прогнозы для каждого типа ОТС. Схематический вид модели выглядит следующим образом (рис. 1):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ТкЖ'а)(1о), ТкШфо), Т^т, ТадМО.

в=0

ЛЬ (А

Алгоритм О

Алгоритм К-1

тГШсЛ

¡щК-1,

Алгоритм О

Алгоритм К-1

гжО г л

т^ШсЛ

Алгоритм композиции элементарных прогнозов

О

Рис. 1. Схематический вид модели адаптивной композиции элементарных прогнозов

Параметры -1 (^(А'о),

I Ркт

Представленная на рисунке модель определена не полностью. В частности, нет уточнений о том, как именно реализуются алгоритмы элементарных прогнозов, рассчитывающие оценки средних Т',к (6, лс, л), и не определена функция агрегации

этих величин. Ниже представлен их вид.

Алгоритмы элементарных прогнозов реализуют отображения множества прецедентов

{(л- 0, Т (лс), АJ (лс))} ,е/г(6л) в различн^1е оценки

средних Тзщк (6, лс, л). В качестве подобных отображений в работе предлагается использовать следующие:

I «к(л-О)Т(Лс)

Л JeЛ' (6,1с)

Т'к (6,л, л) = ^ _ , ч

5 (,с,) I «к(л-О)

JeЛ'(6,'с )

I

:( 6 л )= (6 ,'с)

«к(л-^ )^

(14)

V

к = О,К-1.

I «к (л - ^)

jeЛ' (6 А)

Предлагаемые оценки относятся к классу ядерных, при этом различия в алгоритмах заключаются в используемых ядрах ш(л). Дополнительное требование, предъявляемое к используемому набору ядер л), - это их линейная независимость на рассматриваемой области (прогнозном горизонте). Для определённости предлагается использовать следующий набор из четырёх ядер:

- прямоугольное ядро (к = О):

шо (л) =

1

А„

л <А„

[О, И > Ашах; - треугольное ядро (к=1)

л|

Ш (л ) =

1—

А„

О,

л <А„

л > А_

- экспоненциальное ядро (к=2)

ш2 (л ) =

О,

л| <А ш |л| > А_

- рациональное ядро (к=3) 1

шз (л) =

1 + а-

л

А„

О,

л <А„

л > А„

Область определения финитных ядер должна совпадать. Дополнительно следует заметить, что в целом предлагаемая модель допускает использование произвольного набора алгоритмов оценки среднего, не обязательно совпадающих с выбранными.

Алгоритм композиции элементарных прогнозов реализует отображение набора оценок средних

{Т''к (6, лс, л, и величин Т'(6,с)(лс), ^(лс),

к=О,К-1

а

А

Щ ¿А , Твд( 4), Т:)( ¿А в итоговую оценку

Т: (, t) с учётом значений управляющих параметров 5,1^(4,'с), t- 'с,у(4,'),рw(d,t) . Представляется целесообразным, чтобы этот алгоритм удовлетворял двум основным требованиям:

- был адаптивен по отношению к изменениям дорожной ситуации,

- был адаптивен по отношению к значению параметров.

Первое требование подразумевает, что алгоритм выполняет композиции временных оценок по-разному, в зависимости от динамики транспортного потока (изменения скорости движения ОТС). В данном случае, поскольку вся информация о динамике содержится в прецедентах {('-^, Т(¿с('с))}еГ ^), в качестве

дополнительного параметра, влияющего на алгоритм композиции оценок, можно использовать следующую величину:

X ®1 ('- 0) Т ('е)А-' (Гс)

Л (4,0 =

JеJw (4 Л)

X ®1 ('- о)

JеJw (4 Л)

X (2Шо (г- 0 )-Ш1 ('- ^)) Т (Гс )А-1 ( О

(15)

^Г (4 Л)

X (2®о ('- О)-^1 О))

JеJw (4 Л)

Уменьшаемое в этом выражении соответствует треугольному ядру, спадающему по мере «удаления» по временной шкале от момента прогноза, а вычитаемое - наоборот возрастающему. Результирующая разность оказывается положительной, если время прохождения сегмента для транспорта имеет динамику к увеличению, отрицательной - если имеет динамику к уменьшению. Абсолютная величина характеризует выраженность этой динамики: при нахожде-

Т: (4 л,' )=

нии разности вблизи нуля изменение скорости на участке (динамику) можно считать несущественным.

Второе требование подразумевает, что алгоритм композиции выполняет агрегацию временных оценок по-разному, в зависимости от значения параметров. В частности:

- в зависимости от искомого типа ОТС 5/

- в зависимости от «удалённости» по времени между моментами получения информации о движении

(х: (4, 'с)) и моментом, на который прогноз вычисляется ('- 'с) (например, при малой «удалённости»

между этими моментами факт остановки предшествующего рельсового ОТС приводит к остановкам последующих),

- в зависимости от сложности вождения, характеризуемой величиной у(ё,И);

- в зависимости от плотности потока транспортных средств на участке сети, характеризуемой величиной р:(с1,() (например, высокая плотность транспортного потока приводит практически к полному совпадению скоростей движения ОТС различных типов).

Подобная адаптивность может быть достигнута путём разбиения области определения параметров алгоритма агрегации на подобласти, в каждой из которых использу-агрегация средних {Т5:-к (4,'с )}5

ется

1 5=0,| -1,

к=0,К -1

и величин

Т,

(4 ,'с)

К ) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ткГ(4л)('с), , ты, ты

в итоговую оценку Т: (с1 ,'с, ') с использованием заранее

заданного аналитического выражения, определённого с точностью до некоторого набора параметров (этого выражения), которые и определяются для указанной подобласти параметров алгоритма в некотором смысле оптимальным образом.

Предлагается в качестве агрегирующей функции использовать следующее выражение:

X X - Ск (4,'))Гк (4,0 + а^ ) + а'25Тк: ('с) + а^Д 4,')+ а*.^ ( 4,')+ а^ (4,') (16)

2—П _ с: 5 с 5 с V, /

К-1 _

XX X ак «(' - Г" (4,')) +

а* + а* + а* + а* + а*

к=0

Параметры этого выражения

{кТ|| Г* * * *

аГ5 } и |а15 , а*5 , а*5 , а45 , а*5 }

определяются отдельно для каждого типа э ОТС и подобластей параметров

х: (4, 'с),' - 'с, у( 4,'), р: (4,') ,л( 4,')

алгоритма агрегации.

Определение областей для пяти параметров х: (4, ¡с),' - 'с, у (), р : () () осуществляется автоматически в процессе конструирования иерархической регрессионной конструкции, подобной дереву регрессии, а именно: для каждого из параметров (используем далее для указанных пяти параметров обо-

значение р) заранее определяется интервал его допустимых значений [ р™11, р"™] . Комментарии относительно значения границ интервалов для параметров приведены в табл. 1.

Далее для области

[ рш1п, рШ" ] х [ рш1п, Р1шах ] х [ рШ1п, рШ3* ] х

X[РзШ1П, РзШ3Х ]х[рШ", РШ" ],

соответствующей единственной терминальной вершине дерева на первом шаге, производится оценка параметров агрегирующей функции с использованием подхода, описанного ниже. Далее для отобранных

на текущем шаге терминальных вершин производится их разбиение на 25 новые терминальные вершины путём деления области значений каждого из параметров на две, например:

[ ¿г, pF™ ] ®

max _ rimm

p0 p0

pt, pmin+-

2

max _ mm

min . r0 ±0 _^max

FT + P0 - P0 , P'

2

Отличием от известного дерева регрессии в данном случае является то, что значения параметров, по которым производится иерархическое разбиение, не используются в расчёте функции регрессии (16).

Таблица 1. Значение границ интервалов параметров

Параметр Обозначение Левая граница Правая граница

< (d, <0) P0 0 Определяется по данным

t - <0 Pi 0 Определяется заданным прогнозным горизонтом

g( d,t) P2 0 1

P^ (d,t) P3 0 1

h( d,t) P4 Определяется по данным Определяется по данным

0-ой уровень

2-ой уровень

Рис. 2. Пример иерархического построения адаптивной композиции для двух управляющих параметров

3. Оценка параметров элементарных алгоритмов прогноза

Для реализации элементарных прогнозных функций необходимо оценить их параметры: Amax (область определения ядра) и a (для экспоненциального и рационального ядер).

Параметр Amax определяется по минимуму сред-неквадратической ошибки элементарной прогнозной функции с треугольным ядром. В качестве обучающей выборки использовалась информация о прохождении всех сегментов сети всеми ОТС за день. На рис. 3 показан график зависимости СКО от значения параметра A max.

Нужно учесть, что при малых значениях Amax множество прецедентов для составления элементарных прогнозов будет пустым. Для реализации элементарных функций было выбрано значение параметра A max = 2700 (секунд).

31,6 т ско 31

Область определения ядра, с

Рис. 3. Зависимость СКО от области определения ядра Выбор значения параметра а для экспоненциальной и рациональной функции проводился по минимуму СКО при фиксированном параметре Дшах . Зависимость СКО от а для экспоненциальной функции приведено в табл. 2, для рациональной - в табл. 3.

Таблица 2. Зависимость СКО для экспоненциальной функции

a 50 25 12,5 6,25 3,125

СКО 33,238 32,33 31,08 29,95 29,497

a 1,57 2,35 2,73 2,55 2,63

СКО 29,54 29,483 29,482 29,4802 29,4804

Таблица 3. Зависимость СКО для рациональной функции

a 50 25 37,5 31,25

СКО 29.5087 29,509 29,50832 29,50834

a 34,39 35,9

СКО 29,5083 29,5083

Для экспоненциальной функции a = 2,55 , для рациональной - a = 35,9

выбрано

4. Оценка параметров модели адаптивной композиции

Для определения параметров адаптивной композиции для каждой терминальной вершины конструируемой иерархической регрессии необходимо сформировать обучающую выборку. Ниже представлен предложенный способ её формирования.

Зафиксируем сегмент ш, тип ТС 5 и типодень С. Для этих величин по обучающим данным (дни с выборками) для каждой текущей терминальной вершины иерархической регрессии формируем выборки следующим образом.

ЦИКЛ по С еу( С) ЦИКЛ по номерам ОТС 1 е ^ (С) { = ^; Т = Т (Д = 1); 1С = Ю (ш, 1); ЦИКЛ по временам прогноза с = С - пДг (Дг = 30с, п = 1,2...)

Определяем местоположение ОТС с С в это время. Формируем набор параметров прогнозирования для данного ОТС с моментом построения прогноза Лс и моментом прогноза л* (° t) для сегмента ш:

т:(С, с), t- с,у(Сл),рш(Сл),п().

Формируем набор прецедентов

{('- 'I, Т ('с ) ,А . ('с ))}„л)

элементарные прогнозы {Т5и-к (ё,', 'с)}

и считаем по ним

5=0,| 5и| -1, к=0,К -1

Результаты расчётов элементарных прогнозов

^ ( ё, ', 'с )}

]з=0,| 5и| -1, к=0,К -1

величины

Тки (ё,с) ('0 ) ,Тки (ё,'с) ('с ) , Т% ( ё,') , ■Ц) ( ё,') , Ч.) ( ё,0

и требуемый результат Т добавляется в список терминальной вершины.

КОНЕЦ_ЦИКЛА КОНЕЦ_ЦИКЛА КОНЕЦ_ЦИКЛА

По завершении формирования обучающих выборок для каждой терминальной вершины производится оценка параметров адаптивной композиции по методу минимума СКО.

Если размер обучающей выборки терминальной вершины недостаточен для оценки параметров композиции, используются оценки, полученные на родительской вершине.

5. Экспериментальные исследования

Экспериментальные исследования разработанного алгоритма проводились на улично-дорожной сети г. Самары. Дорожная сеть состоит из 3387 сегментов, трамвайная сеть - из 409 сегментов. Количество ОТС, подключённых к системе мониторинга, - более 1500, новые координаты положения ОТС поступают с усреднённой периодичностью в 30 секунд. Подробнее система мониторинга движения описана в работе [5].

Таблица 4. Сравнение алгоритмов

При составлении прогнозов проводилась дополнительная фильтрация данных, попадающих в список

прецедентов {(' - 'I, Т ('с ) , АI ('с ))} ег{ё) , а именно:

не рассматривались ТС, находящиеся на конечных точках маршрута либо не изменявшие своего положения в течение долгого промежутка времени (больше 5 минут). Для упрощения нахождения решения специфики движения конкретного ТС и ТС определённого маршрута не учитывались, т.е. предполагалось, что аЩ (ё,') = 1 и Ь^ (у(ё),') = 1. Кроме того,

не проводилась агрегация прогнозов от ТС разных типов.

Проводилось сравнение предложенного алгоритма адаптивной композиции (с элементарными прогнозами Т™л (ё,'с,') для каждого типа ядра, прогнозом по

статистике Т*5)( ё,') и прогнозом по средней скорости движения Т^) (ё,')) с моделью линейной регрессии, представленной в работе [6]. Сравнение проводилось по критериям СКО, средней абсолютной ошибки и средней относительной ошибки.

Результаты сравнения алгоритмов на обучающей и контрольной выборках для ТС трамвайных маршрутов приведены в таблице 4. Размер выборок составлял порядка 2500000 записей. Стоит отметить, что контрольная выборка содержала большее число прогнозов в статистике по сравнению с обучающей выборкой, что снизило ошибку прогноза по статистическим данным.

для ОТС трамвайных маршрутов

Алгоритм прогноза СКО Средняя абсолютная ошибка Средняя относительная ошибка

Обучающая Контрольная Обучающая Контрольная Обучающая Контрольная

Прямоугольное ядро 28,492 28,990 17,526 17,420 0,342 0,327

Треугольное ядро 28,605 28,949 17,650 17,582 0,346 0,330

Экспоненциальное ядро 28,672 28,995 17,704 17,643 0,347 0,331

Рациональное ядро 29,971 30,164 18,530 18,424 0,361 0,343

Статистика 40,060 32,514 21,884 18,708 0,392 0,343

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Скорость 37,812 39,003 25,197 25,505 0,380 0,370

Регрессия 25,955 28,552 16,111 16,767 0,315 0,314

Композиция 23,361 27,963 14,991 16,350 0,287 0,307

Графики зависимости СКО, средней абсолютной ошибки и средней относительной ошибки от горизонта прогноза на обучающей выборке для ОТС трамвайных маршрутов показаны на рис. 4, 5 и 6 соответственно.

По графикам видно, что элементарные прогнозы дают очень близкую ошибку прогнозирования для разных типов ядер. Предложенная модель с компози-

цией различных типов прогнозов даёт лучшие результаты по каждому критерию.

На рис. 7, 8 и 9 показаны графики зависимости СКО, средней абсолютной ошибки и средней относительной ошибки от горизонта прогноза на контрольной выборке для ТС трамвайных маршрутов.

Прямоугольное ядро .......... Экспоненциальное ядро .----Треугольное ядро ------Рациональное ядро ----Статистика -------Регрессия ------Скорость -Композиция / —л—/Г

_ !/ \7 Л

_^—

Время, мин

ско

450 400 350 300 250 200 150 100 50 О

О 5 10 15 20 25 30

Рис. 4. Зависимость СКО от горизонта прогноза на обучающей выборке

Средняя абсолютная ошибка

400350300250200 150 100 50 О

-Прямоугольное ядро ----Треугольное ядро ---Статистика -------Регрессия ------Скорость -Композиция

1

1

л/Ч га .*; А//

1 Л

--<•> //\/—Ги\?

^ /\?1

'' "..... Время, мин

О 5 10 15 20 25 30

Рис. 5. Зависимость средней абсолютной ошибки от горизонта прогноза на обучающей выборке

Средняя относительная ошибка

• Прямоугольное ядро

■ Экспоненциальное ядро

----Треугольное ядро

------Рациональное ядро

---Статистика

-------Регрессия

------Скорость

■ Композиция

О 5 10 15 20 25 30

Рис. 6. Зависимость средней относительной ошибки от горизонта прогноза на обучающей выборке

На контрольной выборке разработанная модель для некоторых прогнозных горизонтов проигрывает элементарным прогнозам, что, судя по поведению графиков, связано с достаточно неудачным статистическим прогнозом по историческим данным (предыдущим дням).

Результаты сравнения алгоритмов на обучающей и контрольной выборках для ТС автобусных маршрутов приведены в табл. 5. Размер выборок составлял порядка 8 млн. записей.

Графики зависимости СКО, средней абсолютной ошибки и средней относительной ошибки от горизонта прогноза на обучающей выборке для ТС автобусных маршрутов показаны на рис. 10, 11 и 12 соответственно.

Элементарные прогнозы для ТС автобусных маршрутов дают большую ошибку по сравнению с прогнозами для ТС трамвайных маршрутов. Это объясняется сильной изменчивостью транспортной ситуации на дорожных сегментах в течение дня, в то время как трамвайные сегменты часто обособлены и не так сильно зависят от транспортной ситуации в городе.

ТСКО~

Прямоугольное ядро Экспоненциальное ядро

----Треугольное ядро

------Рациональное ядро

-¿Г

---Статистика -------Регрессия

------Скорость Композиция Время, мин

О 5 10 15 20 25 30

Рис. 7. Зависимость СКО от горизонта прогноза на контрольной выборке

Средняя абсолютная ошибка

• Прямоугольное ядро Экспоненциальное ядро

0 5 10 15 20 25 30

Рис. 8. Зависимость средней абсолютной ошибки от горизонта прогноза на контрольной выборке

Средняя относительная ошибка_

----Треугольное ядро

------Рациональное ядро

---Статистика

-------Регрессия

------Скорость

■ Композиция

Время, мин

0 5 10 15 20 25 30

Рис. 9. Зависимость средней относительной ошибки от горизонта прогноза на контрольной выборке

На рис. 13, 14 и 15 показаны графики зависимости СКО, средней абсолютной ошибки и средней относительной ошибки от горизонта прогноза на контрольной выборке для ТС автобусных маршрутов.

На контрольной выборке разработанная модель также показала лучшие результаты среди рассмотренных алгоритмов прогнозирования.

Выводы

В работе предложен новый оригинальный алгоритм построения прогноза времени прибытия общественных транспортных средств на остановки общественного транспорта, основанный на модели адаптивной композиции элементарных алгоритмов прогнозирования, каждый из которых характеризуется малым числом настраиваемых параметров.

Адаптивность подразумевает зависимость параметров конструируемой композиции от ряда управляющих параметров модели, к которым относятся следующие актуальные (определённые на текущий

момент) факторы: погодные условия, плотность транспортного потока, динамика движения, горизонт прогноза и др. Адаптивность достигается вве-

Таблица 5. Сравнение алгоритм.

дением иерархического разбиения области значений управляющих параметров, применяемого в дереве регрессии.

ОТС для автобусных маршрутов

СКО Средняя абсолютная ошибка Средняя относительная ошибка

Обучающая Контрольная Обучающая Контрольная Обучающая Контрольная

Прямоугольное ядро 27,1347 25,1064 12,7607 12,4590 0,4626 0,4636

Треугольное ядро 26,5599 24,9221 12,7034 12,5126 0,4646 0,4670

Экспоненциальное ядро 26,4379 24,9060 12,6992 12,5315 0,4652 0,4677

Рациональное ядро 26,7537 25,5068 13,0073 12,9006 0,4766 0,4797

Статистика 28,1978 26,1688 13,3373 13,3127 0,4906 0,5054

Скорость 32,7356 31,8209 17,1002 17,0614 0,5848 0,6004

Регрессия 22,1130 24,2553 11,1114 12,0814 0,4243 0,4604

Композиция 19,0246 23,2880 10,2108 11,9968 0,3963 0,4620

• Прямоугольное ядро Экспоненциальное ядро

■ Треугольное яд

■ Рациональное.

■ Статистика Регрессия Скорость

■ Композиция

Время, мин

О 5 10 15 20 25 30

Рис. 10. Зависимость СКО от горизонта прогноза на обучающей выборке

Средняя абсолютная ошибка 10001 900800700600-

• Прямоугольное ядро

■ Экспоненциальное ядро

----Треугольное ядро

------Рациональное ядро

---Статистика

-------Регрессия

------Скорость

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

■ Композиция

О 5 10 15 20 25 30

Рис. 11. Зависимость средней абсолютной ошибки от горизонта прогноза на обучающей выборке

Средняя относительная ошибка_

■ Прямоугольное ядро

■ Экспоненциальное ядро

■ Треугольное ядро Рациональное ядро

---Статистика----Скорость

-----Регрессия " .....

- Композиция ¡

Время, мин

О 5 10 15 20 25 30

Рис. 12. Зависимость средней относительной ошибки от горизонта прогноза на обучающей выборке

Прямоугольное ядро

.......... Экспоненциальное ядро

----Треугольное ядро

------Рациональное ядро

---Статистика ,-'

-------Регрессия

------ Скорость

-Композиция

/-----

Время, мин

О 5 10 15 20 25 30

Рис. 13. Зависимость СКО от горизонта прогноза на контрольной выборке

Средняя абсолютная ошибка

О 5 10 15 20 25 30

Рис. 14. Зависимость средней абсолютной ошибки от горизонта прогноза на контрольной выборке

Средняя относительная ошибка

0,45--

0,400,35 0,30 0,25 0,20 0,15

О

\ Г---Статистика----Скорость { ■■■ Регрессия Композиция -

Ч

, \ ,__________ _Г4"'

». --------- йг ■ÍS..

Xi .T^i.I^^11^1 1 ■ ■ _

-Прямоугольное ядро ---Треугольное ядро ----Рациональное ядро

Время, мин

О 5 10 15 20 25 30

Рис. 15. Зависимость средней относительной ошибки от горизонта прогноза на контрольной выборке

В исследованиях, проведённых на данных движения городского пассажирского транспорта в г. Самаре, предложенный алгоритм прогнозирования показал лучший результат по сравнению с элементарными прогнозами и разработанной ранее моделью линейной регрессии.

Учитывая, что предложенный алгоритм адаптивной композиции обладает свойствами, которые совместно не присущи ни одному из представленных в литературе, а именно:

- позволяет включать в композицию алгоритмы прогнозирования достаточно произвольного типа,

- обладает адаптивностью по отношению к изменению дорожной ситуации (т.е. учитывает факторы, оказывающие непосредственное влияние на движение - плотность транспортного потока, динамику движения и т. п.),

- обладает адаптивностью по отношению к актуальным (определённым на текущий момент) факторам, прямым и/или косвенным образом влияющим на движение и/или результат прогноза: погодным условиям и освещённости, требуемому горизонту прогноза и другим,

- предлагаемый алгоритм и использованная в нём модель адаптивной композиции прогнозов представляются наиболее современными и наилучшим образом подходящими для решения рассмотренной задачи.

Дальнейшие направления работ включают в себя исследования, связанные с выбором наилучшего множества элементарных алгоритмов для конструируемой композиции, а также исследования, связанные с анализом и прогнозированием состояния (параметров) транспортных потоков.

Благодарности

Работа выполнена при частичной финансовой поддержке:

- грантов РФФИ, проекты № 13-07-12103-офи-м, 13-01-12080-офи-м, 12-07-00021 -а;

- программы фундаментальных исследований Президиума РАН «Фундаментальные проблемы информатики и информационных технологий», проект 2.12;

- Министерства образования и науки Российской Федерации (в рамках постановления Правительства Российской Федерации от 09.04.2010 г. № 218: договор № 02.Г36.31.0001 от 12.02.2013).

Литература (References)

1. Hall, R. Handbook of transportation science / Randolph W. Hall. - Dordrecht: Kluwer Academic Publishers, 2003. -737 p.

2. Altinkaya, M. Urban Bus Arrival Time Prediction: A Review of Computational Models / M. Altinkaya, M. Zontul // International Journal of Recent Technology and Engineering (IJRTE). - 2013. - V. 2, Issue 4. - P. 164-169.

3. Hoogendoorn, S.P. State-of-the-art of vehicular traffic flow modeling / S.P. Hoogendoorn, P.H.L. Bovy // Proceedings of the Institution of Mechanical Engineers. Part I: Journal of Systems and Control Engineering. - 2001. - V. 215(4). -P. 283-303.

4. Padmanaban, P. Estimation of Bus Travel Time Incorporating Dwell Time for APTS Applications / R.P.S. Padmanaban, L. Vanajakshi, S.C. Subramanian // IEEE Intelligent Vehicles Symposium. - 2009. - V. 2. - P. 955-959.

5. Агафонов, А.А. Прогнозирование параметров движения городского пассажирского транспорта по данным спутникового мониторинга / А.А. Агафонов, А.В. Сергеев, А.В. Чернов // Компьютерная оптика. - 2012. - Т. 36, № 3.

- С. 453-489. (Agafonov, A.A. Forecasting of the motion parameters of city transport by satellite monitoring data / A.A. Agafonov, A.V. Sergeyev, A.V. Chernov // Computer Optics. - 2012. - V. 36 (3). - P. 453-458.)

6. Agafonov, A. City transport motion parameters forecasting by satellite monitoring data and statistics / A. Agafonov, A. Chernov, A. Sergeyev // PRIA-2013. - 2013. - V. 2. -P. 489-491.

7. Sun, H. Use of Local Linear Regression Model for Short-term Traffic Forecasting / H. Sun, H.X. Liu, H. Xiao, R.R. He, B. Ran // Transportation Research Record. - 2003.

- Issue 1836. - P. 143-150.

8. Vanajakshi, L. Travel time prediction under heterogeneous traffic conditions using global positioning system data from buses / L. Vanajakshi, S.C. Subramanian, R. Sivanandan // IET Intelligent Transport Systems. - 2009. - V. 3. - P. 1-9.

9. Shalaby, A. Prediction Model of Bus Arrival and Departure Times Using AVL and APC Data / A. Shalaby, A. Farhan // Journal of Public Transportation. - 2004. - V. 7(1). - P. 41-63.

10. Chen, M. A dynamic bus-arrival time prediction model based on APC data / M. Chen, X. Liu, J. Xia, S.I. Chien // Computer-Aided Civil and Infrastructure Engineering. -2004. - V. 19(5). - P. 364-376.

11. Chang, G.-L. Predicting intersection queue with neural network models / G.-L. Chang, C.-C. Su // Transportation Research Part C. - 1995. - V. 3(3). - P. 175-191.

12. Jeong, R. Bus arrival time prediction using artificial neural network model / R. Jeong, L.R. Rilett // IEEE Conference on Intelligent Transportation Systems, Proceedings, ITSC. -

2004. - P. 988-983.

13. Bin, Y. Bus arrival time prediction using support vector machines / Y. Bin, Y. Zhongzhen, Y. Baozhen // Journal of Intelligent Transportation Systems: Technology, Planning, and Operations. - 2007. - V. 10, Issue 4. - P. 151-158.

14. Wu, C.-H. Travel-time prediction with support vector regression / C.-H. Wu, J.-M. Ho, D.T. Lee // IEEE Transactions on Intelligent Transportation Systems. - 2004. -V. 5(4). - P. 276-281.

15. van Lint, J.W.C. Accurate freeway travel time prediction with state-space neural networks under missing data / J.W.C. van Lint, S.P. Hoogendoorn, H.J. van Zuylen // Transportation Research Part C: Emerging Technologies. -

2005. - V. 13(5-6). - P. 347-369.

16. Park, T. A bayesian approach for estimating link travel time on urban arterial road network / T. Park, S. Lee // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). - 2004. - V. 3043. - P. 1017-1025.

17. Zheng, W. Short-term freeway traffic flow prediction: Bayesian combined neural network approach / W. Zheng, D.-H. Lee, Q. Shi // Journal of Transportation Engineering.

- 2006. -V. 132(2). - P. 114-121.

18. Yang, J.-S. Travel time prediction using the GPS test vehicle and Kalman filtering techniques / J.-S. Yang // Proceedings of the American Control Conference. - 2005. - V. 3. -P. 2128-2133.

19. Wall, Z. An Algorithm for Predicting the Arrival Time of Mass Transit Vehicles Using Automatic Vehicle Location

Data / Z. Wall, D. J. Dailey // 78th Annual Meeting of the Transportation Research Board, Washington D.C., 1999. 20. Zaki, M. Online Bus Arrival Time Prediction Using Hybrid Neural Network and Kalman filter Techniques /

M. Zaki, I. Ashour, M. Zorkany, B. Hesham // International Journal of Modern Engineering Research. -2013. - V. 3, Issue 4. - P. 2035-2041.

AN ALGORITHM FOR CITY TRANSPORT ARRIVAL TIME ESTIMATION USING ADAPTIVE ELEMENTARY PREDICTIONS COMPOSITION

A.A. Agafonov, V. V. Myasnikov Image Processing Systems Institute, Russian Academy of Sciences, Samara State Aerospace University

Abstract

The problem of precise arrival time of public transport is considered in this paper. There is proposed a new prediction algorithm based on adaptive composition model using elementary prediction. A small number of adaptive parameters characterizes each elementary prediction algorithm. Adaptability means that parameters of the constructed compositions depend on a number of control parameters of the model, which includes the following factors: weather conditions, traffic density, driving dynamics, prediction horizon, etc. Adaptability is achieved by introducing a hierarchical decomposition range of control parameters used in regression tree. We made experimental investigations on real routes of city public transport in Samara to evaluate the prediction accuracy of the proposed algorithm. We also explain the advantages of the proposed solution in comparison with existing ones.

Key words: city public transport, arrival time prediction, arrival time estimation, algorithms composition, hierarchical decomposition, regression tree.

mathematician at JSC

Сведения об авторах

Агафонов Антон Александрович, 1988 года рождения. В 2011 году окончил Самарский государственный аэрокосмический университет (СГАУ). В настоящее время работает стажёром-исследователем в Федеральном государственном бюджетном учреждении науки Институте систем обработки изображений РАН и по совместительству инженером-математиком в ОАО «Самара-Информспутник». Круг научных интересов включает геоинформационные технологии, веб-технологии.

E-mail: ant.agafonov@gmail.com .

Anton Aleksandrovich Agafonov (1988 b.), graduated from Samara State Aerospace University (SSAU) at 2011. At present he is intern-researcher at the Image Processing Systems Institute of the Russian Academy of Sciences, holding a part-time positions of engineer' Samara-Informsputnik". The area of interests includes geoinformatics and web-technologies.

Сведения об авторе Мясников Владислав Валерьевич смотри стр. 296этого номера.

Поступила в редакцию 18марта 2014 г.

Дизайн: Я.Е. Тахтаров. Оформление и верстка: М.А. Вахе, С.В. Смагин и Я.Е. Тахтаров.

Подписано в печать 4.6.2О14 г. Усл. печ. л. 24,26. Отпечатано в типографии ООО «Предприятие «Новая техника». Заказ № 11/2. Тираж 318 экз. Печать офсетная. Формат 62х84 1/8.

i Надоели баннеры? Вы всегда можете отключить рекламу.