Вестник РУДН. Серия: Инженерные исследования
RUDN Journal of Engineering researches
2017 Vol. 18 No 1 97-106
http://journals.rudn.ru/engineering-researches
УДК 62-50, 519-714
DOI 10.22363/2312-8143-2017-18-1-97-106
НЕЙРОСЕТЕВЫЕ ПОДХОДЫ К УПРАВЛЕНИЮ ПОТОКАМИ
ТРАНСПОРТА*
В работе рассматривается задача оптимального управления транспортными потоками. Представлена математическая модель для управления сигналами светофоров на основе теории управляемых сетей в виде системы нелинейных конечномерно-дифференцируемых уравнений. Для представления сети дорог большого размера в модели используются матрицы связей, которые описывают связи между входными и выходными участками подсетей. Управление транспортным потоком достигается за счет изменения активных фаз светофоров. Задачей управления является минимизация разницы между суммарным входным и выходным потоками всех подсетей. В статье представлен нейросетевой подход для корректировки параметров сети дорог.
Ключевые слова: управление транспортными потоками; искусственные нейронные сети
Несмотря на многочисленные попытки, до сих пор не удалось получить качественную математическую модель управления городским движением. Такая модель должна определять функциональную зависимость параметров транспортных потоков от параметров управления. В наши дни транспортные потоки повсеместно регулируются посредством светофоров. Если удастся получить достаточно точную математическую модель потоков транспорта, мы сможем определять оптимальную длительность фаз сигналов светофоров для достижения максимальной пропускной способности узла дорожной сети.
Достаточно точная математическая модель управления дорожным движением, работающая в режиме предсказания, будет отображать оценку оптимальных параметров управления, а также принимать корректные решения в экстренных ситуациях.
Известные математические модели дорожного движения [1—7; 12] учитывают только средние значения потоков, а не точное количество машин на каждом участке дорог в конкретный момент.
* Работа выполнена по гранту РФФИ №16-08-00639-а «Исследование и разработка методов синтеза идентификационного управления транспортными потоками в сетях городских дорог».
Д.Э. Казарян, В.А. Михалев, Е.А. Софронова
Инженерная академия Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
Введение
В работе мы пытаемся получить точное количество машин в каждый момент на каждом участке всей сети дорог. Рассматриваем применение искусственной нейронной сети для определения и уточнения параметров перекрестков. Данная модель значительно отличается от наших предыдущих разработок.
Математическая модель дорожного движения строится на основе теории управляемых сетей [8—11]. Такая модель учитывает сеть и структуру дорог, ее изменение соответственно сигналам светофоров и позволяет рассчитывать состояние потоков в каждый момент времени. В работах [10; 11] мы дополнили модель введением подсетей, из которых собирается полная сеть. Главной сложностью стало определение точных значений пропускных способностей маневров и количественных параметров распределения потоков. В работе [7-8] для определения этих параметров используем искусственную нейронную сеть с учителем (ИНС).
Обзор применения нейросетей для управления транспортными потоками
Искусственные нейросети широко используются в управлении транспортными потоками в дорожной сети. Рассмотрим некоторые из последних работ в этой области.
Клеточные нейронные сети для задачи управления светофорами на отдельных перекрестках, т.е. без учета взаимовлияния режимов работы светофоров на соседних участках сети рассмотрены в [14]. В этой работе минимизируется суммарная задержка автомобилей на перекрестке. Для целей моделирования задержка потока, определяемая фазой работы светофоров, рассматривается как квадратичная функция от длительности зеленого света в этой фазе. На длительность зеленого света накладываются как линейные, так и нелинейные ограничения типа равенств.
В статье [15] приводится сравнение классических ИНС и нечетких контроллеров в качестве систем управления светофорами. Авторы предлагают использовать нейронную сеть с одним скрытым слоем, на вход которой подается вектор с количеством простаивающих перед каждым светофором машин, а на выходе получают длительность каждой фазы. ИНС обучается методом генетического алгоритма.
В работе [16] рассматриваются «вдохновленные биологией» нейронные сети (В1ММ) для управления перекрестком. В таких методах делается упор на исследование динамики в отличие от классических ИНС, в которых в основном рассматриваются процедуры обучения. В1КК исследуется на модели сложного перекрестка. Структура В1КК следующая: входные нейроны описывают очередь транспортных средств на каждой полосе. Выходные нейроны соответствуют фазам на полосах. Все выходные нейроны связаны с ингибиторными нейронами, подавляющими активность прочих выходных нейронов. Длительность фаз ограничивается уравнением, описывающим концепцию «имманентной пластичности» нейрона.
В статье [17] рассматривается глубокая сверточная искусственная нейросеть для адаптивного управления траффиком. Для обучения ИНС используется обучение с подкреплением. В терминологии парадигмы обучения с подкрплением ИНС называется агентом. Входной сигнал в ИНС формируется из предложенного авторами пространства состояний — дискретного кодирования состояния траффика (DTSE). В DTSE каждая полоса длинной l разбивается на «ячейки»
длинной c. Авторы отмечают, что выбор c важен для динамики системы управления. Предлагается следующая нейросетевая архитектура. Используются две ней-росети с идентичной структурой, но различным набором входных сигналов. В первую на вход подается бинарный вектор описывающий наличие/отсутствие автомобиля на участке дороги, во вторую вектор действительных чисел, описывающий скорости автомобилей на участках дорог. Развернутые в вектор выходы нейросе-тей склеиваются друг с другом и с текущим состоянием фаз и подаются на вход полносвязной ИНС. Выходом из ИНС является индикаторный вектор, показывающий действие, которое агент должен совершить, а именно содержит номер фазы которую следует включить.
В работах [14—16] на выходах нейросетей получают длины фаз, а в работе [17] выходом является решение, какую из фаз переключить. В нашем подходе выходом является предсказанный нейросетью транспортный поток в следующий момент времени. Чем точнее прогноз, тем ближе к реальности параметры ИНС описывают параметры сети дорог. Чем точнее определены параметры сети дорог, тем ближе к истине оптимальное решение, найденное с помощью модели.
Математические модели транспортных потоков на основе теории
управляемых сетей
Модель одной сети. Математическая модель транспортных потоков на основе управляемых сетей [8—11] имеет следующий вид:
x(k) = x(k - 1) - ((x(k - 1)1TL) О A(u(k)) О D -
- ((x(k - 1)1T) О A(u(k)) О D - A(u(k)) О B))1L +
+ ((x(k- 1)1T) О A(u(k)) О D - ((x(k- 1)lT) О A(u(k)) О D -
- A(u(k)) О B))T1Z + 8(k), (1)
где L — количество участков дорог; О — Адамарово произведение матриц, 5(k) = [51(k) ... 5L(k)]T; 5i(k) значение приходящего потока на участок i, i = 1, ..., L, задается случайно;
— матрица смежности графа основной сети
A = [alV], atJ е {0,1}, i, j = 1, ..., L; (2)
— матрица пропускных способностей
B = [bij], bij е R+ u {0}, (3)
где bjj описывает поток с участка дороги i на дорогу j в какой-то временной промежуток;
— матрица распределения
D = [dij], dj е [0;1], (4)
где d{j показывает какая часть потока на участке i совершает маневр на участок j. CYBERNETICS AND MECHATRONICS 99
Все участки дорог должны удовлетворять (5)
¿й^ = 1,1 = 1, ..., Ц (5)
3=1
— управляющий вектор
u = [щ ... ым]Т, щ е {0, ..., и+}, (6)
где щ номер фазы светофора на перекрестке г; и+— максимальное количество активных фаз на светофоре г, г = 1, ..., М; М — количество перекрестков в сети;
— матрица конфигураций, которая также является матрицей смежности неполного графа
A(u) = [а^)],
П, если аз =1, и 3 е{Fгз} (7)
а 3 (^ = \ ' ; (7)
[0, иначе
— матрица управления
C = [с^], Сц е {1, ..., М}, (8)
где с¡з — номер перекрестка на котором находится маневр с участка г на участок3;
— матрица фаз светофоров
F = 1,3 = 1, Ц, (9)
где = \fiji, ..., /¡3к{С.)}; е {0,и+ }; 1 < г < к(с3); и+ — максимальное количество активных фаз на перекрестке с,; к(с ф — максимальная длина фазы светофора, которая разрешает маневр с участка г на участок3 на перекрестке с,; F¡■3■ — набор индексов фаз, которые разрешают маневр с участка г на участок3.
Все матрицы одинаковы по своей структуре: Ъ^ > 0; с3 > 0; й^ > 0; Fг■3■ Ф 0, если а, = 1, иначе Ъ^ = 0, су = 0, йц = 0, Fi¿ = 0;
Для описания параметров дорожного потока вводим временные интервалы, Д?. Считаем, что длины всех фаз являются целыми числами, Д?. Так же считаем, что светофоры синхронизированы, так что отсчет целых временных интервалов на всех светофорах сети происходит единовременно. Для описания количественных характеристик потока для каждого участка дорог используем вектор состояния потока
x(tk) = [*!(?*) ... Хц(?к)]Т, (10)
где хрк) — количество машин на участке3 в момент ?к, хД?к) е R1,3 = 1,..., Ц, к = 0, ..., И, N — количество интервалов управления.
Модель с подсетями. При расширении модели (1) за счет добавления перекрестков необходимо формировать новые матрицы. С целью исключения этой процедуры была разработана модель транспортных потоков с подсетями [10; 11].
Рассмотрим обширную сеть дорог из К подсетей. Модели подсетей представляем в виде набора матриц отдельных моделей: (^к)), B/, Dl, I = 1, ..., К).
Для соединения моделей всех подсетей в одну сеть введем матрицы соединений для каждой подсети
^ = [ТШ], I = 1, ..., I = 1, К, (11)
где г1 ц — номер элемента в векторе входных участков для участкау; п11 — количество выходных дорог в подсети I.
Для каждого участка дорог модель должна иметь векторы входных и выходных дорог
^ = ... v/n/, (12)
w/ = ... ^п^]7, (13)
где уи — индекс входной дороги в подсеть I, I = 1, ..., п10; п10 — количество входных дорог в подсеть, ^ — индекс выходной дороги из подсети I, у = 1, ..., п1^
Использование соединительных матриц позволяет моделировать динамику потоков на всех подсетях одновременно. На каждом интервале Д t пересчитываем вектор потока в соответствии с соединительными матрицами
= у Ф 0, хм(к = Щ^к), (14)
где I = 1, ..., п/д; у, I = 1, ..., К; а = Р = wl^.
Искусственная нейронная сеть для определения параметров модели
Математическая модель системы управления транспортными потоками (1) содержит в себе параметры, которые необходимо получить экспериментально для каждого перекрестка. Среди этих параметров элементы матрицы пропускных способностей B и матрицы распределений D. Пропускная способность маневра Ъу с участка дороги / на участоку определяет количество автомобилей, способных совершить этот маневр за один интервал времени. Пропускная способность маневра Ъу зависит от пространственных характеристик перекрестка, скорости автомобиля и количества автомобилей на участках / и у.
Элементы йу матрицы распределений D определяют доли потока автомобилей, которые совершают маневр с участка дороги / на участок у. Сумма этих долей равна потоку на участке /. Значения параметров зависят от маршрутов всех автомобилей и могут изменяться в зависимости от времени суток, дня недели и сезона.
Для определения параметров пропускных способностей B и распределений D модели (1) мы используем двухслойную неполносвязную ИНС.
Архитектура ИНС выбирается соответственно взаимосвязям дорог на перекрестках, значения весов ИНС совпадают с параметрами пропускных способностей и распределений потоков. На вход подаются значения потоков на участках дорог в некоторый момент времени, а на выход — потоки на участках дорог в следующий момент времени.
Структура ИНС определяется структурой перекрестка: входной слой состоит из N входов, где N = п, п — количество входных участков дорог на перекрестке. Каждый вход связан с т1 нейронов скрытого слоя, где т1 — количество маневров, которые возможно совершить с участка /. Количество нейронов скрытого слоя задается равным сумме количества маневров, возможных со всех входных участ-
N0 -1 т1 -1
ков дорог перекрестка, N1 = ^ ^ j. Значения весов для скрытого слоя, опре-
1=0 j=0
деляет параметры матриц пропускных способностей В и распределений Б, как у^ij = dij/bij. Функцией активации нейронов скрытого слоя выбрана кусочно-линейная функция.
f ( х ) =
0, х < 0,
х, 0 < х < 1, (15)
1, х > 1.
Каждый нейрон скрытого слоя связан только с одним элементом выходного слоя, при этом N2 < N1, и каждый нейрон выходного слоя определяет выходной участок дороги, отходящей от перекрестка. Несколько нейронов скрытого слоя могут иметь связи с одним нейроном выходного слоя. Так как выходной слой определяет выходные участки дорог, связь со скрытым слоем определяет маневр с участка дороги / на выходной участок дороги j. Значения весов для выходного слоя определяют параметры матрицы пропускных способностей В как у^ = Ь^.
Рис. 1. Структура управления транспортными потоками с ИНС [Structure of ANN application]
Рис. 2. Структурная схема ИНС
Для обучения ИНС используется алгоритм обратного распространения ошибки методом стохастического градиентного спуска. В качестве обучающих пар на вход подается вектор потоков Ху на входных участках дорог на перекрестке в момент времени tk, а на выход соответствующий вектор потоков на выходных участках дорог Ху в момент времени t¡
k+1-
Таким образом, веса ц и V обученной ИНС однозначно описывают параметры пропускных способностей B и распределений потоков D перекрестка, для любых I и у:
bij = vij, dij = Mij ■ vij.
Представленная ИНС может использоваться как для уточнения параметров модели, изменяющихся во времени, так и для полной идентификации параметров пропускных способностей B и распределений потоков D. Структурная схема управления транспортными потоками с использованием ИНС представлена на рис. 1. В контуре управления применяем двухслойную нейронную сеть, схематичное представление которой приведено на рис. 2.
Выводы
В статье представлено описание нейросетевого подхода для решения задачи управления транспортными потоками в сети городских дорог. Управление транспортными потоками осуществляется в следствии решения задачи оптимального управления на математической модели, построенной на основе теории управляемых сетей. ИНС обеспечивает настройку параметров модели при возникновении расхождения между выходными данными, полученными на модели, и выходными данными на реальном объекте, участке сети дорог.
© Казарян Д.Э., Михалев В.А., Софронова Е.А., 2017
БИБЛИОГРАФИЧЕСКИЙ СПИСОК/REFERENCES
[1] M.J. Ligthill and F.R.S. Whitham. "On kinetic waves II. A theory of traffic flow on crowded roads", Proc. of the Royal Society Ser. A., vol. 229, № 1178, pp. 317—345, 1995.
[2] V Mauro. "Road Network Control". In M. Papageorgious, editor, Concise Encyclopedia of Traffic and transportation Systems. Advanced in Systems, Control in Information Engineering, pp. 361—366. Pergamon Press, 1991.
[3] S.A. Ardekani and R. Herman. "Urban Network-Wide Variables and Their Relations", Transportation Science, vol. 21, № 1, 1987.
[4] A.A. Assad. "Multicommodity network flows — a survey", Networks, vol. 8, № 1, pp. 37—91, 1978.
[5] T. Peter. "Modeling nonlinear road traffic networks for junction control", Int. J. of Applied Mathematics and Computer Sciences, 2012, vol. 22, No. 3, pp. 723—732.
[6] K.-H. Chao, R.-H. Lee, M.-H. Wang "An Intelligent Traffic Light Control Based on Extension Neural Network" Proceedings 12th International Conference, KES 2008, Zagreb, Croatia, September 3-5, 2008, Part I. pp. 17—24.
[7] J. Hu, D. Zhao, F. Zhu "Neural network based online traffic signal controller design with reinforcement training" Proc. 14th International IEEE Conference on Intelligent Transportation Systems (ITSC). 5-7 Oct. 2011. Pp. 1045—1060/
[8] A.I. Diveev. "Controlled networks and their applications", Computational Mathematics and Mathematical Physics, vol. 48, № 8, pp. 1428—1442, 2008.
[9] G.H.A. Alnovani, A.I. Diveev, K.A Pupkov and E.A. Sofronova. "Control Synthesis for Traffic Simulation in the Urban Road Network". Proc. of the 18th IFAC World Congress, Milano, Italy August 28 — September 2, 2011, pp. 2196—2201.
[10] A.I. Diveev and E.A. Sofronova. "Synthesis of Intelligent Control ofTraffic Flows in Urban Roads Based on the Logical Network Operator Method", Proceedings of European Control Conference (ECC-2013) July 17-19, 2013, Zürich, Switzerland, pp. 3512—3517.
[11] A. Diveev, E. Sofronova, V Mikhalev 2016 IEEE International Conference on Systems, Man, and Cybernetics, SMC 2016 - Conference Proceedings 7844705, pp. 3051—3056.
[12] Tu, Y.L., WJ. Zhang, X.Liu., W. Li, C-L. Chai, Ralph Deters et al., 2008. A disaster response management system based on control systems technology, Int. J. of Critical Infrastructures, 4(3), pp. 274—285
[13] J.W Wang, WH. Ip, WJ. Zhang. An integrated road construction and resource planning approach to the evacuation of victims from single source to multiple destinations. Intelligent Transportation Systems, IEEE Transactions on 11 (2), 277—289.
[14] J.C. Chedjou, K. Kyamakya. Cellular neural networks based local traffic signals control at a junction/intersection. Proceedings of the 1st IFAC Conference on Embedded Systems 2012 (CESCIT-2012) 3-5 April, 2012, Wurzburg, Germany, pp. 81—85.
[15] S. Araghi, A. Khosravi, D. Creighton. Optimal design of traffic signal controller, using neural networks and fuzzy logic systems. Proceedings of the International Joint Conference on Neural Networks 2014 (IJCNN) 6-11 July, 2014, Beijing, China, pp. 42—47.
[16] G.B. Castro, J.C. Martini, A. Hirakawa. Biologically-inspired neural network for traffic signal control. Proc. of17th International Conference on Intelligent Transportation Systems 2014 (ITSC) 8-11 October, 2014, Quingdao, China, pp. 2144—2149.
[17] W. Genders, S. Razavi. Using a deep reinforcement learning agent for traffic signal control. Submited to IEEE for publication on 3 November 2016.
История статьи:
Дата поступления в редакцию: 5 октября 2016 Дата принятия к печати: 22 ноября 2016
Для цитирования:
Казарян Д.Э., Михалев В.А., Софронова E.A. Нейросетевые подходы к управлению потоками транспорта // Вестник Российского университета дружбы народов. Серия: Инженерные исследования. 2017. Т. 18 № 1. С. 97-106.
Сведения об авторах:
Казарян Давид Эдуардович, старший преподаватель департамента механики и мехатрони-ки, Инженерная академия, Российский университет дружбы народов. Сфера научных интересов: машинное обучение, искусственный интеллект, искусственные нейронные сети, вычислительные методы для решения задач управления. Контактная информация: kazaryan. david@gmail.com.
Михалев Василий Андреевич, аспирант департамента механики и мехатроники, Инженерная академия, Российский университет дружбы народов. Сфера научных интересов: искусственный интеллект, искусственные нейронные сети, программирование. Контактная информация: vasiliy.mihalev@yandex.ru.
Софронова Елена Анатольевна, кандидат технических наук, заместитель директора по научной работе, доцент департамента механики и мехатроники, Инженерная академия, Российский университет дружбы народов. Сфера научных интересов: вычислительные методы для решения задач управления, синтез и идентификация систем управления. Контактная информация: sofronova_ea@mail.ru.
ARTIFICIAL NEURAL NETWORK APPROACH TO TRAFFIC FLOW
CONTROL
D.E. Kazaryan, V.A. Mihalyev, E.A. Sofronova
Academy of Engineering Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, Russia, 117198
A problem of optimal urban traffic flows control is considered. A mathematical model of control by the traffic lights at intersections using the controlled networks theory is given. It is a system of nonlinear finite-differential equations. To present a large scale road networks the model contains the connection matrices that describe interactions between input and output roads in subnetworks. The traffic flow control is performed by the coordination of active phases of traffic lights. A control goal is to minimize the difference between the total input flow and total output flow for all subnetworks. In this paper, a neural network approach for urban traffic road network parameters adjustment is presented. A simulation is conducted under a microscopic traffic simulation software CTraf. Results demonstrate that neural network reinforcement training obtain good parameters of the network model.
Key words: traffic flow control, artificial neural networks
Article history:
Received: October 5, 2016 Accepted: November 22, 2016
For citation:
Kazaryan, D.E., Mikhalev, V.A., Sofronova E.A. (2017) Artificial neural network approach to traffic How control. RUDN Journal of Engineering Researches, 18(1), 97—106.
Bio Note:
David E. Kazaryan, senior lecturer of department Mechanics and mechatronics, Academy of Engineering, Peoples' Friendship University of Russia. Research Interests: machine learning, artificial intelligence, artificial neural networks, computational methods for control problems. Contact information: kazaryan.david@gmail.com.
Vasiliy A. Mikhalev, PhD student, department Mechanics and mechatronics, Academy of Engineering, Peoples' Friendship University of Russia. Research Interests: artificial intelligence, artificial neural networks, programming. Computational methods for problems of control. Contact information: vasiliy.mihalev@yandex.ru.
Elena A. Sofronova, candidate oftechnical sciences, deputy director for research, associate professor Mechanics and Mechatronics department, Academy of Engineering, Peoples' Friendship University of Russia. Research Interests: computational methods for control problems, synthesis and identification of control systems. Contact information: sofronova_ea@mail.ru.