УДК 614.841.123.24
ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ В ВОПРОСЕ ПРОГНОЗИРОВАНИЯ ВРЕМЕНИ ПРИБЫТИЯ ПОЖАРНО-СПАСАТЕЛЬНЫХ ПОДРАЗДЕЛЕНИЙ
Р. В. МИРОНЕНКО, М. В. СИБИРЯКОВ, А. И. СОКОВНИН
Академия ГПС МЧС России, Российская Федерация, г. Москва E-mail: fds-smv@yandex.ru, sibiryakov.m@bk.ru, sokovninartem88@yandex.ru
В настоящее время отсутствует единый подход к прогнозированию скорости движения пожарного автомобиля следующего к месту вызова в условиях различной загруженности дорожной сети, поэтому данный параметр приобретает вероятностную характеристику, которая зависит от множества внешних факторов (например, дорожный трафик, погодные условия, время суток и т.п.), и как следствие массив данных скорости движения пожарного автомобиля имеет большую дисперсность, что затрудняет выбор метода математической обработки.
Одним из возможных решений при прогнозировании скорости движения пожарного автомобиля в данной постановке вопроса можно решить при помощи машинного обучения, что позволит при обработке больших массивов данных, повысить точность прогнозирования данного параметра.
В статье под машинным обучением принимается метод анализа статистических данных о фактических показателях следования пожарного автомобиля к месту вызова, который автоматизирует построение аналитических моделей.
Для построения модели машинного обучения первого приближения были проанализированы данные по следованию пожарных автомобилей территориального пожарно-спасательного гарнизона города Москвы к месту вызова.
Анализ позволил определить степень влияния загруженности дорожной сети на изменение скорости движения пожарного автомобиля. Загруженность дорожной сети в свою очередь зависит от многих параметров, основным из которых является маятниковая миграция населения Москвы и Московской области. На примере имеющегося массива данных, была определена средняя скорость движения пожарного автомобиля для территории пожарно-спасательного гарнизона г. Москвы, которая составила 34,3 км/ч.
Ключевые слова: следование пожарного автомобиля, машинное обучение, бустинг, прогнозирование скорости пожарного автомобиля, время прибытия.
THE USE OF MACHINE LEARNING IN PREDICTING THE ARRIVAL TIME OF FIRE
AND RESCUE UNITS
R. V. MIRONENKO, M. V. SIBIRYAKOV, A. I. SOKOVNIN
Academy of GPS of the Ministry of Emergency Situations of Russia, Russian Federation, Moscow E-mail: fds-smv@yandex.ru, sibiryakov.m@bk.ru, sokovninartem88@yandex.ru
Currently, there is no unified approach to predicting the speed of a fire truck following to the place of call in conditions of different traffic congestion, therefore, this parameter acquires a probabilistic characteristic that depends on many external factors (for example, traffic, weather conditions, time of day, etc.), and as a result, an array of data on the speed of a fire truck it has a large dispersion, which makes it difficult to choose a method of mathematical processing.
One of the possible solutions for predicting the speed of a fire truck in this formulation of the question can be solved using machine learning, which will allow, when processing large data arrays, to increase the accuracy of forecasting this parameter.
In the article, under machine learning, a method is adopted for analyzing statistical data on the actual indicators of the fire truck following to the place of the call, which automates the construction of analytical models.
To build a machine learning model of the first approximation, data on the following of fire trucks of the territorial fire and rescue garrison of the city of Moscow to the place of the call were analyzed.
© Мироненко Р. В., Сибиряков М. В., Соковнин А. И., 2023
The analysis allowed us to determine the degree of influence of traffic congestion on the change in the speed of a fire truck. The congestion of the road network, in turn, depends on many parameters, the main one of which is the pendulum migration of the population of Moscow and the Moscow region. Using the example of the available data array, the average speed of a fire truck for the territory of the fire and rescue garrison of Moscow was determined, which was 34.3 km/h.
Key words: fire truck tracking, machine learning, boosting, fire truck speed prediction, arrival time.
Введение
Одним из условий обеспечения пожарной безопасности населённых пунктов является время прибытия первых пожарно-спаса-тельных подразделений (далее - ПСП). Согласно статьи 76 Федерального закона от 22.07.2008 № 123 «Технический регламент о требованиях пожарной безопасности» (далее -Ф3-123) время прибытия первых ПСП в городских населенных пунктах не должно превышать 10 минут, а для сельских населенных пунктов 20 минут.
В подтверждении важности сокращения времени реагирования на пожар в ряде исследований [1-3] на основе статистических данных была подтверждена зависимость последствий пожара от времени прибытия первых ПСП, чем меньше время следования ПСП, тем меньше социальный и экономический ущерб. Таким образом, исследования, направленные на повышение точности прогнозирования времени следования ПСП, являются важным элементом в области управления пожарной безопасностью на обслуживаемой территории ПСП и в сокращении времени реагирования в частности.
Время следования ПСП зависит от таких параметров как, расстояния от места дислокации ПСП до объекта защиты (далее - расстояние) и скорости пожарного автомобиля (далее - ПА) ПСП:
~ V
где: Ь - расстояние, км; V - скорость ПА, км/ч.
В данном исследовании не рассматриваются параметры, оказывающие влияние на протяжённость маршрута следования, ввиду чего параметр «расстояние» для конкретного объекта принимается константой. Параметр скорости зависит от множества факторов, таких как состояние дорожного полотна, загруженности дорожной сети, погодных условий, технических характеристик ПА и т.п. [4-11]. Загруженность дорог зависит от месяца, дня недели, времени суток. Ярким примером загру-
женности дорог населенного пункта являются Москва и Московская область - с понедельника по пятницу до 10 ч дороги загружены в направлении Москвы, после 18 ч в направлении Московской области. Утром люди едут на работу, вечером с работы.
Анализ литературных источников показал, что при прогнозировании скорости ПА используется несколько подходов, в большинстве из которых скорость ПА зависит от типа дорожного покрытия. Согласно своду правил 232.1311500.2015 «Пожарная охрана предприятий. Общие требования» (далее — СП 232.1311500.2015) скорость ПА принимает следующие значения:
- 50 км/ч для твердого покрытия;
- 40 км/ч для щебеночно-гравийного покрытия;
- 40 км/ч при наличии на маршруте следования нескольких типов покрытия дорог;
- 30 км/ч для грунтового покрытия.
В работе [12] разработана методика для расчета скорости ПА, которая учитывает скорость движения транспортного потока, а также коэффициент преимущества ПА, зависящий в том числе от степени влияния внешних факторов, таких как день недели, время суток и тип ПА. В [13] представлена методика расчета скорости ПА в зависимости от состояния дорог и теплового режима двигателя пожарного автомобиля, а также дан диапазон скорости ПА в городских поселениях, который составляет от 25 до 45 км/ч.
Как видно из представленного анализа на сегодняшний день не выработан единый подход к прогнозированию скорости ПА, а т.к. данный параметр имеет вероятностный характер и зависит от множества внешних факторов, решением задачи определения наиболее точного метода прогнозирования может выступить машинное обучение.
Машинное обучение крепко вошло в такие сферы деятельности как:
- прогнозирование отказа оборудования;
-анализ платежеспособности кредитора;
- рекомендательные системы по приобретению тех или иных товаров;
- медицинская диагностика и т.д.
Целью исследования является разработка модели машинного обучения, позволяющей прогнозировать скорость движения ПА в зависимости от различных факторов.
Эксперименты Разведочный анализ данных
Для построения модели машинного обучения первого приближения были проанализированы данные следования ПА к месту вызова территориального пожарно-спасательного гарнизона города Москвы за период с 15 июля по 15 декабря 2016 года. Общий массив данных составил 1434 GPX треков. Каждый GPX трек, записанный во время вызова, представляет собой отдельный файл текстового формата GPX, содержащий в себе набор геопозиций (координат) и времени [4, 12], когда ПА находился в данной точке и идентификатор ПА. Для получения большего объема данных было принято решение разделить каждый GPX трек на отдельные отрезки в рамках совершенного выезда для того, чтобы между всеми записанными геопозициями (соседними точками GPX трека) установить расстояние и время прохождения этого расстояния, с целью определения скорости движения ПА на каждом отрезке пути. Система записи GPX треков создаёт точку в случае изменения динамики следования пожарного автомобиля (остановка, ускорение, торможение). После выше описанных манипуляций объем выборки данных для анализа увеличился до 84589 значений.
Проведя первичную обработку данных было установлено, что в массиве данных содержится информация, где скорость автомобиля, равняется 0 км/ч или превышает максимально возможную скорость движения ПА было решено избавиться от выбросов путем отбрасывания значений, где скорость движения ПА 0 км/ч или превышает максимальную скорость движения ПА. Объем выборки данных при этом сократился до 79239 значений.
Запись GPX трек осуществлялось с помощью абонентского телематического терминала GSM/ГЛОНАСС/GPS Гранит-навига-тор-6.18 АСН, который устанавливается на автомобиль для определения координат. Согласно технической документации, точность измерения составляет до 5,7 м, т.е. при опре-
делении координат возможны «фантомные» движения ПА за счет ошибки позиционирования автомобиля. Было решено исключить значения из выборки данных, где перемещение между двумя точками составляет менее 5,7 м. Объем выборки данных сократился до 64895 значений.
На рис. 1 представлено распределение целевой переменной «скорость». С помощью критерия Шапиро-Уилка было установлено, что данное распределение не является нормальным.
0 20 40 60 ао 100
Скорость, км/ч
Рис. 1. Распределение целевой переменной «скорость»
На рис. 2-6 представлены диаграммы размаха, как влияют некоторые признаки, описанные выше, на изменение скорости ПА. Как видно из рис. 2-6 на скорость ПА очень сильно влияет фактор маятниковой миграции населения Москвы и Московской области.
Среднее значение скорости после обработки данных составила 34,3 км/ч. Данное значение согласно СП 232.1311500.2015 ближе к значению скорости ПА для грунтовых покрытий, чем к дорогам с твердым покрытием, также данное значение попадает в диапазон, представленный в работе [13].
Рис. 2. Влияние месяца на скорость ПА
Вторник Среда Четверг Пятница Суббота
Рис. 3. Влияние дня недели на скорость ПА
рабочий день предвыходной день выходной день
Тип дня
Рис. 4. Влияние типа дня на скорость ПА
Рис. 5. Влияние времени суток на скорость ПА
Рис. 6. Влияние типа ПА на скорость ПА
Обучение
Модель машинного обучения обучается предсказывать целевую переменную на признаках. Конкретной целевой переменной для разрабатываемой модели является скорость. К существенным признакам было решено отнести [4, 14] тактико-технические характеристики ПА по их типам (автоцистерна/автомобиль насосно-рукавный (далее -АЦ/АНР), автолестница/автоколенчатый подъёмник (далее - АЛ/АКП), аварийно-спасательный автомобиль (далее - АСА)) день недели, тип дня (рабочий день, предвыходной день, выходной день), время суток.
Наиболее популярным способом обучения в машинном обучении является применение бустинга. Под бустингом понимается процедура последовательного построения композиции алгоритмов машинного обучения,
когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов [15]. Наиболее популярными библиотеками, реализующими бу-стинг являются XGBoost, LightGBM, Catboost. У каждой из этих библиотек есть свои достоинства и недостатки. Подобрать наилучшую реализацию бустинга возможно только с помощью экспериментов.
При обучении модели будет применяться способ обучения с учителем, т.е. целевая переменная в данных, которая подается на обучение известна, в нашем конкретном случае целевой переменной является скорость движения ПА.
Предсказание некоторой непрерывной величины является задачей регрессии.
Необходимо после обучения модели проверить адекватность получаемых значений, так как модель может переобучиться или недоучиться. Для оценки получаемых значений для регрессий используют в основном следующие метрики:
- средняя абсолютная оценка (далее -
MAE);
- среднеквадратическая ошибка (далее
- MSE);
- средняя квадратическая ошибка (далее - RMSE);
- среднеквадратическая логарифмическая ошибка (далее - RMSLE).
Значения выше приведенных метрик при обучении должно стремиться к нулю. Чем ближе значение метрики к нулю, тем ошибка обучения меньше. Область применения каждой метрики различна, в практике МО (машинного обучения) принято при обучении комплексно обращать внимание на все приведенные метрики, но на основании распределения целевой переменной определяется ведущая метрика. Ведущей метрикой в данном исследовании будет являться RMSLE, т.к. распределение целевой переменной (скорости ПА) не
Метод бустинга показал, что он может применяться для дальнейшей обработки получаемых статистических данных для построения более точных прогнозных имитационных моделей, созданной на основе МО, позволяющих с высокой точностью для исследователя предсказывать скорость движения ПА, в зависимости от целого комплекса факторов (день недели, время суток, загруженность дорог и т.п.). Одним из основных преимуществ данного подхода является получение прогнозной средней скорости ПА, которая соответствует постоянно изменяющейся обстановке на территории города. Однако данный результат достижим при создании условий постоянного обновления статистической базы о скорости следования ПА к месту вызова, что вполне реализуемо при интеграции данного метода и современных систем управления пожарно-спасательными подразделениями такими как комплексная информационная система мониторинга и управ-
является нормальным, поэтому необходимо использовать метрику устойчивую к выбросам.
При обучении выборка данных разбивалась на три блока: тренировочные данные (64 % от выборки), валидационные данные (16 % от выборки) и тестовые данные (20 % от выборки). Также использовалась кросс-валидация с 5 блоками данных. На тренировочных данных модель обучалась, на валида-ционных данных обученная модель решала проблему переобучения, а на тестовых данных определялась точность модели.
Обучение модели производится в два этапа. На первом этапе обучаются модели бу-стингов реализованных в XGBoost, LightGBM, Catboost без подбора параметров. На втором этапе обучаются модели бустингов реализованных в XGBoost, LightGBM, Catboost с подбором наилучших параметров. Тем самым будет выявлена наиболее обученная модель.
Результаты обучения модели приведены в таблице. Наилучший результат показала модель, обученная с помощью LightGBM с подбором параметров, т.к. значение ведущей метрики и остальных метрик являются минимальными.
ления силами и средствами пожарно-спасательных подразделений города Москвы (КИСМиУС).
Вывод
Была разработана модель машинного обучения, позволяющая строить прогноз скорости движения ПА, учитывающий различные факторы, такие как модель автомобиля, день недели, тип дня и время суток.
При обработке имеющегося массива данных движения ПА было установлено, что средняя скорость ПА во время следования к месту вызова в территориальном пожарно-спасательном гарнизоне г. Москвы составляет 34,3 км/ч.
Полученные результаты позволят повысить эффективность закрепления района выезда за ПСП в условиях интенсивного изменения внешней среды.
Таблица. Результаты обучения модели
№ этапа Реализация бустинга MAE MSE RMSE RMSLE
1 XGBoost 15,245 376,776 19,411 0,671
LightGBM 15,202 377,207 19,422 0,666
Catboost 15,290 380,110 19,496 0,671
2 XGBoost 15,196 374,243 19,345 0,669
LightGBM 15,063 368,502 19,196 0,662
Catboost 15,149 372,223 19,293 0,665
Список литературы
1. Исследование зависимости риска гибели людей на пожарах от времени прибытия первого пожарного подразделения / А. А. По-рошин, В. В. Харин, А. А. Кондашов [и др.] // Безопасность жизнедеятельности. 2019. № 9 (225). С. 3-9.
2. Соколов С. В., Костюченко Д. В. Управление рисками гибели людей при пожарах в жилых домах городских поселений // По-жаровзрывобезопасность/ Fire and Explosion Safety. 2017. Т. 26, № 1. С. 61-74.
3. Семиков В. Л., Алексеев С. П., Вили-сов В. Я. Статистический анализ зависимости показателей ущерба от времени прибытия первого пожарного подразделения на пожар // Технологии техносферной безопасности. 2019. № 2 (84). С. 72-83.
4. Сибиряков М. В. Анализ геоинформационных данных о следовании пожарно-спасательных подразделений к местам экстренных вызовов // Технологии техносферной безопасности. 2016. №. 6. С. 214-221.
5. Влияние загруженности дорог на среднюю скорость следования пожарных автомобилей / В. В. Харин, В. А. Маштаков, Е. В. Бобринев [и др.] // Вестник НЦБЖД. 2021. № 3 (49). С. 110-119
6. Gholamizadeh K. [et al.] Quantitative Analysis on Time Delay Factors Influencing Firefighters' Response Time in the Process Industries Using Fuzzy Sets Theory. International Journal of Occupational Hygiene, 2022, vol. 14, issue 1, pp. 1-17.
7. Assessment of traffic congestion scenario at the CBD areas in a developing city: In the context of Khulna City, Bangladesh / M. A.Noor, S. Ashrafi, M. A. Fattah [et al.] Transportation Research Interdisciplinary Perspectives, 2021, vol. 11. pp. 1-11.
8. Couture V., Duranton G., Turner M. A. Speed. Review of Economics and Statistics, 2018, vol. 100, issue 4, pp. 725-739.
9. Wang W. X., Guo R. J., Yu J. Research on road traffic congestion index based on comprehensive parameters: Taking Dalian city as an example. Advances in Mechanical Engineering, 2018, vol. 10, issue 6, pp. 1-8.
10. Aftabuzzaman M. Measuring traffic congestion-a critical review. 30th Australasian transport research forum, London, UK: ETM GROUP, 2007. pp. 1-16
11. Vaziri M. Development of highway congestion index with fuzzy set models. Transportation research record, 2002, vol. 1802, issue 1, pp. 16-22.
12. Соколов С. В., Сибиряков М. В. Определение преимущества движения пожар-но-спасательных подразделений в транспорт-
ном потоке // Технологии техносферной безопасности. 2017. № 1 (71). С. 244-254.
13. Теребнев В. В., Подгрушный А. В. Пожарная тактика: Основы тушения пожаров. М.: Академия ГПС МЧС России, 2012. 322 с.
14. Масаев В. Н., Вдовин О. В., Мухови-ков Д. В. Базовые шасси пожарных автомобилей и спасательной техники. Железногорск: Сибирская пожарно-спасательная академия ГПС МЧС России, 2017. 202 с.
15. Mayr A., Binder H., Gefeller O., Schmid M. The evolution of boosting algorithms -From machine learning to statistical modeling. Methods iInf Med, 2014, vol. 53 (6), pp. 419-427.
References
1. Issledovanie zavisimosti riska gibeli lyudej na pozharah ot vremeni pribytiya pervogo pozharnogo podrazdeleniya [Investigation of the dependence of the risk of people dying in fires on the time of arrival of the first fire department] / A. A. Poroshin, V. V. Harin, A. A. Kondashov [et al.]. Bezopasnost' zhiznedeyatel'nosti, 2019, issue 9 (225), pp. 3-9.
2. Sokolov S. V., Kostyuchenko D. V. Up-ravlenie riskami gibeli lyudej pri pozharah v zhilyh domah gorodskih poselenij [Risk management of deaths in fires in residential buildings of urban settlements]. Pozharovzryvobezopasnost'/ Fire and Explosion Safety, 2017, vol. 26, issue 1, pp. 61 -74.
3. Semikov V. L., Alekseev S. P., Vili-sov V. Ya. Statisticheskij analiz zavisimosti poka-zatelej ushcherba ot vremeni pribytiya pervogo pozharnogo podrazdeleniya na pozhar [Statistical analysis of the dependence of damage indicators on the time of arrival of the first fire department to the fire]. Tekhnologii tekhnosfernoj bezopasnosti, 2019, vol. 2 (84), pp. 72-83.
4. Sibiryakov M. V. Analiz geoinfor-macionnyh dannyh o sledovanii pozharno-spasatel'nyh podrazdelenij k mestam ekstrennyh vyzovov [Analysis of geoinformation data on the following of fire and rescue units to the places of emergency calls]. Tekhnologii tekhnosfernoj bezopasnosti, 2016, issue 6, pp. 214-221.
5. Vliyanie zagruzhennosti dorog na sred-nyuyu skorost' sledovaniya pozharnyh avtomobilej [The influence of traffic congestion on the average speed of fire trucks] / V. V. Harin, V. A. Mashta-kov, E. V. Bobrinev [et al.]. Vestnik NCBZHD, 2021, vol. 3 (49), pp. 110-119.
6. Gholamizadeh K. [et al.] Quantitative Analysis on Time Delay Factors Influencing Firefighters' Response Time in the Process Industries Using Fuzzy Sets Theory. International Journal of Occupational Hygiene, 2022, vol. 14, issue 1, pp. 1-17.
7. Assessment of traffic congestion scenario at the CBD areas in a developing city: In the context of Khulna City, Bangladesh / M. A.Noor, S. Ashrafi, M. A. Fattah [et al.] Transportation Research Interdisciplinary Perspectives, 2021, vol. 11. pp. 1-11.
8. Couture V., Duranton G., Turner M. A. Speed. Review of Economics and Statistics, 2018, vol. 100, issue 4, pp. 725-739.
9. Wang W. X., Guo R. J., Yu J. Research on road traffic congestion index based on comprehensive parameters: Taking Dalian city as an example. Advances in Mechanical Engineering, 2018, vol. 10, issue 6, pp. 1-8.
10. Aftabuzzaman M. Measuring traffic congestion-a critical review. 30th Australasian transport research forum, London, UK: ETM GROUP, 2007. pp. 1-16
11. Vaziri M. Development of highway congestion index with fuzzy set models. Transportation research record, 2002, vol. 1802, issue 1, pp. 16-22.
12. Sokolov S. V., Sibiryakov M. V. Opre-delenie preimushchestva dvizheniya pozharno-spasatel'nyh podrazdelenij v transportnom potoke [Determining the advantages of the movement of fire and rescue units in the traffic flow]. Tekhnologii tekhnosfernoj bezopasnosti, 2017, vol. 1 (71), pp. 244-254.
13. Terebnev V. V., Podgrushnyj A. V. Pozharnaya taktika: Osnovy tusheniya pozharov [Fire tactics: The basics of extinguishing fires]. Moscow: Akademiya GPS MCHS Rossii, 2012. 322 p.
14. Masaev V. N., Vdovin O. V., Muhovikov D. V. Bazovye shassi pozharnyh avtomobilej i spasatel'noj tekhniki [Basic chassis of fire trucks and rescue equipment]. Zhelezno-gorsk: Sibirskaya pozharno-spasatel'naya akademiya GPS MCHS Rossii, 2017. 202 p.
15. Mayr A., Binder H., Gefeller O., Schmid M. The evolution of boosting algorithms -From machine learning to statistical modeling // Methods iInf Med, 2014, vol. 53 (6), pp. 419-427
Мироненко Роман Владимирович Академия ГПС МЧС России, Российская Федерация, г. Москва
кандидат технических наук, доцент кафедры организации деятельности пожарной охраны (в составе учебно-научного комплекса систем обеспечения пожарной безопасности) E-mail: fds-smv@yandex.ru Mironenko Roman Vladimirovich
Academy of GPS of the Ministry of Emergency Situations of Russia, Russian Federation, Moscow
Candidate of Technical Sciences, Associate Professor of the Department of Organization
of Fire Protection Activities (as part of the educational and scientific complex of fire safety systems)
E-mail: fds-smv@yandex.ru
Сибиряков Максим Владимирович Академия ГПС МЧС России, Российская Федерация, г. Москва
кандидат технических наук, начальник учебно-научного комплекса систем обеспечения пожарной безопасности E-mail: sibiryakov.m@bk.ru Sibiryakov Maksim Vladimirovich
Academy of GPS of the Ministry of Emergency Situations of Russia, Russian Federation, Moscow
Candidate of Technical Sciences, Head of the educational and scientific complex of fire safety systems E-mail: sibiryakov.m@bk.ru
Соковнин Артем Игоревич Академия ГПС МЧС России, Российская Федерация, г. Москва
кандидат технических наук, доцент кафедры организации деятельности пожарной охраны (в составе учебно-научного комплекса систем обеспечения пожарной безопасности) E-mail: sokovninartem88@yandex.ru Sokovnin Artem Igorevich
Academy of GPS of the Ministry of Emergency Situations of Russia, Russian Federation, Moscow
Candidate of Technical Sciences, Associate Professor of the Department of Organization of Fire Protection Activities (as part of the educational and scientific complex of fire safety systems) E-mail: sokovninartem88@yandex.ru