НАУЧНАЯ СТАТЬЯ / ORIGINAL ARTICLE
УДК 614.8.01, 004.942
DOI 10.25257/FE.2023.3.63-74
® В. Я. ВИЛИСОВ1, Р. Ш. ХАБИБУЛИН2
1 МГТУ им. Н. Э. Баумана (Мытищинский филиал), Мытищи, Россия
2 Академия ГПС МЧС России, Москва, Россия
Статистический анализ и моделирование данных о ликвидации пожаров на топливно-энергетических предприятиях
АННОТАЦИЯ
Тема. На примере статистических данных о пожарах на топливно-энергетических предприятиях за период с 2000 по 2020 гг., хранящихся в федеральной базе данных «Пожары», предложен алгоритм статистического анализа этих данных на предмет построения статистического цифрового двойника (СЦД) рассматриваемого типа пожаров. Цель создаваемого СЦД заключается в том, чтобы для моделируемого класса пожаров можно было создавать любое необходимое, и адекватное исходной выборке данных, множество записей (dataset) для последующего построения моделей и других исследований. Задачами данной работы является построение алгоритма и проработка основных ключевых моментов построения СЦД. Объектом исследования является множество пожаров, характеристики которых заключены в виде отдельных записей в базе данных, а предметом исследования является набор статистических статических и динамических моделей, которые следует построить на основе анализа указанных данных.
Методы. Использованы методы теории вероятностей, математической статистики, имитационного моделирования и статистического оценивания. Предложен подход, основанный на совместном использовании метода Монте-Карло и прин-
ципов бутстрепа для формирования адекватных обучающих выборок.
Результаты. Предложен алгоритм МКБ-моделирования (Монте-Карло-бутстреп) для формирования статистической выборки данных о пожарах в объёме, необходимом для машинного обучения широкого класса моделей поддержки принятия решений. Актуальность предложенного подхода обусловлена тем, что в ряде случаев имеющаяся статистика является недостаточной по объёму для построения моделей поддержки принятия решений и других исследований.
Область применения результатов. СЦД, построенный на основе МКБ-моделирования, позволит формировать выборки данных необходимого объёма, адекватные исходным базам данных.
Выводы. Применение предложенного алгоритма построения СЦД для МКБ-моделирования позволит строить маши-нообучаемые модели для их использования в составе систем поддержки принятия решений в системах безопасности.
Ключевые слова: данные, бутстреп, оценивание, модель, плотность, гамма-распределение, цифровой двойник
© V.Ya. VILISOV1, R.Sh. KHABIBULIN2
1 Mytischi Branch of Bauman Moscow State Technical University, Mytischi, Russia
2 State Fire Academy of EMERCOM of Russia, Moscow, Russia
Statistical analysis and modeling data on eliminating fires at fuel and energy enterprises
ABSTRACT
Purpose. Using the example of statistical data on fires at fuel and energy enterprises for the period from 2000 to 2020, stored in the federal database "Fires", an algorithm for these data statistical analysis is proposed for constructing a statistical digital twin (SDT) of the type of fires under consideration. The SDT under development is aimed at creating any necessary and adequate to the initial data sample set of records (dataset) for the simulated class of fires for subsequent modeling and other studies. The objectives of this work are the construction of an algorithm and the study of the main key points in constructing the SDT. The object of the study is a set of fires, whose characteristics are enclosed contained in the form of separate records in the database, while the subject of the study is a set of statistical static and dynamic models that should be built on the basis of these data analysis.
Methods. Methods of probability theory, mathematical statistics, simulation modeling and statistical estimation are used. An approach based on the joint use of the Monte Carlo method and bootstrap principles to form adequate training samples is proposed.
Findings. MCB-modeling algorithm (Monte Carlo bootstrap) is proposed for generating a statistical sample of data on fires in the amount necessary for machine learning of a wide class of decision support models. The relevance of the proposed approach is due to the fact that in some cases the available statistics are insufficient in volume for building decision support models and other studies.
Research application field. SDT, built on the basis of MCB-modeling, will allow forming data samples of the required volume, which are similar to the original databases.
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
Conclusions. The application of the proposed algorithm Key words: data, bootstrap, estimation, model, density,
for constructing SDT for MCB-modeling will allow building gamma distribution, digital twin machine-learning models for their use as part of decision support systems in safety systems.
ВВЕДЕНИЕ
Ретроспективные статистические данные о пожарах часто используются при анализе состояния объектов пожаротушения, привлекаемых ресурсов и принимаемых решений. Статистические данные позволяют выявлять наличие, структуру и параметры закономерностей в сфере ликвидации пожаров, строить математические модели зависимостей эффекта (например, показателей ущерба) от тех или иных статических или динамических факторов, проявляющихся в процессе развития и тушения пожара [1-5]. Построенные таким образом модели могут быть использованы в качестве информационно-аналитического обеспечения в системах поддержки принятия решений (СППР) [2, 6-9].
Бурно развивающиеся в настоящее время технологии машинного обучения находят всё более широкое применение в различных прикладных задачах [6, 10-15]. В частности, итерационные процедуры «обучения с учителем» позволяют строить широкий спектр нейросетевых [2, 12] и оптимизационных [2, 10] моделей, используемых для поддержки принятия решений (выбора вариантов [12], распределения ограниченных ресурсов и прогнозирования развития процессов [2]), в том числе, например, распределение автотехники по одновременным вызовам на пожары, прогнозирование времени завершения той или иной фазы пожара и т. п. Технологии «обучения без учителя» позволяют решать задачи кластеризации [6] (разбиение объектов анализа на классы - группы близких по свойствам), например, распределение пожаров по рангам. Обученные по статистическим данным (с учителем, без учителя, с подкреплением) модели успешно применяются в СППР, что особенно актуально в условиях дефицита времени, существующего при ликвидации пожаров [2, 16-18]. Поэтому идея использования для построения нейросетевых и других статических и динамических моделей достаточно обширных массивов данных, регистрируемых в соответствии с требованиями приказа МЧС «О формировании электронных баз данных учета пожаров и их последствий» № 625 от 24.12.2018 г. и его более ранней версии, является весьма заманчивой. Однако, как отмечалось в ряде исследований [14], эти данные могут быть не полными, недостаточно надёжными и дос-
товерными. Объём некоторых данных весьма мал в силу очень ограниченного объёма соответствующих событий. Так, например, крупные пожары, имеющие высокие ранги, встречаются крайне редко, что не позволяет для этой категории пожаров построить модели высокой статистической надёжности. Можно привести и другие редко встречающиеся события, для которых сложно построить адекватные модели.
Таким образом, возникает противоречие между достаточно большим объёмом реальных статистических данных, имеющихся в базах данных (БД) и ограниченной возможностью их использования для построения моделей, адекватно описывающих широкий спектр событий и процессов, возникающих при ликвидации пожаров. Это порождает задачу построения некоторого генератора данных (выборок, с1а1а8е1:'ов), максимально адекватных данным БД.
В данной работе приведены основные результаты исследования, направленного на преодоление указанного противоречия путём применения широко используемого ныне в сфере машинного обучения метода, называемого бутстреп (размножения или многократного применения ограниченного набора данных) [2, 19, 20], на базе использования статистических методов аппроксимации эмпирических данных с последующим применением классического метода Монте-Карло [2, 20]. Бутстреп является искусственным приёмом, широко используемым в прикладной статистике (хоть и нарушающим некоторые предпосылки математической статистики), позволяющим ограниченную выборку использовать много раз, иногда в изменённой композиции. Бутстреп-подход ныне часто применяется при обучении нейросетей путём прогона (в процессе обучения модели) одного и того же ограниченного набора данных в несколько итераций (эпох, то есть циклов обучения). Таким образом, предлагаемая технология заключается в том, чтобы построить совокупность статических и динамических моделей по имеющимся в БД статистическим данным, а затем по этим моделям сгенерировать выборки в объёме, необходимом для машинного обучения нейросетевых и (или) других моделей, включаемых в состав СППР. Такой подход далее будем называть МКБ-моделированием.
АЛГОРИТМ МКБ-МОДЕЛИРОВАНИЯ
Основные этапы рассматриваемой в работе технологии моделирования приведены на рисунке 1.
Блоки (1-7, 11, 12), отражающие этапы рассматриваемого в работе статистического анализа, являются основой для решения прикладных задач (блоки 8, 9, 10, выделенные пунктиром). В силу ограниченного объёма публикации последние три блока (8, 9, 10) в данной работе подробно не рассматриваются.
В блоке 1 производится отбор данных для последующего построения по нему СЦД для генерации рабочего набора данных, необходимого для построения(обучения)целевой/прикладной модели объекта/процесса (например, модели распределения автотехники по одновременным вызовам [1-4]).
В блоке 2 производится отсев/фильтрация заведомо искажённых/ошибочных данных в записях набора данных. Отсев производится либо по значению поля данных, которое может быть больше или меньше некоторого порога, либо
НАЧАЛО
£
Отбор первичных данных
Фильтрация данных (пороговая или оконная)
Классификация показателей
на входные (управляемые и неуправляемые) и выходные
Сведения о диапазонах варьирования параметров
?
©
Построение статических и динамических моделей данных по исходной выборке
€
Генерация выборки данных
Построение статических у и динамических моделей данных по сгенерированной выборке
(8) Построение (обучение) моделей объекта
^^ Применение моделей в СППР Обновить модели?
_£нет
( КОНЕЦ )
Требования к составу и объёму выборки
1р
Рисунок 1. Алгоритм МКБ-моделирования Figure 1. Algorithm for MCB-modeling
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
может лежать внутри или вне диапазона данных. Проверка производится также на предмет непрерывности или дискретности проверяемого значения. Ограничения задаются в блоке 11, исходя из смыслового содержания поля данных.
В блоке 3 все отобранные поля записей базы данных подразделяются на входные (независимые переменные) и выходные (зависимые переменные). Такое разбиение определяется содержанием целевых моделей. Например, для построения регрессионной модели, отражающей объём прямого материального ущерба (и) в зависимости от интервалов фаз (i) времени реагирования (т.), входными являются т а выходной - и.
В блоке 4 методами математической статистики ведётся обработка данных для построения элементов СЦД, в частности, функций/плотностей распределения вероятностей показателей (всех входных и выходных) и регрессионных (парных и множественных), из которых для дальнейшей работы оставляются лишь значимые.
В блоке 5 генерируется набор данных на основе СЦД, необходимый для построения целевых моделей. Объём (количество записей) формируется в блоке 12 и определяется смысловым содержанием целевой модели. Так, например, для обеспечения желаемого качества сходимости некоторых нейросетевых моделей бывает достаточно 200 записей в обучающей выборке, в иных случаях требуется больше или меньше. На практике необходимый объём определяется эмпирически, и СЦД позволяет создать выборку любого необходимого объёма, в отличие от использования исходной выборки.
В блоке 6 строятся статистические модели, аналогичные построенным в блоке 4, необходимые для их сравнения друг с другом.
В блоке 7 модели блоков 4 и 6 сравниваются, и при достаточной их близости модели СЦД передаются для построения целевых моделей, необходимых для СППР или иных целей.
Блоки статистического анализа далее поясняются и иллюстрируются.
ПРИКЛАДНЫЕ ЗАДАЧИ, ИСПОЛЬЗУЮЩИЕ БАЗЫ РЕТРОСПЕКТИВНЫХ ДАННЫХ О ПОЖАРАХ
Управление ликвидацией пожаров укруп-нённо может быть представлено [1, 2] как: - распределение (выделение по детерминированному или гибкому плану) некоторых ресурсов окрестных пожарно-спасательных частей
(ПСЧ) в составе и количестве, предположительно (по текущей информации о пожаре) достаточном для эффективной ликвидации пожара [1, 2, 10]. Это можно считать первым контуром управления;
- оперативное управление выделенными (ограниченными и неодновременно поступающими) ресурсами для эффективной ликвидации пожара. При этом руководитель тушения пожара (РТП) использует существенно больший поток данных, чем тот, который затем остается в базах данных [1, 2]. Это можно считать вторым контуром управления;
- постпожарный анализ действий лиц, принимающих решения (ЛПР), участвовавших в ликвидации пожара, учёт опыта и обучение персонала на его основе (третий контур управления - накопление опыта).
Ретроспективные данные о каждом из пожаров (блок 1), представленные в [21], распределены по группам, наиболее существенные (для анализа состояния и механизмов управления) разбиты на следующие группы:
1) общие сведения;
2) объект пожара;
3) последствия пожара;
4) спасено на пожаре;
5) развитие и тушение пожара;
6) силы и средства пожаротушения;
7) сведения о погибших и травмированных.
Процесс возникновения и ликвидации пожара укрупнённо можно представить тремя элементами:
- состояние (группы 1, 2, 5);
- принятие решений (управление) (группа 6);
- эффект (последствия) (группы 3, 4, 7).
Очевидно, механизмы и алгоритмы принятия решений (блок 9) являются одними из наиболее значимых в процессе ликвидации пожара, в частности, вопросы выделения ресурсов по данным о состоянии [2].
С одной стороны, потребные ресурсы должны определяться именно состоянием пожара (а не состоянием имеющихся ресурсов), в предположении их неограниченных запасов. Но имеющиеся, ограниченные по количеству и по времени доставки, запасы приводят к компромиссным решениям [7, 13]. Так, в региональных гарнизонах ограниченность ресурсов оказывает существенное влияние на эффективность ликвидации пожаров [2].
В деле адекватного выделения ресурсов на пожар традиционно важным является такой индикатор, как ранг пожара, укрупнённо определяющий потребность в ресурсах [1, 2]. Есть много подходов к его оцениванию, определению,
назначению, и на сегодня нельзя сказать, что вопросы практического его применения окончательно решены и не требуют дальнейших исследований. Использование ретроспективных статистических данных, на наш взгляд, может позволить выявить закономерности и построить модели (блок 8), отражающие зависимость ранга пожара, а значит и необходимых ресурсов, от регистрируемых показателей пожара.
НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ И ОСОБЕННОСТИ ВЫБОРКИ ДАННЫХ
При анализе рассматривалась выборка статистических данных из БД о пожарах на топливно-энергетических предприятиях, то есть на объектах электроэнергетики (код 11 по классификатору Приказа МЧС России № 625 от 24.12.2018 г.), топливной промышленности (код 20) и угольной промышленности (код 27) за период с 2000 г. по 2020 г. (блок 1 рисунка 1). Эта группа предприятий обладает той спецификой, что возгорание даже на второстепенных их объектах и сооружениях (при риске более широкого распространения пожара) может привести к существенному ущербу.
Статистические данные о каждом пожаре представлены в БД отдельной записью, а значения полей должны отражать информацию в соответствующем формате (непосредственно или в виде кодов классификаторов, приведённых в том же приказе) о тех или иных показателях, перечень которых регламентирован приказом № 625. Однако, как отмечалось в ряде работ [7, 13], данные, хранящиеся в БД, не являются абсолютно достоверными и унифицированными, они лишь содержат то, что в них было введено конечными пользователями. Эти данные содержат ряд явных некорректностей, которые при их последующем использовании могут вносить дополнительные искажения в модели объектов и процессов, поэтому для их эффективного использования крайне желателен этап предварительной обработки. В числе искажений, встречающихся в рассматриваемых наборах данных, следует отметить такие, как:
- изменение форматов (например, дата вместо текста или числа и т. п.);
- явный выход значений за пределы пороговых значений (или сетку кодов классификатора) измеряемого параметра (например, при этажности здания - 2 этаж возникновения пожара - 8);
- пропуски в данных (незаполненные поля записей) и другие.
В связи с этим к типовым процедурам, которые необходимо применять на этапе предварительной обработки данных (блок 2 на рисунке 1), можно отнести следующие:
- приведение форматов данных отдельных записей к необходимым форматам соответствующих полей;
- коррекция (удаление или интерполяция, если возможно и допустимо) значений записей;
- отбраковка (удаление из рабочей выборки) записей, не отвечающих критериям достоверности;
- фильтрация (отбор) записей из БД для формирования рабочей выборки, используемой в конкретных целях исследования (например, для построения прогностической модели или модели распределения ограниченных ресурсов [2], или для машинного обучения нейросети и т. п.);
- распаковка некоторых полей из компактной формы, удобной для хранения данных, в развернутую форму, удобную для обработки, анализа и обучения моделей и нейросетей. В компактной форме хранятся, например, сведения о типах и количестве участвующих в тушении пожара автотехники, стволов и т. п.
Применительно к анализируемой в данной работе выборке данных, отбраковка записей по причинам выхода параметров за границы нормативных или физически обусловленных диапазонов привела к тому, что из общего объёма в 3 231 записи о пожарах на топливно-энергетических предприятиях за период с 2000 по 2020 гг. для анализа оставлено 2 639 записей (отбраковано свыше 18 %).
Для целей решения перечисленных выше задач все регистрируемые в БД показатели разбиты на три функциональные группы (блок 3 на рисунке 1), в каждой из которых рассмотрены лишь наиболее значимые (по мнению авторов):
1. Показатели ущерба и спасения, как эффект от взаимодействия (противоборства) двух групп факторов - природы (неуправляемые, лишь регистрируемые факторы) и пожарной охраны (ПО) -управляемые факторы. В числе показателей этой группы:
- погибло людей (поле 25, здесь и далее по приказу № 625), чел.;
- получили травмы (поле 26), чел.;
- прямой материальный ущерб (поле 27), и, тыс. руб.;
- спасено людей (поле 40.1), чел.;
- эвакуировано людей (поле 40.2), чел.;
- спасено материальных ценностей (поле 43), тыс. руб.;
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
2. Показатели времени реагирования. Эти показатели являются следствием воздействия группы условно неуправляемых факторов (ПО всегда ориентирована на минимальные значения времени реагирования). В числе таких показателей:
- интервал времени сообщения (интервал времени с момента обнаружения пожара до момента передачи сообщения о пожаре) (поле 45 -поле 44), т , , мин.;
п сообщ' 1
- интервал времени прибытия первого подразделения пожарной охраны (поле 46 - поле 45), т ,, мин.;
приб' 1
- интервал времени подачи первого ствола (поле 47 - поле 46) , т. , мин.;
4 7 ' 1 ств 1 1
- интервал времени локализации пожара (поле 48 - поле 47), т , мин.;
4 п локт 1
- интервал времени ликвидации открытого горения (поле 49 - поле 48), т , мин.;
лик. откр
- интервал времени ликвидации последствий пожара (поле 50 - поле 49), т , мин.;
лик. посл
3. Показатели ресурсов, привлекаемых для ликвидации пожаров. Эти показатели являются следствием воздействия группы условно управляемых факторов (на практике хоть и имеются детерминированные расписания выезда подразделений ПО, существует возможность гибкого оптимального назначения ограниченных ресурсов на пожар). В числе таких показателей - сведения об автотехнике, выделяемой на пожары:
- техника (виды), направляемая к месту пожара (поле 54), ц
- количество техники (поле 55), л55. , шт.
Следует отметить, что состав полей БД
в этих трёх группах может быть гибким - сокращён или расширен до полного состава (в соответствии со структурой БД, определённой приказом № 625) при реализации технологии МКБ-моделирования в виде отдельного программного комплекса или реализованного в составе СППР.
В
ЗАКОНОМЕРНОСТИ ВЫБОРКИ ДАННЫХ
состав совокупности моделей, описывающих и адекватно представляющих анализируемую выборку данных, могут входить традиционные статические модели (блок 4 на рисунке 1) математической статистики (плотности и функции распределений вероятностей случайных событий, величин, процессов, корреляционные и регрессионные зависимости между значениями регистрируемых параметров и другие) [20]. Кроме статических могут быть построены и динамические модели (блок 4 на рисунке 1), отражающие разви-
тие процессов ликвидации пожаров (авто- и вза-имнокорреляционные функции, модели трендов, запаздывания, марковские, авторегрессионные модели и другие) [1, 2]. Спектр моделей этих двух групп очень широк, однако в силу ограниченного объёма публикации здесь рассмотрена лишь часть статических моделей, которые могут быть построены в рамках технологии МКБ-моделирования.
Важную группу статических моделей составляют уравнения регрессии [10, 20], отражающие статистическую зависимость того или иного показателя (в частности, ущерба или спасения) от параметров, отражающих влияние управляемых и (или) неуправляемых факторов. Такие модели могли бы быть использованы для построения прогнозных значений одних показателей по другим, например, в СППР. В рамках данного исследования анализ выполнен для различных вариантов парной и множественной регрессии приведённых выше трёх групп показателей. Однако явных закономерностей выявить не удалось, так как регрессионный анализ показал крайне низкие значения коэффициента детерминации (Я2) и других регрессионных метрик. Так, уравнение множественной регрессии, отражающее статистическую зависимость прямого материального ущерба (и, тыс. руб.) от интервалов времени реагирования имеет вид:
u = -1490,09 + 160,16т
- 21,83т б - 168,57т,
' приб ' 1ств
сообщ
+ 115,02Т1лок + 0)
+ 45,34т + 68,18т ,
лик.откр лик.посл
однако при этом Я2 = 0,009, что свидетельствует о том, что лишь около 1 % выходных данных могут быть описаны с помощью этого уравнения (в регрессионном анализе значимость модели считается приемлемой, если значение Я2 близко к единице). Аналогичные значения коэффициента детерминации имеют и другие уравнения как множественной, так и парной регрессии, построенные по анализируемой выборке БД.
Данная ситуация свидетельствует о том, что для рассматриваемой системы регистрации и представления данных о пожарах случайная составляющая зависимостей показателей является доминирующей и не даёт возможности выделить регулярные статистические зависимости между показателями, хранимыми в БД. Хотя, как показано в [2], для подобных данных, прошедших более высокую интеграцию и представленных в ежегодных статистических сборниках [21], значимые регрессионные зависимости могут быть построены.
Момент времени реагирования, мин. Момент времени реагирования, мин.
В (С) г(со
Рисунок 2. Статистические характеристики времени реагирования: а: -ф- эмпирическая плотность распределения вероятности; —■— гамма-распределения; б: -ф- эмпирическая плотность распределения; —■— плотность гамма-распределения; функция гамма-распределения; в: —■— плотность гамма-распределения 1; -ф- плотность гамма-распределения 2; -А- плотность гамма-распределения 3; плотность гамма-распределения 4; плотность гамма-распределения 5; плотность гамма-распределения 6; г: -А- функция гамма-распределения 1; —ф— функция гамма-распределения 2; —■— функция гамма-распределения 3; функция гамма-распределения 4; функция гамма-распределения 5; функция гамма-распределения 6 Figure 2. Statistical characteristics of the response time: a: -ф- empirical probability distribution density; -■- gamma distributions; b: -ф- empirical distribution density; -■- gamma distribution density; -A- gamma distribution function; c: -■- gamma distribution density 1; -ф- gamma distribution density 2; -A- gamma distribution density 3; -X- gamma distribution density 4; -ж- gamma distribution density 5; -•- gamma distribution density 6; d: -A- gamma distribution function 1; -ф- gamma distribution function 2; —■— gamma distribution function 3; gamma distribution function 4; -ж- gamma distribution function 5; -•- gamma distribution function 6
Обширную группу статических статистических моделей, необходимых для МКБ-моделиро-вания (блок 4 рисунка 1), составляют плотности и функции распределения вероятностей показателей, хранимых в БД. На рисунке 2 в качестве иллюстрации приведены некоторые из эмпирических и аппроксимирующих их распределений для показателей фаз (с 1 по 6) времени реагирования.
На рисунке 2, а приведена эмпирическая плотность распределения величины интервала времени между моментом получения сообщения о пожаре и моментом прибытия на пожар первого пожарно-спасательного подразделения. Там же отображена и аппроксимирующая его плотность гамма-распределения, параметры которого (а и в) определены методом наименьших квадра-
тов (МНК) [2, 20]. Для всех шести интервалов времени реагирования, определенных приказом 625, параметры (а и р) приведены в таблице 1.
Параметры распределений, приведенные в таблице, являются «сырьём» для генерации необходимого количества записей о пожарах (блок 5 на рисунке 1). Генерация может быть выполнена с учётом параметров, приведённых в таблице, например, методом обратных функций и генерации равномерно распределённых на интервале [0; 1] случайных величин.
Для ряда моделей динамики ликвидации пожара, и в частности, марковской модели смены фаз пожара [2], важным является представление всех событий реагирования в единой временной последовательности, где каждое из шести
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
Таблица 1 (Table 1)
Параметры гамма-распределения, аппроксимирующего интервалы времени реагирования Parameters of the gamma-distribution approximating the response time intervals
Интервал времени между соседними событиями, а также от обнаружения Для интервалов между соседними событиями Для интервалов от обнаружения пожара
пожара до текущего события, мин. ■ а в а в
До сообщения о пожаре Тсообщ 0,821 4,558 0,821 4,558
До прибытия первого подразделения тприб 2,514 3,105 3,084 2,778
До подачи первого ствола Т1ств 6,108 0,125 3,629 2,729
До локализации пожара Т1лок 1,369 4,636 2,691 7,078
До ликвидации открытого горения Тликоткр 0,818 18,413 2,236 12,310
До ликвидации последствий пожара тликпосл 0,592 48,693 1,737 28,838
событий (от сообщения о пожаре до ликвидации последствий) расположено на единой оси времени как моменты этих событий. При этом началом координаты времени является событие обнаружения пожара. Каждый из моментов времени этих событий (на единой оси времени) также является случайной величиной, сформированной как сумма предыдущих интервалов. Одна из этих величин (момент времени ликвидации открытого горения) приведена на рисунке 2, б, где представлены: эмпи-
рическая плотность распределения, вычисленная по анализируемой выборке, аппроксимирующие её плотность и функция гамма-распределения. Параметры этих гамма-распределений (для интервалов от момента обнаружения пожара) приведены в последних двух колонках таблицы 1, а соответствующие графики - на рисунках 1, в и 1, г.
Аналогично временным характеристикам реагирования (непрерывные случайные величины) может быть выполнено оценивание [2, 10, 20] и представлены статистические распределения дискретных случайных величин (количество погибших и травмированных людей, этажность зданий и другие) из всех трёх групп показателей, приведённых выше.
К числу важных для решения прикладных задач дискретных показателей, перечисленных выше и относящихся к группе результатов принятия решений, относятся ресурсы (автомобильная техника и другие средства ликвидации пожара). Статистический анализ распакованных полей 54 и 55 рассматриваемой выборки из БД показал, что из 71 вида пожарной техники, приведённой в классификаторе, из числа 2 639 записей, охватывающих 21 год, лишь 14 типов использовались более чем 15 раз и 36 типов - хотя бы один раз. Чаще всего привлекались автоцистерны (код 11). Таблица количества привлечённой за анализируемый период автотехники (14 наиболее востребованных типов) приведена в таблице 2.
Ещё одной важной стороной статистических свойств привлекаемой техники является частота
Таблица 2 (Table 2)
Частота использования типов и количества наиболее востребованной техники Frequency of use of the most demanded equipment types and quantity
Код Вид техники Количество пожаров, в которых привлекался вид техники Количество единиц привлеченной техники
11 Пожарная автоцистерна 2 821 7 650
29 Пожарный штабной автомобиль 468 499
23 Пожарная автолестница 285 347
32 Другие неприспособленные для тушения машины и оборудование 62 102
27 Пожарный автомобиль газодымозащитной службы 68 81
31 Приспособленная и переоборудованная для тушения техника 67 80
14 Пожарный автомобиль насосно-рукавный 55 62
15 Пожарный автомобиль пенного тушения 41 52
43 Пожарный аварийно-спасательный автомобиль 44 49
33 Пожарный рукавный автомобиль 36 46
12 Пожарная автонасосная станция 31 42
24 Пожарный коленчатый автоподъёмник 32 39
45 Пожарный автомобиль первой помощи 24 28
28 Пожарный автомобиль связи и освещения 26 27
0,35
0,3
0,25
.а
ст о
£ 0,2 о
Œ
е
m
0,15
0,1
0,05
0
Рисунок 3. Гистограмма частоты (вероятностей) привлечения различного количества автоцистерн (код 11) Figure 3. Histogram of the frequency (probabilities) of attracting a different number of tankers (code 11)
0
1
01234567
8 9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Количество
привлечения того или иного количества вида техники. Так, частота привлечения автоцистерн отображена на рисунке 3.
В состав статистических моделей количества привлекаемой автотехники (используемых в блоке 5 на рисунке 1) должны входить все 36 гистограмм (по каждому виду техники, аналогичные приведённому на рисунке 3), как дискретных распределений вероятностей количества техники.
Ещё одной важной стороной МКБ-модели-рования, позволяющей обеспечить адекватность сгенерированной выборки исходной (блок 7 рисунка 1), является обеспечение коррелированно-сти значений различных показателей, как внутри каждой группы (например, видов техники), так и между произвольными параметрами. Формально это можно сделать вычислением статистических оценок коэффициентов корреляции между параметрами по анализируемой выборке, однако для учёта коррелированности показателей в блоке генерации (блок 5 рисунка 1 ) предлагается строить парные уравнения регрессии между различными парами показателей. В этом случае создаётся достаточно простой механизм генерации новой выборки (блок 5 рисунка 1) - средние значения могут быть вычислены по соответствующим уравнениям парной регрессии, а аддитивное рассеяние относительно среднего значения генерируемого параметра может быть получено как нормально распределённая случайная величина с нулевым математическим ожиданием и стандартным (сред-неквадратическим) отклонением, равным стандартной ошибке (5) уравнения регрессии, получа-
емой как одна из метрик регрессионного анализа.
Из изложенного выше следует, что в состав СЦД могут входить две основные группы статистических моделей:
- значимые парные и (или) множественные регрессионные модели, отражающие статистические взаимосвязи различных показателей, имеющихся в БД и необходимых для машинного обучения целевых прикладных моделей;
- функции (плотности) распределения вероятностей, аппроксимирующие исходную (из БД) выборку показателей, необходимых для построения (машинного обучения) целевых прикладных моделей.
Если необходимых для построения целевых моделей значимых регрессионных моделей нет (то есть все параметры не коррелированы), то СЦД будет состоять лишь из распределений необходимых параметров.
ВЫВОДЫ
1. В связи с широким использованием во всем мире технологий искусственного интеллекта и, в частности, машинного обучения нейронных сетей и других моделей, для обеспечения более оперативного внедрения информационно-аналитических технологий в практику управления ликвидацией пожаров представляется целесообразным не ограничиваться лишь хранящимися в БД записями, часто ограниченного объёма и с большим количеством некорректностей, а построить на их основе СЦД с последующей гене-
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
рацией необходимого объёма и состава данных, например, методом обратных функций. При этом, естественно, должны быть обеспечены требования достаточной адекватности СЦД исходной выборке.
2. Выполненная предварительная обработка исходных статистических данных о пожарах на топливно-энергетических предприятиях за период с 2000 по 2020 гг. позволила откорректировать форматы и отсеять часть данных, содержащих некорректности или явные искажения, что создало предпосылки для построения более адекватных моделей на их основе.
3. Выполненные исследования, результатами которых являются основные статистические характеристики данных о пожарах, позволяют формировать новые наборы данных в объёмах, необходимых для построения статистически надёжных моделей описания, развития и управления ликвидацией пожаров. Данный подход является одной из форм ныне широко применяемого подхода, называемого бутстрепом (размножением данных), на котором основаны практически все алгоритмы машинного обучения нейросетей в несколько эпох (циклов обучения).
4. Предложенный подход позволяет «расслаивать» данные, выделяя из исходной полной
базы данных лишь те подмножества, которые могут представлять интерес для конкретного исследования и строить СЦД по ним. Так, в данной работе рассмотрены лишь данные по топливно-энергетическим предприятиям, но возможны отборы, с последующим статистическим анализом (построением СЦД), как внутри этого множества данных, так и в других множествах.
5. Основными направлениями развития исследования, представленного в данной работе, являются построение программного комплекса, позволяющего:
- выполнять кластеризацию данных, из исходных БД, по ряду признаков, представляющих интерес для конечного пользователя;
- проводить первичную обработку данных, в частности, коррекцию форматов данных, отбраковку (фильтрацию) «выпадающих» фрагментов данных;
- выполнять генерацию набора данных необходимого объёма для использования в исследовательских или прикладных целях;
- выполнять разметку генерируемых по СЦД записей данных по критериям, заданным конечным пользователем, для дальнейшего их использования в машинном обучении нейросетевых моделей.
СПИСОК ИСТОЧНИКОВ
1. Топольский Н. Г., Бутузов С. Ю., Вилисов В. Я. Информационно-аналитические модели поддержки управления при ликвидации пожаров и чрезвычайных ситуаций. М.: Академия ГПС МЧС России. 2021. 216 с.
2. Топольский Н. Г., Вилисов В. Я. Методы, модели и алгоритмы в системах безопасности: машинное обучение, робототехника, страхование, риски, контроль. М.: РИОР. 2021. 475 с. 001:10.29039/02072-2
3. Брушлинский H. H, Брушлинская Г. К. О продолжительности и частоте одновременного обслуживания нескольких вызовов пожарными подразделениями города // Сборник научных трудов «Вопросы экономики в пожарной охране». М.: ВНИИПО МВД СССР. 1975. № 4. С. 34-38.
4. Порошин А. А., Кондашов А. А., Бобринев Е. В., Удавцова Е. Ю. Оценка количества одновременных пожаров в населённых пунктах по сезонам года // Технологии техносферной безопасности. 2022. Вып. 3 (97). С. 25-36. D0I:10.25257/TTS.2022.3.97.25-36
5. Брушлинский Н. Н, Соколов С. В., Григорьева М. П. Об организации систем обеспечения безопасности городов // Технологии техносферной безопасности. 2022. Вып. 3 (97). С. 84-99. D0I:10.25257/TTS.2022.3.97.84-99
6. Хабибулин Р. Ш. Кластерный анализ в области предупреждения и ликвидации пожаров и чрезвычайных ситуаций // Технологии техносферной безопасности. 2022. Вып. 3 (97). С. 202-214. D0I:/10.25257/TTS.2022.3.97.202-214
7. Брушлинский Н. Н, Соколов С. В. Алехин Е. М., Ко-ломиец Ю .И., Вагнер П. Опыт применения компьютерных имитационных систем моделирования деятельности экстренных служб // Пожаровзрывобезопасность. 2016. Том 25. № 8. С. 6-16. D0I:10.18322/PVB.2016.25.08.6-16
8. Cavdur F., Sebatli A. A decision support tool for allocating temporary-disaster-response facilities [Электронный ресурс] // Decision Support Systems. 2019. Volume 127. Режим обращения:
https://www.sci-hub.rU/10.1016/j.dss.2019.113145 (дата обращения 20.06.2023) D0I:10.1016/j.dss.2019.113145
9. Fertier A. Barthe-Delanoё A.-M, Montarnal A, Truptil S., Benaben F. A new emergency decision support system: the automatic interpretation and contextualisation of events to model a crisis situation in real-time // Decision Support Systems. 2020. № 133. Режим доступа: https://www.sciencedirect.com/science/ article/abs/pii/S0167923620300154
10. Вилисов В. Я. Адаптивный выбор управленческих решений. Саарбрюкен: LAP LAMBERT Academic Publishing. 2011. 376 с.
11. Ларичев О. И., Мошкович Е. М. О возможностях получения от человека непротиворечивых оценок многомерных альтернатив // Дескриптивный подход к изучению процессов принятия решений при многих критериях. Сб. трудов ВНИИСИ. 1980. Вып. 9. С. 3-26.
12. Орлов А. И. Искусственный интеллект: экспертные оценки. М.: Изд-во IPR Media. 2022. 436 с. D0I:10.23682/117030
13. Брушлинский Н. Н., Соколов С. В., Алёхин Е. М., Вагнер П., Коломиец Ю. И. Безопасность городов. Имитационное моделирование городских процессов и систем. М.: ФАЗИС. 2004. 172 с.
14. Соколов С. В., Судаков Е. А. Анализ и оценка времени прибытия пожарных подразделений к местам вызовов в Санкт-Петербурге в 2006-2015 гг. // Технологии техносферной безопасности. 2016. Вып. 2(66). С. 1-8.
15. New machine learning theory raises questions about nature of science [Электронный ресурс] // Режим доступа: https://phys.org/news/2021-02-machine-theory-nature-science. html (дата обращения 20.07.2023).
16. Macqueron C. Computational Fluid Dynamics Modeling of a wood-burning stove-heated sauna using NIST's Fire Dynamics Simulator 2009. С. 1-9 [Электронный ресурс] // Режим доступа: https://arxiv.org/abs/1404.6774v1 (дата обращения 20.07.2023). D0I:10.48550/arXiv.1404.6774
17. Yun K., Bustos J., Lu T. Predicting Rapid Fire Growth (Flashover) Using Conditional Generative Adversarial Networks. 2018. С. 1-4 [Электронный ресурс] // Режим доступа: https:// arxiv.org/abs/1801.09804 (дата обращения 25.05.2021).
18. Zhanga J., Seyfried A. Empirical characteristics of different types of pedestrian streams. 2012. С. 1-8 [Электронный ресурс]. Режим доступа: https://arxiv.org/abs/1207.5931 (дата обращения 20.07.2023).
19. Stroh R. [et al]. Gaussian process modeling for stochastic multi-fidelity simulators, with application to fire safety. 2016. С. 1-6 [Электронный ресурс] // Режим доступа: https://arxiv.org/ abs/1605.02561 (дата обращения 20.07.2023).
20. Федоров В. В. Теория оптимального эксперимента. М.: Наука. 1971. 312 с.
21. Пожары и пожарная безопасность в 2016 г. // Статистический сборник. М.: ВНИИПО. 2017. 124 с.
REFERENCES
1. Topolsky N.G., Butuzov S.Yu., Vilisov V.Ya. Informatsionno-analiticheskie modeli podderzhki upravleniia pri likvidatsii pozharov i chrezvychainykh situatsii [Information and analytical models of management support in the elimination of fires and emergencies]. Moscow, State Fire Academy of EMERCOM of Russia Publ., 2021. 216 p. (in Russ.).
2. Topolsky N.G, Vilisov V.Ya. Methods, models and algorithms in security systems: machine learning, robotics, insurance, risks, control. RIOR, Publishing Center, 2021. 475 p. (in Russ.). DOI:10.29039/02072-2
3. Brushlinsky N.N., Brushlinskaya G.K. On the duration and frequency of simultaneous servicing of several calls by fire departments of the city. Collection of scientific papers "Issues of economics in fire protection". Moscow, All-Russian Research Institute for Fire Protection of the Ministry of Internal Affairs of the USSR. 1975, no. 4, pp. 34-38 (in Russ.).
4. Poroshin A.A., Kondashov A.A., Bobrinev E.V., Udavtsova E.Iu. Estimation of the number of simultaneous fires in settlements by seasons of the year. Tehnologii tehnosfernoj bezopasnosti - Technology of technosphere safety. 2022, vol. 3 (97), pp. 25-36 (in Russ.). DOI:10.25257/TTS.2022.3.97.25-36
5. Bruslinskiy N.N., Sokolov S.V., Grigorieva M.P. About organization of fire safety systems in cities. Tehnologii tehnosfernoj bezopasnosti - Technology of technosphere safety. 2022, vol. 3 (97), pp. 84-99 (in Russ.). DOI:10.25257/TTS.2022.3.97.84-99
6. Khabibullin R.Sh. Cluster analysis in the field of prevention and elimination of fires and emergencies. Tehnologii tehnosfernoj bezopasnosti - Technology of technosphere safety. 2022, vol. 3 (97), pp. 202-214 (in Russ.). DOI:/10.25257/TTS.2022.3.97.202-214
7. Brushlinskiy N.N., Sokolov S.V., Alekhin E.M., Kolomiets Yu.I., Wagner P. Computer systems simulating activities of municipal emergency services. Pozharovzryvobezopasnost - Fire and Explosion Safety, 2016, vol. 25, no. 8, pp. 6-16 (in Russ.). DOI:10.18322/PVB.2016.25.08.6-16.
8. Cavdur F., Sebatli A. A decision support tool for allocating temporary-disaster-response facilities. Decision Support Systems. 2019, vol. 127. Available at: https://www.sci-hub.ru/ 10.1016/j.dss.2019.113145 (accessed July 20, 2023) (in Eng.). DOI:10.1016/j.dss.2019.113145
9. Fertier A. Barthe-Delanoe A.-M., Montarnal A., Truptil S., Bénaben F.A new emergency decision support system: the automatic interpretation and contextualisation of events to model a crisis situation in real-time // Decision Support Systems. 2020, vol. 133. Available at: sciencedirect.com/science/article/pii/ S0167923620300154 (accessed July 20, 2023) (in Eng.).
10. Vilisov V.Ya. Adaptivnyi vybor upravlencheskikh reshenii [Adaptive choice of management decisions]. Saarbrücken, LAP LAMBERT Academic Publishing. 2011. 376 p.
11. Larichev O.I., Moshkovich E.M. On the possibilities of obtaining consistent estimates of multidimensional alternatives from a person. In: Deskriptivnyi podkhod k izucheniiu protsessov priniatiia reshenii pri mnogikh kriteriiakh. Sb. trudov [A descriptive approach to the study of decision-making processes under many criteria. Proceedings of Russian lighting research institute named after Sergey Vavilov Publ., 1980, iss. 9, pp. 3-26 (in Russ.).
12. Orlov A.I. Iskusstvennyi intellekt: ekspertnye otsenki [Artificial intelligence: expert assessments]. Moscow, Publishing house IPR Media. 2022, 436 p. (in Russ.). D0l:10.23682/117030
13. Brushlinsky N.N., Sokolov S.V., Alekhine E.M., Wagner P., Kolomiets Yu.I. Bezopasnost' gorodov. Imitatsionnoe modelirovanie gorodskikh protsessov i system [Safety of cities. Simulation modeling of urban processes and systems. Moscow, PHASIS Publ., 2004, 172 p. (in Russ.).
14. Sokolov S.V., Sudakov E.A. Analysis and evaluation of the response time of fire units in St. Petersburg from 2006 to 2015. Tehnologii tehnosfernoj bezopasnosti - Technology of technosphere safety. 2016, vol. 2 (66), pp. 1-8.
15. New machine learning theory raises questions about nature of science. Available at: https://phys.org/news/2021-02-machine-theory-nature-science.html (accessed July 20, 2023) (in Eng.).
16. Macqueron C. Computational Fluid Dynamics Modeling of a wood-burning stove-heated sauna using NIST's Fire Dynamics Simulator 2009, pp. 1-9. Available at: https://arxiv.org/ abs/1404.6774v1 (accessed July 20, 2023) (in Eng.). D0I:10.48550/arXiv.1404.6774
17. Yun K., Bustos J., Lu T., Predicting Rapid Fire Growth (Flashover) Using Conditional Generative Adversarial Networks. 2018, pp. 1-4. Available at: https://arxiv.org/abs/1801.09804 (accessed May 25, 2021) (in Eng.).
18. Zhanga J., Seyfried A. Empirical characteristics of different types of pedestrian streams. 2012, pp. 1-8. Available at: https://arxiv.org/abs/1207.5931 (accessed July 20, 2023) (in Eng.).
19. Stroh R. [et al]. Gaussian process modeling for stochastic multi-fidelity simulators, with application to fire safety. 2016, pp. 1-6. Available at: https://arxiv.org/abs/1605.02561 (accessed July 20, 2023) (in Eng.).
20. Fedorov V.V. Teoriia optimafnogo eksperimenta [Theory of optimal experiment. Moscow, Nauka Publ., 1971. 312 p. (in Russ.).
21. Fires and fire safety in 2016. Statistical collection. Moscow, All-Russian Research Institute for Fire Protection of EMERCOM of Russia Publ., 2017. 124 p. (in Russ.).
ИНФОРМАЦИЯ ОБ АВТОРАХ Валерий Яковлевич ВИЛИСОВ
Доктор технических наук, доктор экономических наук, профессор,
профессор кафедры прикладной математики, информатики
и вычислительной техники,
МГТУ им. Н. Э. Баумана (Мытищинский филиал),
Мытищи, Российская Федерация
SPIN-код: 4477-1400
AuthorID: 521423
ORCID: https://orcid.org/0000-0002-2612-8593 Scopus Author ID: 57205441277 ResearcherID: P-1650-2019 [email protected]
INFORMATION ABOUT THE AUTHORS Valery Ya. VILISOV
Grand Doctor in Engineering, Grand Doctor in Economics, Professor,
Professor of the Department of Applied Mathematics,
Informatics and Computer Engineering,
Mytischi Branch of Bauman Moscow State Technical University,
Mytischi, Russian Federation
SPIN-rafl: 4477-1400
AuthorID: 521423
ORCID: https://orcid.org/0000-0002-2612-8593 Scopus Author ID: 57205441277 ResearcherID: P-1650-2019 [email protected]
FIRE AND EMERGENCIES: PREVENTION, ELIMINATION. 2023. No. 3
Ренат Шамильевич ХАБИБУЛИН H
Кандидат технических наук, доцент,
начальник учебно-научного комплекса автоматизированных систем и информационных технологий,
Академия ГПС МЧС России, Москва, Российская Федерация SPIN-код: 1759-3385 AuthorID: 637284
ORCID: https://orcid.org/0000-0003-1816-1665 Scopus AuthorID: 6506192400 Researcher ID: A-4261-2016 H [email protected]
Renat Sh. KHABIBULIN H
PhD in Engineering, Associate Professor,
Head of the educational and scientific complex of automated systems and information technologies,
State Fire Academy of EMERCOM of Russia, Moscow, Russian Federation SPIN-KOA: 1759-3385 AuthorID: 637284
ORCID: https://orcid.org/0000-0003-1816-1665 Scopus AuthorID: 6506192400 Researcher ID: A-4261-2016 H [email protected]
Поступила в редакцию 23.06.2023 Принята к публикации 19.09.2023
Received 23.06.2023 Accepted 19.09.2023
Для цитирования:
Вилисов В. Я, Хабибулин Р. Ш. Статистический анализ и моделирование данных о ликвидации пожаров на топливно-энергетических предприятиях //
Пожары и чрезвычайные ситуации: предупреждение, ликвидация. 2023. № 3. С. 63-74. 00!:10.25257/РБ.2023.3.б3-74
For citation:
Vilisov V.Ya., Khablbulln R.Sh. Statistical analysis and modeling data on eliminating fires at fuel and energy enterprises. Pozhary i chrezvychaynyye situatsii: predotvrashcheniye, likvidatsiya -Fire and emergencies: prevention, elimination, 2023, no. 3, pp. 63-74. (in Russ.). DO1:10.25257/FE.2023.3.63-74