УДК 614.849
АЛГОРИТМ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ПРОГНОЗИРОВАНИИ УЩЕРБА ОТ ПОЖАРОВ
Валерий Ильич Куватов; Дмитрий Алексеевич Колеровн.
Санкт-Петербургский университет ГПС МЧС России, Санкт-Петербург, Россия [email protected]
Аннотация. Задача снижения ущерба от пожаров является одной из наиболее важных. Для ее решения полезными оказываются модели деления пожароопасных объектов на кластеры, различающиеся по величине ущерба. Получить адекватные математические модели этого типа во многих случаях невозможно в силу их трудной формализации. Налицо противоречие между требованиями адекватности моделей кластеризации и возможностями методов математического моделирования. Один из наиболее продуктивных путей разрешения этого противоречия связан с разработкой моделей на основе технологий интеллектуального анализа больших данных. В статье представлена модель, позволяющая поделить все поднадзорные объекты на кластеры, различающиеся по величине ущерба от пожара. Ущерб от пожара определяется по величине материального ущерба, по количеству погибших и травмированных. Для деления множества пожароопасных объектов на кластеры был использован один из методов интеллектуального анализа данных - иерархический кластерный анализ. В результате все объекты окажутся поделенными на кластеры, ранжированные по величине ущерба от пожара. В отличие от классических моделей эта модель позволяет учитывать особенности реальных пожаров и за счет этого повышать адекватность результатов кластеризации. На этапе профилактики такое деление дает возможность подразделениям государственного пожарного надзора обратить особое внимание на наиболее опасные в пожарном отношении объекты, а руководителю тушения пожара в ходе тушения правильно определить необходимое количество сил и средств, выбрать наиболее подходящий способ тушения.
Ключевые слова: адекватность, иерархический кластерный анализ, интеллектуальный анализ больших данных, показатель ущерба, пожароопасный объект, прогнозирование, риск, обучение без учителя, ущерб от пожара, факторы пожара
Для цитирования: Куватов В.И., Колеров Д.А. Алгоритм интеллектуальной поддержки принятия решений при прогнозировании ущерба от пожаров // Науч.-аналит. журн. «Вестник С.-Петерб. ун-та ГПС МЧС России». 2022. № 3. С. 119-127.
INTELLGENT DECISION SUPPORT ALGORITHM FOR FIRE DAMAGE PREDICTION
Valery I. Kuvatov; Dmitry A. KolerovH.
Saint-Petersburg university of State fire service of EMERCOM of Russia, Saint-Petersburg, Russia [email protected]
Abstract. The task of reducing damage from fires is one of the most important. To solve this problem by the forces and means of the state fire service, among other things, models of dividing fire hazardous objects into clusters that differ in the amount of damage turn out to be useful. In many cases, it is impossible to obtain adequate mathematical models of this type due to their difficult formalization. There is a contradiction between the requirements for the adequacy of clustering models and the possibilities of mathematical modeling methods. One of the most
© Санкт-Петербургский университет ГПС МЧС России, 2022
119
productive ways to resolve this contradiction is related to the development of models based on big data mining technologies. The article presents a model that allows dividing all supervised objects into clusters that differ in the amount of damage from a fire. Damage from a fire is determined by the amount of material damage, by the number of dead and injured. To divide the set of fire hazardous objects into clusters, one of the methods of data mining was used - hierarchical cluster analysis. As a result, all objects will be divided into clusters, ranked by the amount of damage from the fire. Unlike classical models, this model makes it possible to take into account the features of real fires and, due to this, to increase the adequacy of the clustering results. At the prevention stage, such a division allows the state fire supervision departments to pay special attention to the most dangerous objects in terms of fire, and the fire extinguishing manager during the extinguishing process correctly determines the required amount of forces and means, and chooses the most appropriate extinguishing method.
Keywords: adequacy, hierarchical cluster analysis, big data mining, damage index, fire hazardous object, forecasting, risk, unsupervised learning, fire damage, fire factors
For citation: Kuvatov V.I., Kolerov D.A. Intelligent decision support algorithm for fire damage prediction // Nauch.-analit. jour. «Vestnik S.-Petersb. un-ta of State fire service of EMERCOM of Russia». 2022. № 3. P.119-127.
Введение
Известно, что в России ежегодно возникает 140-150 тыс. возгораний, в которых гибнет более 500 чел. (на 2021 г. - 529 чел.), а материальный ущерб исчисляется миллиардами рублей [1]. Основная роль в решении задачи по снижению социального и материального ущерба от пожаров возложена на Государственную противопожарную службу МЧС России.
В настоящее время в МЧС России существует множество статистических данных по величине ущерба от пожаров [2] и множество моделей, построенных на основе этой статистики, и классических методов моделирования [3-5]. Модели кластеризации, построенные на основе классических методов моделирования, не могут учитывать все факторы, влияющие на ход и исход пожара. Это связано с большим разнообразием типов пожароопасных объектов и их характеристик, причин возгорания и необходимостью определения законов распределения вероятностей многочисленных факторов пожара, ряд из которых в отдельности может быть малозначимым, но совместно они могут оказывать значительное влияние на величину ущерба.
Таким образом, получить адекватные классические модели разделения пожароопасных объектов на кластеры, различающиеся по величине ущерба от пожара, во многих случаях невозможно в силу их трудной формализации. Налицо противоречие между требованиями адекватности моделей кластеризации и возможностями методов математического моделирования. Один из наиболее продуктивных путей разрешения данного противоречия связан с технологией интеллектуального анализа больших данных [6], что и определяет актуальность статьи.
Величина ущерба для объектов каждого кластера не может быть рассчитана точно, а может быть только спрогнозирована. Прогнозирование это одна из важнейших функций управления процессами принятия решений по снижению ущерба от пожара.
Научная задача заключается в установлении способа выявления закономерности деления пожароопасных объектов на кластеры, различающиеся по величине ущерба от пожаров.
Целью статьи является разработка модели, которая позволит делить все поднадзорные объекты на кластеры, различающиеся по величине материального ущерба от пожаров, по количеству погибших и травмированных.
Новизна результатов заключается в разработке новой модели деления пожароопасных объектов на кластеры по величине ущерба от пожара. В основе модели лежит иерархический кластерный анализ и технология обработки больших данных. В отличие от классических моделей эта модель позволяет учитывать особенности реальных пожаров и за счет этого повышать адекватность результатов кластеризации.
120
Практическая значимость заключается в том, что на этапе профилактики такое деление дает возможность подразделениям государственного пожарного надзора, в дополнение к требованиям руководящих документов обратить особое внимание на наиболее опасные в пожарном отношении объекты, а руководителю тушения пожара в ходе тушения -правильно определить необходимое количество сил и средств, выбрать наиболее подходящий способ тушения.
Кластерная модель прогнозирования ущерба от пожаров предназначена для такого деления пожароопасных объектов, чтобы объекты, входящие в один кластер, были максимально «похожи», а объекты из разных кластеров - максимально «различны» [7, 8]. Существует два вида кластерного анализа: иерархический и анализ k средних. В модели применяется иерархический кластерный анализ, который показывает хорошие результаты при меньшем объеме обучающей выборки, чем метод k средних. Модель относится к группе моделей машинного обучения без учителя.
На этапе обучения модель анализирует множество обучающих примеров - пожаров с известными характеристиками объекта пожара, причинами возникновения, известной величиной количества погибших, травмированных и материального ущерба, имевших место в прошлом. Затем, модель самостоятельно делит эти пожары на кластеры и определяет характеристики каждого кластера.
На этапе применения модели предъявляется новый, не входящий в обучающую выборку пожароопасный объект. Модель определяет, к какому кластеру относится этот объект. По номеру кластера в дальнейшем устанавливается прогнозируемая величина ущерба и меры для его снижения.
Иерархический кластерный анализ требует большого количества вычислений. Привести пример ручного определения кластеров даже для простейшего варианта данных о прошлых пожарах в рамках статьи невозможно. Для иллюстрации работы модели необходимы компьютерные программы. В модели используется иерархический кластерный анализ, в том виде, как он реализован в программном приложении SPSS [9, 10].
Суть модели, разработанной в данной статье, заключается в следующем. Пусть обучающая выборка состоит из Ывыб пожароопасных объектов.
1. Начальный этап. На начальном этапе каждый пожароопасный объект представляется в виде отдельного кластера. Следовательно, количество кластеров на начальном этапе равно количеству пожароопасных объектов обучающей выборки.
2. Объединение кластеров. На каждом из следующих этапов два ближайших по расстоянию кластера объединяются в один. В качестве расстояния между объектами принято эвклидово расстояние, которое является наиболее подходящим вариантом для показателей ущерба, представляемым в виде интервальных данных. Это расстояние определяется по формуле:
где 2ц, ..., 2га, 2у, 22], ..., - значения показателей ущерба 2г, ..., 2п для объектов г и ] соответственно. Расстояние между кластерами определяется по методу межгрупповой связи, в котором расстояние между кластерами есть среднее значение расстояний между всеми возможными парами объектов из объединяющихся кластеров. Пусть количество объектов в одном из объединяющихся кластеров равно к, а в другом - I. Тогда общее количество измерений между объектами объединяющихся кластеров будет равно к • I, а среднее расстояние между объектами по показателю ущерба 2Р равно:
Описание модели
(1)
121
где г.-у - расстояние между объектом г первого из объединяющихся кластеров и объектом /
второго кластера по показателю р. Существуют и другие методы определения расстояния между кластерами. Процесс объединения продолжается до тех пор, пока все пожароопасные объекты не окажутся поделенными на два кластера.
3. Определение оптимального количества кластеров. Анализируется расстояние между парами кластеров, полученных на каждом этапе объединения. Выясняется на каком этапе это расстояние увеличивается скачкообразно. Оптимальным является количество кластеров (Лопт), равное разности количества наблюдений (Лвыб) и количества этапов объединения, после которого расстояние увеличивается скачкообразно (иэт):
N = N *-П
"опт "выб "эт-
4. Интерпретация и профилирование кластеров. Вычисляются средние значения каждого показателя для каждого кластера. Эти вычисления необходимы для описания кластеров.
5. Оценка достоверности кластеризации. Вновь решается задача кластеризации. Но в качестве расстояния при ее решении принимается квадрат расстояния по Эвклиду:
4 = (21 , - ги)2 + (221 -12])2 + ■■■ + (2Ы - гп])2. (2)
Оптимальное количество кластеров, полученное для обоих вариантов расстояний, сравнивается. Если кластеры совпали, модель считается достоверной. В случае несовпадения анализируются иные этапы на предмет скачкообразного изменения расстояния между кластерами. Заметим, что в иерархическом кластерном анализе применяются и другие меры расстояния, например расстояние по Чебышеву.
Кластерная модель прогнозирования ущерба от пожаров в виде алгоритма представлена на рисунке.
Рассмотрим реализацию модели на примере. С учетом ограничений на объем статьи, а также для большей простоты и наглядности изложения в статье рассматривается только одна характеристика объекта пожара - тип объекта. В качестве показателей, характеризующих ущерб, нанесённый пожаром, принимается: Z1 - количество погибших на пожаре; Z2 - количество пострадавших на пожаре; Z3 - величина материального ущерба.
Прогнозируемая величина ущерба, нанесённого пожаром на конкретном объекте, задается точкой в трехмерном пространстве показателей ущерба с координатами Z1, Z2 и Z3. В качестве меры различия между объектами г и / по причине, объясненной выше, принято эвклидово расстояние ё/
¿ц = ^(2ц - 2^) + (221 - 22¡) + (231 - 23]) ,
где Z1г■, Z2i, Zзi, Z1j, Z2j, 23/ - значения показателей Z1, Z2, Z3 для объектов г и/ соответственно.
Пусть обучающая выборка состоит из статистических данных о пожарах в одном из регионов [11]. В результате содержательного анализа данных о пожарах выделено 12 групп объектов, и в каждой группе выделен типовой объект, обладающий усредненными показателями ущерба от пожара (табл. 1).
122
Рис. Алгоритм кластеризации пожароопасных объектов
Таблица 1. Обучающая выборка
№ Объект пожара Число Число Материальный
объекта погибших травмированных ущерб (тыс. у.е.)
1 Сарай 0 0 1
2 Газоконденсатная станция 1 3 40
3 Хозяйственная постройка 0 0 2
4 Жилой дом 3 4 3
5 Здание администрации 0 1 35
6 Нефтеперегонный завод 1 4 40
7 Баня 3 5 2
8 Завод строй оборудования 2 4 38
9 Автозаправочная станция 0 0 12
10 Сеновал 0 0 3
11 Склад мебели 0 0 7
12 Магазин 0 0 10
123
Представленные в табл. 1 пожароопасные объекты необходимо разделить, на кластеры по следующим критериям [12]:
- количество погибших;
- количество пострадавших;
- величина материального ущерба.
Результаты кластеризации, отображающиеся в SPSS, представлены в табл. 2.
Таблица 2. Таблица последовательности агломерации
Этап Объединяются Коэффициенты Этап первого появления кластера Следующий номер итерации
кластер 1 кластер 2 кластер 1 кластер 2
1 3 10 1 0 0 4
2 2 6 1 0 0 6
3 4 7 2 0 0 9
4 1 3 2,25 0 1 9
5 9 12 4 0 0 7
6 2 8 5,250 2 0 11
7 9 11 16 5 0 8
8 5 9 29,444 0 7 10
9 1 4 29,5 4 3 10
10 1 5 81,283 9 8 11
11 1 2 1110,691 10 6 0
Опишем назначение столбцов этой таблицы.
Столбец «Этап» показывает номер этапа кластеризации. Столбец «Объединяются» содержит 1 и 2 колонки, которые соответствуют номерам кластеров, объединяемых на данном этапе. После объединения кластеру присваивается номер, соответствующий номеру в колонке «Кластер 1» - меньшему номеру объединяющихся кластеров [13]. Так, на первом этапе в кластер объединяются объекты 3 и 10, кластеру присваивается номер 3; на втором этапе в кластер объединяются объекты 2 и 6, кластеру присваивается номер 2; на третьем этапе в кластер объединяются объекты 4 и 7, кластеру присваивается номер 4 и т.д.
Колонка «Коэффициенты» отражает расстояние между кластерами, которые объединяются на данном шаге. Колонка «Этап первого появления кластера» показывает этап, на котором до этого появлялся первый и второй из объединяемых кластеров. Последняя колонка «Следующий этап» показывает, на каком этапе вновь появится кластер, образованный на данном этапе.
Оценим оптимальное число кластеров по таблице последовательности агломерации -табл. 2. Из табл. 2 видно, что первый резкий скачок расстояния между классами наблюдается при переходе от 7 к 8 этапу. Следовательно, оптимальное количество кластеров - то, которое получено на 7 или 8 этапе. Это количество равно численности объектов минус номер шага, 12-7(8)=5(4). То есть все пожароопасные объекты (табл. 1) следует поделить на 5 или 4 кластера. Выбор того или иного решения будет зависеть уже от содержательных соображений. В статье выделено четыре кластера:
- кластер 1 (содержит объекты № 1, 3, 10) - объекты с незначительными последствиями от пожаров;
- кластер 2 (содержит объекты № 2, 6, 8) - объекты со значительным количеством погибших и травмированных на пожарах людей и ущербом от пожара;
- кластер 4 (содержит объекты № 4, 7) - объекты со значительным количеством погибших и травмированных на пожарах людей и незначительным ущербом от пожара;
124
- кластер 5 (содержит объекты № 5, 9, 11, 12) - объекты с незначительным количеством погибших и травмированных на пожарах людей и значительным ущербом от пожара.
На этапе оценки достоверности было проведено сравнение результатов кластеризации, выполненной при использовании эвклидова расстояния (формула (1), и квадрата эвклидова расстояния (формула (2). Проверка показала совпадение результатов. Следовательно, количество и характеристики кластеров определены правильно.
Таким образом, по типу и характеристикам объекта пожара можно определить ожидаемое количество погибших и травмированных, ожидаемую величину материального ущерба. Это позволит инспектору государственного пожарного надзора МЧС России ранжировать поднадзорные объекты по величине ущерба, а следовательно, более точно рассчитывать риск пожара как произведение величины ущерба на частоту возникновения пожаров, и уделять потенциально опасным объектам наибольшее внимание. В случае возникновения пожара на объекте, руководителю тушения пожара по ожидаемой величине ущерба легче оценить рациональное количество сил и средств, для его ликвидации выбрать метод.
Выводы
В статье показана возможность и целесообразность кластеризации пожароопасных объектов по величине материального ущерба, количеству погибших и травмированных методом иерархического кластерного анализа с помощью вышеописанной модели. Такая кластеризация позволит лицам, принимающим решения, ранжировать объекты по степени пожарной опасности и на этапе профилактики обратить особое внимание на наиболее опасные объекты, а на этапе тушения пожаров - определить необходимые силы и средства, способы тушения. Пример, иллюстрирующий применение модели, содержит всего 12 объектов, что обусловлено требованиями к объему статьи. Для реально работающей модели требуются намного большие объемы данных.
В дальнейшем предполагается разработать аналогичную модель в российской аналитической платформе Loginom, в которой более полно отражалась бы статистика по пожарам, учитывающая характеристики объектов, причины возгорания и специфические факторы пожаров.
Список источников
1. О состоянии защиты населения и территорий Российской Федерации от чрезвычайных ситуаций природного и техногенного характера в 2021 году: государственный доклад. М.: Акад. гражданской защиты МЧС России, 2022. 250 с.
2. Пожары и пожарная безопасность в 2021 году: стат. сборник / В.С. Гончаренко [и др.]. СПб.: ФГБУ ВНИИПО МЧС России, 2022. 114 с.
3. Системный анализ и принятие решений / В.С. Артамонов [и др.]. СПб.: С.-Петерб. ун-т ГПС МЧС России, 2017. 352 с.
4. Матвеев А.В. Методы моделирования и прогнозирования. СПб.: С.-Петерб. ун-т ГПС МЧС России, 2022. 230 с. ISBN 978-5-907116-73-3.
5. Богданова Е.М., Матвеев А.В. Классификация методов прогнозирования чрезвычайных ситуаций // Национальная безопасность и стратегическое планирование. 2018. № 4 (24). С. 61-70. EDN YTPZYL.
6. Куватов В.И., Малыгин И.Г., Смирнов А.С. Интеллектуальные технологии в системах управления МЧС России: учеб. пособие. СПб.: С.-Петерб. ун-т ГПС МЧС России, 2013.
7. Дали Ф.А. Кластерный анализ как инструмент управления пожароопасными событиями в социально-экономических системах населенных пунктов // Инженерный вестник Дона. 2021. № 8 (80). С. 117-126. EDN KHYYSL.
125
8. Применение кластерного анализа в решении задач управления пожароопасными событиями в социально-экономических системах / Г.Л. Шидловский [и др.] // Техносферная безопасность. 2021. № 1 (30). С. 72-78. EDN TOVDWO.
9. Куватов В.И., Юнцова О.С., Залаев Р.У. Методика формирования перечня проверяемых объектов для включения в ежемесячный план-график работы инспектора государственного пожарного надзора // Проблемы управления рисками в техносфере. 2010. № 1 (13). С. 6-10.
10. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. М.: Изд. дом ГУ ВШЭ, 2006. 280 с.
11. Tiutiunyk V., Ruban I., Tiutiunyk O. Cluster analysis of the regions of Ukraine by the number of the arisen emergencies // 2020 IEEE International Conference on Problems of Infocommunications. Science and Technology (PIC S&T). IEEE, 2020. С. 1-6.
12. A research of emergency classification based fuzzy AHP and cluster analysis / S. Shasha [et al.] // 2011 International Conference on Future Computer Science and Education. IEEE, 2011. С. 646-649.
13. Morris S.K., Nguyen C.K. A review of the cluster survey sampling method in humanitarian emergencies // Public health nursing. 2008. № 25(4). S. 370-374.
References
1. O sostoyanii zashchity naseleniya i territorij Rossijskoj Federacii ot chrezvychajnyh situacij prirodnogo i tekhnogennogo haraktera v 2021 godu: gosudarstvennyj doklad. M.: Akad. grazhdanskoj zashchity MCHS Rossii, 2022. 250 s.
2. Pozhary i pozharnaya bezopasnost' v 2021 godu: stat. sbornik / V.S. Goncharenko [i dr.]. SPb.: FGBU VNIIPO MCHS Rossii, 2022. 114 s.
3. Sistemnyj analiz i prinyatie reshenij / V.S. Artamonov [i dr.]. SPb.: S.-Peterb. un-t GPS MCHS Rossii, 2017. 352 s.
4. Matveev A.V. Methods of modeling and forecasting. SPb.: S.-Peterb. un-ty of State fire service of EMERCOM of Russia, 2022. - 230 p. ISBN 978-5-907116-73-3.
5. Bogdanova E.M., Matveev A.V. Classification of emergency forecasting methods // National Security and Strategic Planning. 2018. № 4 (24). S. 61-70. EDN YTPZYL.
6. Kuvatov V.I., Malygin I.G., Smirnov A.S. Intellektual'nye tekhnologii v sistemah upravleniya MCHS Rossii: ucheb. Posobie. SPb.: S.-Peterb. un-t GPS MCHS Rossii, 2013.
7. Dali F.A. Klasternyj analiz kak instrument upravleniya pozharoopasnymi sobytiyami v social'no-ekonomicheskih sistemah naselennyh punktov // Inzhenernyj vestnik Dona. 2021. № 8 (80). S. 117-126. EDN KHYYSL.
8. Primenenie klasternogo analiza v reshenii zadach upravleniya pozharoopasnymi sobytiyami v social'no-ekonomicheskih sistemah / G.L. Shidlovskij [i dr.] // Tekhnosfernaya bezopasnost'. 2021. № 1 (30). S. 72-78. EDN TOVDWO.
9. Zalaev R.U., Kuvatov V.I., Yuncova O.S. Metodika formirovaniya perechnya proveryaemyh ob"ektov dlya vklyucheniya v ezhemesyachnyj plan-grafik raboty inspektora gosudarstvennogo pozharnogo nadzora // Problemy upravleniya riskami v tekhnosfere. 2010. № 1 (13). S. 6-10.
10. Kryshtanovskij A.O. Analiz sociologicheskih dannyh s pomoshch'yu paketa SPSS. M.: Izd. dom GU VSHE, 2006. 280 s.
11. Tiutiunyk V., Ruban I., Tiutiunyk O. Cluster analysis of the regions of Ukraine by the number of the arisen emergencies // 2020 IEEE International Conference on Problems of Infocommunications. Science and Technology (PIC S&T). IEEE, 2020. S. 1-6.
12. A research of emergency classification based fuzzy AHP and cluster analysis / S. Shasha [et al.] // 2011 International Conference on Future Computer Science and Education. IEEE, 2011. S. 646-649.
13. Morris S.K., Nguyen C.K. A review of the cluster survey sampling method in humanitarian emergencies // Public health nursing. 2008. № 25 (4). S. 370-374.
126
Информация о статье:
Статья поступила в редакцию: 23.06.2022; одобрена после рецензирования: 04.09.2022; принята к публикации: 07.09.2022 The information about article:
The article was submitted to the editorial office: 23.06.2022; approved after review: 04.09.2022; accepted for publication: 07.09.2022
Информация об авторах:
Валерий Ильич Куватов, профессор кафедры системного анализа и антикризисного управления Санкт-Петербургского университета ГПС МЧС России (196105, Санкт-Петербург, Московский пр., д. 149), доктор технических наук, профессор, заслуженный работник высшей школы Российской Федерации, e-mail: [email protected]
Дмитрий Алексеевич Колеров, начальник кабинета кафедры системного анализа и антикризисного управления Санкт-Петербургского университета ГПС МЧС России (196105, Санкт-Петербург, Московский пр., д. 149), e-mail: [email protected]
Information about the authors:
Valery I. Kuvatov, professor of the department of system analysis and crisis management of the Saint-Petersburg university of State fire service of EMERCOM of Russia (196105, Saint-Petersburg, Moskovsky ave., 149), doctor of technical sciences, professor, honored worker of the higher school of the Russian Federation, e-mail: [email protected]
Dmitriy A. Kolerov, head of the office of the department of system analysis and crisis management of the Saint-Petersburg university of State fire service of EMERCOM of Russia (196105, Saint-Petersburg, Moskovsky ave., 149), e-mail: [email protected]
127