Научная статья на тему 'МЕТОД ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ С ПОМОЩЬЮ АССОЦИАТИВНЫХ СВЯЗЕЙ ПРИ ПРОГНОЗИРОВАНИИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ'

МЕТОД ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ С ПОМОЩЬЮ АССОЦИАТИВНЫХ СВЯЗЕЙ ПРИ ПРОГНОЗИРОВАНИИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
33
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНАЯ ПОДДЕРЖКА УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ / ПРОГНОЗИРОВАНИЕ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ / АССОЦИАТИВНЫЙ АНАЛИЗ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куватов Валерий Ильич, Горбунов Алексей Александрович, Колеров Дмитрий Алексеевич

Возникновению чрезвычайных ситуаций часто предшествуют разнообразные явления природно-климатического характера. Учет этих явлений позволяет разработать более точный прогноз возникновения и развития чрезвычайной ситуации, а на этой основе - своевременно разработать управленческие решения, в результате реализации которых будет значительно снижен ущерб от чрезвычайных ситуаций, включая снижение количества травмированного и погибшего населения.Анализ, выполненный при работе над статьей, показал, что для определения зависимости возникновения и развития чрезвычайных ситуаций от различных явлений целесообразно использовать один из разделов интеллектуального анализа - ассоциативный анализ данных. Поэтому задача интеллектуальной поддержки управленческих решений при прогнозировании чрезвычайных ситуаций с помощью ассоциативного анализа является исключительно актуальной.В статье рассмотрен научно-методический аппарат ассоциативного анализа связей между различными природно-климатическими явлениями и чрезвычайными ситуациями. Для иллюстрации использования аппарата была создана база данных транзакций. Применение к этой базе ассоциативного анализа позволило смоделировать различные сценарии развития событий, ведущие к возникновению чрезвычайных ситуаций.В результате ассоциативного анализа выявлены зависимости между началом ливневых дождей, наводнений и возникновением оползней, а также некоторые другие зависимости.В статье показано, что для решения даже простого примера поиска ассоциативных связей необходимо выполнить большое количество вычислений. Поэтому в деятельности должностных лиц МЧС России, при большом потоке данных о ЧС целесообразно использовать аналитические платформы типа Deductor или Loginom отечественной компании BaseGroup Labs.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHOD OF INTELLECTUAL SUPPORT FOR MANAGEMENT DECISIONS USING ASSOCIATIVE LINKS IN PREDICTING EMERGENCY SITUATIONS

The occurrence of emergency situations is often preceded by a variety of natural and climatic phenomena. Accounting for these phenomena makes it possible to develop a more accurate forecast for the occurrence and development of emergencies, and on this basis, to develop timely management decisions, as a result of which the damage from emergencies will be significantly reduced, including a decrease in the number of injured and dead people.The analysis performed while working on the article showed that in order to determine the dependence of the occurrence and development of emergencies on various phenomena, it is advisable to use one of the sections of intellectual analysis - associative data analysis. Therefore, the task of intellectual support for management decisions in predicting emergencies using associative analysis is extremely relevant.The article considers the scientific and methodological apparatus of the associative analysis of relationships between various natural and climatic phenomena and emergency situations. A transaction database has been created to illustrate the use of the machine. The application of associative analysis to this database made it possible to model various scenarios for the development of events leading to the occurrence of emergencies.As a result of the associative analysis, dependencies between the onset of heavy rains, floods and the occurrence of landslides, as well as some other dependencies, were revealed.The article shows that to solve even a simple example of the search for associative links, it is necessary to perform a large number of calculations. Therefore, in the activities of officials of the Ministry of Emergency Situations of Russia, with a large flow of data on emergencies, it is advisable to use analytical platforms such as Deductor or Loginom of the domestic company BaseGroup Labs.

Текст научной работы на тему «МЕТОД ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ С ПОМОЩЬЮ АССОЦИАТИВНЫХ СВЯЗЕЙ ПРИ ПРОГНОЗИРОВАНИИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ»

УДК 614.849

МЕТОД ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ С ПОМОЩЬЮ АССОЦИАТИВНЫХ СВЯЗЕЙ ПРИ ПРОГНОЗИРОВАНИИ ЧРЕЗВЫЧАЙНЫХ СИТУАЦИЙ

Валерий Ильич Куватов; Алексей Александрович Горбунов; Дмитрий Алексеевич Колеров

Санкт-Петербургский университет ГПС МЧС России, Санкт-Петербург, Россия иdima11rus@inbox.ru

Аннотация. Возникновению чрезвычайных ситуаций часто предшествуют разнообразные явления природно-климатического характера. Учет этих явлений позволяет разработать более точный прогноз возникновения и развития чрезвычайной ситуации, а на этой основе -своевременно разработать управленческие решения, в результате реализации которых будет значительно снижен ущерб от чрезвычайных ситуаций, включая снижение количества травмированного и погибшего населения.

Анализ, выполненный при работе над статьей, показал, что для определения зависимости возникновения и развития чрезвычайных ситуаций от различных явлений целесообразно использовать один из разделов интеллектуального анализа - ассоциативный анализ данных. Поэтому задача интеллектуальной поддержки управленческих решений при прогнозировании чрезвычайных ситуаций с помощью ассоциативного анализа является исключительно актуальной.

В статье рассмотрен научно-методический аппарат ассоциативного анализа связей между различными природно-климатическими явлениями и чрезвычайными ситуациями. Для иллюстрации использования аппарата была создана база данных транзакций. Применение к этой базе ассоциативного анализа позволило смоделировать различные сценарии развития событий, ведущие к возникновению чрезвычайных ситуаций.

В результате ассоциативного анализа выявлены зависимости между началом ливневых дождей, наводнений и возникновением оползней, а также некоторые другие зависимости.

В статье показано, что для решения даже простого примера поиска ассоциативных связей необходимо выполнить большое количество вычислений. Поэтому в деятельности должностных лиц МЧС России, при большом потоке данных о ЧС целесообразно использовать аналитические платформы типа Deductor или Loginom отечественной компании BaseGroup Labs.

Ключевые слова: интеллектуальная поддержка управленческих решений, прогнозирование чрезвычайных ситуаций, ассоциативный анализ, интеллектуальный анализ данных

Для цитирования: Куватов В.И., Горбунов А.А., Колеров Д.А. Метод интеллектуальной поддержки управленческих решений с помощью ассоциативных связей при прогнозировании чрезвычайных ситуаций // Науч.-аналит. журн. «Вестник С.-Петерб. ун-та ГПС МЧС России». 2022. № 2. С. 116-124.

© Санкт-Петербургский университет ГПС МЧС России, 2022

116

THE METHOD OF INTELLECTUAL SUPPORT FOR MANAGEMENT DECISIONS USING ASSOCIATIVE LINKS IN PREDICTING EMERGENCY SITUATIONS

Valery I. Kuvatov; Alexey A. Gorbunov; Dmitriy A. Kolerov^.

Saint-Petersburg university of State fire service of EMERCOM of Russia, Saint-Petersburg, Russia Bdima11rus@inbox.ru

Abstract. The occurrence of emergency situations is often preceded by a variety of natural and climatic phenomena. Accounting for these phenomena makes it possible to develop a more accurate forecast for the occurrence and development of emergencies, and on this basis, to develop timely management decisions, as a result of which the damage from emergencies will be significantly reduced, including a decrease in the number of injured and dead people.

The analysis performed while working on the article showed that in order to determine the dependence of the occurrence and development of emergencies on various phenomena, it is advisable to use one of the sections of intellectual analysis - associative data analysis. Therefore, the task of intellectual support for management decisions in predicting emergencies using associative analysis is extremely relevant.

The article considers the scientific and methodological apparatus of the associative analysis of relationships between various natural and climatic phenomena and emergency situations. A transaction database has been created to illustrate the use of the machine. The application of associative analysis to this database made it possible to model various scenarios for the development of events leading to the occurrence of emergencies.

As a result of the associative analysis, dependencies between the onset of heavy rains, floods and the occurrence of landslides, as well as some other dependencies, were revealed.

The article shows that to solve even a simple example of the search for associative links, it is necessary to perform a large number of calculations. Therefore, in the activities of officials of the Ministry of Emergency Situations of Russia, with a large flow of data on emergencies, it is advisable to use analytical platforms such as Deductor or Loginom of the domestic company BaseGroup Labs.

Keywords: intelligent support for management decisions, emergency forecasting, associative analysis, data mining

For citation: Kuvatov V.I., Gorbunov A.A., Kolerov D.A. The method of intellectual support for management decisions using associative links in predicting emergency situations // Nauch.-analit. jour. «Vestnik S.-Petersb. un-ty of State fire service of EMERCOM of Russia». 2022. № 2. P. 116-124.

Введение

При решении задач МЧС России часто возникает необходимость поиска связей между различными событиями. Знание таких связей позволяет решать задачи прогноза возникновения чрезвычайных ситуаций (ЧС), их хода и исхода. Один из эффективных методов поиска связей - метод ассоциативного анализа.

Ассоциативный анализ, как и многие другие методы интеллектуального анализа данных, состоит из двух этапов: разработка ассоциативных правил на основе обучающей выборки и анализ ЧС с использованием ассоциативных правил.

На этапе разработки ассоциативных правил специалисты формируют транзакционную базу данных, включающую все характеристики ЧС, имевших место в прошлом. Затем, анализируя эту базу данных, получают ассоциативные правила и формируют профили ЧС.

117

На этапе анализа конкретной ЧС, по ее характеристикам, находят профиль, к которому относится данная ЧС, и определяют недостающие характеристики. Если недостающие характеристики должны стать известны позже, например конечная величина ущерба от ЧС, количество травмированных и погибших, то их величины можно прогнозировать по известным характеристикам.

Общие сведения об ассоциативном анализе

Впервые задача ассоциативного анализа была сформулирована Френсисом Гальтоном и Вилгельмом Вундтом в 80-х гг. XX в. [1-3]. Начиная с 1993 г., эта задача получила широкое распространение для нахождения типичных шаблонов покупок, совершаемых в магазинах. Было обнаружено, что если товары, входящие в такой шаблон, выложить на полках магазина рядом, то люди чаще покупают оба этих товара, чем если бы каждый из них лежал отдельно. В результате объемы покупок и прибыль магазинов увеличивается. Вскоре область применения ассоциативного анализа значительно расширилась. В настоящее время он применяется при интеллектуальном анализе данных во многих областях, в том числе в задачах предупреждения и ликвидации ЧС, задачах ликвидации последствий ЧС. Приведем терминологию, применяемую в ассоциативном анализе, с учетом специфики МЧС России [4].

Транзакция - запись о множестве событий, которые произошли и которые характеризуют отдельно взятую конкретную ЧС или несколько ЧС. Каждая транзакция состоит из уникального номера транзакции (ТГО) и перечня характеристик ЧС, соответствующей этому номеру. Ряд характеристик транзакции является устойчивым для данной ЧС. При возникновении аналогичной ЧС они вновь будут иметь место. А ряд характеристик являются случайными.

Регистрируя все ЧС с течением времени, можно накопить огромную транзакционную базу данных, содержащую десятки и сотни тысяч записей. Пример фрагмента транзакционной базы данных приведен в табл. 1.

Таблица 1. Фрагмент транзакционной базы данных о чрезвычайных ситуациях

№ транзакции Перечень природных ЧС

1 Оползень, ливневые дожди, наводнение, землетрясение

2 Смерч

3 Нагонный ветер, бурное таяние снегов, наводнение

4 Оползень, бурное таяние снегов, наводнение, сель, землетрясение

5 Оползень, цунами, землетрясение

6 Нагонный ветер, оползень, ливневые дожди, наводнение

7 Бурное таяние снегов, сель

8 Оползень, бурное таяние снегов, ливневые дожди, наводнение

В этом фрагменте представлены восемь записей с девятью ЧС и событиями, связанными с этими ЧС. Первая колонка (ТГО) определяет номер транзакции, во второй колонке таблицы приведены ЧС и события, имевшие место в прошлом и описанные в соответствующей транзакции.

Анализируя транзакционную базу данных, можно найти связи между ЧС, получить шаблоны, каждый из которых включает перечень и значения характеристик сходных ЧС, подсчитать число и процент транзакций, относящихся к одному шаблону. Это позволит выявлять особенности ЧС, разрабатывать прогнозы их развития и меры по снижению ущерба.

118

Показатели значимости ассоциативных правил

При анализе конкретного набора ситуаций применяются утверждения типа «Если для конкретной ЧС имеет место набор событий A, то для нее также имеет место и набор событий B». Эти утверждения, если они являются справедливыми, называются ассоциативными правилами. Справедливость ассоциативных правил оценивается с помощью двух объективных показателей: поддержка и достоверность и трех субъективных: лифт, левередж и улучшение [5].

Поддержка правила или покрытие (англ. support или coverage). Правило «Если для конкретной ситуации имеет место набор ЧС A, то для нее также имеет место и набор ЧС B» имеет поддержку S, если S % транзакций из базы данных содержат одновременно наборы A и B. Так в восьми транзакциях табл. 1 набор «ливневые дожди+наводнение» встречается три раза. Значит, правило имеет поддержку 37,5 %. Таким образом, поддержка - это количество или процент транзакций, которые содержат определенный набор ЧС.

Если определенный набор ЧС имеет поддержку не ниже определенного пользователем минимального набора, то такой набор называется часто встречающимся.

Достоверность или точность правила есть вероятность того, что из события A следует событие B. Формально это можно записать так: С (Л — В) = Р(Л П В)/ Р(Л ) = (количество транзакций, содержащих А и В) / (количество транзакций, содержащих только А [6].

В табл. 1 число транзакций, содержащих набор «ливневые дожди + наводнение», равно трем, число транзакций, содержащих только «ливневые дожди», также равно трем, значит достоверность правила «если ливневые дожди, то наводнение» равна

1 0 0 % ( 3 / 3 ) * 1 0 0 % = 1 0 0 %.

Используя транзакционную базу данных, можно найти все правила вида «Из A следует B» с различными значениями поддержки и достоверности. Однако в большинстве случаев количество правил необходимо ограничивать заранее установленными минимальными и максимальными значениями этих показателей.

Если поддержка чрезмерно велика, то мы найдем правила, которые известны до анализа. Если поддержка чрезмерно мала, мы найдем много правил, значительное количество которых будут необоснованным. Поэтому необходимо найти такой интервал значений поддержки, который с одной стороны, обеспечит нахождение неочевидных правил, а с другой - их обоснованность. Аналогично, если уровень достоверности слишком мал, то ценность правила вызывает серьезные сомнения, например, правило с достоверностью

2 % вряд ли является настоящим правилом.

Пример. Пусть в транзакционной базе данных характеристика A встречается в 5 % транзакций, то есть вероятность ( ) , а характеристика B - в 2 %, ( ) . Если

характеристики A и B взаимно независимы, вероятность того, что они встретятся в одной транзакции равна ( ) . Следовательно, в базе данных, состоящей

из тысячи записей, мы должны встретить такую комбинацию один, максимум два раза. Если в ходе анализа этой базы данных мы встретили сочетание характеристик A и B 20 раз, то с высокой вероятностью характеристики A и B зависимы.

Очевидно, что зависимые характеристики имеют более высокую поддержку и достоверность. Следовательно, нужно выбрать такие значения поддержки и достоверности, которые, с одной стороны, позволят найти обоснованные ассоциации, а с другой -не учитывать ассоциации не обоснованные. Задача выбора таких значений выходит за рамки ассоциативного анализа и решается с помощью экспертов или руководящих документов.

Рассмотрим субъективные показатели значимости ассоциативных правил.

Лифт (lift) - это отношение частоты появления условия в транзакциях, которые также содержат и следствие, к частоте появления следствия в целом:

¿(Л- В) = С(Л-В)/5(В).

119

Лифт является обобщенной мерой связи двух предметных наборов: при значениях лифта >1 связь положительная, при 1 она отсутствует, а при значениях <1 - отрицательная. Значения лифта большие, чем единица показывают, что условие чаще появляется в транзакциях, содержащих следствие, чем в остальных [7].

Левередж (leverage) - это разность между наблюдаемой частотой, с которой условие и следствие появляются совместно (то есть поддержкой ассоциации), и произведением частот появления (поддержек) условия и следствия по отдельности:

Т(А ^ В) = S(A ^ В) - S(A) * S(B).

Если Левередж ~0, то правило не значимо.

Улучшение правила является отношением числа транзакций, содержащих наборы X и Y, к произведению количества транзакций, содержащих набор Х, и количества транзакций, содержащих набор Y. Улучшение (improvement) показывает полезнее ли правило случайного угадывания. Если I (Х ^ У) > 1, это значит, что предсказать Y по X вероятнее, чем угадать случайно [8].

Задача поиска ассоциативных правил осложняется высокой вычислительной сложностью. Так, если база данных состоит из 20 000 000 записей, то число возможных вычислительных операций может доходить до 1016. Потому использовать ассоциативные правила без компьютерных программ на практике невозможно.

Для поиска ассоциативных связей в данных разработано несколько алгоритмов: наивный или брутфорс-алгоритм, Apriori алгоритм, ECLAT алгоритм, FP-growth алгоритм и т.п. Рассмотрим один из наиболее известных алгоритмов - алгоритм Apriori.

Алгоритм Apriori поиска ассоциативных правил

В алгоритме Apriori при поиске частых наборов используется свойство антимонотонности, которое означает, что если набор Z не является частым, то добавление некоторого нового предмета A к набору Z не делает его частым. Другими словами, если Z не является частым набором, то и набор Z+A также не будет частым. Это свойство значительно уменьшает пространство поиска ассоциативных правил [9].

Работа алгоритма состоит из нескольких этапов. Каждый этап состоит из шага «формирование кандидатов» и шага «подсчет кандидатов».

На этапе формирования кандидатов (candidate generation) алгоритм, сканируя базу данных, создает множество i-элементных кандидатов, где i - номер этапа. На этом этапе поддержка кандидатов не рассчитывается.

На этапе подсчета (candidate counting) вычисляется поддержка каждого i-элементного кандидата. Здесь же выполняется отсечение кандидатов, поддержка которых меньше минимума, установленного пользователем (min_sup). Оставшиеся i-элементные наборы называют часто встречающимися.

Рассмотрим работу алгоритма на примере базы транзакций, представленных в табл. 1. В качестве минимального уровня поддержки примем значение равное трем.

На первом этапе сформируем множество одноэлементных кандидатов. Это будет множество всех элементов, встречающихся в табл. 1 . На втором этапе подсчитаем поддержку одноэлементных наборов и для дальнейшего рассмотрения оставим те из них, которые имеют поддержку больше или равную трем. Назовем эти элементы часто встречающимися.

Из множества одноэлементных часто встречающихся наборов сформируем множество двухэлементных кандидатов, подсчитаем их поддержку и отсечем наборы с уровнем поддержки меньшим, чем три. Оставшиеся наборы из двух элементов назовем часто встречающимися.

Действуя аналогичным образом, сформируем множество часто встречающихся трехэлементных наборов. Процесс будем продолжаться до тех пор, пока не останется ни одного часто встречающегося набора. Затем найдем достоверность часто встречающихся

120

наборов, лифт, левередж и улучшение. На основании этих показателей найдем ассоциативные правила [10, 11].

Пример ассоциативного анализа связей между ЧС

Применим ассоциативный анализ к базе транзакций, отображенной в табл. 1. Преобразуем эту таблицу к нормализованному виду (табл. 2).

Таблица 2. База транзакций в нормализованном виде

№ транзакции Нагонный ветер Оползень Смерч Бурное таяние снегов Цунами Ливневые дожди Наводнение Сель Землетрясение

1 0 1 0 0 0 1 1 0 1

2 0 0 1 0 0 0 0 0 0

3 1 0 0 1 0 0 1 0 0

4 0 1 0 1 0 0 1 1 1

5 0 1 0 0 1 0 0 0 1

6 1 1 0 0 0 1 1 0 0

7 0 0 1 0 0 0 1 0

8 0 1 0 1 0 1 1 0 0

частота 2 5 1 4 1 3 5 2 3

Поддержка 0,25 0,625 0,125 0,5 0,125 0,375 0,625 0,25 0,375

Будем считать частыми (популярными) те ЧС, которые имеют поддержку 5 > 3 0 % (встречающиеся в соответствующем столбце нормализованной таблицы не менее трех раз). Тогда множество однопредметных частых наборов ЧС - это оползни, бурное таяние снегов, ливневые дожди, наводнения и землетрясения.

Найдем частые двухпредметные наборы ЧС, используя операцию связывания частых однопредметных наборов ЧС. Результаты связывания отображены в табл. 3.

Таблица 3. Двухпредметные ЧС

Набор ЧС Количество Поддержка

оползень + ливневые дожди 3 37,5 %

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

оползень + наводнение 3 37,5 %

оползень + землетрясение 2 25 %

оползень + бурное таяние снегов 1 12,5 %

бурное таяние снегов + наводнение 3 37,5 %

бурное таяние снегов + ливневые дожди 1 12,5 %

бурное таяние снегов + землетрясение 1 12,5 %

ливневые дожди + наводнение 3 37,5 %

ливневые дожди + землетрясение 1 12,5 %

наводнение + землетрясение 2 25 %

Получили четыре частых двухпредметных набора ЧС: оползень + ливневые дожди, оползень + наводнение, бурное таяние снегов + наводнение, ливневые дожди + наводнение. Найдем трехпредметные наборы ЧС, используя операцию связывания частых двухпредметных наборов (табл. 4).

Анализ табл. 4 показывает, что существует всего один частый трехпредметный набор ЧС. Это набор (оползень) + (ливневые дожди) + (наводнение). Частых четырехпредметных наборов ЧС в нашей исходной таблице нет.

121

Таблица 4. Трехпредметные наборы ЧС

Набор ЧС Количество Поддержка

(оползень) + (ливневые дожди) + (наводнение) 3 37,5 %

(оползень) + (ливневые дожди) + (землетрясение) 1 12,5 %

(оползень) + (бурное таяние снегов) + (ливневые дожди) 1 12,5 %

(оползень) + (бурное таяние снегов) + (наводнение) 1 12,5 %

(бурное таяние снегов) + (наводнение) + (землетрясение) 1 12,5 %

(бурное таяние снегов) + (ливневые дожди) + (наводнение) 1 12,5 %

(ливневые дожди) + (наводнение) + (землетрясение) 1 12,5 %

Приступаем к задаче поиска и анализа ассоциативных правил. Составим табл. 5.

Рассмотрим первое правило:

1) поддержка Б=37,5 % означает, что ожидаемая вероятность набора из трех событий равна 0,375;

2) достоверность С=100 % означает, что если произойдут оползни и ливневые дожди, то с вероятностью 100 % произойдет и наводнение;

3) лифт Ь=0,6 означает, что наводнение будет происходить в 0,6 раз реже, чем оползни и ливневые дожди вместе взятые;

4) левередж Т « 0,14 0 означает, что данное правило значимо;

5) улучшение 1=1,6>1 означает, что предсказать наводнение, если имеют место оползни и ливневые дожди, вероятнее, чем угадать случайно.

Выводы 2 и 3 противоречат друг другу. Скорее всего, это связано с недостаточным количеством статистической информации. Выбор правильного вывода зависит от мнения лица, принимающего решения. На практике предпочтение обычно отдается объективным показателям.

Аналогично можно рассмотреть и остальные пять правил. Отметим, что из всех правил малозначимым является второе, так как у него С=75 %, Ь=1 и незначимо шестое, так как у него С=60 % и Ь=1.

Таблица 5. Ассоциативные правила

№ Правило Поддержка Достоверность Лифт Левередж Улучшение

1 Если оползень и ливневые дожди, то наводнение 3/8=0,375 100 %3/3=100 % 3/5=0,6 3/8-(3/8И5/8)« 0,14 0,375/(0,375-0,625)=1,6

2 Если оползень и наводнение, то ливневые дожди 3/8=0,375 100 %-3/4=75 % 3/3=1 3/8-(4/8Н3/8) «0,19 0,375/(0,5-0,375)=2

3 Если ливневые дожди и наводнение, то оползень 3/8=0,375 100 %3/3=100 % 3/5=0,6 3/8-(3/8)-(5/8) «0,14 0,375/(0,375-0,625=1,6

4 Если оползень, то ливневые дожди и наводнение 3/8=0,5 100 %• 3/5=100 % 3/3=1 3/8-(5/8)(3/8) «0,14 0,375/(0,375-0,625=1,6

5 Если ливневые дожди, то оползень и наводнение 3/8=0,375 100 %3/3=100 % 3/4=0,75 3/8-3/8)-(4/8) «0,19 0,375/(0,375-0,5)=2

6 Если наводнение, то ливневые дожди и оползень 3/8=0,375 100 %• 3/5=60 % 3/3=1 3/8-(5/8)(3/8) «0,14 0,375/(0,375-0,625)=1,6

122

Заключение

Анализ даже столь простого примера показывает, что его решение вручную требует большого объема вычислительной работы. Находить же ассоциативные правила в реальных ассоциативных базах с десятками и сотнями тысяч строк, с десятками и сотнями столбцов, вручную невозможно. Поэтому для поиска ассоциативных правил разработано большое количество компьютерных программ. Отметим среди таких программ уже упоминавшиеся выше аналитические платформы Deductor и Loginom отечественной компании BaseGroup Labs.

Список источников

1. Agrawal R., Imielinski T., Swami A. Mining Association Rules between Sets of Items in Large Databases. In Proc. of the 1993 ACM SIGMOD International Conference on Management of Data. Washington DC, USA, 1993. P. 207-216.

2. Shaheen M., Shahbaz M., Guergachi A. Context Based Positive and Negative Spatio Temporal Association Rule Mining. Elsevier Knowledge-Based Systems. 2013. P. 261-273.

3. Nancy P., Ramani G.R., Jacob S. Mining of Association Patterns in Social Network Data (Face Book 100 Universities) through Data Mining Techniques and Methods. In Advances in Computing and Information Technology, Springer: Germany, 2013. P. 178:107-117.

4. Антюхов В.И. Системный анализ и принятие решений. СПб.: С.-Петерб. ун-т ГПС МЧС России, 2017. 352 с.

5. Макрусев В.В. Основы системного анализа: учеб. 2-е изд. СПб.: Троицкий мост, 2022. 250 c.

6. Орлов А.И. Искусственный интеллект: статистические методы анализа данных: учеб. М.: Ай Пи Ар Медиа, 2022. 843 с. ISBN 978-5-4497-1470-1.

7. Метод ассоциативных правил при анализе дорожно-транспортных происшествий / Г.А. Якупова [и др.] // Транспорт: наука, техника, управление. Научный информационный сборник. 2020. № 11. С. 40-44. DOI: 10.36535/0236-1914-2020-11-7. EDN WSEISV.

8. Зайко Т.А., Олейник А.А., Субботин С.А. Анализ методов построения ассоциативных правил в интеллектуальных системах // Комп'ютерно-штегроваш технологи: освгта, наука, виробництво. 2012. № 9. С. 34-43. EDN RSHTPN.

9. Шаден Н.Е. Система анализа результатов опросов на основе поиска ассоциативных правил // Студенческий вестник. 2021. № 15-5 (160). С. 71-74. EDN WRFHPI.

10. Kim J.C., Chung K. Emerging risk forecast system using associative index mining analysis // Cluster Computing. 2017. Т. 20. № 1. С. 547-558.

11. Soni S., Vyas O.P. Using associative classifiers for predictive analysis in health care data mining // International Journal of Computer Applications. 2010. Т. 4. № 5. С. 33-37.

References

1. Agrawal R., Imielinski T., Swami A. Mining Association Rules between Sets of Items in Large Databases. In Proc. of the 1993 ACM SIGMOD International Conference on Management of Data. Washington DC, USA, 1993. P. 207-216.

2. Shaheen M., Shahbaz M., Guergachi A. Context Based Positive and Negative Spatio Temporal Association Rule Mining. Elsevier Knowledge-Based Systems. 2013. P. 261-273.

3. Nancy P., Ramani G.R., Jacob S. Mining of Association Patterns in Social Network Data (Face Book 100 Universities) through Data Mining Techniques and Methods. In Advances in Computing and Information Technology, Springer: Germany, 2013. P. 178:107-117.

4. Antyuhov V.I. Sistemnyj analiz i prinyatie reshenij. SPb.: S.-Peterb. un-t GPS MCHS Rossii, 2017. 352 s.

5. Makrusev V.V. Osnovy sistemnogo analiza: ucheb. 2-e izd. SPb.: Troickij most, 2022.

250 c.

6. Orlov A.I. Iskusstvennyj intellekt: ctatisticheskie metody analiza dannyh: ucheb. M.: Aj Pi Ar Media, 2022. 843 c. ISBN 978-5-4497-1470-1.

123

7. Metod associativnyh pravil pri analize dorozhno-transportnyh proisshestvij / G.A. YAkupova [i dr.] // Transport: nauka, tekhnika, upravlenie. Nauchnyj informacionnyj sbornik. 2020. № 11. S. 40-44. DOI: 10.36535/0236-1914-2020-11-7. EDN WSEISV.

8. Zajko T.A., Olejnik A.A., Subbotin S.A. Analiz metodov postroeniya associativnyh pravil v intellektual'nyh sistemah // Komp'yuterno-integrovani tekhnologii: osvita, nauka, virobnictvo. 2012. № 9. S. 34-43. EDN RSHTPN.

9. Shaden N.E. Sistema analiza rezul'tatov oprosov na osnove poiska associativnyh pravil // Studencheskij vestnik. 2021. № 15-5 (160). S. 71-74. EDN WRFHPI.

10. Kim J.C., Chung K. Emerging risk forecast system using associative index mining analysis // Cluster Computing. 2017. T. 20. № 1. S. 547-558.

11. Soni S., Vyas O.P. Using associative classifiers for predictive analysis in health care data mining // International Journal of Computer Applications. 2010. T. 4. № 5. S. 33-37.

Информация о статье:

Статья поступила в редакцию: 26.05.2022; одобрена после рецензирования: 31.05.2022; принята к публикации: 01.06.2022

The information about article:

The article was submitted to the editorial office: 26.05.2022; approved after review: 31.05.2022; accepted for publication: 01.06.2022

Информация об авторах:

Валерий Ильич Куватов, профессор кафедры системного анализа и антикризисного управления Санкт-Петербургского университета ГПС МЧС России (196105, Санкт-Петербург, Московский пр., д. 149), доктор технических наук, профессор, заслуженный работник Высшей школы Российской Федерации, e-mail: kyb.valery@yandex.ru

Алексей Александрович Горбунов, заместитель начальника Санкт-Петербургского университета Государственной противопожарной службы МЧС России по учебной работе (196105, Санкт-Петербург, Московский пр, д. 149), кандидат военных наук, доцент, e-mail: algor.78@yandex.ru Дмитрий Алексеевич Колеров, начальник кабинета кафедры системного анализа и антикризисного управления Санкт-Петербургского университета ГПС МЧС России (196105, Санкт-Петербург, Московский пр., д. 149), e-mail: dima11rus@inbox.ru

Information about the authors:

Valery I. Kuvatov, professor of the department of system analysis and crisis management of the Saint-Petersburg university of State fire service of EMERCOM of Russia (196105, Saint-Petersburg, Moskovsky ave., 149), doctor of technical sciences, professor, honored worker of the Higher school of the Russian Federation, e-mail: kyb.valery@yandex.ru

Alexey A. Gorbunov, deputy chief of educational work of Saint-Petersburg university of State fire service of EMERCOM of Russia (196105, Saint-Petersburg, Moskovsky ave., 149), candidate of military sciences, associate professor, e-mail: algor.78@yandex.ru

Dmitriy A. Kolerov, head of the office of the department of system analysis and crisis management of Saint-Petersburg university of State fire service of EMERCOM of Russia (196105, Saint-Petersburg, Moskovsky ave., 149), e-mail: dima11rus@inbox.ru

124

i Надоели баннеры? Вы всегда можете отключить рекламу.