Татаринов В.В.
Московский государственный технический университет им. Н.Э. Баумана, к.ф.-м.н., доцент кафедры «Экология и промышленная безопасность», [email protected]
Разработка комплексных дисциплин для учебных ситуационных центров
КЛЮЧЕВЫЕ СЛОВА
Ситуационный центр, комплексная дисциплина, статистика экстремальных значений, методы анализа данных, чрезвычайная ситуация (ЧС).
АННОТАЦИЯ
В статье обсуждаются особенности методики проведения занятий в ситуационных центрах. В рамках специальности магистратуры по направлению «Защита в ЧС» предложена комплексная дисциплина «Прикладные методы анализа рисков природных и техногенных ЧС». Разработан примерный план дисциплины с разбиением по темам и видам занятий.
В соответствии с Федеральным законом «О стратегическом планировании» № 172-ФЗ от 28 июня 2014 г. [1] в целях обеспечения информационно-аналитической поддержки стратегического планирования и повышения эффективности государственного управления в Российской Федерации, в том числе при возникновении чрезвычайных (кризисных) ситуаций, а также для наполнения распределенной информацией федеральной информационной системы стратегического планирования в России должна быть создана система распределенных ситуационных центров (СРСЦ).
В «Стратегии национальной безопасности Российской Федерации до 2020 года» [2] прямо указано на то, что информационно-аналитическая поддержка реализации названной Стратегии должна осуществляется с использованием СРСЦ. Для этого в среднесрочной перспективе потребуется преодолеть технологическое отставание в важнейших областях информатизации, телекоммуникаций и связи, разработать и внедрить технологии информационной безопасности в системах государственного и военного управления.
Целесообразность использования ситуационного центра в образовательном процессе определяется, в частности, следующими их возможностями:
• создание интегрированной информационно-аналитической среды
для проведения занятий на основе новых возможностей по
визуализации информации;
• организация взаимодействия с обучаемыми в процессе коллективного обсуждения проблемы с использованием моделирования и анализа различных ситуаций.
В сентябре 2014 года в Московском государственном техническом университете имени Н.Э. Баумана был открыт Научно-учебный центр управления в кризисных ситуациях (НУ ЦУКС).
Новый центр МГТУ создан для непрерывной профессиональной подготовки и повышения квалификации специалистов, отвечающих за безопасность жизнедеятельности и гражданскую оборону в области прогнозирования, предупреждения, защиты от угроз и ликвидации последствий ЧС природного и техногенного характера, обеспечения пожарной и комплексной безопасности.
Одной из важнейших функций центра будет организация командно-штабных, комплексных, опытно-исследовательских учений, штабных тренировок на всех уровнях системы государственного управления.
Образовательная составляющая деятельности центра будет включать в себя обучение студентов и переподготовку кадров по специальностям «Анализ и управление рисками», «Безопасность жизнедеятельности в техносфере», «Защита в ЧС» и «Техносферная безопасность». В ходе учебы студенты смогут проверить соответствие принимаемых ими управленческих решений документам МЧС России, получить навыки организации взаимодействия органов управления и аварийно-спасательных сил РСЧС, управления силами и средствами РСЧС и приданными силами.
Опыт эксплуатации в учебных целях существующих ситуационных центров позволяет выделить следующие виды занятий [3, 4]:
• лекции-демонстрации;
• лекции-дискуссии;
• анализ конкретных ситуаций;
• командно-штабные учения;
• деловые игры.
Методическим обеспечением учебного ситуационного центра могут являться [5]:
• постановка проблем и сценарии проведения конкретных занятий, описания используемых методов, моделей, алгоритмов и программ;
• режиссерские сценарии проведения конкретных занятий;
• типовые сценарии проведения активных видов занятий;
• типовые сценарии поддержки коллективных действий на этапах решения проблем;
• модели проблемных ситуаций и сценариев проведения конкретных занятий для отображения в метабазе учебного контента.
В рамках специальности магистратуры по направлению «Защита в
ЧС» предлагается комплексная дисциплина «Прикладные методы анализа рисков природных и техногенных ЧС».
Примерный план дисциплины.
Лекции.
1. Введение. Основные понятия и обозначения.
2. Основные результаты классической теории экстремальных значений.
3. Графические статистические средства.
4. Статистическая обработка многолетних наблюдений.
5. Методы оценки и прогнозирования параметров лесных пожаров на основе метеорологических данных.
6. Методы количественного анализа статистических структур экстремальных зависимостей.
7. Технологии анализа данных.
Практические занятия в ситуационном центре должны базироваться на анализе конкретных ситуаций.
1. Сравнительный анализ модельных распределений по данным о ЧС.
2. Использование квантиль диаграмм для установления статистического критерия экстремальной ЧС.
3. Исследование динамических изменений модельных распределений длительности и площади пожаров.
4. Статистический анализ количества лесных пожаров.
5. Статистический анализ повторяемости лесных пожаров.
Самостоятельная работа (в том числе под руководством
преподавателя).
1. Технологии анализа данных.
2. Консолидация данных.
3. Трансформация данных.
4. Визуализация данных.
5. Очистка и предобработка данных.
6. Data Mining.
7. Временные ряды.
8. Ансамбли моделей.
9. Сравнение моделей.
Курсовая работа «Обработка данных наблюдений ЧС».
Теоретические основы курса широко известны [6, 7] и по своей сути представляют избранные главы высшей математики.
Лекции по первым четырём темам предполагается представить как лекции демонстрации.
Во введении предполагается рассмотреть общие математические средства из теории вероятностей, необходимые для дальнейших исследований и использования в графических методах построения квантиль диаграмм.
Вторая тема посвящена систематизации и анализу главных
достижений и результатов классической теории вероятностей экстремальных событий для дальнейшего приложения к анализу риска крупных чрезвычайных ситуаций.
В третьей теме рассматриваются:
1.Методы обработки статистических данных о чрезвычайных ситуациях с использованием графических способов построения квантиль-диаграмм;
2.Процедура построения графиков квантилей в общем случае и построение линий регрессии;
3.Примеры построения графиков квантилей.
Основное внимание предполагается уделить предложенному в [7] статистическому методу построения количественного статистического критерия экстремальной ЧС на основе использования квантиль диаграмм из специального класса распределений.
Четвёртая тема посвящена двум методам использования квантиль-диаграмм для исследования динамических изменений в распределении случайных величин. На основе первого метода делаются выводы об изменении распределений, которые могут быть очень важны для понимания качественной тенденции изменения риска экстремальной ЧС. При достаточно длинном динамическом ряде данных второй метод позволяет выявлять тенденции изменения параметров распределений ЧС, которые могут использоваться при составлении и/или уточнении кратко и среднесрочных прогнозов по ЧС природного и техногенного характера.
Материал следующих трёх тем предполагается представить в виде лекций-дискуссий.
При рассмотрении первых двух тем исследуются вопросы применения классической теории экстремальных значений к анализу многолетних данных по чрезвычайным ситуациям природного и техногенного характера.
В пятой теме будут проведены:
4.Отбор основных метеорологических параметров для статистической оценки показателей лесных пожаров и установления их зависимости (или независимости) от метеорологических условий;
5.Корреляционный анализ характеристик лесных пожаров в зависимости от метеорологических параметров.
Основное внимание предполагается уделить алгоритмам обработки рядов данных по показателям пожаров и метеоусловий, и статистическому анализу получаемых параметров функций распределения. Далее выводятся формулы функции риска для числа верховых пожаров, суммарных площадей пожаров трех типов и максимальных площадей верховых пожаров, повторяемость числа лесных пожаров в пределах выбранных диапазонов.
При изложении шестой темы предполагается продолжить анализ современных достижений и подходов теории вероятностей экстремальных
событий и возможностей их приложения к анализу риска крупных чрезвычайных ситуаций, а также провести обзор методов обработки статистических данных о чрезвычайных ситуациях для прогнозирования риска природных и техногенных чрезвычайных ситуаций.
В седьмой теме излагаются базовые сведения об интеллектуальном анализе, принципах анализа, подготовке информации, структурированных данных и технологиях Knowledge Discovery in Databases и Data Mining.
Лекции по седьмой теме являются вводными для тем самостоятельных работ.
С прикладной точки зрения наиболее важны последние темы практических занятий, которые обеспечивают принятие решений в ситуационном центре на основе анализа различных сценариев развития событий.
В раздел самостоятельной работы предлагается вынести современные интеллектуальные методы анализа данных как одни из наиболее перспективных с точки зрения научной работы магистров. Вынесение этих тем в раздел самостоятельной работы обусловлено не только известным ограничением по «часам», но и наличием хорошо разработанного фирмой Basegroup [8] учебного материала.
Примерное содержание вопросов для самостоятельной проработки по теме «Технологии анализа данных»:
1. Принципы анализа данных;
2. Структурированные данные;
3. Подготовка данных к анализу;
4. Технологии KDD и Data Mining.
Во второй теме «Консолидация данных» следует научиться решению задач сбора информации, пригодной для анализа в едином источнике, при помощи технологии многомерных и реляционных хранилищ данных.
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Задача консолидации;
2. Введение в хранилища данных;
3. Основные концепции хранилищ данных;
4. Многомерные хранилища данных;
5. Реляционные хранилища данных;
6. Гибридные хранилища данных;
7. Виртуальные хранилища данных;
8. ETL.
Вопросы группировки, фильтрования, кодировки и преобразования данных к заданному виду отнесены к третьей теме «Трансформация данных».
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Трансформация упорядоченных данных;
2. Группировка данных;
3. Слияние данных;
4. Квантование;
5. Нормализация и кодирование данных.
Аналитическая OLAP-отчетность, а также другие способы визуализации отнесены к четвёртой «Визуализация данных».
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Визуализаторы общего назначения;
2. OLAP-анализ;
3. Визуализаторы для оценки качества моделей;
4. Визуализаторы, применяемые для интерпретации результатов анализа.
Анализу качества данных, методам и алгоритмам выявления пропусков, дубликатов, противоречий и аномалий, а также способам реагирования на выявляемые проблемы посвящается тема «Очистка и предобработка данных».
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Оценка качества данных;
2. Технологии и методы оценки качества данных;
3. Очистка и предобработка;
4. Сэмплинг.
Тема «Data Mining» самая большая из всех планируемых тем. При её изучении надо получить представление об алгоритмах решения основных классов задач Data Mining: ассоциация, кластеризация, классификация и регрессия.
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Ассоциативные правила;
2. Алгоритм кластеризации k-means;
3. Сети и карты Кохонена;
4. Проблемы алгоритмов кластеризации;
5. Простая линейная регрессия;
6. Простая регрессионная модель;
7. Множественная линейная регрессия;
8. Модель множественной линейной регрессии;
9. Регрессия с категориальными входными переменными;
10. Методы отбора переменных в регрессионные модели;
11. Ограничения применимости регрессионных моделей;
12. Основы логистической регрессии;
13. Интерпретация модели логистической регрессии;
14. Множественная логистическая регрессия;
15. Алгоритмы построения деревьев решений;
16. Упрощение деревьев решений;
17. Принципы построения нейронных сетей;
18. Алгоритмы обучения нейронных сетей.
Тема «Временные ряды» более или менее подробно рассматривается в процессе бакалаврской подготовки в курсе высшей математики. В данном курсе этой теме отведена роль одного из методов прогнозирования ЧС.
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Прогнозирование ЧС;
2. Временной ряд и его компоненты;
3. Модели прогнозирования.
При изучении темы «Ансамбли моделей» следует ознакомиться с современными подходами к комбинированию и объединению моделей: бустинг, бэггинг и стэкинг.
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Ансамбли моделей;
2. Бэггинг;
3. Бустинг;
4. Стэкинг;
5. Альтернативные методы построения ансамблей.
Тема «Сравнение моделей» посвящена проблеме выбора лучшей модели на основе объективных критериев.
Примерное содержание вопросов для самостоятельной проработки по теме:
1. Оценка эффективности и сравнение моделей;
2. Оценка ошибки модели;
3. Издержки ошибочной классификации;
4. Lift- и Profit-кривые;
5. ROC-анализ.
По итогам обучения в рамках данного курса магистр должен будет защитить курсовую работу. В принципе, возможна такая постановка вопроса, когда по результатам анализа данных о ЧС может строиться прогноз развития ситуации с привязкой к геоинформационным системам с выработкой обоснованных управленческих решений.
Описанная редакция программы не является окончательной как в силу новизны методики построения курса в ситуационном центре, так и в силу динамики развития изучаемых в курсе вопросов, связанных с новыми информационными технологиями и соответствующими программными продуктами.
Предложенная выше программа спецкурса «Прикладные методы анализа рисков природных и техногенных ЧС» является комплексной дисциплиной, включающей в себя отдельные разделы статистики экстремальных значений, интеллектуальных методов анализа данных,
нацеленной на дальнейшую научную работу магистров в области защиты от ЧС.
Литература
1. Федеральный закон «О стратегическом планировании» № 172-ФЗ от 28 июня 2014.
2. Стратегия национальной безопасности Российской Федерации до 2020 года (утв. Указом Президента РФ от 12 мая 2009 г. N 537)
3. Манушин Э.А., Мишин А.И. Учебный ситуационный центр как среда обучения групповому принятию решений: методические рекомендации для системы повышения квалификации и переподготовки управленческих кадров. (Серия «Учебно-исследовательский ситуационный центр».) -М.: Изд-во РАГС, 2007. 46 с.
4. Филиппович Андрей. Обучающие ситуационные Центры [электронный ресурс] http://it-daim.ru/Library/Artides/publications_Philippovich_Andrew/sit_centres_education/sit_centres_e ducation.htm#p1 (дата обращения: 06.10.2014).
5. Пьянков О. Ситцентр как инновационный инструмент обучения в вузе // Connect! Мир информационных технологий. 2014. № 9, С. 49-53.
6. Гумбель Э. Статистика экстремальных значений. // -М.: Издательство «Мир», 1965 г., 451с.
7. Акимов В.А., Быков А.А., Щетинин Е.Ю. Введение в статистику экстремальных значений и её приложения. // -М.: ФГБУ ВНИИ ГОЧС (ФЦ), 2009 г., 524с.
8. www.basegroup.ru.