Научная статья на тему 'Моделирование уровня риска решений, принимаемых при управлении ликвидацией пожаров'

Моделирование уровня риска решений, принимаемых при управлении ликвидацией пожаров Текст научной статьи по специальности «Математика»

CC BY
146
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ДЕРЕВО РЕШЕНИЙ / ИГРЫ С ПРИРОДОЙ / КРИТЕРИЙ ГУРВИЦА / ОБРАТНАЯ ЗАДАЧА / ОЦЕНИВАНИЕ / DECISION TREE / NATURE GAMES / HURWITZ CRITERION / DECISION MAKER / INVERSE PROBLEM / ASSESSING

Аннотация научной статьи по математике, автор научной работы — Вилисов В.Я.

Введение. Системы поддержки принятия решений при управлении пожаротушением позволяют снизить прямой материальный ущерб, количество погибших и пострадавших. Работа посвящена построению модели риска, заключенного в решениях, принятых руководителем тушения пожара (РТП) как лицом, принимающим решения (ЛПР), в контексте управления тушением пожара в многоэтажном здании. Цели и задачи. Целью исследования является построение модели, отражающей уровень риска в решениях, принимаемых РТП. Для достижения цели необходимо решить следующие задачи: 1) выбрать тип модели принятия решений; 2) построить алгоритм оценивания параметров модели по наблюдениям за решениями, принятыми РТП; 3) проанализировать качество модели. Методы. Выбран класс моделей принятия решений, называемых играми с природой. Процедура принятия решений ЛПР при тушении пожара в многоэтажном здании представлена в виде трехуровневого дерева решений. Оно преобразовано в нормальную (табличную) форму, что позволило представить выбор решений в виде критерия Гурвица. Параметр пессимизма-оптимизма Гурвица отражает степень риска в решениях ЛПР. Для проверки работоспособности предложенной технологии оценивания параметра Гурвица выполнено имитационное моделирование. Результаты и их обсуждение. Имитационные эксперименты подтвердили работоспособность предложенной технологии оценивания степени склонности ЛПР к риску. Оценки, построенные для разных ЛПР, позволяют сравнивать степень склонности к риску различных РТП. Это дает возможность построить эталонные оценки по данным о принятии решений опытными РТП. Оценки других РТП можно сравнивать с эталонными и делать выводы о качестве их управления. Выводы. Цель исследования достигнута путем решения поставленных задач. Предложенная технология является разновидностью машинного обучения, представляется перспективной и может быть использована в составе систем поддержки принятия решений РТП, а также при обучении и подготовке персонала, занимающегося управлением в чрезвычайных ситуациях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Вилисов В.Я.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Modeling the level of risk of decisions accepted at management fire elimination

Introduction. Systems of decision-making support, which are applied when managing fire-extinguishing operations, allow reducing direct financial damage and number of dead and wounded. The work in question is devoted to the construction of the risk model based on the decisions taken by the Fire Ground Commander (FGC) being the Decision Maker (DM) in the context of extinguishing the fire in a multi-storey building. Aims and problems. The objective of the research is the construction of a model that would demonstrate the risk level contained in the decisions of the FGC. In order to achieve the objective it is necessary to solve the following problems: 1) to choose the type of a decision taking model; 2) to build the algorithm of model parameter estimation using the decisions taken by the FGC; 3) to analyze the model’s quality. Methods. The model class called Nature Games has been chosen. The procedure of DM’s decision taking process observed while extinguishing the fire in a multi-storey building has been presented as a three-level decision tree. It was transformed into a normal (table) form, thus presenting the decision choice as the Hurwitz Criterion. Hurwitz’s parameter of pessimism/optimism demonstrates the risk level contained in the DM’s decisions. Simulation modelling has been performed in order to check the working capacity of the suggested Hurwitz parameter estimation technology. Results and discussion. Simulation experiments proved the working capacity of the suggested technology on assessing the DM’s degree of risk proneness. The estimates that have been built for different DM allow comparing the risk proneness degree of different FGCs. It provides a possibility to build model estimates based on the decisions taken by the experienced FGC. Estimates of other FGCs thus could be compared with the model ones, drawing conclusions on their management quality. Conclusion. The objective of the research has been achieved due to solving the set problems. The suggested technology is a high-potential type of machine education that can be used both as a part of the DM’s decision taking support systems and when training personnel whose role involves emergency operation control.

Текст научной работы на тему «Моделирование уровня риска решений, принимаемых при управлении ликвидацией пожаров»

https://doi.org/10.18322/PVB.2019.28.03.36-49 УДК 519.8

Моделирование уровня риска решений, принимаемых при управлении ликвидацией пожаров

© В. Я. Вилисов1к

1 Технологический университет (Россия, 141070, Московская обл., г. Королёв, ул. Гагарина, 42) РЕЗЮМЕ

Введение. Системы поддержки принятия решений при управлении пожаротушением позволяют снизить прямой материальный ущерб, количество погибших и пострадавших. Работа посвящена построению модели риска, заключенного в решениях, принятых руководителем тушения пожара (РТП) каклицом, принимающим решения (ЛПР), в контексте управления тушением пожара в многоэтажном здании.

Цели и задачи. Целью исследования является построение модели, отражающей уровень риска в решениях, принимаемых РТП. Для достижения цели необходимо решить следующие задачи: 1) выбрать тип модели принятия решений; 2) построить алгоритм оценивания параметров модели по наблюдениям за решениями, принятыми РТП; 3) проанализировать качество модели.

Методы. Выбран класс моделей принятия решений, называемых играми с природой. Процедура принятия решений ЛПР при тушении пожара в многоэтажном здании представлена в виде трехуровневого дерева решений. Оно преобразовано в нормальную (табличную) форму, что позволило представить выбор решений в виде критерия Гурвица. Параметр пессимизма-оптимизма Гурвица отражает степень риска в решениях ЛПР. Для проверки работоспособности предложенной технологии оценивания параметра Гурвица выполнено имитационное моделирование.

Результаты и их обсуждение. Имитационные эксперименты подтвердили работоспособность предложенной технологии оценивания степени склонности ЛПР к риску. Оценки, построенные для разных ЛПР, позволяют сравнивать степень склонности к риску различных РТП. Это дает возможность построить эталонные оценки по данным о принятии решений опытными РТП. Оценки других РТП можно сравнивать с эталонными и делать выводы о качестве их управления.

Выводы. Цель исследования достигнута путем решения поставленных задач. Предложенная технология является разновидностью машинного обучения, представляется перспективной и может быть использована в составе систем поддержки принятия решений РТП, а также при обучении и подготовке персонала, занимающегося управлением в чрезвычайных ситуациях.

Ключевые слова: дерево решений; игры с природой; критерий Гурвица; лицо, принимающее решения; обратная задача; оценивание.

Для цитирования: Вилисов В. Я. Моделирование уровня риска решений, принимаемых при управлении ликвидацией пожаров // Пожаровзрывобезопасность/ Fire and Explosion Safety. — 2019. — Т. 28, № 3. — С. 36-49. DOI: 10.18322/PVB.2019.28.03.36-49.

И Вилисов Валерий Яковлевич, e-mail: vilisov@ut-mo.ru

Modeling the level of risk of decisions accepted at management fire elimination

© Valeriy Ya. Vilisov1K

1 Technological University (Gagarina St., 42, Korolyev, Moscow Region, 141070, Russian Federation) ABSTRACT

Introduction. Systems of decision-making support, which are applied when managing fire-extinguishing operations, allow reducing direct financial damage and number of dead and wounded. The work in question is devoted to the construction of the risk model based on the decisions taken by the Fire Ground Commander (FGC) being the Decision Maker (DM) in the context of extinguishing the fire in a multi-storey building.

Aims and problems. The objective of the research is the construction of a model that would demonstrate the risk level contained in the decisions of the FGC. In order to achieve the objective it is necessary to solve the following problems: 1) to choose the type of a decision taking model; 2) to build the algorithm of model parameter estimation using the decisions taken by the FGC; 3) to analyze the model's quality.

Methods. The model class called Nature Games has been chosen. The procedure of DM's decision taking process observed while extinguishing the fire in a multi-storey building has been presented as a three-level decision tree. It was transformed into a normal (table) form, thus presenting the decision choice as the Hurwitz Criterion. Hurwitz's parameter of pessimism/optimism demonstrates the risk level contained in the DM's decisions. Simulation modelling has been performed in ordertocheckthe workingcapacityofthesuggested Hurwitz parameter estimation technology.

Results and discussion. Simulation experiments proved the working capacity of the suggested technology on assessingthe DM's degree of risk proneness. The estimates that have been built for different DM allow comparing the risk proneness degree of different FGCs. It provides a possibility to build model estimates based on the decisions taken by the experienced FGC. Estimates of other FGCs thus could be compared with the model ones, drawing conclusions on their management quality.

Conclusion. The objective of the research has been achieved due to solving the set problems. The suggested technology is a high-potential type of machine education that can be used both as a part of the DM's decision taking support systems and when training personnel whose role involves emergency operation control.

Keywords: decision tree; nature games; Hurwitz criterion; decision maker; inverse problem; assessing.

For citation: Valeriy Ya. Vilisov. Modeling the level of risk of decisions accepted at management fire elimination. Pozarovzryvobezopasnost'/ Fire and Explosion Safety, 2019, vol. 28, no. 3, pp. 36-49 (in Russian). DOI: 10.18322/PVB.2019.28.03.36-49.

K Valeriy Yakovlevich Vilisov, e-mail: vilisov@ut-mo.ru

Введение

Российская единая система предупреждения и ликвидации чрезвычайных ситуаций (РСЧС) имеет иерархическую структуру, включающую федеральный, межрегиональный, региональный, муниципальный и объектовый уровни [1, 2]. На всех уровнях имеются соответствующие управляющие органы: на трех верхних — центры управления в кризисных ситуациях (ЦУКС), на двух нижних — дежурно-диспетчерские службы (ДДС). Все уровни охвачены автоматизированной информационно-управляющей системой (АИУС), обеспечивающей оперативный обмен сообщениями и приказами лиц, принимающих решения (ЛПР). В зависимости от возникающих задач и благодаря иерархической организации в случае необходимости могут быть использованы ресурсы всей системы РСЧС. Чем ниже уровень иерархии управления, тем выше динамика протекающих процессов и принимаемых решений. Фактор времени играет существенную роль в процессах управления на нижнем уровне, что обуславливает актуальность задачи обеспечения высокой эффективности реагирования на возникающие чрезвычайные ситуации (ЧС) в условиях острого дефицита времени.

К сфере ответственности РСЧС относятся разнообразные ЧС [2,3]: поиск и спасение людей на суше и на море; предупреждение и ликвидация аварий и катастроф различной природы; тушение пожаров различной природы и др. Исследование, представленное в настоящей работе, основано на анализе процедур принятия решений при тушении пожара, хотя они во многом аналогичны и другим ситуациям. Эти процедуры, как правило, охватывают два нижних уровня иерархической системы управления МЧС, в которых межуровневое взаимодействие заключается в следующем: команды сверху вниз — выделение ресурсов (подразделений пожарной охраны, специальных технических средств и материалов), команды снизу вверх — информирование о текущем состоянии процесса тушения пожара и запросы о дополнительных ресурсах.

На нижнем уровне иерархии управления, где в качестве ЛПР выступает руководитель тушением пожара (РТП), многие действия и типовые процедуры регламентированы [4]: например, где располагать автоцистерны, куда подавать стволы и сколько, когда применять воду, а когда пену и т. п. Однако не все действия РТП могут быть регламентированы, и тогда руководитель принимает решение, опираясь на персональный опыт и текущую информацию об обстановке, поступающую по каналам связи от групп разведки или из других источников. В ряде случаев создается штаб тушения пожара как совещательный орган, но окончательные решения принимает РТП и на нем лежит ответственность за их принятие.

В последнее время в связи с бурным развитием информационно-коммуникационных и программно-технических средств, а также с комплектованием современными гаджетами не только рабочих мест ЛПР всех уровней управления РСЧС, но и исполнителей различных пожарных специальностей информационные потоки в АИУС существенно возросли. Эти обстоятельства, с одной стороны, создают потенциал для принятия более обоснованных решений, а с другой — при остром дефиците времени ограничивают возможности полноты восприятия неструктурированных потоков данных.

В таких условиях возникает острая потребность в системах поддержки принятия решений (СППР) при ликвидации ЧС [1, 2, 5, 6], которые позволили бы выполнять предварительную обработку поступающих данных, свертку и представление их руководителю в форме, удобной для восприятия, и желательно с учетом его персональной пропускной способности. Особенно остро такая потребность ощущается на нижних двух уровнях иерархии управления, обеспечивающих оперативное управление, где динамика процессов измеряется от десятков до долей минут. Для обеспечения требуемой функциональности СППР в настоящее время разрабатывается широкий спектр математических моделей, среди которых можно выделить три группы.

1. Модели процессов развития пожара. Они очень разнообразны и позволяют моделировать скорость распространения огня в различных средах и на объектах, например в помещениях различной конфигурации, при открытых и/или закрытых окнах и дверях, с различными видами пожарной нагрузки (материалов стен, полов, потолков, перекрытий и т. п.) [7-9], а также воздействие факторов пожара на людей [10]. Большая часть этих моделей представлена программными комплексами [6], позволяющими оценивать те или иные сценарии воздействия на огонь и развитие пожара.

2. Модели систем массового обслуживания (СМО). Этими моделями описываются такие процессы, как движение пожарных подразделений по вызову на пожаре в городской среде [1], "обслуживание" техническими средствами и персоналом очагов возгорания на пожаре, движение людей при их эвакуации из зданий [11-13]. Модели СМО, представленные в настоящее время рядом универсальных [14] и специализированных программных средств, позволяют просчитывать различные варианты и выбирать из них наилучшие исходя из тех или иных критериев.

3. Модели выбора оптимального варианта (решения). Именно в эту группу входят разнообразные модели исследования операций, позволяющие ЛПР выбирать наиболее предпочтительный вариант из дискретного или непрерывного множества альтернатив. К этой группе относятся алгоритмы выбора решений на основе матричных игр (антагонистических и с природой) [15-17], цепей Маркова [17], деревьев решений [17,18] и др. Рассматриваемые в работе модели относятся именно к этой группе.

Модели третьей группы традиционно развиваются в самых разных сферах в прямой постановке (прямые задачи выбора решений), сохранившейся со времен зарождения прикладного направления, называемого "исследование операций". Традиционная технология использования моделей этой группы предполагает, что имеется объект, вербальная цель исследования, в соответствии с которой аналитик (не ЛПР!) выбирает целевой показатель (как правило, один), строится целевая (платежная) функция (линейной или нелинейной структуры), связывающая целевой показатель с варьируемыми (выбираемыми) переменными. Параметры (коэффициенты) целевой функции задаются аналитиками из субъективных соображений. Затем решается задача поиска (выбора) таких значений переменных, которые бы обеспечили максимум или минимум целевой функции. Полученное решение в большинстве случаев оказывается оптимальным с точностью до структуры и параметров целевой функции, заданных аналитиком, поэтому подобная схема (прямая задача) выбора решений очень часто является

нежизнеспособной, как и многие процедуры управления без обратной связи.

В ряде работ [17] в качестве перспективных направлений использования моделей исследования операций в отличие от традиционной схемы предлагается построение их адаптивных вариантов, учитывающих опыт ЛПР, в интересах которых эти модели и создаются.

В настоящей работе предлагается один из вариантов (другие см. в [17]) построения механизма обратной связи, обеспечивающего адаптивность моделей принятия решений, используемых в процедурах управления тушением пожара. Это позволяет в целевой функции использовать параметры, выявленные по решениям именно того ЛПР, который несет ответственность за принятые и реализованные решения (в отличие от аналитика). Выявление параметров (а в некоторых случаях и структуры [17]) представляет собой обратную задачу принятия решений, замыкающую ту самую обратную связь, обеспечивающую адаптивность модели. Тогда обратная задача позволяет сделать прямую задачу адекватной предпочтениям ЛПР, а найденные по модели варианты решений не вызывают у них отторжения. В рамках такой технологии роль аналитика сводится лишь к подбору модели, структурно адекватной процедуре принятия решений, и в построении эффективного алгоритма решения обратной задачи (при необходимости может решаться и задача дискриминации структуры модели). Таким образом, аналитик полностью исключается из цикла управления, а процедура решения обратной задачи обеспечивает фактически аппроксимацию предпочтений ЛПР некоторой моделью выбора. При этом часто становится неважным количество целевых показателей (а значит, и целевых функций), влияющих на решение, так как все они аппроксимируются некоторой сверткой. Использование обратной задачи для настройки параметров или/и структуры модели оптимального выбора реализует фактически одну из адаптивных технологий принятия решений [16,17].

Задача управления, рассматриваемая в данной работе, относится к нижнему уровню иерархической системы управления РСЧС и предназначена для включения ее в состав математического обеспечения СППР, предоставляющей выбор решений, имеющих уровень риска не хуже нормативного. Нормативный уровень риска определяется (в результате решения обратной задачи) по решениям, принятым ЛПР, имеющим допустимый уровень квалификации.

В работе процедура выбора решений при тушении пожара моделируется с помощью матричной игры с природой, параметр пессимизма-оптимизма которой (в рамках критерия Гурвица [15]) предложено оценивать путем решения обратной задачи по

наблюдениям за решениями, ранее принятыми опытным ЛПР, что обеспечит адаптивный характер управления. По алгоритмам решения прямой и обратной задач построена имитационная модель, и для данных, близких к реальным [1,19], на этой модели проведен имитационный эксперимент, в котором имитировались различные ЧС, принимаемые решения и возникающие платежи. Результаты эксперимента подтвердили работоспособность предложенных алгоритмов.

В силу ограниченного объема публикации контур адаптации элементов платежной матрицы по решениям, принятым опытным ЛПР, здесь не рассматривается. Этот вид адаптации может быть выполнен аналогично другим подобным моделям, например антагонистическим матричным играм [17, 20] и управляемым цепям Маркова [17, 20].

Основной целью исследования, представленного в настоящей работе, является построение модели, отражающей уровень риска в решениях, принимаемых РТП. Модель должна быть построена по выборке наблюдений за решениями, принятыми конкретным РТП.

Для достижения этой цели необходимо решить следующие задачи:

1) выбрать тип модели принятия решений, структурно адекватной прикладному контексту управления;

2) построить алгоритм оценивания параметров модели по наблюдениям за решениями, принятыми РТП;

3) проанализировать качество модели принятия решений, построенной по наблюдениям за решениями, принятыми РТП, и сделать заключение о ее адекватности.

Постановка задачи

Действия РТП как ЛПР нижнего уровня иерархии управления РСЧС весьма разнообразны и зависят от многих факторов: объекта пожаротушения, окружающей обстановки (наличия рядом или в пределах досягаемости источников воды, близости к очагу возгорания других пожароопасных объектов и т. п.), имеющихся ресурсов, компетентности персонала и др. Задачи принятия решений (управления) на пожаре также достаточно разнообразны [3,4, 6]: например, как оптимально расположить автомобили; как распределить пожарные стволы по площади объекта и по времени; когда и в каком составе проводить разведку пожарного состояния объекта, наличия и местоположения в нем людей; как и какими силами организовать эвакуацию людей из зоны пожара и т. п. Каждая из этих задач может быть представлена одной или несколькими моделями принятия оптимальных решений [1, 3, 5, 6].

Все действия РТП как ЛПР достаточно подробно документируются и находят свое отражение в карточке действий караула (КДК), которая в дальнейшем (в методическом плане разбора действий караула) является основанием для квалификации действий РТП как удовлетворительных или неудовлетворительных.

В нормативных документах и методических рекомендациях [4] действия РТП рассматриваются по отношению к некоторому перечню (около 30) типовых объектов пожаротушения (например, детские учреждения, культурно-зрелищные учреждения, жилые здания и др.). Жилые здания подразделяют на малоэтажные (высотой до 3 этажей включительно), многоэтажные (до 9 этажей), повышенной этажности (до 25 этажей) и высотные (более 25 этажей).

В настоящей работе в качестве типового объекта рассматриваются многоэтажные здания, как наиболее часто встречающийся объект пожаротушения, для которого в типовой состав сил и средств, участвующих в спасении людей, входят звенья газодымо-защитной службы (ГДЗС), осуществляющей разведку, и звенья спасателей, выполняющих спасение и эвакуацию людей. Кроме того, специфика много-этажности, состоящая в большом количестве помещений и этажей, существенно усложняет поиск людей, которые могут находиться в одном или нескольких из десятков или сотен помещений, что увеличивает время выполнения разведывательных и/или спасательных операций. Задымление, и/или открытый огонь, и/или опасность обрушения еще больше усложняет задачи поиска и спасения, так как обнаруженные в одном помещении люди через некоторое время, спасаясь от обрушения или дыма, могут мигрировать в другие помещения, что приводит к быстрому устареванию данных, полученных в результате разведки, выполняемой звеном ГЗДС [4], а значит, к уменьшению шансов на их эвакуацию и спасение.

Фрагмент типовой карточки действий караула в части рассматриваемой процедуры поиска и эвакуации людей из многоэтажного здания имеет примерно такой вид:

• 2:28 — Отправлено звено ГДЗС из 2-х чел. в секцию 3 здания для разведки (поиска людей);

• 2:35 — Обнаружены 2 чел. на 4-м этаже в секции 3 в двух смежных помещениях. Пути эвакуации отрезаны сильным задымлением. Требуется пожарная лестница для эвакуации людей через балкон 4-го этажа или звено спасателей со специальным дыхательным оборудованием для эвакуации через лестничный марш;

• 2:38 — Отправлено звено спасателей из 3-х чел. с дыхательным оборудованием на 2-х чел. в секцию 3 здания для эвакуации людей;

• 2:48 — Отправлено звено ГДЗС из 2-х чел. в секцию 2 здания для поиска людей;

• 3:52 — После ликвидации последствий пожара в здании погибших людей не обнаружено, количество травмированных людей — 4. Всего на момент возникновения пожара в здании находилось 36 чел.

Таким образом, при поиске и эвакуации людей в многоэтажном здании могут чередоваться решения РТП о разведке и решения об эвакуации людей. Эти решения в зависимости от ситуации и опытности РТП могут приниматься в любой, наилучшей на его взгляд, последовательности и в любом количестве циклов (разведки — эвакуации). "Платежи" от реализации принятых решений носят накопительный характер и не могут быть измерены по результатам исполнения каждого решения, а становятся известными после ликвидации последствий пожара (например, прямой материальный ущерб, количество погибших и травмированных людей и другие количественные показатели ущерба от пожара).

Прямая задача. Как видно из приведенного фрагмента карточки действий караула на пожаре, ЛПР практически всегда стоит перед дилеммой — потратить часть времени на разведку (поиск людей), уточнение и прогнозирование ситуации или, используя свой опыт и интуицию (в том числе рефлексивную), направить силы и средства в определенные места здания для эвакуации и/или спасения людей.

Процедура принятия решений в циклах "разведка и/или спасение" может быть [6] представлена матричной игрой с природой. Игра задана, если известны все элементы ее платежной матрицы

представим состояния Sj в единицах негэнтропии (экстропии) к (р), т. е. величины, противоположной энтропии [20]:

C = к

(1)

и критерий выбора оптимального решения [15,20]. Здесь столбцы соответствуют состояниям природы Sj е S, где S — множество состояний природы, а строки — вариантам решений е В, где В — множество вариантов решений.

В состав множества решений В могут входить, например, решения: ¿1 — направить звено разведки в составе 2 чел.; й2 — направить звено спасателей в составе 3 чел. для эвакуации людей и т. п. Множество состояний природы 5 в контексте задачи спасения людей из горящего здания должно состоять из вариантов размещения людей в помещениях здания. Так, крайние значения таких состояний могут отражать информацию о максимальном рассредоточении людей по помещениям здания (р) или локализации их в одном определенном помещении.

С учетом необходимости измерения элементов модели по реальной статистике, отражаемой в КДК,

h (p) = 1 + Ё Pi log nPi ,

(2)

i = 1

где р — вектор вероятностей (доли) пребывания

людей в том или ином из п помещений;

р =[ Р1Р2-- Рп]Т;

Т — символ транспонирования.

Здесь и далее будем использовать логарифм по основанию, равному числу элементов (помещений), что обеспечит варьирование энтропии в интервале [0; 1]. Использование негэнтропии в качестве меры рассеяния людей по помещениям позволяет единообразно учитывать различные статистические данные по пожарам в зданиях. Данная мера позволяет также унифицировать состояния природы в количестве от двух и выше в зависимости от необходимой степени дифференциации распределения людей в здании по помещениям. Таким образом, к (р) является показателем степени концентрации людей: при равномерном распределении их по помещениям к (р) = 0, при концентрации всех в одном помещении к (р) = 1. Чем выше концентрация людей, тем, как правило, легче проводить их эвакуацию, в том числе потому, что не требуется отыскивать их по отдельным помещениям в сложных условиях пожара и дефицита времени. По мере выполнения поисково-спасательной операции показатель к(р) может как увеличиваться, так и уменьшаться. Так, разведка, проводимая непрерывно или циклически, увеличивает негэнтропию, снимая неопределенность, а развитие пожара может ее уменьшить (например, разогнать людей из одного помещения в силу опасности пребывания в нем по нескольким помещениям). Статистические данные [19] по проведению спасательных операций при пожарах показывают, например, что звено спасателей из 2 чел. может эвакуировать за один раз 2 чел. с вероятностью, равной 1, 3 чел. — с вероятностью 0,4 и 4 чел. — с вероятностью 0,2.

Платежи в матрице (1) должны отражать количество спасенных людей при различных сочетаниях состояний природы и принятых решениях. В дальнейшем без потери общности будем рассматривать в качестве платежей количество спасенных людей, хотя в реальной пожарной статистике абсолютное количество спасенных людей на различных пожарах существенно варьируется и более универсальной единицей измерения платежа является доля спасенных людей при том или ином конкретном пожаре. Однако в случае необходимости относительные единицы (доли) могут быть пересчитаны в абсолютные и наоборот. Значения элементов платежной

матрицы могут быть получены по многочисленным статистическим данным, представляемым в КДК [19] в виде оценок, аналогичных построенным автором для других форм моделей (например, антагонистических матричных игр [17, 20] или управляемых цепей Маркова [17]).

Задача выбора оптимального решения йор( заключается в максимизации целевой функции Ь(й):

йор( = аГё тах Ь (й1

р й, еЛ

(3)

Правило выбора оптимального решения (3) называют критерием [15,18,20]. В теории выбора оптимальных решений в условиях риска и неопределенности [15, 20] различают несколько типов критериев, отличающихся целевой функцией Ь(й): • для критерия Вальда [15] —пессимистического (максиминного):

Ь (й1) = тш с,;

(4)

• для критерия оптимистического (максимакс-ного):

Ь () = тах с у. (5)

Один из комбинированных критериев — критерий Гурвица имеет целевую функцию, состоящую из взвешенной (с параметром X) суммы целевых функций (4) и (5):

Ь (й,) = X тш с,1 + (1 - X) тах су.

(6)

Параметр X е [0; 1] отражает степень риска в выборе решения. При X = 0 критерий Гурвица превращается в критерий Вальда, соответствующий безрисковой, очень осторожной позиции ЛПР. При X =1 ЛПР придерживается позиции, имеющей крайне высокую степень риска, надеясь, что природа будет к нему благосклонна и выигрыш будет максимально возможным.

Поскольку в настоящей работе основным элементом исследования является показатель риска в принимаемых решениях, который в виде параметра X из всех критериев этого типа присутствует лишь в критерии Гурвица, другие критерии [15] не рассматриваются.

Чтобы решить прямую задачу (1), (3), (6), необходимо знать все значения с у и параметра X, что позволит найти оптимальное решение, которое будет "оптимальным" с точностью до адекватности используемых значений с у и X реальным предпочтениям ЛПР, в интересах и под ответственность которого выбирается решение.

Варианты применения модели в процедурах принятия решений. Если модель построена, то каким образом она может использоваться на практике? Диапазон таких вариантов широкий [18, 20] —

от "никак не использовать", а продолжать управлять "вручную" (если ЛПР, несущий ответственность за результаты управления, не доверяет модели или предпочитает другие способы выбора решения) до полного доверия и автоматического управления на основе модели. В числе промежуточных вариантов использования модели в управлении существуют [14, 17]: информационно-советующий режим (модель предлагает, а ЛПР отвергает, корректирует или принимает); множественный выбор (когда модель предлагает несколько субоптимальных решений в окрестности оптимального, а ЛПР выбирает одно из них, или корректирует, или отвергает) и др. Эти промежуточные варианты, как правило, реализуются в составе систем поддержки принятия решений (СППР), обеспечивая более гибкое управление по сравнению с крайними вариантами. Кроме того, промежуточные режимы позволяют плавно перейти от "ручного" к максимально автоматическому управлению, если на протяжении достаточного времени ЛПР убеждается, что приемлемая доля предлагаемых моделью решений удовлетворительна.

Позитивный эффект от применения модели в том или ином режиме в составе СППР может заключаться в следующем:

• сокращается цикл управления (что очень важно при дефиците времени при ликвидации пожара);

• решение не зависит от физического состояния ЛПР;

• модель может быть использована другим субъектом, выполняющим роль ЛПР (т. е. функция выбора решения может быть отделена от ЛПР-субъекта, модель тиражирована и т. п.);

• появляется возможность сравнивать модели, построенные для разных ЛПР-субъектов, и на этой основе обучать менее опытных ЛПР. Обратная задача. Для подавляющего большинства прикладных областей, в которых делаются попытки применения рассматриваемой (и не только) модели, неизбежно возникает априорная неопре-деленностъ. Она состоит в том, что значения су и X неизвестны и их надо задать максимально адекватно объекту моделирования, и тогда найденное "оптимальное" решение будет условно (с точностью до адекватности) оптимальным. Сложность даже для рассматриваемого простейшего варианта модели заключается в том, что объект моделирования расщеплен на две части: одна (объективная) находится в стихии пожара, а вторая (субъективная) — в голове ЛПР. Объективная формирует состояния и платежи, а субъективная — отношение к этим платежам (их полезность), позицию (осторожную или нет) и варианты решений.

В традиционной парадигме исследования операций элементы модели должны быть заданы ана-

литиками (постановщиками задачи). Аналитики же в отличие от ЛПР не несут ответственности за последствия от реализации решений, принимаемых на основе модели. В этом состоит одно из основных противоречий традиционной парадигмы применения моделей.

В подавляющем большинстве современных приложений такая схема нежизнеспособна, так как даже если априори все элементы заданы адекватно и решения, получаемые с помощью модели, всех устраивают, то в силу различных обстоятельств (в том числе нестационарности среды, и/или системы ценностей, и/или опыта ЛПР) через некоторое время они перестают устраивать, т. е. априорная неопределенность сменяется текущей.

Имеются многочисленные исторические факты, согласно которым от внедренных оптимизационных моделей через некоторое время отказывались (в связи с рассогласованием между решениями, получаемыми по модели, и здравым смыслом ЛПР) и возвращались к "ручному" управлению.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Известны случаи, кода предпринимались попытки нормативного определения априорных значений некоторых из этих элементов "на все случаи жизни" (так, например, для процедур выбора инвестиционных проектов параметр критерия Гурвица должен иметь значение 0,3). В других случаях (при многокритериальном выборе [14,18]) для снятия априорной и/или текущей неопределенности создаются экспертные процедуры, которые предусматривают "добывание" у ЛПР необходимых сведений.

В ряде работ [16] предлагается вместо нормативного подхода (априорного задания структуры и параметров моделей) использовать адаптивный, согласно которому модель надо как-то подстраивать под ЛПР, адаптировать к нему, чтобы обеспечить необходимую адекватность и доверие.

Вместе с тем в последние годы интенсивно развиваются методы машинного обучения, которые направлены на оценивание параметров моделей (распознавания, классификации и других процедур выбора) по прошлой статистике выбора, выполненного "Учителем". Эти методы во многом аналогичны методам идентификации динамических систем.

В настоящей работе (и в ряде других работ автора [17]) предлагается подход, аналогичный упомянутым (адаптация, машинное обучение, идентификация), при котором по прошлой статистике оцениваются параметры модели (обратная задача) для их последующего использования при выборе решений (прямая задача).

Таким образом, под обратной задачей в работе понимается (применительно лишь к показателю пессимизма-оптимизма) следующее: по совокупности данных о решениях йк (где к — номер наблюдения;

к = 1, ..., К), принятых ЛПР, и о полученных при

к

этом платежах с построить оценку параметра пессимизма-оптимизма критерия Гурвица.

Многошаговый выбор. Традиционная прямая задача выбора (1), (3), (6) — одношаговая. Она может повторяться много раз, но в ней нет взаимосвязи между шагами принятия решений. В рассматриваемом объекте (процедуре спасения людей из многоэтажного здания) такая связь есть, так как последующий выбор связан с тем, что известно к текущему моменту по данным разведки или из других источников. Эта связь не глубокая, поскольку ситуация на пожаре изменяется очень динамично, и это желательно учесть в модели выбора. Простой способ сделать это — воспользоваться деревом решений, которое затем можно нормализовать [20], т. е. привести к матричной форме (1), а значит, и в целом постановку задачи привести к виду (1), (3), (6).

Процедура нормализации зависит от следующих свойств дерева решений: числа уровней, числа исходов по уровням, степени регулярности дерева. Ниже приведено описание процедуры нормализации для примера дерева (рис. 1), используемого далее в имитационном эксперименте.

Здесь первый шаг (выполняет природа) соответствует исходной (на текущий момент) информации, которой располагает ЛПР, о местоположении людей в здании, где исход а, например, соответствует значению к (р) = 0; Ь — значению к (р) = 0,3; с — значению к (р) = 0,7; й — значению к (р) = 1.

На втором шаге (выполняет ЛПР) по текущей информации (а, или Ь, или с, или й) ЛПР делает свой выбор: 0 — отправить звено разведки; 1 — отправить звено спасателей.

На третьем шаге (выполняет природа) проявляется фактическое состояние природы и происходит платеж, определяющий вклад данной цепочки управления в общий вклад поисково-спасательной операции (травмирование, гибель, ущерб, т. е. значения на конечных вершинах дерева).

Поскольку на втором шаге дерева ЛПР принимает решение в зависимости от оценки состояния

12343568047 10

Рис. 1. Дерево решений при управлении ликвидацией пожара

Fig. 1. Decision tree made in the management of fire suppression

на первом шаге, подобные решения обычно [15,20] представляют в виде вектора стратегий ЛПР, имеющего структуру "если ... то". Для дерева, приведенного на рис. 1, количество ситуаций, требующих выбора ЛПР, на первом уровне равно трем (Ь, с, й), исходя из того, что ЛПР не рассматривает крайнюю ситуацию, когда люди равномерно рассредоточены по всему зданию (ситуация а):

fi

f =

(7)

Размерность вектора стратегий г равна числу исходов на первом уровне дерева, которые приводят к необходимости ЛПР делать свой выбор на втором уровне дерева (для рис. 1 г =3). Элементы вектора стратегий могут принимать значения из множества исходов второго уровня (для рис. 1 5 = 2): х, у, г е е {0; 1}. Тогда полное количество стратегий ЛПР

г

составит т = 5 .

Количество состояний природы определяется количеством сочетаний вариантов ее выбора на всех уровнях дерева. Для дерева, приведенного на рис. 1, эта величина определится как п = п1 х п3 (где п1 — число исходов 1-го уровня, участвующих в стратегиях ЛПР; п3 — число исходов 3-го уровня).

В результате нормализации дерево преобразуется в платежную матрицу, в которой роль вариантов решений ЛПР принимают стратегии (й = /¡), а роль состояний природы — все возможные сочетания "выбора" природы на ее различных шагах.

Матрица платежей заполняется в соответствии с тем, какой стратегии (строке) и состоянию природы (столбцу) соответствует конкретный элемент матрицы, а также согласно тем исходам (конечным вершинам), к которым приводит последовательность: выбор природы (первый из двух элементов, соответствующих состоянию природы — столбцу); выбор ЛПР согласно стратегии (строке), учитывающей выбор природы на первом шаге; выбор природы (второй из двух элементов, соответствующих состоянию природы — столбцу).

Таким образом, нормализация превращает многошаговую процедуру выбора решений в одноша-говую, представленную задачей (1), (3), (6), в которой, однако, учитывается многошаговый характер реальных процессов управления.

Решение

Рассмотрим задачу оценивания параметра X по выборке наблюдений за решениями, принятыми ЛПР. По выражению (6) можно построить зависимости Ьор(Х) и/ор(Х). Для рассматриваемого примера (см. рис. 1) эти зависимости приведены нарис. 2.

¿1 --- L2

/[значение Y] /[value Y] /[3H /[ ачени value еУ] Y]

О 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 X

Рис. 2. Параметрические зависимости оптимальных значений целевой функции Lopt(X) и решения ЛПР fopt(X) Fig. 2. Parametric dependences of the optimal values of the objective function Lopt(X) and the decision fpt(X) taken by the decision maker

По Lopt(X) и fopt(X) могут быть построены обратные функции: X(Lopt) и Xfopt). Тогда по наблюдениям за решениями, принятыми ЛПР, может быть получена оценка параметра X е [0; 1], которая и отражает меру риска, свойственную данному ЛПР.

Так, если, по данным наблюдений ЛПР использует стратегию f1, т. е. при любой информации о пребывании людей принимает решение d1 = 0 (направляет не спасателей, а звено разведки), то его показатель риска находится в интервале [0,5; 1], а платежи определяются целевой функцией L1. Это соответствует уровню риска, более близкому к тому, что заложен в критерий Вальда — позиция крайнего пессимизма (максиминное решающее правило). Если, судя по наблюдениям, используется стратегия f2, т. е. при неопределенной информации о пребывании людей на первом шаге (h = 0) ЛПР принимает решение d1 = 0 (разведка), а при полной определенности (h = 1) — решение d2 = 1 (работают спасатели), то его показатель риска находится в интервале [0; 0,5], а платежи определяются целевой функцией L2. Это соответствует уровню риска, свойственному оптимистическому критерию (позиция крайнего оптимизма, т. е. максимакс-ное решающее правило). Конечно, подобная интервальная оценка, полученная по обратной функции X (fopt), в некоторых случаях может быть достаточно грубой. В то же время исследования показывают, что при большем количестве состояний (уровней негэн-тропии) можно получить более точную (с меньшим интервалом) оценку показателя риска X.

Заметим, что в реальной практике ЛПР может не придерживаться одной чистой стратегии, а использовать смешанную, в которой чистые стратегии участвуют с некоторыми вероятностями [15, 20]. Тогда величину риска, которой придерживается ЛПР, можно оценивать по наиболее часто используемой чистой стратегии либо вычислять как средне-

z

взвешенное значение с учетом частот (как весов) использования чистых стратегий.

Алгоритм

Типовую последовательность действий по выявлению уровня риска, допускаемого ЛПР в процессе принятия решений, представим в виде следующих этапов.

Этап 1. Представить дерево решений в нормальной (матричной или табличной) форме одним из существующих способов [17, 20].

Этап 2. Построить зависимости оптимальной целевой функции и оптимальных решений от параметра А: Ьор((Х) и /ор(Х), воспользовавшись выражениями для критерия Гурвица (4) и (5). По ним построить обратные функции: А(Ьор) и А(/ор)

Этап 3. По статистическим данным наблюдений за решениями ЛПР на основании обратной зависимости вычислить оценку параметра А, которая и будет соответствовать уровню риска ЛПР.

Имитационный эксперимент

Для иллюстрации применения приведенного алгоритма (по этапам) рассмотрим вариант задачи с тремя уровнями дерева решений и четырьмя уровнями неопределенности пребывания людей в здании, т. е. значениями негэнтропии (см. рис. 1).

Этап 1. Дерево приведено в сокращенном варианте: фрагменты, соответствующие необходимости разведки, опущены. Уровни состояний соответствуют четырем значениям негэнтропии Н е {0; 0,25; 0,5; 0,75} в предположении, что полной определенности получить невозможно. Этим значениям соответствуют состояния si е {а; Ь; с; й}. На первом шаге дерева при состоянии а ЛПР направляет процесс на разведку, а при остальных состояниях происходит движение по дереву. При нормализации де-

Таблица 1. Платежная матрица дерева решений Table 1. Decision tree payment matrix

f sj

fi ba bb bc bd ca cb cc cd da db dc dd

000 4 4 4 4 4 4 4 4 4 4 4 4

001 3 3 3 3 3 3 3 3 0 4 7 10

010 4 4 4 4 3 5 6 8 4 4 4 4

011 4 4 4 4 3 5 6 8 0 4 7 10

100 1 2 3 4 4 4 4 4 4 4 4 4

101 1 2 3 4 4 4 4 4 0 4 7 10

110 1 2 3 4 3 5 6 8 4 4 4 4

111 1 2 3 4 3 5 6 8 0 4 7 10

рева решений принимаются во внимание восемь чистых стратегий ЛПР, соответствующих трем значениям состояний на первом шаге дерева (Ь; с; й):

f =

f5 =

0" "0" "0" "0"

0 ; f = 0 ; f3 = 1 J = 1

0_ 1_ 0_ 1_

"1" "1" "1" "1"

0 ; f6 = 0 ; J7 = 1 ; f8 = 1

0 1 0 1

(8)

Чистые стратегии природы определяются всеми возможными сочетаниями трех значений состояний на 1-м шаге и четырех — на 3-м (всего 12 состояний — от 51 до 512): (Ь, а), (Ь, Ь), (Ь, с), (Ь, й), (с, а), (с, Ь), (с, с), (с, й), (й, а), (й, Ь), (й, с), (й, й). Платежная матрица, построенная по дереву решений, имеет размерность 8 х12 (табл. 1).

Этап 2. Для построения зависимости^(А) про-варьированы значения А с шагом 0,1 на интервале [0; 1] и для каждого из них вычислены оптимальные значения целевой функции Ь(/). Шаг варьирования А может быть сколь угодно малым для обеспечения

Таблица 2. Оптимальные значения целевой функции критерия Гурвица Table 2. Optimal values of the objective function of the Hurwitz criterion

fi X

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

000 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0

001 10,0 9,1 8,2 7,3 6,4 5,5 4,6 3,7 2,8 1,9 1,0

010 8,0 7,5 7,0 6,5 6,0 5,5 5,0 4,5 4,0 3,5 3,0

011 10,0 9,1 8,2 7,3 6,4 5,5 4,6 3,7 2,8 1,9 1,0

100 4,0 3,7 3,4 3,1 2,8 2,5 2,2 1,9 1,6 1,3 1,0

101 10,0 9,1 8,2 7,3 6,4 5,5 4,6 3,7 2,8 1,9 1,0

110 8,0 7,3 6,6 5,9 5,2 4,5 3,8 3,1 2,4 1,7 1,0

111 10,0 9,1 8,2 7,3 6,4 5,5 4,6 3,7 2,8 1,9 1,0

Lopt(V 10,0 9,1 8,2 7,3 6,4 5,5 5,0 4,5 4,0 4,0 4,0

fcpXV J2 J2 J2 J2 J2 J3 J3 J3 J1 f1 f1

L„Pm

h

4 4 /Тзначение 71

\ 4 N / value il

Ч ч ч

/[value Y] ч ч

/[ 3H / ачение Y] value Y] s m

/[3HÎ иени еУ]/ /[val ие У]

Л зн ачени value еУ]

ji 7J /[ ЗНЕ 1чени г 7]/ /[val ие У]

О 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 X

Рис. 3. Прямые функции Lopt(X) и fopt(X) Fig. 3. Direct functions Lopt(X) and fopt(X)

необходимой точности. Результаты расчетов приведены в табл. 2.

Построенные по результатам варьирования параметра X функции Ьор((Х) и /ор((Х) представлены на рис.3. Как видно из табл. 2, на интервале X е [0; 0,5] функция многозначна (/1 = /2, /А, /6, /8). По прямой функции построены обратные функции Х(Ьор) и

х(ГоР<).

Таким образом, результатом выполнения первых двух этапов алгоритма являются обратные функции Х(Ьор() и Х(/0р), вид которых полностью определяется исходными данными задачи (структурой дерева и платежами).

На третьем этапе алгоритма, в зависимости от того, какие решения принимает ЛПР в тех или иных ситуациях (состояниях природы), получим оценку риска в его действиях. Проиллюстрируем процедуру оценивания риска с помощью имитационного моделирования ситуаций, возникающих в процессе управления пожаротушением, и решений, принимаемых в них ЛПР.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Этап 3. Статистические свойства (вероятности) состояний природы, возникающих на первом и третьем шагах дерева решений, при имитации были следующими: Р(а) = 0,3; Р(Ь) = 0,3; Р(с) = 0,3; Р(й) =0,1. При имитации решений ЛПР в тех или

1 3 5 7 9 11 13 15 17 19 21 Шаг наблюдений / Observation step

Рис. 4. Пошаговая интервальная оценка стратегии ЛПР Fig. 4. Step-by-step interval estimation of the decision maker's strategy

иных ситуациях (состояниях природы) было принято, что ЛПР придерживается чистой стратегии f (см. (8)).

Фрагмент реализации, включающей сгенерированные случайным образом, с указанными вероятностями, состояния природы и сымитированные (по стратегии f3) решения ЛПР в этих ситуациях, а также соответствующие им платежи, приведен в табл. 3.

В результате пошагового анализа по мере поступления наблюдений построены точечная и интервальная оценки стратегии, применяемой ЛПР. Точечная оценка заключается в вычислении одной (наиболее вероятной) из восьми стратегий по текущей выборке наблюдений. На 20-м шаге наблюдений таковой оказалась стратегия f.. Интервальная оценка — это подмножество стратегий, которым могла бы соответствовать совокупность наблюдаемых на текущий момент пар состояние природы - решение ЛПР. Для рассматриваемого примера интервальная оценка сошлась к стратегии f также на 20-м шаге (рис. 4). Таким образом, оба типа оценок совпали с той стратегией, которая имитировала поведение ЛПР в случайно возникающих (имитируемых) ситуациях.

На рис. 5 приведены обратные функции X(Lopt) и X(fopt), вычисленные на 2-м шаге алгоритма.

На основании полученной по наблюдениям оценки стратегии ЛПР (f) на функции X(fopt) выделен интервал X е [0,5; 0,8], которому соответствует уровень риска ЛПР. Таким образом, оценкой степени

Таблица 3. Фрагмент выборки наблюдений / Table 3. Fragment of a sample of observations

Номер шага / Step number Наблюдение / Observation

1 2 3 4 5 6 8 100

1 (Природа / Nature) c b c c b c b c b

2 (ЛПР / Decision maker) 1 0 1 1 0 1 0 1 0

3 (Природа / Nature) a c a c a b d c a

Платеж / Payment 3 4 3 6 4 5 4 6 4

X 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0

/[значение У] VI

/з 1 J X [ зна* X=[vî гение ilue Y] л

» « - Se и г- СО ^ -, о" tr5

Un i о 3 \

1—1 1 Il g << 5 св \ \

Л \ ч

fl /4 /б \ \ h

\ \ \ т iptQ")

ч£ ч

\ \

1

L0ppfi

Рис. 5. Обратные функции X(Lopt) и Xfopt) Fig. 5. Inverse functions X(Lopt) and X(fopt)

риска X в принимаемых ЛПР решениях является интервал [0,5; 0,8].

Среднее значение платежа за период наблюдений X (Lopt) = 4,27. Значение функции X(Lopt) не противоречит полученной оценке X, так как X (Lopt) = = 0,746, т. е. находится в пределах интервальной оценки риска [0,5; 0,8].

Обсуждение результатов

Приведем несколько расширенную трактовку рассмотренного в работе подхода и полученных результатов.

Оценивание эффективности деятельности ЛПР лишь по конечным интегральным показателям (например, величина материального ущерба и число жертв на пожаре) в большинстве случаев является неконструктивным, так как полученные оценки показателей не структурированы и не позволяют выявить управляемые переменные. Представление (аппроксимация) процедуры выбора решения адекватной моделью позволяет структурировать выбор и выявить значимые факторы или индикаторы.

Предлагаемый в работе метод оценивания показателя риска в решениях ЛПР можно отнести к задачам параметрической идентификации [17] ЛПР, как "черного ящика" по данным наблюдений за решениями, принимаемыми им в процессе нормального функционирования. Оценивание параметра выполняется в предположении, что процедура принятия решения структурно представима в виде игры с природой при отсутствии данных о вероятностях состояний природы. Тогда критерий Гурвица, как одна из схем принятия решений в условиях риска и неопределенности [15], представляется достаточно универсальной моделью, аппроксимирующей выбор ЛПР.

В том случае, когда в распоряжении ЛПР имеются данные о вероятностях состояний природы (по-

лученные, например, по прошлой статистике), моделью выбора, структурно соответствующей ситуации, можно считать критерий Ходжа-Лемана [15], содержащий параметр степени доверия ЛПР оценкам вероятностей состояний природы. В этом критерии с помощью параметра смешиваются критерий Вальда (крайнего пессимизма, максиминный) и критерий Лапласа-Байеса (учитывающий вероятности состояний природы).

Оба параметра смеси, будучи оцененными по наблюдениям за принятыми ЛПР решениями, отражают персональную позицию (состояние) ЛПР, исходя из которой он принимает решение. Такое двух-параметрическое отображение свойств ЛПР могло бы быть развитием однопараметрической меры (риска), как более информативное средство мониторинга ЛПР.

Параметрическая идентификация ЛПР, помимо режима нормального функционирования, может проводиться и в гораздо более ускоренном темпе и при меньшем количестве данных, если воспользоваться инструментами оптимального планирования эксперимента [17]. Применительно к управлению ликвидацией пожаров планирование эксперимента, естественно, возможно лишь в рамках учений и/или с использованием технических средств информационно-управляющей системы МЧС в режиме имитации.

Оценивание показателя риска в решениях ЛПР для использования в управлении ликвидацией ЧС не единственная сфера применения предлагаемого подхода. Знание фактического уровня риска (или склонности к риску) в решениях, принятых ЛПР, важно, например, в инвестиционном менеджменте, где желательно знать, насколько рискованны инвестиционные решения ЛПР. Степень склонности к риску важна и в управлении производственными программами [17]. При обучении опытными операторами робототехнических систем (РТС), используемых как в оборонных приложениях, так и в других экстремальных средах, также важен уровень риска, допускаемый ЛПР в качестве нормативного при принятии РТС решений в автономном режиме [16].

Имея в виду большое разнообразие структурно различных процедур принятия решений, возникающих и применяемых на всех уровнях иерархии управления в МЧС, можно использовать широкий спектр моделей принятия решений [17], таких как задачи математического программирования (линейного, квадратичного, дискретного и др.), антагонистические матричные игры, цепи Маркова с доходами и др. Аппроксимация этими моделями процедур принятия решений ЛПР также может выполняться как параметрическая идентификация [17], а оценки параметров также будут отражать персональные свойства ЛПР, которые могут быть использованы

для управления с использованием построенных моделей.

К числу недостатков предложенного подхода можно отнести следующие:

• интервальная оценка параметра X, полученная по наблюдениям за решениями, принятыми ЛПР, существенно зависит от данных, которые в некоторых случаях могут приводить к очень широкому интервалу, не позволяющему получить желаемую локализацию позиции ЛПР;

• при увеличении числа уровней дерева решений количество чистых стратегий ЛПР, а также размерность построенной по дереву платежной матрицы существенно возрастают, увеличивая размерность последней, что, однако, не приводит к существенному росту вычислительной сложности задачи (для современных компьютеров) в силу простоты вычислительных процедур.

Выводы

Предложенный алгоритм выявления уровня риска в решениях, принятых ЛПР в ходе проведения поисково-спасательных операций в условиях чрезвычайных ситуаций, позволяет выявить стратегию,

которой придерживается ЛПР, и оценить средний платеж. Если полученный от управления эффект признается компетентными лицами (экспертами), оценивающими решения, удовлетворительным, то в дальнейшем подобный уровень риска может быть признан приемлемым и на его основе могут быть построены системы поддержки принятия решений при управлении поисково-спасательными операциями подобного типа.

Применение предложенного подхода может позволить выявить по статистическим данным о решениях, принимаемых заведомо эффективными и опытными ЛПР (экспертами), предельно достижимые уровни эффекта (количество спасенных в чрезвычайных ситуациях людей) и соответствующие им эталонные стратегии принятия решений. Подобные предельные эффекты и эталонные стратегии могут служить ориентиром при обучении менее опытных ЛПР, действующих в чрезвычайных ситуациях.

Таким образом, предложенный подход позволяет обеспечить уровень риска, приемлемый и согласованный с экспертами, оценивающими качество и эффективность управления операциями в чрезвычайных ситуациях.

СПИСОК ЛИТЕРАТУРЫ

1. Брушлинский Н. Н., Соколов С. В. Математические методы и модели управления в ГПС и РСЧС. — М. : АГПС МЧС России, 2011. — 250 с.

2. Семиков В. Л. Комплексные исследования проблем безопасности // Технологии техносферной безопасности. —2015. —Вып. 5(63). — С. 235-242. URL: http://agps-2006.narod.ru/ttb/2015-5/ 31-05-15.ttb.pdf (дата обращения: 28.03.2019).

3. БрушлинскийН. Н., Клепко Е. А., Попков С. Ю., Соколов С. В. Управление пожарной безопасностью субъектов Российской Федерации на основе анализа пожарных рисков // Проблемы безопасности и чрезвычайных ситуаций. — 2010. — № 3. — С. 104-114.

4. ПовзикЯ. С. Пожарная тактика. — М. : ЗАО "Спецтехника", 2004. — 416 с.

5. Пожарные риски: динамика, управление, прогнозирование / Под ред. Н. Н. Брушлинского, Ю. Н. Шебеко. — М. : ВНИИПО. 2007. — 370 с.

6. Тетерин И. М., Топольский Н. Г., Климовцов В. М., Прус Ю. В. Применение математической теории игр в системе поддержки принятия решений руководителем тушения пожара // Технологии техносферной безопасности. — 2008. — Вып. 6 (22). — 21 с. URL: http://agps-2006.narod.ru/ ttb/2008-6/09-06-08.ttb.pdf (дата обращения 28.03.2019).

7. Macqueron C. Computational Fluid Dynamics Modeling of a wood-burning stove-heated sauna using NIST's Fire Dynamics Simulator. — 2009. — 9 p. URL: https://arxiv.org/ftp/arxiv/papers/1404/ 1404.6774.pdf (дата обращения: 28.03.2019).

8. Steffen B., Seyfried A. Modelling of pedestrian movement around 90° and 180° bends // Conference at Advanced Research Workshop on Fire Protection and Life Safety in Buildings and Transportation Systems (15-17 October 2009, Santander). 11 p. URL: https://arxiv.org/ftp/arxiv/papers/0912/0912.0610.pdf (дата обращения: 28.03.2019).

9. Stroh R., Bect J., Demeyer S., Fischer N., Vazquez E. Gaussian process modeling for stochastic multi-fidelity simulators, with application to fire safety. — 2016. — 6 p. URL: https://arxiv.org/pdf/ 1605.02561.pdf (датаобращения: 28.03.2019).

10. Hamke E. E., Jordan R., Ramon-Martinez M. Breath Activity Detection Algorithm. — 2016. — 11 p. URL: https://arxiv.org/ftp/arxiv/papers/1602/1602.07767.pdf (дата обращения: 28.03.2019).

11. Ribeiro J., Almeida J. E., Rossetti R. J.F., Coelho A., Coelho A. L. Using serious games to train evacuation behaviour. — 2013. — 6p. URL: https://arxiv.org/ftp/arxiv/papers/1303/1303.3828.pdf(дата обращения: 28.10.2018).

12. YunK., BustosJ., Lu T. Predicting rapid fire growth (flashover) using conditional generative adversarial networks. — 2018. — 4 p. URL: https://arxiv.org/ftp/arxiv/papers/1801/1801.09804.pdf (дата обращения: 28.03.2019).

13. Zhang J., SeyfriedA. Empirical characteristics of different types of pedestrian streams. —2012. — 8 p. URL: https://arxiv.org/ftp/arxiv/papers/1207/1207.5931.pdf (дата обращения: 28.03.2019).

14. БомасВ.В., СудаковВ.А. Поддержка субъективных решений в многокритериальных задачах.— М. : МАИ, 2011. — 176 с.

15. Лабскер Л. Г. Теория критериев оптимальности и экономические решения. — М.: Кнорус, 2009. — 744 с.

16. Новиков Д. А. Иерархические модели военных действий // Управление большими системами. — 2012. — Вып. 37. — С. 25-62.

17. ВилисовВ.Я. Адаптивный выбор управленческих решений. Модели исследования операций как средство хранения знаний ЛПР. — Саарбрюкен, Германия : LAP LAMBERT Academic Publishing, 2011. —376 с.

18. Петровский А. Б. Теория принятия решений. — М. : Академия, 2009. — 400 с.

19. Пожары и пожарная безопасность в 2016 г. : стат. сб. / Под общ. ред. Д. М. Гордиенко. — М. : ФГУ ВНИИПО, 2017. — 124 с.

20. Taha H. A. Operations research: an introduction. — 10th global ed. — Harlow, England: Pearson Education Limited, 2016. — 848 p.

REFERENCES

1. N. N. Brushlinskiy, S. V. Sokolov. Matematicheskiye metody i modeli upravleniya v GPS i RSChS [Mathematical methods and control models in State Fire Service and Russian System of Prevention and Response to Emergencies]. Moscow, State Fire Academy of Emercom of Russia Publ., 2011. 250 p. (in Russian).

2. V. L. Semikov. Complex researches of security problems. Tekhnologii tekhnosfernoy bezopasnosti / Technology of Technosphere Safety, 2015, issue 5(63), pp. 235-242 (in Russian). Available at: http://agps-2006.narod.ru/ttb/2015-5/31-05-15.ttb.pdf (Accessed 28 March 2019).

3. N. N. Brushlinsky, E. A. Klepko, S. Yu. Popkov, S. V. Sokolov. Fire safety management of subjects of the Russian Federation on the basis of fire hazard analysis. Problemy bezopasnosti i chrezvychaynykh situatsiy / Safety and Emergencies Problems, 2010, no. 3, pp. 104-114 (in Russian).

4. Ya. S. Povzik. Pozharnaya taktika [Fire tactic]. Moscow, ZAO "Spetstekhnika" Publ., 2004. 416 p. (in Russian).

5. N. N. Brushlinskiy, Yu. N. Shebeko (eds). Pozharnyye riski: dinamika, upravleniye, prognozirovaniye [Fire risks: dynamics, management, forecasting]. Moscow, VNIIPO Publ., 2007. 370 p. (in Russian).

6. I. M. Teterin, N. G. Topolskiy, V. M. Klimovtsov, Yu. V. Prus. Application of mathematical theory of games in system of support of decision-making. Tekhnologii tekhnosfernoy bezopasnosti / Technology of Technosphere Safety, 2008, issue 6(22), 21 p. (in Russian). Available at: http://agps-2006.na-rod.ru/ttb/2008-6/09-06-08.ttb.pdf (Accessed 28 March 2019).

7. C. Macqueron. Computational Fluid Dynamics Modeling of a wood-burning stove-heated sauna using NIST's Fire Dynamics Simulator. 2009. 9 p. Available at: https://arxiv.org/ftp/arxiv/papers/ 1404/1404.6774.pdf (Accessed 28 March 2019).

8. B. Steffen, A. Seyfried. Modelling of pedestrian movement around 90° and 180° bends. In: Conference at Advanced Research Workshop on Fire Protection and Life Safety in Buildings and Transportation Systems (15-17 October 2009, Santander). 11 p. Available at: https://arxiv.org/ftp/arxiv/papers/ 0912/0912.0610.pdf (Accessed 28 March 2019).

9. R. Stroh, J. Bect, S. Demeyer, N. Fischer, E. Vazquez. Gaussian process modeling for stochastic multi-fidelity simulators, with application to fire safety. 2016. 6 p. Available at: https://arxiv.org/pdf/ 1605.02561.pdf (Accessed 28 March 2019).

10. E. E. Hamke, R. Jordan, M. Ramon-Martinez. Breath activity detection algorithm. 2016. 11 p. Available at: https://arxiv.org/ftp/arxiv/papers/1602/1602.07767.pdf (Accessed 28 March 2019).

11. J. Ribeiro, J. E. Almeida, R. J. F. Rossetti, A. Coelho, A. L. Coelho. Using serious games to train evacuation behaviour. 2013. 6 p. Available at: https://arxiv.org/ftp/arxiv/papers/1303/1303.3828.pdf (Accessed 28 March 2019).

12. K. Yun, J. Bustos, T. Lu. Predicting rapidfire growth (flashover) using conditional generative adversarial networks. 2018. 4 p. Available at: https://arxiv.org/ftp/arxiv/papers/1801/1801.09804.pdf (Accessed 28 March 2019).

13. J. Zhang, A. Seyfried. Empirical characteristics of different types ofpedestrian streams. 2012. 8 p. Available at: https://arxiv.org/ftp/arxiv/papers/1207/1207.5931.pdf (Accessed 28 March 2019).

14. V. V. Bomas, V. A. Sudakov. Podderzhka subyektivnykh resheniy v mnogokriterialnykh zadachakh [Supportforsubjectivedecisionsinmulti-criteria tasks]. Moscow, MAI Publ., 2011.176p. (inRussian).

15. L. G. Labsker. Teoriya kriteriyev optimalnosti i ekonomicheskiye resheniya [The theory of optimality criteria and economic decisions]. Moscow, Knorus Publ., 2009. 744 p. (in Russian).

16. D. A. Novikov. Hierarchical models ofhostilities combat. Upravlenie bol'simi sistemami /Large-Scale Systems Control, 2012, issue 37, pp. 25-62 (in Russian).

17. V. Ya. Vilisov. Adaptivnyy vybor upravlencheskikh resheniy. Modeli issledovaniya operatsiy kak sred-stvo khraneniya znaniy LPR [Adaptive choice of management decisions. Models of operations research as a means of storing knowledge of decision makers]. Saarbryuken, Germany, LAP LAMBERT Academic Publishing, 2011. 376 p. (in Russian).

18. A. B. Petrovskiy. Teoriya prinyatiya resheniy [Decision theory]. Moscow, Akademiya Publ., 2009. 400 p. (in Russian).

19. D. M. Gordienko (gen. ed.). Pozhary ipozharnaya bezopasnost v 2016 godu. Statisticheskiy sbornik [Fires and fire safety in 2016. Statistical yearbook]. Moscow, VNIIPO Publ.,2017.124p. (inRussian).

20. H. A. Taha. Operations research: an introduction. 10th global ed. Harlow, England, Pearson Education Limited, 2016. 848 p.

Информация об авторе

ВИЛИСОВ Валерий Яковлевич, д-р экон. наук, канд. техн. наук, профессор, профессор кафедры математики и естественнонаучных дисциплин, Технологический университет, г. Королёв, Московская обл., Российская Федерация; ORCID: 0000-0002-2612-8593, Researcher ID: P-1650-2019, e-mail: vilisov@ut-mo.ru

Ïocmynuna 29.03.2019; npunnma k nyönuKaöuu 06.05.2019 Received 29 March 2019; accepted 6 May 2019

Information about the author

Valeriy Ya. VILISOV, Dr. Sci. (Econom.), Cand. Sci. (Eng.), Professor, Professor of Department of Mathematics and Natural Sciences, Technological University, Korolyev, Moscow Region, Russian Federation; ORCID: 0000-0002-2612-8593, Researcher ID: P-1650-2019, e-mail: vilisov@ut-mo.ru

Издательство «П0ЖНАУКА»

Д. Г. Пронин

Д. А. Корольченко

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ДЕЛЕНИЕ ЗДАНИЙ НА ПОЖАРНЫЕ ОТСЕКИ

Представляет книгу

Д. Г. Пронин, Д. А. Корольченко

ДЕЛЕНИЕ ЗДАНИЙ НА ПОЖАРНЫЕ ОТСЕКИ: учебное пособие.

- М.: Издательство "П0ЖНАУКА".

В учебном пособии изложены базовые основы, действующие требования и современные представления о целях, задачах и способах ограничения распространения пожара по зданиям и сооружениям путем их разделения на пожарные отсеки.

Пособие предназначено для студентов Московского государственного строительного университета. Оно может быть использовано также другими образовательными учреждениями и практическими работниками, занимающимися вопросами обеспечения пожарной безопасности.

121352, г. Москва, а/я 6; тел./факс: (495) 228-09-03; e-mail: info@fire-smi.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.