Научная статья на тему 'Проблема превентивной безопасности. Модель и методы принятия решений'

Проблема превентивной безопасности. Модель и методы принятия решений Текст научной статьи по специальности «Математика»

CC BY
227
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Матросов В. М., Баранов В. В.

Рассмотрена проблема принятия управляющих решений, ориентированных на обеспечение работоспособности, безопасности и эффективности технических систем в эксплуатации. Проблема сведена к выбору равновесных по критериям полезности и риска стратегий управляющих воздействий, диагностики ситуаций и моментов диагностики. Представлены методология, модель, постановка задачи и основные результаты, определяющие конструктивные методы принятия управляющих решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREVENTIVE SAFETY PROBLEM. THE MODEL AND DECISION-MAKING METHODS

The problem of making control decisions aimed at ensuring availability, efficiency and safety of industrial systems is examined. The problem is reduced to choosing control strategies balanced with respect to utility, risk, and diagnosis criteria. The methodology, model, problem statement and key results determining constructive decision-making techniques are presented.

Текст научной работы на тему «Проблема превентивной безопасности. Модель и методы принятия решений»

о

бзоры

УДК 519.856

ПРОБЛЕМА ПРЕВЕНТИВНОЙ БЕЗОПАСНПСТП. МОДЕЛЬ И МЕТОДЫ ПРИНЯТИИ РЕШЕНИЙ1

В. М. Матросов, В. В. Баранов

Центр исследований устойчивости и нелинейной динамики при Институте машиноведения РАН, г. Москва

Рассмотрена проблема принятия управляющих решений, ориентированных на обеспечение работоспособности, безопасности и эффективности технических систем в эксплуатации. Проблема сведена к выбору равновесных по критериям полезности и риска стратегий управляющих воздействий, диагностики ситуаций и моментов диагностики. Представлены методология, модель, постановка задачи и основные результаты, определяющие конструктивные методы принятия управляющих решений.

ВВЕДЕНИЕ

Проблема безопасности возникает в любых техногенных системах, ее содержание не однозначно и может иметь смысл охраны (security), отсутствия риска (safety) либо предотвращения (preventive). В статье проблема безопасности рассматривается в смысле «preventive» применительно к условиям технических систем. Этим определяется смысл термина «превентивная безопасность».

В технических системах проблема порождается внутренними процессами типа износа, старения, усталости и т. п., которые случайны и завершаются попаданием в поглощающее состояние. Их моменты называются «отказами» и, как правило, сопровождаются катастрофическими последствиями. Отсюда возникает необходимость их предотвращения. Для этого необходим мониторинг состояния, диагностика ситуаций работоспособности и выполнение определенных воздействий и мероприятий, направленных на восстановление работоспособности, обеспечение безопасности и выбор режимов использования системы. От выбора состава и режимов подобных действий зависит эффективность системы в эксплуатации. Этим определяется непреходящая практическая важность проблемы превентивной безопасности.

В научном плане подобная проблема исследуется, начиная с 1930-х гг. До 1960-х гг. ее решение сводилось к периодическому выполнению так называемого «регламентного обслуживания», состоящего из определенного перечня контрольно-профилактических воздействий.

1 Работа выполнена при поддержке РФФИ, проект № 05-08-33574а.

При этом режимы такого «обслуживания» основывались на интуитивно-опытном подходе, не имеющем объективных научных обоснований и, как правило, не увязанных с режимами использования системы.

Осознание очевидной неэффективности подобного подхода в 1960-е гг. привело к новому научному направлению ее решения в рамках так называемых моделей «профилактики» [1—7]. Постановки задач в таких моделях сводятся к выбору оптимального периода восстановления работоспособности по некоторому критерию «готовности» либо «издержек», определяемому в зависимости от заданных вероятностных характеристик надежности системы. Однако, как известно, теория надежности исходит из условия, что система может пребывать в одном из двух состояний: «исправно» либо «отказ». Все промежуточные состояния, порождаемые процессами старения и предшествующие отказу, при этом не учитываются. Предпринятые в ряде работ попытки учитывать старение системы путем введения предположения о зависимости важнейшей характеристики надежности, называемой «опасностью» либо «интенсивностью» отказов, от времени [8, 9], никак не изменяют того условия, что вся информация о надежности извлекается из «наработки» системы до отказа. В силу этого модели профилактики на практике могут быть использованы лишь для укрупненного планирования ресурсов, но не для оперативного управления состоянием системы с целью обеспечения ее работоспособности и безопасности. По мере осознания этого в 1970—1980 гг. начали интенсивно исследоваться и развиваться методы и средства технической диагностики, которые, как ожидалось, открывали возможность решения проблемы управления работоспособностью и безопасностью систем «по состоянию».

Ориентируясь на такую возможность, в работе [10] была построена модель последовательного принятия оптимальных решений по выбору способов и режимов обеспечения работоспособности и безопасности, основанная на идеологии модели марковских процессов принятия решений Беллмана [11] и ее обобщении в виде «параметрической» модели стохастического управления [12]. Но оказалось, что такая модель мало полезна на практике. Причины этого связаны с предположениями модели, согласно которым состояние системы однозначно определено, доступно наблюдению и множество состояний конечно. Но реальные системы являются сложными, состоят из набора подсистем с различным ресурсом работоспособности и надежности. В этих условиях способ введения состояния, который обеспечивал бы практическую возможность его достоверного наблюдения и использования для принятия управляющих решений, по меньшей мере, не очевиден.

К сожалению, трудности проблемы этим не исчерпываются и определяются более глубокими причинами. Одна из них связана с тем обстоятельством, что обеспечение безопасности не может рассматриваться в качестве цели. Действительно, если положить, что безопасность является целью, то способ ее достижения очевиден и сводится к отключению системы от использования (по этому пути идут, например, страны, отказавшиеся от использования ядерной энергетики). Однако ясно, что существование любой системы может быть оправдано лишь в тех условиях, когда она доступна использованию и приносит определенную «пользу» заинтересованной стороне. Отсюда следует, что проблема превентивной безопасности должна рассматриваться и решаться в контексте интересов, связанных с использованием системы. Очевидно, что на этом пути требуется адекватный подход к формализации и решению проблемы. Такой подход предложен в работе [13]. Он основан на концепции «интересо-ориентированных» систем и методологии управления, мотивированного интересами, развитой в работе [14]. В настоящей статье выполняется обзор результатов, определяющих методологию подобного подхода, модель, постановку задачи и конструктивные методы, обеспечивающие практическую возможность решения проблемы превентивной безопасности.

1. МЕТОДОЛОГИЧЕСКИЕ ОСНОВАНИЯ

Развиваемый подход к проблеме превентивной безопасности основывается на концепции «интересо-ориен-тированной» системы, которая согласно работе [14] определяется тройкой объектов {X, O, Ж), где X — коллектив заинтересованных субъектов, О — множество объектов их интересов, Ж — отношения на элементах множества (X х О). Простейшим вариантом интересоориентированных систем являются так называемые унитарные системы, в которых субъект интересов и объект интересов единственны. Применительно к проблеме превентивной безопасности в роли унитарной системы может рассматриваться любая техническая система, представляемая как целостный объект. В силу относительной простоты такого представления проблему пре-

вентивной безопасности естественно изначально исследовать в классе унитарных систем.

Методология формализации проблемы основывается на следующей аксиоматике унитарных систем [13, 14].

• Цель управления извне не задана и формируется внутри системы на основе интересов.

• Мотивация управляющих действий определяется стремлением к реализации интересов.

• Объект интересов является пассивным, динамическим и стохастическим. Природа динамики объекта определяется внутренними процессами типа старения, износа, усталости и т. д.

• Структурные параметры системы не фиксированы, и субъект может их выбирать.

• Интересы субъекта многоаспектны, и состоят, по меньшей мере, из двух аспектов, один из которых определяется заинтересованностью в управлении эволюцией внутренних состояний объекта, а другой — в заинтересованности в выборе структурных параметров системы.

На основе этой аксиоматики в работе [13] сформулирована концепция управления, мотивированного интересами. В окончательном варианте она определяется следующими постулатами.

• Объект интересов является стареющим. Наблюдаемые значения выходных параметров образуют внешние состояния объекта. Их динамика описывается марковским процессом с поглощающим состоянием. Траектории процесса не убывают и обрываются в момент попадания в поглощающее состояние. Моменты обрыва траектории являются моментами отказа либо катастрофы системы.

• Субъект интересов задает множество X ситуаций, которые являются качественными характеристиками работоспособности объекта. Ситуации непосредственно не наблюдаются и нуждаются в диагностике в зависимости от состояния я е £. При этом заданы ограничения X с X на допустимость ситуаций в зависимости от состояний я е £.

• Субъект интересов располагает множеством У альтернативных управляющих воздействий по восстановлению работоспособности и обеспечению безопасности. Их выбор выполняется в зависимости от ситуаций х е X. При этом заданы ограничения У с У на допустимость воздействий в зависимости от ситуаций х е X. Множество У содержит управляющее воздействие, способное выводить из поглощающего состояния.

• Задано множество С альтернатив, являющихся структурными в том смысле, что они выбираются независимо от состояний и ситуаций в качестве общего параметра, от которого зависит эффективность управляющих решений. Применительно к проблеме безопасности структурные альтернативы имеют, в частности, смысл шага времени между очередными моментами наблюдения состояний и диагностики ситуаций.

• Альтернативами окончательного выбора являются не элементы множеств У, С и X, а правила, по которым осуществляется выбор элементов из заданных множеств.

• Решения по выбору альтернатив принимаются последовательно в дискретные моменты времени.

• Применение управляющих воздействий к объекту интересов порождает управляемый марковский процесс с дискретным временем. Задана его переходная функция 4g(S|£ х У) из £ х У в £, которая зависит от структурной альтернативы g е О как от параметра.

• Задана функция полезности V^(£ х X х У) ^ Л1, представляющая априорные предпочтения на управляющих альтернативах у е У в зависимости от состояний и ситуаций (я, х) е £ х X, как от переменных, и от структурной альтернативы g е О, как от параметра [15].

• Качество правил выбора управляющих и структурных альтернатив описывается критериями, имеющими смысл «полезности».

• Качество правила диагностики описывается критерием, имеющим смысл «риска ожидаемых потерь полезности».

• Правила управления, диагностики и структурные альтернативы выбираются совместно с учетом взаимной зависимости их критериев качества. Информационная структура. Формальные объекты,

постулируемые сформулированной концепцией управления, являются носителями априорной информации об условиях принятия решений. В совокупности они образуют набор:

I = {£, X, [X с X, я е £], У, [Ух с У, х е X], О,

4^£|£ х У), -V^£ х X х У), g е О},

где £ — множество состояний, X — множество ситуаций; X с X — ограничения на допустимость ситуаций в роли альтернатив диагностики; У — множество управляющих альтернатив; У с У — ограничения на допустимость управляющих альтернатив в зависимости от ситуации х е X; О — множество структурных альтернатив (шагов времени между моментами диагностики ситуаций);

4g(S |£ х У) — переходная функция из £ х У в £;

V^(£ х X х У) ^ Л1 — функция полезности.

Набор объектов I называется базовой информационной структурой.

В частном случае, если X = £, структура I сводится к информационной структуре параметрической модели стохастического управления [12], задаваемой набором объектов вида

ВС = {X, У, [ Ух с У, х е X], О, Qg(X|X х У),

V^ х У), g е О}, (1.1)

где X — множество состояний, Qg(X|X х У) — переходная функция из X х У в X, V ^ У х X) — функция полезности,

О — множество структурных альтернатив.

Если при этом |О | = 1, то имеет место информационная структура вида

В = {X, У, [ Ух с У, х е X], Q(X|X х У),

^ х У)}, (1.2)

которая определяет модель Беллмана марковских процессов принятия решений [11].

Принципы формализации проблемы. Формализация проблемы в условиях сформулированной концепции управления нуждается в определенных методологических принципах. Их обоснование содержится в работе [14]. Далее приводятся их окончательные формулировки.

Принцип расщепления интересов: формализация проблемы основывается на расщеплении многоаспектных интересов на компоненты, каждой из которых сопоставляется виртуальная заинтересованная сторона с соответствующим индивидуальным множеством альтернатив и критерием качества.

Принцип компромиссных решений: в условиях принципа расщепления проблемы выбора имеет игровое содержание и состоит в отыскании сильно устойчивого компромисса, являющегося Парето-оптимальным равновесием Нэша [16].

Принцип расщепления постулирует задание критериев качества альтернатив виртуальных заинтересованных сторон. Концепция управления указывает их смысл. Это — критерии ожидаемой полезности и риска. Однако базовая информационная структура I в явном виде не содержит носителей априорной информации, которые были бы непосредственно ориентированы на построение нужных критериев качества. В таком случае остается преобразовать базовую структуру I в наборы носителей информации, которые обеспечивали бы возможность построения требуемых критериев и разрешимость проблемы. Таковыми являются структуры типа ВС либо В. Если подобные преобразования существуют, то их естественно называть структурными. Исходя из этих соображений, формулируется последний методологический принцип.

Принцип структурных преобразований: необходимые для построения критериев качества альтернативных управляющих решений информационные структуры формируются путем преобразований базовой информационной структуры I в информационные структуры, обеспечивающие разрешимость проблемы. Таковыми являются структуры типа ВС либо В, определенные наборами объектов

(1.1) и (1.2), соответственно.

Сформулированная концепция управления вместе с методологическими принципами составляют методологическую базу формализации проблемы превентивной безопасности.

2. МОДЕЛЬ И ПОСТАНОВКА ЗАДАЧИ ПРИНЯТИЯ УПРАВЛЯЮЩИХ РЕШЕНИЙ

Исходные предположения и определения. Согласно введенной концепции управления динамика объекта описывается марковским процессом. В общем случае естественно полагать, что множество его состояний является компактным борелевским. Однако рассматриваемая проблема допускает возможность лишь численного ее решения. Поэтому в любом случае приходится вводить дискретную схему и континуальные множества заменять конечными. Схема дискретизации носит технический характер и не рассматривается. С учетом этого

модель принятия решений будем строить в следующих исходных предположениях.

1. В составе базовой информационной структуры I все множества конечны. При этом множество состояний

S упорядочено и удовлетворяет условию |S| > |X|.

2. Шаг времени между моментами диагностики (структурная альтернатива g е G) выбирается последовательно на каждом шаге принятия решений.

3. Горизонт времени не ограничен.

Согласно концепции управления альтернативами окончательного выбора являются не элементы заданных множеств Y, Xи G, а правила, по которым осуществляется их последовательный выбор. Такие правила будем называть стратегиями и определять следующим образом.

Стратегия управления: последовательность {%[ = = (пп, ..., 7tj), n = 1, 2, ...}, где пп — решающая функция, определяемая однозначным отображением X ^ Y: п(х) е Yx.

Стратегия диагностики: {8^ = (Sn, ..., Sj), n = 1, 2, ...}, где Sn — решающая функция, определяемая однозначным, монотонным отображением S ^ X : Sn(s) е X.

Стратегия наблюдения: последовательность {tJ = = (тп, ..., т1), n = 1, 2, ...}, где тп е G — длительность n-го шага времени между очередными моментами принятия решений.

Тройка стратегий ({nj}, {8^}, {}) является политикой управляющих решений.

Критерии качества. Согласно концепции управления

п

качество стратегии управления nj описывается критерием, имеющим смысл ожидаемой полезности. Такой критерий не задан, но может быть сформирован на основе заданной в базовой информационной структуре I функции полезности wg(S х X х Y), зависящей от структурной альтернативы g е G, как от параметра. В этих условиях требуемый критерий полезности будет зависеть от стратегии наблюдения tJ , как от заданного условия. По определению стратегия управления не зависит от стратегии диагностики. Поэтому и ее критерий качества в явном виде также не зависит от стратегии диагностики. С учетом этого критерий полезности, описывающий качество стратегии управления, будем обозначать символом фп( щ | тп). Поскольку процесс принятия решений начинается из некоторой ситуации x е X, то и критерий фп( nj | тп) будет зависеть от ситуации, как от начального условия. Так как по предположению множество ситуаций X конечно, то окончательно критерий

Фп( %[ | tJ ) будет представляться вектором в пространстве

RX размерности |X |.

Согласно концепции управления функция полезности wg(S х X х Y) зависит от шага наблюдения g е G как от параметра. Поэтому качество стратегии наблюдения

n

Tj естественно описывать критерием, также имеющим смысл ожидаемой полезности. Поскольку при этом вы-

бор альтернативы g є Є выполняется независимо от ситуаций и состояний, то требуемый критерий естественно определять некоторым функционалом цп є Я1, не зависящим от начального условия. Определим его сверткой

/ П яч „X

вектора полезности фп( пі | ^) є Яв виде:

^л() = Е Ф„()(х). (2.1)

х є X

Согласно концепции управления качество стратегии диагностики описывается критерием, имеющим смысл риска ожидаемых потерь полезности. Риск потерь полезности естественно оценивать при условии

п г п

заданных стратегий управления пі и наблюдения ті. С учетом этого критерий риска будем обозначать символом уп( 8” | п”, т!). Ясно, что процесс диагностики начинается в некотором состоянии ^ є £. Поэтому критерий риска будет зависеть также и от состояния я є £, как от начального условия. Поскольку по исходным предположениям множество состояний £ конечно, то критерий

п і п п \

риска будет представляться вектором ул( 811 Пі, ті) в пространстве Я5 размерности |£ |.

Базовая информационная структура I не содержит носителей априорной информации, которые были бы непосредственно ориентированы на построение требуемых критериев. Тогда в соответствии с методологическим принципом структурных преобразований остается преобразовать базовую структуру I в наборы носителей информации, обеспечивающих возможность строить нужные критерии. Если при этом существует преобразование структуры I в информационную структуру, обеспечивающую построение критерия полезности фп( пп | тп ), то такое преобразование будем называть преобразованием «полезности» и обозначать П, а индуцируемую им информационную структуру будем обозначать V и называть «информационной структурой полезности». Результат преобразования П зависит от используемых стратегий. В силу этого преобразование П может выполняться лишь в «апостериорном режиме». В этих условиях индуцируемая преобразованием П структура полезности должна формироваться последовательно в

п п п

зависимости от используемых стратегий (пі, ті, 8і). С учетом этого индуцированную на шагах п = 1, 2, ... структуру полезности будем окончательно обозначать

V = П(1|пп, тп, 8п).

Поскольку согласно (2.1) критерий цп определяется

/ Щ пч „X

суммой компонент вектора полезности фп(Пі |ті ) є Я , то оба критерия фп и цп естественно записывать совместно в виде

/ п| пч Фп(п1 Т1) >

Если существует преобразование базовой структуры I в информационную структуру, обеспечивающую по/ ПI п П \

строение критерия риска уп( 8j | nj, Tj), то будем называть его «преобразованием риска» и обозначать Р, а индуцируемую им информационную структуру будем обозначать R и называть «информационной структурой риска». Оказывается, что преобразование риска Р не зависит от используемых стратегий и может выполняться в априорном режиме. С учетом этого критерий риска будем окончательно записывать в виде

,„П| П П,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

v„(81l п1,т1 ^

R = P( I).

Постановка задачи. Согласно методологическому принципу расщепления формализация проблемы основывается на расщеплении исходной многоаспектной проблемы в набор задач, отвечающих выделенным аспектам интересов. Каждая сторона стремится выбрать свою «наилучшую» стратегию. Поскольку критерии взаимозависимы, то согласно принципу компромиссных решений проблема выбора имеет игровое содержание и сводится к отысканию устойчивого компромисса, называемого равновесием. С учетом этого введем следующие определения.

Определение 2.1. Политика управляющих решений

, ° П °П СП,

{п i, т i, 81} называется равновесной, если она удовлетворяет условиям:

' , ° ПI ° П. . , П| ° П. П . ~

фп(п 1|т 1 ) 1 Ф„(п1|т 1 ) V п1, П - ^ 2, ...,

/ ° П I ° П \ ^ / П I ° П \ W П 1 -Л

i ^п(т 1|п 1) 1 ^п(т1|п 1) V т1, П - 1, 2, ...,

ип - П(1|П 1, TП81), п - 1, 2, ..., (2.2)

/?>П|0П 0 П \ / о. П i 0 П 0 П \ у , о.П _

. уп(81|п 1, т 1) m уп(81|п1, т 1) V 81, П - 1, 2, ...,

R - Р(1).

Равновесная политика определена на любом горизонте времени конечной длины п < го. Естественно требовать, чтобы она имела смысл, в том числе и при П ^ го. С этой целью введем следующие конструкции. Пусть пп - (п, ..., п), тп - (т, ..., т), 8п - (8, ..., 8) —

П П П

стационарные стратегии на конечном горизонте време-

ни длины п < го. На бесконечном горизонте будем обоз-

со , ч со

начать их соответственно в виде: п - (п, п, ...), т -

- (т, т, ...), 8° - (8, 8, ...).

Предположение 2.1. Критерии качества стационарных стратегий удовлетворяют свойствам:

• существуют пределы

' lim фп(пп|тп)(х) - ф(п“К“), п ^да

J lim ^п(тп|пп)(х) - Ц(т“|п“),

П ^да

lim П(1|пп, тп, 8п) - и(п°, т°, 8°), (2.3)

. п ^да

f lim ¥п(8п|пп, ^)(s) - ¥(8“|п°, т°),

J п ^да

Ir - Р(1);

пределы lim фп(пп|тп)(х) - ф(п°|т°) и lim уп(8п|пп,

п ^да п ^да

тп)(^) - у(8°|п°, т°) не зависят от начальных условий, соответственно, x е X и s е S.

Определение 2.2. Стационарная политика (пда, тда,

° дач

8 ) называется равновесной, если существуют пределы (2.3), удовлетворяющие условиям:

ф( пда | тда) 1 ф(п°| тда) V п°,

j р.( тда | пда ) 1 ц(т“| пда ) V т°,

[и - П(1|пда, тда, 8да), (2.4)

I /° да ° да °да\ - /с»°1 ° да °да\ w ° да

I у( 8 17! , т ) m у(8 17! , т ) V 8 ,

Ir - р(1 ).

Определение 2.3. Пусть (пда, тда, 8да) — стационарная равновесная политика. Равновесная политика {п 1, тП,

СП

81} асимптотически стационарна, если существуют пределы

lim Фп( п П|т” )(x) - ф( пда|т да ),

п ^ да

J lim ^п( тСП | п П ) - Ц( т да|^да ),

П ^ да

lim П(1|пп, т1, 8П) - U(пда, тда, 8да), (2.5)

. п ^ да

[ lim ¥п(8П|п1, 4)(s) - у(8да|^да, ^X

I п ^да

Ir - Р(1).

Из выполненных построений следует, что равновесная политика ориентирована на решение проблемы управления, при котором достигается «наилучший» результат в смысле условий (2.2)—(2.5). Тогда ее отыскание и использование естественно рассматривать в качестве внутренней цели управления системой.

В совокупности выполненные построения определяют общую структуризацию, постановку задачи и модель управления, ориентированную на решение проблемы превентивной безопасности и эффективности систем в эксплуатации. Однако используемые в модели критерии полезности и риска, а также структурные преобразования лишь обозначены, но в явном виде не определены. Их однозначное определение требует дополнительных построений и результатов.

Структурные преобразования. Модель принятия решений исходит из необходимости и возможности преобразования заданной базовой информационной структуры I в информационные структуры полезности Un и риска R, в условиях которых должны формироваться соответствующие критерии полезности и риска. Условия существования и варианты конструкций таких преобразований устанавливаются приводимыми далее утверждениями.

Утверждение 2.1. Пусть в некоторый момент п 1 1 задана решающая функция диагностики 8п = 8 : S ^ X и безусловное распределение вероятностей ß^S) = ß(S). Тог-

да существует преобразование базовой структуры I в информационную структуру полезности вида

Ц,(8, в) = {X, У, [Ух с У, х е X], О, Qsn (XIXх У), (X х У), я е О}.

Здесь Qn (XIX х У) — переходная функция из X х У в X, вычисляемая по формуле:

Qn (Ж y) = Z Z qg(k|s, y)x„(s|s (x)),

k є 5 1(/) s є 5 1 (x)

x, j є X, y є

Y*

(2.6)

где # г0|^, •) — переходная функция из S х У в S, заданная в базовой структуре I;

8-1(х) = и {я е S: 8(я) = х} с S, х е X — подмножества разбиения множества S, порождаемого решающей функцией диагностики 8 : S ^ X;

А,п(^ |8 1(х)) — условное распределение на S при условии я е 8-1(х), вычисляемое по формуле:

вп( Я)

Xn(s|S !(x)) =

Z P„(k)

, s є S (x)

k є 5 (x)

-1,

0, s g s (x)

x є X, s є S.

(2.7)

wg (Xx Y) = функция полезности, вычисляемая по формуле:

(x, y) = Z wg(s, x, y)Xn(s|S !(x)),

k є 5 1(x)

x є X, y є Y,

(2.8)

где №g(s, х, у) — функция полезности, заданная в базовой структуре I.

Доказательство аналогично доказательству леммы 2.1 в работе [17].

Замечание 2.1. Условия утверждения 2.1 предполагают задание безусловного распределения вероятностей вп на множестве состояний £ Очевидно, что для п > 1 распределение Рп^) не может быть задано из априорных соображений, но оно может быть построено в зависимости от используемых стратегий. Способ его построения определим рекуррентным соотношением:

Р« = П во + ^ К - і^8, пХ п = - 2 ..., (2.9)

где в0 — априорное распределение на Я, #т(8, п): Я5 Я5 — оператор усреднения, порождаемый переходной функцией #т(£ \£ х У) и действующий по правилу:

#т(8, п)г(^) = Е г(к)<І(к\$, п(8(^)), ^ є £.

к є 5

Соотношение (2.9) отвечает последовательному усреднению распределений по Чезаро. Подробности обоснования содержатся в работе [14].

Утверждение 2.2. Существует преобразование Р базовой структуры I в информационную структуру «риска» вида

R = {S, X, [Xs с X, s е S], Y, G, qg(S|S х Y),

rg(X х S х Y), g е G},

где rg(S х Xх Y) — функция риска, вычисляемая по формуле:

rg(s, x, y) = |wg(s, x, y) — max max wg(s, x, y)|. (2.10)

У e Yx x e Xs

Доказательство аналогично доказательству теоремы 2.2.2 в работе [14]. ♦

Сформулированные результаты устанавливают существование и конструкции структурных преобразований и тем самым открывают возможность построения критериев полезности и риска. Однако в явном виде такие критерии не определены. Их явный вид, удовлетворяющий условиям развиваемой модели принятия решений, устанавливается следующим утверждением.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 2.3. Условиям модели принятия решений удовлетворяют критерии, имеющие смысл средних (в смысле Чезаро) соответственно «полезности» и «риска» вида:

( п\ П) n- 1

ф„(п1к)(x)=1Ti хwTn-t(xt, y),

t = 0

(2.11)

,,л| п пч п __ і

,„Пі п пч, ч 1 , ,(51 п1>ті) Тп-(/ ч

^„(81\пі, ті )(^) = п М Е г (^ X, у).

t = 0

^ є £; (2.12)

При этом для критерия полезности фл є Ях существует оператор ^л(п\т): Ях ^ Ях, с использованием которого критерий фл удовлетворяет рекуррентному соотношению

Фл = ^1(пл|тл)Фл - Р П = 1, 2, -; Ф0 = 0 Є ЯХ Оператор ^л(пл\тл) действует по правилу:

^л(п» = 1 + П-1- (2.13)

п п

где мТ(п) — функция полезности, Qт(п) : Ях ^ Ях — оператор усреднения, порождаемый переходной функцией QT(X\X х У).

с

Для критерия риска ул є Я существует оператор Вл(8\п, т) : Я5 ^ Яс, с использованием которого критерий ул удовлетворяет рекуррентному соотношению

^л = Вл(8л\пл, Тл)Фл - 1, П = -,2, .- Ф0 = 0 Є ЯС.

Оператор Вп(8|п, т) действует по правилу:

Вп(8|п, т)у = - Г(8, п) + --------------q(8, п)у, (2.14)

n n n

где Г(8, п) — функция риска; дт (8, п):Я5 ^ Я5 — оператор усреднения, порождаемый переходной функцией дТ^|S х У).

Доказательство основывается на результатах работы [18] и аналогично доказательству лемм 2 и 3 в работе [20] и теорем 2.7.1 и 2.7.2 в работе [14].

Утверждение 2.4. Пусть в модели принятия решений используются критерии средней полезности фп и риска уп в соответствии с их определениями (2.11) и (2.12), пусть при этом соответствующие операторы усреднения О (п): Ях Я^ и дт(8, п) : Я5 ^ Я5 являются сжимающими. Тогда равновесная политика асимптотически стационарна.

Доказательство аналогично доказательству теоремы 2.10.1 в работе [14].

Замечание 2.2. Вообще говоря, в рамках развиваемой здесь методологии модель принятия решений может рассматриваться при иных критериях полезности и риска, отличных по структуре от средних по Чезаро. Однако существование таких критериев, которые удовлетворяли бы всем предположениям и условиям модели принятия решений (в частности, условию асимптотической стационарности равновесной политики), не очевидно. Поэтому вопрос о возможности использования иных критериев остается открытым. ♦

Представленные результаты завершают построение модели и постановку задачи принятия управляющих решений, ориентированной на проблему превентивной безопасности. Остается указать условия разрешимости задачи и сформировать конструктивные методы отыскания равновесной политики. Для этого необходим ряд дополнительных результатов, которые формулируются далее.

3. УСЛОВИЯ СУЩЕСТВОВАНИЯ И ДОСТИЖЕНИЯ РАВНОВЕСНОЙ ПОЛИТИКИ

Существование согласованных с критериями средней полезности фп и среднего риска уп соответствующих операторов Fn и Вп позволяет последовательно строить равновесную политику управляющих решений. Реализация такой возможности достигается с использованием следующих конструкций и результатов.

Обозначим П = {п : X ^ У|п(х) е 7, х е X} — множество решающих функций управления, Б = {8 : S ^ ^ X|8(д) е X;, ^ е S} — множество решающих функций диагностики.

Определение 3.1. Пусть в момент п 1 1 заданы безусловное распределение Рп _ ^), векторы полезности

Х 5

Фп _ 1 е Я и риска уп _ 1 е Я и согласованные с ними операторы ^,(п|т) и Вп(8|п, т), определенные формулами (2.13) и (2.14), соответственно. Тройка решающих функ-

ций (7t, т, 8) называется локальными равновесиями, если она удовлетворяет условиям:

Fn( 7п|т)Ф„ - 1 1 - 1 v п е П

X [Fn(и|т)фп _ 1](x) 1 X [Fn(7!|Т)фп - 1](x) V т е G

x е X x е X

Un = П(/17t, Т, 8),

Вп( 8 1 7Л , T)^n - 1 < Bn(81 тп, T)^n _ 1 V 8 е D,

R = Р(1).

С использованием операторов Fn(n|x) и Bn(8|n, т) введем операторы выбора вида:

^,(т)ф = max Fn (п|т)ф;

пе П

Ап(п)ф = max X [^п(и|т)ф](х);

т е G X е X

D (%, т)у = min Bn(8|n, т)у.

5 е D

Утверждение 3.1. Пусть множества S, X, Y и G конечны. Тогда локальные равновесия существуют. При этом необходимым и достаточным условием их достижения является выполнение условий системы вида:

рп( п|т)Фп - 1 = Уп( т)Фп - 1,

X [^( пЮфп - 1](х) = Ап( п)фп - 1,

х е X

ип = П(/17!, Т, 8°),

вп( 8К т)^п - 1 = °п( ^ т)^п - 1,

Я = Р(1).

Доказательство аналогично доказательству теоремы 2.4.1 в работе [14].

Утверждение 3.2. Равновесная политика управляющих решений достигается последовательным построением локальных равновесий, вычисляемых из решения системы

Fn(пп|тп )ФЛ - 1(п 1 1|т 1 1 ) -

= Vn( Тп)Фп - 1( п n " 1|тП - 1 ), n - -, 2, ...,

{ X [Fn(Пп|тп )Фп - 1(пП" 1|тП" 1 )](x) -

x є X

- An( п п )Фп - 1( п 1 " 1|т 1 ~ 1 X n - -, 2 ..., ип - П(/|пп, тп , 8п), n - -, 2 ..., (3.-)

Вп( 8п|пп, Тп К - 1( 81 1|п1 1 , т1 1 ) =

1 = °п(пп, тП К - 1(81 " 1|п 1 " 1 , т1 " 1 X п = 1, 2, ...,

Я = Р(/).

Доказательство основывается на монотонности операторов выбора V, Ап и йп и выполняется аналогично доказательству теоремы 2.6.1 в работе [14].

Утверждение 3.3. Равновесная политика образует сильно устойчивый компромисс в том смысле, что она является равновесием Нэша и при этом Парето-оптимальна.

Доказательство аналогично доказательству теоремы 2.5.1 и следствия 2.6.2 в работе [14]. ♦

Полученные результаты устанавливают, что равновесная политика удовлетворяет требованиям методологического принципа компромиссных решений, сформулированного в § 1. Тем самым она является тем наилучшим решением проблемы, на которое изначально ориентирована развиваемая здесь методология и модель управления. Однако равновесная политика рассматривается на неограниченном горизонте времени. Ясно, что на практике процесс принятия решений не может продолжаться бесконечно и в некоторый конечный момент он должен быть остановлен. При определении правила остановки естественно исходить из свойства асимптотической стационарности равновесной политики и требовать, чтобы в момент остановки равновесная политика была в определенном смысле близка к стационарной равновесной политике. Смысл требуемой близости устанавливается следующим определением.

Определение 3.1. Пусть (к ”, 8 ”, т”) — стационарная равновесная политика и задано некоторое е > 0. Тройка

о / ОО ОО ОО \

стационарных стратегий (п , т , 5 ) является е-стацио-нарной равновесной политикой, если выполняются неравенства:

|ф(п“|т”) - ф( к "К" )| < Є

I /с.тоі то то, /С*"| " "\1

V(8 |п , Т ) — у( 8 17! , Т )| m Є.

С учетом этого определения момент остановки процесса принятия решений естественно связывать с достижением s-стационарной равновесной политики. При его отыскании будем использовать следующие конструкции. Обозначим:

||ф||Л = max ф(х) — min ф(х), |М|л = max y(s) — min y(s).

x e X x e X s e S s e S

Х

Утверждение 3.4. Пусть операторы усреднения Q : R ^ RX, q : RS ^ RS являются сжатием. Тогда s-стационарная равновесная политика достигается в конечный момент Z, определенный условиями:

Z = inf{n > 1: max\ и||фп — ^1 ф« - JA,

n — 1

Vn - 1||А m ЄГ .

(3.2)

Доказательство основывается на результатах работы [18] и аналогично доказательству теоремы 2.11.1 и следствия 2.11.4 в работе [14]. ♦

Согласно сформулированному утверждению в момент £, определенный условиями (3.2), достигается є-стационарная равновесная политика. Тем самым в момент £ процесс последовательного построения равно-

весной политики может быть остановлен. Этим определяется правило остановки процесса.

Полученные результаты в совокупности определяют вычислительную процедуру построения равновесной политики управляющих решений, описываемую далее.

4. АЛГОРИТМЫ ВЫЧИСЛЕНИЯ РАВНОВЕСНОЙ ПОЛИТИКИ

Согласно предположениям модели принятия решений все множества в составе базовой информационной структуры I конечны. В этих условиях вычислительная процедура основывается на утверждении 3.2, согласно которому равновесная политика достигается последовательным построением локальных равновесий из решения системы (3.1). При этом условия (3.2) определяют момент остановки процесса вычислений. Тем самым алгоритмическая схема вычислительной процедуры сводится к выполнению на каждом шаге п = 1, 2, ... двух блоков вычислительных операций: 1) вычисление локальных равновесий; 2) проверка условий остановки процесса. Этим определяется следующая алгоритмическая схема вычислительной процедуры.

Алгоритмическая схема вычислительной процедуры. Пусть задана базовая информационная структура I, сформирована информационная структура риска Я = Р(1), задана величина е > 0, выполнено п — 1 1 0 шагов принятия решений, получены равновесная политика

/ ° п - 1 ° п - 1 ° п - 1 ч

(7! 1 , 51 , Т1 ), соответствующие векторы - 1 €

X S

Я , - 1 е Я и безусловное распределение Рп - 1(^).

Тогда на очередном шаге п 1 1 необходимо выполнить следующие этапы вычислений.

Этап 1. Из решения системы (3.1) вычислить локальные равновесия (к п, тп, 8 п).

Этап 2. Образовать равновесную политику (п 1, т 1,

° пч

81), положив:

°п °п- 1 ч °п °п- 1 ч °п , ° °п- 1 ч

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П1 = (Пп П1 ^ т 1 = ( тп т 1 ), 81 = ( 8п 81 ).

Этап 3. Образовать векторы фп е Ях и ш е Я61 по пра-

вилу:

ф. - Fn(nn|Tn)Ф. - і - n w(nn) + ^ (nn)Ф. - 1;

о о о 1 T 0 о

Vn = Bn( 8 n|n n, Tn К - 1 - - r n ( 8 n, n n ) +

, n — 1 Tn / Z ° \

+ — q (8n, n n)Vn - і.

Этап 4. Если выполняется условие:

maxі п\\ф« — П—1 Фп - JA n||¥n — !П—Т Vn - 1||А S’ m Є,

то остановить алгоритм, иначе — перейти к этапу 5.

n||Vn -

n

Этап 5. Сформировать безусловное распределение Р«(£) из рекуррентного соотношения:

Р«^) = 1 Ро(^) + 'Пг X 4^ СФ', пп (8п (г)))Р« _ 1(г),

I £ £

^ е £

где Р0О) — априорное распределение на множестве состояний £.

Этап 6. Положить п + 1 = п и перейти к этапу 1. Согласно этой схеме требуется последовательное построение локальных равновесий из решения системы

(3.1). Их вычисление выполняется с помощью следующего алгоритма [14].

Алгоритм локальных равновесий. Пусть сформирована информационная структура риска Я = Р(/). Пусть

для (п — 1) > 0 получены локальные равновесия (пп -1,

° X S

Тп-1, 8п-1), векторы Ф« - 1 е Я , V« - 1 е Я и безусловное распределение р« _ 1(£). Тогда для вычисления локальных равновесий на очередном шаге п >1 необходимо выполнить следующий алгоритм.

Шаг 0. Задать начальное приближение (п, т, 8), положив п = п п - 1 , т = тп - 1 , 8 = 8 п - 1.

Шаг 1. Вычислить безусловное распределение Р«(^) из соотношения

P„(s) = ± p0(s) + ^ Z q(s|k, n(8(k)))Pn - i(k), s є S,

n n k є S

где P0O) — априорное распределение на S, qT (•Ik, n(8(k))) — переходная функция из S x Y в S, заданная в базовой структуре I.

Шаг 2. Сформировать информационную структуру «полезности» ип = П(/|п, т, 8; Р„).

Шаг 3. В условиях структуры Un с использованием оператора Fn(y|g) для каждой альтернативы g є G в каждой точке x є X выбрать альтернативу уХ є Y из условия

F/yXg |g)9n - i(x) = max Fn(y\g)^n-l(x) =

n — 1

У * Yx І П

= max \ “ wx) + 'n—1 X Ф„ - i(j)Qg(j\x, y)

n — 1

Шаг 4. Для каждого g є G образовать решающую функцию управления пg: X ^ Y, положив:

п g(x) = yXg, x є X.

Шаг 5. Выбрать альтернативу g є G и решающую функцию управления п из условия:

Z [Fn(л(х)|£)Фп - i](x) = max Z [Fn(ng(x)|g) Фп - J(x).

xє X gє Gxє X

Шаг 6. В условиях структуры риска R с использованием оператора Bn(^| 7t, g) для каждого состояния s е S выбрать ситуацию xs е X из условия:

B„(xs\n , g)yn - ¡(s) = min \ 1 rg(s, x, n (x)) +

x e Zs [ n

+ —1 X qg СЖ n(x))^n - 0)

n j e S n

Шаг 7. Образовать решающую функцию диагностики 8: S ^ X, положив 8 (s) = xs, s е S.

Шаг 8. Если 8 = 8, л = п, g = т, то перейти к шагу 9, иначе — к шагу 10.

Шаг 9. Сформировать локальные равновесия (лn, т n, 8 n), положив

nn = ^ тп = g, 8n = 8 .

Шаг 10. Положить 8 = 8, п = 7t, т = g и перейти к шагу 1.

Алгоритм локальных равновесий предполагает формирование информационных структур «полезности» Un и «риска» R. Конструкции структурных преобразований, с помощью которых должны формироваться нужные информационные структуры, определяются соответственно формулами (2.6)—(2.9) и (2.10), приведенными в утверждениях 2.1 и 2.2.

ЗАКЛЮЧЕНИЕ

В статье выполнен обзор основных результатов подхода к проблеме превентивной безопасности, основанного на концепции интересо-ориентированных систем. Этот подход позволяет рассматривать проблему комплексно с учетом различных ее аспектов, включающих в себя задачи управления работоспособностью, диагностики, выбора режимов использования системы и моментов диагностики. При этом проблема превентивной безопасности рассматривается как проблема принятия управляющих решений игрового содержания, решение которой сводится к отысканию устойчивого компромисса, обеспечивающего достижение максимальной эффективности системы в эксплуатации.

Представленные результаты определяют методологию подхода, модель, постановку задачи принятия решений и конструктивные методы ее решения. В совокупности эти результаты составляют методологическую и конструктивную части проблемы, но не исчерпывают всей проблемы. Действительно, развиваемая методология исходит из предположения, что объект интересов является стареющим, и его динамика задана в виде переходной функции марковского процесса. Однако особенности процессов старения требуют самостоятельного описания их динамики, выходящего за рамки настоящей статьи. Кроме того, методология исходит из пред-

положения, что система является унитарной, т. е. рассматривается как целостный объект с единственным субъектом интересов. Но реальные системы являются сложными и состоят из набора подсистем, каждая из которых имеет свои индивидуальные «наилучшие» режимы обеспечения работоспособности и безопасности. Подобные режимы противоречивы в совокупности, что требует построения «наилучшего» для всей системы устойчивого компромисса. Эти условия порождают более сложную проблему корпоративного управления. Идея подхода к решению такой проблемы сформулирована в работе [21]. В ее основу положены описанные в настоящей статье методология и результаты и, с другой стороны, методы корпоративного выбора, развитые в работе [22]. Но исследования в этом направлении не завершены. Тем не менее, можно утверждать, что проблема превентивной безопасности сложных многокомпонентных систем имеет перспективу решения на основе представленных в настоящей статье методологии и результатов.

ЛИТЕРАТУРА

1. Барлоу Р., Прошан Ф. Математическая теория надежности. М.: Сов. радио, 1969. — 488 с.

2. Marshall A. W., Proshan F. Classes of Distribution Applicable in Replacement with Renewal Theory Implication // Proc. of the Berkeley Symposium on Mathematical Statistics and Probability. — 1970. — 1. — P. 395—415.

3. Morivura H. On some preventive maintenance policies for IFR // J. Oper. Res. — 1970. — Soc. Japan 12. — P. 94—124.

4. Голодовников А. Н, Стойкова Л. С. Определение оптимальной предупредительной замены на основе информации о математическом ожидании и дисперсии безотказной работы // Кибернетика. — 1973. — № 3. — С. 110—118.

5. Barlow R. E., Prochan F. Theory of maintained systems: distribution of time to first system failure // Math. Oper. Res. — 1976. — № 1. — P. 32—42.

6. Nakagawa T. Optimum policies when preventive maintenance is imperfect // IEEE Trans. Reliab. — 1979. № 28. — P. 331— 332.

7. Байхельт Ф., Франкен П. Надежность и техническое обслуживание. Математический подход. — М.: Радио и связь, 1988. — 392 с.

8. Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории надежности. — М.: Наука, 1965. — 524 с.

9. Вопросы математической теории надежности / Е. Ю. Бар-зилович, Ю. К. Беляев, В. А. Каштанов и др. — М.: Радио и связь, 1983.

10. Баранов В. В. Модели и методы управления работоспособностью и безопасностью транспортных систем // Транспорт. Наука, техника, управление. — М.: ВИНИТИ. 1995. — № 1. — С. 18—31.

11. Bellman R. A. Markovian Decision Processes // J. Math. Mech. — 1957. — N 6. — P. 679—684.

12. Баранов В. В. Параметрическая задача оптимального стохастического управления // Журнал вычисл. математики и матем. физики. — 1991. — Т. 31. — № 12. — С. 1783—1797.

13. Баранов В. В. Модели и методы принятия управляющих решений в интересо-ориентированных системах по критериям полезности и риска с учетом техногенной безопасности // Тр. междунар. науч. школы «Моделирование и анализ безопасности и риска в сложных системах». — СПб., 2004. — С. 416—423.

14. Баранов В. В. Процессы принятия решений, мотивированных интересами. — М.: Наука, 2005. — 296 с.

15. Фишберн П. Теория полезности для принятия решений. — М.: Наука, 1978.

16. Мулен Э. Теория игр с примерами из математической экономики. — М.: Мир, 1985. — 200 с.

17. Баранов В. В. Методы равновесий в задачах стохастического управления и динамического принятия решений при неопределенностях / Сб.: Нелинейная теория управления и ее приложения: динамика, управление, оптимизация. — М.: Наука, 2003. — С. 247—312.

18. Баранов В. В. Модель и методы равномерно оптимального стохастического управления // Автоматика и телемеханика. — 1992. — № 5. — С. 42—52.

19. Баранов В. В. Игровые методы стохастического управления и принятия решений при неопределенности относительно состояния в условиях сопряженной базы // Изв. РАН. Теория и системы управления. — 2000. — № 3. — С. 43—53.

20. Баранов В. В. Игровые методы стохастического управления и принятия решений при неопределенности относительно состояния в условиях сопряженной базы // Там же. — № 4. — С. 28—38.

21. Баранов В. В., Гогайзель А. В., Махутов Н. А. Модели и методы принятия управляющих решений в сложных технических системах с учетом безопасности по критериям полезности и риска // Тр. междунар. науч. школы «Моделирование и анализ безопасности и риска в сложных системах». — СПб., 2005. — С. 40—46.

22. Баранов В. В. О проблеме и методах корпоративного выбора // Изв. РАН. Теория и системы управления. — 2006. — № 2.

в (495) 132-01-47

e-mail: ciund@orc.ru □

книга

Новиков Д.А., Иващенко A.A. Модели и методы организационного управления инновационным развитием фирмы. — М.: Ленанд, 2006. — 336 с.

Монография посвящена описанию математических моделей и методов организационного управления инновационным развитием фирмы. Рассмотрены общие проблемы управления инновационным развитием, а также комплекс механизмов (процедур принятия решений): финансирования инновационного развития фирмы, управления организационными проектами, институционального правления, мотивации персонала и управления развитием персонала. Адресована студентам вузов, аспирантам и специалистам (теоретикам и практикам) в области управления инновациями.

i Надоели баннеры? Вы всегда можете отключить рекламу.