Научная статья на тему 'Методические положения оценивания вероятностных характеристик процессов функционирования организационно-технических систем'

Методические положения оценивания вероятностных характеристик процессов функционирования организационно-технических систем Текст научной статьи по специальности «Математика»

CC BY
50
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЙЕСОВСКОЕ ОЦЕНИВАНИЕ / ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИЕ СИСТЕМЫ / МОДЕЛИРОВАНИЕ ДИСКРЕТНЫХ СОБЫТИЙ

Аннотация научной статьи по математике, автор научной работы — Титов Алексей Владимирович

Предложены методика и подход к определению вероятностных характеристик процессов функционирования организационно-технических систем, позволяющий построить оптимальные, с точки зрения минимизации байесовского риска, вероятностные распределения среднего числа заданных событий и средней интенсивности наступления событий на выделенных интервалах времени, а также прогнозное распределение времени между событиями.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An approach to determining probability characteristics of operation processes in organizational and technical systems was proposed letting obtain optimal, in terms of Bayesian risk minimizing, probability distributions of average number of specific events and average event rate at selected time intervals, and the predicted distribution of time between events.

Текст научной работы на тему «Методические положения оценивания вероятностных характеристик процессов функционирования организационно-технических систем»

трудоемкая «диалоговая» часть процедуры выбора реализуется в пространстве Ят существенно меньшей размерности и в этом главный выигрыш построенной «косвенной» процедуры.

Предлагаемый «косвенный» подход оказывается реализуемым и в случае, если Х является множеством (конечным или бесконечным) объектов произвольной природы, т. е. требование X с Я" является в данном случае непринципиальным. Важно лишь, чтобы для каждого из элементов хеХ можно было вычислить соответствующую векторную оценку Дх).

Если абстрактные объекты из Х являются не-параметризованными (т. е. с ними не ассоциируются какие-либо числовые векторы), то обычно множество Х оказывается конечным и вспомогательные задачи минимизации ^х) решаются простым перебором вариантов. При этом диалоговый НМ-метод по-прежнему реализуется в числовом непрерывном пространстве весовых коэффициентов Ят, как это и было описано выше.

Дополнительное преимущество рассмотренной косвенной реализации по сравнению с прямой реализацией НМ-метода во множестве X с Я"

СПИСОК Л

1. Кини, Р.Л. Принятие решений при многих критериях: предпочтения и замещения [Текст] / Р. Л. Кини, Х. Райфа. -М.: Радио связь, 1981. -560 с.

2. Джоффрион, А. Решение задач оптимизации при многих критериях на основе человеко-машинных процедур [Текст] / А. Джоффрион, Дж. Дайер, А. Файн-берг // В кн.: Вопросы анализа и процедуры принятия

заключается в том, что здесь мы осуществляем выбор строго в пределах множества Парето и поэтому гарантируется эффективность получаемых решений.

Вместо линейной свертки J(x) для некоторых задач целесообразно использовать более эффективную свертку Джоффриона, реализующую принцип лексикографического упорядочения и не требующую свойства выпуклости множества достижимости ДХ). Вместо НМ-метода можно использовать более простые прямые методы типа методов циклического покоординатного спуска с настройкой шагов без реализации процедур одномерной оптимизации [4].

Построена диалоговая процедура многокритериальной оптимизации для общего случая нелинейного целевого функционала, описывающего систему предпочтений ЛПР при решении многокритериальных задач и не заданного в явном виде. По своим вычислительным и диалоговым параметрам построенная процедура превосходит традиционные диалоговые методы оптимизации.

ГЕРАТУРЬ1

решений. -М.: Мир, 1976. -С. 116-127.

3. Nelder, N. A simplex method for function minimization [Text] / N. Nelder, R. Mead // Computer J. -1965. -№ 7. -P. 140-148.

4. Черноруцкий, И.Г. Методы оптимизации. Компьютерные технологии [Текст] / И.Г. Черноруцкий. -СПб.: БХВ-Петербург, 2011. -384 с.

УДК 519.2

А.В. Титов

МЕТОДИЧЕСКИЕ ПОЛОЖЕНИЯ ОЦЕНИВАНИЯ ВЕРОЯТНОСТНЫХ ХАРАКТЕРИСТИК ПРОЦЕССОВ ФУНКЦИОНИРОВАНИЯ ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМ

При событийном подходе к описанию процессов функционирования организационно-технических систем рассматриваются хронологические последовательности (потоки) событий, связанных с изменением состояния системы [3]. События целесообразно разделять на классы в

соответствии с их содержательным смыслом, периодичностью, последствиями и т. п. Например, следует различать такие события, как поступление задания на выполнение работы заданным элементом системы, начало выполнения работы, окончание выполнения работы, начало взаимо-

действия между элементами системы, окончание взаимодействия, временное прекращение функционирования элемента, возобновление функционирования и т. п. Таким образом, для обобщенного описания процессов функционирования необходимо оценивать характеристики потоков событий различных классов.

Заметим, что в приведенных выше примерах некоторые события объединены причинно-следственными связями, например, существуют парные события, такие, как начало и окончание работы. Во многих случаях объектом анализа могут служить интервалы времени между парными событиями. В подобных ситуациях можно ввести новую шкалу времени, включающую только рассматриваемые интервалы (конец интервала будет совпадать с началом следующего интервала). В результате будет получен поток событий в новой шкале времени, включающий события одного класса.

Потоки событий характеризуются вероятностными категориями. В частности, можно оценить вероятностные распределения среднего числа событий определенного класса на заданных интервалах времени, средней интенсивности наступления событий, средней продолжительности времени между последовательными событиями и др.

При оценивании перечисленных вероятностных распределений необходимо учитывать следующие обстоятельства.

1. Обычно потоки событий являются нестационарными, интенсивность наступления событий зависит от изменяющихся условий функционирования системы.

2. Оценки вероятностных распределений могут уточняться по мере наблюдения за событиями. При этом априорные распределения, полученные ранее, могут использоваться совместно с новыми наблюдениями для формирования апостериорных распределений.

3. При тиражировании систем, как и в предыдущем случае, могут использоваться априорные распределения, полученные для наблюдавшихся ранее экземпляров системы.

Перечисленные обстоятельства определяют целесообразность применения байесовского подхода [2] к оцениванию распределений. Определяются оптимальные распределения, доставляющие минимум байесовскому риску неправильной оценки.

При оценивании вероятностного распределения заданной характеристики потока событий предполагается, что параметры распределения яв-

ляются случайными величинами. В свою очередь совместное распределение параметров оценивается по наблюдаемым характеристикам. Существуют семейства сопряженных распределений характеристики потока событий как случайной величины и параметров как случайных величин. Вид сопряженных распределений не изменяется при добавлении новых наблюдений. Например, если распределение времени выполнения работы подчиняется нормальному закону распределения, то сопряженное совместное распределение параметров определяется следующим образом.

Условное распределение математического ожидания при заданном значении дисперсии подчиняется нормальному распределению, а маргинальное распределение величины, обратной к дисперсии, подчинено гамма-распределению [2]. Процедуры оценивания сопряженных распределений известны для случая использования повторных распределений характеристики, если задана последовательность интервалов времени, на которых значения характеристики независимы и одинаково распределены. [2]. Таким образом, актуальна задача определения последовательности указанных интервалов времени.

Далее приведена общая методика оценивания вероятностных распределений характеристик потоков событий, основанная на формировании подходящих интервалов времени. Приведены соотношения для оценивания вероятностных характеристик нестационарных пуассоновских потоков событий. Подробное рассмотрение этих потоков связано с их практическим значением. Например, такие потоки могут быть рассмотрены при поступлении независимых заявок на выполнение работ или при исследовании отказов элементов системы.

Разработана оригинальная методика оценивания вероятностных характеристик процессов функционирования организационно-технических систем (характеристик потока событий определенного класса, наблюдаемых в системе). Методика обеспечивает построение вероятностных распределений среднего числа событий и средней интенсивности наступления событий на заданных интервалах времени, а также прогнозного распределения времени между событиями для текущих условий функционирования системы.

Методика включает две части и несколько этапов. Первая часть методики применяется для оценивания характеристик потоков событий в единичной системе. Вторая часть методики применяется после тиражирования системы, т. е. при

анализе функционирования типовых систем.

Рассмотрим первую часть методики.

На подготовительном этапе осуществляется преобразование шкалы времени. Исключаются интервалы времени, не оказывающие влияния на оцениваемые характеристики. Например, если анализируется время, затрачиваемое на выполнение работ заданным элементом организационно-технической системы, то интервалы времени, в течение которых элемент простаивает, исключаются. В результате новая шкала времени смещается относительно астрономической шкалы. Если исследуется работа персонала организационно-технической системы, то рассматриваются только интервалы рабочего времени. В этом случае преобразование временной шкалы удобнее выполнить иначе. Время, прошедшее между событиями, выражается в сутках и корректируется с учетом длительности рабочего времени. Время, выраженное в часах, умножается на семь и делится на количество рабочих часов за неделю. При определении времени, прошедшего до первого в текущих сутках события, учитываются только рабочие часы.

На первом этапе определяются серии последовательных событий, для которых условия функционирования системы принимаются постоянными. Устанавливается длина временных интервалов для каждой серии такая, что распределения среднего числа событий на всех интервалах (для разных серий) совпадают.

Разработана процедура группировки наблюдений, содержащих сведения об интервалах времени между событиями. Процедура обеспечивает формирование серий последовательных наблюдений, однородных по вероятностным характеристикам. Процедура основана на ретроспективном анализе функционирования системы и установлении статистической значимости различий в количестве событий на заданных интервалах времени. В случае если ретроспективный анализ показывает, что условия функционирования системы изменились, предпринимается попытка установить статистическую значимость различий в количестве событий на заданных интервалах времени.

Если статистическая значимость различий установлена, то, начиная с момента изменения условий функционирования, определяется новая длина интервалов времени, для которых фиксируется количество событий.

В результате применения процедуры определяются серии событий и интервалы времени такие, что вероятностные распределения числа со-

бытий на всех интервалах совпадают.

Информация о полученных интервалах времени используется для анализа усредненных ин-тенсивностей наступления событий и для сравнительного анализа условий функционирования типовых систем при их тиражировании (во второй части методики).

На втором этапе осуществляется построение зависимости: приведенное время - накопленное число событий. Вместо текущего времени рассчитывается приведенное время с учетом различия длин временных интервалов, построенных для различных серий. Другими словами, текущее время умножается на длину интервала в текущей серии и делится на длину интервала в последней серии.

Проверяется близость построенной зависимости к линейной функции (коэффициент детерминации линейной регрессии должен быть близок к единице). В случае значимых расхождений осуществляется коррекция длин интервалов в соответствии с указанными выше правилами, независимо от статистической значимости различий в количестве событий на заданных интервалах времени.

На третьем этапе устанавливаются параметры апостериорных распределений среднего числа событий и средней интенсивности наступления событий на заданных интервалах времени (интервалы сформированы на втором этапе). Рассчитывается уровень байесовского риска.

На четвертом этапе определяется прогнозное распределение времени между событиями для текущих условий функционирования системы.

Перечисленные этапы в совокупности могут применяться многократно по мере поступления наблюдений, либо после получения нескольких серий наблюдений.

Рассмотрим вторую часть методики.

После тиражирования системы формируются параллельные серии наблюдений для различных экземпляров системы.

Перечисленные выше этапы первой части методики применяются для новых экземпляров, при этом изменяется порядок формирования начального априорного распределения и дополнительно осуществляется сравнительный анализ результатов функционирования типовых систем.

В качестве априорного распределения среднего числа событий и средней интенсивности наступления событий на заданных интервалах времени выбираются соответствующие апостериорные распределения, полученные для другого экземпляра системы. Аналогично, первоначальные длины ин-

тервалов для группировки наблюдений выбираются равные длинам последних интервалов, полученных для другого экземпляра системы.

Заметим, что при одинаковой организационной структуре типовых систем различия в условиях их функционирования могут определяться как внешними факторами, например варьированием нагрузки на систему, так и внутренними факторами, например различиями в квалификации персонала.

Предложенная методика позволяет устанавливать различия в интенсивности наступления событий для различных экземпляров типовой системы (см. этап 1 первой части).

Для сравнительного анализа результатов функционирования типовых систем достаточно сравнивать длины интервалов времени, используемых при группировке событий на двух экземплярах. Интенсивности наступления событий относятся как обратные величины к длинам интервалов. Поэтому информации о длинах интервалов хватает для определения интенсивности наступления событий, обусловленных другими условиями функционирования нового экземпляра системы.

Рассмотрим теперь более детально случай нестационарного пуассоновского потока событий.

Пусть N(0, t > 0 - случайный процесс, представляющий количество событий, произошедших до момента времени t. Считаем, что выполнены следующие предположения:

1) Щ0)=0;

2) N(0, t > 0 имеет независимые приращения;

3) Р(Щ + ДО - ЩГ) = 1) = Щ)*М+оД);

4) Р(Щ + ДО - Щ) > 2) = о(д 0.

Здесь Х(0 - функция интенсивности наступления событий, а о(Д0 имеет более высокий порядок малости, чем Дt.

При сделанных предположениях N(0 как случайная величина для заданного t подчиняется вероятностному распределению:

Р(М^) = п) -

Л^ )п

п!

ехр(-Л^)), t > 0, п = 0, 1, ...

Здесь Л^) = представляет собой ожидае-

0

мое накопленное количество событий на интервале [0, 0.

При использовании байесовского подхода предполагается, что Л^) - случайная величина.

Можно фиксировать количество событий на интервалах времени [0,^), [^2), ..., и рас-

сматривать случайное число событий Nl,N2, ..., Кк

на соответствующих интервалах. Предлагается так подбирать длины интервалов, чтобы N, N, ..., N были одинаково распределены. Получаем:

Р(Щ = п) =

(Л, )п

п!

ехр(-Л,), г = 1, ..., к.

Если N. имеют одинаковое распределение, то Лп

Р (N = п) = — ехр(-Л). п!

В теории байесовских решений предполагается, что распределение Л уточняется по мере наблюдения над N , , = 1, ..., п.

Таким образом, нас интересует распределение Л , которое, вместе с данными об интервалах [0,^), [^¿2), ..., [tk_1,tk), предоставляет наиболее полную информацию о вероятностных характеристиках потока событий.

Как следует из теории байесовских решений, если принять, что Л подчиняется гамма-распределению, то по мере накопления статистических данных о событиях апостериорное распределение (т. е. распределение, уточненное по результатам наблюдений), соответствующее дополнительным данным, также будет гамма-распределением с уточненными параметрами [2]. Иначе говоря, гамма-распределение является сопряженным, по терминологии [2], для распределения Пуассона.

Пусть С - оценка Л. Тогда функция потерь [2] Ь имеет следующий вид:

¿(Л, С) = У (Л)б(Л- С).

Здесь Q - неотрицательная функция погрешности, такая, что Q(0) = 0; У - неотрицательная весовая функция, которая задает относительную значимость погрешностей для различных значений параметра Л .

Байесовская оценка [2] С определяется как точка С, при которой риск р(^, С) достигает минимума:

С) = | У (Л МЛ- С ЖЛ)С (Л),

—да

где £,(Л) - плотность апостериорного распределения Л , полученная в результате уточнения априорного распределения по результатам наблюдений N1, ..., Nk.

Предлагается использовать квадратичную функцию потерь:

¿(Л, С) = (Л- С )2.

В этом случае байесовское решение С при любом заданном распределении Л определяется как значение С, минимизирующее следующее значение риска:

Е[(Л - а)2] = Е(Л2) - 2с1Е(Л) + а2.

При таком выборе а минимальное значенЕе риска равно Е[(Л - Е (Л))2 ] = var(Л), где var( ) -знак дисперсии.

Предположим, что N - наблюдение с функцией вероятностей, сопоставляющей возможным значениям случайной дискретной величины вероятность этих значений, равную /^ | Л1) при Л = Л1.

Пусть Е(Л) - априорная плотность распределения Л, а Е(Л, N1) - апостериорная плотность распределения Л при N = N1.

Тогда легко найти байесовский риск р (Е) для квадратичной функции потерь. Для любого наблюдаемого значения N = N1 байесовское решение 8* (N1) = Е(Л | N1), где Е(Л | N1) - математическое ожидание апостериорного распределения Л . Поэтому байесовский риск имеет вид р (Е) = E[var(Л | N1)]. Математическое ожидание в этом соотношении вычисляется по функции вероятностей

ё (N) = { / (N | Л)Е(Л)а л

—да

Пусть N1, ..., Кк есть повторная выборка из распределения Пуассона с неизвестным значением среднего Л, т. е. N1, ..., Кк независимы и одинаково распределены.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предположим, что априорное распределение Л есть гамма-распределение с параметрами а, р. Из теории байесовского оценивания [2] известно, что апостериорное распределение Л при N. = п.,

г = 1, ..., к - это гамма-распределение с параметра-

к

ми (а +1 пг) и (в + к). Эти соотношения конкре-

г=1

тизируют упомянутый выше факт сопряженности гамма-распределения и распределения Пуассона. Другими словами, полученное апостериорное распределение можно использовать в качестве нового априорного распределения для последующих наблюдений. Если наблюдения начинаются с «чистого листа» и сведения об исходном априорном распределении отсутствуют, то следует принять а = в = 0 (несобственное распределение).

Байесовское решение 8* (^, ..., Nk) = = Е(Л | N1, ..., Nk) определяется равенством

Так как ЕN | Л) = Л, i = 1, ..., к, то Е(N,0 =

а +

8*(..., N.) = -

I N.

в + к

Для любых значений М1, N2, ..., Nk дисперсия апостериорного распределения равна

а +

var(Л|N1, N2, ..., N.) = -

I N.

а

= Е[Е(N , | Л)] = Е(Л) = в. Отсюда

а + -

Е^аг(Л|^, N2, ..., N.)] =

ак

У

а

(в + к )2 в(в + к)

Поэтому байесовский риск определяется как

а

р* (Е) = -

в(в + к)

Заметим, что для случая а = в = 0 байесовский риск не определен.

Распределение числа событий на заданных интервалах времени:

хп

P(N = и) = Г— е п!

Г(а)

-а—1~-вхах.

хе

(в + к )2

Для определения плотности распределения времени между событиями следует руководствоваться следующими соображениями.

Во-первых, необходимо учитывать, что для произвольного фиксированного значения интенсивности наступления событий длина интервалов времени между ними подчиняется экспоненциальному распределению. Это следует непосредственно из приведенного выше допущения о том, что события образуют поток Пуассона.

Во-вторых, поскольку интенсивность наступления событий является случайной величиной, то распределение времени между ними представляет собой смесь экспоненциального распределения и распределения интенсивностей наступления событий.

В-третьих, при проведении практического анализа функционирования систем целесообразно вместо семейств случайных величин Л^), А,(?) с непрерывно изменяющимся параметром временем рассматривать соответственно случайные величины Л,., А.., заданные на последовательных интервалах времени Д.., имеющих длины 8,., г = 1, ..., к. Таким образом, можно говорить о средней интенсивности наступления событий на интервале как о случайной величине.

В этом случае можно считать, что если Л.. подчиняется гамма-распределению с параметрами а, в, то А. подчиняется гамма-распределению с параметрами а , в / 8...

В качестве интервалов Д , = 1, ... , п наиболее удобно использовать определенные выше интервалы [0,?1), [?1,?2), ..., [?к-1,?к), такие, что случайные величины N1, ..., представляющие

собой число событий на соответствующих интервалах, одинаково распределены.

В соответствии со сделанными предположениями, плотность распределения времени между

событиями определяется как смесь:

ра

f(y) = J хе

Г(а)

-x ^e^dx =

(ß + y)a

'x ^^ xa-1e_(p+y) xdx =

aßa

Г(а)

(ß + y)a

где у > 0. Здесь параметр в пересчитан (разделен на длину соответствующего интервала.

Функция распределения времени между событиями определяется по плотности следующим образом:

" ара -сх = 1 - ва

F (y) = J -

(ß + х)а

o(ß + х)а

Математическое ожидание времени между событиями вычисляется как

^ (y) = J

ßa

-dx = -

ß

0(в + х)а а-1

Таким образом, математическое ожидание времени между событиями равно моде распределения средней интенсивности наступления событий.

Очевидно, что формула для вычисления р %

- в в квантилей имеет вид х =--— в.

(1 - р)"а Н Определим теперь процедуру формирования интервалов [0,^), [t1,t2), ..., [tk-1,tk). Считаем, что эти интервалы уже определены. Предполагаем далее, что после момента времени t условия функционирования системы изменились и оставались неизменными до некоторого времени t , такого, что tk ^ tp , а интервалы времени [ts_l,t), ...,

[tk-1,tk) имеют одинаковую длину.

Введем обозначения по аналогии с использованными в [1] для процедуры дисперсионного анализа.

Пусть у , = 1, ..., - соответственно наблюдаемые значения количества событий на интервалах [ts-1,ts), [ts+1,ts+2), ..., [tk-1,tk), т. е. Л = 5 - 1; Уfl,

, = 1, ..., Зг - соответственно наблюдаемые значения количества событий на интервалах вре-

Мени ^р^Х т. е. J2 = к - 5 - 1 т. е.

y1 - среднее арифметическое для ул, i = 1, ..., J1;

y2 - среднее арифметическое для yi2, i = 1, ..., J2;

y = (J У1 + J2 y2)/(Ji + J2).

SSeffec, = J1(yi - y)2 + J2 (у2 - y)2 ,

фа = ^

J1 _ J1 _

SS'error = Z (У« - У1)21 + Z (Уi2 - У2 )2 ,

i=1 i=l

df = J, + J, - 2,

J error 1 2 7

MS „ , = SS „ , /dS „. .

effect effect effect

MS = SS /df ,

error error error

F = MS / MS .

effect error

Можно считать [1], что статистика F имеет распределение Фишера с параметрами

(df , df ).

effect error

Если соответствующее ^-значение меньше уровня значимости 0,05, то подтверждается статистическая значимость различий y i = 1, ..., J1 и yi2, i = 1, ..., J2. В этом случае необходимо изменить длину интервалов, начиная с интервала [ti+1,ti+2) до момента времени t Новая длина_ин-тервалов подбирается таким образом, чтобы y1 и y2 были близки (на практике обычно в качестве длины интервала можно использовать целое число суток. Заметим, что использованный критерий статистической значимости различий устойчив к нарушению нормальности наблюдений (см., например [1]).

Таким образом, разработан оригинальный подход к определению вероятностных характеристик процессов функционирования организационно-технических систем, основанный на байесовском оценивании вероятностных распределений среднего количества событий и средней интенсивности наступления событий на заданных интервалах времени и позволяющий минимизировать байесовский риск ошибочного оценивания.

Предложена методика, обеспечивающая формирование интервалов времени переменной длины, при которых количество событий на интервалах одинаково распределено.

СПИСОК ЛИТЕРАТУРЫ

1. Афифи, А. Статистический анализ: Подход с использованием ЭВМ [Текст] / А. Афифи, С. Эйзен. -М.: Мир, 1982. -488 с.

2. DeGroot, M.H. Optimal statistical decisions [Text] / M.H. DeGroot. -New York: McGrow-Hill Company,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1970. -480 p.

3. Robinson, S. Simulation - The practice of model development and use [Text] / S. Robinson. -Chicheste: John Wiley & Sons Ltd, 2004. -316 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.