Научная статья на тему 'Новые интервальные байесовские модели надежности программного обеспечения на основе неоднородных процессов Пуассона'

Новые интервальные байесовские модели надежности программного обеспечения на основе неоднородных процессов Пуассона Текст научной статьи по специальности «Математика»

CC BY
322
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
НАДЕЖНОСТЬ / ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / БАЙЕСОВСКИЙ ВЫВОД / РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ / НЕОДНОРОДНЫЕ ПРОЦЕССЫ ПУАССОНА / МЕТОД МАКСИМУМА ФУНКЦИИ ПРАВДОПОДОБИЯ / МОДЕЛЬ / RELIABILITY / SOFTWARE / BAYESIAN INFERENCE / PROBABILITY DISTRIBUTION / NON-HOMOGENEOUS POISSON PROCESSES / MAXIMUM LIKELIHOOD ESTIMATION / MODEL

Аннотация научной статьи по математике, автор научной работы — Уткин Лев Владимирович, Затенко Светлана Ивановна, Коолен Франк

Предложен новый класс моделей надежности программного обеспечения, в основу которых положены известные модели, использующие неоднородные процессы Пуассона, например, модели Мусса-Окомото и Джоэл-Окомото. Показано, что основная идея построения моделей заключается в комбинированном применении обобщенного байсовского вывода и метода максимума правдоподобия. Приведены примеры, когда предложенные модели дают более высокое качество прогноза надежности по сравнению с известными.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Уткин Лев Владимирович, Затенко Светлана Ивановна, Коолен Франк

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A new class of software reliability growth models is proposed. It is based on the well-known models using the non-homogeneous Poisson processes, for instance, Goel-Okumoto model or Musa-Okumoto model. The main idea of the models is to combine imprecise Bayesian models, where a set of prior probability distributions is considered instead of a single distribution. The numerical analysis of the proposed models with use of real statistical data indicates situations when the models provide higher reliability forecast quality in comparison with the known reliability models.

Текст научной работы на тему «Новые интервальные байесовские модели надежности программного обеспечения на основе неоднородных процессов Пуассона»

И нформационные технологии в управлении

УДК 681.3.06

НОВЫЕ ИНТЕРВАЛЬНЫЕ БАЙЕСОВСКИЕ МОДЕЛИ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ НА ОСНОВЕ НЕОДНОРОДНЫХ ПРОЦЕССОВ ПУАССОНА

Л.В. Уткин, С.И. Затенко, Ф. Коолен

Предложен новый класс моделей надежности программного обеспечения, в основу которых положены известные модели, использующие неоднородные процессы Пуассона, например, модели Мусса — Окомото и Джоэл — Окомото. Показано, что основная идея построения моделей заключается в комбинированном применении обобщенного байсовского вывода и метода максимума правдоподобия. Приведены примеры, когда предложенные модели дают более высокое качество прогноза надежности по сравнению с известными.

Ключевые слова: надежность, программное обеспечение, байесовский вывод, распределение вероятностей, неоднородные процессы Пуассона, метод максимума функции правдоподобия, модель.

ВВЕДЕНИЕ

Проявление ошибок в программном обеспечении (ПО) интенсивно изучалось в целях улучшения характеристик программ [1]. Большое число моделей надежности программного обеспечения (МНПО) было разработано в последние десятилетия, но нельзя выбрать одну МНПО, которую можно было бы использовать для самых различных программ. Причина состоит в том, что для многих программ ряд предположений, принятых в МНПО, нереалистичные. Детальный критический обзор известных вероятностных МНПО приведен в работах [2, 3].

Основная идея моделирования надежности ПО состоит в попытке статистически описать процесс отладки программного обеспечения (исправления ошибок и тестового диагностирования до момента проявления очередной ошибки). Обычно предполагается, что после исправления очередной ошибки их общее число почти всегда уменьшается или программа становится лучше в смысле надежности. В данном случае говорят о росте надежности программы. Таким образом, для анализа надежности ПО с использованием статистических моделей их параметры оцениваются на основе имеющихся отладочных данных и данных об отказах. Одна часть параметров модели характеризует рост надежности в результате исправления ошибок, а

другая — случайные изменения времен до отказов или числа отказов в рамках заданного роста надежности.

В работе предлагается новый класс МНПО, в основу которых положены модели, использующие неоднородные процессы Пуассона (МНПП) [4—7] для описания роста надежности и особенностей ПО. Предлагаемые модели будут называться интервальными моделями, так как основные показатели надежности ПО, вычисляемые с их помощью, интервальные. Основная идея построения класса МНПО заключается в комбинированном применении обобщенного байесовского вывода [8], где вместо одного априорного распределения вероятностей рассматривается множество распределений, и метода максимума правдоподобия. При этом каждый из методов ориентирован на определенный набор исходных параметров модели. В разрабатываемых МНПО предполагается: статистическая независимость отказов; равномерность тестовых наборов на множестве всех используемых исходных данных; тесты отражают режим эксплуатации ПО.

Численный анализ предлагаемых МНПО с использованием реальных статистических данных, опубликованных в литературе, наглядно демонстрирует ситуации, когда модели дают более высокое качество прогноза надежности по сравнению с известными моделями надежности.

1. СТАНДАРТНЫЕ МНПП

Одним из инструментов для создания класса МНПО, исходными данными для которых являются значения числа отказов ПО, обозначаемые N(7), за определенный период времени 7, служат неоднородные процессы Пуассона. Для любых временных точек 0 < ^ < 72 < ... вероятность того, что число отказов между моментами времен 7, _ 1 и 7. равно к, может быть записана в виде

Pr{N(ti) - N(ti - 1) = k} = {m (t i) - m (ti -1)}

k!

■exp{-(m(ti) - m(ti _ 1)}, k = 0, І, 2, ...

Здесь т(7) — среднее значение числа отказов до момента времени 7. Модели, основанные на неоднородных процессах Пуассона, различаются функцией т(7). Примеры этих функций: т(7) = а7ь (модель Дуэйна [6]), т(7) = а(1 — ехр(—Ь7)) (модель Джоэл — Окомото (Д-О) [5]), т(7) = а1п(1 + Ь7) (модель Муса — Окомото (М-О) [7]). Приведенные примеры лишь малая часть возможных функций т(7). Их расширенный список можно найти в работе [4], где каждая из функций т(7) наилучшим образом отражает поведение статистических данных об отказах конкретных программ.

Параметры а и Ь для большинства МНПО имеют схожий смысл. В модели Д-О, например, параметр а интерпретируется, как неизвестное число оставшихся ошибок в ПО, а параметр Ь — неизвестная интенсивность обнаружения ошибок, которая характеризует рост надежности программы в процессе отладки. Однако не для всех МНПП имеется физическая интерпретация параметров.

Параметры МНПО оцениваются с помощью метода максимума функции правдоподобия, в качестве исходных данных используются значения числа отказов в заданные интервалы тестового диагностирования и отладки. Однако качество прогноза может быть низким вследствие отсутствия достаточного объема статистических данных или их неоднородности. Это можно учитывать в МНПО, рассматривая осторожные или интервальные модели надежности ПО.

2. ИНТЕРВАЛЬНЫЕ МНПО

Пусть X, = N(7.) — N(7, - х) — случайное число отказов в интервале между 7, - 1 и 7,. Предполагается, что существует функция распределения вероятностей величины X,, но она неизвестна. Известно только, что она принадлежит множеству М,(ё), зависящему от множества параметров модели ё.

Множество M;(d) взаимно однозначно определяется границами, т. е. нижней Fi и верхней Ft функциями распределения вероятностей

FYkid) = inf F(k), F (k|d) = sup F(k).

Mj( d) M,-(d)

Отметим, что Mj-(d) — это множество всех функций распределения, ограниченное функциями Fi(k|d) и Fi (k|d), а не множество параметрических распределений, имеющих ту же форму, что и граничные распределения. Это очень важная особенность предлагаемого в данной работе подхода для комбинирования байесовского метода и метода максимума функции правдоподобия.

Обозначим K = (kj, ..., kr). Функция правдоподобия записывается в виде:

L(K|d) = Pr{X1 = k1,

Xn = kn}

Утверждение 1 объясняет, как функция правдоподобия максимизируется по всем распределениям вероятностей, принадлежащим множествам М(&), ..., Ж„(ё).

Утверждение 1. Если случайные величины Хр ..., Хп являются независимыми и дискретными, то

max Pr{X1 = k1, ..., X. = kn} = M..., M

n

= П {F(ki) - Fi(ki - І)},

i = 1

(І)

где £. и Ё, — границы множества М,, I = 1, ..., п. ♦ Доказательство. Обозначим М = (тр ..., тп). Пусть /{1 к} (т) — индикаторная функция, принимающая значение 1, если т < к,. Верхняя граница совместной вероятности Рг{Х1 = к1, ..., Хп = кп} может быть найдена как решение следующей задачи оптимизации:

дада

max X ... X I{і,...,kn}(M) ПPi(mi)

m = 1 m = 1 i= 1

при ограничениях Е р(т) = 1, /].(у) <

т = 1

да

т Е 7( 1, к}} (т)Р/(«) < ^(у), і = 1, ..., и,у = 1, 2, ...

т = 1

Целевую функцию можно переписать как

п да

П Е (1{1,..., к} Ю - /{і,к.-1} (тг)рг.(тг.)). Введем

n

ои

i= 1 m = 1

новые переменные Fj(kj) = ^ 1{1 к} (тг)рг(тг.).

т . = 1

Тогда задача оптимизации приобретает вид

П

тах П {ВД) - ВД - 1)},

г = 1

при ограничениях -^(кг) < -^к) т Рг (кг), /1(кг — 1) т

т ед — 1) т Ёг(к, — 1), I = 1, ..., П.

Используя известные правила стандартного интервального анализа, получаем (1). ♦

3. ОБОБЩЕННЫЕ БАЙЕСОВСКИЕ МОДЕЛИ ДЛЯ ПОЛУЧЕНИЯ МНОЖЕСТВА М

Один из возможных путей получения множества М(Д) — это использование идеи обобщенного байесовского подхода Уолли [8].

3.1. Стандартный байесовский подход

Если случайная величина имеет распределение вероятностей с вектором неизвестных параметров Ь е О, то в соответствии с байесовским подходом [10] эти параметры рассматриваются как случайные величины с априорной плотностью вероятностей п(Ь|с) с параметрами с. Центральный элемент байесовского подхода состоит в выводе апостериорного распределения неизвестных параметров при получении статистических данных на основе теоремы Байеса. Пусть статистическая информация собрана в виде вектора К = (к1, ..., кп) наблюдаемых значений случайных величин Х1, ..., Хп. Пусть р(к) — вероятность того, что наблюдаемое значение числа отказов равно к. Тогда апостериорная плотность п(Ь|К, с) вычисляется как п(Ь|К, с) х р(^) ... р(кп)- п(Ь|с).

Априорное распределение зачастую выбирается таким образом, чтобы упростить вычисления. Наиболее эффективный путь в этом направлении — это выбор согласованных априорных распределений [10]. Если апостериорное распределение п(Ь|К, с) и априорное распределение п(Ь|с) принадлежат одному семейству распределений, то п и р называются согласованными распределениями.

3.2. Интервальные априорные модели

Если отбросить требование простоты вычислений, то предпочтительное априорное распределение должно минимально влиять на апостериорное распределение, а также учитывать отсутствие априорной информации о параметрах. Априорные распределения, моделирующие отсутствие априорной информации, называются неинформативными. Существует немало подходов для выбора неинформативного априорного распределения [10],

имеющих свои достоинства и недостатки. Однако определим не одно априорное распределение, а целый класс Р распределений п, для которого можно найти нижнюю и верхнюю вероятности события А как

Р(А) = шЦРДА): п е Р},

Р (А) = 8ир{Рп(А): п е Р}.

Когда априорной информации почти нет, для

этого класса Р(А) ^ 0, а Р (А) ^ 1. Это означает, что априори событие А может иметь любую вероятность. К наиболее известным классам априорных распределений следует отнести обобщенную модель Дирихле [8], обобщенные модели экспоненциального семейства распределений [9, 11]. В нашем подходе к построению МНПП множество Р используется для того, чтобы сгенерировать множество М прогнозируемых распределений с нижней и верхней границами, которые позволят применить утверждение 1.

3.3. Обобщенная модель отрицательного биномиального распределения

Если число отказов имеет распределение Пуассона, то априорное согласованное распределение является гамма-распределением, обозначаемым (7(а, в) с параметрами а > 0, в > 0. Предположим, что уже было зафиксировано К отказов, наблюдаемых за период времени Т. Тогда апостериорным распределением является (Т(а + К, в + Т). Отсюда прогнозируемое распределение к отказов за время ? при условии, что К отказов были зафиксированы за время Т, имеет вид

к

Р(к, о = Г( 1 0 еХР (-А- ?) • С(а + К, в + Т)^Х =

1 к'

k!

о

= Г ( а + К + k) ( в + T Л а + K Г ( а + К) к\ vp + Т + Р

t

в + Т + ,> ■ (2)

Это выражение для отрицательного биномиального распределения. Если взять вектор (а, в) в треугольнике (0, 0), (5, 0), (0, 5), то все возможные априорные ожидаемые интенсивности отказов попадают в интервал (0, гс>), так как математическое ожидание случайной величины 1, имеющей гамма-распределение, равно а/в. Множество всех параметров в треугольнике образует обобщенную модель отрицательного биномиального распределения [9]. Параметр 5 > 0 определяет влияние априорного распределения на апостериорное. Он также определяет, как быстро нижняя и верхняя границы вероятностей событий сходятся по мере накопления статистических данных. Меньшие значения 5 приводят к быстрой сходимости и более строгим заключениям. Большие значения 5 дают более осторожный статистический вывод. Принимая множество распределений вместо одного

О

распределения вероятностей, мы можем искать только нижнюю и верхнюю границы вероятностей событий вместо точных значений для одного распределения. Эти границы могут быть получены минимизацией и максимизацией этих вероятностей по всему множеству значений (а, в) в треугольнике.

4. ОБЩАЯ СХЕМА ПОСТРОЕНИЯ ИНТЕРВАЛЬНОЙ МНПП

С одной стороны, большая часть возможных функций среднего значения числа отказов т(?) представляется как т(£ а, Ь) = «• т(4, Ь). С другой стороны, параметр X распределения Пуассона в выражении (2) и его аргумент ? можно заменить параметром а и дискретным временем х(?г, Ь) — х(?г- _ р Ь) соответственно. Фактически, заменяя X на а, получаем процесс Пуассона с масштабированным временем тестового диагностирования ПО, т. е. каждый интервал времени [^ _ р ?;] заменяется интервалом [х(?г _ р Ь), х(?г, Ь)]. Используя результаты предыдущих разделов, можно записать функцию распределения вероятностей числа отказов в дискретные интервалы времени между t и ) (? > )) после г периодов отладки:

Р.(к, ? | а, в, Ь) =

= Г ( а + К + к) Г________________________в + Тг_________________

Г ( а + К) к! ^в + Тг + т ( t, Ь) - т ( . Ь)

т(t, Ь) - т(. Ь)

а + Кг

^в + Тг + т(£ Ь) - т(. Ьу

Здесь Т — полное масштабированное время для г-го периода, определяемое как

Г

Т = Е [т(*Р Ь) - т(^ - !, Ь)] = т(tг, Ь),

г = 1

4о 0, ко 0,

К, полное число отказов до момента времени за г

Г

периодов отладки, определяемое как К, = Е кг.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г = 1

Функция распределения вероятностей для момента времени t е [) - 1, )] после г периодов отладочного процесса имеет вид

-.(к, 11а, в, Ь) =

= Е Г ( а + КГ + 1) ^ в + т ( Ь )

I = 0

Г(а + КГ)/1 ^в + Т.(Ь Ь) + т(4г, Ь)

Т( £ Ь)

а + К

^в + Т(и Ь) + т( tг, Ь) Здесь ), Ь) = т(t, Ь) - т() - 1, Ь).

Из приведенных выражений видно, что модифицированная модель не зависит от параметра а, но зависит от новых параметров априорного гамма-распределения а и в. Кроме того, модель зависит от параметра роста Ь. Заметим, что альтернативная форма функции распределения вероятностей имеет вид:

—(к, А а, в, Ь) = 1 - Дд(/, ^ Ь), к + 1, а + КГ).

,

Здесь

40', t, Ь) =

в + т(tг, Ь) + Т,(Г, Ь)’

Ва(Ь, с) — неполная бета-функция; В(Ь, с) — бета-функция; /(а, Ь, с) = Ва(Ь, с)/В(Ь, с).

Предлагается следующая схема для построения МНПП и для вычисления функции распределения вероятностей —Г + 1 после г периодов отладочного процесса. Построив обобщенную байесовскую модель и используя ее, получим множество распределений вероятностей М) с некоторыми границами —. и —•. Далее будет показано, что эти границы не зависят от параметров а и в и определяются только параметром Ь (параметр 5 фиксирован). Отсюда следует, что получаем однопараметрическую модель. Тогда из утверждения 1 следует, что максимум функции правдоподобия по множеству М)(Ь) записывается на основе выражения (1). Максимизируя эту функцию по параметру Ь при фиксированном 5, находим оптимальное значение этого параметра. Далее, получив параметр Ь, функция распределения вероятностей —Г + 1 после г периодов отладки вычисляется посредством построенной обобщенной байесовской модели, но теперь с полученным оптимальным значением Ь.

Следуя представленной выше схеме, построим сначала обобщенную байесовскую модель. Достаточно просто доказать, что минимум функции —(к, 11 а, в, Ь) по всем (а, в) в треугольнике (0, 0), (5, 0), (0, 5) достигается при (а, в) = (5, 0) и ее нижняя граница определяется как

-(к, й 5, Ь) = 1 - /Г-ККк-К—г-, к + 1, 5 + К,

-)( , 1 , ) Мtr, Ь) + Т)(I, Ь)’ ’ Г

Максимум функции -.(к, 11 а, в, Ь) достигается при (а, в) = (0, 5), и ее верхняя граница

Т (^ Ь)

-, (к, 4 5, Ь) = 1 - /

5 + т(Ь) + Т(^ Ь)’

к + 1, КГ|.

х

Следующий шаг — использование утверждения 1 и максимизация функции правдоподобия (1) по Ь. В результате получаем оптимальное значение Ь0: Ь0 = аг§шахіпХ(К 15, Ь) =

argmax I ln

ь

/ = l

/

-------------------0і t/'’ b) , , k + 1, s + K,| -

т і t„ b ) + Ті / b ) /

-/

_____________^ і ^ b )_________________________ k- + 1 К

s + т і tr, b ) + Ті / b У / , r‘

Завершающий шаг — запись границ функций распределения вероятностей числа отказов в интервале времени [4г, ^ после г периодов отладочного процесса

-r + l(k, tjs, b0) =

= І - /

Tr + 1і t, b0)

= І - /

^тіt„ b ) + Tr + 1 іt, b )

-r + l (k, tjs, b0) = Tr + ііt, b0)

0 , k + 1, s + Kr, ,

0 , k + 1, Kr

V5 + т(Ь ) + Тг + 1(ґ, Ь )

Нижняя +1 и верхняя Е(і) Хг +1 границы ожидаемого числа отказов в интервале [ґт, ґ] после г периодов отладочного процесса определяются через известные выражения для математического ожидания случайной величины, имеющей отрицательное биномиальное распределение, как

е(*)х = КгТг + і(ь0)

^ Х +1 = 5 + Т(*„ Ь°) ,

Е(*} X + 1 = (5 + К) Тт+мф..

т(ір Ь )

5. ЧАСТНЫЕ СЛУЧАИ ИНТЕРВАЛЬНЫХ МНПП

Из приведенных выражений для обобщенных байесовских моделей видно, что они отличаются только функцией т(£ Ь). Следовательно, используя функции известных МНПП, можно построить интервальные модификации МНПО в рамках предложенного подхода.

Модифицируем модель М-О [7], как одну из наиболее распространенных МНПО. Используя введенные обозначения, можно записать для модели т(4, Ь) = 1п(1 + Ь4). Отсюда функция правдоподобия

х'->(кк. ь) = П г^1--!0, к+1 *+к

) = 1

-/ (1ПттККК, к+1 К

Здесь Ж = (1 + Ь4г)(1 + Ы)/(1 + Ь) - 1).

Другой МНПО, основанной на неоднородных процессах Пуассона, является модель Д-О [5]. Для нее можно записать т(4, Ь) = 1 - ехр(-Ь4). Функция правдоподобия тогда имеет вид

х("}(к|5, Ь) = п Г / (1 - е х р( - Ь К, к. +1,5+К,

)=1

- / г1 - е х р (- Ь о, к, +1, К

V 5 + V ) )

Здесь V = 1 - ехр(-Ь4г) - ехр(-Ь4) + ехр(-Ь)-1).

6. АНАЛИЗ ИНТЕРВАЛЬНЫХ МОДЕЛЕЙ

Проанализируем предлагаемые интервальные МНПП, используя реальные статистические данные по надежности ПО, опубликованные в работе [7]. Эти данные получены при отладке ПО для управления контроллерами в системе управления. Статистические данные представлены в виде 20-ти тестов и показаны в таблице.

Сначала анализируется предложенная интервальная модификация модели Д-О. Для ее оценки делается прогноз (/ + 1)-го среднего (ожидаемого) числа отказов ПО, начиная с / = 3. Имея среднее число отказов, можно сравнить этот результат с реальным значением числа отказов в (/ + 1)-м тесте, которое дано в таблице. Кроме того, сравниваются результаты моделирования также со стандартной моделью Д-О. Кривая без маркеров на рис. 1 — множество значений числа отказов из таблицы.

Статистические данные по отказам ПО

Номер теста Время теста, ч Число отказов

i 1 1 — 1 k. І

І 62,5 9

2 44 4

З 40 7

4 68 б

5 62 5

б 66 З

7 73 2

8 73,5 5

9 92 4

ІО 71,4 2

ІІ 64,5 4

І2 64,7 7

ІЗ 36 О

І4 54 5

І5 39,5 З

Іб 68 З

І7 61 З

І8 62,6 4

І9 98,7 ІО

2О 25 З

Рис. 1. Прогнозируемые ожидаемые значения числа ошибок для различных моделей, построенных на основе модели Д-О

Жирная кривая с круглыми маркерами — множество прогнозируемых ожидаемых значений числа

отказов Е^Х. + 1, / = 3, ..., 20, при 5 = 1. Здесь значение Е(5)Хг + 1 вычисляется с учетом нижней и верхней границ математических ожиданий [8] как

Е^Х, + ! = +1 + (1 - п) Е(^ X- +1, П = 0,5. Тон-

кая кривая с треугольными маркерами изображает множество точных прогнозируемых значений математического ожидания ЕХ. + 1, вычисленных с использованием модели Д-О. Можно увидеть из приведенных графиков, что интервальная модификация модели Д-О обеспечивает лучший прогноз по сравнению с обычной моделью Д-О.

Введем следующие показатели качества моделей: максимальное отклонение Яр среднее значение отклонения Я2, среднеквадратическое отклонение Я3.

Используя статистические данные, вычислим соответствующие показатели при 5 = 1 после прогнозирования 17-ти значений числа отказов (от 3-го теста до 19-го теста) для предлагаемой модели Я1 = 7,491, Я2 = 2,054, Я3 = 1,786 и для модели Д-О

Я * = 8,311, Я* = 2,312, Я * = 1,959. Из результатов расчета следует, что качество предлагаемой модификации выше по сравнению с обычной моделью Д-О.

Интересно также исследовать, как число тестов влияет на значения тех же самых показателей качества. Вычислим эти показатели после прогнозирования 6-ти значений числа отказов (от 3-го до 8-го теста). В этом случае получаем для новой модели Я1 = 1,827, Я2 = 1,133, Я3 = 0,568 и для модели

Д-О Я* = 2,854, Я* = 1,373, Я* = 1,007. Из результатов расчета следует, что качество предлагаемой интервальной модификации повышается по сравнению с обычной моделью Д-О, когда число тестов небольшое. Это видно из рис. 2, где изображены отклонения прогнозируемых ожидаемых зна-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

чений числа отказов от реальных данных. Жирная кривая с круглыми маркерами — отклонения, соответствующие предлагаемой модели. Тонкая кривая с треугольными маркерами — отклонения, соответствующие модели Д-О. Очевидно, что новая модель ведет себя лучше при малом числе тестов.

Следующая задача анализа модели заключается в исследовании влияния параметра 5 на качество прогноза модели. Используя те же самые статистические данные об отказах, вычислим показатели качества при 5 = 0,5 после 17 тестов Я1 = 7,198, Я2 = 1,952, Я3 = 1,719. Те же самые показатели при 5 = 0,5 после 6 тестов приобретают значения: Я1 = 2,049, Я2 = 1,074, Я3 = 0,657. Можно увидеть, что меньшие значения 5 приводят к более высокому качеству прогноза, когда имеется большой объем данных. Однако качество прогноза падает при малом числе статистических данных. Противоположное заключение можно сделать при анализе случая, когда параметр 5 возрастает. В частности, при 5 = 2 и после 17-ти тестов получаем Я1 = 7,734, Я2 = 2,134, Я3 = 1,852. Те же самые показатели при

5 = 2 после 6-ти тестов имеют значения Я1 = 2,026, Я2 = 1,172, Я3 = 0,547.

Проанализируем интервальную модификацию модели М-О и сравним ее со стандартной моделью М-О. Соответствующие кривые прогноза для моделей показаны на рис. 3. Отклонения прогнозируемых ожидаемых значений числа отказов от реальных статистических данных изображены на рис. 4. Используя статистические данные, вычисляем показатели качества при 5 = 1 после прогнозирования 17 значений числа отказов (от 3-го до 19-го теста) для предлагаемой интервальной модификации модели М-О Я1 = 7,817, Я2 = 2,134,

Я3 = 1,852, и для обычной модели М-О Я* = 7,445,

Я* = 2,222, Я * = 1,800. Те же самые показатели после 6-ти тестов (от 3-го до 8-го теста): Я1 = 1,932,

Рис. 2. Отклонения прогнозируемых ожидаемых значений числа ошибок от реальных данных для моделей Д-О

Рис. 3. Прогнозируемые ожидаемые значения числа ошибок для различных моделей, построенных на основе модели М-О

Рис. 4. Отклонения прогнозируемых ожидаемых значений числа ошибок от реальных данных для моделей М-О

Я2 = 0,990, Я3 = 0,620, Я* = 3,060, Я2 = 2,005, Я* = 1,020.

Модель М-О и ее модификации демонстрируют практически те же зависимости показателей качества прогноза от объема выборки и параметра 5, что и модель Д-О.

ЗАКЛЮЧЕНИЕ

Предложен подход, направленный на развитие нового класса моделей надежности программного обеспечения. Его основная идея состоит в комбинированном применении обобщенного байесовского подхода и метода максимума функции правдоподобия. Ключевыми элементами подхода являются доказанное утверждение и разделение всех параметров модели на два подмножества, что позволяет уменьшить размерность задачи. Другая важная особенность подхода состоит в возможности получать интервальные оценки надежности программного обеспечения. Точные характеристики надежности, которые обычно стремятся иметь специалисты, далеко не всегда заслуживают доверия,

например, когда статистические данные ограниченны и исходная информация бедна. В предложенных моделях результат моделирования представляет собой интервал показателя надежности. Дальнейшее решение принимается исходя из того, насколько высоки требования к надежности анализируемого программного обеспечения.

Предложенный подход носит общий характер. Несмотря на то, что рассмотрены только две частные модели, аналогичным образом можно рассмотреть и другие модификации известных моделей надежности программного обеспечения.

Результаты численного анализа рассмотренных моделей и их сравнение с известными моделями говорят в пользу нового подхода. В то же время, из этих результатов видно, что нельзя выбрать идеальную модель для всех ситуаций. Необходимо пользоваться различными моделями и комбинировать результаты их применения.

ЛИТЕРАТУРА

1. Майерс Г. Надёжность программного обеспечения. — М.: Мир, 1980. — 360 с.

2. Cai K.Y., Wen C.Y., Zhang M.L. A critical review on software reliability modeling // Reliability Engineering and System Safety. — 1991. — Vol. 32, N 3. — P. 357—371.

3. Уткин Л.В., Шубинский И.Б. Нетрадиционные методы оценки надежности информационных систем. — СПб.: Любавич, 2000. — 173 с.

4. Cai K. Y. Towards a conceptual framework of software run reliability modeling // Information Sciences. — 2000. — Vol. 126, N 1— 4. — P. 137—163.

5. Goel A.L., Okomoto K. Time dependent error detection rate model for software reliability and other performance measures // IEEE Trans. Reliab. — 1979. — Vol. R-28, N 3. — P. 206—211.

6. Duane J.T. Learning curve approach to reliability monitoring // IEEE Transactions on Aerospace. — 1964. — Vol. AS-2, N 2. — P. 563—566.

7. Misra P.N. Software reliability analysis // IBM Systems Journal. — 1983. — Vol. 22, N 3. — P. 262—270.

8. Walley P. Inferences from multinomial data: Learning about a bag of marbles // Journal of the Royal Statistical Society, Ser. B. — 1996. — Vol. 58, N 1. — P. 3—57.

9. Уткин Л.В. Анализ риска и принятие решений при неполной информации. — СПб.: Наука, 2007. — 404 c.

10. Bernardo J.M., Smith A.F.M. Bayesian Theory. — Chichester: Wiley, 1994.

11. Quaeghebeur E., De Cooman G. Imprecise probability models for inference in exponential families // Proc. of the 4rd Int. Symposium on Imprecise Probabilities and Their Applications, lSlPTA’05. — Carnegie Mellon University. Pittsburgh. — 2005. — P. 287—296.

Статья представлена к публикации членом редколлегии П.П. Пархоменко.

Уткин Лев Владимирович — д-р техн. наук, проректор, Санкт-Петербургская государственная лесотехническая академия, ®(812) 550-02-53, И lev.utkin@mail.ru,

URL: www.levvu.narod.ru,

Затенко Светлана Ивановна — ст. преподаватель, Санкт-Петербургская государственная лесотехническая академия, И s_lana2004@mail.ru,

Коолен Франк (Frank Coolen) — Professor, PhD,

Durham University, UK, Durham,

©(0191 or +44 191) 334-30-48 (direct), 334-30-50 (secr.),

И Frank.Coolen@durham.ac.uk,

URL: http://maths.dur.ac.uk/stats/people/fc/fc.html.

i Надоели баннеры? Вы всегда можете отключить рекламу.