Научная статья на тему 'АДАПТАЦИЯ МЕТОДА РОЗЕНБЛАТТА - ПАРЗЕНА ДЛЯ ЭКСПЕРИМЕНТАЛЬНОЙ ОЦЕНКИ НАДЁЖНОСТИ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ'

АДАПТАЦИЯ МЕТОДА РОЗЕНБЛАТТА - ПАРЗЕНА ДЛЯ ЭКСПЕРИМЕНТАЛЬНОЙ ОЦЕНКИ НАДЁЖНОСТИ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
29
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКСПЕРИМЕНТАЛЬНЫЙ АНАЛИЗ НАДЁЖНОСТИ / МАЛЫЕ ВЫБОРКИ / ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ / МЕТОД РОЗЕНБЛАТТА - ПАРЗЕНА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Никулин Владимир Сергеевич

Отсутствие исходной информации о законе распределения случайных величин и их реализация в момент, близкий к началу наблюдения, а также наличие цензурированных данных вызывает необходимость адаптации непараметрического метода Розенблатта - Парзена. Для компенсации смещения и устранения нарушения условия нормировки рассмотрен метод зеркального отображения исходных данных. При построении плотности распределения случайных величин предлагается учитывать цензурированные данные. Проведённая оценка точности показывает уменьшение ошибки при аппроксимации эмпирической плотности распределения адаптированным методом Розенблатта - Парзена. На примере экспериментальной оценки показателей надёжности вычислительной системы продемонстрирована практическая реализация адаптированного метода Розенблатта - Парзена. Построение плотности и функции распределения времени до отказа позволяет рассчитать основные показатели безотказности объекта: интенсивность отказов, вероятность безотказной работы, среднее время наработки на отказ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никулин Владимир Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ADAPTATION OF THE ROSENBLATT - PARZEN METHOD FOR THE EXPERIMENTAL EVALUATION OF THE COMPUTING SYSTEM RELIABILITY

The lack of initial information about the law of distribution of random variables and their realization at a time moment close to the beginning of the observation, as well as the presence of censored data, force us to adapt the nonparametric Rosenblatt - Parzen method. To compensate for the bias and eliminate the violation of the normalization condition, the method of mirroring the original data is considered. When constructing the distribution density of random variables, it is proposed to take into account censored data. The accuracy of the estimate shows a decrease in error when using the adapted Rosenblatt - Parzen method. The practical implementation of the adapted Rosenblatt - Parzen method is demonstrated by the example of an experimental assessment of the reliability indicators of a computing system. Plotting the density and the mean time between failures distribution function allows calculating the main indicators of the object's reliability: failure rate, probability of no-failure operation, mean time between failures. Calculated estimates of the reliability indicators of a computing system are necessary for making control decisions during operation and maintaining the facility's performance.

Текст научной работы на тему «АДАПТАЦИЯ МЕТОДА РОЗЕНБЛАТТА - ПАРЗЕНА ДЛЯ ЭКСПЕРИМЕНТАЛЬНОЙ ОЦЕНКИ НАДЁЖНОСТИ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ»

№ п/п 1о, % h, % 12, % 1з, %

1 70 56 81 81

2 70 71 71 76

3 59 55 85 88

4 58 49 80 85

5 64 45 68 80

6 78 49 72 86

7 72 63 75 82

8 63 52 68 81

9 74 68 83 82

10 63 54 82 85

Среднее 67 56 76 82

Для оценки качества сокрытия данных в контейнере использован также программный инструмент StegSolve, позволяющий обнаружить артефакты и скрытую информацию в медиаконтейнерах. В результате анализа изображения-контейнера с помощью StegSolve восстановить скрытые изображения или обнаружить артефакты без раскрывающей сети не удалось, что свидетельствует о том, что данный метод имеет высокую надёжность передачи сообщений без возможности восстановления скрытых изображений участником, не имеющим доступа к раскрывающей сети.

ЛИТЕРАТУРА

1. Baluja S. Hiding Images in Plain Sight: Deep Steganography // Adv. Neural Inform. Processing Systems. 2017. No. 30. P. 1-11.

2. Zhu J., Kaplan R., Johnson J., and Fei-Fei L. HiDDeN: Hiding Data With Deep Networks. 2018. https://arxiv.org/abs/1807.09937.

УДК 519.23:519.6: 004.052 DOI 10.17223/2226308X/14/33

АДАПТАЦИЯ МЕТОДА РОЗЕНБЛАТТА — ПАРЗЕНА ДЛЯ ЭКСПЕРИМЕНТАЛЬНОЙ ОЦЕНКИ НАДЁЖНОСТИ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ

В. С. Никулин

Отсутствие исходной информации о законе распределения случайных величин и их реализация в момент, близкий к началу наблюдения, а также наличие цензури-рованных данных вызывает необходимость адаптации непараметрического метода Розенблатта — Парзена. Для компенсации смещения и устранения нарушения условия нормировки рассмотрен метод зеркального отображения исходных данных. При построении плотности распределения случайных величин предлагается учитывать цензурированные данные. Проведённая оценка точности показывает уменьшение ошибки при аппроксимации эмпирической плотности распределения адаптированным методом Розенблатта — Парзена. На примере экспериментальной оценки показателей надёжности вычислительной системы продемонстрирована практическая реализация адаптированного метода Розенблатта — Парзена. Построение плотности и функции распределения времени до отказа позволяет рассчитать основные показатели безотказности объекта: интенсивность отказов, вероятность безотказной работы, среднее время наработки на отказ.

Ключевые слова: экспериментальный анализ надёжности, малые выборки, вычислительные системы, метод Розенблатта — Парзена.

Экспериментальная оценка показателей надёжности сводится к построению плотности распределения времени отказа. Применение параметрических методов анализа статистической информации ограничено требованием необходимости знания закона распределения наблюдаемых случайных величин. Например, в теории надёжности показано, что наработки до отказа однотипных радиоэлектронных элементов подчиняются экспоненциальному закону, при этом характер отказов предполагается внезапным, а сумма случайных величин, описываемых экспоненциальным распределением, подчиняется гамма-закону [1]. Другие факторы, обосновывающие применение того или иного семейства распределений, отсутствуют. Решением проблемы отсутствия информации о виде закона распределения наблюдаемых случайных величин является использование непараметрических методов.

Среди непараметрических методов построения плотности распределения широкое распространение находят гистограммные, проекционные, ядерные и ортогональные оценки. Методы построения этих оценок известны и хорошо изучены для случаев, когда в отношении результатов наблюдений выполняется предположение, что в каждом испытании реализуется наблюдаемый признак. Например, если речь идёт об обработке статистических данных с целью определения характеристик надёжности, то в качестве обрабатываемой информации используются полные наработки объектов до отказа.

Однако на практике информация от функционирующих объектов имеет ряд ограничений. Например, в момент ввода объекта в эксплуатацию возникают отказы, связанные с отладкой работы оборудования. Данный процесс вызывает проблему смещения плотности распределения. Непосредственно при эксплуатации объектов стараются не допускать отказов за счёт предупредительных профилактических мероприятий, в связи с этим возникает проблема малых выборок по полным наработкам на отказ. В процессе анализа надёжности приходится сталкиваться с ситуациями, когда определённая часть объектов или систем не отказывает за период наблюдения, а другая часть отказывает, но моменты отказов неизвестны. Такой процесс называется цензурированием данных. Учитывая описанные проблемы, применение непараметрических методов в явном виде не представляется возможным для задачи экспериментальной оценки показателей надёжности.

В данной работе предлагается адаптация непараметрического метода Розенблат-та — Парзена. Этот метод обладает рядом преимуществ относительно метода построения гистограмм, проекционных и экспоненциальных оценок [2]. Его достоинством является положительная определённость (при выборе неотрицательного ядра), что не выполняется для оценок на основе ортогональных разложений. Важным моментом является наличие теоретических наработок по учёту малых выборок и цензурированных данных [3, 4]. В общем виде метод Розенблатта — Парзена применяется для построения плотности распределения f (¿) по полным наработкам на отказ [5]:

где £\,... , £ — полные наработки на отказ элемента; К(х) —ядро (чётная нормированная функция); к — параметр сглаживания; п — объём выборки наработок.

Анализ методов определения к показал, что значение данного параметра оказывает существенное влияние на вид оценки плотности распределения и её точность. При наличии малых выборок использование метода Сильвермана [6] для первоначального определения значения параметра к сохраняет универсальность метода построения плотности и не требует значительных вычислительных ресурсов. Формула вычисления

(1)

значения параметра к имеет вид

к = 0,9 шт(а, ^/1,34) п-1/5,

где а — стандартное отклонение; п — объём; ^ — медиана выборки.

Выбор ядра обусловлен предпосылками, касающимися класса функции, которому принадлежит оцениваемая плотность, а также областью определения наработок на

отказ. Рассмотрим функцию Гаусса в качестве первоначального ядра f (¿) [1]:

К (х) = ^ /2

Адаптация метода Розенблатта — Парзена

Известно, что выбранная в качестве К(х) функция Гаусса определена на области (-то, то), а при проведении анализа надёжности наблюдаемой величиной является время с областью определения [0, то). В этом случае при наличии наработок на отказ, близких к нулю, присутствует смещение плотности с нарушением условия нормировки Г(0) = 0. Для компенсации смещения плотности предлагается применить метод зеркального отображения исходных данных [4]. При этом выражение (1) примет следующий вид:

1 п

f (*) = "тЕ

пк г=1

К(^) + к'1 + £

кк

В случае цензурирования справа в качестве дополнительной исходной информации фигурирует массив из числа работоспособных элементов V = (^1,... , у3) на интервале [/, то], где I —правая граница интервала эксплуатации, на котором не зафиксированно отказов. Выражение для учёта цензурированных справа данных получено в [6]. Итоговое выражение для восстановления плотности распределения наработок на отказ можно записать так:

' <" = к"

Е

г=1

К( + к'г + £

кк

+5 I О *'(

Здесь первое слагаемое отвечает за полные наработки на отказ с компенсацией смещения плотности, а второе — за цензурированные данные.

В целях экспериментальной проверки метода Розенблатта — Парзена и его адаптированного варианта проведена серия экспериментов с моделированием наработок по закону распределения Вейбулла с параметрами т = 1,1, в = 103 с областью определения [0, то). На смоделированных данных проведено исследование точности оценок. Выводы о точности основывались на вычислении ошибки оценивания еп в метрике Ь1 -пространства по выражению

оо ^

6п =/ (*)- f (*)\й,

О

где f (¿) — смоделированная плотность распределения времени до отказа; f (¿) —экспериментальная плотность распределения времени до отказа.

По результатам эксперимента максимальная ошибка оценивания еп составляет:

— 0,31 при расчёте f (¿) по выражению (1);

— 0,188 при расчёте f (¿) по выражению (2).

Таким образом, адаптация метода Розенблатта — Парзена позволяет повысить точность восстанавливаемой плотности распределения за счёт компенсации смещения и учёта цензурированных данных. Применение предложенной адаптации целесообразно при отсутствии априорной информации о законе распределения случайных величин, наличии малых выборок, цензурированных данных и необходимости компенсации смещения.

Рассмотрим адаптированный метод Розенблатта — Парзена на примере оценки показателей надёжности вычислительной системы. Выражение (2) позволяет рассчитать основные показатели надёжности сложных систем. Как правило, надёжность объекта определяется надёжностью комплектующих элементов, поэтому для каждого элемента из состава объекта расчитываются следующие показатели:

— функция распределения времени на отказ:

^ (г) = ] / (3)

о

— вероятность безотказной работы:

РЦ) = 1 - ^(*); (4)

— интенсивность отказов:

т = Р§; га

— средняя наработка времени между отказами:

п

Тер = - Е Ъ. (6)

Здесь — — объём выборки наработок; ^ — время штатного функционирования между (] — 1)-м и ]-м отказами.

В качестве объекта рассматривается вычислительная система из 20 параллельно функционирующих вычислительных узлов (элементов). Период полной подконтрольной эксплуатации объекта составляет Т = 35040 ч (4 года). В период эксплуатации система мониторинга фиксирует информацию об отказах по каждому элементу. При заданном режиме функционирования отказ объекта наступает в результате отказа всех составных элементов. Полученная информация предварительно обрабатывается в соответствии с методикой подготовки данных [7] для последующей оценки плотности распределения времени до отказа и представляет:

— Ет = (£1,... ,£г) —выборки полных наработок на отказ элементов за период Т, где £ — время отказа оборудования;

— V = (у\,... ,у3) —массив из числа работоспособных элементов на интервале [/, то], где I —правая граница периода Т, на котором не зафиксировано отказов.

Для каждого элемента вычислительной системы по исходным данным и выражениям (3)-(6) рассчитаны основные показатели надёжности (с нижним индексом (е1)) (таблица).

№ эл-та ТСр(е1)(*) № эл-та Р(еФ) Тср(е1) (*)

1 0,91 2,28е-04 4379 И 0,72 2,51е-04 3980

2 0,69 1,83е-04 5474 12 0,83 1,83е-04 5474

3 0,65 2,06е-04 4865 13 0,65 2,28е-04 4379

4 0,79 2,97е-04 3368 14 0,60 2,28е-04 4379

5 0,72 2,74е-04 3649 15 0,65 1,60е-04 6256

6 0,77 2,06е-04 4865 16 0,72 1,83е-04 5474

7 0,72 2,74е-04 3649 17 0,57 1,37е-04 7299

8 0,67 1,37е-04 7299 18 0,65 1,83е-04 5474

9 0,66 1,60е-04 6256 19 0,60 9,13е-05 10949

10 0,69 2,28е-04 4379 20 0,83 1,37е-04 7299

Связь показателей надёжности параллельно функционирующих элементов с показателями надёжности объекта определяется следующими выражениями:

— вероятность безотказной работы:

N

Р(оь)(*) = 1-П(1-Леи(*)0; (7)

г=1

интенсивность отказа:

" А(в1,(*)<

г=1

^(оь)СО-Е м 1 ,

Е "

3=1 3

— средняя наработка времени между отказами:

ТСр(оЬ)(Х) = Т-777- (9)

По данным из таблицы и выражениям (7)-(9) рассчитаны эксплуатационные показатели надёжности объекта:

— вероятность безотказной работы Р(оЬ)(£) = 0,999;

— интенсивность отказа объекта А(0ь)= 5,52е-05;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— средняя наработка времени между отказами Тср(0ь)(£) = 18108.

По полученным оценкам построены кривые, представленные на рис. 1.

Г - время функционирования объекта в часах Г - время функционирования объекта в часах

Рис. 1. Кривые, построенные по оценкам показателей надёжности объекта за период эксплуатации

Рассчитанные экспериментальные оценки показателей надёжности вычислительной системы необходимы для принятия управляющих решений при эксплуатации и

сохранении работоспособности объекта.

ЛИТЕРАТУРА

1. Половко А.М., Гуров С. В., Основы теории надежности. 2-е изд. СПб.: БХВ-Петербург, 2008.

2. Захаров Д. Н., Никулин В. С., Анализ методов статистической оценки эксплуатационной надежности вычислительных комплексов //Наукоемкие технологии в космических исследованиях Земли. 2020. Т. 12. №1. С. 64-69.

3. Чепурко В. А. Ядерная оценка параметра потока отказов. Диагностика и прогнозирование состояния сложных систем // Сб. научных трудов каф. АСУ НИЯУ МИФИ. 2004. №15. С. 19-31.

4. Антонов А. В., Никулин М. С. Статистические модели в теории надежности. М.: Абрис, 2012. 390 с.

5. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statistics. 1962. V.33. P. 1065-1076.

6. Silverman B. Density estimation for Statistics and Data Analysis. London, N.Y.: Chapman & Hall/CRC, 1986.

7. Никулин В. С. Методика подготовки данных для интеллектуального анализа надежности вычислительных комплексов //Вестник СИБГУТИ. 2020. №3(51). С. 26-37.

i Надоели баннеры? Вы всегда можете отключить рекламу.