Научная статья на тему 'Классификация основных показателей для оценки надежности и диагностируемое компьютерных систем'

Классификация основных показателей для оценки надежности и диагностируемое компьютерных систем Текст научной статьи по специальности «Математика»

CC BY
557
87
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Липчанский Александр Иванович, Давыдов Андрей Андреевич

В данной статье рассматривается классификация основных видов показателей для оценки надежности и диагностируемости компьютерных систем. Рассмотрены показатели безотказной работы, ремонтопригодности, долговечности, эксплуатационной готовности, комплексные показатели диагностируемости. Приведена классификация отказов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In given article is considered the classification of the basic kinds of parameters for a rating of reliability and diagnozability of computer systems. Such parameters were considered: of non-failure operation, of maintainability, of durability, of operational readiness, complex parameters diagnozability. Was given the classification of failures.

Текст научной работы на тему «Классификация основных показателей для оценки надежности и диагностируемое компьютерных систем»

УДК 681.321

А. И. Липчанский, А. А. Давыдов

КЛАССИФИКАЦИЯ ОСНОВНЫХ ПОКАЗАТЕЛЕЙ ДЛЯ ОЦЕНКИ НАДЕЖНОСТИ И ДИАГНОСТИРУЕМОЕ КОМПЬЮТЕРНЫХ

СИСТЕМ

В данной статье рассматривается классификация основных видов показателей для оценки надежности и диагностируемости компьютерных систем. Рассмотрены показатели безотказной работы, ремонтопригодности, долговечности, эксплуатационной готовности, комплексные показатели диагностируемости. Приведена классификация отказов.

ВВЕДЕНИЕ

За последние два десятилетия сложность и быстродействие компьютеров увеличилось в десятки тысяч раз. Задача, требовавшая год вычислений в 1983 г., сегодня решается за час, а современный карманный компьютер намного мощнее настольного тех времен. Но за прогресс и усовершенствования компьютерных систем (КС) приходится платить. Чем сложнее становятся КС, тем более неустойчиво и ненадежно они функционируют. Персональные компьютеры регулярно зависают, интернет-сайты довольно часто перестают работать. Новое программное обеспечение (ПО), разработанное для увеличения производительности КС, зачастую с точки зрения надежности только ухудшает ситуацию. В результате ежегодные затраты на поддержку и ремонт КС намного превышают общую стоимость оборудования и ПО как для индивидуальных пользователей, так и для корпораций. Традиционные меры по увеличению надежности КС рассчитаны на то, что операторы действуют безошибочно, и сейчас во многих случаях именно из-за их оплошности система выходит из строя на более длительное время, чем из-за любых других неполадок с оборудованием и ПО. Вопросы, связанные с оценкой надежности и диагнос-тируемости КС, рассматривались во многих работах. Например, в [1] приведены различные аспекты гарантоспособности, принципы построения гарантоспособных КС, приводятся определения первичных свойств системы: безотказность, готовность, обслуживаемость, достоверность, функциональная безопасность, живучесть, целостность, конфиденциальность. В [2] выполнен аналитический обзор существующих экспертных систем (ЭС), встроенных в пассивные средства диагностирования вычислительных сетей, рассмотрены

© Липчанский А. И., Давыдов А. А., 2007

преимущества и недостатки ЭС в целях определения целесообразности их использования для решения задач диагностирования корпоративных компьютерных сетей. В статье [3] рассмотрены применение экспертных систем реального времени для диагностики компьютерных систем.

ПОСТАНОВКА ЗАДАЧИ

Простои КС обходятся слишком дорого, а иногда просто недопустимы. Комплекс с надежностью в пять «девяток» работает без сбоев 99,999 % времени, т. е. за 25 лет в общем простаивает примерно 2 часа. Переход от двух «девяток» к пяти позволяет сохранить почти 90 часов рабочего времени в год. Поэтому классификация основных видов показателей для оценки надежности и диагностируемости КС на различных этапах жизненного цикла является актуальной задачей.

1 КЛАССИФИКАЦИЯ ОТКАЗОВ КС

Одной из важнейших характеристик надежности КС является безотказность - свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени или наработки на отказ. Отказ КС рассматриваем как событие, заключающееся в прекращении способности объекта исполнять требуемую функцию. Ниже приведена классификация основных видов отказов КС:

- возникновение отказа: в аппаратной или программной части;

- изменения параметров КС во времени до отказа: внезапный (характеризующийся скачкообразным изменением значений параметров объекта) или постепенный (возникающий в результате постепенного изменения значений параметров);

- характер существования отказа во времени: сбой (самоустраняющийся или однократный отказ, устраняемый незначительным вмешательством оператора), перемежающийся (многократно возникающий самоустраняющийся отказ одного и того же характера), устой-

А. И. Липчанский, А. А. Давыдов: КЛАССИФИКАЦИЯ ОСНОВНЫХ ПОКАЗАТЕЛЕЙ ДЛЯ ОЦЕНКИ НАДЕЖНОСТИ И ДИАГНОСТИРУЕМОСТИ КОМПЬЮТЕРНЫХ СИСТЕМ

чивый (не прекращающийся до устранения его причины);

- возможность обнаружения: явный или скрытый;

- обусловленность другими отказами: зависимый или независимый;

- возможность восстановления работоспособности после отказа: неустранимый, устранимый на месте эксплуатации, устранимый на специализированном ремонтном предприятии;

- причина возникновения: конструктивный, производственный, эксплуатационный;

- тяжесть последствий: критический (при котором возникает угроза для жизни и здоровья людей, для окружающей среды, значительные экономические потери или невыполнение ответственного задания) или некритический.

2 ПОКАЗАТЕЛИ БЕЗОТКАЗНОЙ

РАБОТЫ КС

Поскольку отказы компьютерных систем являются случайными событиями, то характеристики для оценки диагностируемости КС имеют вероятностный характер, а их численные значения определяются и анализируются статистическими и вероятностными методами. Рассмотрим основные показатели безотказной работы КС:

- средняя частота отказов, а (ti, t^) - отношение числа отказавших изделий в единицу времени к первоначальному числу испытываемых изделий при условии, что все вышедшие из строя изделия не восстанавливаются;

- наработка - продолжительность или объем работы объекта, измеренная в любых неубывающих величинах;

- средняя наработка до первого отказа (MTTF (Mean operating Time To Failure)), T

= J P( t) dt - мате-0

матическое ожидание наработки объекта до первого отказа (имеет смысл только для восстанавливаемых систем);

1 dP( t)

- интенсивность отказов, X(t) = ———г^ - услов-

P( t) dt

ная плотность вероятности возникновения отказа объекта, определяемая при условии, что до рассматриваемого момента времени отказ не возник;

- средняя наработка на отказ (MTBF (Mean operating Time Between Failures)), To = t / M{ r (t)} - отношение суммарной наработки восстанавливаемого объекта к математическому ожиданию числа его отказов в течение этой наработки;

- вероятность безотказной работы, P(tбр) = = P{т > t} - вероятность того, что в пределах заданной наработки отказ объекта не возникнет.

3 ПОКАЗАТЕЛИ РЕМОНТОПРИГОДНОСТИ

КС

Ремонтопригодность - свойство объе екта, заключающееся в приспособленности к поддержанию и восстановлению работоспособного состояния путем технического обслуживания и ремонта при условии соблюдения условий эксплуатации объекта, а также условий проведения процедур технического обслуживания и ремонта. Рассмотрим основные показатели ремонтопригодности КС:

- вероятность восстановления, Р(Ьв) - вероятность того, что время восстановления работоспособного состояния объекта не превысит заданное значение;

- среднее время ремонта (MRT (Mean Restoration Time)) - математическое ожидание времени восстановления работоспособного состояния объекта после отказа;

- среднее время восстановления (MTTR (Mean Time To Repair)), Тв - математическое ожидание времени восстановления работоспособного состояния объекта после отказа.

4 ПОКАЗАТЕЛИ ДОЛГОВЕЧНОСТИ КС

Долговечность - свойство объекта сохранять работоспособное состояние до наступления предельного состояния при установленной системе технического обслуживания и ремонта. Ниже представлены основные показатели долговечности КС:

- ресурс - суммарная наработка объекта от начала его эксплуатации или ее возобновления до перехода в предельное состояние;

- срок службы, Тсс - календарная продолжительность эксплуатации от начала эксплуатации объекта до перехода в предельное состояние.

5 ПОКАЗАТЕЛИ ЭКСПЛУАТАЦИОННОЙ

ГОТОВНОСТИ

Эксплуатационная готовность - свойство объекта, отражающее как появление отказов, так и время неисправного состояния. Свойство эксплуатационной готовности является сочетанием свойств безотказности и ремонтопригодности объекта. Рассмотрим основные показатели эксплуатационной готовности:

- средний коэффициент эксплуатационной готовности, A(t\, tj) - усредненная на заданном интервале вероятность того, что объект окажется работоспособным в заданный момент времени, отсчитываемый от начала работы;

- средний коэффициент эксплуатационной неготовности, U(t\, tj) - усредненная на заданном интервале вероятность того, что объект окажется неработоспособным в заданный момент времени, отсчитываемый от начала работы;

- среднее время неисправного состояния (МБТ) -математическое ожидание времени нахождения объекта в неисправном состоянии.

6 КОМПЛЕКСНЫЕ ПОКАЗАТЕЛИ

ДИАГНОСТИРУЕМОСТИ

Рассмотрим следующие комплексные показатели ди-агностируемости:

- коэффициент готовности, Кт = Г0/Г0 + Гв - вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается;

- коэффициент оперативной готовности, Ког = = К ■ Р(¿бр ) - вероятность того, что система окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение системы по назначению не предусматривается, и начиная с этого момента будет работать безотказно в течение заданного времени;

- коэффициент технического использования, КТИ = = Г0/Г0 + Тв + Тп - отношение математического ожидания интервалов времени пребывания системы в работоспособном состоянии за некоторый период эксплу-

атации к сумме математических ожиданий интервалов времени пребывания системы в работоспособном состоянии, простоев, обусловленных техническим обслуживанием, и ремонтов за тот же период эксплуатации;

- коэффициент сохранения эффективности, Кэф -отношение значения показателя эффективности за определенную продолжительность эксплуатации к номинальному значению этого показателя, вычисленному при условии, что отказы в системе в течение того же периода эксплуатации не возникают.

7 ПОКАЗАТЕЛИ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ КС

Рассмотрим следующие показатели надежности программного обеспечения КС:

- количество ошибок в программе - число ошибок, обнаруженных в программе с момента начала ее эксплуатации до рассматриваемого момента;

- вероятность безотказной работы программы -вероятность того, что в пределах заданной наработки ошибка в программе не проявится;

- интенсивность потока ошибок программы - условная плотность вероятности возникновения ошибки в программе, определяемая при условии, что до рассматриваемого момента времени ошибка не возникла.

Таблица 1 - Выбор номенклатуры показателей для объектов вида I

Классификация объектов по признакам, определяющим выбор показателей

По назначению По режиму функционирования По возможности восстановления и обслуживания

Восстанавливаемые Невосстанавливаемые

Обслуживаемые Необслуживаемые Обслуживаемые и необслуживаемые

Объекты конкретного назначения Объекты непрерывного длительного применения Кг или Кт и , То, Тв Кг, То, Тв Р^б.р^ или Тср

Объекты многократного циклического применения КОГ(¿бр) = Кг ■ Р(¿б.р.), Тв Ро и Тср

Объекты общего назначения Объекты непрерывного длительного применения и объекты многократного циклического применения Кт.и., То, Тв Кг, То, Тв Т ср

Объекты однократного применения - - Ро

Таблица 2 - Выбор номенклатуры показателей для объектов вида II

Классификация объектов по признакам, определяющим выбор показателей

По назначению По возможности восстановления и обслуживания

Восстанавливаемые Невосстанавли-ваемые

Обслуживаемые Необслуживаемые Обслуживаемые и необслуживаемые

Объекты конкретного назначения Кэф, Тв Кэф

Объекты общего назначения Кт.и., То То Т ср

М. А. Новотарский: АЛГЕБРА ПРОЦЕССОВ ДЛЯ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ СЛОЖНЫХ ДИСКРЕТНЫХ СИСТЕМ

8 ОБОБЩЕННАЯ СХЕМА ВЫБОРА

ЗАДАВАЕМЫХ ПАРАМЕТРОВ

ДИАГНОСТИРУЕМОСТИ

В табл. 1 приводится выбор номенклатуры показателей безотказности, ремонтопригодности или комплексных для объектов вида I.

В табл. 2 приводится выбор номенклатуры показателей безотказности, ремонтопригодности или комплексных для объектов вида II.

ВЫВОДЫ

Рассмотренные показатели надежности и диагности-руемости КС целесообразно использовать на этапе автоматизированного проектирования диагностического обеспечения КС. Это позволит более эффективно осуществлять поиск возможных возникающих дефектов на этапе эксплуатации КС.

ПЕРЕЧЕНЬ ССЫЛОК

1. Харченко В. С, Гарантоспособность и гарантоспособные системы: элементы методологии // Научно-тех-

нический журнал «Радиоэлектронные и компьютерные системы». - 2006. - № 5 (17). - С. 7-20.

2. Кривуля Г. Ф., Липчанский А. И., Механна Сами, Зидат Хабис. Диагностика компьютерных сетей с использованием экспертных систем // Вестник ХГТУ. - 2004. -№ 1 (19). - С. 11-16.

3. Кривуля Г. Ф., Бабич А. В., Липчанский А. И., Шкиль А. С. Применение экспертных систем реального времени для диагностики компьютерных систем // Науково-техшчний журнал «¡нфомацшно-керуюч1 системи на зал1зничному транспорт!». - Харюв. - 2004. - № 1. -С. 67-73.

Надшшла 2.03.07

У cmammi розглядаетъся класифтащя основних eudie показнитв для оцтки HadiuHocmi та 3damHocmi до дiaгнocmyвaння кoмn'юmepнuх cucmeM. Розглян-ymi показ-ники бeзвiдмoвнo'i poбomu, peмoнmoздamнocmi, дoвгoвiч-mcmi, eкcnлymaцiйнo'i гomoвнocmi, комплект показники здamнocmi до дiaгнocmyвaння. Наведена клacuфiкaцiя вiдмoв.

In given article is considered the classification of the basic kinds of parameters for a rating of reliability and diagnozability of computer systems. Such parameters were considered: of non-failure operation, of maintainability, of durability, of operational readiness, complex parameters diagnozability. Was given the classification of failures.

УДК 621,3

М. А. Новотарский

АЛГЕБРА ПРОЦЕССОВ ДЛЯ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

СЛОЖНЫХ ДИСКРЕТНЫХ СИСТЕМ

В работе представлена алгебра процессов, как инструмент для формального описания сложных дискретных систем. Рассмотрена структура множеств, на которых определены переменные и выражения алгебры процессов. Описаны синтаксические конструкции и семантические правила выполнения операций, позволяющие задавать формальное описание имитационных моделей с реальной рабочей нагрузкой. Для определения адекватности модели предложено использовать принципы эквивалентности, базирующиеся на конгруэнтности, строгом и слабом взаимном подобии.

ВВЕДЕНИЕ

Ежедневно мы сталкиваемся с огромным количеством сложных дискретных систем, которые, большей частью, являются продуктом человеческой деятельности. Это и телекоммуникационные сети, и персональные компьютеры, и многое другое. Создавать или исследовать такие системы практически невозможно без пред© Новотарский М. А., 2007

варительной проверки принимаемых технических решений, поскольку компоненты систем, как правило, дорогостоящи и требуют существенных затрат на их производство. Одним из эффективных инструментов для проверки и предварительного анализа сложных систем является компьютерное моделирование. Построение моделей особенно актуально, когда речь идет о разработке мультипроцессорных систем, ориентированных на реализацию параллельных асинхронных алгоритмов. При этом не всегда удается эффективно использовать традиционные подходы к формализации исходной задачи, поскольку в данном случае модели должны отображать особенности параллелизма и асинхронного взаимодействия компонент. Например, ориентация на известные языки моделирования заведомо ставит исследователя в зависимость от способов функционирования и взаимодействия компонент, принятых в том или ином языке, а попытка эмулировать

i Надоели баннеры? Вы всегда можете отключить рекламу.