Петров Б.М.
МЕТОДИКА ПРОГНОЗИРОВАНИЯ ПОКАЗАТЕЛЕЙ ЖИВУЧЕСТИ ПРОГРАММНЫХ СРЕДСТВ ИНФОРМАЦИОННЫХ СИСТЕМ
следует руководствоваться при
количественных показателей
стадиях эскизного и технического путем расчета интенсивности
Целью данной работы является рассмотрение методики прогнозирования живучести программных средств (ПС) информационных систем (ИС) на ранних этапах проектирования, использование которых позволяет совершенствовать процесс разработки, за счет: повышения точности
расчетов при обеспечении живучести; снижения трудоемкости процесса проектирования;
сокращения сроков проведения разработки; снижения стоимости проводимых мероприятий, направленных на выполнение требований по живучести ИС.
Методикой определении живучести на проектирования ошибок ПС. Методика состоит из четырех этапов и позволяет определить количественные показатели живучести с целью:
- научно-теоретического обоснования
возможности выполнения требований по
живучести, заданных в ТЗ на разработку;
- проведения сравнительного анализа живучести различных вариантов
построения ПС ИС;
- выбора технологии технических средств (ТС) ИС с учетом быстродействия,
сложности, мощности
микропроцессоров (МП) и т.п.;
- выбора оптимальной
программирования ПС;
- учета сложности ПС и влияния отладки ПС;
- учета при расчете живучести структурной, временной, алгоритмической,
информационной, программной избыточности, имеющейся в ПС;
рассеивания
технологии
времени
- разработки наиболее рациональных методов обеспечения заданного уровня
живучести ПС ИС.
При исследовании живучести ИС управления и обработки информации предполагаем, что в процессе функционирования в ИС возникают различные виды отказов (сбои, перемежающиеся отказы, ошибки, внезапные отказы), включающие отказы технических и программных средств (ПС, ТС).
Живучесть ИС определяется совместной вероятностью
РИС = РТС (А)х РПС (В1А) , (1)
где Ртс (А) - безусловная вероятность
безотказной работы ТС; Рпс(В/А) - условная
вероятность безотказной работы ПС при условии, что в технических средствах отказ не произошел.
Целесообразно принять допущение о
независимости отказов в технических и программных средствах, т.е.
РИС = РТС (А) Х РПС (В) (2)
Изменение системной возникновении различных происходит случайным различными моделями
функции ИС при видов отказов
образом и описывается применение которых
Надежность и живучесть
ИС
Технические средства ИС
Программ-
мные
средства ИС
Надежность
команд,
подход
свойство
безотказ-
ность
правиль-
ность
элементной базы (МП, данных) интолерантный
показатель свойство
Тотс- средняя отказо-
наработка на устойчи-
отказ в технических вость средствах
Топс- средняя устой-
наработка на чивость
ошибку в
программных средствах
позволяет при расчете живучести ИС вычислять вероятностные характеристики, адекватно
отражающие реальные процессы взаимодействия различных видов отказов.
При выборе показателей живучести ИС для проведения расчетов целесообразно использовать два подхода, которые в настоящее время применяются для создания надежных технических и программных средств ИС.
Живучесть структуры толерантный подход
показатель
Р( t ) - вероятность,
что не произойдет срыва
выполнения задания, из-за
отказов в ТС
Р( t ) - вероятность,
что не произойдет срыва решения
задачи и из-за появления ошибки
в ПС
В первом подходе (интолерантным), который для технических средств называется «безотказность», а для программных средств «правильность» программ, задается показатель То (Тотс, Топс).
Этот показатель характеризует уровень безотказности применяемой элементной базы в технических средствах и уровень создания правильного программного обеспечения. Показатель То зависит от общего количества комплектующих элементов в ТС, от проведенных мероприятий по обеспечению облегченных режимов работы комплектующих элементов и предусматривает тщательную проверку их в различных условиях эксплуатации. В ПС этот показатель зависит от сложности программного обеспечения, от количества функциональных и логических команд, от использованной технологии и языка программирования и от времени отладки ПС.
В ПС повышение значения показателя Топс может быть за счет уменьшения количества и сложности команд совершенствования программирования и методов тестирования, за счет внедрения методов автоматического доказательства правильности программ.
Второй подход называется проектированием ИС «с допуском на сбой» (толерантным), для ТС -«отказоустойчитвость», а для ПС - «устойчивость» программ и задается показателем Р( t ) -
вероятностью успешного выполнения задания или Тс -средней наработкой на отказ, приводящий к срыву выполнения задания. Эти показатели характеризуют отказоустойчивость ТС и устойчивость ПС к различного рода ошибкам, отказам и зависят от различных видов избыточности (информационной, программной, алгоритмической), введенных в ИС и согласованных с механизмами типовых отказов.
По мере увеличения сложности технических и программных средств ИС второй подход становится более перспективным и более экономичным, чем первый. Следует отметить, что универсальность ИС позволяет осуществлять последовательный переход от проектирования специализированных ИС частного применения к ИС более универсального применения, которые имеют большую избыточность, реализующее алгоритмы цифровой фильтрации и имеет большую естественную алгоритмическую избыточность. Все мероприятия по повышению живучести, применяемые в первом подходе, автоматически приводят к повышению показателей второго подхода.
Для оценки живучести ПС ИС построена укрупненная модель, позволяющая учесть основные особенности ПС. Для адекватного отражения в модели реальных процессов отказов ПС предварительно проведен анализ видов и механизмов отказов. На основе анализа приняты следующее определения и допущения, которые позволяют построить инженерную модель прогнозирования живучести ПС ИС:
- программа называется правильной, если она выдает правильные результаты при правильных исходных данных и при отсутствии ошибок в командах и константах;
- программа называется устойчивой, если она выдает правильные результаты при наличии ошибок в исходных данных или в командах, т.е. возникающее ошибки в процессе функционирования нейтрализуются;
- отказ ПС определяется как недопустимое отклонение результатов выполнения задания от заданных в ТУ, по точности, по времени;
- живучесть ПС характеризуется вероятностью безошибочной работы ПС в течение заданного времени, в заданных условиях (т.е. с требуемой точностью и быстродействием), для данной ИС в комплект которой включено ПС;
- для проведения расчетов в качестве основной характеристики живучести ПС используется интенсивность отказов ^ ;
- устранение ошибок, в небольших по объему программных модулях ИС, происходит без внесения новых ошибок, т.е. считаем, что интенсивность ошибок ПС является не возрастающей функцией;
- проведение полного и тщательного анализа типа отказа и его влияния на ПС не реально из-за множества логических путей, поэтому проверка ПС в ИС проводится выборочно. Адекватное отражение реальных условий работы можно получить при тестировании наиболее вероятного множества входных данных, которое охватывает наиболее вероятные ветви алгоритма и наиболее сложные и вероятные сочетания условных переходов.
Точное определение вида закона распределения времени безотказной работы ПС ИС на практике получить очень трудно. Попытки описать время безотказной работы ПС двух- или трехпараметрическим законом распределения успехов не имели, так как точность увеличивалась незначительно, а сложность вычислений из-за сложности определения дополнительных параметров увеличилась в несколько раз.
Обработка множества гистограмм показывает хорошее совпадение экспериментальных данных с теоретическими кривыми экспоненциального закона. Отклонения, которые наблюдаются в некоторых гистограммах на начальном участке, объясняются растягиванием сроков ввода и начала обработки информации по отказам у различных пользователей. Некоторые разработчики из-за большого потока ошибок на начальном этапе не успевают их анализировать и поэтому снижают интенсивность отработки ПС .
Время функционирования ПС не влияет на остаточное время жизни ПС (так как в ПС не происходят процессы, вызывающие износ и старение, а этим свойством обладает только экспоненциальное распределение), то логично принять этот закон для описания безотказности, при котором мы получаем оценку снизу. Отметим основные особенности ПС ИС:
- использование в системах управления и обработки информации, работающих в реальном масштабе времени (т.е. с ограничением по быстродействию);
- использование для программирования технологий и языков разного уровня;
- создание программ ограниченного обмена и сложности с разделением на небольшие модули с более
простой структурой взаимосвязей, чем в суперЭВМ;
- большие трудности при использовании различных видов избыточности для повышения живучести ПС;
- различные последствия при возникновении ошибок:
а) средние (45%) и незначительные (ЗО%) последствия при ошибках в данных, которые искажают данные, точность вычислений (т.е. ухудшают характеристики ИС), эти ошибки обнаруживаются и исправляются при циклической обработке;
б) катастрофические (5%) и серьезные (20%) последствия при ошибках в командах, в последовательности передачи управления, которые приводят к искажению программы и срыву решения задачи.
Рассмотрим функциональную зависимость, называемую моделью прогнозирования живучести ПС ИС, позволяющую учесть влияние различных компонентов ненадежности на живучесть ПС, данная модель должна соответствовать определениям и предположениям, которые приняты выше.
При оценке живучести ПС используется комплексный подход, при котором применяются несколько вложенных моделей, параметры которых уточняются по мере накопления информации.
Интенсивность ошибок ПС ИС определяется по формуле:
ЯПС(г)“(ЯУПС +^НПСХ КТПі X КЯПі X КМПХ КПР X ехр (-а xt))x КПИ , (3)
где т - фактическое время отладки ПС в часах; Янпс, - начальное значение интенсивности ошибок
ПС, равное разности фактического (начального) значения Янпс , соответствующего начальному этапу отладки при т = 0 и установившегося Яупс значения, при т = ю ; Ктпі - коэффициент, учитывающий влияние i-й технологии программирования на процесс разработки и отладки ПС; Кяпі - коэффициент, учитывающий влияние i-ого языка программирования на процесс разработки и отладки ПС; Кмп -коэффициент, учитывающий различие в сложности проектирования ПС для ИС, выполненных на однокристальных и секционных МП; Кпи - коэффициент, учитывающий степень использования стандартного программного обеспечения МП ( эквивалентен коэффициенту электрической нагрузки в технических средствах); КПР коэффициент производительности, учитывающий наличие информационной
избыточности на уровне элементного состава для ПС, который равен отношению фактически используемой тактовой частоты к допустимой по ТУ тактовой частоте, (в отличие от ТС, где режимная избыточность на уровне элементного состава учитывается через коэффициент нагрузки и температурный); а - коэффициент, характеризующей скорость роста живучести ПС при отладке, зависит от типа МП и применяемой технологии и языка программирования.
Установившееся значение интенсивности ошибок ПС ИС определяется остаточными ошибками, которые находятся в редко встречающихся комбинациях передачи управления между ветвями или в редко встречающихся комбинациях данных и констант. Кроме того, учитывает вносимые ошибки, которые возникают по мере изменения характеристик ПС, при введении новых инструкций в процессе совершенствования ПС, после окончаний этапа отладки. Во время этапа отладки введение новых инструкций, направленных на совершенствование ПС не допускается.
Численное значение зависит от вида программы и от уровня живучести, который необходимо
обеспечить, исходя из требований на ИС в целом при эксплуатации. Анализ данных показывает, что Лшс зависит от сложности ПС (общего количества команд) и отличается от Янпс более чем в 100
раз, кроме того имеется нижний уровень для ЯуПс, который соответствует для ПС ИС не более 0,0005 1/ч.