Научная статья на тему 'Факторы надежности информационных систем высокой готовности'

Факторы надежности информационных систем высокой готовности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
608
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕР / CLUSTER / FAILOVER / ВЫСОКАЯ ГОТОВНОСТЬ / HIGH AVAILABILITY / ОБРАБОТКА ДАННЫХ / DATA PROCESSING / КОМПЬЮТЕР / COMPUTER / СЕРВЕР / SERVER / СЛУЖБА / SERVICE / COMPUTER SYSTEMS / ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / SOFTWARE / АППАРАТНЫЕ СРЕДСТВА / HARDWARE / ИНФОРМАЦИОННАЯ СИСТЕМА / INFORMATION SYSTEMS / ОТКАЗОУСТОЙЧИВОСТЬ / ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ / НАДЕЖНОСТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Потресов Дмитрий Кириллович, Скоморохов Данил Владимирович

СТЕМ ВЫСОКОЙ ГОТОВНОСТИ Рассмотрен анализ факторов, влияющих на надежность информационных систем высокой готовности. Принципы организации информационных систем. Глобальные факторы, влияющие на эффективность функционирования системы и сохранность данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE FACTORS RELI-ABILITY OF INFORMATION SYSTEMS HIGH AVAILABIL-ITY

Considered analysis factors influencing the reliability of the information systems of high availability. Principles of organization of information systems. Global factors influencing the efficiency of the system and data integrity.

Текст научной работы на тему «Факторы надежности информационных систем высокой готовности»

© Д.К. Потресов, Д.В. Скоморохов, 2013

УДК 004.052; 004.056

Д.К. Потресов, Д.В. Скоморохов

ФАКТОРЫ НАДЕЖНОСТИ ИНФОРМАЦИОННЫХ СИСТЕМ ВЫСОКОЙ ГОТОВНОСТИ

Рассмотрен анализ факторов, влияющих на надежность информационных систем высокой готовности. Принципы организации информационных систем. Глобальные факторы, влияющие на эффективность функционирования системы и сохранность данных.

Ключевые слова: кластер, отказоустойчивость, высокая готовность, обработка данных, компьютер, сервер, служба, вычислительные системы, программное обеспечение, аппаратные средства, информационная система, надежность.

Надежность является одной из важнейших характеристик качества объекта совокупности свойств, определяющих пригодность его использования по назначению. Но в отличие от точечных характеристик качества (быстродействие, производительность и т.д., которые измеряются для некоторого момента времени), надежность характеризует зависимость точечных характеристик качества либо от времени использования, либо от наработки объекта, т.е. надежность - характеристика временная.

Сторонами надежности являются:

1. Безотказность - свойство объекта непрерывно сохранять работоспособность в течение некоторого времени или некоторой наработки. Наработка - время работы объекта до первого отказа.

2. Ремонтопригодность - свойство объекта, заключающееся в приспособленности его к предупреждению и обнаружению отказов и восстановлению работоспособности объекта либо путем проведения ремонта, либо путем замены отказавших элементов.

3. Долговечность - свойство объекта сохранять работоспособность до наступления предельного состояния при установленном режиме технического обслуживания и ремонта.

4. Сохраняемость - свойство объекта сохранять работоспособность в течение и после его хранения и (или) транспортирования.

5. Работоспособность - такое состояние объекта, при котором он способен выполнять заданные функции, удовлетворяя требованиям нормативно-технической документации. Работоспособность - это характеристика состояния объекта в некоторый момент времени.

Для оценки надежности ИС находят применение дополнительные стороны надежности:

1. Живучесть - свойство объекта или системы сохранять работоспособность (полностью или частично) в условиях неблагоприятных воздействий, не предусмотренных нормативными условиями эксплуатации.

2. Сбой - кратковременное нарушение работоспособности системы, после которого работоспособность восстанавливается оператором без проведения ремонта или самовосстанавливается.

3. Ошибка - проявление сбоя или отказа компонента ИС.

4. Достоверность информации - свойство системы выдавать достоверную информацию при возникновении в ней сбоев.

5. Отказоустойчивость - свойство системы продолжать выполнение заданных функций после возникновения одного или нескольких сбоев или отказов отдельных элементов.

6. Конфигурация - совокупность и способ взаимодействия программных и аппаратных средств системы, направленных на выполнение рабочего задания.

7. Реконфигурация - изменение состава и способа взаимодействия программных и аппаратных средств системы с целью исключения отказавших элементов.

8. Ремонт - восстановление работоспособности системы с помощью специалистов.

9. Избыточность - дополнительные программные и аппаратные средства, возможности алгоритма для выполнения дополнительных функций, предназначенных для повышения надежности ИС. Алгоритмическая избыточность - способность обеспечить правильный результат, несмотря на возможные отдельные ошибки в ходе вычислений. Информационная избыточность - некоторое повторение информации в той или иной форме, позволяющее восстанавливать исходные данные в случае каких-либо нарушений в работе систе-

мы. Характерным способом введения избыточности является резервирование - использование дополнительных средств и возможностей с целью сохранения работоспособности системы при отказе одного или нескольких ее элементов. Различают статическую и динамическую избыточность. Статическая избыточность реализуется автоматически сразу после возникновения отказа: система построена так, что после отказа ее ненарушенная часть позволяет продолжить выполнение задания. Динамическая избыточность реализуется только после некоторой перестройки работы системы, получившей сигнал об отказе от устройства контроля.

10. Отказ - событие, заключающееся в том, что система полностью или частично теряет свойство работоспособности.

Выделяется два основных принципа организации информационных систем:

1. Комплексный подход к построению системы, охватывающий как применение специальных аппаратных и программных средств, так и проведение организационно-режимных мероприятий.

2. Высокие требования к квалификации обслуживающего персонала.

Глобальными факторами, влияющими на эффективность функционирования системы и сохранность данных, являются: случайный отказ или разрушение ее отдельных компонентов и несанкционированный доступ к системе. Поскольку первые два фактора не связаны с прямой атакой на содержимое информационной системы, их можно объединить термином «внезапный отказ».

Внезапные отказы могут быть вызваны неисправностями оборудования, сбоями в работе программного обеспечения (ПО), ошибками обслуживающего персонала, а также внешними воздействиями - природными (землетрясения, ураганы, наводнения и т.п.), техногенными (пожары, перебои с энергоснабжением, прорывы водопровода и канализации и т. п.) и социальными (террористические акты, беспорядки, военные действия и т.д.).

На надежности систем отрицательно сказываются и наличие большого количества устройств, собранных из комплектующих низкого качества, и нередкое использование нели-

цензионного ПО. Аппаратное и программное обеспечение зачастую не отвечает требованиям совместимости, а «прописанная» в соответствующих файлах конфигурация систем — имеющимся аппаратным ресурсам. Виной тому может стать недостаточная компьютерная грамотность ответственных за поддержание компьютерной системы сотрудников. Обобщая, можно сказать, что чрезмерная экономия средств (на обучение персонала, закупку лицензионного ПО и качественного оборудования) приводит к уменьшению времени безотказной работы и значительным затратам на последующее восстановление системы.

В комплекс мероприятий по защите информационной системы от внезапных отказов специалисты компаний, занимающихся системной интеграцией, включают целый ряд действий, направленных на предотвращение внештатной ситуации.

Выбор надежного оборудования и ПО позволяет до определенной степени предотвратить сбой информационной системы. Однако встречаются и неподвластные системному администратору ситуации, влекущие за собой уничтожение информационной системы или какой-либо ее части. Поэтому задача руководства компании — заранее определить ряд мероприятий, составляющих план восстановления бизнеса после катастрофы, которые позволяют свести к минимуму потери информации и время простоя системы.

По существу, восстановление бизнеса после катастроф представляет собой форму страховки. Основу мероприятий, повышающих стойкость системы к событиям подобного рода, составляют различные формы резервирования и мультиплексирования оборудования и коммуникаций, принадлежащих к информационной системе.

Уровень защищенности ИС от различного рода угроз, приводящих к утрате данных и полному или частичному прекращению ее работы, зависит от степени важности ИС для функционирования предприятия. Затраты на повышение надежности должны быть адекватны прогнозируемым убыткам.

Основные причины возникновения отказов в работе ИС приведены на рис. 1.

На надежность ИС оказывают влияние разнообразные факторы. Эта особенность требует проведения испытаний, позволяющих выявить их влияние в различных режимах использова-

Рис. 1. Причины возникновения отказов в работе ИС: 1 - проблемы с электроснабжением —16 %; 2 - сбой аппаратных средств —13 %; 3 - сбой программных средств — 8 %; 4 - сетевые проблемы — 4 %; 5 - нарушение условий: кондиционирование, вентиляция, отопление — 1 %; 6 - пожар, наводнение, землетрясение, ураган, бомбовая атака, буран, заражение, прорыв канализации, вынужденная эвакуация, забастовка, вынужденное перемещение — 58 %

ния системы. Каждая большая система требует разработки своей методики испытаний, отражающей ее особенности.

Заключение

Обеспечение непрерывности работы информационных систем - одна из очевидных и наиболее сложных задач создания ИТ-инфраструктуры.

Надежность корпоративных компьютерных систем обработки данных, их способность ежесекундно обеспечивать пользователей оперативной и достоверной информацией -одно из важнейших условий эффективной работы и, в конечном счете, конкурентоспособности современных компаний. Сегодня существует множество технических решений, обеспечивающих необходимый уровень надежности и отказоустойчивости информационных систем, и один из краеугольных камней таких решений - кластеризация серверных систем, за счет которой поддерживается высокий уровень готовности и защищенности от различного вида угроз.

СПИСОК ЛИТЕРАТУРЫ

1. Авен О.И., Гурнн H.H., Коган Я.А. Оценка качества и оптимизация вычислительных систем. М.: Наука, 1982. - 464 с.

2. Будзко В. И. Количественные оценки отказоустойчивых и катастрофоустойчивых решений. Вопросы защиты информации: Науч.-пракг. журн./ ФГУП «ВИМИ», 2003. Вып. 2. - С. 19-32.15.

3.Беленков В.Г., Будзко В.И., Синицин И.Н. Катастрофоустойчивость корпоративных автоматизированных систем /Системы и средства информатики /Под ред. И.А. Соколова/Вып. 12. - М.: Наука, 2002. 314 с. - С. 41-47.

4. Альянах И.Н. Моделирование вычислительных систем. JL: Машиностроение, 1988. - 223 с. ГТТГГЗ

КОРОТКО ОБ АВТОРАХ -

Потресов Дмитрий Кириллович - профессор, доктор технических наук; Скоморохов Данил Владимирович - студент магистратуры Московский государственный горный университет, ud@msmu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.