Научная статья на тему 'Модель надежности дисковых массивов RAID-5 с одинарной избыточностью'

Модель надежности дисковых массивов RAID-5 с одинарной избыточностью Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
131
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИЗБЫТОЧНЫЙ ДИСКОВЫЙ МАССИВ / СРЕДНЕЕ ВРЕМЯ НАРАБОТКИ ДО ОТКАЗА / ЦЕПЬ МАРКОВА / REDUNDANT DISK ARRAY / MEAN TIME TO FAILURE / MARKOV CHAIN

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рахман П.А.

Рассматриваются марковская модель надежности дисковых массивов с одинарной избыточностью, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модель надежности дисковых массивов RAID-5 с одинарной избыточностью»

Рахман П.А. ©

К.т.н., доцент кафедры автоматизированных технологических и информационных систем, Уфимский государственный нефтяной технический университет, филиал в г. Стерлитамаке

МОДЕЛЬ НАДЕЖНОСТИ ДИСКОВЫХ МАССИВОВ RAID-5 С ОДИНАРНОЙ ИЗБЫТОЧНОСТЬЮ

Аннотация

Рассматриваются марковская модель надежности дисковых массивов с одинарной избыточностью, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

Ключевые слова: избыточный дисковый массив, среднее время наработки до отказа, цепь Маркова.

Keywords: redundant disk array, mean time to failure, Markov chain.

В последние три десятилетия наблюдается бурное развитие информационных технологий и их внедрение в самые различные сферы деятельности человека, и информация, представленная в электронном виде, стала ключевой частью жизни и работы не только организаций, но и каждого отдельного человека. Более того, сохранность и доступность информации для ее пользователей, как правило, имеет критическую важность, а потеря данных нередко может приводить к катастрофическим последствиям.

В такой ситуации анализ показателей надежности систем [1, 2], в частности дисковых массивов, имеет достаточно высокую актуальность, особенно для предприятий среднего и крупного масштабов, поскольку такой анализ также позволяет косвенно оценивать риски потери данных и принимать соответствующие управленческие решения, и при необходимости внедрять дополнительные технические средства защиты информации.

В рамках научной деятельности [3-8] автором исследовались показатели надежности современных систем передачи, обработки и хранения данных, в частности показатели надежности избыточных дисковых массивов с чередованием данных RATD-5. В результате была выведена формула для оценки среднего время наработки до отказа дискового массива RATD-5.

Массив RATD-5 состоит из n > 3 независимых дисков одинаковой емкости и сохраняет работоспособность при отказе не более одного (любого) диска. Массив RATD-5 является компромиссом между отказоустойчивостью и избыточностью. На каждом из дисков 1 / n часть дискового пространства отводится для хранения избыточной (контрольной) информации, вычисляемой по пользовательским данным, хранящимся на других дисках. Это позволяет в случае отказа любого одного из дисков вычислять недостающую информацию по пользовательским данным и контрольной информации, хранящимся на оставшихся дисках.

При отказе любых двух дисков, равно как и при отказе любого второго диска до того, как произойдет замена и полное восстановление ранее отказавшего другого диска, все пользовательские данные всего массива теряются. Полезная емкость массива составляет (n -1) / n часть от суммарной емкости дисков.

Перейдем теперь к рассмотрению марковской модели надежности дискового массива RATD-5.

Массив RATD-5 может находиться в одном из трех состояний:

• Состояние 0 - все диски исправны, массив работоспособен и пользовательские данные доступны.

© Рахман П.А., 2015 г.

• Состояние 1 - один из дисков неисправен, ожидает замены и завершения репликация данных после замены, массив работоспособен за счет оставшихся n - 1 дисков, пользовательские данные доступны.

• Состояние 2 - массив неработоспособен и пользовательские данные недоступны.

Интенсивность отказов дисков X. Диски могут отказывать независимо друг от друга.

Кроме того, пусть при отказе одного диска, помимо базовой интенсивности отказов становится существенной интенсивность ошибок чтения S диска, поскольку для расчета «недостающей» информации требуются чтение данных со всех оставшихся n - 1 дисков.

Интенсивность регенерация информации (процедура rebuild) на замененном диске за счет избыточных данных составляет p. Будем считать, что время замены отказавшего диска

несущественно по сравнению со временем регенерации информации за счет использования технологии автоматической горячей замены дисков (hot-spare).

Кроме того, пусть в системе возможны критические виды ошибок контроллера дискового массива, которые переводят систему из любого работоспособного состояния напрямую в неработоспособное состояние. Интенсивность критических ошибок контроллера

О. Более того, при отказе одного диска, на контроллер ложится дополнительная нагрузка в силу необходимости расчета недостающей информации и регенерации данных на замененных дисках, и к базовой интенсивности ошибок добавляется дополнительная интенсивность 5.

Тогда с учетом всего вышесказанного модель надежности избыточного дискового массива RATD-5 выглядит следующим образом (рис. 1):

Рис. 1. Граф состояний модели надежности дискового массива RAID-5.

Соответственно, система дифференциальных уравнений Колмогорова-Чепмена для этой цепи выглядит следующим образом:

P0(0) - 1; P(0) = 0; P2(0) - 0;

P0(t) + P1(t) + P2(t) - 1; dp0(t)

dP1(t)

dt

-(nX + o) P0(t) + pP(t);

1W - nXP0(t) - (p + (n - 1)(X + s) + o + 5)P(t);

dt dP2(t) dt

oP0(t) + ((n - 1)(X + s) + o + 5) P (t).

(1)

Где, X - интенсивность отказов дисков, s - добавочная интенсивность ошибок в режиме чтения данных для восстановления информации на замененных дисках, p -интенсивность восстановления дисков, n - общее количество дисков, о - интенсивность ошибок контроллера дискового массива, 5 - дополнительная интенсивность ошибок контроллера при регенерации данных после замены отказавшего диска.

Учитывая, что состояние 0 является начальным, а состояние 2 - финальным неработоспособным, при которых теряются все данные, автором была выведена расчетная

формула для оценки среднего времени наработки до отказа массива RATD-5 с потерей всех

данных T = |(P0(t) + Pl(t))dt:

0

T = M + (2n — 1)k + (n — 1)s+ о + 8 (2)

pa + (nk + o)((n — 1)(k + s)+ о + 8)

В частности, для массива RATD-5 состоящего из n = 6 дисков, интенсивностью отказов дисков k = 1/120000 час-1, добавочной интенсивностью ошибок чтения данных s = 1/300 час-1, интенсивностью восстановления p = 1/24 час-1, интенсивностью критических ошибок контроллера о = 1/1200000 час-1 и дополнительная интенсивность ошибок контроллера 8 = 1/1200000 час-1 была получена следующая оценка средней наработки до потери данных:

T = 66082 часа.

Полученные автором теоретические результаты использовались в многолетней практике проектирования и эксплуатации систем хранения, обработки и передачи данных НИУ МЭИ (ТУ), Балаковской АЭС, ОАО «Красный Пролетарий» и ряда других предприятий.

Литература

1. Черкесов Г. Н. Надежность аппаратно-программных комплексов. - СПб.: Питер, 2005.

2. Половко А. М., Гуров С. В. Основы теории надежности. 2-е изд. - СПб.: БХВ-Петербург, 2006.

3. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности избыточных дисковых массивов // Вестник УГАТУ: научный журнал УГАТУ, 2013. - Т. 17 - № 2 (55) - С. 163-170.

4. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ: научный журнал УГАТУ, 2013. - Т. 17 - № 5 (58) - С. 140-149.

5. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности двухуровневых магистральных сетей // Вестник УГАТУ: научный журнал УГАТУ, 2014. - Т. 18 - № 2 (63) - С. 197-207.

6. Рахман П.А., Каяшев А.И., Шарипов М.И. Модель надежности отказоустойчивой пограничной маршрутизации с двумя Интернет-провайдерами // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 131-139.

7. Рахман П.А., Каяшев А.И., Шарипов М.И. Марковская цепь гибели размножения в моделях надежности технических систем // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 140-154.

8. Рахман П.А., Каяшев А.И., Шарипов М.И. Модель надежности отказоустойчивых систем хранения данных // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 155166.

i Надоели баннеры? Вы всегда можете отключить рекламу.