Уфа: УГАТУ, 2013 УДК 621.317
Т. 17, № 2 (55). С. 163-170
Анализ показателей надежности избыточных дисковых массивов
А. И. Каяшев1, П. А. Рахман2, М. И. Шарипов3
1 2 3 Филиал ФГБОУ ВПО «Уфимский государственный нефтяной технический университет» (УГНТУ)
в г. Стерлитамаке
Поступило в редакцию 10.11.2012
Аннотация. Рассматриваются современные избыточные дисковые массивы, обеспечивающих отказоустойчивое хранение данных, а также модели надежности восстанавливаемых систем с выводом упрощенных формул для расчета среднего времени наработки до разрушения дискового массива с потерей данных с учетом специфики отказов и восстановления информации на отдельных дисках в массиве.
Ключевые слова. Дисковые массивы; надежность; RAID; MTTDL
ВВЕДЕНИЕ
В последние три десятилетия наблюдается бурное развитие информационных технологий и их внедрение в самые различные сферы деятельности человека, и информация, представленная в электронном виде, стала ключевой частью жизни и работы не только организаций, но и каждого отдельного человека. Более того, сохранность и доступность информации для ее пользователей, как правило, имеет критическую важность, а потеря данных нередко может приводить к катастрофическим последствиям. В связи с этим на протяжении нескольких десятилетий учеными и специалистами разрабатываются самые разнообразные технические средства и организационные подходы по обеспечению надежного хранения данных при высокой доступности для санкционированных пользователей. В такой ситуации анализ показателей надежности дисковых массивов имеет достаточно высокую актуальность, особенно для предприятий среднего и крупного масштабов, поскольку такой анализ также позволяет косвенно оценивать риски потери данных и принимать соответствующие управленческие решения, и при необходимости внедрять дополнительные технические средства защиты информации.
Современная теория надежности [1, 2] в основном базируется на математическом аппарате теории вероятностей [3] и дополнительно на множестве других разделов математики. Здесь следует отметить, что в отечественной литературе по теории надежности достаточно глубоко рассматриваются теоретические аспек-
ты, однако, примеры и задачи, приводимые в них, как правило, очень далеки от технологий и средств, используемых в современных системах хранения данных. В такой ситуации возникает глубокий научный и академический «пробел» между теоретическими моделями и современными информационными технологиями, что в конечном итоге приводит к фактическому игнорированию теоретических аспектов надежности современными специалистами по проектированию и эксплуатации систем хранения данных, вынуждая их в основном полагаться на практический опыт и интуицию. За рубежом, в частности в США, ситуация обстоит лучше: на протяжении последних двух десятилетий проведено множество исследований, опубликован ряд статей и диссертаций [4-7], посвященных моделям надежности избыточных дисковых массивов.
В рамках данной статьи не ставилась цель изложить и интерпретировать результаты западных исследований по рассматриваемому вопросу. Вместо этого сделана попытка «увязывания» теории и практики касательно задачи анализа показателей надежности дисковых массивов, на основе многолетнего изучения теоретических моделей и многолетней практики проектирования и эксплуатации дисковых систем. Следует отметить, что в рамках небольшого исследования невозможно было всесторонне охватить рассматриваемый вопрос, и поэтому авторы сосредоточились только на оценке наиболее важного показателя надежности - среднего времени наработки до разрушения (безвоз-
вратной частичной или полной потери данных). В западной литературе такой показатель обозначается как MTTDL (Mean Time To Data Loss - среднее время до потери данных).
1. ОПИСАНИЕ МОДЕЛИ
НАДЕЖНОСТИ ДИСКОВЫХ СИСТЕМ
В основе предлагаемой модели лежит аппарат цепей Маркова и метод Колмогорова-Чепмена [6, 7] для составления системы дифференциальных уравнений и расчета вероятностей всех состояний системы. Каждое состояние отражает конкретное количество дисков, находящихся в ожидании замены или в процессе восстановления информации после замены: состояние «0» означает, что все диски работают, «1» означает, что вышел из строя один из дисков, причем какой именно - не имеет значения. Из всех состояний, кроме последнего состояния «s», возможно восстановление без какой-либо потери данных. Состояние «s» является финальным и его наступление означает безвозвратную потерю части или всех данных, при котором дисковый массив теряет смысл своего существования. Само число s будем называть порогом разрушения, причем 1 < s < п, где п -количество дисков в массиве.
Дисковая система содержит в себе множество из n независимых, самостоятельно невос-станавливаемых дисков с точки зрения сохранности данных: под отказом отдельно взятого диска понимается такой отказ, который обязательно влечет частичную или полную потерю данных на нем, и потерянные данные могут быть восстановлены только благодаря избыточной информации, хранящейся на остальных дисках, при помощи соответствующего RAID-контроллера, после замены или ремонта отказавшего диска. Соответственно, в качестве среднего времени наработки до разрушения для отдельно взятого диска принимается средняя наработка до первого отказа самого диска, приводящего к частичной или полной потере данных на нем. Диски независимы по отказам. Время отказа рассматривается как случайная величина, распределенная по экспоненциальному закону. Интенсивность отказов обозначается как к.
Однако практический опыт показывает, что хотя интенсивности отказов самих дисков неизменны, в то же время наблюдается следующее явление. В массиве, состоящем из n дисков, интенсивность перехода от состояния «0» к состоянию «1», в полном согласии с теорией на-
дежности, равна пк. Что же касается интенсивностей переходов в последующие состояния «2», «3» и т. п., на практике они нередко оказываются значительно выше, чем теоретические оценки (п - 1)к, (п - 2)к и т. п. То есть отказ даже одного диска нередко приводит к некоторой деградации дисковой системы, и дальнейшая деградация вплоть до полного разрушения происходит значительно быстрее теоретических оценок. Связано это с повышением вычислительной и обменной нагрузки на RAID-контроллер в «деградированном режиме», когда ему «на лету» необходимо вычислять недостающие данные и, кроме того, параллельно восстанавливать информацию на замененный диск. Для учета этого явления вводится так называемая добавочная интенсивность ошибок, обозначаемая s.
В целом дисковая система благодаря наличию специализированного RAID-контроллера, а также из допущения, что вышедшие из строя диски заменяются вручную специалистом по эксплуатации или автоматически при помощи технологии «горячего резерва», считается восстанавливаемой системой. Под временем восстановления по отдельно взятому диску понимается совокупное время, требуемое на замену вышедшего из строя диска и последующего процесса пересчета информации (rebuild), выполняемого RAID-контроллером. Для простоты время восстановления также считается случайной величиной, распределенной по экспоненциальному закону. Интенсивность восстановления обозначается как ц. С точки зрения восстановления диски имеют ограничение - одновременно могут восстанавливаться не более r дисков. При r = п диски оказываются независимыми с точки зрения восстановления.
Теперь перейдем непосредственно к математическим моделям и примерам расчета среднего времени наработки до разрушения для дисковых массивов RAID-0, 5, 6 и 1.
2. МАРКОВСКИЕ МОДЕЛИ НАДЕЖНОСТИ ДИСКОВЫХ МАССИВОВ
Марковская модель надежности ^восстанавливаемого диска (рис. 1).
К
Рис. 1. Граф состояний для невосстанавливаемого диска
Р(0) = 1; Р(0) = 0; Р(л) + Р(л) = 1;
dPo(t) Сл
СР() Сл
-1л.
= -1Р(л); = 1Р)(Л).
Вероятность отказа диска равна вероятности состояния «1» модели:
Яш «) = ) = 1 - е .
Среднее время наработки до отказа невос-станавливаемого диска:
Т
71
сд(л)
—Сл = —.
Сл 1
(1)
Марковская модель надежности ^восстанавливаемого дискового массива ЯАГО-О
(п > 2) (рис. 2).
п-Л
0
Рис. 2. Граф состояний для невосстанавливаемого дискового массива КАГО-0
Р(0) = 1; Р1(0) = 0; Р,(л) + Р(л) = 1;
сР,(л) Сл
СРХ(Л) Сл
= -и1Р,(л);
= п1Р0(Л).
) Р(л) = ^ ІР(Л) = 1 - е-
Вероятность отказа дискового массива КАГО-0 равна вероятности состояния «1» модели:
) = 1 - е-П%‘.
Среднее время наработки до отказа невос-станавливаемого дискового массива ЯАТБ-О:
Т
С2(л)
1
' Сл =—.
Сл п1
(2)
Общая модель отказоустойчивой системы из п >2 элементов с порогом разрушения
* < п (рис. 3).
Система дифференциальных уравнений Колмогорова-Чепмена для марковской модели:
р(0) = 1; Р(0) = о ... Р(0) = 0;
Р0(~) = 0 ... Р_!(¥) = 0; Р (¥) = 1;
Р0^) + т) +... + Р (() = 1;
= -10 Рй(<) + тР(^);
ш
^ = 10 Р а) - (т +1,) Р (() + т 2 Р«);
ш
ШР2(^)
= 11Р1 () - (т2 + 12 )Р2 (л) + тзР3 (л);
= 15-2 Р*-2 (л) - (т 5-, +15-,) Р-1 (л);
= 1 *-1Р-1(л);
^-2^ 5-2 '
СР5 (л)
({) = Р({); 2 £ 5 £ «.
Среднее время наработки до разрушения
отказоустойчивой системы определяется по выведенной авторами формуле:
Т = [
СР, (л)
( і (і 5-\-к(
= У У гП
к=0 д=0 Л-
V V д
■=1
1 + ■
V «+■ уу
(3)
Частный случай. Невосстанавливаемая система "у = 1.5 -1: ту- = 0 :
Т = У
д=0
_1_
\Лду
Модель отказоустойчивого дискового массива (ЯАГО) из п >2 дисков с порогом разрушения 2 < * < п, возможностью одновременного восстановления г > 0, интенсивностью отказов дисков X, интенсивностью восстановления ц, и добавочной интенсивностью ошибок в процессе восстановления 8 (рис. 4).
0
0
пкл.
0
М1 М2 Мз Мэ-1
Рис. 3. Граф состояний для отказоустойчивой системы из п элементов с порогом разрушения 5
п-Л (п — 1 )-(Л + е) (п-2)-(Л + £) (п-э+2)-(Л + е) (п-з+1)-(Л + е)
еоззго
М'гтпп(г,1) мт1п(г,2) м-гтпп(г,3) м-тт(г,з-1)
Рис. 4. Граф состояний для отказоустойчивого дискового массива с порогом разрушения 5
Система дифференциальных уравнений Колмогорова-Чепмена для марковской модели:
Р)(0) = 1; Р(0) = 0; ... Р (0) = 0;
Р(«) = 0 ... Р^Ю = 0; Р («) = 1;
Р(() + т + ... + Р, (() = 1;
ШР(()
ШР(()
= -п1Р0 (() + т шт(г,1) Р ((); = п1Р0(() - (т шт(г ,1) +
+ (п -1)(1 + е))Р (() + т • шт(г ,2)Р2 ((); = (п - 1)(1 + е) Р(() - (т шт(г ,2) +
ШР2(()
+ (п - 2)(1 + е)) Р2 (() + т шт(г ,3)Р3 (();
ШР-А) ‘
= (п - 5 + 2)(1 + е)Р-2(() -ш
- (т шт(г, 5 -1) + (п - 5 +1)(1 + е)) Р5-1 ((); = (п - 5 + 1)(1 + е)Р-^);
Яеаю (() = р((); 2 £ 5 £ п; г > 0.
Среднее время наработки до разрушения
отказоустойчивого дискового массива НАГО вычисляется по формуле, выведенной как частный случай общей формулы при 10 = п ■ X, 1 = (п - /) ■ (1 + е); I = 1...5-1 и ц = ц ■ шт(г, /); I = = 1.5-1:
( т5-1-к
т = У
КАЮ
Л
-X
к
X У
д=0
-гт ( шт(г, д + у)
у=1 I п - Ч - У
(п - д)(1 + е • шт(1, д))
(4)
//
Частный случай. Невосстанавливаемая система ц = 0 и е = 0:
1 1
т = — У---------
ЛЕАЮ л /_1 ■
1 ч=0 п - д
Модель отказоустойчивого дискового массива КАГО-5 (п > 3) с порогом разрушения
* = 2, возможностью одновременного восстановления г > 0, интенсивностью отказов дисков X, интенсивностью восстановления ц, и добавочной интенсивностью ошибок в процессе восстановления 8 (рис. 5).
п-Л (п-1)-(Л + е)
ртт(г,1)
Рис. 5. Граф состояний для отказоустойчивого дискового массива КАГО-5
Р(0) = 1; Р(0) = 0; Р2(0) = 0; ^(() + р(( ) + р(() = 1;
Шр(()
= —п1р (() + т шт(г,1) • Р ((); к
Шр (() = п1Р0 (() - (т шт(г,1) +
+(п - 1)(1 + е))р(();
= (п - 1)(1 + е) Р(();
ШР2(()
якаю5(() = Р2((); п >3; г >0.
Для отказоустойчивого массива КАГО-5 можно вывести аналитическую формулу для расчета вероятности разрушения:
'""„2 02-
Якаш,(() = Р2(() = 1 -е_“(оЬ(^а2 -Ь2) +
~т==т§Ь(^а 2 -р2));
л/а2 - р2
+
а = — (т шт(г ,1) + (2п -1)1 + (п - 1)е);
Р = >/1(1 + е)п(п -1) ; а>р.
к=0
п-Л (п - 1 )-(Л + е) (п - 2)-(Л + е)
М-птп(г,1) мггмп(г,2)
Рис. 6. Граф состояний для отказоустойчивого дискового массива КЛГО-6
Среднее время наработки до разрушения отказоустойчивого массива RAID-5 определяется по формуле, получаемой из общей формулы для RAID-массивов при s = 2:
T _m min(r,1) + (2n -1)1 + (n - 1)e (5)
TRAID5 _ л ' 7 7 77 . (5)
1(1 + e)n(n -1)
Частный случай 1. Однодисковое и безошибочное восстановление r = 1 и s = 0:
T m+(2n -1)1
TRAID5 _ ,2 , .
1 n(n -1)
Частный случай 2. Невосстанавливаемая система ц = 0 и s = 0:
T _ 2n -1 RAID5 _ 1n(n -1).
Модель отказоустойчивого дискового массива RAID-6 (n > 4) с порогом разрушения s = 3, возможностью одновременного восстановления r > 0, интенсивностью отказов дисков 1, интенсивностью восстановления ц, и добавочной интенсивностью ошибок в процессе восстановления s (рис. 6).
fP(0) _ 1; P(0) _ 0; р(0) _ 0; Р(0) _ 0;
P0(t)+P(t) + P(t) + P(t) _ 1;
dPo(t)
= -nlP0 (t) + m min(r ,1) P (t);
dP (t) = nlP0 (t) - (m min(r,1) +
dt
+ (n -1)(1 + e))P (t) + m min(r ,2)P2 (t)
dMl = (n - 1)(1 + e) P(t) -
dt
- (m min(r,2) + (n - 2)(1 + e))P2 (t); ^ = (n - 2)(1 + e)P2(t);
Среднее время наработки до разрушения отказоустойчивого массива ЯАГО-б определяется по формуле, получаемой из общей формулы для ИЛГО-массивов при * = 3:
1
T
-L D .
x
1(1 + e) n(n - 1)(n - 2)
X (m2 min(r,1) min(r,2) + m((1 + e) X X (n - 2) min(r,1) + 1n min(r,2)) +
+ (1 + e)((1 + e)(n2 - Зп + 2)
+ 1(2n2 - Зп))).
(б)
Частный случай 1. Однодисковое и безошибочное восстановление г = 1 и е = 0:
ТкАЮ6 = 13п(п -1)(п - 2)(д2 +
+ (2п - 2)т1 + (3п2 - 6п + 2)12)
Частный случай 2. Невосстанавливаемая система т = 0 и е = 0 :
T
-L D
Зп2 - бп + 2 1п(п - 1)(п - 2)
Модель отказоустойчивого дискового массива КАГО-1 (п > 2) с порогом разрушения * = п, возможностью одновременного восстановления г > 0, интенсивностью отказов дисков X, интенсивностью восстановления ц, и добавочной интенсивностью ошибок в процессе восстановления 8 (рис. 7).
Qys(t) = P(t); п ^ 4; r ^0.
п-Л (п - 1 )-(Л + є) (п-2)-(Л + е) ^ 2 |j-min(r,1) |j-min(r,2) |j-min(r,3)
Рис. 7. Граф состояний для отказоустойчивого дискового массива RAID-1
Р>(0) = 1; Р(0) = 0 ... Р (0) = 0; Р,(¥) = 0 ... Р,-1 (¥) = 0; Р (¥) = 1;
Р) (л) + Р(л) + ... + Р (л) = 1;
СР0(л)
СР1(л )
= -п1Р0 (л) + т шіп(г,1)Р (л); = п1Р0(л) - (т шіп(г ,1) +
+ (п -1)(1 + е))Р (л) + т шіп(г ,2)Р2 (л); СР>2 (л) = (п -1)(1 + е) Р1 (л) - (т шіп(г ,2) +
+ (п - 2)(1 + е))Р2 (() + т шт(г ,3) Р3 (();
ШРЩ^ = 2(1 + е)Ри-2 (() -а(
- (т шш(г, 5 -1) + (1 + е)) Рп_! (();
ШР^ = (1 + е)Ри-1((); а(
ЯЕАЮ1(()=Рп((); п > 2; г > °.
Среднее время наработки до разрушения
отказоустойчивого массива КАГО-1 определяется по формуле, получаемой из общей формулы для ЯЛГО-массивов при * = п:
( .. п-1-к
И'
(1 + е)п
-х
к
х У
д=0
V V
Пшіп(г,д + ■)^ ^
■=1 V п - д - І
(п - д)(1 + е шіп(1, д))
. (7)
/у
Частный случай 1. Однодисковое и безошибочное восстановление г = 1 и є = 0:
(
Ткліт = У
-1-к к
1п-к
-У
д=0
( п-1-к(
П
І=1
1
п - д - і
п - д
УУ
Частный случай 2. Невосстанавливаемая система ц = 0 и є = 0:
1 п-1 1
т =—У—1—
пліт л
1 д=0 п - д
3. ПРИМЕРЫ РАСЧЕТА СРЕДНЕГО ВРЕМЕНИ НАРАБОТКИ ДО РАЗРУШЕНИЯ (ПОТЕРИ ДАННЫХ) ДЛЯ ЯАГО-МАССИВОВ
Интенсивность отказов отдельного диска 1 = 1/120000. Результаты расчета приведены в табл. 1-8.
к=0
к=0
Таблица 1
Невосстанавливаемая система: г = 0, ц = 0, є = 0
п = 2 п = 3 п = 4 п = 5 п = 6
КАГО-0 (5 = 1) 60000 40000 30000 24000 20000
КАГО-5 (5 = 2) - 100000 70000 54000 44000
КАГО-6 (5 = 3) - - 130000 94000 74000
КАГО-1 (5 = п) 180000 220000 250000 274000 294000
Т аблица 2
Однодисковое безошибочное восстановление (без учета добавочной интенсивности ошибок при восстановлении): г = 1, ц = 1/24, е = 0
п = 2 п = 3 п = 4 п = 5 п = 6
КАГО-0 (5 = 1) 60000 40000 30000 24000 20000
КАГО-5 (5 = 2) - 1,001 -108 5,007 -107 3,0054 -107 2,0044 -107
КАГО-6 (5 = 3) - - 1,2515 -Ю11 5,008 -1010 2,505 -1010
КАГО-1 (5 = п) 3,0018 -108 5,004 -Ю11 6,25625 -1014 6,25751 -1017 5,21563 -1020
Таблица 3
Многодисковое безошибочное восстановление (без учета добавочной интенсивности ошибок при восстановлении): г = п, ц = 1/24, е = 0
п = 2 п = 3 п = 4 п = 5 п = 6
КАГО-0 (5 = 1) 60000 40000 30000 24000 20000
КАГО-5 (5 = 2) - 1,001 -108 5,007 -107 3,0054 -107 2,0044 -107
КАІБ-6 (5 = 3) - - 2,5025 -Ю11 1,0013 -Ю11 5,008 -1010
КАГО-1 (5 = п) 3,0018 -108 1,0007 -1012 3,75325 -1015 1,50157 -1019 6,25775 -1022
Таблица 4
Однодисковое восстановление с добавочной интенсивностью ошибок при восстановлении большей, чем интенсивность восстановления: г = 1, ц = 1/24, е = 9/24
n = 2 n = 3 n = 4 n = 5 n = 6
RAID-0 (s = 1) 60000 40000 30000 24000 20000
RAID-5 (s = 2) - 42223 31111 24667 20444
RAID-6 (s = 3) - - 31175 24692 20457
RAID-1 (s = n) 66669 42473 31184 24698 20463
Таблица 5
Однодисковое восстановление с добавочной интенсивностью ошибок при восстановлении, равной интенсивности восстановления: г = 1, ц = 1/24, е = 1/24
n = 2 n = 3 n = 4 n = 5 n = 6
RAID-0 (s = 1) 60000 40000 30000 24000 20000
RAID-5 (s = 2) - 60007 40005 30004 24003
RAID-6 (s = 3) - - 45019 32013 25010
RAID-1 (s = n) 120011 80035 50056 34070 25745
Таблица 6
Многодисковое восстановление с добавочной интенсивностью ошибок при восстановлении, равной интенсивности восстановления: г = п, ц = 1/24, е = 1/24
n = 2 n = 3 n = 4 n = 5 n = 6
RAID-0 (s = 1) 60000 40000 30000 24000 20000
RAID-5 (s = 2) - 60007 40005 30004 24003
RAID-6 (s = 3) - - 50021 34015 26011
RAID-1 (s = n) 120011 100039 80087 64166 52296
Т аблица 7
Однодисковое восстановление с добавочной интенсивностью ошибок при восстановлении меньшей, чем интенсивность восстановления: г = 1, ц = 1/24, е = 1/216
n = 2 n = 3 n = 4 n = 5 n = 6
RAID-0 (s = 1) 60000 40000 30000 24000 20000
RAID-5 (s = 2) - 219784 119910 77956 55978
RAID-6 (s = 3) - - 523886 239608 136838
RAID-1 (s = n) 599245 1835152 4153358 7490412 11242880
Т аблица 8
Многодисковое восстановление с добавочной интенсивностью ошибок при восстановлении ___________меньшей, чем интенсивность восстановления: г = п, ц = 1/24, е = 1/216___________
n = 2 n = 3 n = 4 n = 5 n = 6
RAID-0 (s = 1) 60000 40000 30000 24000 20000
RAID-5 (s = 2) - 219784 119910 77956 55978
RAID-6 (s = 3) - - 927755 401188 217644
RAID-1 (s = n) 599245 3450304 22700604 161287651 1200034082
ЗАКЛЮЧЕНИЕ
Таким образом, предложена марковская модель надежности избыточных дисковых массивов до разрушения (безвозвратной частичной или полной потери данных) с порогами разрушения 5 = 1, 2, 3 и п, и выведены аналитические формулы для расчета среднего времени наработки до разрушения. Получены упрощенные формулы для определения параметров надежности и приведены примеры их расчета, относя-
щиеся к типовым частным случаям реализации дисковых массивов. Рассмотренные модели и аналитические оценки по степени точности близки к западным моделям MTTDL (Mean Time To Data Loss) и уступают передовым моделям NOMDL (Normalized Magnitude of Data Loss). В то же время полученные теоретические результаты являются альтернативным видением авторов, не нашедшим отражения в публикациях, и могут быть развиты для получения более совершенных моделей и точных оценок.
Полученные теоретические результаты использовались авторами в многолетней практике эксплуатации, развития и проектирования дисковых массивов серверных систем, используемых в Балаковской АЭС и Стерлитамакском заводе нефтепромыслового оборудования «Красный Пролетарий».
СПИСОК ЛИТЕРАТУРЫ
1. Черкесов Г. Н. Надежность аппаратно-программных комплексов. СПб.: Питер, 2005.
2. Половко А. М., Гуров С. В. Основы теории надежности. 2-е изд., перераб. и доп. СПб.: БХВ-Петербург, 2006.
3. Гнеденко Б. В. Курс теории вероятностей. М.: Едито-риал УРСС, 2005.
4. Gibson G. A. Redundant Disk Arrays: Reliable, Parallel Secondary Storage. Ph.D. dissertation, Dept. Computer Science, UC Berkeley, 1991.
5. Elerath J. G. Reliability model and assessment of redundant arrays of inexpensive disks (RAID) incorporating latent defects and non-homogeneous Poisson process events. Ph.D. dissertation, University of Maryland, 2007.
6. Elerath J. G., Pecht M. A highly accurate method for assessing reliability of redundant arrays of inexpensive disks // IEEE Transactions on Computers. March 2009. Vol. 58, No. 3.
7. Siewert S., Scott G. Next Generation Scalable and Efficient Data Protection. Intel Developer Forum, San Francisco, California, 2011.
ОБ АВТОРАХ
Каяшев Александр Игнатьевич, проф., зав. каф. автома-тизир. технол. и информ. систем. Д-р техн. наук (МГТУ «Станкин», 1996).
Рахман Павел Азизурович, доц. той же каф. Магистр техн. и технол. по информатике и выч. технике (МЭИ, 2000). Канд. техн. наук по телекоммун. системам и компь-ют. сетям (МЭИ, 2005).
Шарипов Марсель Ильгизович, доц. той же каф. Канд. техн. наук (УГНТУ, 2010).
METADATA
Title: Reliability analysis of redundant disk arrays.
Authors: A. I. Kayashev1, P. A. Rahman2, M. I. Sharipov3.
Affiliation: 1-3 Sterlitamak branch of Ufa State Petroleum Technological University, Russia.
E-mail: 2 [email protected]
Language: Russian.
Source: Vestnik UGATU (scientific journal of Ufa State Aviation Technical University), Vol. 17, No. 2 (55), pp. 163170, 2013. ISSN 2225-2789 (Online), ISSN 1992-6502 (Print).
Abstract: Redundant disk arrays for fault-tolerant data storages and reliability models of repairable systems are discussed. Simplified formulas for mean time to data loss (MTTDL) assessment with taking into consideration fault and repair specificity and calculation examples are also provided.
Key words: Disk Arrays; Reliability; RAID; MTTDL.
References (English Transliteration):
1. G. N. Cherkesov, Reliability of hardware and software systems, (in Russian), Saint-Petersburg: Piter, 2005.
2. A. M. Polovko and S. V. Gurov, Basis of reliability theory, (in Russian). Saint-Petersburg: BHV-Petersburg, 2006.
3. B. V. Gnedenko, Course of probability theory, (in Russian). Moscow: Editorial URSS, 2005.
4. G. A. Gibson, Redundant Disk Arrays: Reliable, Parallel Secondary Storage, Ph.D. dissertation, Dept. Computer Science, UC Berkeley, 1991.
5. Jon G. Elerath, Reliability model and assessment of redundant arrays of inexpensive disks (RAID) incorporating latent defects and non-homogeneous Poisson process events, Ph.D. dissertation, University of Maryland, 2007.
6. Jon G. Elerath and Michael Pecht, "A highly accurate method for assessing reliability of redundant arrays of inexpensive disks,” IEEE Transactions on Computers, vol. 58, no. 3, March 2009.
7. Sam Siewert and Greg Scott, “Next Generation Scalable and Efficient Data Protection,” Intel Developer Forum, San Francisco, California, September 2011.
About authors:
1. Kayashev, Alexander Ingnatievich, Head of Automated Technological and Informational Systems Department, Sterlitamak branch of Ufa State Petroleum Technological University. Dr. of Tech. Sci. (Moscow State University of Technology «Stankin», 1996).
2. Rahman, Pavel Azizurovich, Associate professor (docent) of Automated Technological and Informational Systems Department, Sterlitamak branch of Ufa State Petroleum Technological University. M. Sc. in Computer Science (Moscow Power Engineering Institute, 2000), Ph.D. in Technical Sciences (Moscow Power Engineering Institute, 2005).
3. Sharipov, Marsel Ilgizovich, Associate professor (docent) of Automated Technological and Informational Systems Department, Sterlitamak branch of Ufa State Petroleum Technological University. Ph. D. in Technical Sciences (Ufa State Petroleum Technological University, 2010).