Научная статья на тему 'Модель надежности каскадных дисковых массивов raid-10 с чередованием и зеркалированием данных'

Модель надежности каскадных дисковых массивов raid-10 с чередованием и зеркалированием данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
155
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИЗБЫТОЧНЫЙ ДИСКОВЫЙ МАССИВ / СРЕДНЕЕ ВРЕМЯ НАРАБОТКИ ДО ОТКАЗА / ЦЕПЬ МАРКОВА / REDUNDANT DISK ARRAY / MEAN TIME TO FAILURE / MARKOV CHAIN

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рахман П.А.

Рассматриваются марковская модель надежности каскадных дисковых массивов с чередованием и зеркалированием данных, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модель надежности каскадных дисковых массивов raid-10 с чередованием и зеркалированием данных»

Рахман П.А. ©

К.т.н., доцент кафедры автоматизированных технологических и информационных систем, Уфимский государственный нефтяной технический университет, филиал в г. Стерлитамаке

МОДЕЛЬ НАДЕЖНОСТИ КАСКАДНЫХ ДИСКОВЫХ МАССИВОВ RAID-10 С ЧЕРЕДОВАНИЕМ И ЗЕРКАЛИРОВАНИЕМ ДАННЫХ

Аннотация

Рассматриваются марковская модель надежности каскадных дисковых массивов с чередованием и зеркалированием данных, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

Ключевые слова: избыточный дисковый массив, среднее время наработки до отказа, цепь Маркова.

Keywords: redundant disk array, mean time to failure, Markov chain.

Современный мир практически невозможно представить без технических систем, ставших неотъемлемой частью как повседневной жизни и профессиональной деятельности человека, так и ключевыми элементами различных предприятий и отраслей экономики.

Помимо функциональных возможностей и основных технических характеристик, которые в первую очередь интересуют конечных потребителей и производителей, таких как: производительность, мощность, емкость и т.п., не менее важными являются показатели надежности [1, 2], так как от них напрямую зависит эффективность и безопасность эксплуатации технических систем. Соответственно, разработка моделей и методов для расчета показателей надежности систем передачи, обработки и хранения данных является актуальной и критически важной задачей.

В рамках научной деятельности [3-8] автором исследовались показатели надежности современных систем передачи, обработки и хранения данных, в частности показатели надежности каскадных дисковых массивов RATD-10. В результате была выведена формула для оценки среднего время наработки до отказа каскадного дискового массива RATD-10.

Каскадный массив RATD-10 представляет собою массив RATD-0 с чередованием данных, объединяющий n массивов RATD-1 с зеркалированием данных по 2 диска в каждом (рис. 1). Массив RATD-10 строится из четного количества (2n) дисков.

Рис. 1. Структурная схема двухуровневого дискового массива RAID-10.

© Рахман П.А., 2015 г.

В лучшем случае каскадный массив RATD-10 сохраняет работоспособность при отказах вплоть до п дисков, если все они оказываются в различных составляющих его массивах RATD-1. В таком случае только отказ п+1-го диска приведет к неизбежной потере данных, поскольку один из массивов RATD-1 потеряет работоспособность, а RATD-0 сам по себе не обладает никакой отказоустойчивостью. В худшем случае отказ даже двух дисков, оказавшихся в рамках одного массива RATD-1, приводит к потере данных. Соответственно, каскадный массив устойчив к отказу любого одного диска и к некоторым сочетаниям отказов большего числа дисков, но не более n дисков.

Рассмотрим теперь модель надежности отказоустойчивой системы хранения данных на базе каскадного массива RATD-10.

Пусть задана система хранения данных на базе каскадного массива RATD-10, состоящего из 2п идентичных дисков.

Интенсивность отказов дисков составляет X. Диски могут отказывать независимо. Если система находится в состоянии 0 (все диски исправны), то отказ любого из 2п дисков приводит в состояние 1. В состоянии 1 возможен отказ любого из 2п - 1 дисков, причем отказ любого из 2п - 2 дисков, не затрагивающих RATD-1 массив, в котором содержится ранее отказавший диск, приводит систему в состояние 2, а отказ 1 диска, являющегося единственным исправным в RATD-1 массиве, приводят систему в аварийное состояние F. В состоянии 2 возможен отказ любого из 2п - 2 дисков, причем отказ любого из 2п - 4 дисков, не затрагивающих RATD-1 массивы, в котором содержатся ранее отказавшие диски, приводит систему в состояние 3, а отказ любого из 2 дисков, являющихся единственными исправными в RATD-1 массивах, приводят систему в аварийное состояние F. И так далее, вплоть до состояния п. После отказа п дисков, находящихся в различных массивах RATD-1, система оказывается в состоянии п и все еще сохраняет работоспособность, но в каждом из RATD-1 массивов содержится один неисправный диск, поэтому отказ любого из оставшихся п дисков приведет систему в аварийное состояние F.

Массивы RATD-1 независимы по восстановлению, и в них может одновременно проходит регенерация (процедура rebuild) данных на замененных дисках путем простого копирования информации, хранящихся на соответствующих вторых дисках. Интенсивность регенерация информации на замененном диске составляет ^. Будем считать, что время замены отказавшего диска несущественно по сравнению со временем регенерации информации за счет использования технологии автоматической горячей замены дисков (hot-spare).

После завершения процедуры регенерации очередного массива RATD-1 система переходит из состояния j = 1... п в состояние j - 1.

Кроме того, пусть при регенерации данных в массиве RATD-1, на диске, с которого идет копирование информации, помимо базовой интенсивности отказов также становится существенной интенсивность ошибок чтения S диска, и эта интенсивность добавляется к базовой интенсивности отказов диска.

Кроме того, пусть в системе возможны критические виды ошибок RATD-контроллера, которые переводят систему из любого работоспособного состояния j = 0. п напрямую в аварийное состояние. Интенсивность критических ошибок контроллера составляет о.

Тогда с учетом всего вышесказанного марковская модель отказоустойчивой системы хранения данных на базе массива RATD-10 выглядит следующим образом (рис. 2):

Рис. 2. Граф состояний модели надежности дискового массива RAID-10.

Где, k - интенсивность отказов дисков, s - добавочная интенсивность ошибок в режиме чтения данных для восстановления информации на замененных дисках, р -интенсивность восстановления дисков, n - общее количество дисков, а - интенсивность ошибок контроллера дискового массива.

В результате аналитического решения марковской модели автором была выведена рекуррентная расчетная формула для оценки среднего времени наработки до отказа массива RAID-10 с потерей всех данных:

U(1) = 2nk; V(1) = 1; M(1) = 1;

W(1) = а; D(1) = 2nk + а; r = 1...n;

Г U(r+1) = 2(n - r)kU(r};

< V(r+1) = (а + r(k + s))M(r) + rрV(r) + U(r);

J M(r+1) = 2(n - r )kM(r) + V(r+1); (1)

W(r+1) = (а + r(k + s))D( r) + rpW(r);

[ D(r+1) = 2(n -r)kD(r) + W(r+1);

M = M(n+1); D = D{n+1);

L 77

D

В частности, для массива RAID-10 состоящего из общего числа 2n = 12 дисков, интенсивностью отказов дисков k = 1/120000 час-1, добавочной интенсивностью ошибок чтения данных s = 1/112 час-1, интенсивностью восстановления р = 1/9 час-1, интенсивностью критических ошибок контроллера а = 1/1200000 час-1 была получена следующая оценка средней наработки до потери данных:

T = 121275 часов.

Полученные автором теоретические результаты использовались в многолетней практике проектирования и эксплуатации систем хранения, обработки и передачи данных НИУ МЭИ (ТУ), Балаковской АЭС, ОАО «Красный Пролетарий» и ряда других предприятий.

Литература

1. Черкесов Г. Н. Надежность аппаратно-программных комплексов. - СПб.: Питер, 2005.

2. Половко А. М., Гуров С. В. Основы теории надежности. 2-е изд. - СПб.: БХВ-Петербург, 2006.

3. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности избыточных дисковых массивов // Вестник УГАТУ: научный журнал УГАТУ, 2013. - Т. 17 - № 2 (55) - С. 163-170.

4. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ: научный журнал УГАТУ, 2013. - Т. 17 - № 5 (58) - С. 140-149.

5. Рахман П.А., Каяшев А.И., Шарипов М.И. Анализ показателей надежности двухуровневых магистральных сетей // Вестник УГАТУ: научный журнал УГАТУ, 2014. - Т. 18 - № 2 (63) - С. 197-207.

6. Рахман П.А., Каяшев А.И., Шарипов М.И. Модель надежности отказоустойчивой пограничной маршрутизации с двумя Интернет-провайдерами // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 131-139.

7. Рахман П.А., Каяшев А.И., Шарипов М.И. Марковская цепь гибели размножения в моделях надежности технических систем // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 140-154.

8. Рахман П.А., Каяшев А.И., Шарипов М.И. Модель надежности отказоустойчивых систем хранения данных // Вестник УГАТУ: научный журнал УГАТУ, 2015. - Т. 19 - № 1 (67) - С. 155166.

i Надоели баннеры? Вы всегда можете отключить рекламу.