Научная статья на тему 'Определение отказоустойчивости системы резервного копирования данных'

Определение отказоустойчивости системы резервного копирования данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
350
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЗЕРВНОЕ КОПИРОВАНИЕ ДАННЫХ / СМЕШАННОЕ МОДЕЛИРОВАНИЕ / ОТКАЗОУСТОЙЧИВОСТЬ / ПОЛУМАРКОВСКИЕ ПРОЦЕССЫ / DATA BACKUP / MIXED MODELING / FAULT TOLERANCE / SEMI-MARKOV PROCESSES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Патутина А.М., Рудаков И.В.

Рассмотрен метод исследования отказоустойчивости системы резервного копирования на основе полумарковских процессов. Приведен краткий обзор методов расчета для динамических и статических моделей анализа надежности, показывающий, что реализации, основанные на полумарковских процессах, практически не имеют ограничений построения моделей отказа, восстановления и резервирования, а также дают наиболее точные результаты. Описаны существующие технологий хранения информации. Реализована модель резервного копирования данных на основе смешанного (аналитико-имитационного) моделирования. Имитационная часть, определяющая отказоустойчивость коммутаторов и серверов, представлена в терминах систем массового обслуживания, а в аналитической части предложено определение отказоустойчивости для системы хранения данных на основе полумарковских процессов

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Determination of Data Backup System Fault Tolerance

The paper considers the method of researching the fault tolerance of the backup system based on semi-Markov processes, and presents a quick overview of calculation methods for dynamic and static models of reliability analysis. The research shows that implementations based on semi-Markov processes have practically no limitations on building failure, recovery and backup models, and also provide the most accurate results. We described the existing storage technologies. By mixed, i.e., analytical-simulation, modeling, we implemented the data backup model. The simulation part, which determines the fault tolerance of switches and servers, is presented in terms of queuing theory, and the analytical part suggests defining fault tolerance for a data storage system based on semi-Markov processes

Текст научной работы на тему «Определение отказоустойчивости системы резервного копирования данных»

УДК 004.052.3

DOI: 10.18698/0236-3933-2019-5-64-78

ОПРЕДЕЛЕНИЕ ОТКАЗОУСТОЙЧИВОСТИ СИСТЕМЫ РЕЗЕРВНОГО КОПИРОВАНИЯ ДАННЫХ

А.М. Патутина И.В. Рудаков

npatutina@gmail.com irudakov@yandex.ru

МГТУ им. Н.Э. Баумана, Москва, Российская Федерация

Аннотация

Рассмотрен метод исследования отказоустойчивости системы резервного копирования на основе полумарковских процессов. Приведен краткий обзор методов расчета для динамических и статических моделей анализа надежности, показывающий, что реализации, основанные на полумарковских процессах, практически не имеют ограничений построения моделей отказа, восстановления и резервирования, а также дают наиболее точные результаты. Описаны существующие технологии хранения информации. Реализована модель резервного копирования данных на основе смешанного (аналитико-имитационного) моделирования. Имитационная часть, определяющая отказоустойчивость коммутаторов и серверов, представлена в терминах систем массового обслуживания, а в аналитической части предложено определение отказоустойчивости для системы хранения данных на основе полумарковских процессов

Ключевые слова

Резервное копирование данных, смешанное моделирование, отказоустойчивость, полумарковские процессы

Поступила 28.03.2019 © Автор(ы), 2019

Введение. В настоящее время регулярное создание резервных копий данных является наиболее надежным способом защиты информации. Оно предполагает создание и хранение дополнительных, избыточных копий исходных данных на случай их частичной или полной потери, позволяя восстанавливать информацию при отказе серверов или аварии в центре обработки данных (ЦОД). Для ЦОД также актуальна проблема управления большим количеством данных, их хранением и быстрым восстановлением. Для решения каждого класса задач существуют различные системы резервного копирования [1], под которыми понимается комплекс программного и аппаратного обеспечения, сохраняющий данные на носитель для их восстановления в случае повреждения.

Модели анализа надежности делятся на два класса: 1) динамические, когда происходящие события и отказы рассматриваются как процессы,

развивающиеся во времени; 2) статические, в которых состояния системы определяются наборами работоспособных и неработоспособных элементов в момент времени t.

В рамках динамических моделей применяют:

- моделирование систем марковскими и полумарковскими процессами [1];

- методы теории восстановления полумарковских и регенерирующих процессов (в основном используют асимптотические результаты либо для системы в целом, либо для отдельных резервированных звеньев) [2];

- статистическое имитационное моделирование (метод Монте-Карло) [3].

В рамках статических моделей анализ надежности проводится методами:

- использующими основные формулы теории вероятностей (вероятность суммы и произведения событий, формула полной вероятности) и комбинаторики (применяется главным образом для последовательно-параллельных, параллельно-последовательных структурных надежностных схем и схем m из n) [1];

- основанными на записи логических условий, интересующих исследователя функций через состояния элементов системы с последующим применением теории алгебры логики (логико-вероятностные методы, используемые в деревьях отказов, схемах функциональной целостности, блок-схемах надежности) [4].

Сравнение программных продуктов, реализующих перечисленные методы расчета надежности, приведено в табл. 1.

Единственным программным продуктом, работающим без ограничений и предоставляющим наиболее точные расчеты, является «УНИВЕРСАЛ», реализованный на основе полумарковских процессов. Следует отметить, что этот продукт не находится в открытом доступе и не имеет подробной документации.

В настоящее время широко используют три основных метода оценки безопасности систем [11]: 1) анализ дерева отказов (Fault Tree Analysis); 2) анализ диаграмм зависимостей (Dependency Diagram Analysis); 3) анализ полумарковских процессов. Каждый метод имеет преимущества и недостатки. Полумарковские процессы, в отличие от других подходов, позволяют анализировать модели систем, способных к восстановлению. Основной недостаток этого метода — экспоненциальный рост размера моделей в зависимости от числа компонентов системы [12].

Таблица 1

Сравнение программных продуктов, реализующих методы расчета надежности

Программный продукт (разработчик) Метод расчета надежности Особенности моделей отказа, восстановления и резервирования, вычисляемые показатели Точность расчетов

«УНИВЕРСАЛ» (ВНИИУП МПС) Полумарковский Практически без ограничений, если не считать сложность построения модели полумарковских процессов [5] Точные и приближенные методы [5]

«Асоника-К» (МИЭМ НИУ ВШЭ) По формулам из справочника, частные случаи статистического моделирования Независимые отказы и восстановления, нагруженное резервирование, мгновенные показатели [6] Приближенные методы (некоторые с заданной погрешностью) [6]

«АРБИТР» (СПИК СЗМА) Логико-вероятностный Независимые отказы и восстановления, некоторые случаи несовместности отказов, нагруженное резервирование, мгновенные показатели [7] Точные методы для мгновенных показателей, приближенные — для интервальных [7]

RiskSpectrum (RELCON АВ, Швеция) Логико-вероятностный Независимые отказы и восстановления, нагруженное резервирование, мгновенные показатели [8, 9] Приближенные методы без указания точности оценок [8, 9]

Isograph (Isograph Inc., США, Isograph Ltd., Англия) Логико-вероятностный, марковский, статистического моделирования Покрытие возможности других продуктов и учета некоторых видов зависимостей и резервирования, нагруженность, возможность оценки широкого спектра показателей, формирование модели марковских процессов [8,10] Точные и приближенные методы (некоторые с заданной погрешностью) [8, 10]

Исследование больших систем, например, резервного копирования вследствие большой размерности затруднено использованием только аналитического или имитационного моделирования [13]. Один из подходов исследования таких систем — декомпозиция, позволяющая разбивать исходную задачу на подзадачи, для одной части которых используют аналитические модели, а для другой — имитационные. В связи с этим необходимо применение комбинированного (смешанного) аналитико-имитационного моделирования, которое сочетает достоинства обеих моделей, т. е. предоставляет возможность многократного измерения интересующих параметров системы, исследования сложных сценариев ее поведения, получения оптимального и наиболее точного решения.

Здесь под отказоустойчивостью — свойством технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов — будем понимать возможность серверов и коммутаторов обрабатывать запросы, а для системы хранения данных — возможность восстановления данных в случае потери.

Модель системы резервного копирования. Идея централизованного хранения данных реализована в рамках двух технологий [14]:

1) сетевых хранилищ NAS (Network Attached Storage);

2) сетей хранения SAN (Storage Area Network) [14].

Обычно SAN — множество подключенных к коммутатору массивов, составленных из хранилищ данных. Коммутатор соединяется с серверами, которые ответственны за организацию доступа к хранимой информации. SAN осуществляет доступ любого сервера к любому накопителю без дополнительных нагрузок на локальную сеть. Для обмена данными не обязательно участие серверов.

Преимущества сетей хранения по сравнению с хранилищами — высокая эффективность и безотказность работы системы [14]. Последние тенденции в SAN сводятся к использованию виртуализации памяти. Это дает серверам возможность создать один логический том из нескольких устройств хранения. Безопасность обеспечивается на уровне сервера, в то время как в NAS — на уровне доступа к файлам.

Рассмотрим систему резервного копирования, состоящую из одной системы хранения данных (СХД), управляющего сервера (УС), двух коммутаторов (К1, К2) и трех серверов (С1-С3), взаимодействующих по LAN с клиентами (рис. 1).

Система хранения данных реализована на основе холодного резервирования с переключателем и состоит из главного и дополнительного серверов, а также переключателя.

Рис. 1. Схема подключения системы резервного копирования

Для данной системы LAN является внешней средой, осуществляющей взаимодействие с системой. Процесс резервного копирования данных включает в себя управление резервированием и сохранение информации пользователя. Последний процесс осуществляется за счет выполнения шагов:

1) данные от клиентов потсупают по LAN на серверы;

2) серверы отправляют полученную информацию на коммутаторы;

3) коммутаторы перенаправляют ее на СХД.

Процесс управления копированием представляет собой последовательность действий:

1) УС по расписанию посылает сигнал на резервное копирование коммутаторам;

2) коммутаторы перенаправляют сигнал на серверы;

3) серверы отправляют клиентам сигнал по LAN.

Исходя из того, что первый из описанных процессов дает незначительную нагрузку на сервер и коммутаторы, для определения отказоустойчивости необходимо моделировать процесс сохранения данных. Далее под резервным копированием будем понимать процесс сохранения информации пользователя.

Имитационная часть модели. Сети хранения данных SAN предоставляют возможность использования большого числа клиентов, при этом число портов для их подключения можно увеличивать за счет соединения коммутаторов друг с другом [15]. Группа связанных коммутаторов носит название Fibre Channel Fabric, или Fabric. Обычно используется до 15 устройств для стабильной работы системы, а значительные задержки в Fabric возникают после подключения более 30 коммутаторов [13]. Рассчитать отказоустойчивость для такого числа устройств аналитически достаточно трудная задача, решение которой, скорее всего, приведет к возникновению серьезных ошибок, поэтому необходимо работу трех серверов, получающих данные от клиентов и коммутаторов, реализовать с помощью имитационного моделирования.

Кроме того, необходимо учитывать возможность большой нагрузки на систему (например, при резервировании большого объема информации), что достигается при использовании именно имитационного моделирования.

В прикладных исследованиях широкое применение находят модели систем массового обслуживания (СМО). С одной стороны, это связано с относительной простотой аналитического описания процессов функционирования сложных систем, с другой — с возможностью получения обобщенных вероятностных показателей эффективности функционирования этих систем. Систему резервного копирования данных также можно рассматривать как СМО, в которой заявкой будем считать информацию, поступающую для резервирования (рис. 2).

Рис. 2. Схема процесса резервного копирования данных в терминах СМО

Аналитическая часть модели. Система хранения данных при резервном копировании состоит из нескольких ленточных библиотек или дисковых массивов, отказоустойчивость которых возможно рассчитать аналитически, что дает наиболее точные результаты. Для данного примера рассмотрено использование двух ленточных библиотек и переключателя между ними. Для них выделены следующие состояния:

0 — отказ всей системы вследствие неработоспособности переключателя;

1 — отказ всей системы за счет неработоспособности переключателя во время восстановления главной ленточной библиотеки;

2 — отказ главной ленточной библиотеки, работа дополнительной библиотеки;

3 — работа системы.

Предположим, что изначально система работает, т. е. находится в состоянии 3. Переходы между состояниями системы приведены на рис. 3.

Обозначим функцию плотности вероятности, определяющую время восстановления у для данной СХД, как Н(х), а плотность ее распределения — Н(х). Введем случайные величины:

- 8Я, обозначающая время выхода из строя I ) главной ленточной библиотеки;

- 8ь, обозначающая время выхода из строя доРис. 3. Схема перехода полнительной ленточной библиотеки;

между состояниями .

- у а, обозначающая время восстановления для системы хранения г

данных главной ленточной библиотеки.

Функции их распределения обозначим через /а (х), /ь (х), На (х), а плотности распределения — через Ра (х), Рь (х),

На (х ).

В добавление к изложенному выше переключатель имеет только два состояния: 1) опущен; 2) поднят. В связи с этим введем случайную величину и, имеющую бинарное распределение Р(и = к) = ак (1 - а)1_к, к = 0,1, 0 < а < 1, где и = 0, когда переключатель опущен и главный сервер не работает или восстанавливается, и = 1 в противном случае.

Пусть {X(Ь); Ь > 0} — стохастический процесс, определенный по правилам Х(0) = 1, X(0 = г, для I е[тп, тп+1), п = 0,1,2,..., I е 5 = {0...3}, где х1,

— моменты сбоев системы.

По определению [3] рассматриваемый в данном примере процесс является полумарковским, так как X (Ь) — случайный процесс с конечным множеством состояний, имеющий ступенчатые траектории со скачками в момент времени 0 < ^ < <... < . Этот полумарковский процесс определяется двумерной марковской цепью (X(хп), хп), 0 < п < да, хп е [0, да).

Исходя из этого, полумарковское ядро, которое обозначает вероятность того, что полумарковский процесс перейдет в состояние ] и время

до этого перехода не превысит t при условии пребывания процесса в состоянии i, для данного процесса можно представить с помощью формулы [16]:

Q(t) = [Qij(t):i, j eS], (1)

Qij(t) = P(xn+i-Tn < t, X(t„+i) = j | X(xn) = i), t > 0.

Вследствие этого вероятность перехода из состояния i в состояние j определяется по формуле [16]:

Pij = lim Qij(t) = P(X(xn+i = j) | X(in = i)). (2)

t

Функция распределения случайной величины Ti, обозначающей проведенное в состоянии i время (при этом состояние, в которое будет осуществлен переход, неизвестно) [17]:

Gi(t) = X Qij(t) = P(Ti < t) = P(in+1 ~Tn < 11X(in) = i). (3)

j ^s

Кроме того, функция распределения случайной величины Ti, обозначающей время задержки в состоянии i, когда следующее состояние j, вычисляется с помощью формулы [17]:

Fij (t) = = P(Tn+1 -Tn < t, X(Tn+1) = j | X(Tn) = i, X(Tn+1) = j). (4)

Pij

Следует отметить, что ядро полумарковского процесса |X(t); t > 0} определяется матрицей

Q(t) =

0 0 0 Q03 (t)

0 0 0 Q13(t)

Q20 (t) Q21(t) 0 Q23(t)

Q30(t) 0 Q32(t) 0

Опираясь на данную матрицу, можно вычислить все элементы полумарковского ядра ), г > 0. Элементы матрицы О03(£) и 013(г) определяются функцией распределения восстановления системы:

г

О0з(*) = ) = Н (г) = | Н(х)Лх. (5)

о

Исходя из описания системы получаем равенства

г

020 (г) = Р(и = о, у < г, 6Ь > у) = (1 - а)\ На (х)(1 - (х)) dx; (6)

0

02i(t) = P(h < t, 5b > у) = J fb(x)(1 - Ha(x))dx;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(7)

Q23(t) = P(U = 1, y< t, 5b >y) = a] ha(x)(1 - Fb(x))dx;

0

Q30(t) = P(U = 0, 5a < t) = (1 -a)Fa(t); Q32(t) = P(U = 1, 5a < t) = a*Fa(t).

(8)

(9) (10)

Когда все элементы матрицы ) определены, т. е. построена полумарковская цепь, необходимо вычислить вероятности переходов. Из формул (2), (5) и (6) получаем

P =

0 0 0 1

0 0 1

p20 p21 0 p23

1 - a 0 a 0

(11)

где

p20 = (1 - a){ ha(x)(1 - Fb(x))dx;

0

ж

p21 = { fb(x)(1 - Ha(x))dx;

(12)

(13)

(14)

р23 = а| На(х)(1 - Бь(х)^х.

0

С учетом (3) вычисляем функцию распределения случайной величины Т для всех состояний [17]:

Gb(t) = G1(t) =Х Q0j (t) = H(t);

JeS

(15)

02^) = Ю На(х)(1 - Рь (х))йх + Ю /ь(х)(1 - На(х))йх; (16)

03^) = Ба V). (17)

Получив эти данные, можно определить среднее значение времени безусловного ожидания в состоянии [18]:

ж

Е(Т0) = Е(Т1) = | хН(х )дх = £(у);

E(T2) = j xha(x)(1 - Fb(x))dx + J xfb(x)(1 - Ha(x)) dx;

0 0

ВД) = { /а(X)Сх =Е(Ъа). 0

Пример. Предположим, что время выхода из строя 8а главной ленточной библиотеки определено экспоненциальной функцией распреде-

*

ления с параметром аа: /а (х) = аае ~ааХ.

Функция плотности вероятности, определяющая время восстановления главной ленточной библиотеки уа, найдена по формуле На (х) = = ^0аХе~^аХ, где ца — параметр, оценивающийся на основе реальных данных.

Время выхода из строя 8ь дополнительной ленточной библиотеки определено экспоненциальной функцией распределения с параметром аь: /ь (х) = аье ~аьх.

Функция плотности вероятности, определяющая время восстановления СХД у : Н(х) = ц2хе, где ц — параметр, оценивающийся на основе реальных данных.

Предположим, что известно математическое ожидание случайных величин 8а (МТТГ — средняя наработка до отказа для главной ленточной библиотеки), 8ь (МТТ^1 для дополнительной), уа (МТТК — среднее время до восстановления главной ленточной библиотеки) и у (МТТЯ для СХД). Эти данные зависят от характеристик оборудования, для рассматриваемого примера перечисленные данные взяты приблизительно на основе имеющихся реализаций [19]:

Е(5а) = 18329 ч, Е(5ь) = 12675 ч, Е(уа) = 98 ч, Е(у) = 564 ч, а = 0,996.

Основываясь на том, что

да да 2

Е(у) = | хк(х) с1х = | ц2хе~^хСх = ц2хе+ — | Н(х)Сх,

0 0 М- 0

получим

ц = —— = 0,003546, аа = —1— = 0,00005456, Е(у) а Е(5а)

аь = = 0,0000789, ца = —— = 0,020408. ь Е(5ь) ^ Е( у а)

Эти данные позволяют составить ядро полумарковского процесса на основе формул (5)-(10):

Q03(t) = Q13(t) = 1 - е-°,°0354« (1 + 0,003546^);

Q20(t) = 0,004(1 - е-0,02048^ (1 + 0,020486^));

021(Ь) = 0,188002(0,0408949 -- е "0,020486г (0,0000789 + 0,020408(2 + 0,0204080 + 0,00000160);

023(Ь) = 0,98843(1 - е -°,°2048« (1 + 0,020486Ь)); ^) = 0,004(1 - е-0,00005456Ь); 032(*) = 0,996(1 - е-0,00005456Ь).

Функции распределения случайной величины Т для всех состояний вычислим по (15)-(17):

в0 (г) = 0^) = 1 - е "0,003546г (1 + 0,003546Ь);

02(г) = 1 -е-0,020486г(1 + 0,020557Ь); ОъЦ) = 1 -е-0,00005456г.

Затем определим средние значения времени безусловного ожидания в состоянии:

Е(Т0) = Е(Т) = 564; Е(Т2) = 96,4437; Е(Т3) = 18 329.

Вероятности переходов в матрице (11) можно найти по (12)-(14): р20 = 0,0 0 3 9 7; р21 = 0,00769; р23 = 0,9 8 8 4 3; р32 = 0,9 9 6.

Исходя из полученных характеристик, можно вычислить среднюю продолжительность работы системы до отказа по формуле [18]:

= Е(Т2) + р23Е(Т3) 1 - р23 р32

В результате получим 1 173 261 ч. Основываясь на имеющихся результатах, можно вычислить дополнительные показатели производительности и надежности, например коэффициент готовности и время цикла обслуживания единицы продукции с учетом отказов и восстановлений [20].

Заключение. Приведен краткий обзор методов расчета и их реализации для динамических и статических моделей анализа надежности. Показано, что реализации, основанные на полумарковских процессах, практически не имеют ограничений построения моделей отказа, восстановления и резервирования, а также дают наиболее точные результаты. Рассмотрены основные технологии хранения данных. Описан принцип работы системы резервного копирования.

Описан метод исследования резервного копирования на основе смешанного моделирования с использованием полумарковских процессов. В имитационной части, определяющей отказоустойчивость коммутаторов и серверов разрабатываемой модели, представлена данная система в

терминах СМО, в аналитической — описано определение отказоустойчивости системы хранения данных на основе полумарковских процессов.

Полученная модель определяет среднюю продолжительность работы системы до отказа и позволяет рассчитывать характеристики надежности и производительности, такие как коэффициент готовности и время цикла обслуживания единицы продукции с учетом отказов и восстановлений.

ЛИТЕРАТУРА

[1] Половко А.М., Гуров С.М. Основы теории надежности. СПб., БХВ-Санкт-Петербург, 2006.

[2] Kalashnikov V.V. Topics on regenerative processes. CRC Press, 1994.

[3] Бусленко Н.П. Моделирование сложных систем. М., Наука, 1978.

[4] Рябинин И.А. Надежность и безопасность структурно-сложных систем. СПб., Политехника, 2000.

[5] Шубинский И.Б., Шулика В.Ф. Программный комплекс «Универсал» для расчетов надежности и функциональной безопасности технических устройств и систем (общее описание). Надежность, 2003, № 4, с. 65-71.

[6] Жаднов В. Новые возможности программного комплекса «Асоника-К.В». CHIP NEWS: Инженерная микроэлектроника, 2003, № 10 (83), с. 52-55.

[7] Можаев А.С., Нозик А.А. Программный комплекс «АРБИТР» для моделирования, расчета надежности и безопасности систем. Монтаж и наладка средств автоматизации и связи, 2007, № 2, с. 32-40.

[8] Викторова В.С., Лубков Н.В., Степанянц А.С. Надежность технических систем. Обеспечение и анализ. Тр. 16-й Междунар. конф. «Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта». М., ИПУ РАН, ООО «Аналитик», 2016, с. 14-18.

[9] riskspectrum.com: веб-сайт. URL: http://www.riskspectrum.com (дата обращения: 09.01.2019).

[10] isograph.com: веб-сайт. URL: https://www.isograph.com (дата обращения: 09.01.2019).

[11] SAE ARP4761. Guidelines and methods for conducting the safety assessment process on civil airborne systems and equipment. Warrendale, USA, 1996.

[12] Karnov A.A., Zelenov S.V. Stochastic methods for analysis of complex hardwaresoftware systems. Труды ИСП РАН, 2017, т. 29, № 4, с. 191-202.

[13] Рудаков И.В., Давудпур М. Алгоритм декомпозиции формальной модели функционального блока дискретного устройства. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2006, № 1, с. 90-98.

[14] Борзенкова С.Ю., Савин И.В. Обеспечение безопасности системы хранения данных. Известия ТулГУ. Технические науки, 2017, № 10, с. 196-200.

[15] Дайлип Н. Системы хранения данных в Windows. М., Вильямс, 2005.

[16] Королюк B.C., Турбин А.Ф. Полумарковские процессы и их приложения. Киев, Наукова думка, 1976.

[17] Orsingher E., Ricciuti C., Toaldo B. On semi-Markov processes and their Kolmogo-rov's integro-differential equations. J. Funct. Anal., 2018, vol. 275, iss. 4, pp. 830-868. DOI: https://doi.org/10.1016/j.jfa.2018.02.011

[18] Grabski F.G. Semi-Markov reliability model of system composed of main subsystem, cold backup component and switch. JPSRA, 2017, vol. 8, no. 1, pp. 47-53.

[19] MIL-HDBK-217. Reliability prediction of electronic equipment. URL: http://everyspec.com/MIL-HDBK/MIL-HDBK-0200-0299/ MIL-HDBK-217F_14591 (дата обращения: 15.01.2019).

[20] Каштанов В.А., Медведев А.И. Теория надежности сложных систем (теория и практика). М., Европейский центр по качеству, 2002.

Патутина Анастасия Михайловна — студентка магистратуры кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Н.Э. Баумана (Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5, стр. 1).

Рудаков Игорь Владимирович — канд. техн. наук, доцент кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Н.Э. Баумана (Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5, стр. 1).

Просьба ссылаться на эту статью следующим образом:

Патутина А.М., Рудаков И.В. Определение отказоустойчивости системы резервного копирования данных. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение,

2019, № 5, с. 64-78. DOI: 10.18698/0236-3933-2019-5-64-78 DETERMINATION OF DATA BACKUP SYSTEM FAULT TOLERANCE

Bauman Moscow State Technical University, Moscow, Russian Federation

The paper considers the method of researching the Data backup, mixed modeling,

fault tolerance of the backup system based on fault tolerance, semi-Markov

semi-Markov processes, and presents a quick processes

overview of calculation methods for dynamic and

static models of reliability analysis. The research

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

shows that implementations based on semi-

Markov processes have practically no limitations

on building failure, recovery and backup models,

A.M. Patutina I.V. Rudakov

npatutina@gmail.com irudakov@yandex.ru

Abstract

Keywords

and also provide the most accurate results. We described the existing storage technologies. By mixed, i.e., analytical-simulation, modeling, we implemented the data backup model. The simulation part, which determines the fault tolerance of switches and servers, is presented in terms of queuing theory, and the analytical part suggests defining fault tolerance for a data storage system Received 28.03.2019 based on semi-Markov processes © Author(s), 2019

REFERENCES

[1] Polovko A.M., Gurov S.M. Osnovy teorii nadezhnosti [Fundamentals of reliability theory]. St. Petersburg, BHV-Sankt-Peterburg Publ., 2006.

[2] Kalashnikov V.V. Topics on regenerative processes. CRC Press, 1994.

[3] Buslenko N.P. Modelirovanie slozhnykh system [Simulation of complex systems]. Moscow, Nauka Publ., 1978.

[4] Ryabinin I.A. Nadezhnost i bezopasnost strukturno-slozhnykh system [Reliability and safety of structural-complicated systems]. St. Petersburg, Politekhnika Publ., 2000.

[5] Shubinskiy I.B., Shulika V.F. "UNIVERSAL" software package for reliability calculations and functional safety of technical equipment and systems (main description). Nadezhnost [Dependability], 2003, no. 4, pp. 65-71 (in Russ.).

[6] Zhadnov V. New possibilities of Asonika-K.V software package. CHIP NEWS: In-zhenernaya mikroelektronika, 2003, no. 10 (83), pp. 52-55 (in Russ.).

[7] Mozhaev A.S., Nozik A.A. "ARBITR" software package for modelling, reliability calculation and safety of systems. Montazh i naladka sredstv avtomatizatsii i svyazi, 2007, no. 2, pp. 32-40 (in Russ.).

[8] Viktorova V.S., Lubkov N.V., Stepanyants A.S. [Reliability of technical systems. Maintenance and analysis]. Tr. 16-y Mezhdunar. konf. "Sistemy proektirovaniya, tekhnologicheskoy podgotovki proizvodstva i upravleniya etapami zhiznennogo tsikla promyshlennogo produkta" [Proc. 16th Int. Conf. "Design for systems, preproduction engineering and management of life cycle stages of industrial product"]. Moscow, IPU RAN Publ., OOO "Analitik" Publ., 2016, pp. 14-18 (in Russ.).

[9] riskspectrum.com: website. Available at: http://www.riskspectrum.com (accessed: 09.01.2019).

[10] isograph.com: website. Available at: https://www.isograph.com (accessed: 09.01.2019).

[11] SAE ARP4761. Guidelines and methods for conducting the safety assessment process on civil airborne systems and equipment. Warrendale, USA, 1996.

[12] Karnov A.A., Zelenov S.V. Stochastic methods for analysis of complex hardwaresoftware systems. Trudy ISP RAN [Proc. ISP RAS], 2017, vol. 29, no. 4, pp. 191-202 (in Russ.).

[13] Rudakov I.V., Davudpur M. Algorithm of decomposition of formal model of discrete device functional block. Herald of the Bauman Moscow State Technical University, Series Instrument Engineering, 2006, no. 1, pp. 90-98 (in Russ.).

[14] Borzenkova S.Yu., Savin I.V. Security of the data storage system. Izvestiya TulGU. Tekhnicheskie nauki [News of the Tula State University. Technical Sciences], 2017, no. 10, pp. 196-200 (in Russ.).

[15] Dilip N.C. Inside Windows storage: server storage technologies for Windows 2000, Windows server 2003, and beyond. Addison-Wesley, 2004.

[16] Korolyuk B.C., Turbin A.F. Polumarkovskie protsessy i ikh prilozheniya [Semi-Markov processes and their applications]. Kiev, Naukova dumka Publ., 1976.

[17] Orsingher E., Ricciuti C., Toaldo B. On semi-Markov processes and their Kolmo-gorov's integro-differential equations. J. Funct. Anal., 2018, vol. 275, iss. 4, pp. 830868. DOI: https://doi.org/10.1016/j.jfa.2018.02.011

[18] Grabski F.G. Semi-Markov reliability model of system composed of main subsystem, cold backup component and switch. JPSRA, 2017, vol. 8, no. 1, pp. 47-53.

[19] MIL-HDBK-217. Reliability prediction of electronic equipment. Available at: http://everyspec.com/MIL-HDBK/MIL-HDBK-0200-0299/MIL-HDBK-217F_14591 (accessed: 15.01.2019).

[20] Kashtanov V.A., Medvedev A.I. Teoriya nadezhnosti slozhnykh sistem (teoriya i praktika) [Reliability theory of complex systems (theory and practice)]. Moscow, Evropeyskiy tsentr po kachestvu Publ., 2002.

Patutina A.M. — Master's Degree Student, Department of Computer Software and Information Technology, Bauman Moscow State Technical University (2-ya Baumanskaya ul. 5, str. 1, Moscow, 105005 Russian Federation).

Rudakov I.V. — Cand. Sc. (Eng.), Assoc. Professor, Department of Computer Software and Information Technology, Bauman Moscow State Technical University (2-ya Baumanskaya ul. 5, str. 1, Moscow, 105005 Russian Federation).

Please cite this article in English as:

Patutina A.M., Rudakov I.V. Determination of data backup system fault tolerance. Herald of the Bauman Moscow State Technical University, Series Instrument Engineering, 2019, no. 5, pp. 64-78 (in Russ.). DOI: 10.18698/0236-3933-2019-5-64-78

i Надоели баннеры? Вы всегда можете отключить рекламу.