МОДЕЛЬ ОТКАЗОУСТОЙЧИВОЙ РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ.
Скорик Фадей Александрович
соискатель лаборатории проблем компьютерной безопасности Санкт-Петербургского института информатики и автоматизации РАН
(СПИИРАН), г. Санкт-Петербург Е-mail: work_bk@bk. ru
MODEL OF FAULT TOLERANT DISTRIBUTED INFORMATION SYSTEM
Fadey Skorik
Applicant of Laboratory of Computer Security Problems, St. Petersburg Institute for
Informatics and Automation of RAS (SPIIRAS), St. Petersburg
АННОТАЦИЯ
В статье рассматривается проблема построения отказоустойчивой распределенной информационной системы. Разработана многоуровневая сервисная модель, которая позволяет динамически контролировать избыточность данных, необходимых для равномерной загрузки сети, а так же их хранение и восстановление в автоматическом режиме. Полученная модель оптимальна в случае, если накопление данных происходит линейно, без скачков. В противном случае, рассмотренный алгоритм может повести себя некорректно.
ABSTRACT
The article describes a problem of a fault-tolerant distributed information system. the multi-service model is developed and it allow to make the dynamic redundancy and control data necessary for the uniform network load, as well as their storage and recovery in the automatic mode. The resulting model is optimal if the accumulation data is linear, with no jumps. Otherwise, the algorithm can behave incorrectly.
Ключевые слова: отказоустойчивая распределенная информационная система; многоуровневая сервисная модель, динамическое управление.
Keywords: a fault-tolerant distributed information system; the multi-service model; dynamic control.
Большинство современных информационных систем носит распределённый характер, и высокая их популярность вполне закономерна. Этому способствует постоянное увеличение объёмов информации циркулирующей в локальных и глобальных сетях, а так же тот факт, что современный уровень принятия решений и оперативное управление информационными ресурсами требует всё большей их децентрализации.
Если вероятность сбоя отдельно взятого компьютера относительно невелика, то в распределенных системах, состоящих из тысяч или даже миллионов таких компьютеров, сбои происходят постоянно [3, ^ 18].
Соответственно способность распределенной информационной системы выполнять возложенные на нее функции, напрямую зависит от ее способности противостоять постоянно возникающим отказам.
В данной статье рассматривается многоуровневая сервисная модель отказоустойчивой распределенной информационной системы, где все файлы и процессы объедены в сервисы. Каждый сервис состоит из изменяемых и неизменяемых во времени процессов и временных файлов.
Для того чтобы получить отказоустойчивую самовосстанавливающуюся систему необходимо обеспечить возможность быстрого восстановления любого сервиса на любом из существующих в сети серверов. А если обеспечить хранение процессов, изменяющихся во времени, за определенный период времени, можно получить систему хранения.
Определим время работы временной дискретной сеткой, с небольшим шагом, который и будет являться единицей времени , данные системы будут изменяться по линейному закону V = V + АУ£. Примем, что не все файлы подлежат хранению/восстановлению в узлах, на временной дискретной сетке, а затраты на передачу файла не зависит от его типа и одинаковы для каждого из участников обмена а. Затраты на процедуру сжатия любой части любого файла в единицу времени одинаковы , и нет различий между файлами и процессами, они определяются единым названием — файл.
В случае, если распределенная информационная система имеет М файлов, затраты на копирование файла і для каждого дискретного момента времени определяются:
Сі = аУ^і (1)
где: У і — размер копируемого файла;
а і — элемент вектора копирования.
Затраты на хранение файла можно определить как:
О і = Ъ q іУіа і (2)
где: q і — элемент вектора, задающего периоды хранения файла.
Для обеспечения отказоустойчивости системы лучше всего воспользоваться методом представления файлов в виде ( N , к) -пороговой схемы [1, с. 355]. Метод позволяет представить файл в виде N частей таким образом, что достаточно получить любые к из них, к < N чтобы собрать файл целиком. Число к является фиксированным для каждого файла и зависит от его размера. Следовательно, размер файла можно представить следующей формулой:
Уі=І%іУц с^(Ю (3)
где: — размер одной из к частей файла;
СРі(№) — конечное поле Галуа для -го файла, состоящее из N элементов, к из которых образуют нужный файл.
В итоге, математическая модель динамической отказоустойчивой системы примет следующий вид:
Р(Лщ) = ЕІіІСі + О,} = Ей і {(ааі + Ъqiа¡) і УцС Р (№)} (4)
где элемент структурной матрицы информационной системы, отвечающий за размещение и хранение одного из М файлов, состоящего из к частей.
Рассмотренная модель позволяет динамически контролировать избыточность данных, необходимых для равномерной загрузки сети, их хранения и восстановления. Однако она не учитывает взаимодействия между файлами и очередность их восстановления. Модель нельзя использовать в виде,
рассмотренном выше, это может привести к большим простоям в случае сбоя, поскольку придется восстанавливать всю структурную матрицу [2, с. 122].
Чтобы учесть последовательность резервирования/восстановления процессов, необходимо определить дискретную временную сетку, показывающую очередность резервирования/восстановления файлов.
На каждом дискретном временном интервале имеется один или несколько файлов, требующих восстановления/резервирование. Очередность их восстановления определяется потребностью уже восстановленных файлов. Заменим дискретный временной интервал связанным списком
, где — представляет собой фильтр, определяющий
сборку. В результате, режим восстановления становится автоматическим и не зависит от времени.
Математическая модель автоматической системы восстановления сервиса следующая:
¥ (Л ¡к) = 5 (А а _ ц к) Ей ! {(аа1 + Ь Ч1а{) Е)= г УцС р ( Щ) } (5)
В простейшем случае матрица 5 (АIь) представляет собой матрицу из 1 и 0. Она определяет порядок восстановления файла, определяет
оптимальный режим восстановления сервиса.
Далее следует определить среду, содержащую начальный элемент или сервис целиком и матрицу управления . Предположим, распределенная
информационная система имеет сервисов. Определим сервисы как проекции -мерного вектора Рм = Ер=\Р (А I ь) Рр, на временную решетку. Состояние этого вектора описывает общее состояние всех информационных сервисов на всех аппаратно-программных платформах.
В процессе функционирования системы, вектор информационной системы осуществляет некоторое прецессионное движение во времени. Если во время этого процесса, вектор информационной системы не выходит из определенной области — считается, что система функционирует в штатном режиме,
Рм а Ф, где Ф — область штатного функционирования. Если выходит — требуется коррекция.
Рассмотренная сервисная модель отказоустойчивой распределенной
информационной системы может быть оптимальна для небольших
организаций, где данные растут линейно и не сильно изменяются со временем. В случае, если возможен не равномерный рост или быстрая деградация сервисов, рассмотренный алгоритм может повести себя некорректно.
Отличительными преимуществами рассмотренной системы являются высокая гибкость и масштабируемость, которые позволяют провести плановое обслуживание системы без остановки основных сервисов. Кроме того система имеет высокую надежность и доступность, которые достигается благодаря отсутствию компонентов, отказ которых приведет к неспособности системы выполнять возложенные на нее функции.
Список литературы:
1. Тармасов А.Г., Хасин М.А., Пахомов Ю.И. Модель распределенного
хранения данных с регулируемой избыточностью // Исследовано в России. — 2001. — № 4. — 364 с.
2. Тетюшев А.В. Отказоустойчивые самовосстанавливающие
информационные системы // Информационные технологии моделирования и управления. — 2007. — № 1(35). — 160 с.
3. Хорошевский В.Г. Архитектура вычислительных систем. — М.: МГТУ им. Н.Э. Баумана, 2008. — 520 с.