Научная статья на тему 'Решение проблемы повышения надежности информационно-управляющих систем кластерным методом'

Решение проблемы повышения надежности информационно-управляющих систем кластерным методом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
113
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Царегородцев А. В., Савельев И. А.

В работе рассматривается проблема повышения устойчивости к сбоям в работе информационно-управляющих систем путём управления развитием их инфраструктуры. Предлагается формализация задачи планирования очередности и этапности создания сложных кластерных систем управления и обработки информации. В зависимости от конкретных особенностей постановки задачи формализуется критерий оптимальности для плана развития кластерной инфраструктуры корпорации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Царегородцев А. В., Савельев И. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The solution of increasing safity of informational control systems by clustered approach

The problem of increasing safety to fail operations of informational control systems is considered in this work as the control of infrastructure's evolution. The formalization of programming task and stage of creation compound clustered systems of control and process information is called attention hereinafter. Depending on specific property of task we are formalizing optimal criterion for planning clustered infrastructure's evolution of corporation.

Текст научной работы на тему «Решение проблемы повышения надежности информационно-управляющих систем кластерным методом»

УДК 519.714

РЕШЕНИЕ ПРОБЛЕМЫ ПОВЫШЕНИЯ НАДЕЖНОСТИ ИНФОРМАЦИОННО-УПРАВЛЯЮЩИХ СИСТЕМ КЛАСТЕРНЫМ МЕТОДОМ

А.В. Царегородцев, И.А.Савельев

Кафедра технической кибернетики Российский университет дружбы народов 117198, Москва, ул. Миклухо-Маклая, 6

В работе рассматривается проблема повышения устойчивости к сбоям в работе инфор-мационно-управляющих систем путём управления развитием их инфраструктуры. Предлагается формализация задачи планирования очередности и этапности создания сложных кластерных систем управления и обработки информации. В зависимости от конкретных особенностей постановки задачи формализуется критерий оптимальности для плана развития кластерной инфраструктуры корпорации.

Введение.

Прогресс в области обработки информации открыл для множества предприятий важнейшие и ставшие сравнительно дешевыми возможности: распределенные в сети вычисления и распределенные информационные системы. Последнее дало возможность небольшим фирмам объединить в сети свои управляющие, торговые и производственные структуры на корпоративный манер, а корпорациям - укрепить связи своих подразделений и улучшить управляемость.

В работе рассматривается проблема повышения устойчивости к сбоям в работе информационно-управляющих систем путём управления развитием их инфраструктуры. Рассматривается формализация задачи планирования очередности и этапности создания сложных кластерных систем управления и обработки информации.

В связи с повсеместной автоматизацией рабочих процессов большое значение в настоящие время придается совершенствованию структуры информационно-управляющих систем [1]. Автоматизированные информационные системы хранят сегодня основную информацию. Очевидно, что такие жизненно важные системы должны обладать адекватным уровнем отказоустойчивости в рамках отведенных бюджетов. Под отказоустойчивостью понимается количество одновременных отказов компонентов системы, которые приводят к прекращению работы - чем больше узлов системы нужно вывести из строя для прекращения ее работы, тем более отказоустойчива такая система. Отказоустойчивость повышает общую надёжность системы, собранной из недостаточно надежных компонентов. Требования по отказоустойчивости определяются по разности между требуемым уровнем надёжности и реальной надежностью существующих компонентов. Надёжность в свою очередь -это доля времени непрерывной работы вычислительной системы - чем больше эта величина, тем меньше система простаивает. Для критически важных приложений нужно добиваться минимум 99,99% надежности. Простое дублирование элементов системы зачастую не является эффективным решением проблем отказоустойчивости информационных технологий.

Катастрофоустойчивая кластерная структура.

Все серьезное оборудование подразумевает некоторую степень избыточности. Серверы и дисковые массивы оснащаются резервными источниками питания, вентиляторами, дублирующими контроллерами, процессорами, зеркалированной кэшпамятью, многими другими избыточными устройствами. Все эти усилия направлены на устранение единой точки отказа оборудования. Для построения отказоустойчивой системы это необходимо, для катастрофоустойчивой - недостаточно. Если отказоустойчивая система способна сохранять работоспособность в случае выхода из строя отдельных компонентов, то катастрофоустойчивая - в случае одновременного множественного выхода из строя составных частей или узлов в результате событий непредвиденного характера.

Рис. 1 Три центра (с площадкой-арбитратором)

Работоспособность отказоустойчивой системы обеспечивают входящие в нее компоненты: данные со сбойного диска восстанавливаются по четности, микросхема памяти может локально отключаться, питание осуществляется с резервного источника и т.д. Функционирование катастрофоустойчивой системы достигается за счет разнесения ее компонентов на значительные расстояния. Это позволяет подключать систему к разным подстанциям или электростанциям, исключая единую точку отказа по сбою в подаче питания, и обеспечивая непрерывность бизнеса при выходе из строя не только узла кластера, но и всей площадки. Однако одновременно растет роль каналов связи между узлами кластера; если риск повредить проводку внутри здания невелик и можно применять дешевые решения (изначально полагая, что проводка надежнее компонентов), то в метрокластере канал связи становится важным элементом архитектуры. При построении катастрофоустойчивого

кластера необходимо предусмотреть прокладку основного и резервного каналов связи по разным маршрутам.

При формировании оптимального плана развития кластерной инфраструктуры чрезвычайно важен этап выбора правильной архитектуры, когда требуется определить, насколько уязвим бизнес и каково максимальное время простоя ИТ-инфраструктуры, при котором бизнесу не будет нанесен непоправимый ущерб.

Также важно определить, какую роль играет каждый конкретный сервер. Так, серверы, отвечающие за обслуживание сборочной линии, требуется восстановить быстрее. Однако если они расположены неподалеку от сборочной линии, то в случае землетрясения серверы выйдут из строя вместе с линией, поэтому запускать приложения, управляющие сборкой на удаленной площадке, не имеет смысла. С другой стороны, систему управления поставками можно запустить на другой площадке, обеспечив работу абонентских узлов отдела продаж и непрерывность поставок продукции.

Катастрофоустойчивость системы в аппаратной части обеспечивается:

- репликацией данных;

- географическим разнесением узлов;

- несколькими независимыми источниками питания;

- высоконадежной сетевой инфраструктурой.

Рассматриваемые архитектурные решения для возможного развития кластерной инфраструктуры корпорации включают совокупность узлов в центрах обработки информации. В свою очередь, узлы включают ряд структурных подразделений, участвующих в информационном пространстве на равных правах (приложения, дисковые массивы, арбитраторы и т.д.), связанных между собой коммуникационными каналами, обеспечиваемыми сетью высокой готовности, а для дисковых массивов предоставляется связь непрерывного доступа. Каждый центр обработки информации характеризуется величинами потребностей своих узлов в информационно-технических ресурсах и категорией катастрофоустойчивости для кластерной архитектуры в каждый период планирования развития инфраструктуры корпорации [2].

Категория катастрофоустойчивости центра обработки информации характеризуется, в первую очередь, значением кластер-кворума, а также составом комплекса используемых аппаратно-программных средств в узлах. Тогда процесс развития кластерной инфраструктуры корпорации, обеспечивающий последовательное поэтапное повышение уровня катастрофоустойчивости, представляется в виде набора путей на многодольном альтернативном графе, множество вершин которого отображает набор возможных категорий катастрофоустойчивости (тип кластера) каждого центра обработки информации в заданные периоды, а множество дуг - возможные переходы из одной категории в другую.

Задача планирования развития кластерной инфраструктуры состоит в поиске оптимального плана развития кластерного информационного пространства, который должен определить моменты ввода центров обработки информации, а также инфраструктуру кластерной сети в каждый период планирования. Необходимо также учитывать динамику изменения потребностей узлов системы и затраты на развитие кластерной сети корпорации.

В зависимости от конкретных особенностей постановки задачи формализуется критерий оптимальности для плана развития кластерной инфраструктуры корпора-

ции. В ряде случаев целесообразно ввести коэффициенты, учитывающие важность информационно-технических ресурсов, требуемых / -м подразделением (узлом кластера). Она зависит от приоритетности структурных подразделений системы корпоративного управления, обслуживаемых им, и значения кластер-кворума для соответствующего сценария поведения системы при отказах компонентов. При этом накладываются общие ограничения на затраты по созданию аппаратно-программных средств инфраструктуры (информационного пространства). Важными также являются ограничения на степень удовлетворения потребностей корпоративных пользователей в информационно-технических услугах по периодам планирования.

Рассматриваемая модель позволяет проводить оптимизацию и анализ вариантов развития кластерной инфраструктуры систем управления и обработки информации.

Считаем кластер-кворум динамической характеристикой, значение которой представляет собой целостность кластера в текущий момент времени. Для нашей постановки задачи кластер-кворум определён как минимальная целостность кластера, при которой он остаётся работоспособен. Это процентная характеристика, обозначающая минимальную часть кластера, способную справляться с возложенными на него задачами. Объясним на примере. Если значение кластер-кворума 40%, то это означает, что при выходе из строя 60% всего оборудования кластер способен стабильно работать на оставшихся элементах. Таким образом, в идеале кластер-кворум должен стремиться к 0.

Для расчёта значения кластер-кворума каждому узлу кластера экспертным путём проставляются веса. После этого соответственно весам рассчитывается процентный «эквивалент важности» для каждого узла. Далее составляются варианты нарушения целостности кластера с соответствующей оценкой работоспособности. Минимальное работоспособное значение целостности принимается за кластер-кворум.

Оптимизация процесса планирования развития кластерной инфраструктуры.

Имеется информационно-управляющая система, представляющая собой совокупность / кластеров. Обозначим номер кластера г = 1,1. Каждый кластер характеризуется: катастрофоустойчивой категорией (к — 1,К), районным коэффициентом и потребностью в кластер-кворуме (2и момент времени t. На интервале времени Т каждый период планирования I (t = 1,Т), выделяются материальные средства в размере Я, на развитие инфраструктуры системы кластеров. А районный коэффициент //, учитывает увеличение капитальных затрат на строительство

кластера в особых районах (северных, сейсмических и т.д.). Каждой категории к соответствует минимальное работоспособное значение целостности (кластер-

кворум) ()к и капитальные затраты (требуемые ресурсы) на развитие кластера Як.

Для формализации поставленной задачи введём следующие переменные величины:

Хш = 1, если /-Й кластер имеет к-ю категорию в г-й период планирования,

хш — 0 в противном случае.

Обозначим через = 0,и — ()к разность между требуемой минимальной целостностью /-го кластера в г-й период и кластер-кворумом к -й категории. Пусть

\-Qttr еслид1к,<0,

1 0, если <?ш > 0.

- [ч1к,> е°ли д1к1 > О,

к' [ 0, если <7(4, < 0.

Тогда выражение, характеризующее степень превышения потребностей в устойчивости к нарушению целостности, выглядит следующим образом:

12

/=/ 1=1 к-1

Условие выбора для каждого кластера одной категории из допустимого множества формализуется в виде:

=И = 1,и = 1,Т,

к=1

где I - общее количество кластеров.

Условие, ограничивающее набор возможных категорий /-го кластера в каждый I -й период, выглядит так:

к ______ ____

2^к- хш < Кit, i 1,Т,

к=1

mink

где Кн = q q минимальная категория, кластер-кворум которой полностью

удовлетворяет потребности / -го кластера в / -й период планирования (к = 1, К).

Учитывая районный коэффициент //,, ограничение на капитальные затраты в период времени / формализуется в следующем виде:

I К

У, А X! ' Х1к1 ~ &к ' Х1к(1-1) ) — В-1 ■

1=1 к=1

В нашем случае важным условием является удовлетворение потребительских запросов, и поэтому в качестве критерия оптимальности плана развития используем выражение (1), взятое по минимуму:

Т I К

~>гпт.

1=1 1=1 к=1

Таким образом, план, обеспечивающий минимум дефицита надёжности, на всём интервале времени, выделенном на развитие системы, будет являться оптимальным.

Для решения рассмотренной задачи предлагается использовать алгоритм, применяющий графовую формализацию, отражающую возможные варианты развития кластерной системы.

Заключение.

В работе рассмотрена формализация задачи планирования очередности и этап-ности создания сложных кластерных систем управления и обработки информации. В зависимости от конкретных особенностей постановки задачи предложен критерий оптимальности для плана развития кластерной инфраструктуры, на основе которого становится возможным проводить оптимизацию плана развития кластерной структуры конкретной катастрофоустойчивой системы обработки информации на заданный период развития.

Работа выполнена по теме гранта РФФИ 06-08-01532 «Теория оптимизации кластерных структур катастрофоустойчивых информационно-управляющих систем».

ЛИТЕРАТУРА

1. Царегородцев А.В. Теория построения иерархических информационно-управляющих систем. - М.: Изд-во РУДН, 2004.

2. Царегородцев А.В., Савельев И.А. Синтез кластерных структур информационно-управляющих систем // INTELS’2006 Интеллектуальные системы. - Труды VII международного симпозиума. - М. - 2006. - С. 97-100.

THE SOLUTION OF INCREASING SAFITY OF INFORMATIONAL CONTROL SYSTEMS BY CLUSTERED APPROACH

A.V. Tsaregorodtsev, I.A. Savelev

Technical Cybernetics’ Department Peoples’ Friendship University of Russia 6, Miklukho-MaklayaSt., Moscow, Russia, 117198

The problem of increasing safety to fail operations of informational control systems is considered in this work as the control of infrastructure’s evolution. The formalization of programming task and stage of creation compound clustered systems of control and process information is called attention hereinafter. Depending on specific property of task we are formalizing optimal criterion for planning clustered infrastructure’s evolution of corporation.

i Надоели баннеры? Вы всегда можете отключить рекламу.