3
КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 004.3
АНАЛИЗ ВЛИЯНИЯ НАКОПЛЕНИЯ ОТКАЗОВ КОММУНИКАЦИОННЫХ СРЕДСТВ НА СНИЖЕНИЕ КОММУНИКАЦИОННЫХ ВОЗМОЖНОСТЕЙ КОМПЬЮТЕРНЫХ
СИСТЕМ С РЕЗЕРВИРОВАНИЕМ В.А. Богатырев, Е.Ю. Котельникова
Анализируется влияние накопления отказов сетевых адаптеров и магистралей (коммутаторов) на снижение коммуникационных возможностей типовых структур компьютерных систем с резервированием коммуникационных средств, оценено отрицательное влияние числа и комбинаторного расположения отказавших сетевых адаптеров на снижение производительности коммуникационной подсистемы. Ключевые слова: отказоустойчивость, деградация, коммуникационная подсистема, среднее время пребывания запросов.
Введение
Высокая отказоустойчивость и производительность распределенных компьютерных, особенно управляющих, систем обеспечивается резервированием вычислительных и телекоммуникационных средств. Интенсивность снижения эффективности коммуникационной подсистемы зависит от числа и комбинаторного расположения отказавших сетевых адаптеров, связывающих компьютерные узлы с резервированными коммуникационными средствами (коммутаторами или магистралями).
Целью статьи является анализ влияния комбинаторного расположения отказавших сетевых адаптеров, связывающих компьютеры с резервированными коммуникационными средствами, на отказоустойчивость и снижение эффективности функционирования коммуникационной подсистемы.
Типовые структуры компьютерных систем с резервированной коммуникационной подсистемой
Типовые структуры управляющих компьютерных систем предусматривают резервирование коммуникационной подсистемы, построенной на основе магистралей или коммутаторов. Структура компьютерной системы, содержащей т равноправных компьютерных узлов, объединенных через п магистралей, приведена на рис. 1, а, а через п коммутаторов - на рис. 1, б. Структура двухуровневой компьютерной системы (например, с выделением клиентских и серверных компьютеров) приведена на рис. 2. Подключение компьютерного узла к одной магистрали или порту коммутатора требует одного сетевого адаптера (СА).
Состояние рассматриваемых резервированных коммуникационных подсистем
отображается матрицей ^^^^ , элемент которой $„=1, если 1-й узел способен к взаи-
II У\\пх.т
модействию с 1-й исправной магистралью (г-м коммутатором), т.е. осуществляющий соответствующее подключение адаптер исправен, в противном случае $/=0. В исходном состоянии при полнодоступном подключении компьютерных узлов к магистралям (коммутаторам) все элементы матрицы Эу = 1. При неполнодоступном подключении или в результате отказов часть элементов матрицы могут быть нулевыми [1]. При отказе г-й магистрали (коммутатора) все элементы г-й строки равны нулю.
п Коммутатор 1 Коммутатор п
а б
Рис. 1. Одноуровневая организация компьютерной системы: а - с резервированием магистралей, б - с резервированием коммутаторов
1 2 ГП1
12 3 т2
Рис. 2. Двухуровневая организация компьютерной системы Постановка задачи
Работоспособность и эффективность состояний коммуникационной подсистемы зависят не только от числа отказавших адаптеров и магистралей, но и от их комбинаторного расположения. В статье проводится оценка влияния накопления отказов сетевых адаптеров и магистралей (коммутаторов) на снижение коммуникационных возможностей типовых структур компьютерных систем с резервированием коммуникационных средств. Ставится задача оценки отказоустойчивости и эффективности взаимосвязи компьютерных узлов через коммуникационную подсистему при возникновении
различных комбинаций отказов сетевых адаптеров, отображаемых матрицей 11.
При бесприоритетной (циклической или случайной) дисциплине выбора магистралей для передачи оценивается влияние размещения отказавших адаптеров на сбалансированность загруженности различных магистралей и на среднее время пребывания запросов (пакетов) в коммуникационной подсети. Предполагается идентичность параметров всех однотипных коммуникационных средств и независимость их отказов. Функционирование компьютерных и коммуникационных узлов (коммутаторов или магистралей) представляется простейшими системами массового обслуживания типа М/М/1 с бесконечной очередью.
Условия работоспособности коммуникационной подсистемы
Для одноуровневых систем будем считать, что компьютерная система работоспособна, если между любой парой из т компьютерных узлов осуществима взаимосвязь хотя бы по одной из п магистралей для систем по рис. 1, а, или хотя бы через один коммутатор для систем по рис.1, б. Для двухуровневых систем по рис. 2 условие работоспособности коммуникационной подсистемы заключается в обеспечении взаимосвязи между компьютерными узлами разных уровней (например, между рабочими станциями и серверами), причем взаимосвязь между компьютерными узлами одного уровня
не обязательна. Для одноуровневых вычислительных систем (рис. 1) взаимосвязь между а-м и Ъ-м узлами поддерживается по /-ой магистрали, если сетевые адаптеры, связывающие с ней а-й и Ъ-й узлы, исправны, т.е. имеется хотя бы одна строка матрицы л , у которой в а-м и Ъ-м столбцах находятся единичные элементы.
II У\\п хт
Таким образом, для одноуровневых вычислительных систем признак отказа -возможность выделения в матрице л подматрицы из двух столбцов (а-го и Ъ-го),
II 3 11пхт
в каждой строке которой содержится не более одной единицы [9]. В этом случае отказ коммуникационной подсистемы возможен только после отказа С=п адаптеров. Максимальное число отказавших СА, при котором возможно сохранение функционирования системы, 9=(п-1)т. Заметим, что при отказе (п—1)т СА система работоспособна, если все т исправных СА подключены к одной из п магистралей.
Для двухуровневых вычислительных систем (рис. 2) выделим в матрице
л. две подматрицы 51 и 52 ( размерности п х т^ и п х т2, т + т = т), первая
\пхт
из которых отображает исправность адаптеров подключения к магистралям клиентов, а вторая - серверов.
Таким образом, для двухуровневых вычислительных систем признак отказа - возможность выделения в матрице л.. подматрицы 512 из двух столбцов (а-го и Ъ-го),
\пхт
один из которых принадлежит подматрице 51, а второй подматрице — 52, причем в каждой строке 512 содержится не более одной единицы [9].
Показатели отказоустойчивости коммуникационной подсистемы
Система показателей отказоустойчивости коммуникационной подсистемы должна отражать динамику сохранения эффективности при возникновении одного, двух или большего числа отказов СА.
Отказоустойчивость коммуникационной подсистемы характеризуют [2-5] следующие параметры: С - минимальное число и распределение отказов сетевых адаптеров и магистралей (коммутаторов), которое может привести к нарушению ее связности, т.е. к отказу коммуникационной подсистемы (С - число элементов, образующих минимальное сечение); 9 - максимальное число отказов СА, при котором возможно сохранение работоспособности коммуникационной подсистемы.
Условная вероятность сохранения работоспособности (связанности) резервированной коммуникационной подсистемы при наличии 5 отказов СА и Ы-п отказов магистралей (коммутаторов) вычисляется как =Ы в С*тп, где С*тп и N - общее число и число работоспособных состояний системы при условии возникновения 5 отказов СА ^9) и целостности п магистралей (коммутаторов).
Среднее число выдерживаемых коммуникационной подсистемой отказов СА при условии исправности п магистралей (коммутаторов) равно
9
= £ Л (1 "Рлп ) О" (1 " Р) ,
л=1
где р - надежность (вероятность работоспособности) СА. Среднее число выдерживаемых коммуникационной подсистемой отказов СА S с учетом состояний при различной кратности отказов магистралей (коммутаторов) равно
N 9
л = £ СПР0П (1 - Р0)N п £ л (1 -Рлп) стпрпт-л (1 - Р)л,
п=1 л=1
где ро - надежность (вероятность работоспособности) одного коммутатора (магистрали).
Исследуемые системы относятся к категории сложных систем с множеством работоспособных состояний, обладающих различной эффективностью взаимосвязи, поэтому в качестве основного показателя надежности таких систем рекомендуется [4, 5] коэффициент сохранения эффективности Кэф. При расчете Кэф каждому состоянию объекта, определенному совокупностью состояний его элементов (СА), сопоставляется доля сохраняемой номинальной эффективности от 0 до 1 [4]. Для коммуникационной подсистемы эффективность состояний определим величиной, обратной среднему времени пребывания в системе запросов на передачу кадров. В этом случае коэффициент сохранения эффективности определим как N е
кЭф = ХСПРо" (1 - 1ХРС рпт-5 (1 - р)5 ,
"=1 5=1
где Ет=ж/жт, а ж и - соответственно среднее время пребывания кадров (запросов) в исходном состоянии системы (без отказов СА и магистралей) и в системе с отказом ^ СА и Ы-п магистралей.
Условную вероятность сохранения работоспособности (связанности) резервированной коммуникационной при наличии ^ отказов СА и (Ы-п) отказов магистралей (коммутаторов) для одноуровневых компьютерных систем можно приближенно вычислить на основе комбинаторного метода включения исключения [6-9]:
в .О^т + О"-1)
в 5"
С
5
тп
Оценка влияния накопления отказов на снижение эффективности коммуникационной подсистемы
Снижение эффективности функционирования по мере накопления отказов, выраженное как Ет=№/жт, во многом определяется влиянием на среднее время пребывания запросов (кадров) несбалансированности каналов взаимосвязи, возникающей при существенной разнице числа исправных СА, подключенных к разным магистралям (коммутаторам).
Каждое состояние коммуникационной подсистемы представляется матрицей 5 , при этом среднее время пребывания запросов при распределении потока за-
II \\nxm
просов по всем исправным магистралям определяется как
" Ъу
т =у-
5" / 1 л
7=1 1 -
-=1 1 - Ъ Ху
где ЬI - вероятность передачи кадра через /-ю магистраль (коммутатор), V - среднее время передачи кадра через магистраль, X - интенсивности входного потока запросов на передачу кадров между компьютерами.
Зависимости доли сохранения эффективности относительно исходного состояния (при исправности всех коммуникационных средств) вычислим как
/Г Л
(" Ъу Л
Е =
5"
^ 1
-=1 1
V -=1 1- Ъ-Ху Л
V
Ху
1 -
V п У
Для одноуровневых вычислительных систем (рис. 1), содержащих т компьютеров и п магистралей (коммутаторов), вероятность передачи через /-ю магистраль составляет
Ъ = С
где числитель определяет число всевозможных пар компьютеров, связь между которыми возможна по 1-й магистрали.
Для двухуровневых вычислительных систем (рис. 2) с п магистралями (коммутаторами), содержащих т компьютеров, в том числе т1 клиентских и т2 серверных узлов, вероятность передачи через /-ю магистраль равна
Ь =
т
Е
V у=1
V у
"*2
2:
=т +1
Я-
^ т.1
(е
V у=1
Я
Vу
2
2: ■
= т +1
а для двухуровневых компьютерных систем при серверах, подключенных к п магистралям (коммутаторам) через все исправные СА,
т I п т
ь = ЕЕЕ■
] =1 / i=l у=1
В последнем случае зависимостям среднего времени пребывания кадров от интенсивности входного потока X при связанности клиентских компьютеров с магистралями, представленной матрицами 51 вида
1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1
0 0 0 0 0 1 1 1 1 1 1 111110 11111 1 1 1 1 1 1 0 0 0 0 0
0 1111111111 1 0 0 0 0 0 0 0 0 0 1 11111111110
соответствуют кривые 1-3 на рис. 3 (подматрица 52 содержит все единицы). Расчеты проведены при среднем времени передачи кадра у=1 с.
Зависимости доли сохранения эффективности Е после отказов СА для второй и третьей матриц 51 относительно исходного состояния при у=1 с представлены кривыми 2 и 1 на рис. 4.
10
Т, с
6
О
3 /
/ I 1 м / 2 / J / 1
/Л
а
0.5
1.5
1/с
Рис. 3. Среднее время пребывания кадров в коммуникационной подсистеме
Из представленных на рис. 3 и 4 графиков следует, что при равномерном распределении единиц в матрице 5 (характеризующем расположение исправных СА) существенно повышается эффективность конфигурации (даже при одинаковом числе сохраненных СА), следовательно, при выборе структур с неполнодоступным подключением компьютеров к коммутаторам (магистралям) следует решать оптимизационную задачу.
0Г6
0,4
0.21-^
0 0.5 1 1,5 2
к , 1/с
Рис. 4. Доля сохранения эффективности при отказах адаптеров относительно исходного состояния
Выводы
Оценено отрицательное влияние накопления отказов сетевых адаптеров и магистралей (коммутаторов) на снижение коммуникационных возможностей типовых структур компьютерных систем с резервированием коммуникационных средств.
Предложена оценка отрицательного влияния отказов сетевых адаптеров на сбалансированность коммуникационной системы, снижающую ее производительность, для одноуровневых и многоуровневых вычислительных систем в зависимости от взаиморасположения отказавших сетевых адаптеров.
Рассмотренные оценки рекомендуются к использованию при выборе протоколов взаимосвязи, обеспечивающих после возникновения отказов сетевых адаптеров сбалансированность нагрузки резервированной коммуникационной подсистемы.
Литература
1. Богатырев В.А. Отказоустойчивость и сохранение эффективности функционирования многомагистральных распределенных вычислительных систем // Информационные технологии. - 1999. - № 9. - С. 44-48.
2. Волик Б.Г. О дискуссии на IV Всесоюзном совещании «Надежность, живучесть и безопасность автоматизированных комплексов» // Приборы и системы управления. - 1989. - № 11. - С. 2-3.
3. Черкесов Г.Н. Методы и модели оценки живучести сложных систем. - М.: Знание, 1987. - 56 с.
4. ГОСТ 27.003-90. Надежность в технике. Состав и общие правила задания требований по надежности. - М.: Издательство стандартов, 1991. - 27 с.
5. ГОСТ 27.301-95. Надежность в технике. Расчет надежности. Основные положения. - М.: Издательство стандартов, 1996. - 15 с.
6. Богатырев В.А. К оценке среднего времени ожидания передачи кадров через резервированный канал с ограниченными коммуникационными возможностями магистралей // Автоматика и вычислительная техника. - 1998. - № 1. - С.77-80.
7. Богатырев В.А. Комбинаторный метод оценки отказоустойчивости многомагистрального канала // Методы менеджмента качества. - 2000. - № 4. - С. 30-35.
8. Богатырев В.А. Комбинаторно-вероятностная оценка надежности и отказоустойчивости кластерных систем // Приборы и системы. Управление, контроль, диагностика. - 2006. - № 6. - С.21-26.
9. Богатырев В.А. Надежность и эффективность резервированных компьютерных сетей // Информационные технологии. - 2006. - № 9. - С. 25-30.
Богатырев Владимир Ана- -тольевич
Котельникова Елена Юрьевна -
Санкт-Петербургский государственный университет информационных технологий, механики и оптики, доктор технических наук, профессор, [email protected]
Санкт-Петербургский государственный университет информационных технологий, механики и оптики, аспирант, [email protected].
УДК 519.179.2
ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ В ЭВОЛЮЦИОНИРУЮЩИХ ПО ГЕНЕТИЧЕСКИМ
АЛГОРИТМАМ СЕТЯХ А.А. Короновский, А.А. Косицын, О.И. Москаленко, А.Е. Храмов
Представлены результаты исследования кооперативных явлений в сетях со сложной топологией. Для моделирования процессов эволюции разработан генетический алгоритм эволюции сложных сетей. Проанализированы переходные процессы, наблюдающиеся в ходе эволюции. Обнаружены определенные закономерности при оптимизации сети.
Ключевые слова: сети со сложной топологией, генетический алгоритм, центральность, переходной процесс, перемежаемость.
Введение
Исследование кооперативных явлений в сетях со сложной топологией представляется в настоящее время одной из актуальных задач нелинейной динамики [1]. Интерес к подобным системам обусловлен, прежде всего, наличием большого числа объектов в природе и технике, которые можно описать с помощью сетевых моделей. Энергетические сети, железнодорожные сети, сети авиаперевозок, метро, всемирная сеть Интернет, социальные сети, сети соавторства, компьютерные сети - вот далеко не полный список объектов, к которым может быть применено понятие сети [2]. Понятно, что ни одна из вышеперечисленных сетей не является постоянной, характеристики каждой из них меняются с течением времени.
Поэтому в последнее время значительное внимание исследователей привлечено к изучению эволюционных процессов в сетях [3]. Эта проблема касается, прежде всего, биологических и экологических объектов, для которых понятие эволюции кажется очевидным. Большая часть систем в биологии и экологии эволюционирует по генетическим алгоритмам. Идея генетических алгоритмов состоит в организации эволюционного процесса, конечной целью которого является получение оптимального результата. Длительность эволюционных процессов является достаточно большой, а достижение оптимального результата зависит от ряда критериев. Понятно, что предсказание результата эволюции является нетривиальной задачей, поэтому возможна постановка задачи оптимизации тех или иных характеристик сети в процессе эволюции. На решение этой задачи как раз и направлена настоящая работа. В рамках исследования коопера-