Сведения об авторах
Василий Сергеевич Дужин — аспирант; Санкт-Петербургский государственный университет аэро-
космического приборостроения, кафедра безопасности информационных систем; E-mail: [email protected] Григорий Сергеевич Евсеев — канд. техн. наук, доцент; Санкт-Петербургский государственный уни-
верситет аэрокосмического приборостроения, кафедра моделирования вычислительных и электронных систем; E-mail: [email protected] Евгений Михайлович Линский — канд. техн. наук, доцент; Санкт-Петербургский государственный университет аэрокосмического приборостроения, кафедра безопасности информационных систем; E-mail: [email protected]
Рекомендована кафедрой Поступила в редакцию
№ 51 безопасности информационных систем 01.02.13 г.
УДК 681.3
В. А. Богатырев, С. В. Богатырев, А. В. Богатырев
ОЦЕНКА НАДЕЖНОСТИ ОТКАЗОУСТОЙЧИВЫХ КЛАСТЕРОВ С НЕПОСРЕДСТВЕННЫМ ПОДКЛЮЧЕНИЕМ УСТРОЙСТВ ХРАНЕНИЯ
Предложен подход к оценке надежности кластеров с прямым подключением двухвходовых устройств хранения и серверов при ограничении предельно допустимого времени пребывания запросов в системе. Проанализировано влияние вариантов такого подключения на надежность системы с учетом вероятности выполнения запросов в заданные сроки.
Ключевые слова: отказоустойчивость, кластер, надежность, резервирование, устройство хранения, сервер.
Введение. Высокие отказоустойчивость, доступность, надежность и производительность распределенных вычислительных систем достигаются при объединении узлов обработки и хранения данных в кластеры [1, 2].
При построении небольших кластерных систем в ряде случаев целесообразно прямое подключение узлов разных уровней между собой, например, серверных узлов и устройств хранения (архитектура DAS, Directly Attached Storage [1]).
Поскольку надежность и производительность кластера зависят от вариантов объединения его узлов, представляет интерес исследование альтернатив, обеспечивающих большую отказоустойчивость, надежность и доступность системы при одинаковых затратах на ее реализацию [3—5].
Двухуровневые структуры с непосредственным подключением резервированных узлов. Рассмотрим варианты конфигурации двухуровневых кластерных систем. Будем считать, что на верхнем уровне (ВУ) выделяется m дублированных узлов. Таким образом, общее число узлов верхнего уровня равно 2m, общее число узлов нижнего уровня (НУ) будем также считать равным 2m. Узлы верхнего уровня объединяются в пары (дублируются) по функциональной принадлежности реализуемых приложений или по разделению обслуживаемого ими потока запросов [6—9].
Представляет определенный интерес исследование вариантов построения кластеров с прямым подключением узлов разного уровня, в частности серверов, к устройствам хранения [1, 2]. Цель таких исследований — выбор конфигурации, обеспечивающей при одинаковых затратах на реализацию системы ее большую отказоустойчивость, надежность и доступность.
В рамках указанного направления в работах [10, 11] исследованы варианты прямого подключения дублированных серверов к устройствам хранения без учета ограничений на время обслуживания запросов. Поскольку для систем, функционирующих в реальном времени, такие ограничения важны, в настоящей статье исследуется влияние конфигураций прямого подключения узлов двухуровневого кластера на выполнение функциональных запросов при ограничении времени их пребывания в системе.
Варианты построения кластера. Рассмотрим конфигурации кластерных систем с непосредственным подключением устройств хранения к серверам приложений т типов [10, 11]. На рис. 1 приведены варианты кластеров: а — Б1, б — Б2 , в — Б3. Будем считать, что запрос у'-го потока (к /-му приложению) может быть обслужен хотя бы одним из выделенных для этого потока серверов (сервером /-го приложения) при взаимодействии с любым из подключенных к нему устройств хранения (узлов НУ). Кратность резервирования серверов будем считать 2/1, в этом случае общее число узлов ВУ 2т, общее число узлов НУ также будем считать равным 2т.
Запросы
Запросы
Рис. 1
Будем считать, что все серверы и устройства хранения (узлы ВУ и НУ) имеют по два порта (входа), что позволяет строить резервированные системы с отсутствием единой точки отказа без использования коммутаторов, которые в ряде случаев могут вносить дополнительную ненадежность в систему.
Проанализируем надежность представленных на рис. 1 вариантов структур [11] с учетом ограничений по предельно допустимому времени обслуживания запросов. Подчеркнем что эти варианты характеризуются одинаковыми затратами на их построение, но позволяют достичь различных уровней надежности и отказоустойчивости, что и обусловливает актуальность их исследования.
При исправности двух резервированных серверов некоторого приложения конфигурации Б1, Б2 и Б3 сохраняют функциональность, если действует хотя бы одно из двух, трех либо четырех связанных с рассматриваемыми серверами устройств хранения соответственно. При дееспособности одного сервера приложения для всех вариантов конфигураций (см. рис. 1) функциональность сохраняется, если исправно хотя бы одно из двух связанных с сервером устройств хранения. Таким образом, отказоустойчивость конфигурации Б3 выше, оценим надежность ее и базовой конфигурации [10].
Вычислим вероятность безотказной работы (ВБР) конфигурации (рис. 1, а) при условии исправности хотя бы одного сервера и одного устройства хранения в каждой из т дублированных групп [11]:
Жг) =
1 -(1 - Р1(г) )2 ?1 -(1 - Р2(г) )2
где Р1 (г) = ехр(-^), Р1 (г) = ехр(-^), Х1, Х2 — интенсивность отказов сервера и устройства хранения.
В этой формуле не введены ограничения на время выполнения запросов, характерные для систем реального времени. С учетом этих ограничений считается, что система может выполнить некоторое приложение (поток запросов), если запрос может быть обслужен хотя бы одним узлом ВУ и хотя бы одним узлом НУ, а время пребывания запросов не превышает
Будем считать, что среднее время обслуживания запросов в серверах включает их взаимодействие с устройствами хранения, тогда
) =
1 - (1 - р2 ())21 \(( ())2 + 2р ()(1 - р ())gl
Вычислим вероятность того, что время пребывания запросов в г параллельно работающих серверах меньше ^ [12]:
gг =
0, г/ (Лу / г)> 1, 1 ехр(-Г!-Л],-г/ (Лу/г) < 1,
Оценим ВБР системы для конфигураций Б2 и Б3 при условии непревышения ^ (ограничения по времени пребывания запросов не учитываются, т.е. g1=1, g2=1):
Р2Ц) =
Рз(<) =
1 - (1 - Р2 ())31 (Р1 ())2 g2 + 2р ()(1 - Р1 ()) [1 - (1 - Р2 ())2
1 -(1 -Р2(г))4 ((г))2 g2 + 2рх(г)(1 -рх(г)) 1 -(1 -р2(г))
gl.
Кривые 1—3 на рис. 2 иллюстрируют результаты расчета вероятности безотказной работы структур —Б3 при Х1=10-4, Х2=2-10-4 ч-1. Из графиков видна зависимость ВБР исследуемых структур от варианта соединения двухвходовых серверов и устройств хранения, причем затраты на реализацию сравниваемых структур одинаковы.
0,99
0,98
0,97
0,96
0,95
ч ч" 3 ч 2 \
1 \
200
400 600 Рис. 2
800
и ч
На рис. 3 представлены результаты расчета вероятности выполнения запросов за время, меньшее ¿0 (Х1=10-4, Х1=2-10-4 ч-1, среднее время обслуживания запроса сервером, с учетом обращений к системе хранения — 1 с). Кривые 1, 2 соответствуют ВБР конфигураций Б3 и Б1;
0
кривые 3, 4, 5 для конфигурации Б3 (6, 7, 8 — для Б1) соответствуют вероятности выполнения запросов при ¿0=10, 5, 2 с соответственно. Интенсивность потока рассматриваемых функциональных запросов 1 с-1(рис. 3, а) и 1,5 с-1 (рис. 3, б).
Рис. 3
Проведенные расчеты подтвердили существенную зависимость надежности кластеров от порядка прямого подключения устройств хранения к серверам приложений при явном преимуществе конфигурации S3 по отказоустойчивости, ВБР и надежности в случае выполнения запросов в установленные сроки.
Заключение. Предложен подход к оценке надежности кластерных вычислительных систем с прямым подключением двухвходовых устройств хранения и серверов, позволяющий учитывать вероятность выполнения запросов при непревышении предельно допустимого времени их пребывания в системе. Продемонстрировано влияние вариантов подключения серверов и устройств хранения на надежность системы при одинаковых издержках на ее реализацию. Даны рекомендации по выбору вариантов конфигурации резервированных кластеров.
СПИСОК ЛИТЕРАТУРЫ
1. Juud J. Principles of SAN Design. San Jose: Brocade Bookshelf, 2008. 589 p.
2. Clark T. The New Data Center. New technologies are radically reshaping the data center. Brocade Bookshelf. San Jose, 2010. 156 p.
3. Богатырев В. А. Надежность функционально-распределенных резервированных структур с иерархической конфигурацией узлов // Изв. вузов. Приборостроение. 2000. Т. 43, № 4. С. 67—70.
4. Богатырев В. А. О влиянии размещения функциональных ресурсов на отказоустойчивость информационно-вычислительных систем с функциональной реконфигурацией // Информационные технологии. 2002. Т. 45, № 2. C. 10—15.
5. Богатырев В. А. Безотказность систем из функционально неоднородных модулей // Приборы и системы. Управление, контроль, диагностика. 2002. № 3. С. 6—8.
6. Богатырев В. А. К размещению резервированных функциональных ресурсов в системах с функциональной реконфигурацией // Управляющие системы и машины. 2003 № 3. С. 42—45.
7. Богатырев В. А . Надежность вариантов размещения функциональных ресурсов в однородных вычислительных сетях // Электронное моделирование. 1997. № 3. С. 21—25.
8. Богатырев B. А. К оценке надежности систем из многофункциональных модулей // Автоматизация и современные технологии. 2001. № 6. С. 12—15.
9. Богатырев В. А., Богатырев С. В. Объединение резервированных серверов в кластеры высоконадежной компьютерной системы // Информационные технологии. 2009. № 6. C. 41—47.
10. Bogatyrev V. A. Fault Tolerance of Clusters Configurations with Direct Connection of Storage Devices // Automatic Control and Computer Sciences. 2011. Vol. 45, N 6. P. 330—337.
11. Богатырев В. А., Богатырев А. В., Богатырев С. В. Надежность кластерных вычислительных систем с дублированными связями серверов и устройств хранения // Информационные технологии. 2013. № 2. С. 27—32.
12. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432 с.
Владимир Анатольевич Богатырев
Станислав Владимирович Богатырев
Анатолий Владимирович Богатырев
Рекомендована кафедрой № 51 безопасности информационных систем
Сведения об авторах
д-р техн. наук; Санкт-Петербургский государственный университет аэрокосмического приборостроения, кафедра безопасности информационных систем; профессор; E-mail: [email protected]
Санкт-Петербургский государственный университет аэрокосмического приборостроения, кафедра безопасности информационных систем; младший научный сотрудник; E-mail: [email protected]
аспирант; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра вычислительной техники; E-mail: [email protected]
Поступила в редакцию 01.02.13 г.