Научная статья на тему 'Кластерная система компьютерной обработки данных высокой готовности'

Кластерная система компьютерной обработки данных высокой готовности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
197
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
CLUSTER / FAILOVER / HIGH AVAILABILITY / DATA PROCESSING / COMPUTER / SERVER / SERVICE / COMPUTER SYSTEMS / SOFTWARE / HARDWARE / СИСТЕМА КОНТРОЛЯ И УПРАВЛЕНИЯ ДОСТУПОМ / БЕЗОПАСНОСТЬ / КОНТРОЛЬНО-ПРОПУСКНОЙ РЕЖИМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Потресов Дмитрий Кириллович, Скоморохов Данил Владимирович

Рассмотрен и исследован кластер компьютерной обработки данных высокой готовности, который предназначен для обеспечения высокой доступности и гибкой экономичной масштабируемости, защищая от сбоев программную и аппаратную части, обеспечивая непрерывный доступ к данным.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Потресов Дмитрий Кириллович, Скоморохов Данил Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HIGH AVAILABILITY CLUSTER SYSTEM OF THE COMPUTER DATA PROCESS-ING

Considered and investigated a cluster of computer processing high availability, which is designed to provide high availability and flexible cost-effective scalability, fault-tolerant hardware and software, providing continued access to data.

Текст научной работы на тему «Кластерная система компьютерной обработки данных высокой готовности»

- © Д.К. Потресов, Д.В. Скоморохов, 2013

УДК 004.052; 004.056

Д.К. Потресов, Д.В. Скоморохов

КЛАСТЕРНАЯ СИСТЕМА КОМПЬЮТЕРНОЙ ОБРАБОТКИ ДАННЫХ ВЫСОКОЙ ГОТОВНОСТИ

Рассмотрен и исследован кластер компьютерной обработки данных высокой готовности, который предназначен для обеспечения высокой доступности и гибкой экономичной масштабируемости, защищая от сбоев программную и аппаратную части, обеспечивая непрерывный доступ к данным. Ключевые слова: система контроля и управления доступом, безопасность, контрольно-пропускной режим.

Обеспечение непрерывности работы информационных систем - одна из очевидных и наиболее сложных задач создания ИТ-инфраструктуры.

Надежность корпоративных компьютерных систем обработки данных, их способность ежесекундно обеспечивать пользователей оперативной и достоверной информацией - одно из важнейших условий эффективной работы и, в конечном счете, конкурентоспособности современных компаний. Сегодня существует множество технических решений, обеспечивающих необходимый уровень надежности и отказоустойчивости информационных систем, и один из краеугольных камней таких решений - кластеризация серверных систем, за счет которой поддерживается высокий уровень готовности.

Говоря о кластерных системах высокой готовности, необходимо четко понимать, что основополагающим элементом стратегии развертывания подобных систем на предприятии выступает отнюдь не используемое в них аппаратное или программное обеспечение, а набор грамотных экспертно-аналитических и консультационных услуг, предоставляемых либо самим поставщиком, либо его партнером-интегратором, и нацеленных на адаптацию имеющихся типовых программно-аппаратных решений к реальным требованиям и условиям информационной системы заказчика.

Построение эффективной и качественной кластерной системы компьютерной обработки данных высокой готовности представляет собой достаточно сложную задачу, решение которой требует от поставщика глубоких знаний и опыта, хотя

сам процесс опирается на использование стандартизованных программных и аппаратных средств. В известной степени можно утверждать, что каждая новая реализация кластерной системы компьютерной обработки данных высокой готовности - это в определенном смысле уникальная задача, решение которой не терпит легкомысленного отношения ни со стороны поставщика, ни со стороны заказчика.

Еще один важный вопрос, часто возникающий при построении кластерной системы компьютерной обработки данных высокой готовности, - адекватность используемых аппаратных средств решаемым с их помощью задачам. Построение отказоустойчивых кластеров предполагает использование в качестве узловых машин высоконадежных серверов с двукратным, а иногда и многократным, дублированием всех основных блоков и компонентов. Противоположный подход, привнесенный из области вычислительных кластерных систем и проповедуемый некоторыми поставщиками, состоит в том, что сама кластерная архитектура признается единственным необходимым и достаточным условием для обеспечения высокой готовности систем обработки данных, а аппаратная база отдается на откуп дешевым, легко заменяемым и ненадежным компонентам. Этот подход не только ошибочен, но даже опасен, так как дает заказчикам лишь иллюзию высокой готовности и надежности их информационно-вычислительных систем.

Типовая схема компьютерной кластерной системы высокой готовности, изображенная на рисунке, подразумевает объединение двух или более (в зависимости от конкретной решаемой задачи) серверов в целостную систему, снаружи видимую пользователями как единый сервер, исполняющий то или иное корпоративное приложение, например, СУБД или БИР-систему.

На данном рисунке кластер состоит из двух узлов (серверов), подключенных к общему дисковому массиву. Все основные компоненты этого дискового массива - блок питания, дисковые накопители, контроллер ввода/вывода -имеют резервирование с возможностью горячей замены. Узлы кластера соединены между собой внутренней сетью для обмена информацией о своем текущем состоянии. Электропитание кластера осуществляется от двух независимых источников. Подключение каждого узла к внешней локальной сети также дублируется.

Рис. 1. Принципиальная схема кластера компьютерной обработки данных высокой готовности: 1 - внешняя сеть; 2 - внутренняя сеть; 3 -узел 1; 4 - узел 2; 5 - консоль управления; 6 - общий дисковый массив; 7 -интерфейс SCSI или Fibre Channel; 8 - компьютеры1-клиенты

Таким образом, все подсистемы кластера имеют резервирование, поэтому при отказе любого элемента кластер в целом останется в работоспособном состоянии. Более того, замена отказавшего элемента возможна без остановки кластера.

Принцип работы предлагаемого компьютерного кластера следующий. Приложение (служба), доступность которого обеспечивается кластером, устанавливается на обоих узлах. Для этого приложения (службы) создается группа ресурсов, включающая IP-адрес и сетевое имя виртуального сервера, а также один или несколько логических дисков на общем дисковом массиве. Таким образом, приложение вместе со своей группой ресурсов не привязывается «жестко» к конкретному узлу, а, напротив, может быть запущено на любом из этих узлов (причем на каждом узле одновременно может работать несколько приложений). В свою очередь, клиенты этого приложения (службы) будут «видеть» в сети не узлы кластера, а виртуальный сервер (сетевое имя и IP-адрес), на котором работает данное приложение.

Сначала приложение запускается на одном из узлов. Если этот узел по какой-либо причине прекращает функционировать, другой узел перестает получать от него сигнал активности и автоматически запускает все приложения отказавшего узла, т.е. приложения вместе со своими группами ресурсов «мигрируют» на исправный узел. В зависимости от типа приложения

после рестарта сеанс возобновляется автоматически либо может потребоваться повторная авторизация клиента. Никаких изменений настроек со стороны клиента не нужно. После восстановления неисправного узла его приложения могут мигрировать обратно.

Если на каждом узле кластера работают различные приложения, то в случае отказа одного из узлов нагрузка на другой узел повысится и производительность приложений упадет.

Если приложения работают только на одном узле, а другой узел используется в качестве резерва, то при отказе «рабочего» узла производительность кластера не изменится (при условии, что запасной узел не «слабее»).

Для связи вовне и передачи данных от потребителей и к ним в большинстве случаев используется стандартное соединение Fast Ethernet или получающий все большее распространение стандарт Gigabit Ethernet, реже - ATM. Между собой серверы общаются посредством так называемого интерконнекта -специальной выделенной сети для синхронизации состояний и посылки команд перезапуска заданий на резервном узле в случае обнаружения сбоев или отказов на основном. Набор вариантов для организации интерконнекта достаточно широк - от хорошо известных и достаточно распространенных Myrinet, InfiniBand или Scalable Coherent Interface (SCI) до узкоспециализированных фирменных разработок, - и поставщики могут применять любой из них по собственному усмотрению, лишь бы он обладал достаточной скоростью. Тут важно отметить, что, в отличие от вычислительных кластеров, где между узлами передается значительный объем информации и соответственно возникает потребность в высокой пропускной способности, в кластерных системах высокой готовности, за исключением служебных команд, между узлами практически нет обмена трафиком, однако сами команды должны передаваться максимально быстро, и потому здесь используются стандарты с как можно меньшим временем задержки.

Взаимодействие с системами хранения, как и в случае с высокопроизводительными серверами, организовано максимально гибко: можно использовать любые схемы и протоколы - от прямого подключения до решений NAS и SAN, присоединяемых по оптоволокну. Здесь основную роль играют потребности заказчика и реальные условия его системы, исходя из кото-

рых и выбирается конкретное решение. Естественно, во все этих случаях сетевые интерфейсы для повышения надежности как минимум дублируются.

Реальная кластерная система компьютерной обработки данных высокой готовности строятся в одной из двух базовых архитектур - с разделением ресурсов (share something) или без разделения ресурсов (share nothing). В первом случае (яркий пример - Oracle Real Application Clusters) благодаря внутренней логике промежуточного ПО задача заказчика «размазывается» по серверам, входящим в кластер (вот где видна реальная польза от включения в кластерную систему нескольких серверов сразу), и на каждом сервере исполняется некоторая ее часть. Такой подход позволяет повысить эффективность вложения средств, удачно сочетая высокую отказоустойчивость и производительность на относительно недорогих аппаратных средствах. Во втором случае задача заказчика целиком и полностью решается на головном узле системы, а второй сервер фактически играет роль горячего резерва, способного в любой момент времени подхватить «упавшее» приложение. Какой вариант организации кластерной системы использовать, зависит от уже развернутой в компании ИТ-инфраструктуры и в каждом конкретном случае определяется исходя из задач заказчика и программных сред для их решения.

Кластеры высокой готовности решают следующие задачи:

• постоянное обеспечение максимальной готовности любых приложений круглые сутки, независимо от каких-либо сбоев операционной системы, устройств хранения данных, приложений либо инфраструктуры;

• перевыполнение в рамках выделенного бюджета конкретных обязательств по определенному уровню обслуживания (SLA);

• обеспечение максимально высокой доступности на имеющейся базе (оборудование, инфраструктура);

• защита «кластерных» приложений, а также всего программного обеспечения;

• создание определенного решения с целью обеспечения локальной высокой доступности, а также восстановления данных (аварийного восстановления) в случае полного отключения площадки;

• уменьшение простоев операционной системы по причине частых сбоев, а также сокращение перерывов для обновления оборудования, модернизации программного обеспечения и пр.;

• высокий контроль и максимальное обеспечение доступности самых важных приложений, баз данных и других служб -как дополнение к обычной защите (на уровне системы);

• гарантирование высокой доступности в виртуальных, реальных и смешанных средах.

Основным преимуществом кластеров высокой готовности является возможность использования стандартного оборудования и программного обеспечения, что делает это решение недорогим и доступным для внедрения предприятиями малого и среднего бизнеса.

Заключение

Кластерная система компьютерной обработки данных высокой готовности дает возможность радикально снизить эксплуатационные затраты и обеспечить новый уровень гибкости, делая корпоративные системы более адаптивными и динамичными.

Динамическое обеспечение узлами, устройствами хранения, центральными процессорами и оперативной памятью позволяет быстро и эффективно гарантировать необходимые уровни обслуживания при одновременном снижении затрат за счет лучшего использования ресурсов.

- СПИСОК ЛИТЕРАТУРЫ

1. Авен О.И., Гурнн H.H., Коган Я.А. Оценка качества и оптимизация вычислительных систем. М.: Наука, 1982. - 464 с.

2. Будзко В. И. Количественные оценки отказоустойчивых и катастрофоустойчивых решений. Вопросы защиты информации: Науч.-пракг. журн./ ФГУП «ВИМИ», 2003. Вып. 2. - С. 19-32.15.

3. Беленков В.Г., Будзко В.И., Синицин И.Н. Катастрофоустойчивость корпоративных автоматизированных систем /Системы и средства информатики /Под ред. И.А. Соколова/Вып. 12 -М.: Наука, 2002. 314 с. -С. 41-47.

4. Альянах И.Н. Моделирование вычислительных систем. JL: Машиностроение, 1988. - 223с. ГТТШ

КОРОТКО ОБ АВТОРАХ -

Потресов Дмитрий Кириллович - профессор, доктор технических наук; Скоморохов Данил Владимирович - студент магистратуры, Московский государственный горный университет, ud@msmu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.