Научная статья на тему 'Принципы построения межведомственного центра коллективного пользования общего назначения в модели программно-определяемого ЦОД'

Принципы построения межведомственного центра коллективного пользования общего назначения в модели программно-определяемого ЦОД Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
210
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГРАММНО-ОПРЕДЕЛЯЕМЫЕ ЦОД / ОБЛАЧНЫЕ ВЫЧИСЛЕНИЯ / РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ / ВИРТУАЛИЗАЦИЯ / SOFTWARE-DEFINED DATA CENTER / CLOUD COMPUTING / DISTRIBUTED COMPUTING / VIRTUALIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шабанов Б.М., Самоваров О.И.

Центр обработки данных (ЦОД) является наиболее прогрессивной формой предоставления вычислительных ресурсов, когда необходимо обеспечить обслуживание широкого круга пользователей. В статье рассматривается один из подходов к созданию ЦОД концепция программно-определяемой инфраструктуры. Программно-определяемой является такая инфраструктура ЦОД, в которой все ее ключевые элементы вычислительные ресурсы, сеть, системы хранения данных и пр. виртуализованны и предоставляются пользователям как сервисы с заданным качеством. Показано, что реализация предлагаемой инфраструктуры позволяет обеспечить возможность каждому пользователю продуктивно решать свои задачи за приемлемое время c приемлемым уровнем затрат. В статье формулируются общие требования, предъявляемые к центрам обработки данных межведомственного уровня, предлагаются методы создания программно-определяемого ЦОД (развертывание вычислительных платформ, обеспечивающих максимальное переиспользование аппаратуры, обеспечение поддержки выполнения программ разных классов задач и пр.) и описываются реализации инфраструктур данного класса в конкретных проектах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шабанов Б.М., Самоваров О.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Building the Software Defined Data Center

Data Center is the most progressive form of providing computing resources when it is necessary to provide services to a wide range of users. The paper discusses one of the approaches to the creation of a data center the concept of software-defined infrastructure. Software-defined is such a data center infrastructure, in which all its key elements computing resources, network, data storage systems, etc. are virtualized and provided to users as services with a given quality. It is shown that the implementation of the proposed infrastructure allows each user to productively solve their tasks in a reasonable time with an acceptable level of costs. The paper formulates the general requirements for inter-departmental data processing centers, proposes methods for creating software-defined data center (deployment of computing platforms that maximize hardware reuse, provide support for the execution of programs of different classes of tasks, etc.) and describes the implementation of infrastructures of this class in specific projects.

Текст научной работы на тему «Принципы построения межведомственного центра коллективного пользования общего назначения в модели программно-определяемого ЦОД»

Принципы построения межведомственного центра коллективного пользования общего назначения в модели программно-определяемого ЦОД

1 Б.М. Шабанов <shabanov@jscc.ru>

2 О.И. Самоваров <samov@ispras.ru>

1 ФГУ ФНЦ НИИСИ РАН, 117218, Москва, Нахимовский просп., 36, к.1 2 Институт системного программирования РАН, 109004, Россия, г. Москва, ул. А. Солженицына, д. 25

Аннотация. Центр обработки данных (ЦОД) является наиболее прогрессивной формой предоставления вычислительных ресурсов, когда необходимо обеспечить обслуживание широкого круга пользователей. В статье рассматривается один из подходов к созданию ЦОД - концепция программно-определяемой инфраструктуры. Программно-определяемой является такая инфраструктура ЦОД, в которой все ее ключевые элементы - вычислительные ресурсы, сеть, системы хранения данных и пр. виртуализованны и предоставляются пользователям как сервисы с заданным качеством. Показано, что реализация предлагаемой инфраструктуры позволяет обеспечить возможность каждому пользователю продуктивно решать свои задачи за приемлемое время с приемлемым уровнем затрат. В статье формулируются общие требования, предъявляемые к центрам обработки данных межведомственного уровня, предлагаются методы создания программно-определяемого ЦОД (развертывание вычислительных платформ, обеспечивающих максимальное переиспользование аппаратуры, обеспечение поддержки выполнения программ разных классов задач и пр.) и описываются реализации инфраструктур данного класса в конкретных проектах.

Ключевые слова: программно-определяемые ЦОД; облачные вычисления; распределенные вычисления; виртуализация

Б01: 10Л5514ЛSPRAS-2018-30(6)-1

Для цитирования: Шабанов Б.М., Самоваров О.И. Принципы построения межведомственного центра коллективного пользования общего назначения в модели программно-определяемого ЦОД. Труды ИСП РАН, том 30, вып. 6, 2018 г., стр. 7-24. DOI: 10.15514/ISPRAS-2018-30(6)-1

1. Введение

В настоящее время наиболее эффективной формой предоставления вычислительных ресурсов для обслуживания широкого круга пользователей является центр обработки данных (ЦОД) [1]. ЦОД межведомственного уровня имеет следующие особенности:

• обслуживаются запросы на исполнение потока задач, относящихся к разным классам;

• допускаются запросы от пользователей разного уровня подготовки;

• класс задачи и уровень подготовки пользователя определяются в момент обращения в межведомственный ЦОД.

При этом к межведомственному ЦОД предъявляется дополнительное требование: по необходимости обеспечить каждого пользователя возможностью продуктивно решать свои задачи. Продуктивностью мы называем возможность качественного решения задачи за приемлемое время и на приемлемом уровне затрат.

Качество решения задачи с точки зрения предоставляемых возможностей включает удобный интерфейс, обеспечивающий возможность точно описать требования задачи к аппаратуре ЦОД, а также возможности ЦОД адекватно обеспечить эти требования.

Приемлемое время складывается из времени решения задачи, времени ожидания на организацию платформы по требованиям пользователя и времени предоставления доступа к платформе.

Приемлемый уровень затрат связан с эффективной формой организации ЦОД, когда аппаратура максимально переиспользуется при выполнении разного класса задач при соблюдении условия качественного решения. Задача статьи состоит в том, чтобы конкретизировать общие требования в плане организации межведомственного ЦОД, а именно ответить на следующие вопросы:

• методы развертывания вычислительных платформ межведомственного ЦОД, обеспечивающие максимальное переиспользование аппаратуры;

• используемая аппаратура, способная эффективно обеспечить поддержку выполнения программа из классов задач;

• используемый стек системного программного обеспечения.

2. Общие требования межведомственного центра коллективного пользования общего назначения

Основные классы задач, на поддержку выполнения которых приходят запросы в ЦОД [2]:

• вычислительные задачи (MPI, CUDA, OpenMP);

• задачи искусственного интеллекта (Machine Learning);

• встроенные вычисления (Embedded Computing);

• задачи обработки графики;

• управление и анализ больших данных.

Определим общие требования, предъявляемые к центрам коллективного пользования межведомственного уровня. Центр коллективного пользования должен:

• обеспечить возможность поддержки решения максимального числа классов задач;

• обеспечить эффективное использование аппаратуры (консолидация вычислителей, систем хранения, каналов сетей, обеспечить возможность переиспользования одной аппаратуры под разные задачи, с учетом особых требований к системному окружению);

• обеспечить возможность быстрого доступа пользователя к аппаратуре, настроенной в соответствии с требованиями его задачи (доступ к аппаратуре на уровне готовых платформ, приложений)

• обеспечить возможность доступа к аппаратуре в сервисной модели (доступ по запросу)

• обеспечить заданный уровень качества обслуживания;

• обеспечить высокий уровень продуктивности;

• обеспечить безопасность на всех уровнях.

3. Концепция программно-определяемого ЦОД

Современным подходом к созданию вычислительной инфраструктуры ЦКП, который позволяет удовлетворить всем поставленным требованиям, является использование концепции программно-определяемого центра обработки данных [3], [4], [5].

Программно-определяемым является центр обработки данных в котором все элементы вычислительной инфраструктуры - сеть, системы хранения данных, вычислительные ресурсы, приложения и пр. виртуализованны и предоставляются как сервисы с заданным качеством.

Виртуализация является ключевой технологией, формирующей программно -определяемый центр обработки данных. Можно выделить три основных блока, из которых строится программно-определяемый ЦОД.

• Виртуализация серверов позволяет скрыть особенности аппаратной реализации конкретного физического сервера, предоставляя разным пользователям доступ к его вычислительным ресурсам (вычислительным ядрам процессора, оперативной памяти и пр.) в унифицированном виде, обеспечивая при этом полную изоляцию их вычислений.

• Виртуализация сети позволяет управлять сетевыми ресурсами путем

разделения доступной широты пропускания на независимые каналы, которые могут назначаться или переназначаться по запросам конкретным виртуальным серверам в реальном режиме времени. • Виртуализация систем хранения данных позволяет сформировать по запросу из нескольких физических, объединенных сетью хранилищ, единое устройство хранения данных, которое может быть назначено конкретному виртуальному серверу.

На основе этих блоков строятся сервисы более высокого уровня - уровня специализированных платформ: виртуальный высокопроизводительный кластер (HPC-кластер), виртуальный кластер хранения и обработки больших данных (BigData-кластер), виртуальная платформа машинного обучения, виртуальная ферма визуализации и пр.

На базе виртуализированных вычислительных ресурсов и специализированных платформ могут быть развернуты приложения или прикладные информационные системы, предлагающие решения в конкретных прикладных областях: web-лаборатории инжиниринговых компаний, платформы анализа социальных сетей, платформы промышленного Интернета вещей и пр.

Одним из основных преимуществ такого подхода является полная автоматизация всех рутинных функций, связанных с операционным управлением ИТ-инфраструктурой за счет возможности реализовать специальный уровень, отвечающий за бизнес-логику управления виртуализированными ресурсами. Этот уровень обеспечивает трансляцию запросов на развертывание по заданным параметрам конкретных вычислительных сервисов программно-определяемого ЦОД и предоставление к ним доступа.

Такая организация ЦОД позволяет обеспечить высокую степень гибкости (переиспользование аппаратных средств для выполнения приложений с различными требованиями к настройкам системного окружения) по сравнению с традиционным подходом, а также использовать эластичность -возможность равномерно распределять текущую вычислительную нагрузку независимо от особенностей организации физической ИТ-инфраструктуры, модели облачных вычислений.

Высокий уровень масштабируемости программно-определяемого ЦОД позволяет прозрачно наращивать вычислительные ресурсы, системы хранения, каналы обмена данными по мере возрастания требований к их объему.

4. Архитектура программно-определяемого ЦОД

Архитектуру программно-определяемого ЦОД можно разделить на три логических уровня: уровень аппаратуры, уровень виртуализации, уровень управления.

4.1 Уровень аппаратуры

Уровень аппаратуры программно-определяемого ЦОД включает в себя оборудование (сервера, системы хранения, GPU ускорители, сети обмена данными и пр.), которое по своим характеристикам удовлетворяет требованиям классов задач конечных пользователей, решаемых в ЦОД. Такая аппаратура, как правило, состоит из широко распространенных компонентов общего назначения разных производителей, что значительно снижает общую стоимость ИТ-инфраструктуры и позволяет исключить риски, связанные с технологической зависимостью от единого поставщика.

Рис. 1. Архитектура программно-определяемого ЦОД Fig. 1. Software-defined data center architecture

В зависимости от классов решаемых задач отдельные серверы объединяются в Bigdata-кластеры, фермы визуализации, аппаратные платформы поддержки машинного обучения и пр. в соответствии с требованиями к базовой архитектуре данных вычислителей. Например, для решения задач анализа больших данных в модели in-memory в узлы BigData-кластера устанавливается большой объем оперативной памяти (от 512 GB). Для поддержки решения задач класса искусственного интеллекта физический уровень ЦОД должен иметь в своем составе сервера с шиной обмена данным NVLink и графическими ускорителями типа GPU NVIDIA V100. Компоненты хранения могут быть реализованы как SAN, NAS или DAS хранилища данных. В зависимости от класса решаемых задач в качестве физических устройств хранения могут использоваться как дисковые (HDD), так и твердотельные накопители (SSD) и их сочетание. Например, для решения задач, связанных со сбором и аналитикой больших данных, на серверах локально устанавливаются дисковые подсистемы обладающие значительным объемом (от 16 TB), производительные и надежные RAID-контроллеры, а для высокопроизводительных вычислений в области нефти и газа требуется высоконадежное (с глубиной репликации данных 3) распределенное файловое хранилище, обеспечивающее параллельный ввод-вывод и имеющее в своем составе как дисковые разделы общего назначения на накопителях тира NL-SAS, так и разделы, обладающие сверхпроизводительными характеристиками на основе накопителей SSD. Сетевые компоненты программно-определяемого ЦОД включают физическое оборудование для обеспечения обмена данными между всеми серверами и системами хранения данных. Аппаратное обеспечение может включать в себя коммутаторы, маршрутизаторы, шлюзы и любые другие компоненты, необходимые для поддержки решения в ЦОД всех классов задач. Так, например, для поддержки высокопроизводительных вычислений узлы, входящие в состав HPC-кластера, должны быть дополнительно соединены высокоскоростной сетью Infiniband с низкой латентностью и задержками, а сервера Big-Data-кластера должны быть соединены сетью с высокой пропускной способностью (от 40 Gbs).

4.2 Уровень виртуализации

Уровень виртуализации является ключевым в организации программно-определяемого ЦОД. На данном уровне реализуется слой абстракции, отделяющий от физического сервера вычислительные ядра процессора и память, которые в дальнейшем предоставляются, как пулы логических вычислительных компонент. Таким образом, физический уровень аппаратуры скрыт от приложений, и для своего выполнения они используют исключительно виртуализованные процессоры и память.

Ядром уровня виртуализации является гипервизор - программа, реализующая одновременное, изолированное выполнение виртуализированных ресурсов на одной и той же аппаратуре. Гипервизор также обеспечивает перевод набора команд виртуальной машины в набор команд целевой аппаратуры. Виртуализация хранилищ также абстрагирует основные физические устройства хранения, скрывая от приложений специфику базового оборудования и представляя по запросу доступное хранилище (блочное или объектное) в виде логического пула ресурсов.

Виртуализация сетей позволяет разделять физическую пропускную способность на независимые каналы, которые в дальнейшем можно назначать или переназначать, подключая виртуальные сервера для конкретных рабочих нагрузок в режиме реального времени.

В целом, уровень виртуализации делает возможным гибкое управление унифицированными ресурсами, что может быть использовано для автоматического развертывания по запросу сложных программно-аппаратных платформ для решения конкретных прикладных задач с учетом всех их требований.

4.3 Уровень управления

Кроме виртуализации вычислительных ресурсов, инфраструктура программно-определяемого ЦОД также включает в себя уровень, обеспечивающий оркестрацию (координацию взаимодействия нескольких элементов виртуализированной ИТ-инфраструктуры) и автоматизацию операций развертывания и управления сервисами.

Данный уровень обеспечивает централизованное управление всеми виртуализированными ресурсами программно-ориентированного ЦОД и может распределять эти ресурсы в соответствии с возникающими во время выполнения приложений рабочими нагрузками, переназначать ресурсы по мере изменения требований и пр. Данные функции реализуются через предоставляемые данным уровнем инструментальные средства. Уровень управления также реализует возможности по проактивному мониторингу, оповещению и планированию выполняемых операций, по поддержке работоспособности сервисов всех уровней. Это дает администратором ЦОД возможность контролировать все операции по изменению конфигурации ИТ-инфраструктуры, следить за уровнем производительности сервисов, собирать и анализировать данные по использованию ресурсов.

Кроме того, уровень управления реализует бизнес-логику транслируя требования и запросы приложений в инструкции API, которые выполняют операции оркестровки и автоматизации. Через API-интерфейсы программный слой уровня управления формирует элементы ИТ-инфраструктуры, необходимые для выполнения приложений конечного пользователя в

соответствии с их требованиями, а также реализует политики соглашения об уровне обслуживания (SLA).

4.4 Функциональные и не функциональные требования

Вышесказанное обобщим в виде таблиц функциональные и нефункциональных требований, предъявляемых к реализации программно-определяемого ЦОД.

Табл. 1. Функциональные требования Table 1. Functional requirements

Требование Описание

Виртуализация Реализация программно-определяемого ЦОД должна включать решения, обеспечивающие виртуализацию и контейнеризацию вычислительных ресурсов, систем хранения данных, сети.

Мониторинг, сбор и анализ событий, управление и планирование ресурсов Непрерывный мониторинг работоспособности и загруженности облачной инфраструктуры, сбор и анализ случаев возникновения сбоев, планирование и управление перераспределением ресурсов.

Самообслуживание и оркестрация Автоматизация управления (включение в каталог, развертывание, предоставление доступа, контроль) сервисами и виртуальными ресурсами программно-определяемого ЦОД.

Управление потоками заданий Обеспечение возможностей автоматической организации и управления потоками заданий, при которой запросы на выполнение сервисов выполняются как бизнес-процессы в соответствии с набором процедурных правил, которые могут требовать подтверждений, модификаций, настроек ограничений доступа, делегирования и пр.

Администрирование облачной инфраструктурой Обеспечение возможностей администрирования облачной инфраструктуры, которые включают прозрачное расширение ресурсов: добавление систем хранения, вычислителей, агрегированных каналов связи и пр.

Управление шаблонами виртуальных ресурсов Обеспечение возможностей создания описаний/шаблонов виртуальных ресурсов, контроля версий, сравнения описаний, регистрации описаний в репозитории.

Управление шаблонами сервисов Обеспечение возможностей создания сервисов/шаблонов сервисов, контроля версий, сравнения шаблонов, регистрации шаблонов в репозитории.

Контроль доступа Обеспечение возможностей создания учетных записей пользователей, групп пользователей и назначения прав доступа к различным возможностям облачной инфраструктуры; создания разделов арендаторов

ресурсов ЦОД и их администраторов, учетных записей разработчиков ресурсов и ученых записей конечных пользователей.

Миграция виртуальных машин Средства миграция приложений, виртуальных машин и шаблонов с описаниями между облачными ЦОД, объединенными в федерации и публичными облачными инфраструктурами.

Миграция профилей безопасности Средства миграции профилей безопасности описаний настроек ограничений сетевых сервисов (firewaИ) между облачными ЦОД, объединенными в федерации и публичными облачными инфраструктурами.

Масштабирование сетей Network Extension Сохранение настроек свойств сети виртуальных машин (уровни L2, L3) при миграции между облачными ЦОД, объединенными в федерации, и публичными облачными инфраструктурами.

Управление каталогом ЦОД Система управления и обмена каталогами описаний ресурсов, сервисов, правил, шаблонов между облачными ЦОД, объединенными в федерации, и публичными облачными инфраструктурами.

Табл. 2. Нефункциональные требования Tab. 2. Non-functional requirements

Требование Описание

Резервное копирование и восстановление Система интегрального резервного копирования и восстановления

Простота инсталляции Снижение сложности развертывания

Простота управления Снижение сложности управления инфраструктурой и облачными приложениями

Технологическая безопасность Снижение рисков технологической зависимости от единого поставщика решений

Масштабируемость Прозрачное масштабирование компонент на всех уровнях с увеличением числа пользователей, сервисов, нагрузки

Безопасность Реализация профилей безопасности данных пользователей

Надежность, доступность и удобство обслуживания Высокая доступность и отказоустойчивость управления на всех уровнях ЦОД

5. Реализация модели программно определяемого ЦОД

Модель использования программно-определяемого ЦОД предусматривает варианты, представленные на рис. 2.

Управляющий ЦОД управляет развертыванием и конфигурированием программно-определяемого ЦОД, реализует политики безопасности и доступа к ресурсам, обеспечивает сбор и анализ данных по использованию ресурсов, отвечает за расширение аппаратных возможностей по хранению данных и вычислительных мощностей. Управляющий ЦОД предоставляет возможности инфраструктуры арендаторам ресурсов через создание разделов, управление которыми передает администраторам арендаторов ресурсов. Администратор арендатора ресурсов управляет выделенными ему мощностями программно-определяемого ЦОД, настраивает права доступа. Администратор сервиса разворачивает вычислительные сервисы на предоставленной ему инфраструктуре, следит за их работоспособностью. Конечный пользователь использует сервис для решения своих прикладных задач. Разработчик сервиса используя возможности программно -определяемого ЦОД принимает участие в создании сервиса, его развитии, обеспечивает техническую поддержку конечных пользователей.

Рис. 2.

Упрощенная модель использования программно-определяемого ЦОД Fig. 2. Simplified model of using software-defined data center

5.1 Функциональная модель программно-определяемого ЦОД

Опишем функциональную, компонентную и операционную модели (см. рис. 3, 4, 5) программно-определяемого ЦОД на примере реализации сервис-ориенированного программно-аппаратного комплекса, направленного на решение широкого класса задач.

Модуль параллельных вычислений (домен HPC) предназначен для выполнения высокопроизводительных программ с поддержкой парадигм MPI, OpenMPI и представляет собой высокопроизводительную вычислительную кластерную систему.

Модуль виртуализации (облачный домен) представляет собой среду облачных вычислений и предназначен для поддержки решения следующих задач:

• предоставление унифицированных вычислительных виртуализированных ресурсов (regular zone, bigdata zone) - виртуальные машины, виртуальные блочные и объектные хранилища, виртуальные сети, виртуальные кластеры хранения и анализа больших данных, виртуальные кластеры среды iot.

• предоставление унифицированных контейнеризированных ресурсов (ml zone, vdi zone) - контейнеры вычислений Machine Learning, контейнеры вычислений CUDA, контейнеры визуализации результатов научных расчетов, контейнеры виртуальных рабочих столов.

Рис. 3. Упрощенная функциональная модель программно-определяемого ЦОД Fig. 3. Simplified functional model of software-defined data center

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Модуль долгосрочного хранения данных (storage domain) обеспечивает надежное, эффективное долгосрочное хранение данных пользователей. Реализован на базе распределенной файловой системы Gluster.

5.2 Компонентная модель программно-определяемого ЦОД

Программный стек программно-определяемого ЦОД формируется на базе свободных стандартов и программных технологий индустриального качества с открытым исходным кодом, что в совокупности позволяет обеспечивать высокую гибкость, технологическую независимость и безопасность конечного решения.

Рис. 4. Упрощенная компонентная модель программно-определяемого ЦОД Fig. 4. Simplified component model of software-defined data center

В качестве основы управления и оркестрации виртуальных ресурсов программно-определяемого ЦОД может быть взят открытый пакет OpenStack. Виртуальные вычислительные ресурсы реализует компонент Nova (управление вычислительным облаком). Виртуализацию сетевых ресурсов обеспечивает компонент Quantum. Виртуализацию аппаратуры обеспечивают гипервизоры: XenServer/XCP, KVM/QeMU, LXC, ESX. Для случаев, когда требуется нативный доступ к реальной аппаратуре, используется драйвер OpenStack, реализующий метод BMD. Автоматизацию развёртывания и

управления приложениями в рамках изолированных контейнеров, реализует компонент Docker.

Виртуализованное хранилище реализуют пакет Gluster и компонент Cinder (виртуальные блочные устройства хранения) пакета OpenStack. Объектное хранилище реализовано с помощью компонента Glance пакета OpenStack. Функции аутентификации, авторизации конечных пользователей, разработчиков, администраторов арендаторов ресурсов реализованы с помощью компонента Keystone, входящего в состав пакета OpenStack. Интерфейс, обеспечивающий доступ к функциям ЦОД, реализует компонент Horizon (компонент пакета OpenStack).

Вычислительные платформы, предназначенные для решения прикладных задач, также реализуются с использованием СПО. Так, в качестве системного программного обеспечения HPC-кластера используется операционная система Linux CentOS и стек утилит из набора OpenHPC (http://openhpc.community/). Обеспечивается развертывание вычислительных узлов с помощью единого образа, поддерживаются централизованное управление, администрирование и мониторинг. В качестве планировщика задач используется пакет SLURM (поддержка пакетного и интерактивного режима запуска приложений, гибкое планирование и аккаунтинг ресурсов и пр.)

Приложения и платформы для решения пользовательских задач реализуются на основе IaaS как сервисы более высокого уровня (PaaS, SaaS) с использованием соответствующих платформ и SDK (ignite, gridgain, apache sparck, cloud foundry и др.). Номенклатура таких сервисов может быть легко расширена. Сервисы уровня IaaS используются как основа для развертывания информационных систем.

5.3 Операционная модель программно-определяемого ЦОД

Аппаратура высокопроизводительной вычислительной системы (hpc-кластер) состоит из управляющего CTR_NODE и вычислительных узлов COMPUT_NODE, сети управления CTR_NET на базе технологии GigEthernet), вычислительной сети COMPUT_NET на базе технологии Infiniband. HPC-кластер интегрирован с модулем долгосрочного хранения данных с помощью сети хранения (10 GigEthernet).

Совокупная мощность однородного вычислительного поля составляет 1440 вычислителей.

Для виртуальной среды OpenStack используются 4 сервера, обеспечивающие управление и общесистемные функции OS_CORE, и 12 серверов, формирующих виртуальные вычислительные ресурсы OS_COPMUTE. Для контейнеризированной среды Docker используются 2 сервера с графическими ускорителями типа NVIDIA V100 и NVIDIA GRID K2.

Контейнеризированная среда предназначена для приложений, эффективность выполнения которых чувствительная к виртуализации, случаев

предоставления прямого доступа к аппаратуре, выполнения тяжелых графических приложений, требующих использования ускорителей для отображения 3D сцен и т.д. Хранилище данных имеет объем сырого дискового пространства в 92 TB в разделе SSD. Все аппаратные модули ЦОД соединены с системой долгосрочного хранения по сети хранения, реализованной на базе 10 Gigabit bEtnernet

Рис. 5. Упрощенная операционная модель программно-определяемого ЦОД Fig. 5. Simplified operating model of software-defined data center

6. Заключение

Описанный подход был успешно внедрен при реализации ряда проектов.

• Вычислительная инфраструктура программы «Университетский кластер» - совместная программа ИСП РАН, МСЦ РАН и компании HP, направленная на поддержку параллельных и распределенных вычислений [6]. На базе описанной концепции создана вычислительная инфраструктура с помощью, которой участники программы выполняют научные исследования, промышленные разработки, реализуют образовательные проекты по обучению студентов и аспирантов. Инфраструктура предназначена для организации на ее основе

масштабируемых облачных сервисов и предметно-ориентированных виртуальных лабораторий, доступных широкому кругу пользователей. Среди сервисов, создаваемых в рамках программы, можно выделить следующие:

1) обеспечение выполнения параллельных программ на высокопроизводительных вычислительных системах с распределенной или общей памятью;

2) разработка программных продуктов: средства управления проектом, система отслеживания ошибок и управления версиями;

3) поддержка проведения конференций, лекций, семинаров, лабораторных работ в режиме онлайн.

• Испытательный стенд международного проекта OpenCirrus, в рамках которого проводятся исследовательские работы в области разработки стека системного программного обеспечения для облачных сред. Центрами компетенции проекта стали ИСП РАН и MCЦ РАН [7].

• Проблемно ориентированная web-лаборатория решения задач механики сплошных сред UniCFD [S], [9], [10]. Web-лаборатория UniCFD продемонстрировала свою высокую эффективность при выполнении исследовательских и индустриальных проектов, а также при решении образовательных программ. Так, на базе web-лаборатории UniCFD разработан ряд учебных курсов («Основы использования свободных пакетов SALOME, OpenFOAM и ParaView при решении задач MCC»; «Расширенные возможности пакета OpenFOAM»; учебный трек «Пакет OpenFOAM - платформа для решения задач MCC»; «Использование свободных пакетов для создания расчётных сеток в задачах MCC»). Учебные курсы и лабораторные работы для обучения студентов проводятся на кафедрах ФН2, CM2, CM3 MTTy им. Н.Э.Баумана. С 2014 года прошли обучение более 1000 слушателей из более 70 образовательных и научно-исследовательских учреждений и промышленных предприятий.

Список литературы

[1]. Joseph M. Hellerstein. Programming a Parallel Future. EECS Department University of California, Berkeley, Technical Report No. UCB/EECS-2008-144, November 7, 2008

[2]. Krste Asanovic, Ras Bodik, Bryan Christopher Catanzaro, Joseph James Gebis, Parry Husbands, Kurt Keutzer, David A. Patterson, William Lester Plishker, John Shalf, Samuel Webb Williams and Katherine A. Yelick. The Landscape of Parallel Computing Research: A View from Berkeley. EECS Department University of California, Berkeley, Technical Report No. UCB/EECS-2006-183 December 18, 2006

[3]. Mike Perks. Reference Architecture: VMware Software Defined Data Center. 15 August 201S [Электронный ресурс], страница LENOVOPRESS, режим

доступа: https://lenovopress.com/lp0661-reference-architecture-vmware-software-defmed-data-center-thinksystem, дата обращения 20.10.2018

[4]. FUJITSU White Paper [Электронный ресурс]. Software-Defined Data Center -infrastructure for enterprise digital transformation . Режим доступа: https://sp.ts.fujitsu.com/dmsp/Publications/public/wp-sddc-infrastructure-for-enterprise-digital-transformation-ww-en.pdf, дата обращения 20.10.2018

[5]. EMC Reference Architecture [Электронный ресурс]. Federation Software-Defined Data Center, Foundation Infrastructure Reference Architecture. Режим доступа: https://www.emc.com/collateral/TechnicalDocument/h13378-evp-sddc-ra.pdf, дата обращения 20.10.2018

[6]. Арутюн Аветисян, Сергей Гайсарян, Виктор Иванников, Олег Самоваров. «Университетский кластер»: интеграция образования, науки и индустрии". Открытые системы. СУБД, № 05, 2010

[7]. Арутюн Аветисян, Олег Самоваров, Сергей Гайсарян, Эшсоу Хашба. OpenCirrus, российский сегмент. Открытые системы. СУБД, № 05, 2011

[8]. M. Kraposhin, O. Samovarov, S. Strijhak. Web Laboratory UniHUB in the Scope of Program «University Cluster». In Proc. of the Workshop «Multiphysical Modelling in OpenFOAM», Riga, October 20-21, 2011

[9]. М.В. Крапошин, О.И. Самоваров, С.В. Стрижак. Особенности реализации Web-лаборатории механики сплошной среды на базе технологической платформы программы «Университетский Кластер»». Труды международной суперкомпьютерной конференции с элементами научной школы для молодежи «Научный сервис в сети Интернет: экзафлопсное будущее», 2011, стр. 473-475

[10]. Крапошин М.В., Самоваров О.И., Стрижак С.В. Опыт использования СПО для проведения расчетов пространственной гидродинамики промышленного масштаба. Труды конференции «Свободное программное обеспечение», 2010, стр. 44-46.

Building the Software Defined Data Center

1 B.M. Shabanov <shabanov@jscc.ru>

2 O.I. Samovarov <samov@ispras.ru>

1 Scientific Research Institute of System Development, 117218, Moscow, Nakhimovskiy Avenue, 36, bld.1 2 Ivannikov Institute for System Programming of the RAS, 109004, Russia, Moscow, Alexander Solzhenitsyn st., 25

Abstract. Data Center is the most progressive form of providing computing resources when it is necessary to provide services to a wide range of users. The paper discusses one of the approaches to the creation of a data center - the concept of software-defined infrastructure. Software-defined is such a data center infrastructure, in which all its key elements -computing resources, network, data storage systems, etc. - are virtualized and provided to users as services with a given quality. It is shown that the implementation of the proposed infrastructure allows each user to productively solve their tasks in a reasonable time with an acceptable level of costs. The paper formulates the general requirements for interdepartmental data processing centers, proposes methods for creating software-defined data

center (deployment of computing platforms that maximize hardware reuse, provide support for the execution of programs of different classes of tasks, etc.) and describes the implementation of infrastructures of this class in specific projects.

Keywords: software-defined data center; cloud computing; distributed computing; virtualization программно-определяемые ЦОД; облачные вычисления; распределенные вычисления; виртуализация

DOI: 10.15514/ISPRAS-2018-30(6)-1

For citation: Shabanov B.M., Samovarov O.I. Building the Software Defined Data Center. Trudy ISP RAN/Proc. ISP RAS, vol. 30, issue 6, 2018, pp. 7-24 (in Russian). DOI: 10.15514/ISPRAS-2018-30(6)-1

References

[1]. Joseph M. Hellerstein. Programming a Parallel Future. EECS Department University of California, Berkeley, Technical Report No. UCB/EECS-2008-144, November 7, 2008

[2]. Krste Asanovic, Ras Bodik, Bryan Christopher Catanzaro, Joseph James Gebis, Parry Husbands, Kurt Keutzer, David A. Patterson, William Lester Plishker, John Shalf, Samuel Webb Williams and Katherine A. Yelick. The Landscape of Parallel Computing Research: A View from Berkeley. EECS Department University of California, Berkeley, Technical Report No. UCB/EECS-2006-183 December 18, 2006

[3]. Mike Perks. Reference Architecture: VMware Software Defined Data Center. 15 August 2018 [online], страница LENOVOPRESS, available at: https://lenovopress.com/lp0661-reference-architecture-vmware-software-defined-data-center-thinksystem, accessed 20.10.2018

[4]. FUJITSU White Paper [online]. Software-Defined Data Center - infrastructure for enterprise digital transformation. Available at: https://sp.ts.fujitsu.com/dmsp/Publications/public/wp-sddc-infrastracture-for-enterprise-digital-transformation-ww-en.pdf, accessed 20.10.2018

[5]. EMC Reference Architecture [online]. Federation Software-Defined Data Center, Foundation Infrastructure Reference Architecture. Available at: https://www.emc.com/collateral/TechnicalDocument/h13378-evp-sddc-ra.pdf, accessed 20.10.2018

[6]. Arutyun Avetisyan, Sergey Gaysaryan, Viktor Ivannikov, Oleg Samovarov. Training center «University Cluster»: Blending Education, Science and Industry. Open Systems. DBMS, № 05, 2010 (in Russian)

[7]. Arutyun Avetisyan, Oleg Samovarov, Sergey Gaysaryan, Eshsou Hashba. Opencirrus, Russian Segment. Open Systems. DBMS, № 05, 2011 (in Russian)

[8]. M.V. Kraposhin, O.I. Samovarov, S.V. Strijhak. Web Laboratory UniHUB in the Scope of Program «University Cluster». In Proc. of the Workshop «Multiphysical Modelling in OpenFOAM», Riga, October 20-21, 2011

[9]. M.V. Kraposhin, O.I. Samovarov, S.V. Strijhak. Features of the implementation of the Web-laboratory of continuum mechanics based on the technological platform of the program «University Cluster». In Proc. of the International supercomputer conference with elements of the scientific school for young people «Scientific

service on the Internet: an exaflop future», 2011, pp. 473-475 (in Russian) [10]. M.V. Kraposhin, O.I. Samovarov, S.V. Strijhak. Experience of using open source software for calculating spatial hydrodynamics of industrial scale. In Proc. of the All-Russian Conference «Free Software 2010», 2010, pp. 44-46 (in Russian).

i Надоели баннеры? Вы всегда можете отключить рекламу.