Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара

Мукосей Анатолий Викторович; Семенов Александр Сергеевич

= Информатика, вычислительная техника и управление =

УДК 519.687.1 DOI: 10.14529/cmsel80204

ОПТИМИЗАЦИЯ ФРАГМЕНТАЦИИ ПРИ ВЫДЕЛЕНИИ РЕСУРСОВ ДЛЯ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ С СЕТЬЮ АНГАРА*

АО «НИЦЭВТ»

(117587 Москва, Варшавское шоссе, д. 125, стр. 15)

E-mail: mukosey@nicevt.ru, semenov@nicevt.ru Поступила в редакцию: 10.05.2018

В данной работе рассматривается высокоскоростная вычислительная сеть с топологией многомерный тор. Работа посвящена оптимизации фрагментации, возникающей в результате последовательного выделения вычислительных узлов в многоузловой системе при заданном требовании о том, что сетевой трафик разных пользовательских заданий не должен пересекаться. В данной работе на основе идей из задачи о многомерной упаковке контейнера предложен метод поиска узлов с оценкой фрагментированности системы. Для такой оценки введено понятие прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера. Исследование разработанного метода проводилось с помощью симулятора работы вычислительной системы. Рассмотрен набор различных вычислительных систем с трехмерными и четырехмерными топологиями, размер минимальной системы — 32 вычислительных узла, максимальной — 144 узла. Для каждой системы задана синтетическая очередь заданий, параметры которой приближены к реально возможной. В качестве критерия качества метода выбора узлов рассматривается средняя утилизация ресурсов вычислительной системы и среднее время ожидания заданий в очереди. Исследование показало, что увеличение утилизации ресурсов для предложенного метода выбора узлов составило в среднем 11 % по сравнению с базовым методом, а среднее значение времени нахождения задания в очереди сокращенно на 45, 3 %.

Ключевые слова: коммуникационная сеть Ангара, многомерный тор, правило порядка направлений, фрагментация вычислительной системы, выбор узлов.

ОБРАЗЕЦ ЦИТИРОВАНИЯ

Мукосей А.Б., Семенов А.С. Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара / / Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2018. Т. 7, № 2. С. 50-62.

DOI: 10.14529/cmsel80204.

Введение

Фрагментация, возникающая в результате последовательного выделения вычислительных узлов в многоузловой системе играет критическую роль в эффективности использования суперкомпьютера. Особенное значение эта проблема имеет для сетей с топологией типа тор. На данный момент существует две стратегии выделения ресурсов, используемых в суперкомпьютерах с тороидальной сетью [1]. В суперкомпьютерах IBM Blue Gene/P, Blue Gene/Q предоставление ресурсов основано на разделение системы на партиции, по которым размещаются задачи пользователей [2, 3]. Такая стратегия может

‘Статья рекомендована к публикации программным комитетом Международной научной конференции «Параллельные вычислительные технологии (ПаВТ) 2018»

порождать фрагментацию, возникающую в результате выделения большего числа узлов, чем требовалось или невозможности выделить доступный набор узлов из разных партиций.

Вторая стратегия используется в серии суперкомпьютеров Cray ХТ/ХЕ, где расположение выделенных узлов [4] не зависит от топологии. Такой способ выделения ресурсов может привести к деградации производительности ввиду наличия конкурирующего трафика. В статье [1] алгоритм оптимизации упаковки заданий использует линейную нумерацию узлов, однако это неудобно для сети Ангара.

В АО «НИЦЭВТ» разработана высокоскоростная коммуникационная сеть Ангара [5, 6] с топологией «многомерный тор». В маршрутизаторе сети реализована бездедлоковая, адаптивная маршрутизация, основанная на правилах «пузырька» (Bubble flow control, [7]) и «порядка направлений» (Direction ordered routing, DOR, [8, 9]) с использованием битов направлений [9]. Благодаря алгоритму First Step/Last Step «нестандартного первого и последнего шага» [9] аппаратно поддерживается обход отказавших узлов или линков. Эффективность этого метода по поддержанию связности в сети с отказами была показана в статье [10].

Для сети Ангара необходимо разработать алгоритм оптимизации фрагментации при условии отсуствия пересечения трафика различных задач. Такая задача носит название упаковки контейнера и является А^Р-полной задачей. Существуют различные способы решения такой задачи: авторы статьи [11] предлагают решать такую задачу

муравьиным алгоритмом — полиномиальный алгоритмов метаэвристической оптимизации для нахождения приближенных решений, который основан на использовании модели поведения муравьев, ищущих пути от колонии к источнику питания. Авторы статьи [12] разработали различные алгоритмы упаковки с использованием генетического алгоритма.

В данной статье предлагается алгоритм выбора узлов для суперкомпьютеров с топологией «многомерный тор» с учетом расположения заданий в топологии в коммуникационной сети. Разработанный алгоритм на рассмотренных системах и предложенных очередях в среднем увеличил утилизацию ресурсов на 11 %, а значение времени нахождения заданий в очереди сократил на 57 % по сравнению с первоначальным вариантом алгоритма, использовавшемся для выбора узлов.

Статья организована следующим образом. В разделе 1 приводятся необходимые формальные определения и постановка задачи. В разделе 2 описаны разработанные алгоритмы. В разделе 3 проведено исследование построенных алгоритмов. В заключении приводится краткая сводка результатов, полученных в работе, и намечаются направления дальнейших исследований.

1. Определения и постановка задачи

В данном разделе приводятся формальные определения, которые в дальнейшем будут использоваться в статье.

Рассмотрим вычислительную систему, узлы которой объединены в тороидальную топологию. Размерности тора обозначим (ф, е?2,..., dn), а множество всех узлов вычислительной системы обозначим N = {и\и = (щ,..., ип), Vi щ £ Z^.}, а общее число узлов — \N\. Расстояние на множестве N определим следующим образом: L(u,v) =

П

Y1 |щ - Vi\, Vit, v £ N.

i=1

Состояние системы S можно описать множествами узлов, доступных и недоступных для выделения, обозначим эти множества Nfree и А/ос&е^, соответственно.

Будем называть маршрутизируемым множеством узлов в коммуникационной сети Ангара такое множество, что для каждого узла этого множества существует сетевой маршрут в любой другой узел множества, удовлетворяющий правилам маршрутизации сети Ангара, а также весь сетевой трафик узлов множества не выходит за его пределы.

Будем называть заданием W — число узлов Wnodes, запрашиваемое пользователем в момент времени Wstart на время Wtime, а ресурсами для задания — маршрутизируемое множество узлов, размер которого не меньше, чем Wnodes- Потоком заданий назовем множество различных заданий W.

Ранее в работе [13] авторами статьи решалась проблема поиска маршрутизируемого множества заданного размера в коммуникационной сети Ангара с учетом топологии и маршрутизации. Обозначим алгоритм, решающий эту проблему как Find_Systems(W., S). На вход этому алгоритму подается состояние системы S и задание W с требуемым числом вычислительных узлов Wnodes- Результатом работы алгоритма является набор вариантов ресурсов для задания. Необходимо заметить, что особенностью алгоритма является то, что все ресурсы для задания представляют собой многомерные прямоугольники.

Под утилизацией ресурсов U вычислительного кластера будем понимать среднее значение утилизации по всем вычислительным узлам:

U =

Е Ui

i=1

I N\

Ui =

Е

т'

где Ui — утилизация г-го вычислительного узла, Т — время работы вычислительного кластера, Д - полезное время работы г-го вычислительного узла.

Обозначим значение времени нахождения задания в очереди относительно запрошенного времени как Т^е1ау = ^—, где W%ime — запрошенное время для

задания ИД Q1 — время ожидания задания W1 в очереди. За среднее значение времени нахождения задания в очереди относительно запрошенного времени задания примем Tmid = —i=1 delay = -т; Ej=i йтт—, где к — число различных заданий в потоке.

За оценку качества решения для потока пользовательских заданий возьмем утилизацию ресурсов вычислительного кластера и среднее значение времени нахождения задания в очереди относительно запрошенного времени. Эти характеристики используются по аналогии с работой [14].

Во введенных обозначениях проблема, которую решает данная статья, будет формулироваться следующим образом. Для заданного вычислительного кластера и последовательности заданий Q = W1,..., Wk требуется найти ресурсы для всех заданий из последовательности, которые будут максимизировать утилизацию вычислительного кластера и минимизировать среднее значение времени нахождения задания в очереди относительно запрошенного времени.

2. Алгоритм выбора узлов

Для решения поставленной проблемы в статье предложен алгоритм выбора узлов, основанный на методах, предложенных в работе [12], посвященной трехмерной упаковке контейнера. Идея алгоритма выбора узлов заключается в расположении задания таким образом, чтобы максимизировать оставшееся пространство в многомерном торе.

2.1. Алгоритм построения прямоугольников максимального размера

Назовем прямоугольником максимально возможного размера MSS (MaxSpaceSize) многомерный прямоугольник, состоящий только из узлов Nfree, который нельзя расширить ни в одну из его сторон. Расширить прямоугольник может быть невозможно по двум причинам — либо по соответствующему измерению тора достигнуто максимальное количество узлов в кольце (расширять некуда), либо сторона прямоугольника граничит с узлом из множества Niocked- Множество различных прямоугольников MSS характеризуют меру фрагментированности системы.

Алгоритм поиска различных прямоугольников MSS {Find_МSSs{S)) реализован

следующим образом. Из множества Njree выбирается узел щ £ Nfree. Выбранный узел

последовательно расширяется во все стороны, пока это возможно. Полученное множество

узлов обозначим MSS\. На следующем этапе выбирается узел щ £ Nfree\MSS 1 и

аналогичным образом строится множество MSS2- Алгоритм продолжается до тех пор,

Iters

пока множество Nfree\ (J MSSiter не пусто, где Iters — число итераций алгоритма.

iter=1

Псевдокод алгоритма представлен на рис. 2. Обозначим множество различных MSSiter, как MSSs. Важно отметить, что каждый прямоугольник строится независимо от остальных прямоугольников, в предположении доступности всех изначально свободных узлов Nfree.

а) построение прямоугольника максимально возможного размера

максимально возможного размера, построенные алгоритмом

Рис. 1. Выделение прямоугольников максимального размера

Иллюстрация работы алгоритма приведена на рис. 1а и рис. 16, на которых в двумерной решетке узлы множества А/ос/%е^ закрашены, а свободные узлы Nfree — нет. Жирным контуром на рис. 1а выделен узел, из которого поочередным расширением построен двумерный прямоугольник, который обозначен пунктирной линией. Узлы, выделенные полужирным пунктиром, соответствуют множеству узлов Nfree, не входящих в построенный прямоугольник. Из этих узлов будут строиться последующие прямоугольники. Все построенные прямоугольники MSS показаны на рис. 16.

Input:

S -- массив, характеризующий состояние системы

S[и], может принимать следующие значения: 0 - free, 1 - locked, 2 - discovered Output:

MSSs -- массив прямоугольников максимального размера Find_MSS(S)

Iter = 1

dirs -- массив доступных направлений в торе, например, +х,-х,+у,-у... MSSs -- результирующий массив, изначально пуст for u in S {

if S [u] == free {

MSSs[Iter],push_back(u) for dir in dirs {

MSSs[Iter].extend(dir)

>

for v in MSSs[Iter] {

S[v] = discovered

>

Iter++

>

}

return MSSs

Рис. 2. Псевдокод алгоритма Find_MSS поиска прямоугольников максимального размера

2.2. Оценка состояния вычислительной системы на основе прямоугольников максимального размера

Для оценки состояния вычислительной системы предложена функция tp, которая тем больше, чем большее число прямоугольников максимального размера имеется в системе:

4>(S) = N * MSS™°xdes + \MSSmax\,

где MSSmax — множество прямоугольников максимального размера, имеющих наибольшее число узлов MSS™°des, \MSSmax\ — число таких прямоугольников, S — текущее состояние системы.

Эта метрика была добавлена в алгоритм Find_Systems(W, S) поиска маршрутизируемого множества заданного размера. Для каждого найденного маршрутизируемого множества оценивается значение функции ip{S'), где S' — состояние вычислительной системы S после выделения узлов. Для увеличения утилизации вычислительного кластера требуется выбирать решения с наибольшим значением функции (р. Модифицированный алгоритм Find_Systems(W, S), в котором возможные варианты систем отсортированы с учетом значения функции (р, в дальнейшем будем обозначать Find_Systemsmss(W, S).

2.3. Первоначальный алгоритм выбора узлов для кластеров с сетью Ангара

Алгоритм, который изначально работал на кластерах с сетью Ангара, устроен следующим образом. Для всего кластера строится таблица маршрутизации [13]. Для требуемого числа узлов Wnodes И допустимого числа транзитных узлов Ntransit строятся всевозможные разложения чисел Wnodes, Wnodes + 1Wnodes + Ntransit на n множителей, таких что 1 ^ pt ^ ф,\/г £ 1 ..п, где р* — множитель разложения. Все такие разложения обозначим D. Эти разложения описывают всевозможные размеры прямоугольников, подходящих под решение задачи W. Средним диаметром

прямоугольника, соответствующего разложению Dj £ D, назовем среднее арифметическое

E„,„eDj,„r=„ L(u,v)

всех расстоянии между узлами прямоугольника: ---------.

Следующий этап выбора узлов — поиск множества узлов вычислительного кластера, которое можно покрыть одним из найденных прямоугольников таким образом, чтобы в покрытии присутствовали только узлы из множества Nfree, то есть доступные для выделения. Поиск покрытия начинается с разложений с наименьшим средним диаметром. При первом найденном решении алгоритм заканчивает свою работу.

3. Экспериментальное исследование

3.1. Симулятор вычислительного кластера

Для оценки утилизации ресурсов вычислительного кластера разработан симулятор очереди задач (заданий) и модель состояния кластера. Заметим, что в данной работе не рассматривалась возможность обгона заданий, то есть предоставление ресурсов заданию, имеющему более позднее время Wtime, если заданию с ранним временем Wtime не были выделены ресурсы. На вход симулятору подается поток пользовательских задач Q = W1, ...,Wk. На выходе выдается полное время работы всего кластера Т, время работы каждого узла Д и время предоставления ресурсов для каждого задания. Используя эти данные, можно вычислить утилизацию ресурсов вычислительного кластера U и среднее значение времени нахождения задания в очереди Тт^.

Введем некоторые формальные определения, необходимые для описания работы симулятора. Очередью симулятора назовем набор заданий из потока, для которых не выделялись ресурсы и время их запуска Tstart меньше текущего симулируемого времени t. Временем занятости узла и системы S, назовем время, на которое узел и был выделен для некоторого задания W. В начальный момент времени t = 0 время занятости всех узлов равно 0. Операцией выделения набора узлов на время Тацос назовем увеличение времени занятости для этих узлов на время Тацос. Временем изменения системы Т$ назовем время, через которое освободится хотя бы один из выделенных узлов. Временем изменения очереди Тqueue назовем время, через которое хотя бы одно задание перейдет из потока заданий в очередь симулятора. Тогда временем ожидания симулятора Tsieep назовем минимальное время до изменения состояния симулятора: Tsieep = min(Ts,Tqueue).

Алгоритм работы симулятора устроен следующим образом. Если очередь симулятора не пуста, симулятор выполняет процедуру поиска маршрутизируемого множества для каждого задания из очереди по очереди. Если удалось найти решение, то симулятор выделяет найденные ресурсы на необходимое время, а также удаляет это задание из очереди. Если решение не было найдено, время симулятора сдвигается на время ожидания Ts/eejJ, а время

занятости каждого занятого узла и системы S уменьшается на Tsieep. Если очередь заданий пуста, а все узлы перешли в состояние свободных, то симулятор завершает свою работу.

3.2. Результаты исследования

Исследование разработанного алгоритма проводилось на симуляторе для вычислительных систем [15], представленных в таблице.

Таблица

Моделируемые системы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Количество узлов Топология Топология

вычислительной системы Зх-мерный тор 4х-мерный тор

32 4x4x2 4х2х2х2

36 4x3x3 ЗхЗх2х2

64 4x4x4 4х4х2х2

96 6x4x4 4х4хЗх2

144 8x6x3 4х4хЗхЗ

Поток заданий для каждой из систем характеризуется вероятностью появления задания для каждого числа узлов от 1 до максимального. Распределение вероятностей таких вероятностей представлено на рис. 3. На рис. 36 представлено реальное распределение пользовательских задач (заданий) по количеству узлов, полученное с гибридного суперкомпьютера Desmos на базе сети Ангара, имеющую топологию 4х-мерный тор 4х2х2х2. В дальнейшем системы с данной очередью будем помечать символом s — 4x2x2x2s и 4x4x2s. Остальные распределения долей заданий по количеству узлов — синтетические, основанные на предположении о том, что чаще всего встречаются заданий с требуемым числом узлов, равным степеням двойки.

Вероятности для остальных числов узлов равны 0. Задания равномерно случайно размещаются на временной шкале в диапазоне [0; 40500] секунд вне зависимости от числа требуемых узлов. Время продолжительности заданий равномерно распределено по диапазону [50; 100].

Для исследования разработанного алгоритма поиск ресурсов для заданий производился четырьмя различными способами: методом Find_Systems без применения разработанной метрики (Find _S у stems)] методом Find _Sy stems mss c применением разработанной метрики (Find_Systems + MSS)] методом, который изначально функционировал на кластерах с сетью Ангара (base).

Диаграмма сравнения утилизации для различных методов и систем представлена на рис. 4а. Сравнение средних значений времени нахождения задания в очереди относительно запрошенного времени (Т„цД для различных методов и систем представлено на рис. 46.

Разработанный алгоритм Find_Systems из статьи [13] сократил в среднем значение времени нахождения заданий в очереди на 45,3 %, а утилизация ресурсов кластера в среднем увеличилась на 8,4 % относительно базового метода base.

Добавление в Find_Systems учета фрагментированности вычислительной системы позволило еще сократить значение времени нахождения заданий в очереди до 57 % относительно метода base, что на 11, 7 % больше чем у метода Find_Systems. Утилизация

Размер задания

а) для систем из 32 узлов

30

*25

ш

о.

Ш 20

0 ш

15

S

1

2- ю

аз

го

чр 5

ОЧ

1

l 1 я лЛх

НГМГО^ООО^ГМЮОО^-ГМЧ) г-I г—I rH (N ГО ГО

Размер задания

в) для систем из 36 узлов

Размер задания

д) для систем из 96 узлов

тН (N ГО <sl- 1£> 00 (N

ГО

Размер задания

б) для систем из 32 узлов, кластер Desmos

20

е) для систем из 144 узлов

Рис. 3. Распределение заданий для систем с разным числом узлов

ресурсов при этом увеличивается до 11 % относительно метода base, что на 2, 6 % больше чем у метода Find_Systems.

■ base ■ Find_Systems ■ Find_Systems+MSS

Моделируемые системы

а) сравнение утилизации вычислительного кластера для различных: системы и методов

б) сравнение средних значений времени нахождения задания в очереди относительно запрошенного времени (Tmid) для различных методов и систем

Рис. 4. Выделение прямоугольников максимального размера

Заключение

В данной работе представлен метод выбора вычислительных узлов для потока пользовательских заданий, сокращающий фрагментацию вычислительной системы в сети Ангара с топологией многомерный тор. Метод основан на алгоритме выделения ресурсов для задания таким образом, чтобы максимизировать оставшееся пространство в многомерном торе. Это достигается построением прямоугольников максимального размера, которые возможно вписать в систему после размещения очередного пользовательского задания. Каждое множество узлов, подходящее для размещения задания, оценивается предложенной функцией, учитывающей размер и количество найденных прямоугольников максимального размера.

Проведено экспериментальное исследование разработанного алгоритма для различных вычислительных систем с топологией многомерный тор с общим числом узлов 32, 36, 64, 96 и 144, при этом рассмотрены Зх-мерные и 4х-мерные конфигурации топологий. Эксперимент проводился при помощи разработанного симулятора вычислительной системы. Для каждой исследуемой вычислительной системы была создана синтетическая очередь заданий, параметры которой приближены к реальным.

Средняя утилизация ресурсов для разработанного алгоритма выбора узлов увеличилась на 11 %, а значение времени нахождения заданий в очереди сократилось на 57 % по сравнению с первоначальным вариантом алгоритма.

В дальнейшем необходимо провести исследование разработанного алгоритма для систем большого размера, а также детально исследовать и провести возможную оптимизацию времени работы алгоритма. Также возможно провести исследование о влиянии перестановки задач в очереди для улучшения характеристик использования вычислительной системы.

Литература

1. Lan Z., Tang W., Wang J., Yang X., Zhou Z., Zheng X. Balancing Job Performance with System Performance via Locality-aware Scheduling on Torus-connected Systems // 2014 IEEE International Conference on Cluster Computing (CLUSTER) (Madrid, Spain, September 22-26, 2014), 2014. P. 140-148. DOI: 10.1109/CLUSTER.2014.6968751.

2. IBM Redbooks Publication: IBM System Blue Gene Solution: Blue Gene/Q System

Administration. 2013. 282 p.

3. Tang W., Lan Z., Desai N., Buettner D., Yu Y. Reducing Fragmentation on Torus-Connected Supercomputers // Proceedings of the 2011 IEEE International Parallel Distributed Processing Symposium (IPDPS’ll) (Anchorage, Alaska, USA, May 16-20, 2011), 2011. P. 828-839. DOI: 10.1109/IPDPS.2011.82.

4. Cray Document: Managing System Software for Cray XE and Cray XT Systems. 2010.

5. Агарков А.А., Исмагилов Т.Ф., Макагон Д.В., Семенов А.С., Симонов А.С. Результаты

оценочного тестирования отечественной высокоскоростной коммуникационной сети Ангара // Суперкомпьютерные дни в России: Труды международной конференции

(26-27 сентября 2016 г., г. Москва). М.: Изд-во МГУ, 2016. С. 626-639.

6. Симонов А.С., Макагон Д.В., Жабин И.А., Щербак А.Н., Сыромятников Е.Л., Поляков Д.А. Первое поколение высокоскоростной коммуникационной сети «Ангара» // Наукоемкие технологии. 2014. Т. 15, № 1. С. 21-28.

7. Puente V., Beivide R., Gregorio J.A., Prellezo J.M., Duato J., Izu C. Adaptive Bubble Router: a Design to Improve Performance in Torus Networks / / Proceedings of the International Conference Parallel Processing (Wakamatsu, Japan, September 21-24, 1999), 1999. P. 58-67. DOI: 10.1109/ICPP.1999.797388.

8. Adiga N.R., Blumrich M., Chen D. Blue Gene/L Torus Interconnection Network // IBM Journal of Research and Development. 2005. Vol. 49, No. 2. P. 265-276. DOI: 10.1147/rd.492.0265.

9. Scott S.L. The Cray T3E Network: Adaptive Routing in a High Performance 3D Torus. 1996.

10. Пожилов И.А., Семенов А.С., Макагон Д.В. Алгоритм определения связности сети с топологией «многомерный тор» с отказами для детерминированной маршрутизации // Программная инженерия. 2015. № 3. С. 13-19.

11. Кагиров Р.Р. Многомерная задача о рюкзаке: новые методы решения //

Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2007. № 3. С. 16-20.

12. Gongalves J.F., Resende M.G.C. A Parallel Multi-population Biased Random-key Genetic Algorithm for a Container Loading Problem // Computers & Operations Research. February 2012. Vol. 39, No. 2. P. 179-190. DOI: 10.1016/j.cor.2011.03.009.

13. Мукосей А.В., Семенов А.С. Приближенный алгоритм выбора оптимального подмножества узлов в коммуникационной сети Ангара с отказами // Вычислительные методы и программирование. 2017. Т. 18, № 1. С. 53-64.

14. Баранов А.В., Киселёв Е.А., Ляховец Д.С. Квазипланировщик для использования простаивающих вычислительных модулей многопроцессорной вычислительной системы

под управлением СУППЗ // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2014. Т. 3, № 4. С. 75-84. DOI: 10.14529/cmsel40405.

15. Полежаев П.Н. Симулятор вычислительного кластера и его управляющей системы, используемый для исследования алгоритмов планирования задач // Вестник ЮУрГУ. Серия: Математическое моделирование и программирование. 2010. Т. 6, № 35(211). С. 79-90.

Мукосей Анатолий Викторович, научный сотрудник, сектор управления разработки вычислительной техники, акционерное общество «Научно исследовательский центр электронной вычислительной техники» (Москва, Российская Федерация)

Семенов Александр Сергеевич, к.т.н, зам. начальника отдела архитектуры и программного обеспечения суперкомпьютеров, акционерное общество «Научно исследовательский центр электронной вычислительной техники» (Москва, Российская Федерация)

DOI: 10.14529/cmsel80204

ALLOCATION OPTIMIZATION FOR REDUCING RESOURCE FRAGMENTATION IN ANGARA HIGH-SPEED INTERCONNECT

JSC «NICEVT»

(Varshavskoye shosse 125, building 15, Moscow, 117587 Russia)

E-mail: mukosey@nicevt.ru, semenov@nicevt.ru Received: 10.05.2018

This paper considers a high-speed interconnect with a multidimensional topology. The paper is devoted to the optimization of fragmentation resulting from sequential allocation of compute nodes in a supercomputer provided that network traffic from different user’s tasks should not overlap. This paper proposes a method for searching nodes with an evaluation of the fragmentation of the system based on ideas from multidimensional container loading problem. For such an evaluation, the concept of rectangles is introduced, which can be inscribed into the system after placing the next user task. Each set of nodes that is suitable for placing the task is evaluated by the proposed function taking into account the size and the number of found rectangles of maximum size. The proposed method was evaluated using computer system model. A set of different computer systems with three-dimensional and four-dimensional topologies was considered. The minimum system size is 32 compute nodes and the maximum is 144. A synthetic queue of tasks is set for each system. The parameters of the synthetic queues are close to a real ones. The average utilization of the resources of the computer system and the average waiting time for the tasks in the queue is chosen as a method quality criterion. The study showed that the increase of the resources utilization for the proposed method averaged 11 % compared to the base method, and the average time spent in queue is reduced by 45, 3 %.

Keywords: Angara interconnect, multidimensional torus, deterministic routing, direction ordered routing,

fragmentation, allocation.

FOR CITATION

Mukosey A.V., Semenov A.S. Allocation Optimization for Reducing Resource Fragmentation in Angara High-speed Interconnect. Bulletin of the South Ural State University. Series: Computational Mathematics and Software Engineering. 2018. vol. 7, no. 2. pp. 50-62. (in Russian) DOI: 10.14529/cmsel80204.

This paper is distributed under the terms of the Creative Commons Attribution-Non

Commercial 3.0 License which permits non-commercial use, reproduction and distribution of

the work without further permission provided the original work is properly cited.

References

1. Lan Z., Tang W., Wang J., Yang X., Zhou Z., Zheng X. Balancing job Performance with System Performance via Locality-aware Scheduling on Torus-connected Systems. 2014 IEEE International Conference on Cluster Computing (CLUSTER) (Madrid, Spain, September 22-26, 2014). 2014. pp. 140-148. DOI: 10.1109/CLUSTER.2014.6968751.

2. IBM Redbooks Publication: IBM System Blue Gene Solution: Blue Gene/Q system

administration. 2013. 282 p.

3. Tang W., Lan Z., Desai N., Buettner D., Yu Y. Reducing Fragmentation on Torus-Connected Supercomputers. Proceedings of the 2011 IEEE International Parallel Distributed Processing Symposium (IPDPS’ll) (Anchorage, Alaska, USA, May 16-20, 2011), 2011. pp. 828-839. DOI: 10.1109/IPDPS.2011.82.

4. Cray Document: Managing System Software for Cray XE and Cray XT Systems. 2010.

5. Agarkov A.A., Ismagilov T.F., Makagon D.V. Performance Evaluation of the Angara Interconnect. Supercomputernie dni v Rossii: Trudy meghdunarodnoj konferentsii (Moscva, 26-27 sentyabra 2016) [Russian Supercomputing Days: Proceedings of the International Scintihc Conference (Moscow, Russia, September 26-27, 2016)]. Moscow, Publishing House of Moscow State University, 2016. pp. 626-639. (in Russian)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Simonov A.S., Makagon D.V., Zhabin I.A., Shcherbak A.N., Syromyatnikov E.L., Polyakov D.A. The First Generation of Angara High-Speed Interconnect. Naukoemkie technologii [Science Technologies]. 2014. vol. 15, no. 1. pp. 21-28. (in Russian)

7. Puente V., Beivide R., Gregorio J.A., Prellezo J.M., Duato J., Izu C. Adaptive Bubble Router: a Design to Improve Performance in Torus Networks. Proceedings of the International Conference Parallel Processing (Wakamatsu, Japan, September 21-24, 1999), 1999. pp. 58-67. DOI: 10.1109/ICPP.1999.797388.

8. Adiga N.R., Blumrich M., Chen D. Blue Gene/L Torus Interconnection Network. IBM Journal of Research and Development. 2005. vol. 49, no. 2. pp. 265-276. DOI: 10.1147/rd.492.0265.

9. Scott S.L., et al. The Cray T3E Network: Adaptive Routing in a High. Performance 3D Torus. 1996.

10. Pozhilov I.A., Semenov A.S., Makagon D.V. Connectivity Problem Solution for Direction Ordered Deterministic Routing in nD Torus. Programmnaya inzheneriya [Software Engineering], 2015. no. 3. pp. 13-19. (in Russian)

11. Kagirov R.R. Multiple Knapsack Problem: New Solving Methods. Vestnik SibGAU [Vestnik of the Reshetnev Siberian State Aerospace University]. 2007. no. 3. pp. 16-20. (in Russian)

12. Gongalves J. F., Resende M. G. C. A Parallel Multi-population Based Random-key Genetic Algorithm for a Container Loading Problem. Computers & Operations Research. February 2012. vol. 39, no. 2. pp. 179-190. DOI: 10.1016/j.cor.2011.03.009.

13. Mukosey A.V., Semenov A.S. An Approximate Algorithm for Choosing the Optimal Subset of Nodes in the Angara Interconnect with Failures. Vyichislitelnyie metodyi i programmirovanie [Numerical methods and Programming], 2017. vol. 18, no. 1. pp. 53-64. (in Russian)

14. Baranov A.V., Kiselev Е.А., Lyakhovets D.S. The Quasi Scheduler for Utilization of Multiprocessing Computing System’s Idle Resources under Control of the Management System of the Parallel Jobs. Vestnik Yuzhno-Ural’skogo Gosudarstvennogo Universiteta. Seriya “Vychislitelnaya Matematika i Informatika” [Bulletin of South Ural State University. Series: Computational Mathematics and Software Engineering], 2014. vol. 3, no. 4. pp. 75-84. DOI: 10.14529/cmsel40405. (in Russian)

15. Polezhaev P.N. Simulator of Computer Cluster and Its Management System Used for Research of Job Scheduling Algorithms. Vestnik Yuzhno-Ural’skogo Gosudarstvennogo Universiteta. Seriya “Matematicheskoe Modelirovanie i Programmirovanie” [Bulletin of South Ural State University. Series: Mathematical Modeling, Programming & Computer Software]. 2010. vol. 6, no. 35(211). pp. 79-90. (in Russian)

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мукосей Анатолий Викторович, Семенов Александр Сергеевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мукосей Анатолий Викторович, Семенов Александр Сергеевич

ALLOCATION OPTIMIZATION FOR REDUCING RESOURCE FRAGMENTATION IN ANGARA HIGH-SPEED INTERCONNECT

Текст научной работы на тему «Оптимизация фрагментации при выделении ресурсов для высокопроизводительных вычислительных систем с сетью Ангара»