Научная статья на тему 'К решению задачи размещения центров обработки данных в сетецентрической системе'

К решению задачи размещения центров обработки данных в сетецентрической системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
192
78
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЕЦЕНТРИЧЕСКАЯ СИСТЕМА / ГРАФОВАЯ МОДЕЛЬ / ЗАДАЧА РАЗМЕЩЕНИЯ ЦЕНТРОВ / ОБСЛУЖЕННАЯ НАГРУЗКА / МЕТОД ПРОСЕЯННОЙ НАГРУЗКИ / NETWORK CENTRIC SYSTEMS / LOCATION PROBLEM / CARRIED LOAD / REDUCED LOAD APPROXIMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бородакий В. Ю.

В статье в терминах теории графов построена формальная модель и сформулирована задача размещения центров обработки данных в сетецентрической системе с ограниченной пропускной способностью звеньев сети передачи данных. Целевыми функциями задачи являются число и расположение центров на графе сети, а также величина обслуженной нагрузки трафика данных, передаваемых из центров по запросам абонентов системы. Предложен алгоритм решения задачи размещения центров, для оценки величины обслуженной нагрузки модифицирован метод просеянной нагрузки, приведён иллюстрирующий пример численного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бородакий В. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the Datacenters Location Problem in the Network Centric Systems

The formal graph model and the datacenters location problem definition in the network centric systems are developed. The objective functions for the optimization problem are as follows: quantity as well as the location on the net's graph for the datacenters, and the amount of the carried load transmitting from datacenters on the requests from the subscriber nodes. The algorithm for solving datacenters location problem is given, and the modified algorithm for the carried load amount approximation is proposed. The illustrative example of the numerical analysis is provided.

Текст научной работы на тему «К решению задачи размещения центров обработки данных в сетецентрической системе»

Сети телекоммуникаций

УДК 519.17

К решению задачи размещения центров обработки данных в сетецентрической системе

В. Ю. Бородакий

Кафедра компьютерных систем и технологий Национальный исследовательский ядерный университет «МИФИ» Россия, 115409 , Москва, Каширское шоссе, 31

В статье в терминах теории графов построена формальная модель и сформулирована задача размещения центров обработки данных в сетецентрической системе с ограниченной пропускной способностью звеньев сети передачи данных. Целевыми функциями задачи являются число и расположение центров на графе сети, а также величина обслуженной нагрузки трафика данных, передаваемых из центров по запросам абонентов системы. Предложен алгоритм решения задачи размещения центров, для оценки величины обслуженной нагрузки модифицирован метод просеянной нагрузки, приведён иллюстрирующий пример численного анализа.

Ключевые слова: сетецентрическая система, графовая модель, задача размещения центров, обслуженная нагрузка, метод просеянной нагрузки.

1. Введение

В настоящее время в России и ряде зарубежных стран развиваются распределённые автоматизированные системы управления специального назначения, построенные на основе сетецентрической концепции (см., например, [1]). От выбора структуры подобных систем и поддержки заданных показателей качества существенно зависит эффективность решения возложенных на них задач. При проектировании сетецентрических систем (СС) возникает задача построения оптимальной структуры сети передачи данных с точки зрения соответствия заданным требованиям по режиму работы и/или производительности. Существует целый ряд систем [2], где невыполнение этих требований не только снижает производительность, но и приводит к деградации системы вплоть до её уничтожения. СС можно представить [1] в виде распределённой вычислительной системы, управляющей или контролирующей набор объектов управления (рис. 1). В её состав входят:

— абонентские узлы, представляющие собой клиентское оборудование (автоматизированное рабочее место, кластер, терминал) и обменивающиеся информацией и/или управляющими сигналами с объектами управления или контроля. Эти узлы обладают потребностью информационного обмена с управляющими компонентами системы (центрами обработки данных);

— центры обработки данных (ЦОД), принимающие информацию от абонентских узлов, обрабатывающие её, посылающие ответное воздействие, осуществляющие хранение принятой и обработанной информации;

— телекоммуникационное оборудование, обеспечивающее передачу информации между узлами, которое включает как активное сетевое оборудование (коммутаторы, маршрутизаторы, шлюзы), так и пассивное оборудование (линии передачи).

Будем исследовать задачу построения СС в автономном (англ. off-line) режиме. В этом случае набор и месторасположение абонентских узлов задан и фиксирован, исходя из требований к функциональности системы, и зависит в первую

Статья поступила в редакцию 7 июля 2009 г.

1—> данных /\ Абонентский узел

Маршрутизатор

Рис. 1. Компоненты сетецентрической системы

очередь от вида и размещения объектов управления. Можно считать, что телекоммуникационное оборудование — его объем и расположение — также является заданным. Таким образом, к исходным данным решаемой задачи можно отнести расположение и конфигурацию абонентских узлов и сети передачи данных, пропускные способности звеньев сети, объёмы информационных потребностей абонентских узлов. Помимо данных о структуре сети и модели трафика данных, известны требования к качеству информационного взаимодействия узлов СС, в том числе ограничение на вероятность отказа в обслуживании запроса абонента по причине сети. Из этого следует, что под задачей синтеза проектируемой системы необходимо понимать, в первую очередь, выбор способа размещения ЦОД в условиях ограниченной пропускной способности звеньев сети и заданных информационных потребностей абонентских узлов. Критериями решения задачи являются:

— минимум числа ЦОД в структуре СС;

— максимум переданной информации (обслуженной системой нагрузки).

В следующем разделе статьи предлагается формальная постановка задачи синтеза структуры СС, т. е. задачи размещения минимального числа ЦОД при условии максимального значения величины обслуженной нагрузки.

2. Задача оптимизации структурных и нагрузочных параметров сетецентрической

системы

Исследуемую систему удобно представить в виде графа С (8, У), 8 С У х У, где каждой вершине из множества У соответствует узел СС (абонентский узел, маршрутизатор или узел предполагаемого размещения ЦОД), а рёбрам из множества 8 — звенья сети передачи данных. На множестве вершин графа С введём такое разбиение У = и У я и Ут, что - множество вершин, соответствующих абонентским узлам, У я — множество вершин, соответствующих транзитным маршрутизаторам, Ут — множество вершин, соответствующих узлам размещения ЦОД. Пример такого графа показан на рис. 2, где = {х\, х6, х9, х\0, х\2, х\3}, Уя = {х2,х3,х4,х5,х7,х8,х11} и Ут = {ж18}. Введём также множество Ус вершин предполагаемого размещения центров (Ут С Ус).

Формулировку задачи проведём в два этапа. На первом этапе, следуя известной постановке задаче (к, г)-размещения центров [3], будем использовать следующие обозначения:

— С (хг,х^) — пропускная способность ребра (хг,х^) £ 8;

— ё (хг,х^) — минимальное расстояние между вершинами XI £ V и х^ £ У;

— г — ограничение на расстояние от вершины графа до центра;

— Мс := {8 : 8 £ Ув, ё (в, с) ^ г} — множество достижимости для вершины

с £ Ус.

— шс — стоимость включения вершины с £ Ус в множество Ут;

— к8 — ограничение снизу на число центров для вершины 8 £ Ув, к = тах (к8).

Рис. 2. Граф сетецентрической системы

Тогда задача размещения центров на графе СС записывается в виде:

1 (с е Vt) ^ min, (1)

ceVc

£ 1(с е VT) 1 (s е Мс) > ka, s eVs, (2)

ceVc

где 1 (■) — функция-индикатор.

На втором этапе, при формулировке задачи оптимизации величины обслуженной системой нагрузки, будем использовать понятие «эластичный трафик» [4,5]. Такой режим известен также под названием передачи по принципу «best effort», суть которого заключается в том, что в процессе одновременной передачи по звену сети с ограниченной пропускной способностью нескольких потоков (блоков данных) все потоки получают одинаковую долю пропускной способности вне зависимости от своего объёма (длины).

Очевидно, что с ростом нагрузки абонентов растёт и время передачи эластичного трафика, которое для рассматриваемых в статье СС не может превышать некоторого директивного значения. Для решения проблемы может быть использован метод гарантированного назначения всем потокам минимальной ширины полосы пропускания (ШПП), достаточной для передачи без дополнительных задержек наиболее ценной информации. Заметим, что такой метод имеет недостатки, а именно, при больших значениях нагрузочных параметров с некоторой вероятностью могут возникать блокировки запросов абонентов на передачу блоков данных из-за отсутствия на звеньях маршрута передачи свободной ШПП. Поэтому для обеспечения качества функционирования системы вводятся требования (ограничения) на вероятность блокировки запросов абонентов.

Для формулировки задачи оптимизации обслуженной СС нагрузки введём следующие обозначения:

— N — множество предоставляемых ЦОД типов данных;

— On — длина блока данных n-типа (п-блока);

— b — требование к минимальному значению ШПП для передачи блока данных любого типа;

— Хп (s,t) — интенсивность потока запросов s-абонента в ¿-центр на передачу п-блока;

— ап (s, t) := Хп (s, t) вп — нагрузка, создаваемая n-блоками между s-абонентом и i-центром (предложенная нагрузка);

— С (s,t) — множество (пучок) маршрутов между s-абонентом и ¿-центром;

— li (s,t) — i — маршрут доставки информации между s-абонентом и ¿-центром;

— ain (s, t) — доля предложенной n-блоками нагрузки на г-маршруте;

— ai (s,t) :=Y1 пеЯ ain (s,t) — предложенная нагрузка на г-маршрут;

— Bin (s, t) — вероятность блокировки n-блока на li (s, ¿)-маршруте.

С учётом введённых обозначений задача оптимизации обслуженной нагрузки в СС записывается в виде:

а := ®in (s, t) (1 — Bin (s, t)) ^ max, (3)

seVs teVT i: h(s,t)ec(s,t) neU

В (з):=1 ^П I1 ^П П В™ (М)1 < В*, 8 , (4)

пеЯ \ геУт г: )

где В * — требование к качеству обслуживания абонентов.

Таким образом, мы получили одну из возможных формулировок общей задачи оптимизации структурных и нагрузочных параметров СС с целевыми функциями (1), (3) и ограничениями (2), (4). Данная задача может быть отнесена к классу многокритериальных задач нелинейного целочисленного программирования, является МР-сложной, а метод её решения в данный момент не известен. В разделе 2 данной статьи предложен алгоритм для решения задачи (1)-(2). Решение задачи (3)-(4) в статье не рассматривается, а в разделе 3 предложен метод для оценки величины обслуженной системой нагрузки.

3. Алгоритм решения задачи размещения

центров

Известно, что задача (1)-(2) относится к классу задач (к, г)-размещения, которые можно решать с помощью различных приближенных методов [3,6]. Предложенный ниже алгоритм 1 размещения центров в СС является модификацией алгоритма М. Спона [7] с применением «жадной» эвристики В. Хватала [8].

Алгоритм 1 Задача (к, г)-размещения центров

1

2

3

4

5

6

7

8

9 10 11 12

13

14

15

для всех с £ Ус выполнять

вычислить Мс

Ут ^ 0, V/ ^ 0, 7 ^ 0

пока У^= 0 выполнять для всех с £ Ус выполнять

если ) П Мс1/шс > 7 то

7 ) ПМС|М

V ^ с _

Ут ^Ут и М Ус ^ Ус \ м

для всех в £ (Ув\У1) П Мю выполнять

к8 < к8 — 1 если к8 = 0 то

^ ^ \ {5}

У: ^У: и {*}

возвратить Ут

Алгоритм подразумевает наличие метрики на графе сети. В рассматриваемом случае используется метрика 1/С (хг,х^), (хг,х^) £ £, а параметр г расстояния до центра рассчитывается по формуле г := т/0Шт, где т — директивное время доставки информации в СС, а вш\п — минимальный размер передаваемого блока данных. На рис. 3 показан граф, иллюстрирующий применение предложенного алгоритма, где = {х1,х6,х9,х10,х12,х13}, Уп = {х2,х3,х4,х5,х7,х8,х11} и Ус = {х14,х15,х16,х17,х18,ж19,ж20}. Предполагается, что задача является "не взвешенной", т. е. шс = 1, с £Ус; пропускные способности рёбер графа (кбит/с) показаны на рис. 3, а 9ш\п = 12 Кбайт и т = 90 с, т. е. г = 0, 001. Результатом решения задач (1,г)- и (2, г)-размещения на таком графе являются множества Ут = {ж18} и Ут = {х18,х19} соответственно.

Рис. 3. Граф СС с исходными данными задачи размещения центров

На рис. 3 также показаны значения величин

а (8) := 53 53 53^™ (в, г), 8 £ У3

геУт г: ^(з^)ес(з^) пеМ

нагрузок (кбит/с), создаваемых в сети в результате запросов абонентов на передачу данных из ЦОД (предложенные нагрузки). Как видно из формулы (3), для оценки величины обслуженной системой нагрузки необходимо знать маршруты передачи, т. е. множества С (в,Ь), в £ , Ь £ Ут. Задача маршрутизации не является предметом исследований в данной статье, а в рассматриваемом ниже примере пучки маршрутов рассчитаны по аналогии с алгоритмом протокола ОБРЁ и с учётом балансировки нагрузок на рёбрах графа сети. В табл. 1 показаны маршруты и значения нагрузок на маршрутах, рассчитанные для графа на рис. 3 при решении задачи (1, г)-размещения.

Таблица 1

Маршруты и предложенные нагрузки для задачи (1, г)-размещения

С (м) li (s, t) ai (s,t)

[li (xi,Ж1в)} (Xi,X2,X3,Xig) 1,46

[li (Х6 ,Ж1в)} (x6,X5,X4,X3,Xi8) 1,5

[li (xq ,Xig) ,l2 (x9,xig)} (XQ,X8,X7,X3,Xis) 1,6

(Xq,X8,X3,Xi8) 3,6

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[li (Xi0,Xis)} (Xi0,Xg,X3,Xig) 2,5

[h (xi2,xis) ,h (xi2,Xis)} (Xi2,Xii,X7 ,X3,Xis) 1,6

(Xi2,Xii,X4 ,X3,Xi8) 0,2

[li (Xi3,Xi6)} (Xi3,Xii,X4 ,X3,Xi8) 1,3

4. Метод оценки величины обслуженной

нагрузки

Величина обслуженной нагрузки a (s), создаваемой в результате передачи данных по запросу s-абонента, вычисляется по формуле

«(*):= Е Е Е а- (М)(1 -(s,f)), (5)

t€VT г: li(s,t)eC(s,t) neU

где ain (s,t) предложенная нагрузка, а Bin (s,t) вероятность блокировки п-блока на li (s, ¿)-маршруте. Считая известными величины предложенных нагрузок и множества маршрутов С (s,t), задача оценки величины обслуженной нагрузки a (s) сводится к вычислению вероятностей Bin (s, t). Эти вероятности можно выразить через соответствующие вероятности блокировки n-блока на звеньях li (s,t)-маршрута в предположении, что блокировки на всех звеньях происходят независимо в совокупности, т. е.

Вгп (s,t) « В*п (s,t) = 1 - П (1 - Btn (s,t)),

ee£i(s,t) (6)

п еМ, i : li (s,t) e С (s, t), t e W, s e Vs,

где Si (s,t) множество звеньев li (s, ¿)-маршрута.

Предположение о независимости блокировок на звеньях сети лежит в основе известного метода приближенного расчёта вероятностей блокировок — метода просеянной нагрузки (англ. Reduced load approximation), разработанного (см., например, [9]) для задач анализа сетей с потоковым трафиком одноадресных соединений. В [10] этот метод развит для сетей с трафиком одноадресных и многоадресных соединений. Данный подход предполагает наличие точного метода для расчёта вероятностей блокировок на отдельном звене сети.

Рассмотрим отдельное звено е е S сети СС пропускной способности (ёмкости) С условных единиц, по которому передаются блоки данных М типов. Без ограничения общности дальнейшего изложения будем считать, что на рассматриваемом звене запросы на передачу n-блока образуют пуассоновский поток интенсивности

к := Е Е Е Xin (s,t), п eN,

seVs teVT i: li(s,i)eC(s,t)

где Xin (s,t) доля интенсивности потока запросов на передачу n-блока по li (s,t)-маршруту. Размер блока является случайной величиной, распределённой экспоненциально со средним дп, причём блок любого типа также характеризуется минимальным требованием b к ёмкости звена, а обслуживание блоков происходит по

дисциплине разделения процессора (англ. Processor Sharing, PS), что соответствует общепринятому подходу к моделированию эластичного трафика [4,5]. В [11] решена задача анализа вероятностных характеристик звена сети СС и показано, что вероятность блокировки запроса на передачу n-блока данных не зависит от параметра п и имеет вид

аСь (С -а) л кг

= ССЬ+Л - аРъ+1 =:В> п , (7)

а обслуженная нагрузка, создаваемая п-блоками, рассчитывается по формуле

- X-Л» i ■ "^ <8»

где ап := \п0п предложенная нагрузка, a := Еn€j\f ап и Сь := \С/Ь\. Заметим, что вероятность блокировки, определённая формулой (7), представляет собой функцию трёх переменных, но поскольку требование b едино для блоков данных любого типа — от двух параметров, т. е. можно считать, что:

5 =:Р (а,С) = X. 0)

Вернёмся к задаче расчёта вероятностей Bin (s, t), приближенное значение В*п (s, t) которых находится из (6), где величины Bfn (s, t) являются функциями от следующих параметров: ёмкости е-звена Се и величины поступающей на е-звено предложенной нагрузки ае, т. е.

Bein (s, t)=:Be = р (ае, Се), eeS. (10)

Тогда «просеянная» нагрузка ае равна предложенной на звено нагрузке, которая не была потеряна на других звеньях маршрута, т. е.

ае := ЕЕ Е Е -in (з ■ t) П (! -Ве)■ eeS. (11)

seVs teVT i: U(s,i)eC(s,t)neM e6£i(s,í)\{e>

Таким образом, вычисление вероятностей Bin (s, t) сводится к нахождению решения системы трансцендентных уравнений (9)—(11). На практике это удобно сделать методом простых итераций по предлагаемому ниже алгоритму 2.

Алгоритм 2 Метод просеянной нагрузки

1: е — _ > например, _ = 10-2

2: Be — Be, е e S > например, Be = 0, 5

3: пока е > £о выполнять > например, £о = 10-5

4: ае — Е Е Е Е ain (s ■ t) П (1 -Be)■ ees

seVs teVT i: h( s, t)eC( s, t)neH ee£i (s, t)\{e}

ё (а*)™ (Се - a

B Се)1св/Ъ1+1 - (de)[ce/bi+i ■ eec 6: £ —— E Be -Be

ee£

7: Be — Be, ees

8: B*n (S■ t) — 1 - n (1 -Be)■ n erf, i: li (S■ t) e L (S■ t) ■ teVT■ seVs

ee£i (s, t)

9: возвратить B*n (s ■ t) ■ n eN ■ i: k (s, t) e L (s, t), te VT, s eVs

а

rt

a

Завершая численный анализ рассматриваемого в статье примера СС, предположим, что один из абонентов системы (абонент 6, расположенный в вершине Х13)

увеличивает величину а (13) предложенной нагрузки от значения 1,3 до максимального значения 2,4 (кбит/с) ШПП звена (хц,х1з). Ясно, что такое поведение абонента влияет на маршрутизацию потоков в сети и на значения исследуемых вероятностных характеристик СС. Опуская для краткости промежуточные результаты, приведём значения вычисленных с помощью предложенных в статье методов для важнейшего показателя качества функционирования СС — величины (а — а)суммарной избыточной нагрузки. Как и следовало ожидать (табл. 2), наличие в СС двух ЦОД снижает общий объем избыточной нагрузки по сравнению с СС с одним ЦОД в относительных величинах до 4%. Таким образом, число ЦОД оказывает положительное влияние на показатели качества обслуживания абонентов. Однако в условиях ограниченной пропускной способности сети и, следовательно, ограниченных возможностей для маршрутизации потоков данных это влияние не приводит к резкому снижению величины избыточной нагрузки.

Таблица 2

Суммарная избыточная нагрузка в сетецентрической системе

Предложенная нагрузка Избыточная нагрузка (a — a)

a (13) (1, г)-размещение (2, г)-размещение

1,3 1, 83 1, 79

1,6 2, 01 1, 97

1,9 2, 85 2,16

2,2 2,40 2, 37

2,4 2, 57 2, 52

5. Заключение

В статье сформулирована общая задача оптимизации структурных и нагрузочных параметров СС с ограниченной пропускной способностью звеньев сети передачи данных. Разработаны вычислительные алгоритмы для решения задачи размещения ЦОД и для оценки величины обслуженной системой нагрузки. Для иллюстрации в рамках важного для приложений случая рассмотрен пример, показывающий на качественном уровне лишь часть проблем, возникающих при решении такого рода задач. Развитие методов решения поставленных задач, организация и проведение масштабного численного эксперимента являются задачами дальнейших исследований.

Литература

1. Alberts D. S., Garstka J. J., Stein F. P. Network Centric Warfare: Developing and Leveraging Information Superiority // DoD C4ISR Cooperative Research Program publication series. — 2-nd (revised) edition. — 2000. — 284 p.

2. Теория управления в системах военного назначения: Учебник / И. В. Котенко, А. В. Боговик, И. С. Ковалев и др.; под ред. И. В. Котенко. — М.: МО, 2001. — 320 с.

3. Еремеев А. В., Заозерская Л. А., Колоколов А. А. Задача о покрытии множества: сложность, алгоритмы, экспериментальные исследования // Дискретный анализ и исследование операций. — 2000. — Т. 7, № 2.

4. Меликов А. З., Пономаренко Л. А., Паладюк В. В. Телетрафик: модели, методы, оптимизация. — Киев: ИПК «Политехника», 2007. — 285 с.

5. Iversen V. B. Teletraffic Engineering: Handbook. — ITU-D. — 2006. — http: //www.com.dtu.dk/teletraffic/handbook/telenook.pdf.

6. Алгоритмы и программы решения задач на графах и сетях / М. И. Нечепу-ренко, В. К. Попков, С. М. Майнагашев и др.. — Новосибирск: Наука, 1990. — 515 с.

7. Spohn M. A, Garcia-Luna-Aceves J. J. A Solution for the Location Problem in Arbitrary Computer Networks Using Generic Dominating Sets // Proc. of the 2005 ACM Symposium on Applied Computing. — 2005. — Pp. 739-743.

8. Chvatal V. A Greedy Heuristic for the Set Covering Problem // Mathematics of Operations Research. — 1979. — Vol. 4, No 3. — Pp. 233-235.

9. Ross K. W. Multiservice Loss Models for Broadband Telecommunication Networks. — Springer, 1995. — 343 p.

10. Наумов В. А., Самуйлов К. Е., Яркина Н. В. Теория телетрафика мульти-сервисных сетей: Монография. — М.: РУДН, 2007. — 191 с.

11. Бородакий В. Ю. Вероятностная модель обслуживания трафика в системе сетецентрического типа // Информатика и её применения. — 2009. — № 3.

UDC 519.17

On the Datacenters Location Problem in the Network Centric

Systems

V. Yu. Borodakiy

Computer Systems and Technologies Department National Research Nuclear University "MEPHI" Kashirskoe avenue, 31, Moscow, 115409 , Russia

The formal graph model and the datacenters location problem definition in the network centric systems are developed. The objective functions for the optimization problem are as follows: quantity as well as the location on the net's graph for the datacenters, and the amount of the carried load transmitting from datacenters on the requests from the subscriber nodes. The algorithm for solving datacenters location problem is given, and the modified algorithm for the carried load amount approximation is proposed. The illustrative example of the numerical analysis is provided.

Key words and phrases: network centric systems, location problem, carried load, reduced load approximation.

i Надоели баннеры? Вы всегда можете отключить рекламу.