Задача оптимального размещения информационно-технологического резерва в распределенных системах обработки данных

Сомов Сергей Константинович

И нформационные технологии в управлении

УДК 004.75;004.02 D0l:https://doi.org/10.25728/pu.2018.4.6

ЗАДАЧА ОПТИМАЛЬНОГО РАЗМЕЩЕНИЯ ИНФОРМАЦИОННО-ТЕХНОЛОГИЧЕСКОГО РЕЗЕРВА В РАСПРЕДЕЛЕННЫХ СИСТЕМАХ ОБРАБОТКИ ДАННЫХ

С.К. Сомов

Отмечено, что информационно-технологический резерв — это новый вид информационного резервирования, применение которого в распределенных автоматизированных информационно-управляющих системах позволяет повысить эффективность функционирования таких систем при обработке типовых запросов пользователей. Сформулирована задача оптимального размещения идентичных копий информационно-технологического резерва по узлам распределенной системы в форме минисуммной задачи поиска р-медианы графа. Предложен алгоритм ее решения и приведен пример решения. Выполнен краткий анализ работы алгоритма решения.

Ключевые слова: распределенная система обработки данных, компьютерная сеть, информационно-технологический резерв.

ВВЕДЕНИЕ

Данная статья является продолжением предыдущей статьи [1]. В ней рассматривается проблема размещения копий информационно-технологического резерва (ИТР) по узлам компьютерной сети, на основе которой работает распределенная система обработки данных (РСОД). Информационно-технологический резерв представляет собой обобщение и дальнейшее развитие методов структурно-технологического резервирования, применение которого целесообразно в крупномасштабных автоматизированных информационно-управляющих системах с большим числом пользователей.

Характеристики и особенности обработки регулярных запросов пользователей систем данного класса позволяют разбить эти запросы на несколько различных групп, объединяющих запросы разного типа. Каждая такая группа запросов характеризуется некоторой инвариантной частью технологии обработки запросов, включенных в данную группу, и подмножеством данных, используемых при обработке этих запросов.

Инвариантную часть технологии можно оформить в виде подмножества процедур обработки данных, выполняемых в определенной последовательности. Это подмножество процедур, предназначенных для обработки регулярных запросов

определенного типа, можно выполнить заранее, до поступления в систему запросов. В результате будет сформирован промежуточный массив (массивы) данных, который может быть впоследствии использован при обработке поступивших запросов из группы соответствующего типа.

Подмножество процедур, а также сформированные ими промежуточные массивы данных составляют ИТР, используемый для ускорения обработки регулярных, типовых запросов пользователей. Копии ИТР, размещенные в узлах компьютерной сети, служат информационной основой для функционирования РСОД в будущем при обработке регулярных запросов пользователей. Причем обработка запросов будет вестись с использованием созданных заранее промежуточных массивов данных. Благодаря использованию данных промежуточных массивов ИТР обеспечивается повышение эффективности функционирования распределенной системы, так как значительно снижаются затраты времени на обработку регулярных запросов пользователей.

При регулярном создании полных копий (full backup) ИТР появляется возможность обработки средствами РСОД запросов пользователей к историческим данным. Кроме того, хранящиеся в узлах сети полные копии ИТР можно использовать также для восстановления данных и процедур ИТР в случае их частичного или полного разрушения.

Информационно-технологический резерв является составной частью системы обработки данных, поэтому проектирование и создание ИТР ведется в рамках процесса проектирования и создания всей РСОД.

Процесс проектирования и создания ИТР в рамках РСОД состоит из трех этапов [1].

На первом этапе выполняется анализ предметных областей пользователей системы, в ходе которого уточняются входные, промежуточные и итоговые данные, процедуры обработки этих данных и последовательность выполнения этих процедур при обработке типовых запросов пользователей.

На втором этапе на основе данных, полученных на первом этапе, осуществляется синтез информационного и программного обеспечения ИТР (массивы используемых входных, промежуточных и выходных данных и наборы процедур обработки данных).

На третьем этапе решается задача оптимального распределения ИТР (в виде определенного числа его копий) по узлам компьютерной сети, на базе которой работает РСОД. Копии ИТР размещаются по узлам компьютерной сети в целях повышения производительности, надежности и снижения стоимости функционирования системы (благодаря уменьшению затрат на обработку запросов).

Принципы и методы формирования структурно-технологического резерва подробно описаны в работе [1].

В настоящей статье описан третий этап процесса проектирования и создания ИТР для использования в распределенных системах. Дана формулировка и приведено решение задачи поиска оптимального размещения копий ИТР по узлам компьютерной сети. Оптимальное размещение копий ИТР позволяет предоставить пользователям системы кратчайший доступ к необходимой им информации и обеспечивает наименьшее время отклика системы на их запросы благодаря предварительно подготовленным промежуточным данным, хранящихся в ИТР.

1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО РАЗМЕЩЕНИЯ ИНФОРМАЦИОННО-ТЕХНОЛОГИЧЕСКОГО РЕЗЕРВА

В РАСПРЕДЕЛЕННОЙ СИСТЕМЕ ОБРАБОТКИ ДАННЫХ

Предположим, что РСОД работает на базе компьютерной сети, состоящей из / узлов (серверов), топология которой задана и которую можно представить в виде графа Б = (X, Г). Каждый сервер х.,

х. е X, у = 1, /, / = |Х\, сети может выступать в роли пользовательского сервера и обслуживать некоторое число пользователей системы (ввод пользователями запросов и выдача им результатов обработки этих запросов). Также сервер сети может вы-

полнять роль сервера ИТР, в котором размещена копия ИТР и который обрабатывает запросы пользователей, полученные от пользовательских серверов. При этом каждый запрос пользователя можно отнести к одному из N типов запросов. Допустим также, что в соответствии с некоторой процедурой определены маршруты, по которым передаются сообщения между узлами сети (запросы пользователей и ответы на эти запросы). Предполагается, что копии ИТР могут быть размещены в нескольких узлах сети. Необходимо определить такое подмножество X из р узлов множества X всех узлов сети, размещение в которых р копий ИТР обеспечит минимум стоимости эксплуатации РСОД при обработке регулярных запросов пользователей.

Обозначим через Л = || Х" || матрицу размерности

Nх /, где Х. — интенсивность запросов п-го типа,

формируемых пользователями в у-м узле сети в единицу времени.

Каждый запрос пользователя посылается из узла I (пользовательский сервер) в узел у, I, у = 1, /, (сервер ИТР) при условии, что в у-м узле сети расположена копия ИТР. Результат обработки каждого запроса (ответ на запрос) посылается из узла у обратно в узел I. Предполагается, что РСОД работает в установившемся режиме и все сформированные пользователями запросы обрабатываются.

Введем обозначения:

Б = ..., dn, ..., dN} — кортеж средних объемов данных, которыми обмениваются пользовательский сервер и сервер ИТР при обработке запроса

п-го типа, п = 1, N;

У= {Ур ..., у, ..., уД — кортеж «весов» узлов компьютерной сети, в котором V. — средний объем данных, который узел у передает и получает за единицу времени при обработке всех запросов, инициированных в этом узле:

V =

N

I ^ ХП

п = 1

^(х., х.) — длина кратчайшего пути из узла х. в

I } I

узел х.;

5 — стоимость передачи единичного объема данных по пути единичной длины;

со81(хг) — стоимость хранения копии ИТР, размещенной в узле х, за единицу времени; она включает в себя затраты на использование технических средств для хранения информации и затраты на репликацию изменений в данных ИТР для поддержки в актуальном состоянии всех копий ИТР, размещенных в узлах РСОД (вопросы реализации

механизма репликации изменений в данных ИТР выходит за рамки настоящей статьи).

Для поиска оптимального размещения копий ИТР по узлам сети предположим, что граф С = (X, Г) неориентированный и сформулируем обобщенную минисуммную задачу о р-медиане, приняв в качестве критерия оптимизации минимум затрат на функционирование РСОД [2, 3].

Определим для узла х. передаточное число

= Z js^.,

(1)

X e X

т. е. передаточное число представляет собой сумму стоимости обмена данными между узлом x. со всеми другими узлами множества X при обработке запросов за единицу времени.

Вершина X, для которой достигается минимум передаточного числа

ст(X) = min{a(x.)} = min J V [v,d/s(x,, x.)s] L,

xie X ' xie X jx ' ' J

называется медианой графа G.

Обозначим через X подмножество множества вершин X графа G, состоящее из p вершин, а через d(Xp, x,) — минимальное расстояние от вершины x, множества Хдо одной из вершин множества X. т. е.

d(X, x) = min [dis(x, x)].

p 1 X,. e Xp 1 1

(2)

Если обозначить через х* вершину из множества X, на которой достигается минимум в выражении (2), то можно говорить о том, что точка х. в выражении (2) «прикреплена» к точке х*. Применительно к рассматриваемой задаче это означает, что запросы, возникающие в узле х., маршрутизируются для обработки в узел х* с копией ИТР. Данный факт можно обозначить как х. ^ х*.

По аналогии с формулой (1) определим передаточное число не для одной вершины, а для подмножества вершин X [2]:

аЦ) = Z Vjs^ Xj)

X e X

Z J v.s min [d's(x., x.)]

L-t- 1 1 x, e Xp 1 1

Xj e X

(3)

С учетом принятых обозначений задачу оптимального размещения ИТР по узлам РСОД можно сформулировать следующим образом: для неориентированного графа С = (X, Г) требуется найти

такое подмножество Хр, состоящее из р вершин

этого графа, для которого достигается минимум функционала

Fp() = Z c°st(xi) + а().

(4)

X e X„

Первое слагаемое в выражении (4) определяет стоимость хранения копий ИТР, размещенных в p

вершинах подмножества Xp графа. Второе слагаемое представляет собой передаточное число подмножества Xp, которое определяется как

Ст( Xp) = min>(Xp)],

Xp с X

где, в свою очередь, передаточное число a(Xp) для подмножества Xp вычисляется по формуле (3).

В данной задаче могут быть ограничения. Например, может быть ограничение «сверху» на число p медиан, т. е. можно задать ограничение на максимальное число копий ИТР, размещенных в узлах компьютерной сети, на базе которой работает РСОД: |Xp| < p.

Еще одним примером ограничения в данной задаче служит ограничение на средний объем информации, обрабатываемой сервером с копией ИТР за единицу времени, т. е. ограничение на объем данных в запросах всех N типов, полученных сервером за единицу времени из «прикрепленных» к нему узлов, и объем данных, возвращаемых сервером в виде ответов на эти запросы:

Z

N

Z jj * D , j = 1, J.

Xj e X xj ^ x* n = 1

Для решения сформулированной задачи можно воспользоваться различными известными методами (например, методами целочисленного программирования, эвристическими методами и др.) [2-4].

Отметим, что поиск оптимального размещения копий ИТР по узлам компьютерной сети на основе сформулированной обобщенной минисум-мной задачи о p-медиане не является единственным вариантом решения рассматриваемой проблемы. В литературе можно найти обзоры и описания других подходов к решению задачи оптимального размещения копий (реплик) данных в узлах компьютерных сетей, в таких областях, как, например, Content Delivery Network, Data Grid, Cloud Computing, распределенные базы данных [5—8].

2. АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ

Как уже отмечалось, для решения сформулированной минисуммной задачи о p-медиане мож-

но воспользоваться различными методами [9—11]. В качестве примера рассмотрим только один из возможных алгоритмов решения задачи оптимального размещения ИТР в РСОД. Он основан на эвристическом методе поиска р-медиан взвешенного графа, предложенном в работе [4]. Данный метод заключается в следующем.

Сначала произвольным образом из множества всех вершин графа X выбираются р вершин, которые образуют исходное множество Хр медианных вершин, которое с некоторой точностью аппроксимирует искомое р-медианное множество Хр. Затем делается проверка, имеет ли множество X такую вершину х., которая не входит в множество Хр, х. е Х\Хр, и которая может заменить некоторую медианную вершину х . е X. Для проверки возмож-

I р

ности такой замены строится еще одно множество вершин Хр = (Хр и {х.})\{х.}. Затем вычисляются и

р р ) I

сравниваются между собой два передаточных числа для множества Хр, в котором произошла замена вершины х. на вершину х, и для исходного множества Хр: ст(Хр) и а(Хр).

Если при этом для передаточных чисел выполняется неравенство ст(Хр) < а(Хр), то вершина х{ в множестве Хр заменяется на вершину х.. Таким образом, множество Хр становится новой версией исходного множества Хр, так как оно лучше аппроксимирует искомое множество вершин Хр. Затем аналогичным образом проверяется уже новая версия множества Хр.

Такие проверки и замены вершин в последовательно создаваемых аппроксимирующих множествах Хр проводятся до тех пор, пока не удастся найти ни одной вершины х., такой, чтобы замена на эту вершину любой из вершин текущего множества Х приводила бы к улучшению (уменьшению) передаточного числа этого множества.

Сформулируем алгоритм эвристического поиска р-медиан графа.

Шаг 1. Случайным образом задается число р медиан графа. Затем случайным образом выбираются р вершин из множества Х всех вершин графа. Выбранные вершины образуют первоначальную версию множества Хр. Все вершины множества Х, не включенные во множество Хр, маркируются меткой «не протестирована».

Шаг 2. Случайным образом из множества {Х\Хр} выбирается «не протестированная» вершина х.. Если «не протестированных» вершин нет, то переход к шагу 6.

Шаг 3. В цикле для всех вершин х. множества Хр

I р

вычисляется величина Д., на которую изменится

Ч

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

значение функционала ¥р (рассчитывается по формуле (4)) при замене вершины х. в Х на вершину

I р

х., выбранную на шаге 2):

A. = Fp(Xp) - Fp(Xp), где X; = (Xp u Ц})\Ц}, т. е. изменение значения функционала

Aj =

X cost(xt) + Xp)

^ Е Хр

X cost( xi) + с( Xp)

LX Е Хр

Передаточные числа о(Хр) и ст(Хр) в этом выражении вычисляются по формуле (3).

Запоминается индекс I * той вершины х1 множества Хр, для которой достигается максимальное изменение значения функционала при ее замене на вершину х., т. е.

Д.,, = тах Д...

п

Х е Хр iJ

Шаг 4. Если A.*.< 0, т. е. замена какой-либо вер-

I J

шины множества X на «не протестированную» вершину Xj, выбранную на шаге 2, не улучшает значение функционала Fp(Xp), то вершина Xj маркируется как «протестированная», и переходим на шаг 2.

Шаг 5. Если A .> 0, то замена вершины x *

1 J I

множества X на вершину Xj улучшает значение функционала задачи. Производится такая замена,

и вершины x. и x* маркируются как «протестиро-

J *

ванные». В результате получаем новое множество Xp = (Xp u {х,.})\{хг}. Переход к шагу 2.

Шаг 6. Конец работы алгоритма. Текущее множество Xp является аппроксимацией искомого

p-медианного множества Xp узлов РСОД для размещения копий ИТР, близкого к оптимальному.

Описанный алгоритм реализован в виде программного модуля (в среде MS Visual Studio на языке программирования C++), с помощью которого решалась задача оптимального размещения ИТР в РСОД — см. далее пример.

3. ПРИМЕР РЕШЕНИЯ ЗАДАЧИ

Рассмотрим работу описанного алгоритма при числе медиан р = 3 на примере РСОД, работающей на базе компьютерной сети из 12 узлов. Топология компьютерной сети с пронумерованными узлами и длинами дуг представлена в виде неориентированного графа на рис. 1.

Х8 f--7-

Рис. 1. Топология компьютерной сети

Характеристики РСОД и компьютерной сети, на базе которой она функционирует:

— РСОД обрабатывает запросы пользователей, относящиеся к одному из 10-ти типов запросов;

— стоимость 5 передачи единичного объема данных по пути единичной длины составляет 50 ед.;

л П

— интенсивности к. запросов различного типа в узлах сети представлены в табл. 1;

— объемы данных передаваемых по сети при обработке запросов разного типа, приведены в табл. 2;

— «веса» V. узлов сети (объем получаемой и передаваемой информации при обработке запросов) представлены в табл. 3, значения весов подсчиты-ваются на основе данных в табл. 1 и 2;

— стоимость со81(хг) хранения ИТР в узлах сети представлена в табл. 4;

— матрица длин кратчайших путей показана в табл. 5.

В результате решения сформулированной задачи найдено близкое к оптимальному размещение Хр1 копий ИТР, данные которого представлены в табл. 6 и показано на графе (рис. 2), со значением функционала ДХр1) задачи, равного 4 750:

В таблице величины 5/_Хр, ?г_Хр и 5/_Хр1, ?г_Хр1 это соответственно, стоимость хранения копий ИТР и передаточное число (см. формулу (4)) для исходного множества узлов Хр и найденного в результате решения задачи множества Хр1 (узлы х3, х5, х9). Множество узлов Хр получено на шаге 1

Таблица 1

Матрица интенсивностей запросов различного типа в узлах сети

Номер узла сети

1 2 3 4 5 6 7 8 9 10 11 12

1 20 10 10 10 10 10 10 10 10 10 10 10

2 10 5 5 30 5 5 20 5 20 5 5 5

3 5 5 5 30 5 5 30 5 30 5 5 15

4 10 15 10 20 15 10 20 15 20 15 10 15

Тип запроса 5 6 10 5 5 10 5 5 10 10 5 10 5 10 10 10 5 10 10 10 5 10 5 10 5 10

7 30 10 10 10 10 5 10 10 30 15 10 10

8 20 20 10 15 20 10 15 20 15 20 10 20

9 10 5 5 30 5 5 30 5 30 5 5 5

10 10 5 10 20 5 10 20 5 20 5 10 5

Таблица 2

Объемы данных, передаваемых по сети при обработке запросов

Тип запроса 1 2 3 4 5 6 7 8 9 10

Объем данных 100 500 500 300 300 100 150 100 400 400

Таблица 3

Веса узлов сети

Номер 1 2 3 4 5 6 7 8 9 10 11 12

узла сети

Вес узла 30 500 20 500 19 500 64 000 20 500 19 250 59 000 20 500 62 000 21 250 20 000 25 500

Таблица 4

Стоимость хранения копии ИТР в узлах сети

Номер узла 1 2 3 4 5 6 7 8 9 10 11 12

сети

Стоимость 500 500 400 300 400 450 500 350 350 500 500 450

Рис. 2. Размещение копий ИТР в узлах компьютерной сети Рис. 3. Зависимость стоимости 5<_Хр1 хранения копий ИТР от их

числа р

описанного выше алгоритма. Для этого множества рассчитано значение функционала F(Xp), равного сумме затрат &1_Хр на хранение копий и передаточного числа ^_Хр, характеризующего затраты на обработку запросов.

В ходе экспериментов по выявлению зависимости значения функционала F(Xp\) от числа медиан р (при неизменных характеристиках РСОД и компьютерной сети) были получены результаты, представленные далее в табл. 7 и графиках.

На рис. 3 и 4 показана близкая к линейной зависимость стоимости st_Xp\ хранения копий ИТР и затрат ^_Хр\ на обработку запросов пользователей от числа р.

В табл. 7 и на графике рис. 5 показана зависимость значений функционала задачи F(Xp\) и его

компонент (стоимости st_Xpl хранения копий ИТР и затрат tr_Xp\ на обработку запросов) от числа р копий ИТР, размещенных по узлам компьютерной сети.

Как видно из значений функционала задачи F(Xp1), приведенных в табл. 7, и графика на рис. 5, функционал имеет минимальные значения при числе медиан графа от 4 до 6. При уменьшении числа медиан от 3 до 2 значение функционала растет. Аналогичная картина наблюдается при увеличении числа медиан от 7 до 11. Объяснение этому факту можно найти, посмотрев, как ведут себя графики затрат st_Xp1 на хранение копий ИТР и передаточного числа tr_Xp1, характеризующего размер затрат на обработку запросов к копиям ИТР (см. рис. 3 и 4). При уменьшении числа копий

Таблица 5

Матрица длин кратчайших путей

Номер узла сети

1 2 3 4 5 6 7 8 9 10 11 12

1 0 20 26 16 10 17 24 17 21 29 31 28

2 20 0 25 12 15 22 29 22 26 34 33 33

3 26 25 0 11 16 23 19 12 12 20 19 5

4 16 12 11 0 5 12 19 12 16 24 23 23

5 10 15 16 5 0 7 14 7 11 19 18 18

Номер узла сети 6 7 17 24 22 29 23 19 12 19 7 14 0 7 7 0 14 7 18 11 26 19 27 18 27 18

8 17 22 12 12 7 14 7 0 4 12 11 11

9 21 26 12 16 11 18 11 4 0 8 7 7

10 29 34 20 24 19 26 19 12 8 0 15 15

11 31 33 19 23 18 27 18 11 7 15 0 14

12 28 33 5 23 18 27 18 11 7 15 14 0

Таблица 6

Решение задачи размещения ИТР по узлам сети

Хр ДХр) ^_Хр Х?1 В(Хр1) st_Xp1 &_Хр1

, Х3, Х5 6350 1300 5050 Х3, Х5, Х9 4750 1150 3600

2 3 4 5 6 7 8 9 10 11

число медиан 2 3 4 5 6 7 8 9 10 11

-затраты на обработку запросов 4 650 3 600 2 850 2 450 2 100 1 400 1 150 850 600 250

Рис. 4. Зависимость затрат &_Хр1 на обработку запросов от числа копий ИТР

ИТР (числа медиан р) в сети происходит, с одной стороны, уменьшение затрат 5/_Хр1 на хранение ИТР, а с другой стороны, увеличиваются затраты ?г_Хр1 на обработку запросов к копиям ИТР. Причем при заданных параметрах сети увеличение затрат на обработку запросов происходит быстрее, чем уменьшение стоимости хранения ИТР. При увеличении числа копий ИТР, начиная с некоторого их числа рост затрат на хранение превышает уменьшение затрат на обработку запросов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из приведенных результатов следует очевидный вывод о том, что для рассматриваемой задачи необходимо определить как оптимальное число копий ИТР, так и оптимальное размещение этих копий в узлах распределенной системы обработки данных.

Был также проведен эксперимент по проверке стабильности результатов, получаемых с помощью эвристического алгоритма поиска р-медиан графа.

При постоянном числе р медиан, равном 7, и неизменных характеристиках РСОД и компьютерной сети, алгоритм решения задачи запускался 12 раз. В результате получено множество значе-

Зависимостьзначения

Рис. 5. Зависимость значения функционала и его компонент от числа медиан

ний функционала задачи ДХр1), представленное в табл. 8.

Среднее значение функционала задачи равно 4592. При этом отклонение значений функционала, полученных при 12-ти запусках алгоритма, от среднего значения не превышает 3,09 %, т. е. выбранный для решения задачи алгоритм дает достаточно стабильные результаты.

4. ОСНОВНЫЕ ВЫВОДЫ

Применение информационно-технологического резервирования в РСОД позволяет значительно увеличить эффективность функционирования систем благодаря существенному снижению времени обработки поступающих от пользователей запросов. Это обусловлено тем, что заранее сформированные промежуточные массивы данных ИТР и набор процедур обработки запросов размещаются в узлах компьютерной сети, расположенных как можно ближе к источникам запросов. Это обеспечивает возможности для кратчайшего доступа пользователей к необходимой им информации. Кроме того, процесс обработки запросов пользо-

Таблица 7

задачи от числа медиан графа

Число медиан 2 3 4 5 6 7 8 9 10 11

Стоимость хранения копий ИТР 650 1150 1700 2000 2450 3050 3450 3850 4250 4750

Затраты на обработку запросов 4650 3600 2850 2450 2100 1400 1150 850 600 250

Функционал задачи 5300 4750 4550 4450 4550 4450 4600 4700 4850 5000

Таблица 8

Значения функционала задачи

Номер расчета 1 2 3 4 5 6 7 8 9 10 11 12

Значение функционала 4550 4650 4500 4450 4600 4600 4650 4650 4700 4600 4650 4500

вателей ускоряется также благодаря предварительно подготовленным промежуточным массивам данных. Множество копий ИТР, размещенных в узлах сети, содержащих предварительно сформированные промежуточные массивы данных, служат информационной базой для функционирования РСОД в будущем при обработке запросов, поступивших от пользователей уже после создания ИТР.

Остановимся на некоторых важных вопросах, которым необходимо уделить особое внимание в процессе проектирования РСОД, использующих ИТР.

• Отметим, что при проектировании ИТР для крупномасштабных РСОД с огромным числом пользователей потребуется выполнить и большой объем работ по анализу предметных областей пользователей системы:

— территориальная распределенность пользователей;

— перечень запросов;

— их разбиение по различным типам;

— перечень запрашиваемой информации;

— частота возникновения запросов;

— выделение групп пользователей, запрашивающих аналогичные данные.

Возможно, этот процесс потребует выделения дополнительных ресурсов бизнес- и системных аналитиков.

• Очень важно решить сложную задачу обеспечения достоверности информации в массивах данных ИТР в случае изменения тех или иных исходных данных. Для ее решения можно применить различные алгоритмы, различающиеся по сложности и стоимости их реализации. Это в свою очередь обусловливает необходимость поиска оптимального варианта решения задачи. При этом, например, возможны следующие варианты:

— пересчет данных в одном узле и репликация изменений в данных в узлы с копиями ИТР;

— пересчет промежуточных данных в каждом из узлов с ИТР;

— рассылка сообщений-извещений о неактуальности данных в копиях и др.

Формальная постановка и поиск решения данной задачи составляет предмет дальнейших исследований.

• В случае большого числа распределенных источников исходных данных, используемых для формирования ИТР (например, таблиц территориально распределенной базы данных) системным архитекторам и аналитикам необходимо тщательно спроектировать эффективную технологию формирования ИТР. Так как процесс формирования ИТР на основе большого числа распределенных источников данных может потребовать слишком больших ресурсов компьютерной сети.

ЗАКЛЮЧЕНИЕ

Сформулированы задачи поиска оптимального размещения копий информационно-технологического резерва по узлам распределенной системы и представлен алгоритм их решения. Данный алгоритм реализован в виде программного модуля, который применялся для решения задачи оптимального размещения ИТР в РСОД.

Приведен пример решения задачи оптимизации по критерию минимума стоимости функционирования РСОД. На расчетных данных примера продемонстрирована зависимость стоимости эксплуатации системы, стоимости хранения ИТР и затрат на обработку запросов от числа копий ИТР, размещенных в узлах компьютерной сети.

Дано краткое описание направления дальнейших исследований по проблемам использования данного вида резерва в компьютерных сетях, неоднородных в смысле распределения частот возникновения в узлах сети запросов пользователей.

ЛИТЕРАТУРА

1. Сомов С.К. Создание информационно-технологического резерва в распределенных системах обработки данных // Проблемы управления. — 2018. — № 3. — С. 40—46.

2. Кристофидес Н. Теория графов. Алгоритмический подход. — М.: Мир, 1978. — 432 с.

3. Майника Э. Алгоритмы оптимизации на сетях и графах. — М.: Мир, 1981. — 322 с.

4. Teitz M.B., Bart P. Heuristic methods for estimating the generalized vertex median of a weighted graph // Operations Research. — 1968. — Vol. 16. — P. 955—961.

5. Sahoo J., Salahuddin M.A., Glitho R. A Survey on Replica Server Placement Algorithms for Content Delivery Networks // IEEE Communications Surveys & Tutorials. — 2016. — 30 p. — URL: https://arxiv.org/ftp/arxiv/papers/1611/1611.01729.pdf (дата обращения: 6.07.2017).

6. Souri A., Rahmani A. A Survey for Replica Placement Techniques in Data Grid Environment // Intern. Journal Modern Education and Computer Science. — 2014. — Vol. 5. — P. 46—51.

7. Mansouri N. Adaptive data replication strategy in cloud computing for performance improvement // Frontiers of Computer Science. — 2016. — Vol. 10, N 5. — P. 925—935

8. Чернышев Г.А. Обзор подходов к организации физического уровня в СУБД // Тр. СПИИРАН. — 2013. — Вып. 1 (24). — С. 222—275.

9. Reese J. Methods for Solving the p-Median Problem: An Annotated Bibliography // Networks. — 2006. — Vol. 48, N 3. — P. 125—142.

10. Daskin M.S., Maass K.L. The p-Median Problem // Location Science. Springer. — 2015. — P. 21—45. — URL: https:// link.springer.com/book/10.1007/978-3-319-13111-5#toc (дата обращения: 10.01.2018).

11. Mladenovic N, Brimberg J., Hansen P., The p-median problem: A survey of metaheuristic approaches // European Journal of Operational Research. — 2007. — Vol. 179, N 3. — P. 927—939.

Статья представлена к публикации членом редколлегии В.В. Кульбой.

Сомов Сергей Константинович — канд. техн. наук, вед. инженер, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, И ssomov2016@ipu.ru.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сомов Сергей Константинович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сомов Сергей Константинович

Текст научной работы на тему «Задача оптимального размещения информационно-технологического резерва в распределенных системах обработки данных»