Научная статья на тему 'Задачи обеспечения устойчивости функционирования распределенных информационных систем'

Задачи обеспечения устойчивости функционирования распределенных информационных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1098
184
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
распределенная информационная система / математические модели / дискретная оптимизация / оптимизация по Парето / устойчивость функционирования / distributed information system / mathematical models / discrete optimization / Pareto optimization / oper-ational sustainability

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д О. Есиков

Предложены способы обеспечения устойчивости функционирования распределенных информационных систем. Формализованы задачи обеспечения устойчивости функционирования распределенных информационных систем в со-ставе: математическая модель оптимизации распределения элементов ПО функциональных задач по узлам сети, мате-матическая модель оптимизации распределения информационных ресурсов по центрам хранения и обработки данных, математическая модель определения рационального уровня расходов на формирование комплекса средств хранения данных в центрах хранения и обработки информации, математическая модель оптимизации состава технических средств системы хранения и обработки данных, математическая модель оптимизации распределения резерва инфор-мационных ресурсов по центрам хранения и обработки данных. Показано, что они относятся к классу задач дискрет-ной оптимизации, дана их характеристика. Предложен порядок применения комплекса математических моделей обес-печения устойчивости функционирования распределенных информационных систем с указанием входных и выход-ных данных для каждой модели. Для решения разработанных задач предложено использовать программный комплекс, реализующий метод ветвей и границ по решению задач дискретной оптимизации с булевыми переменными с приме-нением алгоритма предварительного определения порядка ветвления переменных на основе использования теории двойственности. Применение теории двойственности в методе ветвей и границ позволяет существенно усилить отсев бесперспективных вариантов и сократить время решения задач по сравнению с традиционным методом в среднем в 8 раз. Приведены особенности практического использования разработанного комплекса математических моделей на стадиях проектирования, эксплуатации и совершенствования жизненного цикла распределенных информационных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Д О. Есиков

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PROBLEMS OF ENSURING DISTRIBUTED INFORMATION SYSTEMS SUSTAINABILITY

The paper considers the ways to ensure distributed information systems sustainability. It formalizes the problems of ensuring sustainability of distributed information systems, which consist of: a mathematical optimization model for functional tasks software elements distribution according to network nodes; a mathematical optimization model for information resources distribution according to data storage and processing centers; a mathematical model for determination of a reasonable expenditure level to form data storage facilities; a mathematical optimization model of technical means for data storage and processing; a mathematical optimization model for information resources reserve distribution on data storage and processing centers. The article shows that they belong to discrete optimization problems and gives their characteristics. It also proposes a procedure for applying a complex of mathematical models to ensure distributed information systems sustainability with indication of input and output data for each model. To solve the abovementioned problems the authors suggest using a software package, which implements the branch and bound method to solve discrete optimization problems with Boolean variables using the algorithm of branching variables pre-determined order based on the duality theory. The duality theory in the branch and bound method significantly enhances the screening of unpromising options and reduces the time for solving problems compared with the traditional method on average in 8 times. The paper gives the special aspects of practical use of the developed mathematical model complex during design, maintenance and update of distributed information systems life cycle.

Текст научной работы на тему «Задачи обеспечения устойчивости функционирования распределенных информационных систем»

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

УДК 681.322 Дата подачи статьи: 08.05.15

DOI: 10.15827/0236-235X. 112.133-141

ЗАДАЧИ ОБЕСПЕЧЕНИЯ УСТОЙЧИВОСТИ ФУНКЦИОНИРОВАНИЯ РАСПРЕДЕЛЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Д.О. Есиков, аспирант, [email protected] (Тульский государственный университет, пр. Ленина, 92, г. Тула, 300012, Россия)

Предложены способы обеспечения устойчивости функционирования распределенных информационных систем. Формализованы задачи обеспечения устойчивости функционирования распределенных информационных систем в составе: математическая модель оптимизации распределения элементов ПО функциональных задач по узлам сети, математическая модель оптимизации распределения информационных ресурсов по центрам хранения и обработки данных, математическая модель определения рационального уровня расходов на формирование комплекса средств хранения данных в центрах хранения и обработки информации, математическая модель оптимизации состава технических средств системы хранения и обработки данных, математическая модель оптимизации распределения резерва информационных ресурсов по центрам хранения и обработки данных. Показано, что они относятся к классу задач дискретной оптимизации, дана их характеристика. Предложен порядок применения комплекса математических моделей обеспечения устойчивости функционирования распределенных информационных систем с указанием входных и выходных данных для каждой модели. Для решения разработанных задач предложено использовать программный комплекс, реализующий метод ветвей и границ по решению задач дискретной оптимизации с булевыми переменными с применением алгоритма предварительного определения порядка ветвления переменных на основе использования теории двойственности. Применение теории двойственности в методе ветвей и границ позволяет существенно усилить отсев бесперспективных вариантов и сократить время решения задач по сравнению с традиционным методом в среднем в 8 раз. Приведены особенности практического использования разработанного комплекса математических моделей на стадиях проектирования, эксплуатации и совершенствования жизненного цикла распределенных информационных систем.

Ключевые слова: распределенная информационная система, математические модели, дискретная оптимизация, оптимизация по Парето, устойчивость функционирования.

Задача обеспечения устойчивости функционирования распределенных информационных систем (РИС), несмотря на интенсивное развитие средств хранения и обработки информации, до сих пор стоит очень остро. Данное обстоятельство связано с ростом объемов критически важных данных, хранящихся и обрабатываемых в системе, с ограниченными материальными средствами, выделяемыми на создание и развертывание РИС, ограниченной пропускной способностью каналов передачи данных и других характеристик сети, с влиянием дестабилизирующих факторов различной природы.

На предприятиях промышленности, в организациях и государственных учреждениях различных уровней эксплуатируется большое количество информационных систем (ИС), требующих хранения больших объемов данных, критичных для решения задач управления. К таким ИС относятся системы учета и хранения конструкторской документации, системы электронного документооборота, ИС управления персоналом, ERP-системы и др.

Надежное и бесперебойное функционирование данных систем является залогом эффективного функционирования организаций и предприятий в различных сферах экономики. Под устойчивостью функционирования системы понимается ее способность выполнять возложенные функции с заданными показателями качества в условиях воздействия дестабилизирующих факторов [1, 2].

В настоящее время наиболее эффективными для обеспечения устойчивости функционирования РИС являются следующие подходы [3, 4]:

- совершенствование информационно-вычислительного процесса, в том числе в части обеспечения его устойчивости;

- создание высоконадежных подсистем хранения и резервирования данных.

В общем случае можно утверждать, что устойчивость функционирования РИС непосредственно зависит от устойчивости процессов хранения и обработки данных (ХОД) в системе вычислительных средств распределенной сети. Для повышения устойчивости процессов ХОД на этапе проектирования эксплуатации РИС целесообразно рациональное распределение элементов ПО и информационных массивов по узлам вычислительной сети, а при воздействии дестабилизирующих факторов, в случае структурной деградации сети - их перераспределение [1].

Решение задач организации процессов ХОД позволяет повысить эффективность функционирования системы за счет снижения издержек, связанных с разрушением информации, включая потери от невозможности решения задач и получения недостоверных результатов, за счет уменьшения времени и затрат на восстановление разрушенной или искаженной информации, рационального использования внешней памяти вычислительных средств для размещения данных РИС и т.д.

133

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

Практическое решение вопросов оптимизации распределения (перераспределения) информационных ресурсов, а также управление данным распределением в РИС связаны с развитием теории дискретной оптимизации. Большая размерность, дискретность, нелинейность указанных задач и необходимость их решения в жестких временных рамках (на этапах эксплуатации и совершенствования) порождают задачу многомерности, дискретности и поиска путей снижения размерности сформулированных задач, разработки и использования эффективных методов их решения.

Основу РИС составляет система ХОД, предназначенная для организации надежного, а также отказоустойчивого хранения данных, высокопроизводительного доступа серверов к устройствам системы ХОД.

Для рациональной организации процессов ХОД в РИС в структуре системы ХОД создают центры ХОД, основной задачей которых является реализация эффективных, с точки зрения решаемых в системе задач, процессов хранения и обработки информации.

Вследствие ограниченности материальных средств, выделяемых на создание РИС, хранение и обработка информации в них осуществляются в ограниченном количестве центров ХОД, создаваемых в соответствующих узлах сети. В центрах ХОД аккумулируются мощные вычислительные средства и средства хранения данных, обеспечивающие решение функциональных задач как отдельного сегмента сети, так и системы в целом.

Таким образом, для обеспечения устойчивости функционирования РИС разработан комплекс математических моделей (рис. 1) в следующем составе:

- оптимизация распределения элементов ПО функциональных задач по узлам сети;

- оптимизация распределения информационных ресурсов по центрам ХОД;

- определение рационального уровня расходов на формирование комплекса средств хранения данных в центрах ХОД;

- оптимизация состава технических средств системы ХОД;

- оптимизация распределения резерва информационных ресурсов по центрам ХОД.

Задача определения числа и месторасположения центров ХОД в РИС решается с целью получения такого плана распределения центра ХОД, который обеспечивал бы использование наиболее скоростных каналов передачи данных при информационном обмене. Определение количества и месторасположения центров ХОД в системе ХОД возможно путем решения задачи о ^-медиане [5], которая относится к классу задач целочисленного линейного программирования. Для ее решения обычно используется метод ветвей и границ.

Целью решения задачи оптимизации состава технических средств системы ХОД, составляющих основу центра ХОД, является получение такого состава технических средств, который обеспечивал бы максимальное значение коэффициента готовности системы в целом при соблюдении ограничений на общий объем пространства средств хранения, на время восстановления системы, на стоимость системы резервирования.

Пусть все средства хранения данных, претенденты на включение с состав комплекса технических средств центра ХОД, делятся на I групп. В каждую i-ю группу средств хранения входят Zi средств хранения, имеющих номера с 1 по Zi. Заданы стоимость, время восстановления и объем информационного пространства каждого средства хранения данных.

Тогда по критерию максимума значения коэффициента готовности системы хранения данных в целом задача оптимизации состава средств хранения может быть сформулирована следующим образом [6]. Найти такие значения переменных zi (i=1, 2, ..., I), что

ПМz, max (1)

i=1

при ограничениях

- на стоимость системы резервирования:

i

YC {Zi )< Cдоп, (2)

i=1

- на время восстановления системы резервирования:

YTB {z, )< ТВдоп, (3)

i=1

- на общий объем средств хранения:

YV {Zi )> vr, (4)

i=1

- на значения переменных:

z=1, 2, ..., Zi, (5)

где Сдоп - максимально допустимая стоимость системы хранения и резервирования; TB доп - максимально допустимое время восстановления системы хранения и резервирования; К,доп - максимально допустимый информационный объем системы хранения и резервирования данных; I - число видов средств хранения информации.

Задача (1)-(5) относится к классу задач выбора комплекса технических средств, и для ее решения применяются методы динамического программирования [7].

В связи с тем, что затраты на построение системы ХОД в центре ХОД существенны по размеру и значительно растут при ужесточении требований к надежностным показателям качества их функционирования, необходимо обоснование рациональности выбора их размера.

134

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

Оптимизация состава комплекса технических средств хранения данных

Значение рационального уровня расходов на создание системы ХОД

/

Определение рационального уровня расходов на формирование комплекса средств хранения данных в центрах ХОД

План расположения центров ХОД в РИС

План распределения ПО по узлам сети

Оптимизация распределения ПО функциональных задач по узлам сети

Оптимизация

распределения

резерва

информационных массивов по центрам ХОД

План распределения информационных массивов по центрам ХОД

Рис. 1. Порядок применения комплекса математических моделей обеспечения устойчивости

функционирования РИС

Fig. 1. The application of the complex of mathematical models to ensure distributed information systems sustainability

Для определения рационального уровня расходов на формирование комплекса средств хранения

данных в центрах ХОД предлагается использовать методику, основанную на применении элементов

135

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

теории вероятностей и теории благосостояния (принцип оптимальности по Парето) [8, 9], суть которой состоит в следующем.

Пусть q - параметр, характеризующий уровень сохранности информации в РИС, 0 <q <1. Обозначим через Zф потери от разрушения или нарушения целостности информации в РИС, которые зависят от определенного в РИС уровня обеспечения сохранности информации (ОСИ), описываемого значением параметра q. Будем считать, что эта величина принимает максимальное значение при q = 0 (отсутствие системы ОСИ) и значение, равное нулю, при q=1 (наличие «абсолютной» системы ОСИ). Таким образом, имеем функцию вида Z,^ = Z4,(q), q е [0, 1].

При отсутствии системы ОСИ (q = 0) потери от разрушения или искажения информации в РИС составляют С единиц. Будем считать, что с ростом величины q значение потерь Zф уменьшается по экспоненциальному закону и при q=1 становится практически равным нулю. Этим требованиям удовлетворяет функция Z, (q) = Ceaq.

Параметр а, входящий в это выражение, можно

1 (С)

вычислить из уравнения а = ln I — I, где е - пара-

метр, учитывающий степень важности информации, обращающейся в РИС.

Пусть Zc - затраты на создание системы ОСИ, которые описываются функцией вида Zc = Zc(q), q е [0, 1].

Эта функция описывается зависимостью

Zc(q) = C2 e-4 (1-q).

Здесь С2 - стоимость создания «абсолютной» системы ОСИ, при которой уровень сохранности информации q = 1. Параметр b определяется по

формуле b = ln I — I.

При разработке системы ОСИ естественным требованием является минимизация затрат Zф и Zc путем выбора значения вероятности q на интервале [0, 1], то есть Z4 (q) — min, Zc (q) — min.

Данные целевые функции противоречивы, так как с ростом значения q затраты Zф убывают, а затраты Zc возрастают. Это позволяет установить некоторый компромисс между значениями затрат Zф и Zc.

Для реализации такого подхода сформулируем двухкритериальную задачу оптимизации вида

(Zi, , Zo) — min .

0<q<1

Парето-оптимальное решение этой задачи будем искать путем минимизации линейной свертки критериев: L(q, X) = XZ. (q) + (1 - X)Zc (q) — min.

0< q<1

Здесь X е (0, 1) - параметр свертки критериев.

Для решения задачи можно использовать необходимое условие экстремума функции L (q, X), которое записывается как ВТ

— = XZ;(q) + (1 -X)Zc'(q) = 0 . oq

Решая это уравнение, получаем параметрическую зависимость вида q = q(X), Xe(0, 1), которая описывает множество парето-оптимальных решений задачи в пространстве решений.

После подстановки функций Zф=Zф(q) и Zc=Zc(q) в условие экстремума L(q, X) получим [7]: -1аС1в~ач + (1 — X)C2be~b(1—q) = 0 .

Решая это уравнение, получим конкретный вид зависимости:

- ln

q(X) = -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

C2b (1 — X) XC, а

Xe (0,1).

а + b

Для определения допустимых значений параметра свертки X, входящего в это выражение, примем, что задано значение q*, определяющее границу вероятности q, то есть минимально допустимый с точки зрения ОСИ уровень. Тогда парето-оптимальные значения вероятности q(X) должны удовлетворять неравенству вида q* < q(X) <1.

При этом минимальное значение Xmm е (0, 1)

определяется как

X_ = -

C2be'b(1~q>

С2ЬеЬ(1— > + C аеа

При q(X) <1 имеем следующее ограничение на

. . С2Ь

значение параметра X: X =-----2---- при за-

А a max ^ 7 ^ -а А

Cb+Сае

мене q* на величину q(X)=0,85.

В связи с тем, что уровень ОСИ, при котором q=1, на практике недостижим, но разработчик стремится обеспечить такой уровень, значение С2 можно формировать двумя путями: заданием разработчиком величины С2, при которой, с его точки зрения, будет достигнут максимально возможный уровень ОСИ в РИС (30-50 % стоимости системы ОСИ), и использованием значения С2 из практики разработки и функционирования хорошо защищенных систем ХОД.

Так, при q*=0,85, С)=150 000 000, С2=48 000 000 можно получить множество значений уровня обеспечения ОСИ путем варьирования значений параметра X в интервале [0.999977, 0.999999].

Пример графиков функций Zф(q) и Z^q) при е = 0,01 для особо важной информации (ИС учета и хранения конструкторской документации), е = 0,0001 для важной информации (информационных массивов электронного документооборота, договорные материалы), е = 0,000001 для информационных массивов, хранящих информацию, важную в течение заданного периода времени (текущая переписка), представлен на рисунке 2.

136

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

а)

б)

Рис. 2. Графики зависимостей: а) потери от разрушения или искажения информации в РИС Zф(q), в тыс. рублей; б) затраты на создание системы ОСИ Zo(q) от вероятности успешного функционирования ОСИ (q) при различных значениях параметра е, в тыс. рублей

Fig. 2. Dependency graphs:

a) loss from information destruction and distortion in Zф(q) distributed information system, thousand RUB;

b) the cost of creating the system of ensuring the safety information on the probability of successful operation

of ensuring the safety of information (q) for different values of е thousands rubles

Из рисунка 2 видно следующее:

- график зависимости Zc1(q) является некорректным, поскольку при затратах на разработку систем информационной безопасности, равных 0, вероятность обеспечения безопасности при функционировании системы ХОД q ^0;

- при уменьшении величины е наблюдается уменьшение значения функций Z,^(q) и ZG(q) при одинаковом значении аргумента.

Исходя из этого, можно сделать вывод о том, что для систем ОСИ, в которых обращается информация с более высокой степенью важности, минимальное значение в интервале варьирования параметра X должно быть больше, чем для системы ХОД с более низкой степенью важности.

Таким образом, множество значений вероятности обеспечения ОСИ в РИС и соответствующие им значения потерь от потери или искажения информации и затрат на создание системы ОСИ возможно определить путем варьирования значений параметра свертки X в интервале [Xmm, Xmax], что позволит выбрать значение требуемой вероятности ОСИ из полученного множества. При этом в качестве исходных данных для получения вышеуказанного множества выступает незначительный набор данных.

На основе результатов решения задач определения числа и месторасположения центров ХОД в РИС, оптимизации состава технических средств системы ХОД формализованы задачи оптимизации распределения элементов ПО функциональных задач по узлам сети и оптимизации распределения резерва информационных ресурсов по центрам ХОД.

Для простоты дальнейших рассуждений примем следующее допущение: время получения информации из информационного массива равно 0, то есть оперативность получения данных для решения задач не зависит от каналов передачи данных и размещения информационного массива по узлам сети.

Пусть задана сеть, состоящая из L вычислительных комплексов.

В сети решается К задач. Для каждого j-го узла сети сформирован и определен перечень задач, решение которых разрешено должностным лицам. Решение каждой из задач связано с формированием и обработкой соответствующего числа запросов на получение (сохранение, изменение) данных из (в) информационных массивов.

Размещение ЭПО по узлам сети определяется планом распределения, задаваемым матрицей

ф =1 % II’

1, если k - й ЭПО размещается

<ykj = <! на j - м узле сети,

0 в противном случае.

Тогда выражения для определения вероятности успешного решения Pjk, времени решения задач Грш , объема информации, передаваемой по кана-

лам связи при решении каждой задачи на каждом вычислительном комплексе (узле сети) Л*(/=1, 2, ..., L; k=l, 2, ..., K), имеют вид

L

Pjk = Т jk X Ф« Pjkl ’ l=1

L

рг=еф« (Tjik + грет),

l=1

137

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

Л* =

V*

5 {(

FA * FA

где P^ - вероятность успешной передачи информации между узлами j и i при решении на j-м вычислительном комплексе k-й задачи, Pj* = Pj* Pjk;

Pj*, Pjk - вероятность успешной передачи запроса

(сообщения) на решение и сообщения с результатом решения должностным лицом j-го узла сети k-й задачи в i-м узле сети соответственно; Fij -число ИС, пересылаемых при передаче из i-го узла сети в j-й; Tijk - среднее время передачи сообщения из i-го узла сети в j-й при решении k-й задачи должностным лицом j-го вычислительного комплекса:

Tjk = j * Tk, j, Tjkk - среднее время горедачи запроса на решение и сообщения, содержащего результаты решения должностным лицом j-го вычислительного комплекса k-й задачи в i-м узле сети соответственно; уу - время выполнения k-го ЭПО

на l-м вычислительном комплексе должностным лицом j-го узла при наличии всех исходных данных; %jk = 1, если должностные лица j-го вычислительного комплекса решают k-ю задачу, тд = 0 в противном случае; Xjk - интенсивность решения k-й задачи должностными лицами j-го вычислительного комплекса; l) - объем запроса, формируемого должностными лицами j-го вычислительного комплекса на решение k-й задачи; lк - объем

сообщения с результатами решения должностными лицами j-го вычислительного комплекса k-й задачи; uk - объем внешней памяти, занимаемый k-м ЭПО.

С использованием данных выражений задача распределения ЭПО по критерию минимума объема информации, передаваемой по каналам связи при выполнении в РИС всех ЭПО (при решении всех функциональных задач), может быть сформулирована следующим образом. Определить такие значения ф^ (k=1, 2, ..., K; j=1, 2, ..., L), что

Л = min ££Л j* (ф) (6)

j=1 k=1

при ограничениях

- на время решения задач:

Tfy < туп, j=1, 2, ..., L, k=1, 2, ..., K; (7)

- на вероятность успешного решения задач:

Pjk > P*r, j=1, 2, ..., L, k=1, 2, ..., K; (8)

- на объем исходного информационного пространства:

K

Тф.щ < Vj, j=1, 2 ..., L; (9)

к=1

- на значения переменных:

L

ЕФ* = 1, k=1, 2, ..., K; (10)

j=1

Ф*. ={0,1}; k=1, 2, ..., K; j=1, 2, ..., L, (11)

где тдоп - допустимое значение времени решения k-й задачи должностными лицами j-го вычислительного комплекса; - допустимое значение

вероятности успешного решения k-й задачи должностными лицами j-го вычислительного комплекса; Vj - максимально допустимый объем информационного пространства.

Задача (6)-(11) относится к классу линейных задач дискретного программирования с булевыми переменными и со смешанными ограничениями.

План распределения программ по узлам сети используется в качестве исходных данных для задачи распределения информационных массивов по центрам ХОД. В качестве информационного массива могут рассматриваться БД, массив электронных образов документов, обрабатываемых и циркулирующих в системе, и т.п. Необходимо распределить информационные массивы по центрам ХОД таким образом, чтобы минимизировать время решения всех задач в РИС.

Для простоты дальнейших выводов используем следующие допущения:

- информационный обмен между ЭПО при решении задач осуществляется посредством сохранения промежуточных и конечных результатов в информационные массивы;

- время выполнения запросов к информационным массивам пренебрежительно мало по сравнению со временем передачи информации по каналам связи.

Введем следующие обозначения: M - количество информационных массивов; ||ф|| - матрица распределения ЭПО по узлам сети (1=1, 2, ..., K, j=1, 2, ..., L), фу = {0, 1}; ||ю/т|| - матрица связи

ЭПО и информационных массивов (1=1, 2, ..., K, m=1, 2, ., M), rnlm= 1, если l-й ЭПО имеет информационный обмен в процессе своего решения с m-м информационным массивом, и 0 в противном

случае; ||^ || - матрица распределения информационных массивов (m=1, 2, ...,M, jeXp); Lm - среднее значение суммарного объема информационного обмена l-го ЭПО при его выполнении с m-м информационным массивом; 1э - длина эталонного сообщения; t’ - среднее время доведения эталонного сообщения от i-го узла сети кj-му; tp - среднее время выполнения l-го ЭПО в j-м узле без учета информационного обмена с информационными массивами; Xp - множество номеров узлов сети, в которых создаются центры ХОД (результат решения задачи о p-медиане).

Тогда задача оптимизации распределения информационных массивов по критерию минимума среднего времени решения всех задач в РИС может быть сформулирована следующим образом.

138

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

Определить такие значения ymj, т=1, 2, ..., M,

L K ( M L ^

что T = min ZZVkj lp + Z™k1fL Z Vlmj

j=1 k=1 ^ l=1 1э meXp )

при ограничениях

- на объем пространства на носителях для хранения информационных массивов:

M

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Zv kjuk < Vj , jeXp;

k =1

- на значения переменных:

L

ZVj = 1, Vk, vkj = {0, 1}.

j=1

Данная задача относится к классу задач целочисленного линейного программирования с булевыми переменными [10, 11]. Для ее решения может быть применен метод ветвей и границ.

Задача оптимизации распределения резерва информационных ресурсов по центрам ХОД решается с целью получения такого плана распределения резерва информационных ресурсов по центрам, который обеспечивал бы минимальное время восстановления работоспособности системы ХОД в случае нарушения целостности информации при соблюдении ограничений на стоимость хранения резерва информационных ресурсов.

Пусть N - число центров ХОД, создаваемых в системе; M - число информационных массивов, хранящихся и обрабатываемых в центрах ХОД. Известны распределение информационных массивов по центрам ХОД, задаваемое матрицей ||х;. ||, i=1,

2, M, j=1, 2, ..., N, а также объемы каждого i-го

информационного массива Vi и пропускная способность каналов передачи данных между каждыми l-м и m-м центром ХОД - иы . Тогда можно опре-

делить значение среднего времени восстановления i-го информационного массива в случае его иска-

жения или разрушения: TtB

N N

Z Xll Z Ут

l=1 т=1

-+1р

+ lil

\

)

где tp - время выполнения работ по развертыванию и подключению (регламентных работ) i-го информационного массива после его восстановления в l-м центре ХОД; ||y.||, i=1, 2, ..., M, j=1, 2, ..., N

- матрица распределения резерва информационного массива по центрам ХОД, причем

N

У j = {°!}, ZУ j =1 i=1, 2, ., M xj yij=0 V hj.

j=1

В этом случае задача распределения резерва информационного массива по центрам ХОД по критерию минимума общего значения среднего времени восстановления информации в системе ХОД [12, 13] может быть сформулирована следующим образом.

Определить такие значения ||y#||, i=1, 2, ..., M, j=1, 2, ..., N, что

M N N

ZZ x il Z Уim

i=1 l=1 m=1

f V. л

—+tp

^ min

(12)

при ограничениях

- на стоимость хранения резерва информационного массива:

Z Cj Z y.j

j=1 i=1

< C

(13)

- на значения переменных:

yj = {0, 1}, (14)

Zyv= 1, i=1, 2, ., M, Xj,yij=0 V i, j, (15)

j=1

где Cj - стоимость хранения единицы объема информации в j-м центре ХОД; v - размер единицы объема хранения информации; Сдоп - максимально возможное значение стоимости хранения резерва информационного массива в системе ХОД.

Задача (12)-(15) относится к классу задач дискретного линейного программирования с булевыми переменными и может быть сведена к задаче о ранце [14], для решения которой может использоваться метод ветвей и границ [14]. Ее решение позволит минимизировать время восстановления работоспособности системы ХОД в случае нарушения целостности информации.

Разработанные математические модели обеспечения устойчивости функционирования РИС могут быть использованы на этапе проектирования, при эксплуатации и совершенствовании РИС (рис. 1).

На стадии проектирования РИС для построения процесса ХОД последовательно решаются задачи определения числа и месторасположения центров ХОД в РИС, оптимизации состава комплекса средств хранения данных, оптимизации распределения ПО функциональных задач по узлам сети, оптимизации распределения информационных массивов по центрам ХОД, оптимизации распределения резерва информационных массивов по центрам ХОД.

На этапе эксплуатации в случае, когда воздействие дестабилизирующих факторов имело негативные последствия для РИС, например, нарушение функционирования отдельных сегментов сети, разрушение информационных массивов, выход из строя средств хранения и обработки данных и т.п., для обеспечения сохранения работоспособности РИС могут последовательно решаться задачи оптимизации распределения ПО функциональных задач по узлам сети, резерва информационных массивов и информационных массивов по центрам ХОД. При этом перераспределению подлежат те элементы ПО, информационные массивы и их резерв, нормальная эксплуатация которых была нарушена при воздействии дестабилизирующего фактора. Это обеспечит устойчивость функционирования РИС путем реорганизации процесса ХОД.

139

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

Для обеспечения оперативности принятия решения по реорганизации процесса ХОД решение указанных задач целесообразно производить методом ветвей и границ с применением алгоритма предварительного определения порядка ветвления переменных. В качестве метода оценки границ решения использовать симплекс-метод, в качестве стратегии ветвления - глобально-поисковую или локально-избирательную стратегию. При решении указанных задач должны учитываться результаты размещения остальных ЭПО и информационных массивов и их резерва, а также результаты воздействия дестабилизирующих факторов на функционирование узлов сети, центров ХОД, каналов передачи данных.

На этапе совершенствования РИС с вводом в эксплуатацию новых комплексов средств хранения и обработки данных, развертыванием новых сегментов распределенной вычислительной системы математические модели обеспечения устойчивости функционирования РИС могут решаться как в полном объеме, так и выборочно.

Для решения формализованных задач возможно использование разработанного программного комплекса [15, 16], реализующего метод ветвей и границ по решению задач дискретной оптимизации с булевыми переменными с применением алгоритма предварительного определения порядка ветвления переменных на основе использования теории двойственности. Использование теории двойственности для определения порядка ветвления переменных в методе ветвей и границ позволяет сократить время решения разработанных математических моделей в среднем в 8 раз. Применение разработанного программного комплекса позволяет получить решение разработанных задач за время, приемлемое для их практического применения.

Таким образом, использование разработанного комплекса математических моделей позволит обеспечить устойчивое функционирование РИС на этапах проектирования, эксплуатации и совершенствования.

Литература

1. Повзнер Л.Д. Теория систем управления: учеб. пособие для вузов. М.: Изд-во МгГу, 2002. 472 с.

2. Николаев В.И., Брук В.М. Системотехника: методы и приложения. Л.: Машиностроение, 1985. 199 с.

3. Есиков Д.О. Способы повышения устойчивости функционирования вычислительной системы // Молодежные инновации: сб. статей 7-й молодеж. науч.-практич. конф. Тула: Изд-во ТулГУ, 2012.

4. Есиков Д.О., Есиков О.В., Савватеев С.С., Стру-ков А.В., Сухарев Е.М. Математические модели, методики и алгоритмы обеспечения устойчивости функционирования современных систем хранения и обработки данных // Нелинейный мир. 2013. № 9. С. 621-632.

5. Кристофидес Н. Теория графов. Алгоритмический подход. М.: Мир, 1978. 430 с.

6. Yesikov D.O. Increase of level of stability of functioning of systems of storage and data processing at the expense of realization of actions for ensuring safety of information // High Performance Computing 3rd Intern. Conference (HPC-UA 2013), pp. 416-420.

7. Михалевич В.С., Волкович В.Л., Волошин А.Ф. Метод последовательного анализа в задачах линейного программирования большого размера // Кибернетика. 1981. № 4. С. 114-120.

8. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Физматлит, 2007. 256 с.

9. Есиков Д.О. Применение теории оптимальности по Парето для обоснования требуемых значений параметров надежности функционирования комплексов средств хранения информации // Труды Российского науч.-технич. об-ва радиотехники, электроники и связи им. А.С. Попова. 2014. Вып. XXXII. 325 с.

10. Кини Р.П., Райфа Х. Применение решений при многих критериях: предпочтения и замещения. М.: Радио и связь, 1981. 560 с.

11. Есиков Д.О. Математические модели построения подсистемы обеспечения сохранности информации в распределенных информационных системах // Труды Российского науч.-технич. об-ва радиотехники, электроники и связи им. А.С. Попова. 2014. Вып. XXXII. 325 с.

12. Воронин A.A., Морозов Б.И. Надежность информационных систем: учеб. пособие. СПб: Изд-во СПбГТУ, 2001.

13. Есиков Д.О., Абрамов П.И. Математическая модель обеспечения сохранности информации в распределенных информационных системах за счет резервирования информационных массивов // Труды Российского науч.-технич. об-ва радиотехники, электроники и связи им. А.С. Попова. 2014. Вып. XXXII. 325 с.

14. Алексеев О.Г. Комплексное применение методов дискретной оптимизации. М.: Наука, 1987. 248 с.

15. Есиков Д.О., Ивутин А.Н. Программа решения задач целочисленного линейного программирования с булевыми переменными. Свид. о гос. регистр. программы для ЭВМ № 2014619322.

16. Есиков Д.О. Программа распределенного решения задач целочисленного линейного программирования с булевыми переменными методом ветвей и границ. Свид. о гос. регистр. прогр. для ЭВМ № 2014619324.

DOI: 10.15827/0236-235X.112.133-141 Received 08.05.15

THE PROBLEMS OF ENSURING DISTRIBUTED INFORMATION SYSTEMS SUSTAINABILITY Yesikov D.O., Postgraduate Student, [email protected] (Tula State University, Lenina Ave. 92, Tula, 300012, Russian Federation)

Abstract. The paper considers the ways to ensure distributed information systems sustainability. It formalizes the problems of ensuring sustainability of distributed information systems, which consist of: a mathematical optimization model for functional tasks software elements distribution according to network nodes; a mathematical optimization model for information resources distribution according to data storage and processing centers; a mathematical model for determination of a reasonable expenditure level to form data storage facilities; a mathematical optimization model of technical means for data storage and processing; a mathematical optimization model for information resources reserve

140

Программные продукты и системы /Software & Systems

№ 4 (112), 2015

distribution on data storage and processing centers. The article shows that they belong to discrete optimization problems and gives their characteristics. It also proposes a procedure for applying a complex of mathematical models to ensure distributed information systems sustainability with indication of input and output data for each model. To solve the abovementioned problems the authors suggest using a software package, which implements the branch and bound method to solve discrete optimization problems with Boolean variables using the algorithm of branching variables predetermined order based on the duality theory. The duality theory in the branch and bound method significantly enhances the screening of unpromising options and reduces the time for solving problems compared with the traditional method on average in 8 times. The paper gives the special aspects of practical use of the developed mathematical model complex during design, maintenance and update of distributed information systems life cycle.

Keywords: distributed information system, mathematical models, discrete optimization, Pareto optimization, operational sustainability.

References

1. Povzner L.D. Teoriya sistem upravleniya [The Theory of Control Systems]. A manual for universities. Moscow, MEI Moscow State Mining Univ. Publ., 2002, 472 p.

2. Nikolaev V.I., Brooke V.M. Sistemotekhnika: metody iprilozheniya [System engineering: methods and applications]. Leningrad, Mashinostroenie Publ., 1985, 199 p.

3. Yesikov D.O. Ways to improve computer system sustainability. Molodezhnye innovatsii: sb. statey 7-y molodezh. nauch.-praktich. konf. [Proc. of the 7th Youth Scientific and Practical Conf. “Youth Innovation”]. Tula, TSU Publ., 2012.

4. Yesikov D.O., Yesikov O.V., Savvateev S.S., Strukov A.V., Sukharev E.M. Mathematical models, methods and algorithms to ensure the sustainability of modern storage systems and data processing. Nelineyny mir [Nonlinear World]. Moscow, 2013, no. 9, pp. 621-632 (in Russ.).

5. Christofides N. Graph Theory. Algorithmic approach. Academic Press, 1975, 415 p. (Russ. ed.: Moscow, Mir Publ., 1978, 430 p.).

6. Yesikov D.O. Increase of level of stability of functioning of systems of storage and data processing at the expense of realization of actions for ensuring safety of information. 3rd Int. Conf. "High Performance Computing" (HPC-UA 2013). Ukraine, Kiev, 2013, pp. 416-420.

7. Mikhalevich V.S., Volkovich V.L., Voloshin A.F. Sequential analysis in large linear programming tasks. Kibernetika [Cybernetics]. 1981, no. 4, pp. 114-120 (in Russ.).

8. Podinovsky V.V., Nogin V.D. Pareto-optimalnye resheniya mnogokriterialnykh zadach [Pareto-optimal solutions for multi-criteria problems]. Moscow, Fizmatlit Publ., 2007, 256 p.

9. Yesikov D.O. Application of the Pareto optimality theory to justify the required parameters of data storage complexes reliability. Trudy Ross. nauch.-tekhnich. ob-va radiotekhniki, elektroniki i svyazi im. A.S. Popova [Proc. of the Russian Scientific and Technical Society of Radio Engineering, Electronics and Telecommunications n.a. A.S. Popov]. 2014, iss. 32, 325 p.

10. Keeney R.L., Raiffa H. Decision-making with multiple criteria: preferences and value tradeoffs. NY, Wiley Publ., 1976 (Russ. ed.: Moscow, Radio and svyaz Publ., 1981, 560 p.).

11. Yesikov D.O. Mathematical models of building an information integrity subsystem in distributed information systems. Trudy Ross. nauch.-tekhnich. ob-va radiotekhniki, elektroniki i svyazi im. A.S. Popova [Proc. of the Russian Scientific and Technical Society of Radio Engineering, Electronics and Telecommunications n.a. A.S. Popov]. 2014, iss. 32, 325 p.

12. Voronin A.A., Morozov B.I. Nadezhnost informatsionnykh sistem [Information system reliability]. Study guide, St.-Petersburg, SPbSTU Publ., 2001.

13. Yesikov D.O., Abramov P.I. A mathematical model for information integrity in distributed information systems through data arrays reservation. Trudy Ross. nauch.-tekhnich. ob-va radiotekhniki, elektroniki i svyazi im. A.S. Popova [Proc. of the Russian Scientific and Technical Society of Radio Engineering, Electronics and Telecommunications n.a. A.S. Popov]. 2014, iss. 32, 325 p.

14. Alekseev O.G. Kompleksnoe primenenie metodov diskretnoy optimizatsii [Integrated application of discrete optimization]. Moscow, Nauka Publ., 1987, 248 p.

15. Yesikov D.O., Ivutin A.N. Программа распределенного решения задач целочисленного линейного программирования с булевыми переменными методом ветвей и границ [Program of solving integer linear programming problem with Boolean variables using the branch and bound method]. Software State Registration Certificate no. 2014619322.

16. Yesikov D.O. Programma raspredelennogo resheniya zadach tselochislennogo lineynogo programmirovaniya s bulevymi peremennymi metodom vetvey i granits [Program distributed solving of integer linear programming problems with Boolean variables using the branch and bound method]. Software State Registration Certificate no. 2014619324.

141

i Надоели баннеры? Вы всегда можете отключить рекламу.