Научная статья на тему 'Оптимальное оперативное резервирование информации в системах обработки данных на базе вычислительных сетей'

Оптимальное оперативное резервирование информации в системах обработки данных на базе вычислительных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
185
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННЫЕ СИСТЕМЫ ОБРАБОТКИ ДАННЫХ / DISTRIBUTED DATA PROCESSING SYSTEMS / ВЫЧИСЛИТЕЛЬНЫЕ СЕТИ / COMPUTER NETWORKS / РЕЗЕРВИРОВАНИЕ МАССИВОВ ДАННЫХ / ЗАДАЧИ ОПТИМИЗАЦИИ РЕЗЕРВИРОВАНИЯ / THE OPTIMIZATION PROBLEM OF THE DATA REDUNDANCY / СТРАТЕГИИ РЕЗЕРВИРОВАНИЯ / BACKUP ARRAYS OF DATA / DATA BACKUP STRATEGY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Микрин Евгений Анатольевич, Сомов Сергей Константинович

Рассмотрены вопросы применения оперативного резервирования информации в распределенных системах обработки данных (РСОД), функционирующих в рамках вычислительных сетей, в целях повышения безопасности их работы. Проанализированы особенности применения трех основных стратегий оперативного резервирования в РСОД. Сформулированы задачи оптимального по разным критериям распределения оперативного резерва РСОД по узлам вычислительной сети и предложены методы их решения. Рассмотрены проблемы и задачи оптимизации резервирования массивов данных с учетом их взаимосвязи между собой и резервирование данных в распределенных базах данных. Выполнен анализ влияния трафика запросов на распределение резерва РСОД.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Микрин Евгений Анатольевич, Сомов Сергей Константинович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article examines online information backup issues in distributed data processing systems (DDPS) operating within computer networks, in order to improve their operation safety. The features of using three online backup basic strategies in DDPS are analyzed. Problems are formulated of optimal by different criteria DDPS online backup distribution over computing network nodes, and the methods of solving them are proposed. Problems and challenges of data arrays backing up optimization, taking into account the relationship between them, are considered, as well as data backup in distributed databases. Analyzed is the requests traffic impact on DDPS backup distribution.

Текст научной работы на тему «Оптимальное оперативное резервирование информации в системах обработки данных на базе вычислительных сетей»

И нформационные технологии в управлении

УДК 004.75;004.056.3

ОПТИМАЛЬНОЕ ОПЕРАТИВНОЕ РЕЗЕРВИРОВАНИЕ ИНФОРМАЦИИ В СИСТЕМАХ ОБРАБОТКИ ДАННЫХ НА БАЗЕ ВЫЧИСЛИТЕЛЬНЫХ СЕТЕЙ

Е.А. Микрин, С.К. Сомов

Рассмотрены вопросы применения оперативного резервирования информации в распределенных системах обработки данных (РСОД), функционирующих в рамках вычислительных сетей, в целях повышения безопасности их работы. Проанализированы особенности применения трех основных стратегий оперативного резервирования в РСОД. Сформулированы задачи оптимального по разным критериям распределения оперативного резерва РСОД по узлам вычислительной сети и предложены методы их решения. Рассмотрены проблемы и задачи оптимизации резервирования массивов данных с учетом их взаимосвязи между собой и резервирование данных в распределенных базах данных. Выполнен анализ влияния трафика запросов на распределение резерва РСОД.

Ключевые слова: распределенные системы обработки данных, вычислительные сети, резервирование массивов данных, задачи оптимизации резервирования, стратегии резервирования.

ВВЕДЕНИЕ

Распределенные системы обработки данных (РСОД) представляют собой сложные аппаратно-программные комплексы или системы, компоненты которых распределены на больших расстояниях друг от друга и объединены в единую систему различными каналами связи и специальным системным программным обеспечением. Они строятся, как правило, на основе глобальных, корпоративных или сетей специального назначения.

В процессе работы РСОД могут происходить инциденты, приводящие к появлению ошибочных данных, ошибочным результатам решения задач и обработки запросов системой, а в крайнем случае и к невозможности нормального функционирования РСОД, т. е. к потере системой работоспособности, ее отказу. Разрушение программного и информационного обеспечения системы может потребовать значительных затрат времени и ресурсов для восстановления потерянной в результате инцидента информации и восстановления работоспособности системы. А в некоторых случаях восстановление информации и, соответственно, работоспособности системы становится просто невозможным.

Примером воздействия ошибки в программном обеспечении на работу и безопасность сложной системы может служить катастрофа, произошедшая с первым космическим аппаратом «Mariner-1». Данный аппарат в соответствии с программой «Ма-ринер» должен был стартовать 22 июля 1962 г. и лететь в сторону Венеры [1]. Однако примерно через 5 мин после старта произошла авария, и аппарат был разрушен. В свидетельских показаниях, полученных во время послеполетного расследования инцидента, указывалось, в частности, что в результате ошибки в программном обеспечении управляющие подсистемы аппарата получали неверно интерпретированную информацию. В итоге компьютер аппарата дал серию ошибочных команд на корректировку курса, в итоге аппарат потерял управление и потерпел крушение [2, 3].

Иллюстрацией того, к каким непроизводительным затратам времени приводит разрушение информации м ожет быть инцидент, произошедший в OCLC Research Library Partnership (некоммерческий компьютерный библиотечный сервис и научно-исследовательская организация, цель которых заключается в предоставлении широкого доступа к различной информации в режиме он-лайн) [4]. Эта организация предоставляет д оступ к информации с помощью RLIN (компьютерная информаци-

онная сеть библиотек). В этой информационной сети произошла авария, в результате которой был потерян большой объем данных. На восстановление разрушенной информации было потрачено 12 дней кропотливой работы ИТ-специалистов организации [5].

Причины, вызывающие возникновение инцидентов в процессе работы РСОД, приводящих к потере, разрушению или искажению информации и, в итоге, к нарушению безопасности и даже к отказу в работе системы, можно классифицировать следующим образом.

• Сбои и ошибки в работе оборудования вычислительной системы (ВС), на базе которой работает РСОД: сбои в каналах связи, перебои в системах электропитания, сбои в системах хранения информации, сбои в работе вычислительных машин (серверов, рабочих станций).

• Некорректная работа обслуживающего персонала и пользователей системы.

• Потери информации в системах архивации в результате сбоев оборудования.

• Ошибочные данные и потеря информации при некорректной работе программного обеспечения, содержащего ошибки в коде.

• Заражение системы компьютерными вирусами.

• Потери и искажение данных, вызванные несанкционированным доступом в систему. Для повышения безопасной работы распределенных систем обработки данных вводят различного рода избыточность [5]. В таких системах задача обеспечения сохранности используемых программ и данных решается главным образом применением информационной избыточности (созданием и хранением резервных данных). Кроме того, с этой же целью применяется и аппаратная избыточность (использование резервных устройств хранения данных), а также временная избыточность — использование части ресурсов системы для выполнения процессов дампирования (создания копий данных) и восстановления данных в случае их разрушения. Основным методом обеспечения сохранности данных в РСОД при ее функционировании служит метод резервирования, который предполагает использование следующих видов избыточности: идентичной избыточности (создания и хранения копий д анных) и/или неидентичной (создания и хранения предысторий данных).

1. ПОСТАНОВКА ЗАДАЧИ

В настоящее время в системах обработки данных (СОД) различного класса и назначения применяются два вида резервирования: оперативное и восстановительное.

При оперативном резервировании некоторая часть информационных ресурсов (резервные ко-

пии и/или предыстории массивов данных) РСОД и ее вычислительной мощности используется только для поддержания работоспособности системы в случае, если при решении РСОД текущих задач произошло разрушение используемого ей массива/массивов данных.

В отличие от оперативного резервирования в восстановительном резервировании часть ресурсов системы используется только для восстановления используемых системой рабочих/текущих копий и/или предысторий массивов данных в случае их разрушения.

При оперативном резервировании данных в СОД используются три основные стратегии оперативного резервирования [5, 6]. Первая стратегия применяется для массивов постоянных данных (к этой категории можно отнести относительно редко меняющиеся программные модули или, например, справочники, содержащие статичную информацию разного рода). Вторая и третья стратегии применяются к текущим массивам оперативных данных, содержащим данные, которые подвергаются частым изменениям (добавление и удаление данных, изменение данных, их сортировка), например, таблица с проводками по аналитическим счетам в автоматизированной учетной системе банка или программный модуль на этапе его тестирования и исправления обнаруженных ошибок.

Стратегия I заключается в использовании некоторого числа копий основного массива данных. В случае, если основной массив разрушен, то для продолжения решения задачи СОД переходит к использованию первой его копии, если же и она разрушена, то используется следующая копия и т. д.

Стратегия II основывается на учете особенностей обновления текущих массивов д анных и основывается на том, что вместо копий текущего массива используются его предыстории (предыдущие версии массива и журналы их изменений). В случае разрушения текущего массива запускается специальная программа, которая восстанавливает разрушенный массив на основе его предыдущей версии с использованием записей журнала изменений. Если восстановление закончилось неудачно, то восстановление текущего массива производится из следующей предыстории и т. д.

Стратегия III — это смешанная стратегия, которая использует возможности первых двух стратегий, т.е. эта стратегия использует и копии и предыстории текущего массива данных. Причем, сначала в соответствии со стратегией I используются копии массива, а затем, в случае неудачи восстановления из копий, используются предыстории массива в соответствии со стратегией II.

Объединение автономных компьютеров посредством каналов связи позволило получить единую распределенную ВС, обладающую качественно

новыми возможностями по созданию и эксплуатации распределенных СОД по сравнению с возможностями систем, работающих на базе отдельных компьютеров. Применение методов резервирования в таких ВС по сравнению с автономными ЭВМ обладает рядом особенностей [7]:

• при анализе эффективности и выборе оптимальной стратегии резервирования данных в РСОД, построенной на базе ВС, необходимо учитывать параметры самой ВС: топологию сети, задержку сообщений в каналах связи, характеристики производительности отдельных компьютеров, надежность и пропускную способность объединяющих их каналов связи и т. д.;

• в силу территориальной распределенности в вычислительной сети можно использовать один из следующих основных способов хранения резерва РСОД:

— централизованное, при котором резерв хранится в одном из узлов ВС;

— децентрализованное, когда резерв распределен по некоторому множеству узлов ВС;

• в случае д ецентрализованного хранения резерва в РСОД для обработки поступающих в систему запросов можно применять несколько дисциплин обработки. Рассмотрим основные из них (см. рисунок) [7, 8].

1. Запрос пересылается для обработки в ближайший (согласно некоторому критерию) узел, который хранит резерв массива данных, необходимого для обработки запроса.

2. Запрос пересылается для обработки параллельно в К узлов с требуемым резервом.

3. Запрос, который изначально был получен в у'-м узле, последовательно пересылается по узлам пути длины К, начинающегося в у'-м узле и состоящим из узлов, содержащих резерв требуемого массива. Запрос последовательно пересылается по узлам данного пути до тех пор, пока он или не будет успешно обработан в некотором узле либо не будет пройден весь путь из К узлов.

4. Запрос, полученный в у'-м узле, поочередно отправляется для обработки в К ближайших узлов, содержащих необходимый резерв. Опрос узлов продолжается до тех пор, пока из очередного опрашиваемого узла не будет успешно получен ответ на запрос либо не будут опрошены все К узлов без получения требуемого ответа.

Территориальная распределенность ВС обусловливает не только возможность применения различных дисциплин обработки запросов, но и большое разнообразие вариантов размещения резерва по узлам сети, которые обеспечивают различные значения стоимости, времени и надежности обработки поступающих запросов [7]. Эти обстоятельства определяют необходимость решения задачи оптимального размещения оперативного

м-

1. J

2. j

О

к

3. j 0-*

4. j

О

-*■ ...

о

к

к

Основные дисциплины обработки запросов

резерва м ассивов д анных по узлам ВС в соответствии с различными критериями оптимизации. В результате решения этой задачи определяется множество I0 = {i\yi = 1} узлов сети, в которых необходимо разместить резерв (у. = 1, если в i-м узле размещен резерв), а также количество копий и/или предысторий массива данных, размещаемых в узлах этого множества I0. В качестве критериев оптимизации решения д анной задачи можно, например, использовать такие критерии, как максимум вероятности и минимум среднего времени получения ответа на запрос, минимум стоимости обработки запросов и минимум затрат на хранение резерва.

Например, задача поиска размещения оперативного резерва в узлах ВС, обеспечивающего минимум стоимостных затрат S(X) на обработку поступающих запросов и хранение резерва формулируется таким образом:

S(X) ^ min (1)

при ограничениях на время j обработки запросов, вероятность р. получения ответа на запрос и на

размер х. резерва в узлах сети:

tj(X) < t, j е J3, р/X) > р., j е J

з'

х. < х., j е I0.

j j' J

(2)

(3)

(4)

Здесь /з — это множество индексов узлов ВС,

в которых возникают запросы; I0 = {/1 у. = 1} — множество узлов ВС, в которых размещен резерв; X = (х) — распределение резерва по узлам сети, где х} — число копий и/или предысторий, размещенных в узле у; X. — максимальное число копий и/или

предысторий массива данных, которые можно разместить в узле у.

Размер затрат 5(Х) для дисциплин 1 и 2 обработки запросов определяется по формуле

ад = ь I sixi + I I Щх^ир» + V).

I е I0 .= 11 е I0

Здесь е Т0; матрица Т0 = ||\°-||, где е {0, 1}

и = 1, если запрос из у-го узла адресуется в 1-й узел, — стоимость хранения одного бита информации в узле Ь — длина м ассива д анных в битах; и (V) — интенсивность информационных запросов (запросов на модификацию), возникающих в узле у; 2Р,.(х) — размер средних производительных затрат на обработку запроса, посланного из узла на обработку в узел -:

= 2Бп + Е(х)к,

где Е.(х.) — среднее время обработки запроса в узле I, Б,. — стоимость передачи запроса/ответа из узла у в узел I (предполагается, что Бн = Б,), к, —

у - У -

стоимость использования ресурсов ЭВМ узла I в единицу времени.

Значения времени обработки запросов и вероятности получения ответа на запрос определяются по формулам

для дисциплины 1:

1(Х) = 2^(1 - \у) + £ Ек(хк)Т

2. РЕШЕНИЕ ЗАДАЧИ

к = 1

1 к

N

Ру(Х) = I Г^х^^, к = 1

для дисциплины 2:

В работе [7] показано, что сформулированная в настоящей статье задача поиска оптимального оперативного резерва принадлежит классу задач целочисленного выпуклого программирования. Для этого в указанной работе доказывается выпуклость ограничений (2)—(4) и целевой функции (1).

Достаточное условие совпадения локального и глобального минимумов целевой функции заключается в выпуклости функций ¿(Х), у(Х) и ру<Х). Данное обстоятельство позволяет применить для решения нашей задачи оптимизации оперативного резервирования методы, применяемые для решения задач распределения ограниченных ресурсов [9].

Аналогично можно показать, что к классу задач целочисленного выпуклого программирования принадлежат и задачи оптимального оперативного резервирования, приведенные ниже и использующие в качестве критериев оптимизации:

— максимум вероятности успешной обработки запросов (задача (5)—(9));

— минимум среднего времени получения ответа на запрос (задача (9)—(12)).

Формулировки данных задач оптимального оперативного резервирования:

Найти:

шах^(Х) = тах П Р;(Х)

у е / у

при ограничениях:

¿(Х) < 5,

1(Х) < 1, у е /з,

ху < ху, у е I уу

Найти:

штГ(Х) = шт Щ1 I у(Х),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

з ¿—! -/X у е /з у

(5)

(6)

(7)

(8)

(9)

где N = |/1,

зз

при ограничениях:

1 (Х) = шах

21 з + шахЕк( хк); Е ( х }) Ту

к е N к *]

р/Х) = 1 - П [1 - ГкРк(х,)гкТ ¡к\,

к = 1

где Ек(хк) — среднее время обработки запроса в узле к, Рк(хк) — вероятность успешной обработки запроса в узле к при условии размещения в этом узле резерва объемом хк.

5(Х) < 5, р/Х) > р, у е /з, х ■ < х ■, у е I0.

(10) (11)

(12)

Приведенные задачи оптимального оперативного резервирования массивов данных в ВС сформулированы в предположении, что они решаются в два этапа. На первом этапе определяется оптимальное размещение копий массива по узлам ВС I0 (не более одной копии в каждом узле). Это раз-

мещение получается в результате решения задачи (1)—(4) с помощью известных алгоритмов [10—14].

Если найденное на первом этапе размещение копий не обеспечивает выполнение ограничения (3) задачи, т. е. не обеспечивает требуемую вероятность обработки запросов р, то переходят ко второму этапу решения задачи. На втором этапе

для каждого узла множества 1° решается задача определения оптимального объема резерва в отдельном узле ВС. Для ее решения применяются традиционные методы (методы решения задач распределения ограниченных ресурсов) [7].

Решение задачи оптимального оперативного резервирования массивов данных в ВС в два этапа позволяет уменьшить вычислительную сложность задачи, так как вместо одной сложной задачи решаются две более простые задачи. Решение первой из них позволяет определить подмножество узлов ВС, в которых необходимо разместить резерв. А решение второй задачи позволяет определить объем резерва, размещаемого в полученном ранее подмножестве узлов ВС.

Рассмотрим более общую постановку задачи оптимального оперативного резервирования, в которой могут использоваться аналогичные критерии оптимизации.

Рассмотрим такую постановку задачи, например, для дисциплины 1 обработки запросов при использовании в качестве критерия оптимизации минимума стоимости обработки запросов и стоимости хранения резерва. Задача формулируется следующим образом:

найти минимум значения функции

ДХ) = Ь £ ^ + £ V I [2Б + Е.(х)И ] +

¡е ] = 1 V, * 0

N

+ £ + Е(х)Н]

] = 1

при ограничениях:

р(Х) = рд > р , ] е ](Х) = ] < 1, ] е

ху е {0, 1, ..., Ху}, ] = ,

где к — индекс узла сети с оперативным резервом, для которого справедливы условия:

Щк + Чхк)К = шш [2.Б + Е(х)];

1 I е N]

N = { ¡/рр < р , ] < 1};

ру = гуР,(х)г] пРи Ы] и ру = р(х) пРи '=];

] = 21з + Е(х) при I*] и ] = Е(х) при I = у,

где Ек(хк) — среднее время обработки одного запроса в узле к; — среднее время задержки пере-

дачи сообщений в каналах связи сети; Нк — стоимость использования ресурсов компьютера узла к в единицу времени; — стоимость передачи сообщения (запроса/ответа на запрос) из узла у в узел к (полагаем, что = Бк]).

Аналогично формулируются и другие задачи оптимального оперативного резервирования, использующие в качестве критерия оптимизации минимум среднего времени получения ответа на запрос или максимум вероятности успешной обработки запросов.

3. РЕЗЕРВИРОВАНИЕ ВЗАИМОСВЯЗАННЫХ МАССИВОВ ДАННЫХ

Задачи оптимального оперативного резервирования (см. § 1 и 2) были сформулированы в предположении, что резервируемые в РСОД массивы данных используются независимо друг от друга. Это позволило ставить и решать задачи оптимального резервирования отдельно и независимо для каждого массива данных. Однако чаще всего на практике в СОД разного класса и назначения, в том числе и в РСОД, построенных на базе ВС, решаются задачи и обрабатываются запросы, работа с которыми требует использования некоторого подмножества массивов д анных. Причем, как правило, в данное подмножество входят массивы данных, взаимосвязанных между собой (ссылками или алгоритмически). В частности, обработка одного запроса к распределенной базе д анных (РБД) также может потребовать доступ к данным из нескольких связанных друг с другом массивов данных, которые могут быть размещены в разных узлах ВС, территориально удаленных друг от друга.

По этой причине возникает необходимость оптимизации резервирования массивов данных, используемых в РСОД, с учетом их взаимосвязи друг с другом и других параметров ВС (таких, как топология сети, трафик запросов различного типа, надежность функционирования каналов связи и отдельных ЭВМ сети и др.). Покажем, что данные задачи можно сформулировать, используя приведенные выше результаты.

Рассмотрим работу РСОД, построенную на основе ВС, состоящей из N узлов. В системе используется Ммассивов данных и решается /различных задач. Каждая из задач системы может использовать несколько различных массивов и может решаться в нескольких различных узлах сети. Обозначим через IV] то число решений у'-й задачи, у = 1, /, которое производится за некий интервал времени (например, час, сутки, неделя, месяц, квартал и т. п.).

Введем переменную Т. е (0, 1) такую, что

Jn

Т ■ = 1, если ]-я задача решается в и-м узле сети;

обозначим и. — среднее число информационных

запросов ]-й задачи к т-му м ассиву д анных, а V. — среднее число запросов на модификацию т-го массива данных, возникающих при решении ]-й задачи; хпт — объем резерва т-го массива, размещенного в и-м узле сети, Ьт — размер т-го массива данных в байтах.

Условимся, что задача в системе решена успешно только в случае, если получены ответы на все запросы, возникающие в процессе ее решения (запросы на получение и модификацию данных) ко

всем требуемым массивам данных. Тогда вероятность Ри(Х) решения]-й задачи в и-м узле при распределении резерва X = ||х||

М и. П

]) = П [Рит(X)] !т впт , т = 1

где Рит(Х) — вероятность получения ответа на информационный запрос к т-му массиву, выданный в и-м узле сети; Рит(Х) — это вероятность успешной обработки выданного в и-м узле сети запроса на обновление т-го массива данных. Значение данной вероятности зависит от того, какая используется дисциплина обработки запроса, и опреде-

Таблица вероятностных временных и стоимостных характеристик дисциплин обработки запросов

Дисциплина Характеристика

1 N PJ = S rjkpk(xk)rkfVjk k = 1 z = S S ik + ww j= 1 k= 1 zp = S S (jjk + Vyk)Zpjk(xk) J=1k= 1

j = 2ta(1 - J + SEk (Xk)^k k = 1

2 N Pj = 1 - П [1 - rjkPk(xk)rk^jk\ k = 1 Z = S S (jjk + Vjyk)zjk(xk) j = 1 k=1 zp = S S (jjk + Vyk)zpjk(xk) j = 1 k= 1

j = max12(з + max . Ek(xk);Ej(xkj)Vjj \ [ k е nj ; k ^ j j

3 K n P i = S J P.. (x.. ) r.. .. П (1 - Pi (x j ) r .. 1J ¿-1 JJn Jn Jn JnJ ii Ji-1 Ji-1 Ji- 1J n = 1 i = 2 z = S S (U + Vjyk)zjk(xk) j= 1 k= 1 zp = S S (UJ + Vyk)zpjk(xk) j=1k= 1

N j = (K + Щ + S Ek (xk)Vjk - B; В = t3 при k = 1 n(j, j) = 1 или n(j, j) = K и 0 в остальных случаях

4 N Pj = 1 - П [1 - rjkPk(xk)rkjVjk] k = 1 NN Г n (j, k) -1 1 z =S SlU П [ 1 - jpj;( xjOj] + Vykj^^^^^^^ j= 1 k = 1 L i = 1 j j е N; i = ^

j = 2ta(K " J + SEk (Xk>Vjk k = 1 zp= NN Г n (j k) - 1 1 SS]U П [1 - JJ xj) rj + V-y^lkix^ j= 1k= 1 L i = 1 j j е n; i = ^

N °бозначения: ](хк) = 2(1 - + [1 - рк(хк)]Ек(хк)Нк; гР]Мк) = Щк + Е^к)^ ик = Е УцЧ]ки<к при ]= 1 ( и ] 1) - 1 и(], к) = и(], 1) + 1 и 0 в остальных случаях; Щ = и П ]- . [ 1 - Р.^х.)], ]а = ], ]а е N. а = 1

ляется по соответствующей формуле, приведенной в таблице [7]. Предположим, что значение этой вероятности равно вероятности события, заключающегося в обновлении по крайней мере одного из массивов данных, размещенного в одном из узлов сети с резервом, и последующего получения сообщения об успешном обновлении этого массива. С учетом сделанного предположения вероятность успешной обработки запроса на обновление массива данных

Р^Х) = 1 - П [1 - г„? {хт)г пХ ¡= 1

где Р(хтт) — вероятность успешной обработки запроса в узле , в котором размещен резерв объемом х,т; гп. — надежность канала связи между п-м и ,-м узлом ВС (будем считать, что гп. = г п).

Обозначим через Тп(Х) суммарное время ожидания ответов на все запросы, выданные при решении у-й задачи в п-м узле ВС. Оно определяется по формуле

М

ТпуХ = I {ЦтС (Х) + ^С(X)},

т = 1

где 1'пт (X) — время получения ответа на запрос к

т-му массиву, выданный в п-м узле (его значение вычисляется по соответствующей формуле из таблицы); 1''т (X) — время обработки одного запроса

на модификацию данных в т-м массиве, который был выдан в узле п. Значение данного времени также определяется по формуле из таблицы для дисциплины 2 обработки запросов при N. = {п/хт * 0}).

В таблице приведены формулы для расчета характеристик дисциплин обработки запросов: р] — при ограничениях вероятности получения ответа на запрос, выданный в у-м узле ВС; ] — времени обработки запроса, выданного в узле у; 2Р — размера средних производительных затрат на обработку запросов; Z — размера средних непроизводительных затрат на обработку запросов.

Стоимость ^(Х) функционирования РСОД в течение рассматриваемого нами периода времени будет складываться из стоимости решения всех задач системы и стоимости хранения резерва в узлах сети и, таким образом,

М I N Г

ад = I I ^ I ф]п I ] / I 0 2рт(хы) +

т = 1 ] = 1 п = 1 V 1/хтт * 0 Л N

+ и]т ./1П1П02РШ(хт) I + Ьт £ SтХnm,

1/х1т *0 I п = 1

где 2Рт(хт) = 2БШ + Е(хт)НР 5п — стоимость хранения одного бита информации в п-м узле в течение рассматриваемого периода времени.

Сформулируем задачу оптимального оперативного резервирования M взаимосвязанных массивов данных при использовании в качестве критерия м инимума стоимостных затрат на функционирование системы S(X).

Необходимо найти такое оптимальное размещение резерва используемых в РСОД массивов данных по узлам ВС, которое обеспечит минимальные стоимостные затраты на функционирование системы. Найденное решение задачи должно соответствовать ограничениям на объем резерва, размещаемого в каждом из узлов ВС, и должно обеспечивать затраты времени на ожидание ответов на запросы не более заданного лимита.

Таким образом, найти

S(X) ^ min

при ограничениях:

_ _ м

P (X) > P., T (X) < T., У х L < Q ,

np' j ' яД' j ' t—* nmm ^n'

m = 1

j = 1J; n = 1N.

Аналогично формулируются задачи поиска оптимального размещения в ВС резерва взаимосвязанных массивов, используемых в РСОД, при других критериях оптимальности решения. Например, при использовании такого критерия оптимальности размещения резерва, как максимум вероятности успешного решения всех задач системы за заданный период времени, задача формулируется следующим образом:

J N

W,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

P(X) = ПП [ Pnj(X) ] j ^ max

j = 1 n = 1

M

S(X) < S , Tn(X) < Tj , У XnmLm < Qn,

m = 1

j = 1J, n = 1N.

4. РЕЗЕРВИРОВАНИЕ ИНФОРМАЦИИ В РАСПРЕДЕЛЕННЫХ БАЗАХ ДАННЫХ

Рассмотрим ситуацию, когда необходимо найти оптимальное размещение резерва взаимосвязанных массивов для распределенной базы данных (РБД), в адрес которой пользователями ВС формируются поток информационных запросов и поток запросов на модификацию данных.

Обозначим: I — множество номеров информационных запросов к массивам, обрабатываемым

средствами РБД; I0 — множество номеров различных запросов на модификацию данных в массивах РБД; М] — множество номеров массивов, используемых при обработке у-го информационного за-

проса, у е I; М° — множество номеров массивов, которые модифицируются при выполнении одного запроса уо е Iо. В каждый фиксированный интервал времени в адрес РБД в п-м узле сети в среднем формируется и , запросов у-го типа (информационный запрос к массиву данных) и V 0 запросов

п]

у о-го типа (модификация массива данных).

Вероятность ^п(Х) получения ответов на все запросы, выданные в п-м узле за рассматриваемый интервал времени (т. е. надежность обслуживания пользователей п-го узла сети, генерирующих поток запросов к РБД) определяется по формуле:

^Д) =

П Г П Рп^! п1П

} е е И,

00 1 е I

П впт(Х)

.т е М°

V .. п]

Всеми пользователями п-го узла ВС, работающими с РБД, за рассматриваемый интервал времени будет затрачено Тп(Х) единиц времени на ожидание ответов на выданные ими запросы:

Тп(Х) = I и] I С X +

1 е I

т е И,

+ I V о I С(Х)

0 0 0 ] е I т е М

Стоимость функционирования РБД за рассматриваемый интервал времени (затраты на хранение резерва и обработку запросов)

N

S(X) = I

п = 1

IД- Е.,™*,2Рщ(Хтт) +

] е I

- т е М] Чхш * 0

+ I

00 1 е I

V о

п]

I I ^-(-Хт)

,е И0 1/хш * 0

И N

+ I Ьт I ¿п

т = 1 п = 1

-

Полученные формулы позволяют сформулировать задачу оптимизации резервирования массивов д анных в РБД по критерию максимума надежности обслуживания пользователей базы данных — необходимо обеспечить максимальную вероятность обработки всех запросов пользователей к РБД, сформированных за рассматриваемый интервал времени, при ограничениях на объем резерва, размещаемого в каждом из узлов сети, стоимость функционирования РБД, общее время ожидания ответов на запросы, выданные пользователями одного узла за рассматриваемый интервал времени:

N

Л(Х) = П Яп(Х) ^ тах

п = 1

при ограничениях Т(Х) < Тп, ¿(Х) < ^,

м _

I х Ь < О , п = 1, N.

пт т п

т = 1

Аналогично формулируются и задачи оптимального резервирования массивов д анных в РБД с другими критериями оптимизации: минимум стоимости функционирования РБД за заданный интервал времени; минимум суммарного времени ожидания ответов на запросы пользователей РБД, сформированные ими за заданный интервал времени.

5. РАЗМЕЩЕНИЕ РЕЗЕРВА ИНФОРМАЦИИ С УЧЕТОМ ИНТЕНСИВНОСТИ ТРАФИКА ЗАПРОСОВ

Оптимальное распределение оперативного резерва массивов данных по узлам ВС находится в непосредственной зависимости от трафика запросов к резервируемым массивам, возникающих в узлах сети при решении задач и формируемых пользователями сети. Выполним качественный анализ влияния трафика запросов, возникающих в узлах ВС, на оптимальное распределение оперативного резерва массивов данных. Анализ выполним на примере однородной полносвязной ВС в смысле размера стоимостных затрат на хранение резерва и обработку запросов — ¿(Г). Будем считать, что запросы на модификацию массива данных адресуются одновременно во все узлы сети с резервом, а информационные запросы к массиву обрабатываются в соответствии с дисциплиной 1. Затраты будем вычислять по формуле

N

¿(Г) = [к + 2Б + И*(Ту - Т + 2/з)1 I (Д + КV) +

1 = 1

+ зК - (2Б + к*2Гз) I и + V), (13)

з ] е Г 1 1

где Б — стоимость передачи запроса/ответа по каналам связи ВС; к — стоимость обработки одного запроса в узле с резервом; 5 — стоимость хранения резерва в одном из узлов; У — множество индексов узлов сети, по которым распределен резерв (распределение резерва по ВС); К = |Г |; Ту — среднее время обработки запроса в одном из узлов сети при распределении резерва Г; Т — заданная верхняя граница времени получения ответа на запрос; к* — стоимость (штраф) превышения временем получения ответа величины Т.

Сделаем предположения:

— информационные запросы, возникающие в узлах без резерва, равномерно распределяются между всеми К узлами сети с резервом;

— запросы, поступающие в каждый из узлов с резервом, образуют пуассоновский поток с пара-

метром Ху; время обработки запросов распределено по показательному закону;

— для каждого узла сети ] = 1, N выполняются равенства: и = и; V. = V.

Основываясь на сделанных предположениях, получим, что Тг = ¿/(1 — Ху$, где / — среднее время

обработки запроса, а Хг = NV + NK 1 и.

Предположим, что размещение резерва Т мы получили на основе распределения У путем размещения в узле 1 дополнительного резерва. Определим, при каких соотношениях между значениями и и V справедливо неравенство

S(Y') > S(Y), (14)

в котором Г = У и {/}; (К = |Г| = К + 1).

При сделанных предположениях из формулы (13) следует, что

¿(Г) = ¿(Г) — Щи + КГ)(Гг — Гг)й* + + £ — (и + У)(2Б + КЩ + + NV[h + 2Б + И*(Тт — Т) + Н*21з, (15)

а неравенство (14) будет эквивалентно неравенству

V [Ш + 2Б^ — 1) + Ж*(ТГ — Т) + + — 1) — Ш(ТГ — Тг)^] >

> и[Мг*(Т-у — Тг) + 2Б + #"2/з] — ¿. (16)

Достаточным условием выполнения неравенства (16) служит соотношение между значениями и и V:

V> и[Ш*(Тт — Тг) + 2Б + ^2/1 х

х [Л% + 2Б^ — 1) + Ж*(ТГ — Т) + + Ь*2иИ — 1) — NK(TY — Тг)^]

—1

(17)

Рассмотрим частные случаи. 1. Значение ¿(1) зависит главным образом от затрат на использование каналов связи, т. е. Б . И*, Б . h. В этом случае соотношение (17) приводится к виду

V > ЩЫ — 1)

—1

(18)

2. Превышение временем получения ответа на запрос величины Т несущественно, т. е. И* « h, h* « Б.

Соотношение (17) выполняется при условии

V > U(N — 1)^/2Б + 1)] 1.

(19)

3. Учитывается главным образом время получения ответа на запрос, т. е. Н* . Б, И* . h. В этом случае выражение (17) эквивалентно соотношению

V > и [ЩТУ — Тг) + 2/з][^(Тг — Т) +

+ N — 1)2 ¿з — Nк(Tr — Тг)]

—1

Полученные качественные результаты (при сделанных предположениях) сформулируем в виде утверждения,

Утверждение 1. В однородной полносвязной вычислительной сети при выполнении соотношения (17) (или соотношений (18)—(20)) соответственно для рассмотренных случаев 1—3 наименьшие стоимостные затраты на хранение резерва и на обработку запросов достигаются при размещении резерва в одном узле сети.

Из выражения (15) следует, что неравенство ¿(У) < ¿(Г) справедливо при выполнении соотношения

и > V{Nh + 2Б(Ы — 1) + И*[ЩТГ — Т) — — 21з(Ы — 1) — Ш(ТГ — ТГ)]}Б-1 + ¿В-1, (21)

где Б = Ш*(ТГ — Тг) + 2Б + ^2/з.

Рассмотрим частные случаи:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1) если Б . №, Б . ^ Б . £, то соотношение (21) эквивалентно неравенству

и > V(N — 1);

(22)

2) при ^ « к, И* « Б и ^ « £ соотношение (21) приводится к виду

и > ^ — 1) + (£ + ШУ)(2Б) 1; (23) 3) для h* . Б и h* . h получим:

и > V [ДТГ — Т) + 2/з^ — 1) —

— Ш(Тг — ТЛ^Т — Тг) + 2/,]

—1

(24)

(20)

Обобщим полученные качественные результаты в виде утверждения, справедливого при сделан -ных предположениях.

Утверждение 2. В однородной полносвязной вычислительной сети при выполнении соотношения (21) (или соотношений (22)—(24)) соответственно для рассмотренных случаев 1—3 наименьшие стоимостные затраты на хранение резерва и обработку запросов обеспечивает размещение резерва во всех узлах, в которых возникают запросы.

Пример. Покажем на примере решения задачи оптимального оперативного резервирования массивов данных в ВС то, как влияет на оптимальное размещение резерва изменение значений параметров самой сети. Рассмотрим результат решения задачи оптимального резервирования на примере сегмента однородной полносвязной ВС из пяти узлов. Параметры узлов рассматриваемого сегмента сети (в силу однородности сети индексы узлов опущены):

0 = 1,5; т = 0,5; и = 20; V = 7; д = 0,01; £ = 2,0;

г2 = 0,985; 2Б = 9,0; h = 3,0; N = 5.

В качестве критерия задачи примем минимум стоимостных затрат на обработку запросов и хранение резерва.

Для рассматриваемого нами примера сегмента сети с указанными параметрами выполняется соотношение (18). Следовательно, справедливо и утверждение 1, из которого следует, что при заданных параметрах сети резерв целесообразно разместить только в одном из узлов.

Проверка данного утверждения путем решения задачи оптимального оперативного резервирования м етодом полного перебора показывает, что для рассматриваемого фрагмента сети оптимальными являются пять равнозначных (в силу однородности сети) распределений резерва: (20000), (02000), (00200), (00020) и (00002). Эти распределения резерва обеспечивают одинаковое значение целевой функции ¿(Г) = 1792,07.

Если же в параметрах рассматриваемого сегмента сети произойдут изменения: V = 3, к = 1,5, то в этом случае будет выполняться соотношение (23) и будет уже справедливо утверждение 2. В соответствии с этим утверждением при измененных параметрах ВС наиболее целесообразно размещение резерва в каждом из узлов сегмента, в котором возникают запросы. Решение задачи оптимального оперативного резервирования методом полного перебора при новых параметрах фрагмента сети доказывает справедливость утверждения 2 и дает нам одно оптимальное распределение оперативного резерва — (11111), которое обеспечивает следующее значение целевой функции ¿(Г) = 1337,49.

ЗАКЛЮЧЕНИЕ

Рассмотрены три основные стратегии оперативного резервирования массивов постоянных и текущих оперативных данных и указаны особенности применения этих стратегий в системах обработки данных, работающих в распределенных вычислительных сетях. Описаны различные варианты хранения резерва в вычислительной сети и несколько возможных дисциплин обработки информационных запросов и запросов на модификацию данных массивов. Сформулирована в общем виде задача распределения информационного резерва по узлам вычислительной сети, оптимального по критерию минимума суммарных затрат на обработку поступающих запросов и хранение резерва в узлах сети. Также сформулированы задачи оптимального резервирования массивов данных в вычислительных сетях по критериям максимума вероятности успешной обработки запроса к распределенным системам обработки данных и минимума среднего времени получения ответа на запрос. Даны формулировки задач оптимального оперативного резервирования массивов данных в вычислительных сетях с учетом различного рода взаимосвязей между резервируемыми массивами и задач оптимального резервирования в распределенных базах д анных. Приведены м етоды решения поставленных задач оптимизации. На примере однородной полносвязной сети ЭВМ выполнен качественный анализ влияния интенсивностей запросов, возникающих в отдельных узлах сети, на

распределение оперативного резерва массивов данных. Изложенные в статье результаты имеют практическую ценность и могут быть использованы при проектировании распределенных систем обработки данных в целях повышения безопасности их функционирования.

ЛИТЕРАТУРА

1. NASA publication SP-480, Far Travelers -The Exploring Machines, Oran W. Nicks, 1985. — URL: http://history.nasa.gov/ SP-480/ch3.htm (дата обращения 14.07.2016).

2. NASA Space Science Data Coordinated Archive. Mariner 1. NSSDCA ID: MARIN1. — URL: http://nssdc.gsfc.nasa.gov/ nmc/spacecraftDisplay.do?id=MARIN1 (дата обращения 23.08.2016).

3. Mariner Venus Final Project Report (NASA SP-59, 1965). — P. 87. — URL: http://history.nasa.gov/SP-4407/ETUv5.pdf (дата обращения 14.07.2016).

4. History of the OCLC Research Library Partnership. — URL: http://www.oclc.org/research/partnership/history.html (дата обращения 14.07.2016).

5. Информационная безопасность систем организационного управления. Теоретические основы: в 2 т. / Н.А. Кузнецов, В.В. Кульба, Е.А. Микрин и др.; отв.ред. Н.А. Кузнецов,

B.В. Кульба; Ин-т проблем передачи информации РАН. — М.: Наука, 2006.

6. Кульба В.В., Мамиконов А.Г., Шелков А.Б. Резервирование программных модулей и информационных массивов в АСУ // Автоматика и телемеханика. — 1980. — № 8. —

C. 133—141.

7. Кульба В.В., Сомов С.К., Шелков А.Б. Резервирование данных в сетях ЭВМ. — Казань: Изд-во Казанского гос. ун-та, 1987. — 175 с.

8. Сомов С.К. Резервирование программных модулей и информационных массивов в сетях ЭВМ: дисс. канд. техн. наук. — М.: ИПУ РАН, 1983. — 217 с.

9. Гурин Л. С., Дымарский Я. С., Меркулов А.Д. Задачи и методы оптимального распределения ресурсов. — М.: Сов. радио, 1968. — 463 с.

10. Machmoud S., Riordon J.S. Optimal Allocation of Resources in Distributed Information networks // ACM Trans. on Database Systems. — 1976. — Vol. 1, N 4. — P. 66—78.

11. Chu W.W. File Allocation in an Multiple Computer System // IEEE Trans. on Computers. — 1969. — Vol. C-18, N 10. — P. 885—889.

12. Casey R.G. Allocations of copies of a file in an Information Network // AFIPS Conference Proceedings. — 1972. — Vol. 40. — P. 617—625.

13. Akoka J. Design of optimal distributed database systems. Distributed Data Bases // Proc. Int. Symp. — 1980. — P. 229—246.

14. Ramamoorthy C.V., Wah B.W. Data management in distributed data bases // AFIPS Conference Proceedings. — 1978. — Vol. 48. — P. 667—680.

15. Клейнрок Л. Вычислительные системы с очередями. — М.: Мир, 1979. — 600 с.

Статья представлена к публикации членом редколлегии В.В. Кульбой.

Микрин Евгений Анатольевич — академик РАН, ген. конструктор, ПАО «Ракетно-космическая корпорация «Энергия» им. С.П. Королева», г. Королев, Н Eugeny.Mikrin@rsce.ru,

Сомов Сергей Константинович — канд. техн. наук, вед. инженер, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, Н ssomov2016@ipu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.