Математические модели и алгоритмы обеспечения сохранности информации в системах хранения и обработки данных

Есиков Олег Витальевич; Есиков Дмитрий Олегович

Savvateev Sergey Sergeevich, candidate of technical science s.savvateev@gmail.com, Russia, Tula, Tula State University,

Yesikov Dmitry Olegovich, undergraduate, mcgeen4@gmail.com, Russia, Tula, Tula State University

УДК 007.3

МАТЕМАТИЧЕСКИЕ МОДЕЛИ И АЛГОРИТМЫ ОБЕСПЕЧЕНИЯ СОХРАННОСТИ ИНФОРМАЦИИ В СИСТЕМАХ ХРАНЕНИЯ И ОБРАБОТКИ ДАННЫХ

О.В. Есиков, Д.О. Есиков

Формализована математическая модель оптимизации состава технических средств обеспечения сохранности информации в системах хранения и обработки данных. Для повышения эффективности метода ветвей и границ при решении данной задачи предложено использование алгоритма предварительного определения порядка ветвления переменных на основе применения теории двойственности.

Ключевые слова: оптимизация состава технических средств, сохранность информации, метод ветвей и границ, алгоритм предварительного определения порядка ветвления переменных, теория двойственности.

Одним из направлений обеспечения устойчивости функционирования систем хранения и обработки данных (СХОД) является организация защиты данных, хранящихся на различных носителях и обеспечение их сохранности. Обеспечение сохранности информации производится путём применения специальных мер организации хранения, восстановления (регенерации) информации, специальных устройств резервирования. Качество обеспечения сохранности информации зависит от её целостности (точности, полноты) и готовности к постоянному использованию.

Обеспечение сохранности информации в системах хранения и обработки данных производится путём применения специальных мер организации хранения, восстановления (регенерации) информации, специальных устройств резервирования. Качество обеспечения сохранности информации зависит от её целостности (точности, полноты) и готовности к постоянному использованию[1, 2]. Наиболее простым способом обеспечения сохранности информации в СХОД является создание резервных хранилищ данных.

Резервные хранилища информации в СХОД по типу устройств резервирования делятся на [3]:

- хранилища на базе жестких дисков (КАГО-массивы);

110

- хранилища на магнитных лентах;

- хранилища на базе оптических дисков.

Резервные хранилища по количеству уровней резервирования делятся на:

- одноуровневые;

- многоуровневые.

При большом количестве разновидностей систем и средств высоконадежного хранения данных, а также их конфигураций, стоит задача выбора их состава с учетом решаемых СХОД задач.

В качестве показателя устойчивости функционирования СХОД в условиях воздействия дестабилизирующих факторов обычно используют коэффициент устойчивости [4].

К у = П*ущ ,

/ =1

где Куч/ - коэффициент готовности вычислительной системы в условиях воздействия /-го дестабилизирующего фактора (1=1,2,...,!)

Ктр К дф1

Кущ 1 К ’

тр

Ктр- требуемое значение показателя качества функционирования системы; Кф - значение показателя качества функционирования системы в условиях воздействия /-го дестабилизирующего фактора.

Кроме того, за показатели качества функционирования системы, характеризующие устойчивость её функционирования, могут быть взяты время выполнения рассматриваемого процесса в СХОД, коэффициент готовности системы, коэффициент эффективности системы, и другие. Так, время выполнения рассматриваемого процесса в СХОД оценивается его средним значением Твп., которое определяется как статистическое среднее случайной величины Твф выполнения ф-го процесса в системе:

1 N

т . =—Ут.

впФ N вФ ,

ф=1

где Твпф - среднее значение времени выполненияф-го процесса в системе; Ып

- количество выполняющихся в системе процессов.

Коэффициент готовности системы КГ/ по выполнению некоторого процесса находится из выражения:

I — t

пр потерь /

К Г/ =—--------------,

пр

где П - среднее время производительной работы системы, tпотерь I - среднее значение потерянного (затраченного) времени на обнаружение и устране-

ние последствий от воздействия /-го дестабилизирующего фактора. Вследствие большого разнообразия существующих средств хранения данных, вариантов организации СХОД, определение конкретного перечня используемых технических средств в условиях жестких ограничений на совокупную стоимость построения СХОД, временные параметры доступа и обработки данных, целесообразно осуществлять решением оптимизационной задачи [4].

По критерию максимума вероятности обеспечения сохранности информации в СХОД указанная задача формулируется следующим образом. Определить такие значения Zjl, у/т (/ = 1,2,..., /; I = 1,2,..., Ь; т = 1,2,..., М) ,

что:

р = тах П Прку (2, У) (1)

к=1 j=l

при ограничениях:

- на время решения к-ой задачи

Ткреш (2) < Ткдо", к = 1,2,..., К; (2)

- на стоимость средств хранения данных

с( г ,у ) < сдоп; (3)

- на коэффициент готовности СХОД

г (2)-У г . (г,у)

пр V / потерь !\ > /

У ____ / =1

Кг = гр (2) ; (4)

- на значения переменных

Z|^ ={0,1}, ур, ={0,1}, j = 1,2,..., /; I = 1,2,..., Ь; т = 1,2,..., М; (5)

Ь М

У Zjl = 1; У у]'т = 1. (6)

I=1 т=1

где 2 = |- матрица распределения данных в СХОД по средствам хранения, zfl = 1, если j-е данные распределены на 1-е средство хранения данных

(/=1,2,...,/; 1=1,2,...,Ь) и 0 - в противном случае; Ь- количество задействованных в СХОД средств хранения данных; / - количество разновидностей данных в СХОД, используемых при решении задач; У = | |у/т|| -матрица распределения резерва данных по средствам хранения, у/т = 1, если резерв /-х

данных распределен на т-е средство хранения данных (т=1,2,...,М); М -количество средств хранения резерва данных в СХОД; рк/ - вероятность со-

хранности/-х данных при решении к-й задачи; Сдоп - максимально допустимая стоимость системы резервирования; Тк доп - максимально допустимое время решения к-ой задачи.

В общем случае задача (1) - (6) может быть приведена к следующему

виду.

Определить такие составляющие вектора решения Х=(х1, х2,...,хп) которые максимизируют функцию:

п

р(х) = У сЛ (7)

/=1

в области заданной ограничениями:

X/ ={0,1}, / = 1,2,..., п (8)

п

У а/х/ < Ь, /=1,2,...,т (9)

/=1

Наличие в данной задаче ограничений (8) и (9) определяет множество (область) допустимых решений, причем данное множество является дискретным и конечным [5].

Наиболее эффективным методом решения задачи (7) - (9) является метод ветвей и границ [6], из практической реализации которого возникают три задачи [7]:

1. выбор метода, позволяющего достаточно точно вычислять нижнюю (верхнюю) границу для каждого из подмножеств;

2. определение способа разбиения множества допустимых решений на подмножества, т.е. определение способа дальнейшего ветвления.

3. определение способа организации компьютерных вычислений (распределенные или параллельные вычисления).

Эффективность вычислительных алгоритмов в методе ветвей и границ зависит от точности и простоты способа определения верхней или нижней границы возможных решений. Чем точнее способ определения верхней границы целевой функции, тем больше бесперспективных ветвей отсекается в процессе оптимизации. Однако увеличение точности расчета верхних или нижних границ связано с возрастанием объема вычислений. Поэтому, при выборе метода оценки границ решения необходимо идти на компромисс между точностью и скоростью сходимости метода [5].

Для определения границ решений на каждом шаге ветвления используют хорошо изученный аппарат решения задач линейного программирования. Для этого в задаче (7) - (9) и всех подзадачах, возникающих в ходе ветвления, условие целочисленности (8) ослабляется и заменяется условием:

0 <= х/ <= 1 /= 1,п; (10)

Задачи (7), (9), (10) можно решить наиболее часто применяемым для решения задач линейного программирования симплекс - методом или

такими его разновидностями [7], как модифицированный и двойственный симплекс метод, а также приближёнными методами решения двойственной по отношению к исходной задачи, основанными на градиентной процедуре. При использовании приближенных методов решения двойственной задачи для оценки границ решения встает задача определения влияния точности оценки границы решения на общую эффективность метода ветвей и границ и областей эффективного применения данных методов.

Для оценки границ решения в методе ветвей и границ при решении задачи (7) - (9) в [8] предложен приближенный алгоритм, основанный на градиентной методе и применении теории двойственности. Особенностью данного алгоритма является наличие процедуры определения порядка ветвления переменных.

Данный алгоритм сравнительно прост и обеспечивает достаточно высокую точность решения при незначительной, по сравнению с симплекс-методом, вычислительной сложности.

Выбор способа повышения эффективности метода ветвей и границ зависит от условий его применения, типа решаемых задач, особенностей исходных данных, выбранных стратегии ветвления и метода оценки границы решения.

Предлагается для повышения эффективности метода ветвей и границ для решения задачи (7) - (9) использовать однократное решение указанной задачи приближенным алгоритмом для определения порядка ветвления переменных, в соответствии с которым решение задачи осуществлять с использованием точных методов оценки границ решения, например симплекс-метода. Это позволит существенно увеличить количество отсеченных бесперспективных вариантов решения.

Для оценки эффективности предложенного подхода к повышению эффективности метода ветвей и границ осуществлен вычислительный эксперимент.

В качестве вычислительной системы использовались технические средства со следующими параметрами:

- Процессор: Intel(R) Core(TM) i5-3450 CPU @ 3.10GHz 3.10GHz;

- Оперативная память: 8ГБ;

- Операционная система: Windows 7 Professional (x64).

Решалось по 10 задач каждой размерности. В качестве методов оценки границ решения использовались:

- Симплекс-метод;

- Приближенный метод с использованием теории двойственности для оценки границ решения и определения порядка ветвления переменных.

В качестве стратегии ветвления использовались глобальнопоисковая, стратегия [9,10], как обеспечивающая наилучший результат по времени решения задач.

Исходные данные решаемых задач генерировались случайным образом. Коэффициенты при переменных в целевой функции и ограничениях генерировались в интервале [0,100]. Значения правых частей ограничений рассчитывались по следующей зависимости.

П

Ь = ач , 1=1,2,...,ш,

М

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Q - коэффициент определяющий жесткость ограничений.

Задачи решались как с предварительным определением порядка ветвления переменных, так и без него. Оценивалось максимальное, минимальное и среднее время решения задач. Результаты оценки эффективности метода ветвей и границ приведены в таблице.

Оценка влияния предварительного определения порядка ветвления переменных на эффективность метода ветвей и границ (О. = 0.5)

№М Среднее время решения 1 (сек.)

Без определения порядка ветвления С определением порядка ветвления

Симплекс- метод Приближённый метод Симплекс- метод Прибли- жённый метод

30x10 0.13 0.24 0.04 0.06

50x10 0.54 60.16 0.39 5.34

60x10 3.95 76.69 1.73 7.04

70x10 16.87 284 2.73 8.06

100x10 367.14 - 26.31 4002.68

Из таблицы видно, что предварительное определение порядка ветвления переменных при решении задачи (7) - (9) различных размерностей позволяет снизить время решения задач в 2.5 - 20 раз. При этом отчетливо видно преимущество точного метода оценки границы решения (от 1,5 до 3 раз) по сравнению с приближенным. Результаты решения являются стабильными независимо от способа оценки верхней границы. Это говорит об эффективности данного способа повышения эффективности метода ветвей и границ и целесообразности его использования при решении практических задач.

Как видно из приведенных данных, даже с учетом применения предлагаемых алгоритмов, время решения задач с числом переменных более 100 достаточно велико и с ростом размерности возрастает экспоненциально.

В условиях применения многопроцессорных, распределенных вычислительных систем дальнейшее повышение эффективности метода ветвей и границ при решении задач (7) - (9) возможно за счет совершенство-

вания способов организации вычислений.

Выбор способа организации компьютерных вычислений влияет на скорость вычислений и зависит от типа задачи и количества однотипных вычислений в ней, технических параметров вычислительной системы, в которой проводятся вычисления[11, 12].

Параллельные вычисления являются менее требовательными к техническим характеристикам вычислительной системы, чем распределенные вычисления, так как вычисления производятся на одном компьютере.

Параллельные вычисления могут физически исполняться либо последовательно на единственном процессоре - перемежая по очереди шаги выполнения каждого вычислительного процесса, либо параллельно - выделяя каждому вычислительному процессу один или несколько процессоров (находящихся рядом или распределённых в компьютерную сеть).

Основная сложность при реализации параллельных вычислений -обеспечить правильную последовательность взаимодействий между различными вычислительными процессами, а также координацию ресурсов, разделяемых между процессами.

В распределённых системах последовательные вычисле-

ния выполняются с учётом одновременного решения многих задач. Особенностью распределенных многопроцессорных вычислительных систем, в отличие от локальных суперкомпьютеров, является возможность неограниченного наращивания производительности за счет масштабирования.

Параллельный способ организации вычислений позволяет снизить до минимума межпроцессорные задержки, так как осуществляется управление вычислениями на более низком уровне.

Таким образом, выделение алгоритма определения порядка ветвления переменных приближенного метода в отдельную процедуру и использование ее совместно с симплекс методом повышает эффективность метода ветвей и границ при решении задач оптимизации обеспечения сохранности информации в системах хранения и обработки данных в 2.5-20 раз.

Для оценки выбора способа организации вычислений при решении задачи оптимизации состава технических средств обеспечения сохранности информации в системах хранения и обработки данных методом ветвей и границ требуются дополнительные исследования.

Список литературы

1. Воронин Л.Л., Морозов Б.И. Надежность информационных систем: учебное пособие. СПб: Изд-во СПбГТУ, 2001.

2. Есиков Д.О. Обеспечение устойчивого функционирования вычислительных систем за счет обеспечения высоконадежного хранения данных // Сборник статей XV международной научно-практической конференции «Фундаментальные и прикладные исследования, разработка и при-

менение высоких технологий в промышленности». Санкт-Петербург, По-литехн. универ-т, 2013.

3. Повзнер Л. Д. Теория систем управления: учебное пособие для вузов. М.: Изд. МГГУ, 2002. 472 с.

4. Николаев, В.И. Системотехника: методы и приложения /

B.И. Николаев, В.М. Брук. Л.: Машиностроение, Ленингр. отд-ние, 1985. 199 с.

5. Алексеев О.Г. Комплексное применение методов дискретной оптимизации. М.: Наука, 1987 г. 248 с.

6. Есиков Д.О. Оценка влияния предварительного определения порядка ветвления переменных на эффективность метода ветвей и границ, материалы научно-практической INTERNET-конференции «Междисциплинарные исследования в области математического моделирования и информатики». Ульяновск:8ГМ!ЕТ, 2013. 151 с.

7. Михалевич В.С. Волкович В. Л. Вычислительные методы исследования и проектирования сложных систем. М.: Наука, 1982. 275 с.

8. Алексеев О.Г., Алексеев А.О., Киселев В. Д. Применение двойственности для определения порядка ветвления переменных и границ при решении задач о ранце // Журнал Вычислительная математика и математическая физика. 1990. Т.30. N4. C. 630-632.

9. Бабаев А. А. Организация поиска решений на деревьях детерминированной структуры. Электронное моделирование 1985. Т. 7, №1.

C. 19 - 25.

10. Киселев В.Д., Есиков О.В. Оценка стратегий ветвления переменных и методов оценки границ решения в методе ветвей и границ при решении задач целочисленного линейного программирования. // Автоматика и вычислительная техника. Вып. 7. Тула: ТулГУ, 2001.

11. Воеводин В. В., Воеводин Вл. В. Параллельные вычисления. СПб: БХВ-Петербург, 2002. 608 с.

12. Эндрю Таненбаум, Мартин ван Стеен. Распределенные системы. Принципы и парадигмы. Санкт-Петербург: Питер, 2003. 877 с.

Есиков Олег Витальевич, д-р техн. наук, проф., eovmail@rambler.ru, Россия, Тула, Научно-исследовательский институт репрографии,

Есиков Дмитрий Олегович, магистрант, mcgeen4@gmail.com, Россия, Тула, Тульский государственный университет

MA THEMA TICAL MODELS AND ALGORITHMS MAINTENANCE OF INFORMA TION

SYSTEMS AND DATA STORAGE

O.V. Yesikov, D.O. Yesikov

Formalized mathematical model of optimization of the technical means to ensure the security of information systems, data storage and processing. To improve the efficiency of branch and bound method to solve this problem suggests the use of an algorithm to predetermine the order of branching variables on the basis of application of the theory of duality.

Key words: optimization of hardware, security of information, branch and bound algorithm to pre-determine the order of branching variables, the theory of duality.

Yesikov Oleg Vitalevich., Doctor of Engineering. Science, Professor, eovmail@rambler.ru, Russia, Tula, Research Institute of reprographic,

Yesikov Dmitry Olegovich, undergraduate, mcgeen4@gmail.com, Russia, Tula, Tula State University

УДК 004.9:681.518

АЛГОРИТМ УСТРАНЕНИЯ ИСКАЖЕНИЙ СРЕДНЕЙ ЯРКОСТИ

ПО ПОЛЮ ИЗОБРАЖЕНИЙ

В.К. Злобин, Б.В. Костров, А.Г. Упакова, Ю.В. Конкин

Рассмотрены вопросы построения алгоритма устранения искажений средней яркости на основе аппарата анализа дискретных сигналов определенны на конечных интервалов.

Ключевые слова: ортогональные функции, функции Виленкена-Крестенсона, фильтрация аэрокосмических изображений.

Основу системных платформ современных космических и атмосферных летательных аппаратов составляют различные датчики сканирующего типа. Общей характерной чертой для изображений, создаваемых такими системами, является наличие в них искажений средней яркости по полю снимка, вызванных, как правило, переменностью условий съемки и изменением чувствительности датчиков. При классическом подходе и устранению искажений такого рода, процесс коррекции описывается аналитической Н-1(i, j) и статической F-1(i, j) моделями [1]. В соответствии с ними процесс коррекции представляется следующим образом:

b*(i.j) = F _1<Л j) H _1<Л j X (1)

*

где b (i, j) и b(i, j) - значения яркостей скорректированного и искаженного изображений соответственно, представленных в виде дискретных двумерных функций, i = 0, N -1 и j = 0, N -1.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Есиков Олег Витальевич, Есиков Дмитрий Олегович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Есиков Олег Витальевич, Есиков Дмитрий Олегович

MATHEMATICAL MODELS AND ALGORITHMS MAINTENANCE OF INFORMATION SYSTEMS AND DATA STORAGE

Текст научной работы на тему «Математические модели и алгоритмы обеспечения сохранности информации в системах хранения и обработки данных»