Научная статья на тему 'Стохастическое моделирование информационной системы облачного хранения данных'

Стохастическое моделирование информационной системы облачного хранения данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
124
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛУМАРКОВСКАЯ МОДЕЛЬ / УРАВНЕНИЯ МАРКОВСКОГО ВОССТАНОВЛЕНИЯ / ХРАНЕНИЕ ДАННЫХ / ОБЛАЧНАЯ СИСТЕМА / EMI-MARKOV MODEL / MARKOV RECOVERY EQUATIONS / DATA STORAGE / CLOUD SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Заморёнов Михаил Вадимович

Рассмотрена информационная структура системы облачного хранения данных. Показаны причины. обеспечивающие стохастический характер функционирования исследуемой системы. В качестве аппарата исследований выбран аппарат полу-марковских процессов. Определены функции распределения времен пребывания в состояниях и вероятности переходов вложенной цепи Маркова. Составлена система уравнений марковского восстановления. для чего были определены полумарковские ядра. Система решена операторным методом. Проведено моделирование такой системы. построен график функции распределения времени полной обработки запроса на чтение системой облачного хранения данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Заморёнов Михаил Вадимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STOCHASTIC MODELING OF THE INFORMATION SYSTEM OF CLOUD STORAGE OF DATA

Describes the information structure of the cloud data storage system. The reasons for the stochastic character of the functioning of the system under investigation are shown. The apparatus of semi -Markov processes was chosen as the research apparatus. The di stribu-tion functions of the residence times in states and the probability of transitions of the embedded Markov chain are determined. А system of Markov renewal equations was constructed, for which the semi-Markov kernels were determined. The system is solved by the operator method. Modeling of such a system is carried out, the graph of the time distribution function of the compl ete processi ng of the read request by the cl oud storage system i s constructed.

Текст научной работы на тему «Стохастическое моделирование информационной системы облачного хранения данных»

Martyanov Ivan Anatolyevich, student, martyanow. ivan@yandex. ru, Russia, Tula, Tula State University

УДК 519.87:004.94

СТОХАСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ИНФОРМАЦИОННОЙ СИСТЕМЫ ОБЛАЧНОГО ХРАНЕНИЯ ДАННЫХ

М.В. Заморёнов

Рассмотрена информационная структура системы облачного хранения данных. Показаны причины, обеспечивающие стохастический характер функционирования исследуемой системы. В качестве аппарата исследований выбран аппарат полумарковских процессов. Определены функции распределения времен пребывания в состояниях и вероятности переходов вложенной цепи Маркова. Составлена система уравнений марковского восстановления, для чего были определены полумарковские ядра. Система решена операторным методом. Проведено моделирование такой системы, построен график функции распределения времени полной обработки запроса на чтение системой облачного хранения данных.

Ключевые слова: полумарковская модель, уравнения марковского восстановления, хранение данных, облачная система.

В настоящее время в структуре информационных систем все большее использование находят системы облачного хранения данных [1-4]. Наиболее важной характеристикой таких систем выступает их быстродействие. Одним из основных способом повышения быстродействия систем облачного хранения данных является использование кэш-памяти, характеризующейся высокой скоростью чтения данных, однако имеющей более высокую себестоимость по отношению к памяти, находящейся на сервере хранения данных [5-12]. Вероятность обращения к кэш-памяти зависит от вида запроса на чтение данных, поэтому процесс является стохастическим, а сами запросы являются случайными событиями. Также, стохастический характер носят возможные отказы линий передачи данных.

Выше сказанное обосновывает стохастический характер процесса обработки запроса на чтение к системе облачного хранения данных в целом. Что позволяет такую систему считать стохастической и применять для ее моделирования аппарат полумарковских процессов.

Системы облачного хранения данных во многих случаях являются элементами более сложных систем, при моделировании которых используется иерархический подход. При этом для стыковки моделей различных иерархических уровней необходима наиболее информация о случайных величинах, описывающих функционирование элементов иерархии, которую дают только функциях или плотности распределения этих случайных величин.

Для нахождения функций распределения, используя аппарат полумарковских процессов [13-17], необходимо составить и решить систему уравнений марковского восстановления, являющуюся системой интегральных уравнений Вольтерры 2-го рода с полустохастическим ядром.

Целью данной работы является определение функций распределения времени полной обработки запроса на чтение системой облачного хранения данных.

Постановка задачи.

Поставим задачу следующим образом: пусть известны функции распределения Fi(t) и Gi(t) случайных величин ai и gi, которые являются временами обработки запросов на чтение от пользователя к кэш-памяти и от кэш-памяти к серверу хранения данных соответственно, а также функции распределения F (t) и G2 (t) случайных величин a 2 и g 2 - времен между сбоями в каналах связи между пользователем и кэш-памятью и между кэш-памятью и сервером хранения данных. Кроме этого известна функция распределения R(t) случайной величины b - времени поиска в кэш-памяти и вероятность p нахождения требуемой информации в кэшпамяти.

При построении модели принимается допущение о том, что при возникновении сбоя в канале связи выполнение запроса на чтение начинается сначала.

В проводимом исследовании необходимо определить функцию распределения времени полной обработки запроса на чтение указанной системой (усредненное время поиска информации в кэш-памяти и в сервере хранения данных).

Построение модели.

Указанная система может принимать следующие состояния: Sq -запрос выполнен (мгновенное состояние); Si - запрос от пользователя получен (или в момент выполнения запроса произошел сбой в канале связи), началось выполнение запроса с начала; S2 - производится поиск данных в кэш-памяти; S3 - данные в кэш-памяти не найдены, производится запрос к серверу хранения данных (или во время выполнения запроса к серверу хранения данных произошел сбой в канале связи), выполнение запроса началось с начала.

Граф состояний системы представлен на рисунке.

Времена пребывания 0о, 0i, 62,63 системы в состояниях Sq, S1, S2 и S3 равны:

0о = 0, 01 = (a1 ла2),

02 =b, 0з = (gi лg2), где л - знак, обозначающий минимум случайных величин.

307

Граф системы

Тогда функций распределения времен пребывания системы в состояниях равны:

_ ^о(0 = 1о(0;

^) = т) • 1 2(г); _ ^2^) = т;

1 3«) = ) • О 2^). Опишем вероятности переходов вложенной цепи Маркова:

р01 = 1;

¥

р/(а1 >а 2} = |11(1 ХМ )йг;

о

¥

Р12{а1 <а 2} = | М) 12(г М; о

о

р2=р;

р2 =1 - р;

¥

Р33 = | Щ ) g 2(Г )Л;

о

¥

р0 = | 2(0^. о

(1)

Фазовое пространство состояний имеет вид: E = {Sq , Si, S2, S3 }. Определим полумарковские ядра Q(t, x, B) процесса марковского восстановления {Xn, 0n,n - 0 }:

Q(t, Sq, Si) = 1;

Q(t,Si,Si) = P{Xn+i = Si;0n+i < t/Xn = Si}=P{ai > a2;a2 < t}=

t _

= J F i( x )f2( x)dx; 0

Q(t,Si,S2) = P{Xn+i = S2;0n+i < t/Xn = Si} = P{ai < a2;ai < t}=

t _ = J /i( x ) F 2( x)dx; 0

Q(t,S2,Sq) = P{Xn+i = So;0n+i < t/Xn = S2} = Piß < t}-p = p• R(t); (4) Q(t, S2, S3) = P{Xn+i = S3; 0n+i < t / Xn = S2 } = Piß < t}- (i - p) =

= (i - p) • R(t);

Q(t, S3, S3) = P{Xn+i = S3; 0n+i < t / Xn = S3 } = P{gi > g2; g2 < t} =

t _

= J Gi( x ) g2( x )dx; 0

Q(t, S3, So) = P{Xn+i = So; 0n+i < t / Xn = S3}=P{gi < g2; gi < t}=

t _ = J gi( x)G 2( x )dx. 0

Представим множество всех состояний в виде:

E = E+ U E-, где E+ = {Si, S 2, S3 } E_ = {Sq }.

Найдем распределение времени пребывания полумарковского процесса X(t) в подмножестве состояний E+ . Пусть ti, Т2, ^3 - времена пребывания полумарковского процесса X(t) в E+ с начальными состояниями Si,S2,S3 соответственно; ji(t), j2(t),Ф3(t) - соответствующие этим временам функции распределения.

Составим уравнения марковского восстановления [i6, i7, i9] для подмножества E+ :

г г

Л(0 =I Q(dx, 5Ь ^1)ф1(г - х) +IОФ, 5Ь ^2)ф2(г - х); о о

г

ф2(г) = I О^х, 52, ^3)ф3(г - х)+О(г, 52,5о); (5)

о г

Ф3(г) = I 53,53)ф3(г - х)+О(г, 53,5о). о

Подставляя выражения (4) в (5), имеем:

г _ г _

ф1 (г) = I ф1 (г - х) 11 (х) /2 (х)йх +1 ф2(г - х) /1 (х)12( х)^х; оо г

ф2 (г) = (1 - р) • I ф3 (г - х)г (х)йх+Д(г) • р; (6)

о

г _ г _

ф3 (г) = | ф3 (г - х)01 (х) g 2 (х)^х +1 gl (х)0 2 (x)dx. оо

Произведя в (6) замену переменной получим:

г — г —

ф1 (г) = I ф1 (х) 11 (г - х) /2 (г - x)dx+1 ф2 (х) /1 (г - х)12 (г - х)^х; оо г

ф2(г) = (1 - Р) • I ф3 (х)г (г - х)йх+Д(г) • р; (7)

о

г _ г _

ф3 (г) = I ф3 (х)01(г - х) g 2 (г - х)^х+1 gl( х)0 2( х)^х. оо Представим третье уравнение системы (7) в виде

г

ф3 (г) = I ф3 (х)К3 (г - х)^х + Ф3(г), (8)

о

_ г _

где К3(х) = 01(х^2(х), Ф3(х) = Ig1(х)02(х'^х.

о

Введем оператор [^ф3 ](г) [2о, 21]

г

[^ф3 ](г) = I ф3 (х)К 3(г - х^х. о

Выражение (8) примет вид

ф3(г) = [ф ](г) + Ф 3(г). (9)

Решая (9), получим

An Ф

(г),

Фз(г) = [1 - A]Фз(t) = Фз(г) + I

п=

где I - единичный (тождественный) оператор. Тогда

t

Фз (г) = Ф з (г) + | Из^ - x)Ф з (x)dx, (10)

0

¥ _ t _

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Из(х) = • g2f)n (х); Фз(х) = I gl(x)G2(x)dx. п=1 0

Подставив Ф( х) в (10), получим

t __t х _

Фз (t) = I gl (х^2(х)(х + |Из(г - х) | gl (у^2 (у)(у(х. (11)

0 0 0

Подставляя (11) во второе уравнение системы (7), имеем

t

Ф2(г) = (1 - р )• | г (г - х)

0

I gl( у )G 2( у )(у +

0

х У _

+1 Из(х - у) I gl (2^2 (2)(2(у 00

(х + ^(г) • р.

(12)

Преобразуя (12), получим

г х _

Ф2 (г) = Р • Щ) + (1 - р ) • I г (г - х) I gl (y)G 2( у)(у(х +

0 0 г х у _

+ (1 - Р ) • IГ (г - х) I Из( х - у) I gl ( 2 (2 )(2(у(х. 0 0 0 Представим первое уравнение системы (7) в виде

г

Ф1(г) = I ф1( х) К1(г - х)(х+Ф1( х), (1Э)

0

__х _

где К (х) = (х)/2 (х), Ф1 (х) = I ф2 (у)/1 (х - у)^ 2(х - у)(у;.

0

Введем оператор [20, 21]

г

[Аф1 ](г) = I ф1 (х)К1 (г - х)(х. 0

Выражение (1Э) примет вид

Ф1(г) = [АФ1 ](г) + Ф1(г). (14)

оо

х

Решая (14), получим

AnFi

(t ).

jl(t) = [l - A]Fi(t) = Fi(t) + S

n=

Проинтегрировав, получим

t

j1(t) = F1(t) + Jh1(t - х)Ф1(x)dx, (15)

0

¥ __X _

где h1(x) = S[F1 • /2](*)n (x); Ф1(х) = J jMMx - y)Fl(x - y)dy. n=1 0

Подставив Ф1( x) в (15), получим

t _ j1(t ) = J j 2( У ) /1(t - У ) F 2(t - y ) dy + 0

(16)

t x _

+ Jh1(t - x)J j2(y)/1(x - y)F2(x - y)dydx. 00

Полученная функция распределения (16) описывает полное время обработки запроса на чтение блочной системой облачного хранения данных. Исходными данными для моделирования служат функции распределения F1(t ), F2 (t ), G1(t ), G2 (t ) и R(t ), которые соответствуют обобщенному закону Эрланга второго порядка с параметрами I1, 12 ; m1, m2 ; U1, U2 ; V1, v 2; т1, т2 соответственно. Причем

/1(t - ^2t ) ,

12 -11

где 11 =0,275 с-1; 12=2,725 с-1;

/2(t)=m1m-«-m2t) , m 2 -m1

где m1=0,069 с-1; m 2=0,681 с-1;

(t )=U1U2(e-u-t - «-u 2t ) ,

u2 -u1

где u1 =0, 275 с-1; u2=2,725 с-1;

g 2 (t )=V1V2(V^v^) v 2-V1

где v1=0,069 с-1; v2 =0,681 с-1;

r (t ) = ,

t 2 -t1

где t1 =0,55 с-1; t2=5,45 с-1.

сю

В результате компьютерного моделирования математическое ожидание полного времени обработки запроса на чтение составило 8,5 с.

Выводы.

Построенная полумарковская модель обработки запроса на чтения к информационной системе облачного хранения данных позволяет получать функцию распределения времени полной обработки такого запроса. Что, в свою очередь, позволит в дальнейших исследованиях использовать результаты данной работы при моделировании функционирования системы облачного хранения данных в целом.

Список литературы

1. Кирьянова А. Россия создает 2,4% мирового объема данных // Издание о высоких технологиях CNews. Главные новости. URL: www.cnews.ru/news/top/rossiya sozdaet 24 mirovogo obema dannyh (дата обращения: 08.08.2017).

2. Клименков П.А., Кузнецов С.Д. Большие данные: современные подходы к хранению и обработке // Труды ИСП РАН. 2012. № 22. С. 143— 158.

3. Соболь А. С. Обработка больших данных в телекоммуникационных компаниях // Вестник СибГУ им. М.Ф. Решетнева. 2014. № 2 (54). С. 73-76.

4. Хашковский В.В., Шкурко А. Н. Современные подходы в организации систем обработки больших объемов данных // Известия ЮФУ. Технические науки. 2014. № 8. С. 241-250.

5. Ганин Д.В., Климов Р.В. Особенности моделирования надежности распределенных систем хранения данных // Вестник НГИЭИ. 2017. № 7 (74). С. 18-25.

6. Tormasov A., Lysov A., Mazur E. Distributed data storage systems: analysis, classification and choice // Труды ИСП РАН. 2015. № 6. С. 225252.

7. От хранения данных к управлению информацией. 2-е изд. // СПб.: Питер. 2016. 544 с.

8. Зенченко Е.С. Сравнительный анализ систем хранения данных // Cloud of science. 2013. № 3. С.22-26.

9. Проскуряков Н.Е., Ануфриева А.Ю. Анализ и перспективы современных систем хранения цифровых данных // Известия ТулГУ. Технические науки. 2013. № 3. С. 368-377.

10. Быков В.В. Проблемы хранения медиаинформации // T-Comm. 2011. № 9. С. 39-41.

11. Богатырев В.А., Богатырев С.В., Богатырев А.В. Оценка надежности отказоустойчивых кластеров с непосредственным подключением устройств хранения // Приборостроение. 2013. № 8. С. 77-81.

12. Соловьев Д. Гибридное двухуровневое сетевое файловое хранилище и его применение в облачном хостинге / Иртегов Д.В., Рутман М.В., Маллаева Ю.М., Князев И.С. // Вестник НГУ. Серия: Информационные технологии. 2014. № 4. С. 96-101.

13. Королюк В.С., Турбин А.Ф. Процессы марковского восстановления в задачах надежности систем. Киев: Наукова думка, 1982. 236 с.

14. Королюк В.С. Стохастические модели систем. Отв. ред. А.Ф. Турбин. Киев: Наукова думка, 1989. 208 с.

15. Королюк В.С. Суперпозиция процессов марковского восстановления // Кибернетика. 1981. №4. С. 121 - 124.

16. Королюк В.С., Турбин А.Ф. Полумарковские процессы и их приложения. Киев: Наук. Думка, 1976. 181 с.

17. Броди С.М., Власенко О.Н., Марченко Б.Г. Расчет и планирование испытаний систем на надежность. Киев: Наукова думка, 1970. 192 с.

Заморёнов Михаил Вадимович, канд. техн. наук, доц., zamoryonoff(@,gmail.com, Россия, Севастопольский государственный университет

STOCHASTIC MODELING OF THE INFORMATION SYSTEM OF CLOUD STORAGE

OF DATA

M.V. Zamoryonov

Describes the information structure of the cloud data storage system. The reasons for the stochastic character of the functioning of the system under investigation are shown. The apparatus of semi-Markov processes was chosen as the research apparatus. The distribution functions of the residence times in states and the probability of transitions of the embedded Markov chain are determined. A system of Markov renewal equations was constructed, for which the semi-Markov kernels were determined. The system is solved by the operator method. Modeling of such a system is carried out, the graph of the time distribution function of the complete processing of the read request by the cloud storage system is constructed.

Key words: semi-Markov model, Markov recovery equations, data storage, cloud

system.

Zamoryonov Mikhail Vadimovich, candidate of technical sciences, docent, zamoryo-noffagmail. com, Russia, Sevastopol National University

i Надоели баннеры? Вы всегда можете отключить рекламу.