Аналитико-численное моделирование распределенных информационных систем с низким уровнем сетевого трафика

Ковалевский В.Н.

В.Н.Ковалевский

Южно-Российский государственный политехнический университет (НПИ)

им. М.И.Платова, г. Новочеркасск

Аннотация: в данной статье на базе аппарата замкнутых систем массового обслуживания (СМО) разработана аналитико-численная модель для распределенной информационной системы с удаленным исполнением в условиях низкого уровня сетевого трафика. Приведены формулы расчета характеристик этих систем на основе вектора стационарного распределения вероятностей (СРВ) в моменты регенерации сообщений. Ключевые слова: распределённая информационная система, репликация, сетевой трафик, удаленное исполнение, пуассоновский поток, эрланговский поток, метод вложенных цепей Маркова, пространство состояний, моменты регенерации, матрицы переходных вероятностей, вектор стационарного распределения вероятностей.

Информационные системы (ИС) с распределенной архитектурой относятся с организационной точки зрения к сложным системам [1]. Основная особенность этих систем заключается в том, чтобы хранить одинаковые локальные копии баз данных на всех станциях ИС. Практически весь основной объем данных, необходимый для функционирования системы, может быть размещен на одном мощном персональном компьютере. Поток исправлений и дополнений, генерируемый на этом компьютере, ничтожно мал по сравнению с общим объемом данных, используемым в его работе. Однако применение одного компьютера в системе не может обеспечить ее многопользовательский режим . Поэтому, если хранить постоянно используемые данные на всех станциях (узлах), и организовать обмен между ними только исправлениями и дополнениями к хранящимся данным, то суммарный передаваемый трафик может быть значительно сокращен. Это позволит: понизить требования к каналам передачи данных между станциями (узлами) и чаще использовать для этого неустойчивую связь типа Интернета, мобильной связи, спутниковых каналов; обеспечить доступную

стоимость эксплуатации такой связи. Конечно, реализация этой ИС не относится к простым случаям, а требует решения ряда задач, одна из которых - это своевременная синхронизация данных. Эта операция обеспечивает актуальность данных во всей системе благодаря непрерывному обмену сообщениями между узлами. Он осуществляется с помощью репликаций -передачи фрагментов обновляемых данных [2,3]. Репликация бывает синхронной и асинхронной. В случае синхронной репликации реплика обновляется в одной транзакции по всем узлам, поэтому в них поддерживается только одна версия данных. Синхронная репликация имеет тот недостаток, что она создаёт дополнительную нагрузку на сеть при выполнении всех транзакций в момент пиковых ситуаций в линиях связи (ЛС). При асинхронной репликации обновление одной реплики распространяется на другие узлы спустя некоторое время, а не в той же транзакции. Таким образом, при асинхронной репликации вводится задержка или время ожидания, в течение которого отдельные реплики могут быть фактически неидентичными. В большинстве случаев асинхронная репликация реализуется посредством ведения журнала транзакций или постоянной очереди тех обновлений, которые подлежат распространению. Преимущество асинхронной репликации состоит в том, что она может выполняться при не сильно загруженном трафике. К недостаткам этой схемы относится то, что данные в узле могут оказаться неактуальными с точки зрения пользователя в определенные моменты времени.

Однако при определенных особенностях функционирования ИС иногда невозможно качественно реализовать схему репликативного типа. К ним относится использование баз данных (БД), которые хранятся только на удаленном сервере или частично на разных серверах. В этом случае приложение клиентского узла обращается к выделенному (удаленному) серверному узлу непосредственно или обращается к своей локальной базе,

которая уже и обеспечивает обращение к удаленному серверу , т.е реализуется тип удаленного исполнения.

Для анализа информационных процессов (протоколов обмена) в вычислительных сетях (ВС) распределенных систем широко используются вероятностные модели, которые на концептуальном уровне представляются как системы и сети массового обслуживания [4,5]. При разработки этих моделей применяется понятие марковского процесса и такие методы как вложенных цепей Маркова, экспоненциальных сетей и т.д. [6,7].

Далее в работе будет рассмотрена аналитико-численная модель для распределенной информационной системы с удаленным исполнением, представляющей многоточечное соединение (звезду). Характеристики такой системы непосредственно зависят от сетевого трафика (объёма информации, передаваемого по линиям связи ВС за определённый период времени). Влияние сетевого трафика оказывает существенное влияние на передачу сообщений между узлами сети (станциями и сервером БД). Поэтому информационные процессы такого класса ИС моделируются в трех областях этого трафика: низком, среднем и высоком [8].

В линиях связи ВС распределенной системы с низким сетевым трафиком практически отсутствуют потери (искажения) передаваемых сообщений из-за несущественной загрузки каналов и их узловых промежуточных накопителей (очередей). Поэтому вероятность потери сообщений низка и ею можно пренебречь. Указанные признаки позволяют не использовать в протоколе обмена квитирование и повторные передачи сообщений, но не исключают процедуры предварительного обмена с помощью блока заголовка и подтверждения.

Для построения модели определены следующие исходные данные: число источников сообщений - т; экспоненциальный закон распределения времени отработки сообщения в 1-м источнике ^(Е) = 1 — е-'1

_ __

где А^ = £оЕГ( - интенсивность отработки сообщения в 1-м источнике, £0(Г; -

среднее время отработки сообщения в 1-м источнике с учетом времени, затрачиваемого на формирование блока заголовка и анализа подтверждения во время этого процесса; экспоненциальный закон распределения времени занятости /-го канала при передачи прямого сообщения = 1 — е-4^,

где = среднее время занятости /-го канала при передаче

прямого сообщения; длина файла и прямого сообщения, передаваемых в 1-м канале - быстродействие /-го канала - С/; среднее время,

затрачиваемое на предварительный обмен при передаче прямого сообщения в 1-м канале (включает время передачи блоков заголовка и подтверждения) -. Для увеличения степени адекватности модели было предложено вместо

экспоненциального закона В^) = 1 — , где /л^1- среднее время

обслуживания прямого сообщения от I -го источника, использовать произвольный закон распределения времени обслуживания сообщения от I-го источника с плотностью

В данном случае практически отсутствуют потери (искажения) передаваемой информации, поэтому время занятости 1-го канала при передаче прямого сообщения имеет вид = 4- Щ* ¡С}. Случайность

этой величины обуславливается в основном одним процессом -предварительным обменом. Таким образом, эта характеристика имеет в данном случае более простое распределение. С учетом этой особенности при построении модели осуществлено объединение процесса отработки и процесса передачи прямого сообщения в единый, так называемый процесс генерации сообщения. Среднее время генерации сообщения для 1-го

источника определяется как ^ = 1ащ -Ь Ввиду показательного закона

распределения случайных величин 1ащи ^^ в модели принято допущение

об эрланговском законе распределения второго порядка (к =2) времени генерации сообщения функция плотности которого имеет вид

- интенсивность пуассоновского потока,

порождающего эрланговский поток для 1-го источника. Исходя из принятого допущения, функционирование рассматриваемой ВС представлено на концептуальном уровне в виде замкнутой системы массового обслуживания с эрланговским распределением времени генерации сообщения I? и произвольным законом распределения времени

I

обслуживания в устройстве. Также СМО включает группу из т источников с буферными накопителями, обслуживающее устройство с группой из т системных накопителей. Емкость всех накопителей равна параметру

Ичг^д;' = (рис. 1).

Рис.1.- СМО распределенной системы

На основе данного концептуального представления рассматриваемую модель можно построить на базе метода вложенных цепей Маркова.

Учитывая, что время генерации сообщения распределено по эрланговскому закону, целесообразно использовать метод фаз. Идея метода основана на том, что распределение Эрланга представляет собой сумму к случайных величин (фаз), имеющих экспоненциальное распределение, и состоит в сведении немарковского процесса к непрерывному марковскому либо к вложенной цепи путем дополнительного введения в пространство состояния номера фазы, на которой находится процесс. Таким образом, процесс генерации сообщения 1-м источником разбивается на к фаз, имеющих интенсивность выполнения = 2/(?ои.1 -Ъ

Для нахождения стационарных характеристик случайного процесса ^(С)методом вложенных цепей Маркова необходимо: задать полное

пространство состояний Б = {Б^ I = 1 ,р}\ выбрать моменты регенерации тп;

определить пространство состояний Б"' = {ЕЁ = цепи Маркова

= вложенной в процесс с учетом ограничений; вычислить

матрицу переходных вероятностей

Полное пространство состояний Е для рассматриваемого процесса ^(С)с учетом фаз имеет вид:

Б ■ ■■ I ¿¿I III I Ё-рр^ $21 "' 1^11 ■■■ I Е 1! 1

где ¡|- число сообщений, находящихся в очереди и на обслуживании, т. е. в

/-м системном накопителе; 81- номер фазы генерации сообщения 1-м

источником; к- порядок Эрланга. Например: для т=2, к=2 полное пространство состояний имеет вид

Е = { Е1(0,0; 1Д),Е2(0,0; 1,2), Е3(0Г0; 2,1), Е4 (0,0; 2,2),

Е5(0,1; 1,1), Ей(0Д; 1,2),Е7(0Д;2,1),ЕВ(0,1; 2,2}.....

Е; (¡1, ¡.2; ..., 2,2) }.

В качестве моментов регенерации тп, целесообразно выбрать моменты п=1,2,3,..., где 1п - момент окончания обслуживания одного сообщения. Тогда полное пространство состояний Еп цепи Маркова > 0), вложенной в процесс имеет вид

Еп = {Е1\ 1 = 1,р1} ,р1 = р — X. Подмножество из X состояний представляет

собой совокупность следующих векторов:

О^иЛеш!' ■■■'^вЛеи^ ■■■ ...... Л)

О^иЛеи!» ■■■ г ^яЛеп^ ■■■ : ^рЬеПщ/ Ъ — А/ ■■■ г^)

0^wheu1t ■■■ г^whenif ■■■ ... ,k)„

Исключение этих состояний обусловлено тем, что после обслуживания сообщения не могут все системные накопители быть заполненными. Т.е. для получения ограниченного пространства Е'' = {£У\ Ё = 1,ро) состояний цепи

Маркова >0) необходимо исключить из пространства Е" те состояния,

которые не удовлетворяют следующему ограничению: если

= Ж,.;,,,;,., ю 5; = 1,( = Состояние марковской цепи, когда

= п = 1, соответствует пассивному состоянию 1-го источника,

поэтому оно должно быть для этого источника единственным.

Для определения элементов матрицы

переходных

вероятностей цепи Маркова, вложенной в полумарковский процесс, для моментов окончания обслуживания одного сообщения хп из У-го системного

накопителя, где V = шт{и £ и/(и £ У} « = тах {ц/1 £ {1,2,... ,ш}}},

воспользуемся следующим выражением:

где Тщщ- вероятность того, что цепь Маркова в момент т„ (п>0) находится в одномерном состоянии ... ... ..., (¿¿,..., спри условии, что

в момент тп-1 цепь Маркова находилась в состоянии £/'(¡1....................вероятность того, что в момент

накопителя,

времени т„_1 на обслуживание будет выбрано сообщение из У-го системного

где Гц-СзуУх^гУ вероятность того, что в момент т„ в 1-м системном накопителе сообщений, а в 1-м источнике - й\~я фаза генерации сообщения, при условии, что в момент т„_1 сообщений было ц, а фаза -^^-вероятность того, что в момент тп в /-м системном накопителе

(/ф¥, т.е. из /-го накопителя сообщения не были выбраны на обслуживание в момент тп.1) ]/ сообщений, а в /-м источнике й/-я фаза генерации сообщения, при условии, что в момент тп-1 сообщений было ¿/, а фаза - £/.

При вычислении вероятностей г^^щ^ Учитывается

то, что вероятность выполнения источником Ь фаз генерации сообщения за время £ при условии, что источник имеет возможность максимально отрабатывать Ьтах = И^йеп ■ ^ фаз, определяется из следующих

соотношений [9]:

Тогда, зная функцию йу(1) плотности распределения времени обслуживания сообщения от У-го системного накопителя, получим:

Й — II

1-У

СЧг1^-^

1о,

(у =0; ]у = 0, Ху < <1у,

Ь = )у ■ к 4- (1У —

^ = (1у = 1 ,

}у = Щ^-Ьепу ~ 1/ * = (И^ЬЯ, - 1 )-к+йу-$у\

1у = С, 0 < }у < - 1

Ь =]¥ 1 к + йу —

в остальных случаях;

г"5 №Ой

^ —- Оу (£)

Й-1

Я=и

¿п О!

О,

(у* 0, £р - ¡у < 1,

Л' < И^Авт* - % < Йр, Ь = Ор —Ъу + 1}-к+ —

Ф О, -]у < 1,

]у = И^й^пр — 1' йу = 1с

ь = (И^РАяц, - Ч>) ■ к + ^ - ¿V ;

О, ¿V ~]у < 1,

/у < - 1; ^ > йу,

& = (/V — V + 1) " к Н- —

в остальные случаях;

ь/ЗД^/О1/)=

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о

ь-± „

-XI

-(а;*)' _

^ а

Ь = • к + —

= 0 ,0 < )Г < > <1Т, Ь = ■ к н- ёр —

= 0, = Ь = & + ^ - лу;

в остальных случаях;

Г« 1

Ь-1

О,

(у Ф 04. < И^лга^ -]г < о, б = (// - ■ йс + -

^ = О,

¿1 = ёг — гу; ¿у Ф - уу < О,

в остальных случаях.

Для подсчета фаз Ь в вышеприведенных соотношениях необходимо использовать следующие выражения:

Таким образом, определены выражения для всех компонент элементов

матрицы переходных вероятностей

тБ*Е*

= |г:,' |. Классическим методом

нахождения характеристик полумарковских процессов является решение системы линейных уравнений для цепи Маркова = к совместно с

условием нормировки Е^н^ = 1, ще л: = (л^,... /Лр0) ~ вектор

*><и

стационарного распределения вероятностей в моменты регенерации; п -

вероятность того, что цепь Маркова находится в состоянии

.

Для решения данной системы линейных уравнений целесообразно использовать итерационные методы: простой итерации, Гаусса- Зайделя и др. [10]. Это связано с тем, что размерность матрицы может быть

достаточно велика, поэтому применение точных методов в этих случаях будет затруднено. При увеличении пространства состояний целесообразно применять приближенные методы укрупнения состояний случайных процессов. Для получения вектора СРВ л= (л^,... ...где п* -

вероятность того, что цепь Маркова находится в состоянии Щ 0±1 ••• — г}т.Х необходимо вероятности ^¿(Ё = 1,/?о) просуммировать по

всем сочетаниям фаз ...,...,

Полученный вектор СРВ позволяет определить следующие характеристики:

- закон распределения состояний накопителя 1-го источника

11 1 ■ 1

К

Ч'

Еj Zt ... г I.

HI*

i1=0 i.£_1=0 ¿f+i=0

- вероятность блокировки l-го источника

- среднее число сообщений, находящихся в l-м системном накопителе

N.

-1

1 Z,

t = (1,т);

Z=Q

- средняя интенсивность l-го источника

- среднее время передачи файла для l-го источника

Литература

1.Таненбаум Э. Распределенные системы. Принципы и парадигмы / Э. Таненбаум, М. ван Стеен. - СПб.: Питер, 2003. - 877 с.

2. Wiesmann M., Pedone F., Schiper A., Kemme B., Alonso G. Database Replication Techniques: a Three Parameter Classification // Proc. 19-th {IEEE} Symp. on Reliable Distributed Systems. 2000. pp. 206-218.

3. Holliday J., Steinke R.., Agrawal D., Amr E. A. Epidemic Algorithms for Replicated Databases // IEEE Transactions on Knowledge and Data Engineering. 2003. Vol. 15, N. 3. pp. 1218-1238.

4. Черноморов Г.А. Теория принятия решений: Учебное пособие / Юж.-Рос.гос. техн.ун-т.-3-е изд.перераб. и доп. -Новочеркасск : Ред. журн. «Изв. Вузов. Электроомеханика», 2005. 448с.

5. Матвеев В.Ф., Ушаков В.Г. Системы массового обслуживания. - М.: Изд-во МГУ, 1984. - 240 с.

6. Скоба А.Н., Состина Е.В. Математическая модель оптимального размещения распределённой базы данных по узлам ЛВС на базе файл-серверной архитектуры. // Инженерный вестник Дона, 2015, №2 URL:ivdon.ru/ru/magazine/archive/n2y2015/2881.

7. Скоба А.Н., Состина Е.В. Математическая модель оптимального размещения распределённой базы данных по узлам ЛВС на базе двухуровневой клиент-серверной архитектуры // Инженерный вестник Дона, 2015, №2 URL:ivdon.ru/ru/magazine/archive/n2y2015/2882.

8. Ковалевский В.Н., Воробьёв С.П. Построение аналитико-численных моделей распределенных информационных систем с невысоким уровнем сетевого трафика // Изв. вузов. Сев.- Кавк. регион. Техн. науки. 2015. № 2. С. 23-29.

9.Зуев В.А., Ковалевский В.Н. Моделирование процессов обработки информации в распределенных системах: учебное пособие. Юж.-Рос. гос. политехн. ун-т. - Новочеркасск: ЮРГПУ (НПИ) имени М.И.Платова, 2015. -128c.

10.Зуев В.А., Ковалевский В.Н., Черноморов Г.А. Программное моделирование систем : учеб.пособие / Новочерк. политехн. ин-т. -Новочеркасск, 1992. - 109 с.

References

1. Tanenbaum Je. Raspredelennye sistemy. Principy i paradigmy [The distributed systems. Principles and paradigms]. SPb.: Piter, 2003. 877 p.

2. Wiesmann M., Pedone F., Schiper A., Kemme B., Alonso G. Database Replication Techniques: a Three Parameter Classification // Proc. 19-th {IEEE} Symp. on Reliable Distributed Systems. 2000. pp. 206-218.

3. Holliday J., Steinke R.., Agrawal D., Amr E. A. Epidemic Algorithms for Replicated Databases. IEEE Transactions on Knowledge and Data Engineering. 2003. Vol. 15, N. 3. pp. 1218-1238.

4. Chernomorov G.A. Teorija prinjatija reshenij: Uchebnoe posobie [Theory of decision-making: Manual]. Juzh.- Ros.gos. tehn.un-t.-3-e izd.pererab. i dop. Novocherkassk : Red. zhurn. «Izv. Vuzov. Jelektroomehanika», 2005. 448p.

5 Matveev V.F., Ushakov V.G. Sistemy massovogo obsluzhivanija. [Systems of mass service]. M.: Izd-vo MGU, 1984. 240 p.

6. Ckoba A.N., Sostina E.V. Inzenernyj vestnik Dona (Rus), 2015, №2 URL:ivdon.ru/ru/magazine/archive/n2y2015/2881.

7. Ckoba A.N., Sostina E.V. Inzenernyj vestnik Dona (Rus), 2015, №2 URL:ivdon.ru/ru/magazine/archive/n2y2015/2882.

8. Kovalevskij V.N., Vorob'jov S.P. Izv. vuzov. Sev.- Kavk. region. Tehn. nauki. 2015. № 2. pp. 23-29.

9. Zuev V.A., Kovalevskij V.N. Modelirovanie processov obrabotki informacii v raspredelennyh sistemah: uchebnoe posobie [Modeling of processing of information in the distributed systems: manual]. Juzh.-Ros. gos. politehn. un-t. Novocherkassk: JuRGPU (NPI) imeni M.I.Platova, 2015. 128 p.

10. Zuev V.A., Kovalevskij V.N., Chernomorov G.A. Programmnoe modelirovanie sistem: ucheb.posobie [Program modeling of systems: ucheb.posoby]. Novocherk. politehn. in-t. - Novocherkassk, 1992. 109 p.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ковалевский В.Н.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ковалевский В.Н.

Analitiko-chislennoye modeling of the distributed information systems with the low level of a network traffic

Текст научной работы на тему «Аналитико-численное моделирование распределенных информационных систем с низким уровнем сетевого трафика»