Научная статья на тему 'Оценка эффективного времени обслуживания пользователей в узле глобальной информационной сети'

Оценка эффективного времени обслуживания пользователей в узле глобальной информационной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
38
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЕ СЕТИ / INFORMATION NETWORK / ТЕЛЕКОММУНИКАЦИОННЫЙ ТРАФИК / TELECOMMUNICATION TRAFFIC / ВРЕМЯ ОБСЛУЖИВАНИЯ / SERVICE TIME / ОЦЕНКА ПАРАМЕТРОВ / PARAMETER ESTIMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тамазян Араик Симакович, Богачёв Михаил Игоревич

Рассмотрена оценка эффективного времени обслуживания пользовательских запросов в узле глобальной информационной сети. Проведено статистическое исследование эмпирических данных времени обслуживания пользовательских запросов на примере двух различных HTTP-серверов. Предложена q-гаус­совская модель распределения логарифмов времен обслуживания пользователей и показано, что она более точно отражает свойства распределения эмпирических данных, нежели более широко применяемое гауссовское распределение. Полученные результаты могут использоваться при имитационном моделировании информационных сетей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тамазян Араик Симакович, Богачёв Михаил Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Estimation of user service times by wide area network node

Estimation of user service times by a wide area network node is considered. exemplified using empirical data from two HTTP-servers. Statistical research of empirical data of a holding time of user queries on the example of two different HTTP-servers is conducted. A q-gaussian model of service times logarithms is suggested and it is shown that it better describes empirical data than traditional Gaussian model. The results may be useful in wide area networks simulation.

Текст научной работы на тему «Оценка эффективного времени обслуживания пользователей в узле глобальной информационной сети»

УДК 519.21, 004.77

А. С. Тамазян, М. И. Богачев Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В. И. Ульянова (Ленина)

Оценка эффективного времени обслуживания пользователей в узле глобальной информационной сети

Рассмотрена оценка эффективного времени обслуживания пользовательских запросов в узле глобальной информационной сети. Проведено статистическое исследование эмпирических данных времени обслуживания пользовательских запросов на примере двух различных НТТР-серверов. Предложена щ-гаус-совская модель распределения логарифмов времен обслуживания пользователей и показано, что она более точно отражает свойства распределения эмпирических данных, чем более широко применяемое гауссовское распределение. Полученные результаты могут использоваться при имитационном моделировании информационных сетей.

Информационные сети, телекоммуникационный трафик, время обслуживания, оценка параметров

В современном мире широко распространены информационные сети обработки, хранения и передачи данных. К таким сетям предъявляются высокие требования по эффективности и надежности работы. Для удовлетворения указанных требований необходимо оптимизировать ресурсы сети по критериям минимизации вероятности отказа в обслуживании и уменьшения времени обслуживания пользователей с учетом ограниченной пропускной способности узлов и каналов. Одним из важных этапов является оптимизация алгоритмов управления ресурсами сети, которую наиболее удобно выполнять с использованием средств имитационного моделирования, поэтому задача создания адекватных моделей динамики сетевого трафика является актуальной.

В рамках имитационного моделирования узел информационной сети можно рассматривать как систему массового обслуживания (СМО) [1]. Классической моделью СМО является модель с пуассо-новским входным потоком и временем обслуживания, распределенным по экспоненциальному закону. В ряде работ (см., напр., [2], [3]) показано, что пуассоновские модели крайне неточно отражают статистические характеристики потоков данных в глобальных информационных сетях ввиду отличия распределения последних от экспоненциального. В качестве альтернативы могут быть использованы непуассоновские модели потоков данных [4], [5]. Помимо статистических свойств потока входных запросов важной характеристикой при моделировании загрузки узла информационной сети является время обслуживания пользователей [1].

© Тамазян А. С., Богачев М. И., 2013

Цель настоящей статьи - эмпирическое исследование статистических свойств времени обслуживания пользователей двух HTTP-серверов при условии фиксированной пропускной способности исходящего канала связи. Из-за высокого быстродействия сервера время обработки запроса считалось пренебрежимо малым по сравнению со временем передачи информации в канале связи, что позволило считать время обслуживания пользователей пропорциональным объему передаваемой пользователем информации.

Приведенные на рис. 1 временные диаграммы соответствуют реальным измерениям исходящего трафика узла глобальной информационной сети при пропускной способности исходящего канала 100 Мбит/с. Временная диаграмма на рис. 1 построена на основе данных посуточного исходящего трафика, измеренного на HTTP-сервере: а -университета г. Калгари (University of Calgary); б - университета штата Саскачеван (University of Saskatchewan)1.

Из данных трафика получены выборки объемов переданной пользователям информации. Далее рассчитаны значения времени обслуживания одиночного запроса пользователя (время обработки запроса сервером считается пренебрежимо малым): ts =v/c, где v - объем запрошенной пользователем информации; c = 100 Мбит/с -пропускная способность исходящего канала связи.

1 The internet traffic archive. URL: //http://ita.ee.lbl.gov

51

v, Мбайт 806040200

04.09.94

v, Мбайт

150 — 100 —

13.12.94

23.03.95

01.07.95

Дата

50 -

12.05.95

01.07.95

20.08.95

09.10.95

28.11.95

Дата

б

Рис.

Затем выборка значений времени обслуживания логарифмировалась, после чего подвергалась нормализации в соответствии с выражением z = = [lnts —lnts)где О - оператор усреднения;

cts - среднеквадратическое отклонение времени

обслуживания.

Далее для модуля нормализованных значений времени обслуживания |z| построены эмпирические функции распределения F'(x) = 1 - F (x). На рис. 2, а (сплошная линия) показана функция F'(x) для HTTP-сервера университета г. Калгари за период наблюдений с 24.10.1994 по 11.10.1995 гг., а на рис. 2, б (сплошная линия) - для HTTP-сервера университета штата Саскачеван за период наблюдения с 01.06 по 31.12.1995 г. Штриховыми линиями для сравнения показана функция распределения гауссовского (нормального) закона

F '(| z| ) = 1/2 - (1/2 )erf [(|z| -ц)/>/

2ст2

2 2

где erf (| z|) = —=• f e dt - функция ошибки; ц, о -yh 0

коэффициенты сдвига и масштаба соответственно.

Как видно из графиков на рис. 2, гауссовский закон распределения неточно описывает статистические свойства эмпирических данных. Также можно отметить, что "хвосты" этого распределения имеют степенную зависимость F'(|z|) = P (z > x) ~

~ |z| а при а = 4 (пунктирные линии).

Распределения эмпирических данных имеют медленно убывающие "хвосты", которые асимптотически стремятся к степенной зависимости. Статистические характеристики подобных распределений могут быть описаны с помощью д-распре-

F'

10-1 -

10-

10-3 -

10-4|-10-

F'

10-1 -

10-

10-3 -

10-4|-10-

Рис. 2

а

0

1

2

2

б

а

Р 0.6

0.4 0.2

Р 0.6

0.4 0.2 0

-4

-2

-6

-4

-2

Рис. 3

F'

10

10

10

10 10

F'

10-1 -

10-2 -

10-3 -

10-4h 10"

Рис. 4

делений, введенных в рамках теории обобщенной статистической механики [6]. Введем д-гауссов-ское распределение согласно [7], [8] для описания распределений эмпирических данных.

Плотность вероятности для д-гауссовского закона распределения имеет вид

\2

-B,

{x-V-q )

Р ( X )= Ыд ^ а функция распределения записывается как [8] Р(х) = Ыд • г[(1/2)(3 - д)р]/[2Г(р^х/й^р] +

+ (х -Цд ) 2Р1 (a, Р У, 5)}, где Ыд - коэффициент нормировки; д - коэффициент формы; ед =[1 + (1 - д( д)] - д-экс-понента; Вд, Цд - коэффициенты масштаба и сдвига соответственно;

го

2Р/ (а, р, у, 8)= X 8* (а)к (%/[к !(у)* ] к=0

- гипергеометрическая функция Гаусса (а = 0.5;

Р = У(д-1); У = 1.5; 8 = -Вд (д-1)(-х)2). При д = 1 д-экспонента переходит в обычную экспоненту: ед = ех, а д-гауссовское распределение - в

гауссовское. Коэффициент нормировки определяется как

Nq =

На рис. 3 графики плотности вероятности q-гауссовского закона распределения наложены на гистограммы величины z для исследуемых случаев. На рис. 3 представлены результаты для данных HTTP-серверов: а - университета г. Калгари; б -университета штата Саскачеван.

Результаты аппроксимации экспериментального распределения (сплошные линии) q-гаус-совским распределением (штриховые линии) приведены на рис. 4 для данных HTTP-серверов: а -университета г. Калгари; б - университета штата Саскачеван. Как видно из рис. 4, q-гауссовское распределение в целом хорошо отражает статистические свойства эмпирических данных. Некоторое расхождение между теоретическим и эмпирическим распределениями имеет место лишь для крайне больших значений z.

Таким образом, по результатам проведенного анализа эмпирических данных можно сделать вывод, что распределение логарифма времени обслуживания пользователя узлом глобальной информационной сети z может быть с большой точностью описано моделью на основе q-гауссов-ского распределения.

0

а

б

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

СПИСОК ЛИТЕРАТУРЫ

1. Шелухин О. И., Текняшев А. М., Осин А. В. Моделирование информационных систем. М.: САЙНС-ПРЕСС, 2005. 368 с.

2. The changing nature of network traffic: scaling phenomena / A. Feldmann, A. C. Gilbert, W. Willinger, T. G. Kurtz // ACM SIGCOMM computer communication review. 1998. Vol. 28, № 2. P. 5-29.

3. A multifractal wavelet model with application to network traffic / M. S. Crouse, R. H. Riedi, V. J. Ribeiro, R. G. Baraniuk // IEEE Trans. on information theory. 1999. Vol. IT-45, № 3. P. 992-1018.

4. Karagiannis T., Molle M., Faloutsos M. Long-range dependence ten years of Internet traffic modeling // IEEE internet computing. 2004. Vol. 8, № 5. P. 57-64.

A. S. Tamazian, M. I. Bogachev Saint-Petersburg state electrotechnical university "LETI"

5. Тамазян А. С., Богачев М. И. Анализ интервальных статистик между абонентскими запросами к узлу глобальной информационной сети // Изв. вузов России. Радиоэлектроника. 2013. Вып. 2. С. 35-38.

6. Tsallis C. Possible generalization of Boltzmann-Gibbs statistics // J. of statistical physics. 1988. Vol. 52, № 1-2. P. 479-487.

7. ^-distributions in complex systems: a brief review / S. Picoli Jr., R. S. Mendes, L. C. Malacarne, R. P. B. Santos // Brazilian J. of physics. 2009. Vol. 39, № 2A. P. 468-474.

8. Rak R., Drozdz S., Kwapien J. Nonextensive statistical features of the Polish stock market fluctuations // Physica A: statistical mechanics and its applications. 2007. Vol. 374, № 1. P. 315-324.

Estimation of user service times by wide area network node

Estimation of user service times by a wide area network node is considered. exemplified using empirical data from two HTTP-servers. Statistical research of empirical data of a holding time of user queries on the example of two different HTTP-servers is conducted. A q-gaussian model of service times logarithms is suggested and it is shown that it better describes empirical data than traditional Gaussian model. The results may be useful in wide area networks simulation.

Information network, telecommunication traffic, service time, parameter estimation

Статья поступила в редакцию 19 августа 2013 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.