Научная статья на тему 'Анализ статистики временных интервалов между абонентскими запросами к узлу глобальной информационной сети'

Анализ статистики временных интервалов между абонентскими запросами к узлу глобальной информационной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
56
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ СЕТЬ / СИСТЕМА МАССОВОГО ОБСЛУЖИВАНИЯ / ВРЕМЯ МЕЖДУ ЗАПРОСАМИ / NETWORK / QUEUING SYSTEM / INTERARRIVAL TIME

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тамазян Араик Симакович, Богачёв Михаил Игоревич

Рассмотрена задача анализа временных интервалов между запросами абонентов к узлу глобальной информационной сети. Проведено статистическое исследование эмпирических данных интервалов времени между абонентскими запросами к узлу на примере двух различных HTTP-серверов. Предложена логнормальная модель распределения интервалов времени между абонентскими запросами и показано, что она более точно воспроизводит распределения эмпирических данных, чем традиционная пуассоновская модель, приводящая к экспоненциальным распределениям. Полученные результаты могут быть использованы при математическом моделировании информационных и инфокоммуникационных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тамазян Араик Симакович, Богачёв Михаил Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of interarrival time statistics in a wide area network node

Statistics of interarrival times analysis in a wide area network node are considered exemplified using emprical data from two HTTP-servers. A lognormal model of interarrival times distribution is suggested and compared with the traditional exponential model that is a result of the Poisson modeling. The results may be useful in wide area networks simulation.

Текст научной работы на тему «Анализ статистики временных интервалов между абонентскими запросами к узлу глобальной информационной сети»

3. Волков Л. Н., Немировский М. С., Шираков Ю. С. Системы цифровой радиосвязи. М.: Эко-Трендз, 2005. 392 с.

4. Valenti M. C., Cheng S. Iterative demodulation and decoding of Turbo-coded M-ary noncoherent orthogonal modulation // IEEE J. sel. areas commun. 2005. Vol. 23, № 9. P. 1739-1747.

5. Kang J., Stark W. Turbo codes for noncoherent FH-SS with partial band interference // IEEE Trans. on comm. 1998. Vol. 46, № 11. P. 1451 -1458.

6. Wilson S. G. Digital modulation and coding. New Jersey: Prentice hall, 1996. 621 p.

7. Прокис Дж. Цифровая связь. М.: Радио и связь, 2000. 260 c.

8. Nelder J. A., Mead R. A simplex method for function minimization // Computer J. 1965. № 7. P. 308-313.

9. Морелос-Сарагоса Р. Искусство помехоустойчивого кодирования - методы, алгоритмы, применение. М.: Техносфера, 2005. 320 с.

Nguyen Hoang Phuong, Dang Kim Ngoc, V. N. Smirnov Saint-Petersburg state electrotechnical university "LETI"

The simplified calculation of the characteristic of the incoherent turbo codes detector

The method for estimating of a log likelihood ratio in turbo codes iterative decoding on the basis of statistical characteristics of incoherent detection is offered. Simulation results are showed that new approximation reduces of decoding complexity with insignificant lowering of its quality.

Turbo code, noncoherent detection, log likelihood ratio

Статья поступила в редакцию 21 февраля 2013 г.

УДК 519.872, 004.77

А. С. Тамазян, М. И. Богачёв Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В. И. Ульянова (Ленина)

Анализ статистики временных интервалов между абонентскими запросами к узлу глобальной информационной сети

Рассмотрена задача анализа временных интервалов между запросами абонентов к узлу глобальной информационной сети. Проведено статистическое исследование эмпирических данных интервалов времени между абонентскими запросами к узлу на примере двух различных HTTP-серверов. Предложена лог-нормальная модель распределения интервалов времени между абонентскими запросами и показано, что она более точно воспроизводит распределения эмпирических данных, чем традиционная пуассоновская модель, приводящая к экспоненциальным распределениям. Полученные результаты могут быть использованы при математическом моделировании информационных и инфокоммуникационных систем.

Информационная сеть, система массового обслуживания, время между запросами

Глобальные информационные сети предназначаются для обработки, хранения и передачи данных. Они охватывают большие территории и имеют в своем составе большое число абонентов. Такая сеть состоит из множества связанных между собою сетевых узлов. Глобальные информационные сети, в особенности ориентированные на неограниченный круг потребителей, можно рассматривать как системы массового обслуживания (СМО). Неотъемлемой частью эффективного и надежного функционирования сети является оптимизация ее ре-

сурсов по критерию минимизации вероятности отказа в обслуживании абонента с учетом ограниченной пропускной способности узлов и каналов.

В теории СМО рассматриваются динамические системы, предназначенные для эффективного обслуживания случайного потока заявок при ограниченных ресурсах системы. Основными характеристиками любой СМО, с помощью которых она может быть однозначно задана, являются входящий поток требований (запросов), структура системы обслуживания, время обслуживания каждым кана-

© Тамазян А. С., Богачёв М. И., 2013

лом, дисциплины ожидания, очереди и обслуживания. Структура СМО состоит из одного или нескольких обслуживающих устройств - каналов. Каждый канал, в общем случае, состоит из прибора обслуживания и накопителя [1].

При моделировании СМО используются пуас-соновские и непуассоновские модели [1]. Пуассо-новская модель СМО является классической в теории массового обслуживания и широко применяется на практике. В этой модели время между запросами абонентов и время их обслуживания распределены по экспоненциальному закону [1]. Однако согласно эмпирическим исследованиям (см., напр., [2], [3]) пуассоновские модели СМО в недостаточной степени учитывают статистические характеристики потоков данных в глобальных информационных сетях. Между тем точность моделирования таких систем довольно важна, так как результаты моделирования широко используются для решения задач прогнозирования перегрузок в системе, оптимизации перегрузочного управления и др. (см., напр., [4], [5]). В связи с этим предпринимаются попытки описания распределения эмпирических данных с помощью типовых распределений, используемых для описания интервалов между запросами в различных СМО (см., напр., [6]).

Целью настоящей статьи является эмпирическое исследование параметров работы СМО на примере анализа данных об интервалах времени между запросами абонентов двух различных HTTP-серверов. Из этих данных получены последовательности интервалов между запросами абонентов, для которых построены эмпирические функции распределения.

Рассмотрим два закона распределения: пуас-соновский, характеризуемый экспоненциальной

функцией распределения F (x) = 1 - e (l - интенсивность (параметр распределения)), и лог-нормальный с функцией распределения

F(x) = 12 + (12)erf (lnx-|j,)/лба2 ,

2 f -t 2

где erf(z )=I e dt - функция ошибки; ц -

логарифмическое математическое ожидание; о - логарифмическое среднеквадратическое отклонение.

Вначале рассмотрим данные интервалов времени между абонентскими запросами HTTP-сервера университета г. Калгари. Построена эмпирическая функция F'(х) = 1 -F(х) распределения интервалов между запросами т (рис. 1, сплошная линия), которая аппроксимирована логнормальным рас-

F'

10"

10"

10"

10"

- \

- \\

1 1 1 U

100 101 102 103 104 т, с

2000 4000 8000 х б

Рис. 1

пределением (рис. 1, а, штриховая линия) и экспоненциальным распределением, соответствующим пуассоновской модели СМО (рис. 1, а, пунктирная линия) с одинаковыми средними значениями.

Оценки параметров моделей составили:

- для экспоненциальной модели 1 = 0.02;

- для логнормальной модели (1 = 2 и о = 2.

Определим доверительный интервал для математического ожидания логнормальной модели. Ввиду большого объема выборки данных воспользуемся асимптотическим представлением, при котором данные считаются распределенными по нормальному закону [7]. В таком случае границы доверительного интервала рассчитываются как

ЬСЬц = 1 - о2/п; где ЬСЬ

UCLj = j + ty а

, иСЬц - нижняя и верхняя границы

доверительного интервала для 1 соответственно;

( - квантиль распределения Стьюдента с (п — 1) степенями свободы для двухстороннего значения а = 0.10; п - объем выборки данных.

С учетом доверительного интервала оценка математического ожидания составила (1 = 2 ± 0.03.

Сравним точность описания традиционной экспоненциальной и логнормальной моделями распределения интервалов времени между абонентскими запросами эмпирических данных. Для этого рассчитаем для обеих моделей два информационных критерия - критерий Акаике (А1С) и байесовский критерий (информационный критерий Шварца, В1С).

Указанные критерии применяются для выбора одной модели из нескольких предложенных. Они учитывают качество приближения модели к реальным данным и предусматривают систему штрафов за использование излишнего числа параметров в модели [8] и [9], причем штраф в байесовском критерии выше, чем в критерии Акаике. Наилучшей моделью полагается та, для которой значения этих критериев минимальны.

2

3

0

а

Значение информационного критерия Акаике определялось как А1С = — 21п Ь + 2к, где Ь - максимизированное значение функции правдоподобия; к - число параметров в статистической модели.

Байесовский информационный критерий рассчитан как В1С = —21п Ь + к 1п п , где п - объем выборки данных.

В результате расчетов установлено, что значения обоих критериев для логнормальной модели на 17 % меньше, чем для экспоненциальной модели.

Точность логнормальной модели показывает построенный для нее QQ-график, приведенный на рис. 1, б. На этом графике по оси абсцисс отложены квантили распределения логнормальной модели Т, а по оси ординат - квантили распределения эмпирических данных Т. Штриховая линия соответствует совпадению теоретических и экспериментальных данных (идеальная ситуация), сплошная -соотношение между теоретическими и экспериментальными результатами. По графику видно, что кривые идеального и эмпирического распределений в целом близки, что свидетельствует об удовлетворительной точности логнормальной модели.

По аналогичному алгоритму проведен анализ данных НТТР-сервера университета шт. Саскаче-ван. Результат приведен на рис. 2, а, где сплошной линией показана эмпирическая функция распределения исходных данных, штриховой - ее аппроксимация логнормальным распределением, а пунктирной - экспоненциальное распределение с тем же средним значением.

Оценки параметров моделей составили:

- для экспоненциальной модели 1 = 0.1;

- для логнормальной модели | = 1.3 и о = 1.3.

С учетом доверительного интервала математическое ожидание в логнормальной модели составило | = 1.3 ± 0.02. Аналогично предыдущему слу-

Рис. 2

чаю оба критерия точности описания указывают на преимущество логнормальной модели. Точность логнормальной модели показывает построенный для нее QQ-график (рис. 2, б). На нем кривые лог-нормального (сплошная) и эмпирического (штриховая) распределений в целом близки, что свидетельствует, как уже отмечалось, об удовлетворительной точности логнормальной модели.

На основе результатов, полученных в ходе сравнения традиционной экспоненциальной и лог-нормальной моделей распределения интервалов времени между абонентскими запросами в СМО, следует сделать вывод о том, что логнормальная модель точнее описывает распределение эмпирических данных, чем традиционная экспоненциальная модель. Полученные результаты могут быть использованы при моделировании узлов информационных систем, таких как СМО, в том числе при решении задач оптимизации ресурсов узла и уточненной оценки вероятности возникновения перегрузки или отказа в обслуживании. Следует отметить, что помимо распределения интервалов времени между абонентскими запросами важное значение имеют корреляционные свойства последовательности интервалов, учет которых в дополнение к распределению потенциально позволяет повысить точность моделирования трафика [10].

СПИСОК ЛИТЕРАТУРЫ

1. Шелухин О. И., Текняшев А. М., Осин А. В. Моделирование информационных систем. М.: САЙНС-ПРЕСС, 2005. 368 с.

2. On the self-similar nature of Ethernet traffic (extended version) / W. Leland, M. Taqqu, W. Willinger, D. Wilson // IEEE/ACM Trans. on Networking. 1994. Vol. 2, № 1. P. 1-15.

3. Paxson V., Floyd S. Wide area traffic: the failure of Poisson modeling // IEEE/ACM Trans. on Networking. 1995. Vol. 3, № 3. P. 226-244.

4. Bogachev M. I., Bunde A. On the occurrence and predictability of overloads in telecommunication

networks // Europhysics Letters. 2009. Vol. 86, № 6. P. 66003(1-6).

5. Богачёв М. И. Статистический анализ и прогнозирование динамики случайных процессов в телекоммуникационных сетях с использованием муль-тифрактальных моделей трафика // Изв. вузов России. Радиоэлектроника. 2008. Вып. 2. С. 34-45.

6. Kleban S., Clearwater S. Hierarchical dynamics, in-terarrival times and performance // Supercomputing. 2003 ACM/IEEE Conf., 15-21 Nov. 2003, Phoenix, Arizona. Phoenix, Arizona: ACM/IEEE, 2003. P. 28.

7. Parkin T., Chester S., Robinson J. Calculating confidence intervals for the mean of a lognormally distrib-

uted variable // Soil science society of America. 1990. Vol. 54, № 2. P. 321-326.

8. Akaike H. A new look at the statistical model identification // IEEE Trans. on autom. control. 1974. Vol. AC-19, № 6. P. 716-723.

A. S. Tamazian, M. I. Bogachev Saint-Petersburg state electrotechnical university "LETI"

9. Schwarz G. Estimating the dimension of a model // The annals of statistics. 1978. Vol. 6, № 2. P. 461 -464.

10. Богачёв М. И., Гайворонский Д. В., Маркелов О. А. Прогнозирование выбросов трафика в многопользовательских информационных сетях // Радиотехника. 2012. № 7. С. 18-23.

Analysis of interarrival time statistics in a wide area network node

Statistics of interarrival times analysis in a wide area network node are considered exemplified using emprical data from two HTTP-servers. A lognormal model of interarrival times distribution is suggested and compared with the traditional exponential model that is a result of the Poisson modeling. The results may be useful in wide area networks simulation.

Network, queuing system, interarrival time

Статья поступила в редакцию 21 мая 2013 г.

УДК 621.391

А. С. Васьков, Б. И. Смирнов Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В. И. Ульянова (Ленина)

Использование пакета Proteus для проектирования виртуальных моделей микропроцессорных устройств

Описан набирающий популярность пакет Proteus Design suite для проектирования виртуальных моделей цифровых устройств. Приведена структура пакета, рассмотрены основные особенности и преимущества по сравнению с конкурентными решениями, а также проблема согласования цифровых и аналоговых устройств.

Proteus, виртуальная модель, проектирование микроконтроллеров, программирование, симуляция, пакет проектирования, VSM, подготовка специалистов

Proteus 7.8 SP2 является коммерческим программным пакетом класса САПР, разработанным компанией "Labcenter Electronics". Основная особенность пакета - предоставление сравнительно простого, но функционального инструмента для разработки устройств на основе микроконтроллеров (МК) различных типов. Использование МК позволяет значительно упростить способы создания сложных устройств, а также экономить место и энергопотребление. Например, сигнальные процессоры надолго завоевали рынок аппаратов мобильной связи, фотоаппаратов и даже устройств, анализирующих состояние здоровья в режиме реального времени. Для последнего сегмента наиболее популярен процессор DSPIC33F за счет удобной архитектуры, развитой и быстрой системы АЦП1. Ука-

1 Sankman J. Microchip technology. Transitioning analog to digital in medical designs // URL: http ://medsmagazine. com/2011/03/transitioning-from-analog-to-digital-in-medical-designs

занный процессор, как и многие другие (новые МК на базе технологий AVR, ARM и PIC и сравнительно старые МК-устройства, такие как /8051, Z80, /8086), входит в базовый состав библиотек Proteus и доступен для анализа и симуляции. Также в библиотеке имеется ряд аналоговых элементов, которые делают пакет очень удобным для проектирования и образовательных целей.

Структура пакета. Proteus делится на два взаимосвязанных приложения: Intelligent schematic input system (ISIS) и Advanced routing and editing software (ARES)2. Proteus ISIS представляет собой среду моделирования и симуляции и основан на технологии виртуальной системы моделирования (Virtual System Modeling - VSM), а ARES - среду для компоновки и трассировки печатных плат. Це-

2

Proteus design suite, product guide / Labcenter electronics // URL: http://downloads.labcenter.co.uk/proteus7brochure.pdf

© Васьков А. С., Смирнов Б. И., 2013

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.