УДК 621.394.343
DOI: 10.24412/2071-6168-2022-2-385-391
ОБРАБОТКА И УЧЕТ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК МУЛЬТИМЕДИЙНОГО ТРАФИКА
С.М. Одоевский, М.И. Рафальская, И.В. Степанец
В современных мультисервисных сетях важное значение имеет учет статистических характеристик мультимедийного трафика. В данной статье сравниваются выборки мультимедийного трафика с теоретическим экспоненциальным распределением., а также с распределениями Парето и Вейбулла, которые сравниваются между собой.
Ключевые слова: мультисервисная сеть связи, мультимедийный трафик, самоподобный трафик, коэффициент Херста.
Развитие современных мультисервисных сетей, их интеграция и сближение с IT-технологиями, бурный рост технологий и широкое внедрение их сервисов постоянно увеличивает требования к пропускной способности мультисервисных сетей, вносят изменения в структуру обслуживаемого трафика. Появляется необходимость пересмотра алгоритмов управления и глубокого изучения структуры трафика современных мультисервисных сетей. Изучение его структуры и поведения в реальных условиях позволит внести необходимые коррективы в уже существующие модели современного трафика. Многочисленные исследования мультимедийного трафика в мультисервисных сетях показывают, что он обладает свойствами самоподобия.
В мультисервисных сетях обслуживается трафик разных видов, поэтому для обеспечения приемлемого качества необходимо применять дифференцированное обслуживание разнородного трафика. Интересным представляется статистический анализ характеристик мультимедийного трафика на предмет законов распределения его параметров, последующий учет которых позволит определить наилучший алгоритм обеспечения качества обслуживания.
Тестирование программных средств анализа статистических характеристик мультимедийного трафика. Для эффективного управления сетевыми механизмами в устройствах коммутации современных мультисервисных сетей важное значение имеет учет статистических характеристик обслуживаемого мультимедийного трафика. Исходными данными для определения указанных характеристик являются текущие статистические выборки потока данных, поступающих на отдельные порты устройств коммутации в виде всех или отдельных разновидностей пакетов.
Для получения указанных выборок могут использоваться различные сетевые анализаторы, в частности, программа Wireshark [1]. Данная программа является мощным сетевым анализатором, который позволяет полностью просматривать содержимое пакетов на всех уровнях. Все пакеты перехватываются в реальном времени и предоставляются в удобном для чтения формате. Программа поддерживает очень мощную систему фильтрации, подсветку цветом, и другие особенности, которые помогают найти нужные пакеты.
Однако выполнить оценку статистических характеристик трафика данная программа не позволяет. В то же время она предоставляет возможность выгрузить измеренные параметры всех перехваченных пакетов в табличном виде во внешний файл и обработать другими программными средствами. В качестве такого программного средства, в частности, может выступать табличный процессор Excel, имеющий встроенные функции математической статистики.
Достаточно полной статистической характеристикой трафика является функция распределения интервалов времени между моментами прихода очередных пакетов. Чаще всего в пакетных сетях предполагается, что в качестве такой функции выступает экспоненциальное распределение, определяемое только одним параметром - средней интенсивностью Л или обратной величиной интенсивности т=1/Л- средним интервалом времени между моментами прихода очередных пакетов. При этом для динамического управления сетевыми механизмами достаточно контролировать указанную среднюю интенсивность.
Однако в современных мультисервисных сетях статистические характеристики мультимедийного трафика отличаются от характеристик трафика с экспоненциальным распределением [2]. Многочисленные современные исследования мультимедийного трафика свидетельствуют о том, что он обладает свойством самоподобия. Для прогнозирования качества обслуживания самоподобного трафика в устройствах коммутации мультисервисной сети необходи-
385
мо, в частности, знать функциональную зависимость q(p) прогнозируемого относительного среднего времени ожидания q, нормированного к среднему времени обслуживания гоб=1//, равному обратной величине интенсивности обслуживания /и, от интенсивности входной нагрузки p = А//, с учетом дополнительной (доступной или предполагаемой) информации об особенностях входного, в частности, самоподобного трафика. [3]
Традиционным дополнительным параметром самоподобного трафика является коэффициент (параметр) Хёрста H, который может принимать значения в диапазоне 0.5 < H < 1. При этом значению H = 0.5 соответствует простейший (несамоподобный) поток с экспоненциальным распределением интервалов времени между моментами поступления очередных пакетов.
Одной из самых популярных моделей самоподобного трафика является модель типа fbm (от англ. fractal brownian motion - фрактальное броуновское движение). Для данной модели известны аналитические функциональные зависимости q(p,H) при детерминированном (D) и экспоненциальном (M) распределении времени обслуживания в одноканальных системах массового обслуживания (СМО) вида fbm/D/1 и fbm/M/1. При H > 0.5 самоподобный трафик в области даже относительно невысокой нагрузки p > 0.4 приводит к значительному увеличению относительного среднего времени ожидания q(p).
Для моделирования самоподобного трафика кроме модели fbm могут использоваться многие другие распределения с «длинными хвостами». Наиболее популярными являются распределения Парето (P - Pareto) и Вейбулла (W - Weibull). Точные аналитические выражения для расчета зависимости q(p,H), для СМО типа P/M/1 или P/D/1, а также W/M/1 или W/D/1, т.е. при поступлении на вход устройства коммутации потоков данных, описываемых распределениями Парето (P) и Вейбулла (W), не известны, но встречаются приближенные эмпирические аналитические зависимости, в частности, для P/M/1 [4].
В отличие от экспоненциального распределения, которое однозначно определяется одним параметром k=1/A распределения Вейбулла и Парето являются двухпараметрическими, т.е. зависят от двух параметров a и k (табл. 1 первая строка), однозначно связанных с параметрами А и H (табл. 1 вторая строка).
Для проверки различимости указанных распределений средствами анализа статистических характеристик Excel были сгенерированы три выборки объемом 10000 с помощью генератора псевдослучайных чисел с равномерным распределением и обратных функций, соответствующих трем указанным выше распределениям (табл. 1 третья строка).
Таблица1
Взаимосвязь параметров потоков данных и параметров распределений, используемых __для моделирования этих потоков_
Параметры Распределение
E P W
Функция распределения '-(к)
Параметры потока и распределения т-1 | ^ N а = 3-2Н\ а - 1 к = —г ал а = 2- 2Н;
Обратная функция х = Р~1(у) х = -к • 1п(у) II tril- x = kaJ-ln(y)
y - случайная величина с равномерным распределением F(y) = y,ye(0,1]
Для проверки степени соответствия полученных статистических выборок, выступающих в роли тестовых выборок мультимедийного потока данных с неизвестным распределением, каждому из трех предполагаемых теоретических распределений были использованы критерии согласия Пирсона (%2 - хи-квадрат) и Колмогорова [5,6].
Рассчитанные по формулам в табл. 1 при Л=1 значения параметров Пи к при генерации выборок задавались равными:
для распределения Парето: a =2, &=0.5 при H=0.5 и a=1.5, ^0.33 при H=0.75, для распределения Вейбулла: a=1, к=1 при H=0.5 и a=0.5, к=0.5 при H=0.75.
Для экспоненциального распределения задавался только один параметр
k=1A,=L
Количество «карманов» для гистограмм было выбрано равным 20. Рассчитанный по формулам в Excel критический уровень %2кр, соответствующий этому числу карманов с уровнем значимости a = 0.95, получился равным х2кр= 30.14. Статистика Колмогорова вычислялась по всей выборке без предварительного построения гистограмм. Пороговое значение Колмогоровой статистики с тем же уровнем значимости a = 0.95, получилось равным Ka =1.36.
На рис. 1-5 приведены построенные графическими средствами Excel гистограммы для сгенерированных выборок с экспоненциальным распределением и распределениями Парето и Вейбулла при двух значения параметра Хёрста для последних двух распределений.
Результаты расчета значений двух критериев согласия и Колмогорова) для разных пар истинных и предполагаемых распределений (округленные до двух-трех значащих цифр) при двух значениях параметра Хёрста приведены в табл. 2-5.
Гистограмма
4000 3000
* 1000
йтгг
I I I I I I I I I I I I I I I I I I I г~
2000 00 0
& &
о" v v o,V Oj? с,0 <ь? л" <ь?
Карман
150,00% 100,00% 50,00%% 0,00%
Частота
Интегральный %
Рис. 1. Гистограмма для выборки с экспоненциальным распределением
Гистограмма
4000 г 3000 ¡3 2000
0
120,00% 100,00% 80,00% 60,00% 40,00% 20,00% 0,00%
t>
qS? <$> ЛР <§>' ср
кр 4? <$>
or v 'v V <СР <Ь;
bV о?4
Частота
Интегральный %
г" V
W <}«'
Карман
Рис. 2. Гистограмма для выборки с распределением Вейбулла при H=0.5
Гистограмма
10000 8000 6000 4000 2000 0
~~1-1-1-1-Г"
105,00%
100,00%
95,00%
90,00%
85,00%
80,00%
75,00%
<£> /у & J? ¿Р ^
V о® <\? ^ ф?
Карман
Частота
Интегральный %
Рис. 3. Гистограмма для выборки с распределением Вейбулла при H=0.75
387
Гистограмма
10000 8000 6000 102,00% 100,00% 98,00%% 96,00%% 94,00%% 92,00%% 90,00%
(б 1-о
и (б Т 4000 2000 0 1 Частота
<Л> & & /Л # ^ (У ^ Л с& оУ ¿У ^ о."5 Л°> £ & ¿с? ^ ^ ^ «А* л^ л* ^ Ф & о^1 ф —^—Интегральный %
Карман
РЫс. 4. Гистограмма для выборки с распределением Парето при Н=0.5
Гистограмма
12000 100,50%%
10000 100,00%%
а 1- 8000 яг"^ 99,50%%
о н и 6000 99,00%%
а Т 4000 2000 щ 98,50%% 98,00%% Частота
0 97,50%%
^ о^ $ Ж $ ^ Л* ф О* ^ лГ # Л? —■—Интегральный %
Карман
Рис. 5. Гистограмма для выборки с распределением Парето при Н=0.75
Таблица 2
Значения X2 при Н=0.5_
Истинное распределение П редполагаемое распределение
Экспоненциальное Вейбулла Парето
Экспоненциальное 14, 2 14, 2 да
Вейбулла 14, 2 14, 2 да
Парето 49.8108 49.8108 14,1
Таблица 3 начения Колмогоровой статистики при Н=0.5
Истинное распределение П редполагаемое распределение
Экспоненциальное Вейбулла Парето
Экспоненциальное 0,924 0,924 39,7
Вейбулла 0,924 0,924 39,7
Парето 39,3 39,3 0,924
Таблица 4 Значения X при Н=0.75
Истинное распределение П редполагаемое распределение
Экспоненциальное Вейбулла Парето
Экспоненциальное 14,2 4,0.104 да
Вейбулла 4,11012 21,7 917,2
Парето 9,91031 510,8 19,8
Значения критериев согласия в диагональных клетках табл. 2-5 соответствуют результатам сравнения случайных выборок с теоретическими распределениями, по которым они и генерировались. Все они оказались в пределах допустимых значений для обоих критериев - и Пирсона Хкр = 30.14, и Колмогорова К =1.36. Этого следовало ожидать, и лишь подтвердило правильность работы использованных генераторов случайных чисел для всех трех функций распределения при обоих значениях параметра Хёрста.
Таблица 5
Значения Колмогоровой статистики при Н=0.75_
Истинное распределение П редполагаемое распределение
Экспоненциальное Вейбулла Парето
Экспоненциальное 0,924 28,4 29,2
Вейбулла 29,1 0,923 56,1
Парето 28,3 55,8 0,924
Подтвердилось также ожидаемое совпадение гистограмм (рис. 1 и 2) и допустимых значений критериев согласия при сравнении выборок экспоненциального распределения с теоретическим распределением Вейбулла и наоборот - выборки с распределением Вейбулла с теоретическим экспоненциальным распределением при Н=0.5 (табл. 2 и 3).
А вот распределение Парето даже при отсутствии самоподобия (при Н=0.5) заметно отличается даже визуально, судя по гистограмме (рис. 4), от экспоненциального и совпадающего с ним распределения Вейбулла (рис. 1 и 2). Это подтверждается численно огромным (по величине X - практически бесконечным) значением критериев согласия при сравнении выборок экспоненциального (и Вейбулла) распределения с теоретическим распределением Парето и наоборот - выборки с распределением Парето с теоретическим экспоненциальным (и Вейбулла) распределением (табл. 2 и 3).
Следует отметить, что бесконечные значения в последней колонке табл. 2 связаны с особенностью размера первого кармана выборки с экспоненциальным распределением, который оказался меньше минимального значения (равного к) случайных чисел при распределении Паре-то, а, следовательно, с нулевым значением теоретической плотности функции распределения, на которое, согласно правилу вычисления первого слагаемого, делится квадрат разности ожидаемого и имеющегося заполнения кармана.
При Н=0.75 распределение Вейбулла уже заметно отличается от экспоненциального распределения (не зависящего от Н), что подтверждается и визуально (сравнением рис. 1 и 3), и численно очень большими значениями критериев согласия при сравнении выборок экспоненциального распределения с теоретическим распределением Вейбулла и наоборот - выборки с распределением Вейбулла с теоретическим экспоненциальным распределением (табл. 5, 6).
Распределение Парето отличается от экспоненциального при Н=0.75 еще больше, чем при Н=0.5, но не так сильно, как от распределения Вейбулла при Н=0.75. При этом, следует отметить, что бесконечное значение X в верхней клетке последней колонки табл. 4 в данном случае связано не с особенностью размера первого кармана (он в данном случае превысил минимальное значение случайных чисел при распределении Парето), а с практически нулевыми значениями теоретической плотности функции распределения большинства остальных карманов (начиная с третьего) из-за появившегося очень «длинного хвоста» распределения Парето.
Из приведенных в табл. 5 результатов следует, что, сравнивая выборки мультимедийного трафика с теоретическим экспоненциальным распределением с помощью обоих критериев согласия легко обнаружить самоподобный трафик по очень большому значению этих критериев. Более чувствительным к самоподобию является критерий X Пирсона. Причем по величине этого критерию (пусть и очень большого) он дополнительно позволяет различить выборки с распределением Вейбулла и Парето. Критерий Колмогорова этого различия практически не замечает. Но он позволяет (впрочем, как и критерий X) отличить выборки с распределением Вейбулла от выборок с распределением Парето, если в качестве предполагаемого (теоретического) распределения использовать одно из этих распределений.
Заключение. В данной статье в роли мультимедийного самоподобного трафика рассматривались потоки с экспоненциальным распределением, также с распределениями Парето и Вейбулла, которые сравнивались по критериям согласия (Пирсона и Колмогорова) как с обычным Пуассоновским трафиком с экспоненциальным распределением, так и между собой. С по-
мощью этих критериев самоподобный трафик можно с легкостью обнаружить по большому значению. Установлено, что критерий Пирсона более чувствителен к самоподобию, нежели критерий Колмогорова.
Список литературы
1. Электронная энциклопедия. [Электронный ресурс] URL: http://www.wireshark.org (дата обращения: 10.02.2022).
2. Шелухин О.И., Осин А.В., Смольский С.М. Самоподобие и фракталы. Телекоммуникационные приложения. М.: Физматлит, 2008. 368 с.
3. Одоевский С.М., Хоборова В.П. Методы прогнозирования качества обслуживания самоподобного трафика в устройствах коммутации мультисервисной сети // Труды учебных заведений связи. 2017. Том 3. № 3. С. 86-92.
4. Бусыгин А.В., Одоевский С.М. Аналитическая модель обслуживания мультимедийного трафика с распределением Парето на основе аппроксимации результатов имитационного моделирования // Системы управления, связи и безопасности. 2020. № 1. С. 74-108.
5. Мартынов Г.В. Статистические критерии, основанные на эмпирических процессах, и связанные с ними вопросы. Итоги науки и техн. Сер. Теор. вероятн. Мат. Стат. Теор. Кибернет, 1992. Том 30. С. 6-112.
6. Градов В.М., Овечкин Г.В., Овечкин П.В., Рудаков И.В. Компьютерное моделирование. М.: КУРС: ИНФРА-М, 2019. 264 с.
Одоевский Сергей Михйлович, д-р техн. наук, профессор, odse2017@mail.ru, Россия, Санкт-Петербург, Военная академия связи им. С.М. Буденного,
Рафальская Маргарита Игоревна, адъюнкт, margo-23@bk.ru, Россия, Санкт-Петербург, Военная академия связи им. С.М. Буденного,
Степанец Ирина Валерьевна, аспирант, stepanets.irina@gmail.com, Россия, Санкт-Петербург, Санкт-Петербургский государственный университет телекоммуникаций им. М.А. Бонч-Бруевича
PROCESSING AND ACCOUTING OF STATISTICAL CHARACTERISTICS OF MULTIMEDIA
TRAFFIC
S.M. Odoevsky, M.I. Rafalskaya, I.V. Stepanets
In modern multiservice networks, it is important to take into account the statistical characteristics of multimedia traffic. This article compares samples of multimedia traffic with a theoretical exponential distribution, as well as with Pareto and Weibull distributions, which are compared with each other.
Key words: multiservice communication network, multimedia traffic, self-similar traffic, Hurst coefficient.
Odoevsky Sergey Mihailovich, doctor of technical sciences, professor, odse2017@mail.ru, Russia, Saint-Petersburg, Military academy of communication,
Rafalskaya Margarita Igorevna, postgraduate, margo-23@bk.ru, Russia, Saint-Petersburg, Military academy of communication,
Stepanets Irina Valerievna, postgraduate, stepanets. irina@gmail. com, Russia, Saint-Petersburg, St. Petersburg State University of Telecommunications named after M.A. Bonch-Bruevich