Научная статья на тему 'Влияние активности пользователей сети Интернет на свойства мультисервисного трафика'

Влияние активности пользователей сети Интернет на свойства мультисервисного трафика Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
213
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ / ЖИДКОСТНАЯ МОДЕЛЬ / СЕТЕВОЙ ТРАФИК / САМОПОДОБИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гребенкин Михаил Константинович, Поршнев Сергей Владимирович

В рамках жидкостной модели сетевого трафика рассмотрено влияние параметров распределения вероятностей запросов пользователей на самоподобные свойства сетевого трафика в режиме обеспечения гарантированной скорости доступа к сети ИнтернетI

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гребенкин Михаил Константинович, Поршнев Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n terms of fluid model of network traffic the influence of users requests probability distribution parameters on self-similar properties of Internet traffic in rate-limit mode is considered.

Текст научной работы на тему «Влияние активности пользователей сети Интернет на свойства мультисервисного трафика»

-►

Телекоммуникационные системы и компьютерные сети

УДК 004.942

М.К. Гребенкин, С.В. Поршнев

ВЛИЯНИЕ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЕЙ СЕТИ ИНТЕРНЕТ НА СВОЙСТВА МУЛЬТИСЕРВИСНОГО ТРАФИКА

При решении многих практических задач требуются образцы сетевого трафика (при оптимизации загрузки канала передачи, проверке алгоритмов управления потоками данных, обеспечения качества обслуживания клиентов, при исследовании сетевых аномалий и средств их своевременного обнаружения и т. д.). В связи с тем, что в перечисленных выше задачах информация о содержании передаваемых сообщений не требуется, здесь можно ограничиться рассмотрением трафика, используя данные о размере каждого из пакетов и принадлежности их к тому или иному протоколу.

Полную информацию о входящем трафике, теоретически, можно получить путем перехвата и последующей обработки реального трафика конкретной компьютерной сети или использования файлов из существующих архивов трафика. Очевидными недостатками данного (сугубо эмпирического) подхода являются:

невозможность изменения в процессе моделирования параметров трафика, что требуется при рассмотрении различных режимов работы сети и ее конфигураций;

за пределами рассмотрения остается процесс формирования трафика, знание особенностей которого открывает возможность оптимального конфигурирования сетей и управления их работой.

В этих условиях представляется целесообразным использовать имитационное моделирование для более детального изучения процесса формирования и передачи потоков данных по современным телекоммуникационным каналам, которые в ряде случаев оказываются эффективными инструментами решения задач обеспечения качества обслуживания клиентов сети Интернет и выбора необходимых параметров для настройки сетевого оборудования.

Постановка задачи

В последнее время широкое распространение получили методы генерации «синтетического» трафика при помощи моделей, отличающихся друг от друга уровнем детализации (начиная с наиболее обобщенных формул и заканчивая генераторами, воссоздающими точные копии каждого из передаваемых в сеть пакетов). Основное требование, предъявляемое к трафику, полученному расчетным путем, очевидно: он должен быть максимально «похожим» на реальный трафик. В качестве количественной характеристики «похожести» систем обычно используют такие статистические свойства, как дисперсия, функция распределения и т. д. [1]. Априори можно ожидать, что согласованность данных показателей обеспечивает близость результатов моделирования прохождения пакетов с аналогичными показателями реальных современных сетей.

Одна из проблем моделирования трафика состоит в том, что в современных компьютерных сетях одновременно работает большое число (сотни) разных типов приложений [2], количество которых стремительно растет. Как следствие, на практике оказывается невозможным адекватно описать источники трафика, эквивалентные каждому из существующих приложений. В этой связи моделирование трафика на уровне явного описания каждого из конкретных приложений для современных высокоскоростных мультисервисных сетей представляется бесперспективным.

Отметим также, что известные пакетные си-муляторы трафика (например, сетевой симуля-тор NS-2) можно использовать только для моделирования каналов с умеренной пропускной способностью (потоки порядка 100 Мбит/^. Для высокоскоростных Интернет-каналов в последние годы был предложен принципиально иной

подход - непрерывные (жидкостные) модели, в которых скорость поступления пакетов считается непрерывной функцией времени, а значение этой функции находится путем интегрирования (обычно - численного) системы дифференциальных уравнений.

Однако оказывается, что известные непрерывные модели трафика с упрощенным описанием источников трафика позволяют получить только грубые оценки его характеристик, например, не удается понять истинные причины пульсаций интенсивности трафика в каналах передачи данных. Как следствие, не удается ответить на вопрос о связи величины данных пульсации с количеством пользователей и их профилями.

Для описания поведения пользователей в терминах частоты отправки запросов, объемов передаваемой и получаемой информации в [2] была предложена абстрактная модель источников трафика. Ее ключевая идея состоит в том, чтобы рассматривать потоки, которыми обмениваются по сети приложения, не на уровне отдельных пакетов, а более укрупненно - на уровне «модулей данных приложений» (МДП).

Здесь принципиальное значение имеет то обстоятельство, что информация о параметрах МДП рассматривается безотносительно к конкретным сетевым программам (производится усреднение по всем активным приложениям). Это в свою очередь освобождает от необходимости моделировать работу конкретных приложений в отдельности. Использование данного метода описания источников минимизирует недостатки жидкостной модели трафика и расширяет ее применимость.

Расчетная методика

В данной работе применена жидкостная модель трафика [2], в которой используются абстрактные сетевые источники, предложенные в [3].

В выбранной жидкостной модели скорость передачи данных считается непрерывной функцией времени, а значение этой функции находится путем интегрирования системы дифференциальных уравнений с запаздыванием [4], определяющей изменение со временем окна передачи данных по протоколу ТСР по i-му потоку W, а также длины очереди q на входе l-го канала:

dt ад 2

dq^t) dt

Л(r)•cг + Zи>•■4(0,

ie N,

hf(t) ~

где М - максимально допустимый размер окна; R. - время прохождения (оборота) данных от сервера к клиенту и обратно (Round Trip Time); A (t) - скорость поступления пакетов i-го потока на вход l-го канала; C 1 - пропускная способность l-го канала; hf (t) - ступенчатая функция, определяющаяся соотношением:

fl, если /(;)> 0, [0, если /(f) <0.

Зависимость скорости сброса пакетов i-го потока можно представить в виде (t) = ^ A1 (tl) • pl (tl), где суммирование про-

lGFt

изводится по всему пути прохождения сигнала, A (tl) - скорость поступления данных i-го потока на l-й узел, pt - вероятность сброса пакета.

В случае, если применяется предусмотренный некоторыми вариантами протокола ТСР алгоритм быстрого восстановления окна после потери пакетов, реальную скорость потерь Xi (t) следует заменить на эффективное значение A,i (t). Последнее можно интерпретировать как скорость поступления сигналов на уменьшение окна (сигналом к уменьшению размера окна передачи принято считать потерю одного или более пакетов в передаваемом окне). Значение (t) связано с реальной скоростью потерь Xi (t) следующим соотношением [4]:

-| я, (0Л ('-•«/W)

1-

1—

ад

Д. (г-ад).

ад

Скорость отправки пакетов i-го потока из l-го узла описывается выражением:

Aj(t), q,(t) = 0, D\(t) = \ A'(t~d)

jeN,

■C„ ql(t)> 0,

где d = узле.

q(t - d) C

задержка в очереди на этом

Скорость поступления пакетов /-го потока на 1-й узел равна скорости отправления из предшествующего узла pi (I):

Гад, 1=кц,

4(0 = 1 т

где l = кп обозначает конечный узел для /-го потока.

Если суммарный поток на входе в маршрутизатор £ Aj (t - d) превышает его пропускную

j^N,

способность Cl, то формируется очередь. При возникновении перегрузок на маршрутизаторе происходит сброс пакетов. Вероятность сброса пакета зависит от принятой политики предотвращения перегрузок. Например, при использовании алгоритма Drop Tail сброс пакетов происходит, если размер очереди превышает заданную длину буфера, следовательно, вероятность сброса пакетов на l-м узле можно представить в виде

р1 (f) = |0' при 4i(ti)<qmi' DT [1 при ?,аг)>?тг,

чему соответствует полная скорость сброса пакетов

yl (i) = j0' ПРИ eh(tl)<qml,

DT [АО,) при )>?„,,.

При этом сброс пакетов из разных потоков производится с вероятностью, равной относительному вкладу данного потока в суммарный поток

Al (t - d) £ Aj (t - d).

j^N,

В настоящее время наибольшее распространение получил режим работы пользователей, при котором им обеспечивается гарантированный уровень скорости доступа к сети Интернет CAR (Committed Access Rate). При этом основным инструментом, регулирующим скорость доступа пользователей к сети Интернет, является механизм ограничения скорости (Rate Limit) [5]. В соответствии с данным механизмом на маршрутизаторе устанавливается согласованный размер всплеска BC (байт) - объем данных, которые можно передать, если скорость превысит заданное среднее значение. После превышения установленного уровня происходит сброс пакетов. Это в свою очередь приводит к снижению скорости передачи данных за счет алгоритма изменения окна передачи данных, реализованного в протоколе ТСР. Данный алгоритм учтен в приведенных выше уравнениях жидкостной модели трафика, где зависимость счетчика всплеска описывается уравнениями, аналогичными уравнениям для очередей q,(t).

Начальные условия для приведенной выше системы дифференциальных уравнений определяются сценарием, по которому реализуется активность пользователей, т. е. источниками трафика. В данной статье рассмотрена одна из самых распространенных классификаций, разделяющих источники трафика на три типа (отметим, что сходная классификация рассматривается и в других работах, например [6, 7]).

1. Класс А. МДП > 10 Мбайт - «слоны» (P2P, скачивание больших файлов по протоколу ТСР). Время жизни таких потоков достаточно велико, несколько или более минут.

2. Класс B. МДП = 0,3-10 Мбайт - «мулы» (скачивание файлов промежуточных размеров, просмотр видеоклипов). Этот тип источников занимает промежуточное положение между «слонами» и «мышами» (по терминологии работы [12]). К этому классу относится загрузка файлов промежуточной длины 0,3-10 Мбайт. Одна из причин появления заметного количества потоков класса В состоит в том, что, как показали измерения [8, 9], очень большой процент загрузок (по разным оценкам - от 30 до 70 %) видеоинформации представляет собой кратковременные просмотры начала видеоклипа или фильма. В течение времени порядка 1 мин или менее пользователь просматривает клип и принимает решение о том, стоит ли продолжать просмотр (в большинстве случаев не продолжает).

3. Класс С. МДП < 0,3 Мбайт - «мыши» (просмотр веб-страниц, электронная почта ICQ и др. При современных скоростях доступа 1-10 Мбит/с «время жизни мышей» меньше или порядка нескольких секунд. Доля потребляемого ими трафика мала - по данным работы [10] менее 10 % (при этом доля пользователей, принимающих данный вид трафика, до 80 % [11]).

Параметр, который важно определять при моделировании источников трафика класса А, -число потоков, активных в течение всего времени моделирования.

Класс B описывается моментами включения и выключения потоков. Кроме того, для каждого потока производится статистический розыгрыш времени оборота сигнала R, для чего тоже должна быть задана соответствующая функция распределения.

Априори понятно, что флуктуациями потока, создаваемого пользователями класса С, можно пренебречь, поскольку на рассматриваемых вре-

Рис. 1. Конфигурация моделируемой сети Ма - магистральный маршрутизатор; М6 - маршрутизатор локального интернет-провайдера; — - удаленные серверы; Сг.. Ск- рабочие станции (клиенты)

менных интервалах флуктуации большого числа однородных случайных процессов усредняются. Следовательно, «мыши» не могут быть причиной интересующих нас выбросов интенсивности передаваемых в канале данных (> 10 %).

Результаты расчетов

Рассмотрим типичные результаты, полученные при моделировании сети, включающей магистральную линию и каналы связи с клиентами (рис. 1).

Предположим, что каждый клиент получает данные от своего сервера, и обслуживание клиентов происходит в режиме с гарантированной скоростью доступа CAR. «Узким горлом» в рассматриваемой системе является канал связи

интернет-провайдера с магистральным маршрутизатором, обладающий пропускной способностью Р.

Для определения самоподобных свойств трафика был использован показатель Херста [1], значение которого оценивалось в соответствии с методикой, описанной в [2] (напомним, что для для белого шума Н = 0,5, а для самоподобного процесса Н находится в интервале 0,5^1).

Проводились расчеты с использованием трех вариантов жидкостных моделей (результаты расчетов приведены в таблице):

модель 1 - активность 100 пользователей (10 «слонов» и 90 «мулов»);

модель 2 - активность 100 пользователей (90 «слонов» и 10 «мулов»);

Результаты расчетов

Номер эксперимента 1 2 3 4 5 6 7 8 9 10 Среднее значение

Модель 1

Н 0,85 0,86 0,77 0,73 0,76 0,84 0,79 0,84 0,74 0,77 0,80±0,04

Модель 2

Н 0,54 0,53 0,51 0,53 0,52 0,53 0,54 0,53 0,52 0,53 0,53±0,01

Модель 3

Н 0,70 0,65 0,65 0,67 0,73 0,72 0,62 0,74 0,62 0,76 0,69±0,05

Мбит/с 850 800 750 -700 650 600 550 500 450

50 100 150 200 250 t,C

Рис. 2. Расчетная зависимость интенсивности

поступления данных на вход маршрутизатора от времени (перегрузки не возникают)

модель 3 - активность 100 пользователей как и в модели 1, при этом канал передачи перегружен т. к. его пропускная способность лимитирована на уровне 700 Мбит/с.

Рассмотрим каждую из моделей более подробно. Гарантированная скорость доступа для каждого из пользователей - 10 Мбит/с (ВС = 100 Кбайт; BE = 2-BC = 200 Кбайт; R = 20+80rand(1,N) мс).

Модель 1 (недогруженный канал передачи). Активность «мулов»: ON-период - равномерно распределенная случайная величина с параметрами tmn = 1с, до tmax = 60 с, OFF-период -экспоненциально распределенная случайная величина со средним временем t = 3 с.

Пропускная способность общего канала намного больше максимальной необходимой скорости передачи, т. е. канал недогружен (рис. 2). Средняя интенсивность поступления данных на маршрутизатор в представленной реализации 704 Мбит/с, максимум - 853 Мбит/с. При этом следует отметить, что средняя скорость пользователей класса А (10 пользователей) порядка 9,8 Мбит/с, а потоков класса B (90 пользователей) - 6,6 Мбит/с.

Из таблицы видно, что значения Н для разных реализация случайного процесса несколько отличаются и лежат в интервале 0,73-0,86. Данный результат согласуется с экспериментальными данными, полученными в [1] (для одного и того же канала значения Н находились в интервале 0,54-0,86).

Модель 2 (недогруженный канал передачи). Видно, что если подавляющее число потоков

работает непрерывно (как «слоны»), то трафик является не самоподобным, а случайным броуновским процессом. Происходит усреднение, выбросы сглаживаются. Подтверждается предположение о том, что существенной причиной всплесков трафика является рассогласованность действий пользователей. И определяющая роль в этом принадлежит «мулам» - потокам, которые активны в интервале времен от 1 до 60 с. Следовательно, именно потоки средней длительности передачи (класс В) определяют самоподобные свойства сетевого тарфика.

Модель 3 (перегруженный канал). Значение пропускной способности канала выбрано близко к среднему значению суммарной интенсивности генерируемого трафика (90 «мулов», 10 «слонов») -700 Мбит/с. Учитывая, что в канале происходят всплески трафика, достигающие 20 % от среднего значения, канал в данном варианте будет сильно перегружен. Результат моделирования показан на рис. 3.

Значения показателя Н уменьшились по сравнению со случаем недогруженного маршрутизатора, однако незначительно.

Возникающие в процессе передачи перегрузки влекут за собой потерю пакетов и, как следствие, принудительное снижение скорости. Это, в свою очередь, снижает среднюю скорость передачи отдельных пользователей (по сравнению с вариантом недогруженного канала). При этом скорость пользователей класса В становится в среднем на 0,5 Мбит меньше, а скорость потоков класса А остается неизменной.

Мбит/с

850 800

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

750 Т| ,Л

500

450 -______-

50 100 150 200 250 £ с

Рис. 3. Расчетная зависимость интенсивности поступления данных на вход маршрутизатора от времени (канал перегружен, объем буфера 1 Мб)

Таким образом, в режиме с высокой (> 5 Мбит/с) гарантированной скоростью доступа можно относительно комфортно работать даже при высокой загрузке магистрального канала. При перегрузках скорость доступа не будет снижаться критически, но пользователи будут получать меньше, чем обещано. Подразумевается, что при таком режиме эксплуатации каналов необходимо резервировать часть полосы пропускания для данных, передаваемых по протоколу UDP, т. к. UDP-пакеты необходимо защищать от сброса на передающем маршрутизаторе.

Использование жидкостных моделей трафика позволило рассмотреть самоподобные свой-

ства трафика в каналах с высокой пропускной способностью с учетом режимов обеспечения заданной скорости доступа клиентов и профилей пользователей. Проведенные расчеты показателя Херста позволяют лучше понять самоподобную природу Интернет-трафика и причины противоречивости данных, полученных различными исследователями.

Согласно полученным данным, основной причиной возникновения самоподобия является рассогласованность действий (запросов) пользователей, в результате которой могут возникать значительные всплески интенсивности передаваемых данных.

СПИСОК ЛИТЕРАТУРЫ

1. Шелухин, О.И. Моделирование информационных систем [Текст]/О.И. Шелухин, А.М. Тенякшев, А.В. Осин.-М.: Радиотехника, 2005.-368 с.

2. Hernandez-Campos, F. Generating realistic TCP workloads [Текст]/Е Hernandez-Campos, F.D. Smith, K. Jeray//In Proc. of Computer Measurement Group (CMG) Conf.-2004.-P. 273-284.

3. Гребенкин, М.К. Статистическая abt-модель Интернет-трафика в мультисервисных сетях [Текст]/ М.К. Гребенкин, С.В. Поршнев//Тр. Междунар. науч.-практич. конф. «СВЯЗЬ-ПРОМ 2009».-Екатеринбург: ЗАО «Компания Реал-Медиа», 2009.-Т. 2.-С. 55-58.

4. Liu,Y. Fluid Models and Solutions for Large-Scale IP Networks [Текст]/У Liu, F.L. Presti, V. Misra [et al.]// Performance Evaluation Review. -ACM SIGMETRICS, 2003.-Vol. 31 .-Iss. 1.-P. 91-101,

5. Шринивас, В. Качество обслуживания в сетях IP [Текст]/В. Шринивас.-М.: Вильямс, 2003.-368 с.

6. Lan, K. A measurement study of correlations of Internet flow characteristics [Текст]/К Lan, J. Heidemann//Computer Networks.-16 Jan. 2006.-Vol. 50. -Iss. 1.-P. 46-62.

7. Erman, J. Byte Me: A Case for Byte Accuracy in Traffic Classification [Текст]Л. Erman, A. Mahanti,

M. Arlitt//Proc. of the III annual ACM workshop on Mining network data. -San Diego, California, USA, 12 June 2007. -P. 35-38.

8. Yu, H. Understanding User Behavior in Large-Scale Video-on-Demand Systems [TeKCT]/H. Yu, D. Zheng, B.Y. Zhao [et al.]//Proc. of the 1st ACM SIGOPS EuroSys European Conf. on Computer Systems. -ACM, NY, USA,

2006.-Vol. 40.-Iss. 4.-P. 333-344.

9. Brampton, A. Characterising and Exploring Workloads of Highly Intensive Video-on-Demand [TeKCT]/A. Brampton, A. MacQuire, M. Fry [et al.]// MULTIMEDIA SYSTEMS.-Computer Science,

2007.-Vol. 15.-P. 3-17.

10. Pellicer-Lostao, C. Modelling user's activity in a real-world complex network [TeKCT]/C. Pellicer-Lostao, D. Morato, R. Lpez-Ruiz//International Journal of Computer Mathematics. -Bristol, USA, Taylor & Francis, Inc, 2008.-Vol. 85.-Iss. 8.-P. 1287-1298.

11. Zhang, Y. On the Characteristics and Origins of Internet Flow Rates [TeKCT]/Y. Zhang, L. Breslau, V. Pax-son [et al.]//On the Characteristics and Origins of Internet Flow Rates: Proc. of the 2002 conf. on Applications, technologies, architectures, and protocols for computer communications.-ACM, NY, USA, 2002.-P. 309-322

i Надоели баннеры? Вы всегда можете отключить рекламу.