Научная статья на тему 'ФРАКТАЛЬНЫЕ СВОЙСТВА ПОТОКОВ СОБЫТИЙ ПРИКЛАДНОГО УРОВНЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ'

ФРАКТАЛЬНЫЕ СВОЙСТВА ПОТОКОВ СОБЫТИЙ ПРИКЛАДНОГО УРОВНЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
73
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФРАКТАЛЬНЫЕ ПРОЦЕССЫ / САМОПОДОБИЕ / МОДЕЛИРОВАНИЕ НАГРУЗКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Треногин Николай Геннадьевич, Соколов Дмитрий Евгеньевич

Приводятся результаты оценки статистических характеристик потока событий прикладного уровня в действующей информационной системе оператора связи, позволяющие сделать вывод о наличии фрактальных свойств в данном потоке.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FRACTAL PROPERTIES OF EVENTS FLOW OF APPLICATION LEVEL IN INFORMATION SYSTEMS

The results of estimating statistical characteristics of events flow of application level in operating information system of telecommunications operator, allowing to draw a conclusion about the presence of fractal properties in the process are given.

Текст научной работы на тему «ФРАКТАЛЬНЫЕ СВОЙСТВА ПОТОКОВ СОБЫТИЙ ПРИКЛАДНОГО УРОВНЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ»

УДК 681.324

Фрактальные свойства потоков событий прикладного уровня в информационных системах

Н. Г. Треногин, Д. Е. Соколов

Приводятся результаты оценки статистических характеристик потока событий прикладного уровня в действующей информационной системе оператора связи, позволяющие сделать вывод о наличии фрактальных свойств в данном потоке.

Ключевые слова: фрактальные процессы, самоподобие, моделирование нагрузки.

1. Введение

Ряд исследований последнего времени показывает недостаточность использования классических моделей теории телетрафика для описания нагрузки в современных информационных системах и сетях передачи данных и для оценки их вероятностно-временных характеристик. Традиционные подходы, основанные на марковских моделях, не учитывают такие свойства реальной нагрузки, как выраженная вариативность, коррелированность (потоки с последействием), весомые распределения статистических величин и т.д. Для описания потоков, обладающих указанными свойствами, в настоящее время все чаще используются фрактальные, или самоподобные, модели, переносящие отдельные положения фрактальной геометрии на свойства стохастических процессов.

Адекватность фрактальных моделей для описания потоков нагрузки на уровне сетевых пакетов многократно подтверждена в зарубежных и отечественных работах. При этом причины формирования фрактальных, или самоподобных, свойств сетевого трафика, как правило, рассматриваются в качестве внешних по отношению к рассматриваемому предмету факторов и выносятся за рамки исследования.

В настоящей статье на примере данных действующей информационной системы показывается, что потоки событий не только сетевого, но и прикладного уровня могут обладать фрактальными свойствами, что дает возможность использования единого математического аппарата при комплексном моделировании систем обработки данных на различных уровнях абстракции.

2. Базовые понятия и свойства фрактальных моделей трафика

Наиболее общим определением фрактального (самоподобного) процесса является его неформальное определение как случайного процесса, статистические характеристики которого проявляют свойства масштабирования. Самоподобный процесс существенно не меняет вида при рассмотрении в различных масштабах по шкале времени.

Случайный процесс Х(Х) является самоподобным с параметром Н, если Х(Х) и а ~НХ(Ш) имеют одинаковые конечномерные распределения вероятностей для всех а> 0. Параметр

H е (0.5; 1) называется параметром Хёрста и определяет степень выраженности фрактальных свойств. При H = 0.5 такие свойства полностью отсутствуют и процесс является классическим; чем ближе H к 1, тем более ярко проявляются фрактальные свойства. С прикладной точки зрения ценность данного подхода к моделированию заключается в том, что он позволяет описать существенно пульсирующий трафик, моменты поступления пакетов которого группируются в пиковые всплески, причем пульсирующий характер наблюдается при различных степенях усреднения процесса по времени.

Самоподобные процессы, в том числе описывающие явления в сетях передачи данных, обладают рядом свойств, существенно отличающих их от потоков, рассматриваемых в классической теории очередей.

1. Долговременная зависимость.

Самоподобные процессы обладают гиперболически затухающей корреляционной функцией вида

_2

R(k) = а((к +1)2H - 2k2H + (к -1)2H), (1)

или

R(k) « к2H 2L(t) при к ^да, (2)

L(tx)

где L(t) - медленно меняющаяся функция на бесконечности (т.е. lim-= 1 для всех x>0).

L(t)

Следовательно, корреляционная функция является несуммируемой - ряд, образованный последовательными значениями корреляционной функции, расходится.

Это свойство характеризует практически все самоподобные процессы и отличает их от процессов без долговременной зависимости, у которых корреляционная функция убывает по показательному закону и суммируема. Долговременная зависимость является причиной ярко выраженных пульсаций процесса, однако позволяет говорить о некоторой предсказуемости в небольших пределах времени. С точки зрения теории очередей важным следствием коррели-рованности потока является неприемлемость оценок параметров очереди, основанных на предположении об одинаковом и независимом распределении интервалов во входящем потоке.

2. Медленно убывающая дисперсия.

При усреднении процесса дисперсия выборочного среднего затухает медленнее, чем величина, обратная размеру выборки, по закону:

2 / v(ш)\ 2H-2 , /л\

а (X ) <х m , при m ^ да, (3)

в то время как для традиционных стационарных случайных процессов

а2(Х(m)) = — а2(Х), (4)

m

т.е. уменьшается обратно пропорционально объему выборки.

Свойство медленно убывающей дисперсии говорит о возможности существенных, не сглаживаемых усреднением, «выбросов» в случайном процессе и связывает самоподобие с таким понятием, как распределения с весомыми хвостами (РВХ). Важное следствие свойства медленно затухающей дисперсии состоит в том, что в случае классических статистических тестов (например, вычисления доверительных интервалов) общепринятая мера среднеквад-ратического отклонения а может не быть достоверной.

С данным свойством связано и нехарактерное поведение индекса разброса для отсчетов процесса (IDC), также называемого фактором Фано:

F(T) = VaíN(T)]. (5)

E[N(T)] V 7

Здесь N(T) - число событий исследуемого потока, наступивших в интервале (окне) Т.

Для самоподобных процессов логарифм индекса разброса F(T) линейно возрастает:

n[F(T)-1] = (2H-1) lnT+y. (6)

3. Весомые распределения (распределения с весомыми хвостами)

Случайная величина Z имеет распределение с весомым хвостом (РВХ), если вероятность

P[Z>x] ~ cxa , x , (7)

т.е. хвост распределения затухает по степенному закону. Примером распределения с весомым хвостом является распределение Парето.

При 0<a <2 величина Z обладает бесконечной дисперсией, а при 0<a <1 среднее значение также бесконечно.

Наиболее существенной особенностью случайной величины, обладающей распределением с тяжелом хвостом, является чрезвычайная изменчивость. С вероятностью, которая не является пренебрежимо малой, в выборке может присутствовать некоторое число «очень больших» значений. Такие распределения существенно снижают точность статистических оценок: скажем, конечный объем выборки приводит к заниженной оценке среднего и дисперсии.

Наличие РВХ во внешних по отношению к рассматриваемым процессам явлениях является одной из причин возникновения самоподобия в соответствующих стохастических моделях.

Часто при рассмотрении самоподобных процессов говорят о комплексе взаимосвязанных понятий: самоподобии, масштабировании, долговременной зависимости, РВХ и степенных законах статистических характеристик. Этот комплекс свойств отличает процессы, называемые самоподобными, от классических случайных процессов, например, пуассоновского.

3. Рассматриваемая информационная система

В настоящей работе проведен анализ потока событий прикладного уровня в действующей информационной системе.

Исследовалась система коммерческого ордеринга (COM - Commercial Order Management), интегрированная с биллинговой системой крупного подразделения оператора связи (порядка 9 млн абонентов).

Элементарным событием для системы данного класса является создание или обработка заявки (ордера, «наряда»). Заявка в общем случае инициирует внесение в асинхронном режиме изменений в абонентскую картотеку биллинга: создание или изменение лицевого счета или его отдельных атрибутов, изменение действующего набора услуг (подключение, отключение, блокировка) и т.д.

Заявки могут порождаться как полностью автоматически при обработке периодических операций, таких, например, как контроль дебиторской задолженности, либо поступать от смежных интегрированных систем: CRM (управление взаимоотношениями с клиентом -Customer Relationship Management), дилерские интерфейсы, интерфейсы абонентского самообслуживания и др. В процессе обработки заявка может проходить несколько этапов, которые могут быть как автоматизированными операциями над данными в смежных системах, так и инициировать внешние по отношению к системам действия специалистов: например, экспертное определение технической возможности или выезд монтажника к абоненту.

В рамках исследования рассматривалась только последовательность моментов наступления элементарных событий вышеописанного рода, т.е. экспериментальные данные являются

полностью обезличенными и не содержат какой-либо коммерческой или абонентской информации.

4. Статистические свойства прикладного потока

Пример среза прикладного потока приведен на рис. 1. Здесь и далее в качестве иллюстрации рассматривается 10-часовой срез процесса в течение рабочего дня (22.08.2017). Процесс в указанный период можно считать условно стационарным, внешние по отношению к предмету исследования аномалии (регламентные работы, аварии) отсутствуют.

Диаграмма на рис. 1 отображает число событий на последовательных 10-секундных интервалах.

200

10 000 20 000 30 000

Ь с

Рис. 1. Срез прикладного потока

Отчетливо заметно наличие существенных всплесков, а также наличие колебаний интенсивности различных масштабов времени, что говорит о наличии внутренней корреляции (по-следействия)в потоке.

Таблица 1. Основные статистические характеристики среза потока

Характеристика Значение

Длительность, ч 10

Длительность, с 36000

Число событий 216461

Интенсивность, с-1 6.013

к, с

Рис. 2. Автокорреляционная функция (линейный масштаб)

-1

-2

-3

0 0,5 1 1,5 2 2,5 3 3,5

log k

Рис. 3. Автокорреляционная функция (логарифмический масштаб)

Корреляционная структура (рис. 2) показывает наличие как долговременной зависимости в форме гиперболически затухающей кривой АКФ, так и периодической составляющей.

Периодическая составляющая с выраженными пиками для значений, кратных 60 с, вызвана тем фактом, что значительная часть событий в системе порождается автоматическими периодическими процессами обработки, выполняющимися по расписанию - либо ежеминутно, либо в кратные целым минутам заданные моменты времени.

Гиперболическое же затухание АКФ говорит о наличии в рассматриваемом процессе фрактальных свойств. Отсчеты оценок АКФ в логарифмическом масштабе (рис. 3) в целом группируются вокруг наклонной прямой. Для самоподобного процесса в соответствии с (2) угловой коэффициент этой прямой в = 2 - 2H напрямую связан с параметром Хёрста. Если путем линейной регрессии оценить этот коэффициент для рассматриваемого случая, получаем в = 0.5047 и H = 0.748, что подтверждает наличие фрактальных свойств. На рис. 2 дополнительно показана кривая для идеального самоподобного процесса с полученным оценочным значением параметра в-

5 4 3 2 1 0

0 1 2 3 4 5 6 7

Рис. 4. Логарифм индекса разброса (IDC)

Если рассмотреть график логарифма индекса разброса IDC (рис. 4), то очевидно его линейное возрастание, что характерно для выраженных фрактальных свойств. Угловой коэффициент соответствующей прямой, оцененный путем линейной регрессии, равен 0.617, что исходя из (6) соответствует параметру Хёрста H = 0.808.

Рис. 5. Убывание дисперсии при усреднении процесса по времени (логарифмический масштаб)

Оценка параметра Хёрста исходя из свойства медленно убывающей дисперсии (рис. 5) на основании (3) дает значение H = 0.755, что практически совпадает с оценкой, полученной из анализа автокорреляционной функции.

5. Заключение

Полученные результаты подтверждают наличие фрактальных свойств в потоках событий не только сетевого, но и прикладного уровня, что говорит о том, что самоподобие в распределенных информационных системах не является исключительно сетевым феноменом, порождаемым свойствами сети - протоколов, алгоритмов пакетирования и маршрутизации.

Представляет научный интерес вопрос взаимосвязи статистических характеристик потоков сетевого и прикладного уровня, а также выбор конкретной фрактальной модели, наиболее адекватно описывающей рассматриваемый процесс. Эти направления можно рассматривать как сферу дальнейших исследований.

Литература

1. Кокс Д., Льюис П. Статистический анализ последовательностей событий. Пер. с англ. И. А. Маховой, В. В. Рыкова, ред. Н. П. Бусленко. М.: Мир, 1969. 310 c.

2. Шелухин О. И., Тенякшев А. М., Осин А. В. Фрактальные процессы в телекоммуникациях: монография. М.: Радиотехника, 2003. 480 с.

3. Петров М. Н., Треногин Н. Г. Распределенные информационные системы управления в телекоммуникационной отрасли. Красноярск, 2006. 345 с.

4. Городецкий А. Я., Заборовский В. С. Информатика. Фрактальные процессы в компьютерных сетях: учеб.пособие. СПб: Изд-во СПбГТУ, 2000. 102 с.

5. Leland W. E., Taqqu M. S., Willinger W., Wilson D. W. On the self-similar nature of Ethernet traffic // Computer Communications Review. 1993. V. 23. P. 193-198.

6. Ryu B. K. Fractal Network Traffic: From Understanding to Implications. Ph.D. thesis. Columbia University, 1996. 143 p.

7. Треногин Н. Г., Соколов Д. Е. Фрактальные свойства сетевого трафика в клиент-серверной информационной системе // Вестник НИИ СУВПТ. Сборник научных трудов. 2003. В. 14. С. 163-172.

8. Треногин Н. Г., Соколов Д. Е. Моделирование сетевого трафика в информационных системах на основе фрактального точечного процесса // Вестник университетского комплекса: сб. научных трудов. 2004. В. 2 (16). С. 12-21.

9. Соколов Д. Е., Треногин Н. Г. Фрактальные свойства трафика в действующей двухзвен-ной системе обработки данных // Современные проблемы информатизации в технике и технологиях: Сб. трудов. Вып. 10. Воронеж: Научная книга, 2005. С. 264.

10. Треногин Н. Г., Петров М. Н., Соколов Д. Е. Свойства фрактального трафика при прохождении системы массового обслуживания с очередью // Вестник СибГАУ. 2017. Т. 18, № 1. С. 105-110.

Статья поступила в редакцию 12.09.2017

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Треногин Николай Геннадьевич

к.т.н., доцент кафедры телекоммуникационных сетей и вычислительных средств СибГУТИ, директор департамента развития и эксплуатации информационных систем и платформ макрорегионального филиала «Сибирь» ПАО «Ростелеком», e-mail:

nikolay.g.trenogin@sibir.rt.ru.

Соколов Дмитрий Евгеньевич

начальник отдела создания и продвижения биллинговых решений центра компетенций по телекоммуникационным решениям «Старт» макрорегионального филиала «Сибирь» ПАО «Ростелеком», e-mail: dmitrij .sokolov@sibir.rt.ru.

Fractal properties of events flow of application level in information systems N. Trenogin, D. Sokolov

The results of estimating statistical characteristics of events flow of application level in operating information system of telecommunications operator, allowing to draw a conclusion about the presence of fractal properties in the process are given.

Keywords: fractal processes, self-similarity, load simulation.

i Надоели баннеры? Вы всегда можете отключить рекламу.