Научная статья на тему 'Алгоритм прогнозирования объектов локализуемого трафика в сети Бурятского филиала ОАО «Ростелеком»'

Алгоритм прогнозирования объектов локализуемого трафика в сети Бурятского филиала ОАО «Ростелеком» Текст научной статьи по специальности «Экономика и бизнес»

CC BY
148
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
TRAFFIC / LOCALIZATION

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Макшанова Лариса Михайловна, Содномова Марина Станиславовна

В статье собраны и обработаны данные объемов внешнего и внутреннего трафика сети Бурятского филиала за три года, рассмотрены вопросы локализации трафика, найдены оптимальные методы прогнозирования трафика сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Макшанова Лариса Михайловна, Содномова Марина Станиславовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ALGORITHM OF FORECASTING OF THE OBJECTS OF LOCALIZED TRAFFIC IN THE NET OF THE BYRYAT BRUNCH OAO ROSTELEKOM

In the article the data of the external and internal volume of the traffic in the net of the Buryat Brunch have been collected and processed for the period of three years, the issues of traffic localization have been considered, the optimal methods of forecasting net traffic have been found.

Текст научной работы на тему «Алгоритм прогнозирования объектов локализуемого трафика в сети Бурятского филиала ОАО «Ростелеком»»

УДК 51

Л.М. Макшанова, М. С. Содномова

АЛГОРИТМ ПРОГНОЗИРОВАНИЯ ОБЪЕКТОВ ЛОКАЛИЗУЕМОГО ТРАФИКА В СЕТИ БУРЯТСКОГО ФИЛИАЛА ОАО «РОСТЕЛЕКОМ»

В статье собраны и обработаны данные объемов внешнего и внутреннего трафика сети Бурятского филиала за три года, рассмотрены вопросы локализации трафика, найдены оптимальные методы прогнозирования трафика сети.

L.M. Makshanova, M.S. Sodnomova

THE ALGORITHM OF FORECASTING OF THE OBJECTS OF LOCALIZED TRAFFIC IN THE NET OF THE BYRYAT BRUNCH OAO “ROSTELEKOM”

In the article the data of the external and internal volume of the traffic in the net of the Buryat Brunch have been collected and processed for the period of three years, the issues of traffic localization have been considered, the optimal methods of forecasting net traffic have been found.

Key words: traffic, localization.

Уровень локализации трафика - это показатель, позволяющий дать оценку эффективности деятельности филиала при предоставлении качественной услуги. Мы не можем достигать заданный показатель локализации путем массовой деградации сервиса за счет перегрузок на магистральных каналах. Снизить возможный негативный эффект от допускаемых перегрузок, а в дальнейшем и нормализовать ситуацию на магистральных портах предстоит только за счет повышения уровня локализации трафика. А также локализация трафика является одной из эффективных мер экономии затрат на закупку внешнего трафика.

Актуальной задачей является разработка модели прогноза локализованного трафика для выбора рациональных принципов использования и развития сети. В статье представлен один из возможных алгоритмов прогнозирования трафика сети.

На рисунке 1 представлены графики, на которых видно, что трафик сети имеет выраженный сезонный характер с возрастающим трендом. Понятие “сезон” в прогнозировании применим к любым систематическим колебаниям, например, если речь идёт об изучении трафика в течение недели, то под термином “сезон” понимается один день. Кроме того, цикл колебаний может существенно отличаться (как в большую, так и в меньшую сторону) от величины один год. И если удаётся выявить величину цикла этих колебаний, то такой временной ряд можно использовать для прогнозирования с использованием аддитивных и мультипликативных моделей.

Аддитивную модель прогнозирования можно представить в виде формулы:

F = T + S + E, где: F - прогнозируемое значение; Т - тренд; S - сезонная компонента; Е - ошибка прогноза.

Применение мультипликативных моделей обусловлено тем, что в некоторых временных рядах значение сезонной компоненты представляет собой определенную долю трендового значения. Эти модели можно представить формулой:

F = T х S x E.

На практике отличить аддитивную модель от мультипликативной можно по величине сезонной вариации. Аддитивной модели присуща практически постоянная сезонная вариация, тогда как у мультипликативной она возрастает или убывает [3].

Методики простого и в то же время адекватного прогнозирования на сегодняшний день действительно освещены в научных материалах в небольшом количестве. Одни просты до такой степени, что моделируют ситуацию, крайне далекую от реальной. А другие настолько сложны, что период их применения и сбора необходимой информации значительно превышает все установленные начальством сроки. Для анализа применим MS Excel как наиболее доступный и простой для понимания программный продукт.

Исходные данные/ Объем трафика сети БФ

] Трафик внешний

ш Трафик внупрений

- Трафик Сибнет

Рис. 1. Объем трафика филиала за период 2008 - 2011гг.

На рисунке 1 наглядно иллюстрируется рост потребляемого абонентами трафика. Причинами роста являются увеличение абонентской базы (по сравнению с 2008 г. в 4,4 раза), ввод высокоскоростных тарифных планов, развитие контент-ресурсов.

При увеличении трафика абонентов перед провайдерами стоит вопрос о закупке внешнего Интернет-трафика и обеспечения работоспособности оборудования. Одним из мер по изменению текущего процесса является локализация трафика, которая достигается путем развития и популяризации собственных контент-ресурсов, увеличения доли внутреннего трафика. Филиалом проводятся

следующие мероприятия по повышению локализации трафика:

- развитие и продвижение собственного контента;

- ограничение внешней нагрузки (самой безболезненной мерой по ограничению внешней нагрузки является реализация ретрекера с кэшированием наиболее востребованного контента). По статистическим данным трех лет доля внутреннего трафика выросла от 6 до 70%.

Создадим модели, описывающие объем локализованного филиалом трафика. Количество создаваемых моделей определяется методом подбора, учитывая вероятности достоверности. При этом важно, что большее количество построенных моделей даст возможность выбрать наиболее точную модель. Изначально неизвестно какое из уравнений трендов даст наилучший результат, поэтому на данном этапе моделирования целесообразнее всего использовать все линии тренда, которые может строить программный продукт MS Excel линейный, логарифмический, полиномиальный, степенной тренд и экспоненциальный тренд.

На рисунке 2 представлены все линии тренда для локализованного филиалом трафика, в таблице 1 указаны их вероятности достоверности.

Выбранные линии тренда для локализованного трафика

у = -0, 0522x6 + 5,7343x5 - 237,02x4 + 4536,5x3 - 38977x2 + 134622x - 128286 R2 = 0,9796

у = 1608,4e0,2118x R2 = 0,8257 “y = -8,9036x3 + 1084,6x2 - 2316,2x - 16008 R2 = 0,9619

у = 84,43x2,5:

R2 = 0,8278 = 274537Ln(x) - 410270 R2 = 0,6464 300 000y- = 26944x - 178781

^ <5$° <$* <£* <£* <$* & &

-100

Линейная аппроксиммация - - - ■ Степенная аппроксимация

Полиноминальная аппроксимация 6 степени

Логарифмическая аппроксимация Экспоненциальная аппроксимация Полиномиальная аппроксимация 3 степени

Рис. 2. Выбранные линии тренда для прогнозирования локализованного трафика

Таблица 1

Методы аппроксимации и их вероятности достове рности

Методы аппрокси мации Линейная Полиномиальная Логарифми ческая Экспо ненци альная Степен ная

3-й степени 6-й степени

Вероятность достоверности R2 0,923 0,9619 0,9796 0,6464 0,8257 0,8278

Для простоты и большей наглядности данного примера ограничимся выбором трех линий тренда: полиномиальная аппроксимация 3-й и 6-й степени, а также линейная, так как эти тренды имеют высокую вероятность достоверности (рис. 3).

Выбранные методы аппроксимации

■ | Методы аппроксимации полином Локализованный график, Гб

Методы аппроксимации полином 6ст Методы аппроксимации линейный

Рис. 3. Выбранные методы аппроксимации Рассчитываем сезонную компоненту для каждого из уравнений тренда. Из фактических данных вычитаем значения линий тренда для каждого из сезонов. В расчетах для того, чтобы довести средние колебания до 0, необходимо итоговую сумму средних разделить на количество периодов в сезоне (в нашем случае - это 12). Полученный результат вычитаем из значений среднего по каждому периоду. В итоге сумма колебаний составит абсолютный 0.

Отклонения сезонных колебаний модели с линейным и полиномиальным трендом 3 и 6 степени от 0 весьма велико и утверждать, что в моделях выявлена сезонность, мы не можем. Но, исходя из экономических соображений и знаний специфики рынка ТКС услуг, предполагаем, что сезонность существует. Соответственно, ошибка модели вырастет. Рассчитанные сезонные компоненты для каждого из уравнений тренда при прогнозировании просто переносятся на соответствующие месяцы прогнозного периода.

Рис. 4. Значения трендовых моделей с учетом сезонной компоненты

Получив 3 сезонные компоненты (8) с 3 уравнениями тренда (Т), мы можем рассчитать ошибки построенных моделей (Е). Для этого из исходных значений задачи необходимо отнять сумму Б+Т, Е=Б-(Б+Т).

Ошибки моделей (Е)

Ошибка полиномиальной модели 6 сп. E=A-(S+T)

Ошибка полиномиальной модели 3 сгт E=F-(S+T)

Ошибка линейной модели E=F-(S+T)

Рис. 5. Ошибки построенных моделей (Е)

На основании рассчитанных ошибок рассчитаем среднеквадратическое отклонение (СКО) для каждого из периодов, СКО моделей, а также их точность (табл. 2).

Находим среднеквадратическую ошибку модели (Е) по формуле:

Е= I О2:I (F-(T+S))2’ где:

Т - трендовое значение;

S - сезонная компонента;

О - отклонения модели от фактических значений.

На основании СКО для периодов рассчитаем точность по формуле: (точность модели) = [1- (среднее значение СКО)]*100% .

Таблица 2

Рассчитанные значения ошибок моделей

Полиномиальная аппроксимация 6-й степ. Полиномиальная аппроксимация 3-й степ. Линейная аппроксимация

Среднее значение 0,5085 0,3314 0,3048

Точность модели 49,15% 66,86% 69,52

Среднеквадратичная ошибка модели (Е) 0,397% 1,369% 6,099%

На основе полученных значений (табл. 2), а также значений вероятности достоверности (табл. 1) оптимальной моделью является полиномиальная аппроксимация 3-й степени. Данная модель отражает тенденции объемов локализованного трафика и может использоваться для прогнозов. Чтобы построить доверительный интервал, воспользуемся данными СКО для модели с полиномиальным трендом 3-й степени (СКО=0,33144). Доверительный интервал примет вид:

^*[1-СКО№*[1+СКО]).

Доверительный интервал отражает, в каких пределах может колебаться ошибка прогнозных значений.

Таблица 3

Расчет прогнозных значений модели с полиномиальным трендом 3-й степени

Месяц Доверительный интервал Прогнозируемые значения объема локализованного трафика

+

2011-05 622060,9877 1238840,911 956 067,81

2011-06 658076,1536 1310565,487 973 805,55

2011-07 677536,7788 1349321,524 985 168,32

2011-08 705378,5331 1404768,667 1 007 729,52

2011-09 733241,9059 1460258,863 1 043 789,26

2011-10 761091,1818 1515720,985 1 115 461,62

2011-11 788890,6452 1571083,904 1 179 992,19

2011-12 816604,5807 1626276,495 1 233 200,95

2012-01 844197,2728 1681227,627 1 338 717,78

2012-02 871633,0061 1735866,175 1 317 667,21

2012-03 898876,0651 1790121,009 1 392 831,27

2012-04 925890,7343 1843921,003 1 371 293,79

Прогнозируемые значения объема локализованного трафика

1 600 000,00 -|-------------------------------------------------

1 400 000,00--------------------------------------—----1—I-1—|—

1 200 000,00---------------------------1—I 1—I -1 I- - —

1 000 000,00--=------.-1—I 1—I 1—I—Г~|— — — — — — —

800 000,00-------- ---- -- --- --- ---- --- --- --- ----- - —

600 000,00-------- ---- -- --- --- ---- --- --- --- ----- - —

400 000,00-------- ---- -- - - -- --- - - ----- - —

200 000,00-------- ---- -- --- --- ---- --- --- --- ----- - —

0,00 -I-.-I—1.1 —Ц-1—Ц-1—1.1 11—Ц-1—I—г-1—Ц-1—L^l—L^l—L,

SS8è888î:âS083 ¿¿¿¿¿¿¿¿ЙЙЙЙ 102 012 021 021 210 210 201 012 021 102 201 012

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

|~D Прогнозируемые значения объема локализованного прафика |

Рис. 3. Прогноз локализованного трафика на 1 год Таким образом, мы пришли к выводу, что:

S для точного прогноза необходимо исследовать несколько трендовых моделей;

S для стратегических планов необходимо использовать более сложные модели,

опираясь на теорию телетрафика. Для тактического же анализа приемлем вышеописанный метод.

S в рассмотренном примере предпочтительна полиномиальная аппроксимация 3-й

степени (исходя из рассчитанных значений СКО, R2, ошибок моделей).

S по данным прогнозных значений ожидается рост объемов локализованного

трафика. Причинами которого являются рост абонентской базы, рост объемов контента (видео, игры, и т.п.);

Для обеспечения данных показателей необходимы:

S организация высокоскоростной раздачи файлов внутри сети;

S размещение серверов, кэширование на собственных хранилищах торрент-

трекеров;

S организация пиринговых включений;

S маркетинговые мероприятия.

Литература

1. Каграманзаде А.Г. Менеджемент и регулирование в Инфокоммуникациях. Баку: Элм, 2006.

2. Соколов Н.А. Телекоммуникационные сети. М.: Альварес Паблишинг, 2004. Ч. 4.

3. URL: http://www.cfin.ru/finanalysis/sales_forecast.shtml

4. URL: http://www.cfin.ru/finanalysis/math/add_to_kosh.shtml

Макшанова Лариса Михайловна, начальник отдела по работе с операторами связи БФ ОАО "Ростелеком", тел. (3012) 217617

Содномова Марина Станиславовна, аспирант Сибирского государственного университета телекоммуникаций и информатики.

Makshanova Larisa Mikhailovna, head of the department on work with operators of communication BB OAO “Rostelekom”, ph.(3012)217617

Sodnomova Marina Stanislavovna, postgraduate student, Siberian State University of Telecommunication and Computer Science

i Надоели баннеры? Вы всегда можете отключить рекламу.