Научная статья на тему 'СИСТЕМА МОНИТОРИНГА ПОКАЗАТЕЛЕЙ ДОСТУПНОСТИ СЕТЕЙ МОБИЛЬНОЙ СВЯЗИ СТАНДАРТА LTE-A'

СИСТЕМА МОНИТОРИНГА ПОКАЗАТЕЛЕЙ ДОСТУПНОСТИ СЕТЕЙ МОБИЛЬНОЙ СВЯЗИ СТАНДАРТА LTE-A Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
191
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛЮЧЕВЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА (KPI) / ПРОТОКОЛ RAB (RADIO ACCESS BEARER) / ПРОТОКОЛ E-RAB (E-UTRAN RADIO ACCESS BEARER) / СЕТЬ LTE (LONG-TERM EVOLUTION) / СЕТЬ LTE-ADVANCED / ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ / ETS / SARIMA / РАЗЛОЖЕНИЕ ПРОНИ / XGBOOST

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фадеев Владимир Анатольевич, Зайдуллин Шайхрозы Васимович, Фадеева Злата Сергеевна, Надеев Адель Фирадович

Анализируются два основных показателя доступности сети мобильной связи одного из региональных сотовых операторов РФ, а именно проценты неуспешных соединений по протоколам E-RAB (E-UTRAN Radio Access Bearer) и E-RRC (Evolved Radio Resource Control) в сегменте стандарта LTE-A. Основной целью работы является поиск и оценка эффективности алгоритмов прогнозирования показателей доступности. В рамках исследования приводится динамика изменения показателей во времени, причины возможного возникновения неполадок. Анализируется стационарность рассматриваемых временных рядов методом Дики-Фуллера и методом Квятковского-Филлипса-Шмидта-Шина. Рассчитывается доля значений временного ряда, соответствующих нештатным ситуациям на сети (выбросам). Приводятся результаты ETS-разложения временных рядов. Для прогнозирования будущих значений показателей используются модель SARIMA, тройное экспоненциальное сглаживание (метод Холта-Винтера), Facebook Prophet, модель на основе разложения Прони, алгоритм XGboost. Оценка эффективности моделей проводится с помощью медианы абсолютной ошибки (Median Absolute Error - MAE), которая рассчитывается двумя способами: по тестовой выборке и усредненно в ходе процедуры кросс-валидации. На основе полученных результатов сравнения составляется рекомендация по использованию определенной предиктивной модели. Также в данной работе приводится схема предполагаемого ПАК (программно-аппаратного комплекса) по сбору, анализу и визуализации необходимых метрик в рамках сети рассматриваемого сотового оператора. Проводится анализ возможности применения решений с открытым исходным кодом, как на этапе сбора и подготовки данных, так и на этапах обучения предиктивной модели и визуализации полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фадеев Владимир Анатольевич, Зайдуллин Шайхрозы Васимович, Фадеева Злата Сергеевна, Надеев Адель Фирадович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MONITORING SYSTEM FOR LTE-A CELLULAR COMMUNICATION NETWORK ACCESSIBILITY INDICATORS

In this paper we consider two accessibility indicators, namely E-RAB (E-UTRAN Radio Access Bearer) and E-RRC (Evolved Radio Resource Control) failure rates, of the LTE-A communication network belonging to one of the regional operators in Russian Federation. The aim of this study is to find the proper algorithms for accessibility indicators prediction, and performance estimation of these algorithms. During the study, we provide temporal dynamics of the indicators and possible failure reasons, behind these indicators. Then the percentage of the time series values is shown, which are corresponding to the abnormal situations (incidents). After that, the stationarity of the inspected time series using augmented Dickey-Fuller (ADFuller), and Kwiatkowski-Phillips-Schmidt-Shin (KPSS) methods is analyzed. Next, the ETS decomposition is performed. In order to predict the future values of the indicators, we utilize SARIMA model, triple Exponential Smoothing (Holt-Winters method), Facebook Prophet, Prony decomposition based model and XGBoost algorithm. Performance estimation is obtained in two ways: by test-sequence- and cross-validation-based Median Absolute Error (MAE). Also, the architecture for the monitoring system, that collects, analyzes and visualizes the required metrics within the infrastructure of the considered operator, is proposed in this paper. Herein, we analyze the possibilities of the open-source solution deployment on each stage of the monitoring process from data mining and preparation up to predictive model learning.

Текст научной работы на тему «СИСТЕМА МОНИТОРИНГА ПОКАЗАТЕЛЕЙ ДОСТУПНОСТИ СЕТЕЙ МОБИЛЬНОЙ СВЯЗИ СТАНДАРТА LTE-A»

СИСТЕМА МОНИТОРИНГА ПОКАЗАТЕЛЕЙ ДОСТУПНОСТИ СЕТЕЙ МОБИЛЬНОЙ СВЯЗИ СТАНДАРТА LTE-A

Фадеев Владимир Анатольевич,

ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия, VAFadeev@kai.ru

Зайдуллин Шайхрозы Васимович,

ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия, shvzaydullin@stud.kai.ru

Фадеева Злата Сергеевна,

ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия, zsgibalina@stud.kai.ru

Надеев Адель Фирадович,

ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия, afnadeev@kai.ru

DOI: 10.36724/2072-8735-2021-15-3-4-16

Manuscript received 16 November 2020; Accepted 25 January 2021

Ключевые слова: ключевые показатели качества (KPI), протокол RAB (Radio Access Bearer), протокол E-RAB (E-UTRAN Radio Access Bearer), сеть LTE (Long-Term Evolution), сеть LTE-Advanced, прогнозирование временных рядов, ETS, SARIMA, разложение Прони, XGBoost

Анализируются два основных показателя доступности сети мобильной связи одного из региональных сотовых операторов РФ, а именно проценты неуспешных соединений по протоколам E-RAB (E-UTRAN Radio Access Bearer) и E-RRC (Evolved Radio Resource Control) в сегменте стандарта LTE-A. Основной целью работы является поиск и оценка эффективности алгоритмов прогнозирования показателей доступности. В рамках исследования приводится динамика изменения показателей во времени, причины возможного возникновения неполадок. Анализируется стационарность рассматриваемых временных рядов методом Дики-Фуллера и методом Квятковского-Филлипса-Шмидта-Шина. Рассчитывается доля значений временного ряда, соответствующих нештатным ситуациям на сети (выбросам). Приводятся результаты ETS-раз-ложения временных рядов. Для прогнозирования будущих значений показателей используются модель SARIMA, тройное экспоненциальное сглаживание (метод Холта-Винтера), Facebook Prophet, модель на основе разложения Прони, алгоритм XGboost. Оценка эффективности моделей проводится с помощью медианы абсолютной ошибки (Median Absolute Error - MAE), которая рассчитывается двумя способами: по тестовой выборке и усредненно в ходе процедуры кросс-валидации. На основе полученных результатов сравнения составляется рекомендация по использованию определенной предиктивной модели. Также в данной работе приводится схема предполагаемого ПАК (программно-аппаратного комплекса) по сбору, анализу и визуализации необходимых метрик в рамках сети рассматриваемого сотового оператора. Проводится анализ возможности применения решений с открытым исходным кодом, как на этапе сбора и подготовки данных, так и на этапах обучения предиктивной модели и визуализации полученных результатов.

Информация об авторах:

Фадеев Владимир Анатольевич, аспирант, ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия

Зайдуллин Шайхрозы Васимович, аспирант, ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия

Фадеева Злата Сергеевна, магистрант, ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия

Надеев Адель Фирадович, д.ф.-м.н., профессор, ФГБОУ ВО "Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ", г. Казань, Россия

Для цитирования:

Фадеев В.А., Зайдуллин Ш.В., Фадеева З.С., Надеев А.Ф. Система мониторинга показателей доступности сетей мобильной связи стандарта LTE-A // T-Comm: Телекоммуникации и транспорт. 2021. Том 15. №3. С. 4-16.

For citation:

Fadeev V.A., Zaidullin Sh.V., Fadeeva Z.S., Nadeev A.F. (2021) Monitoring system for LTE-A cellular communication network accessibility indicators. T-Comm, vol. 15, no.3, pр. 4-16. (in Russian)

7TT

Введение

Одной из штатных функций OSS (Operation Support System) систем в рамках мобильных сетей четвертого поколения (LTE/LTE-A) является функция управления, включающая в том числе управление нештатными ситуациями (alarm management). Под управлением в данном случае понимается сбор данных с возможностью последующего анализа [1-3].

Более гибким является подход, реализованный в рамках самоорганизующихся сетей (SON - Self-Organized Networks) и систем управления радиоресурсами (RRM - radio resource management)[4, 5], где, например, одной из виртуальных сетевых функций (VNF - Virtual Network Functions) является функция балансировки нагрузки (load balancing)[6-7], занимающаяся сбором и анализом ряда ключевых показателей качества (KPI - Кеу Performance Indicators) с последующим воздействием на сеть связи в целях балансировки нагрузки для нескольких близко расположенных базовых станций. Данный подход нашел свое применение при проектировании сетей пятого и шестого поколений [8].

Однако, уровень технического прогресса в сфере виртуализации позволяет производить локальные доработки к функционалу OSS-систем в том числе и без полного перехода на SON. Более того, функции, предлагаемые рекомендациями органов стандартизации, как правило, не включают возможность прогнозирования нештатных ситуаций.

Данная статья фокусируется на формировании решений по анализу релевантных KPI доступности к ресурсам сети [9] с последующим прогнозированием на базе OSS систем сетей стандарта LTE-A. В качестве опорной точки, рассматриваются данные одного из региональных операторов мобильной связи.

1. Описание объекта исследования

В качестве показателей доступности оператором выбраны две метрики, а именно процент неуспешных соединений по протоколу S1AP [10], в частности неуспешные соединения по протоколу E-RAB (E-UTRAN Radio Access Bearer), и предшествующему ему протоколу E-RRC (E-UTRAN Radio Resource Control), что отвечает общепринятым подходам, описанным в литературе [11]. Обе названные метрики рассчитываются по общей формуле:

KPI

( N

_ I - ш<хт

100%

(1)

Рис. 1. Процедура установления соединения по протоколу E-RRC

Данный тип ошибок составляет 99% общей выборки, оставшийся 1% составляют проблемы связанные с "RRC connection setup": отказ установления соединения из-за нехватки радиоресурсов и отказ из-за внутрисистемных ошибок eNodeB.

Основной причиной возникновения неуспешных соединений по протоколу E-RAB в рамках сети рассматриваемого оператора является неуспешная доставка сообщения типа "E-RAB SETUP REQUEST" (рис. 2) от узла управления мобильностью (ММЕ - Mobility Management Entity), под которой понимается нарушение контрольной суммы сообщения из-за проблем в каналах связи ме^ду базовыми станциями и пакетным ядром (транспортная сеть). Более подробная аналитика приведена в нашем предыдущем исследовании [12].

- это количество успешных соединении, а

Где Nsl

Ntotai - это общее количество попыток соединения по тому или иному протоколу.

Схема установления E-RRC соединения представлена на рис. 1.

Основной причиной неуспешных соединений по данному протоколу для рассматриваемого оператора является отсутствие сообщения "RRC connection setup complete" по восходящему каналу от абонентского оборудования (UE - user equipment) до базовой станции (eNodeB).

Рис. 2. Процедура установления соединения по протоколу E-RAB

Визуальные отображения выбранных параметров за период 2019 года представлены на рис. Зи4.

В случае неуспешных соединений по протоколу E-RRC можно отметить относительно малое количество выбросов, то есть значений, превышающих границы диаграммы размаха (рис. 5): для данного параметра доля выбросов составляет 0.07%.

Для показателя процента неуспешных соединений по протоколу Е-ЯАВ наоборот характерно относительно большое количество выбросов (4.86%), отмечаемое на протяжении всей временной статистики (рис. 6).

Month-wise Box Plot (The Seasonality)

Рис. 3. Динамика изменения параметра неуспешных соединений по протоколу Е-1ЖС за 2019 год.

ERABSETUPFR [пЦмМ)

Ih | г м„

Рис. 4. Динамика изменения параметра неуспешных соединений по протоколу Е-БАВ за 2019 год.

Рис. 5. Диаграмма размаха параметра неуспешных соединений по протоколу Е-КЯС за2019 год

Ajg Эвр Cet M» Ose

Рис. 6. Диаграмма размаха параметра неуспешных соединений по протоколу Е-БАВ за 2019 год

В ходе ADF (Augmented Dickey-Fuller) и KPPS (Kwiatkowski-Phillips-Schmidt-Shin) тестов было выяснено, что оба KPI могут рассматриваться в качестве стационарных временных рядов.

Данные временные ряды являются, в том числе, сезонными (периодическими), при этом один период составляет 24 часа (рис. 7, 8).

or J1 m 07-31 II -/• 21 ПГ 7,7 27 ' 1 Dr -Ч ТУГ ОГпЗЭ 12 Dr 27. ПГ

Рис. 7. Динамика изменения параметра неуспешных соединений по протоколу E-RRC, взятая за несколько суток.

E_RAB_SETUP_FR (wvanl олп'.

Рис. 8. Динамика изменения параметра неуспешных соединений по протоколу Е-БАВ, взятая за несколько суток

7ТЛ

При этом нужно отметить, что амплитуды пиковых дневных показателей неуспешных соединений по протоколу Е-ЯАВ визуально могут отличаться друг от друга относительно сильно.

2. Методы прогнозирования КР1 сети мобильной связи

В литературе представлено несколько вариантов прогнозирования КР1 сети мобильной связи [13-15]. Используют такие подходы преимущественно линейную регрессию для прогнозирования изменения трендов в долгосрочной перспективе. Также в литературе представлены различные методики выбора оптимального метода анализа и прогнозирования временных рядов [16-18]. В рамках данного исследования были отобраны наиболее распространенные методы прогнозирования временных рядов, учитывающие не только трендовую, но и сезонную составляющие. В исследование включены как линейные, так и нелинейные подходы.

Veasenal Component ci Ш derampossiton additive fc_RM£5fc ruPJ-R

п 1 А л л л А А А Ал г \

IQ

1 l 1 11 Ш i

у у у у

■eVT mr tf7 -fiv

№t«

Рис. 10. Визуализация сезонной компоненты ЕТв-разложения для протокола Е-КЯС (аддитивная модель)

3.1. Разложение временного ряда на компоненты

Одним из самых простых подходов к моделированию временных рядов, обладающих сезонностью, является метод разложения на компоненты (ETS - error, trend, seasonality) [19]. Выбранная модель при этом может быть или аддитивной, или мультипликативной.

Аддитивная модель может быть представлена в виде:

(2)

Где - это значение временного ряда в момент времени ;, 8/; - это сезонная составляющая, Т; - трендовая составляющая, а^- это составляющая случайных шумов. Визуализация составляющих аддитивной модели для рассматриваемых КР1 в представлена на рис. 9-12.

VniuUjtnn d the its Dccnn

1 I»

Job 1ш

г

• ■

Рис. 9. Визуализация трендовой и остаточной компонент ЕТв-разложения для протокола Е-ЯЯС (аддитивная модель)

Мультипликативная модель может быть выражена как: что в свою очередь эквивалентно следующему выражению:

(4)

Рис. 11. Визуализация трендовой и остаточной компонент ЕТв-разложения для протокола Е-БАВ (аддитивная модель)

Рис. 12. Визуализация сезонной компоненты ЕТв-разложения для протокола Е-БАВ (аддитивная модель)

Визуализация составляющих мультипликативной модели для рассматриваемых КР1 в представлена на рис. 13-16.

Рис. 13. Визуализация треидовой и остаточной компонент ЕТв-разложения для протокола Е-КЯС (мультипликативная модель)

Рис. 16. Визуализация сезонной компоненты ЕТв- разложения для протокола Е-БАВ (мультипликативная модель)

Исходя из значений случайных шумов (residual), представленных на рисунках 9, 11, 13 и 15, нами был сделан вывод, что аддитивная модель является более подходящей для рассматриваемых KPI. Данный тип моделирования сигналов рассматривается нами также в качестве теоретического базиса для других линейных методов прогнозирования семейства ETS.

3.2. Тройное экспоненциальное сглаживание

Одним из классических линейных методов семейства ETS является экспоненциальное сглаживание (exponential smoothing). В данном исследовании нами рассматривается его тройная форма, используемая для прогнозирования обладающих сезонной компонентой временных рядов. Данная модель известна также, как метод Хольта-Винтера (Holt-Winter) [19-21].

Наиболее распространенной формой такого экспоненциального сглаживания является аддитивное представление. Значение временного ряда в момент времени t для данного метода будет иметь вид:

Рис. 14. Визуализация сезонной компоненты ЕТв- разложения для протокола Е-КЯС (мультипликативная модель)

yt+h = it+i<P+<P2+-- + <Ph)bt+st+h_

т(к+1) (5)

UtaiultMon of the f TS. Drccr

Jfipliulivr t P.AH_Si tUS^FR

J

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— . IJ. I ..i .Li b ......,t

14ml Сотрет** 1Г> itttr-^n-lu- «¿dim

-i-1

_

IAJUUUAAJLL^JJ __ *—~__- » - -V

taudjJi d ¿кшчкиисол

Ш \I ir'jnrtifefr..........

Рис. 15. Визуализация трендовой и остаточной компонент ЕТв-разложения для протокола Е-БАВ (мультипликативная модель)

где 0 < ф < 1 - это параметр затухания тренда (для незатухающих трендов данный параметр равен 1), h - это целое число показывающее, насколько отсчетов вперед должен быть сделан прогноз, т - это количество отсчетов, входящих в один период, к - это целая часть от (И - \) / от, гарантирующая, что используемые для прогнозирования оценки сезонных индексов относятся к последнему году выборки.

Значение уровня (level) значений временного ряда в момент времени t выражается следующей формулой:

(6)

где 0< а <1- это параметр сглаживания. Значение изгиба (slope) трендовой составляющей в момент времени t может быть вычислено как:

где 0 < Р < 1 - это параметр сглаживания тренда. В нашем случае оба временных ряда являются стационарными, а значит данная компонента не является составной частью модели.

Значение сезонной компоненты в момент / вычисляется по следующей формуле:

(8)

где 0<у<1-а- это параметр сглаживание сезонной компоненты.

Неизвестные коэффициенты а, (3 и у определяются на этапе обучения модели методом максимального правдоподобия [19, 22]. В рамках наиболее распространенной программной реализации [22] значение уровня в нулевой момент времени по умолчанию равняется значению временного ряда в тот же момент времени.

В рамках программной реализации [22, 23] для сезонной компоненты и для тренда вводятся дополнительные понятия аддитивности и мультипликативности, исходя из которых осуществляются разные методики расчета инициализирующих значений сезонности и изгиба тренда. Нулевое значение сезонности (нулевой период) для ее аддитивной или мультипликативной формы рассчитывается как разность или отношение между первыми т отсчетами и нулевым значением уровня соответственно. На основе проведенных нами сравнительных тестов было выяснено, что сезонность обоих временных рядов является аддитивной составляющей.

Результаты валидации и кросс-валидации моделирования с с аддитивной сезонностью для названных выше KPI представлены в таблицах 1 и 2.

3.3. Модель SARIMA

Еще одним классическим линейным методом является сезонная интегрированная авторегрессионная модель скользящего среднего (SARIMA - seasonal autoregressive integrated moving average) [19, 24, 25], описываемая, как правило, через форму вида (р, d, q) X (Р, D, О, s), где р и Р - количество необходимых предшествующих отсчетов и периодов временного ряда регулярной и сезонной компонент соответственно, d и D - порядки дифференцирования, необходимые для приведения к стационарной форме регулярной и сезонной составляющих соответственно, q и О - количество необходимых значений ошибок аппроксимации регулярной и сезонной компонент соответственно, as — это количество отсчетов временного ряда, составляющих один период.

Значение временного ряда ^'г и ошибка аппроксимации fc t соотносятся между собой через уравнение следующего вида:

Фр( В*) Фр{ В) V f V = eq{ В) €>Q{ В*) ef

(9)

где

- это сезонная составляющая авторегрессионной (AR - autoregressive) части модели порядка Р,

(рр{В) =(1 - - :.-<ррВР)

ляющая и —

авторегрессионнои

Vf = ( l-ß-0% V' = (l- В)

это регулярная состав-части порядка p,

- это операторы набла для сезонной и регулярной составляющих порядков D и d соответственно (не являются составной частью модели в нашем случае в силу стационарности рассматриваемых временных рядов),

елвs) = (1 - е.в* - ... - епв&\

Q \ 1 Q ) - это сезонная составляю-

щая скользящей средней порядка О,

в {В) =( 1 - в .В - ... - в Вч)

<г V 1 q J - это регулярная часть сколь-

зящей средней (MA - moving average) порядка q, a B - это лаговый оператор.

Подбор параметровр, d, q, P, D и Q может быть осуществлен автоматически с помощью алгоритма описанного в [26], на каждой итерации которого множества неизвестных коэффициентов многочленов AR и МА оцениваются на основе одного из оптимизационных алгоритмов [27] по критерию максимального правдоподобия. Нужно также отметить, что данный метод имеет потенциал к уточнению внешними (exogenous) переменными (SARIMAX модель) [27].

Основываясь на информационном критерии Акаике (AIC) для параметра неуспешных соединений по протоколу E-RRC была отобрана модель с параметрами (2, 0, 1) X (1, 0, 2, 24). Для параметра неуспешных соединений по протоколу E-RAB, исходя из того же критерия, была отобрана модель (1, 0, 2) X (2, 0, 1, 24). Результаты валидации и кросс-валидации отобранных для названных KPI моделей представлены в таблицах 1 и 2.

3.4. Facebook Prophet

Модель Prophet была разработана компанией Facebook в качестве способной к одновременной оценке нескольких сезонных компонент альтернативы экспоненциальному сглаживанию и SARIMA, не требующей к тому же предварительной интерполяции временного ряда для восполнения отсутствующих данных в какие-либо моменты времени [28].

Данная модель представляет собой модификацию обобщенной аддитивной модели [28], [30]. В качестве априорной модели сигнала используется обобщение аддитивного ETS-разложения [28]:

y(t) = s(t) + g(t) + h(t) + £

(И)

Где s(;) - это сезонная компонента, g(/) - это компонента тренда, выражаемая как правило либо через линейную, либо через логистическую модель, - компонента, характеризующая важные общественные события и праздничные дни, а £(/) - случайная ошибка модели. Для моделирования сигналов, подразумевающих мультипликативное разложение, используется схожий с представленным в формуле (4) метод логарифмирования исходной последовательности.

Сезонная компонента моделируется с помощью разложения в ряд Фурье:

(12)

где Р - ожидаемый период сезонной компоненты, N — количество гармоник, а„, Ьп - коэффициенты ряда, (в качестве начальных значений берутся случайные числа, распределенные по нормальному закону). Для количества гармоник не существует какого-либо строгого математического выраже-

ния, авторами [28] эмпирически установлены значения N = 10 - для сезонной компоненты с длиной периода от недели до года, 3 — для компоненты с более коротким периодом.

Компонента важных событий характеризует важные события в жизни общества, которые могут повлиять на значения исследуемого временного ряда. Моделируется данная компонента с помощью индикаторной функции-матрицы, определяемой следующим образом:

Z(0 =[l(îe£>,) ... l(i ÉDt)]

(13)

где L — общее число важных событий за прошедший период, 1 - вектор-столбец длиной Nseries - L, состоящий из единиц, Кseries ~ длина всего рассматриваемого промежутка времени. Для получения полной компоненты используются значения функции в момент заданного события:

t) = Z(t) к

(14)

где к — вектор значений ряда в моменты важных событий.

В данной работе в качестве дат важных событий были выбраны следующие числа: 1.01.2019, 23.02.2019, 8.03.2019, 1.05.2019, .05.2019, .06.2019, .08.2019, .11.2019, 6.11.2019, 31.12.2019. Результаты моделирования рассматриваемых KPI представлены в таблицах 1 и 2.

Реализация модели с открытым исходным кодом на языках Python и R доступна по ссылке [35].

3.5. Метод прогнозирования на основе разложения Прони

Одним из перспективных методов моделирования сигналов с последующим прогнозированием можно назвать подход, основанный на разложении Прони и названный авторами [32] методом "универсальной" подгоночной функции ("universal" fitting function).

Данный подход может быть реализован в соответствии с описанным в [32-34] алгоритмом. Для этого нужно разбить доступную выборку на М последовательностей (реализаций) и рассчитать усредненную реализацию:

у{ t) = <у{ t) >

1 М

M т

m — 1

(15)

Далее необходимо найти отклонения (slopes) от усредненной реализации. Каждое значение отклонения будет отношением скалярного произведения т-ой реализации и усредненной реализации и скалярного произведения усредненной реализации с самой собой:

SL =

m

У У

J m J

УУ

(16)

На основе данных отклонений вычисляется степень достоверности (reliability) выборки данных по следующей формуле [33]:

R =

N

N +N + N.

тп up an j

х 100% =

x 100%

Где АТс!п — это количество отклонений, значения которых находятся выше границы 8Ьтп + Апр при

, * тшс (SLm) - тп

8Ь =— YsL л = тш1"м-

тп д/ Лш^ т " ип

Ы11п - это количество отклонений, значения которых находятся ниже границы 8Ьтп - Ас1„ при

л*ш

- min (SL ) - SL

\ mj I

m=\...M

a Nm„ - это все значения отклонений, находящиеся между указанными выше пределами.

Для неуспешных соединений по протоколу E-RRC достоверность составила 41.7%, для неуспешных соединений по протоколу E-RAB 58.3%, что согласно [33] считается "приемлемым" для обоих KPI. Распределения отклонений приведены на рисунках 17 и 18.

Slopes and maximal deviations of the signal

• -*- Sorted siöp£5 ■ ■ Mean геа tot ion —■ Uopet uVùi'iti — 1 nwcr hiHjnrt • Slop«

1 \

ч

Xt

!

Number of experiments

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 17. Распределение отклонений для неуспешных соединений по протоколу E-RRC

Slopes and maximal deviations of the signal

- 1 Sorted slopes — Мвдп réalisât ГШ 4 4

- UppeT b&ürid - Lower bound * Slopes.

IL

■ *-- >

4.

Number of experiments

Рис. 18. Распределение отклонений для неуспешных соединений по протоколу E-RAB

На основе выделенных выше трех кластеров отклонений составляется линейное уравнение вида:

(18)

Где <Fmn(t)> - это усредненная реализация множества реализаций, чьи отклонения принадлежат к кластеру, находящемуся между границами SLmn + Aup и Smn - Adn;

<Fup(t)> - это усредненная реализация кластера, находящегося выше SLmn + Aup; a <Fdn{t)> - это соответственно усредненная реализация кластера, находящегося ниже Smn - Adn.

Исходя из данного уравнения, методом наименьших квадратов (LLS - linear least squares) находят переменные, a0(t), a\{t) и которые в свою очередь составляют следующее характеристическое уравнение [34]:

к2 - а^к -

а0 = О

(19)

Корни данного уравнения используются уже в рамках, так называемой, подгоночной функции, основанной на разложении Прони [33], а именно ее гармонической составляющей:

я0( /) =[*!< О ]f/r'+ [1*2( О \]t,T3

Т s( Тч

Т =— + — 27*--

' 2 S{ 2/

(20) (21)

где Т - это длина каждой из М последовательностей (реализаций), 5 - это длина массива, содержащего целочисленные значения от 0.5 Т до 2Т.

Сама, так называемая, подгоночная функция имеет следующий вид:

<y(t)>=F{t-K,Ts) =AQEQ(t) +

К>> 1

2 (AckEck(t)+AskEsk(t)) k=i

к» 1

АДО + I

fc=i

AckEQ( t) cos

( <" i \\ t

2 жк— Т + AskEQ(t) sin 2лк— т

\ s > 1 \ s))

(22)

(23)

Результаты применения описанной в данном разделе модели приведены в таблицах 1 и2. Исходные коды рассмотренной модели доступны по ссылке [35].

3.6. Метод градиентного бустинга случайных деревьев

Одним из наиболее распространенных методов машинного обучения на данный момент является алгоритм ХОВоо81 [36, 37], представляющий из себя эффективную с точки зрения вычислительной способности реализацию градиентного бустинга деревьев принятия решений и использующийся как для задач классификации, так и для задач регрессии.

Для построения деревьев принятия решений в рамках рассматриваемых КР1 нами было отобрано следующее множество признаков: день в году, день месяца, день недели, месяц, квартал, час.

Распределения весов признаков, полученное в ходе применения алгоритма ХОВоо81;, для неуспешных соединений по протоколам Е-КЯС и Е-ЯАВ представлены на рисунках 11и12 соответственно.

Коэффициенты Лск® и Лзк® для каждой к-ой моды разложения Прони вычисляются на каждой итерации обучения модели методом наименьших квадратов. Переменные ^ и К подбираются итеративно по критерию минимальной относительной ошибки [32-34]:

Рис. 11. Распределение временных признаков для неуспешных соединений по протоколу Е-КЯС.

Рис. 12. Распределение временных признаков для неуспешных соединений по протоколу Е-ЯАВ

Как видно из полученных результатов, одним из двух основных признаков для построения модели стали часы, что, на наш взгляд, подтверждает сезонность рассматриваемых параметров в рамках 24 часов.

т т

Таблица 1

Результаты прогнозирования параметра неуспешных соединений по протоколу E-RRC

Метод прогнозирования МАЕ по тестовой выборке (%) Усредненная МАЕ по результатам кросс-валидации (%)

Holt-Winter 0.0104 0.0313

SARIMA 0.0044 0.0073

Facebook Prophet (без учета праздничных дней) 0.0045 0.0083

Facebook Prophet (с учетом праздничных дней) 0.0044 0.0082

Prony decomposition based "universal" fitting function 0.0153 0.0199

XGBoost 0.0035 0.0037

Для неуспешных соединений по протоколу E-RRC день недели играет большую роль, чем число месяца, что косвенно свидетельствует о том, что значения данного KPI сильнее зависят от циклов рабочей недели. Для неуспешных соединений по протоколу E-RAB наоборот, что может быть обусловлено относительно большим количеством выбросов по данному KPI. Конкретный месяц и квартал влияют в наименьшей степени на оба рассматриваемых нами KPI.

Результаты моделирования представлены в табл. 1 и 2 для показателя неуспешных соединений по протоколу E-RRC и показателя неуспешных соединений по протоколу E-RAB соответственно.

3.7. Анализ полученных результатов

Исходя из поставленной изначально задачи прогнозирования не относящихся к выбросам частей временных выборок, в качестве критерия была выбрана медианная абсолютная ошибка (МАЕ - median absolute error) [38], позволяющая нивелировать ошибки обучения модели для выбросов.

Сравнение выбранных методов прогнозирования проводилось в два этапа. Первый этап состоял в обучении по тренировочной выборке, состоящей из первых 11 месяцев 2019 г., и расчете МАЕ по тестовой выборке, состоящей из значений, относящихся к декабрю 2019 г. На втором этапе проводился расчет усредненной МАЕ по результатам проведенной кросс-валидации временных рядов (рис. 13), при минимальной длине и шагом прироста обучающей выборки равным одному месяцу.

Рис. 13. Схема использованной в рамках исследования кросс-валидации временных рядов [39]

Результаты моделирования представлены в табл. 1 и 2 для показателя неуспешных соединений по протоколу Е-РР.С и показателя неуспешных соединений по протоколу Е-ЯАВ соответственно.

Исходя из полученных результатов алгоритм ХвВоов! является наиболее предпочтительным вариантом предик-тивной модели. Также стоит отметить, что данный алгоритм имеет достаточную для поставленных задач вычислительную скорость.

Таблица 2

Результаты прогнозирования параметра неуспешных соединений по протоколу Е-РАВ

Метод прогнозирования МАЕ по тестовой выборке (%) Усредненная МАЕ по результатам кросс-валидации (%)

Holt-Winter 0.04 0.07

SARIMA 0.07 0.06

Facebook Prophet (без учета праздничных дней) 0.04 0.09

Facebook Prophet (с учетом праздничных дней) 0.05 0.08

Prony decomposition based "universal" fitting function 0.08 0.07

XGBoost 0.01 0.03

2. Предлагаемая система мониторинга показателей доступности сетей мобильной связи стандарта ЬТЕ-А

Рассматриваемые в данной работе показатели доступности предоставляют достаточно важную информацию об инцидентах на сети. По этой причине, анализ таких показателей может выявить причину инцидента, а прогнозирование позволит предотвратить инцидент до его начала. На рисунке 14 приведена обобщенная структурная схема предлагаемой системы мониторинга.

Рис 14. Структурная схема предлагаемой системы мониторинга

Данная система может быть реализована в виде кросс-платформенного программного решения с открытым исходным кодом. При этом несколько модулей схемы могут быть реализованы на одной физической или виртуальной машине в качестве микросервисов с помощью инструментов контейнеризации.

В качестве хранилища данных (data storage) предлагается использовать СУБД Clickhouse [40] в силу ее быстродействия при обработке больших объемов данных и оптимизиро-ванности для хранения и обработки временных рядов.

Модуль модели предсказания (predictive model) представляет собой реализацию алгоритма XGBoost, который может быть реализован с помощью различных языков программирования таких, как Python 3, С++, Julia, Lúa и др. Необходимым критерием для выбора языка является принципиальная возможность высокопроизводительной реализации модели предсказания и коннектора для доступа к хранилищу данных.

Для визуализации данных (UI - user interface) нами предлагается использование таких программные продукты с открытым исходным кодом, как Grafana [41] и Elasticsearch [42], в силу их широкого спектра инструментов отображения, анализа и последующей обработки данных.

Заключение

В ходе работы были рассмотрены и проанализированы два показателя доступности сети LTE-A, а именно проценты неуспешных соединений по протоколам E-RRC и E-RAB.

Приведены основные причины возникновения нештатных ситуаций, дано описание временной динамики иссле-

дуемых KPI. Кроме того, был проведен анализ разброса значений показателей в течение определенных интервалов времени (рис. 5, 6), который позволяет получить более подробную характеристику проблемных ситуаций связанных с отсутствием или качеством связи, в указанные промежутки.

На основании предварительного ETS разложения были сформированы первичные гипотезы для выбора модели предсказания. Также результаты были использованы при анализе проблемных ситуаций, в рамках выявления периодичности во временной динамике, которая в свою очередь связана с индикаторами загруженности сети.

В рамках исследования были проанализированы наиболее распространенные методы предсказания показателей, использующие динамику изменения исследуемых KPI во времени, и предложена схема использования данных алгоритмов для обнаружения и предупреждения инцидентов в работе сети. Все рассмотренные модели предсказания имеют сравнительно небольшой процент ошибки и могут быть использованы в целях мониторинга работы сети сотовой связи, однако исходя из сравнительного анализа более предпочтительным для решения поставленных задач является алгоритм XGBoost.

Однако, вопрос прогнозирования значений, считающихся выбросами, не является закрытым. Данный вид прогнозирования особенно актуален для показателя неуспешных соединений по протоколу E-RAB (4.86% выбросов от общей выборки). В целях разработки алгоритмов, способных прогнозировать данный тип значений, планируется рассмотрение нейросетевых моделей, а также исследование динамики различных показателей сети как во времени, так и в пространстве (относительно конкретных сот и секторов).

Литература

1. ETSI TS 132 111-1 V12.1.0 (2015-01).

2. Recommendation ITU-T М.3703.

3. Recommendation ITU-T X.733.

4. ETSITR 136 902 V9.3.1 (2011-05).

5. Hamalainen, S., Sanneck, H. and Sartori, C. eds., 2012. LTE self-organising networks (SON): network management automation for operational efficiency. John Wiley & Sons. 226 p.

6. ETSITS 132 522 Vll.6.1 (2013-07).

7. ETSI TS 128 500 V14.1.0 (2017-04).

8. Akyildiz, I.F., Kak, A. and Nie, S., 2020. 6G and beyond: The future ofwireless communications systems. IEEE Access, 8, pp.133995134030.

9. ETSI TS 132 450 V9.1.0 (2010-07).

10. ETSI TS 136 413 V12.3.0 (2014-09).

11. Kreher, Ralf, and Karsten Gaenger. LTE signaling: troubleshooting and optimization. John Wiley & Sons, 2010. C. 244-252.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Фадеев B.A., Зайдуллин Ш.В. and Надеее А.Ф., 2020. Анализ неуспешных соединений по протоколу E-RAB сети мобильной связи стандарта LTE-A. T-Comm: Телекоммуникации и транспорт, 14(7), pp. 4-12.

13. Kalderen B.O.E. and Mindler D. Verizon Patent and Licensing Inc, 2018. Identification ofwireless communication congestion. U.S. Patent 9, 930, 548.

14. Gopalakrishnan, N., Yang, J., Roa, J., Mathew, J., Sheen, B.S. and Ren, Y., FutureWei Technologies Inc, 2017. Predicting Network Performance. U.S. Patent Application 14/810,699.

15. Singh, R.K., Barr, D.K., Bharti, S. and Kalva, S., InMobi Pte Ltd, 2016. Time series forecasting using spectral technique. U.S. Patent Application 14/837, 618.

7TT

16. Crosswhite, C.E., 2003. Method for determining optimal time series forecasting parameters. U.S. Patent 6,611, 726.

17. Bontempi, G., Taieb, S.B. and Le Borgne, Y.A., 2012, July. Machine learning strategies for time series forecasting. In European business intelligence summer school (pp. 62-77). Springer, Berlin, Heidelberg.

18. Pan, B., Demiryurek, U. and Shahabi, C., University of Southern California USC, 2016. Traffic prediction using real-world transportation data. U.S. Patent 9, 286, 793.

19. Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. OTexts.com/fpp2. Accessed on 1.10.2020.

20. Holt, C. E. (1957). Forecasting seasonals and trends by exponentially weighted averages (O.N.R. Memorandum No. 52). Carnegie Institute of Technology, Pittsburgh USA. https://doi.Org/10.1016/j.ijforecast.2003.09.015

21. Winters, P. R. (I960). Forecasting sales by exponentially weighted moving averages. Management Science, 6, 324-342. https://doi.Org/10.1287/mnsc.6.3.324

22. Statsmodels.org. smodels.Tsa.Holtwinters. Exponentialsmoothing - Statsmodels. [online] Available at: <https://www.statsmodels.org/dev/generated/statsmodels.tsa.holtwinters ExponentialSmoothing.html> [Accessed 7 October 2020].

23. GitHub. 2020. Statsmodels/Statsmodels. [online] Available at: <https://github.com/statsmodels/statsmodels/blob/master/statsmodels/tsa /holtwinters/model.py> [Accessed 7 October 2020].

24. Box, G. E. P., & Jenkins, G. M (1970). Time series analysis: Forecasting and control. San Francisco: Holden-Day.

25. Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Time series analysis: Forecasting and control (5th ed.). Hobo-ken, New Jersey: John Wiley & Sons.

26. Hyndman, R.J. and Khandakar, Y., 2007. Automatic time series for forecasting: the forecast package for R (No. 6/07). Clayton VIC, Australia: Monash University, Department of Econometrics and Business Statistics.

27. Alkaline-ml.com. 2020. Pyramid.Arima.Auto_Arima - Pyramid 0.9.0 Documentation, [online] Available at: <https://alkaline-ml.com/pmdarima/0.9.0/modules/generated/pyramid.arima.auto_arima.h tml> [Accessed 7 October 2020].

28. Sean J. Taylor, Benjamin Letham (2018) Forecasting at scale. The American Statistician 72(l):37-45

29. Harvey, A. & Peters, S. (1990), Estimation procedures for structural time series models //Journal of Forecasting, 9, pp. 89-108.

30. Hastie, T. & Tibshirani, R. (1987), Generalized additive models: some applications //Journal of the American Statistical Associa-tion82(398),pp. 371-386.

31. GitHub. 2020. Facebook/Prophet. [online] Available at: <https://github.com/facebook/prophet/tree/master/python> [Accessed 18 October 2020].

32. Nigmatullin, R.R., Zhang, W. andStriccoli, D., 2017. "Universal" Fitting Function for Complex Systems: Case of the Short Samplings. Journal of Applied NonlinearDynamics, 6(3), pp. 427-443.

33. Nigmatullin, R.R., Zhang, W. and Striccoli, D., 2015. General theory of experiment containing reproducible data: The reduction to an ideal experiment. Communications in Nonlinear Science and Numerical Simulation, 27(1-3), pp. 175-192.

34. Nigmatullin, R.R., Maione, G., Lino, P., Saponaro, F. and Zhang, W., 2017. The general theory of the Quasi-reproducible experiments: How to describe the measured data of complex systems?. Communications in Nonlinear Science and Numerical Simulation, 42, pp. 324-341.

35. Gist. 2020. Enigma_Tools.Py. [online] Available at: <https://gist.github.com/kirlf/9acdac082bl4a56c30b272ebbb896d82> [Accessed 16 0ctober2020].

36. Chen, T. and Guestrin, C., 2016, August. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785794).

37. GitHub. 2020. Dmlc/Xgboost. [online] Available at: <https://github.com/dmlc/xgboost> [Accessed 19 0ctober2020],

38. Scikit-learn.org. 2020. Sklearn.Metrics.Median_Absolute_ Error - Scikit-Learn 0.23.2 Documentation, [online] Available at: <https://scikit-learn.org/stable/modules/generated/sklearn.metrics. median_absolute_error.html> [Accessed 19 0ctober2020],

39. Ethen8181.github.io. 2020. l_Exponential_Smoothing. [online] Available at: <http://ethen8181.github.io/machine-learning/ time_series/l_exponential_smoothing.html> [Accessed 19 October 2020].

40. GitHub. (2020). ClickHouse/ClickHouse. [online] Available at: <https://github.com/ClickHouse/ClickHouse> [Accessed 20 October 2020].

41. GitHub. (2020). Grafana. [online] Available at: <https://github.com/grafana/grafana> [Accessed 20 October 2020].

42. GitHub. (2020). Elastic Search, [online] Available at: <https://github.com/elastic/elasticsearch> [Accessed 20 October 2020].

MONITORING SYSTEM FOR LTE-A CELLULAR COMMUNICATION NETWORK ACCESSIBILITY INDICATORS

Vladimir Fadeev, Kazan National Research Technical University named after A.N. Tupolev-KAI, Kazan, Russia, vafadeev@kai.ru Shaikhrozy Zaidullin, Kazan National Research Technical University named after A.N. Tupolev-KAI, Kazan, Russia, shvzaydullin@stud.kai.ru Zlata Fadeeva, Kazan National Research Technical University named after A.N. Tupolev-KAI, Kazan, Russia, zsgibalina@stud.kai.ru Adel Nadeev, Kazan National Research Technical University named after A.N. Tupolev-KAI, Kazan, Russia, afnadeev@kai.ru

Abstract

In this paper we consider two accessibility indicators, namely E-RAB (E-UTRAN Radio Access Bearer) and E-RRC (Evolved Radio Resource Control) failure rates, of the LTE-A communication network belonging to one of the regional operators in Russian Federation. The aim of this study is to find the proper algorithms for accessibility indicators prediction, and performance estimation of these algorithms. During the study, we provide temporal dynamics of the indicators and possible failure reasons, behind these indicators. Then the percentage of the time series values is shown, which are corresponding to the abnormal situations (incidents). After that, the sta-tionarity of the inspected time series using augmented Dickey-Fuller (ADFuller), and Kwiatkowski-Phillips-Schmidt-Shin (KPSS) methods is analyzed. Next, the ETS decomposition is performed. In order to predict the future values of the indicators, we utilize SARIMA model, triple Exponential Smoothing (Holt-Winters method), Facebook Prophet, Prony decomposition based model and XGBoost algorithm. Performance estimation is obtained in two ways: by test-sequence- and cross-validation-based Median Absolute Error (MAE). Also, the architecture for the monitoring system, that collects, analyzes and visualizes the required metrics within the infrastructure of the considered operator, is proposed in this paper. Herein, we analyze the possibilities of the open-source solution deployment on each stage of the monitoring process from data mining and preparation up to predictive model learning.

Keywords: key performance identifiers (KPI), RAB (Radio Access Bearer) protocol, E-RAB (E-UTRAN Radio Access Bearer), LTE (Long-Term Evolution) network, LTE-Advanced network, time series forecasting, ETS, SARIMA, Prony decomposition, XGBoost.

References

1. ETSI TS 132 111-1 V12.1.0 (2015-01).

2. Recommendation ITU-T M.3703.

3. Recommendation ITU-T X.733.

4. ETSI TR 136 902 V9.3.1 (2011-05).

5. Hamalainen, S., Sanneck, H. and Sartori, C. eds., (2012). LTE self-organising networks (SON): network management automation for operational efficiency. John Wiley & Sons. 226 p.

6. ETSI TS 132 522 V11.6.1 (2013-07).

7. ETSI TS 128 500 V14.1.0 (2017-04).

8. Akyildiz, I.F., Kak, A. and Nie, S. (2020). 6G and beyond: The future of wireless communications systems. IEEE Access, 8, pp. 133995-134030.

9. ETSI TS 132 450 V9.1.0 (2010-07).

10. ETSI TS 136 413 V12.3.0 (2014-09).

11. Kreher, Ralf, and Karsten Gaenger. LTE signaling: trouble-shooting and optimization. John Wiley & Sons, 2010. P. 244-252.

12. Fadeev V.A., Zaydullin S.V., Nadeev A.F. (2020). Analysis of unsuccessful E-RAB protocol connections on the LTE-A standard mobile communication network. T-Comm. Vol. 14, no.7, pр. 4-12.

13. Kalderen, B.O.E. and Mindler, D., Verizon Patent and Licensing Inc, (2018). Identification of wireless communication congestion. U.S. Patent 9,930,548.

14. Gopalakrishnan, N., Yang, J., Roa, J., Mathew, J., Sheen, B.S. and Ren, Y., FutureWei Technologies Inc, (2017). Predicting Network Performance. U.S. Patent Application 14/810,699.

15. Singh, R.K., Barr, D.K., Bharti, S. and Kalva, S., InMobi Pte Ltd, (2016). Time series forecasting using spectral technique. U.S. Patent Application 14/837,618.

16. Crosswhite, C.E., (2003). Method for determining optimal time series forecasting parameters. U.S. Patent 6,611,726.

17. Bontempi, G., Taieb, S.B. and Le Borgne, Y.A., (2012), July. Machine learning strategies for time series forecasting. In European business intelligence summer school, pp. 62-77. Springer, Berlin, Heidelberg.

18. Pan, B., Demiryurek, U. and Shahabi, C., University of Southern California USC, (2016). Traffic prediction using real-world transportation data. U.S. Patent 9,286,793.

19. Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. OTexts.com/fpp2. Accessed on 1.10.2020.

20. Holt, C. E. (1957). Forecasting seasonals and trends by exponentially weighted averages (O.N.R. Memorandum No. 52). Carnegie Institute of Technology, Pittsburgh USA. https://doi.org/10.1016/j.ijforecast.2003.09.015.

21. Winters, P.R. (1960). Forecasting sales by exponentially weighted moving averages. Management Science, 6, 324-342. https://doi.org/10.1287/mnsc.6.3.324.

22. Statsmodels.org. 2020. Statsmodels.Tsa.Holtwinters.Exponentialsmoothing - Statsmodels. [online] Available at: <https://www.statsmodels.org/dev/generated/statsmodels.tsa.holtwinters.ExponentialSmoothing.html> [Accessed 7 October 2020].

23. GitHub. 2020. Statsmodels/Statsmodels. [online] Available at: <https://github.com/statsmodels/statsmodels/blob/master/statsmod-els/tsa/holtwinters/model.py> [Accessed 7 October 2020].

24. Box, G. E. P., & Jenkins, G. M. (1970). Time series analysis: Forecasting and control. San Francisco: Holden-Day.

25. Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Time series analysis: Forecasting and control (5th ed). Hoboken, New Jersey: John Wiley & Sons.

26. Hyndman, R.J. and Khandakar, Y., (2007). Automatic time series for forecasting: the forecast package for R (No. 6/07). Clayton VIC, Australia: Monash University, Department of Econometrics and Business Statistics.

27. Alkaline-ml.com. 2020. Pyramid.Arima.Auto_Arima - Pyramid 0.9.0 Documentation. [online] Available at: <https://alkaline-ml.com/pmdarima/0.9.0/modules/generated/pyramid.arima.auto_arima.html> [Accessed 7 October 2020].

28. Sean J. Taylor, Benjamin Letham (2018) Forecasting at scale. The American Statistician 72(1):37-45.

29. Harvey, A. & Peters, S. (1990), 'Estimation procedures for structural time series models',Journal of Forecasting, 9, 89-108.

30. Hastie, T. & Tibshirani, R. (1987), 'Generalized additive models: some applications',Jour-nal of the American Statistical Association82(398), 371-386.

31. GitHub. 2020. Facebook/Prophet. [online] Available at: <https://github.com/facebook/prophet/tree/master/python> [Accessed 18 October 2020].

32. Nigmatullin, R.R., Zhang, W. and Striccoli, D., (2017). "Universal" Fitting Function for Complex Systems: Case of the Short Samplings. Journal of Applied Nonlinear Dynamics, 6(3), pp. 427-443.

33. Nigmatullin, R.R., Zhang, W. and Striccoli, D., 2015. General theory of experiment containing reproducible data: The reduction to an ideal experiment. Communications in Nonlinear Science and Numerical Simulation, 27(1-3), pp. 175-192.

34. Nigmatullin, R.R., Maione, G., Lino, P., Saponaro, F. and Zhang, W., (2017). The general theory of the Quasi-reproducible experiments: How to describe the measured data of complex systems?. Communications in Nonlinear Science and Numerical Simulation, 42, pp. 324-341.

35. Gist. 2020. Enigma_Tools.Py. [online] Available at: <https://gist.github.com/kirlf/9acdac082b14a56c30b272ebbb896d82> [Accessed 16 October 2020].

36. Chen, T. and Guestrin, C., (2016), August. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pp. 785-794.

37. GitHub. (2020). Dmlc/Xgboost. [online] Available at: <https://github.com/dmlc/xgboost> [Accessed 19 October 2020].

38. Scikit-learn.org. 2020. Sklearn.Metrics.Median_Absolute_Error - Scikit-Learn 0.23.2 Documentation. [online] Available at: <https://scikit-learn.org/stable/modules/generated/sklearn.metrics.median_absolute_error.html> [Accessed 19 October 2020].

39. Ethen8181.github.io. (2020). 1_Exponential_Smoothing. [online] Available at: <http://ethen8181.github.io/machine-learning/time_series/1_exponential_smoothing.html> [Accessed 19 October 2020].

40. GitHub. (2020). ClickHouse/ClickHouse. [online] Available at: https://github.com/ClickHouse/ClickHouse [Accessed 20 October 2020].

41. GitHub. (2020). Grafana. [online] Available at: <https://github.com/grafana/grafana> [Accessed 20 October 2020].

42. GitHub. (2020). Elastic Search. [online] Available at: <https://github.com/elastic/elasticsearch> [Accessed 20 October 2020].

i Надоели баннеры? Вы всегда можете отключить рекламу.