Научная статья на тему 'Прогнозирование трафика трехмерной сети Интернета вещей высокой плотности как многомерного случайного процесса'

Прогнозирование трафика трехмерной сети Интернета вещей высокой плотности как многомерного случайного процесса Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
трехмерная сеть связи / сеть связи высокой плотности / трафик / прогнозирование / искусственная нейронная сеть / three-dimensional network / high-density network / traffic prediction / neural networks

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Елагин Василий Сергеевич, Гребенщикова Александра Андреевна

Актуальность рассматриваемой в статье тематики состоит в активной трансформации сетей связи и формировании трехмерной сети связи высокой плотности, которая изменяет структуру трафика данных, поэтому и для такого рода сети рассматривается модель трафика как многомерного случайного процесса. Целью исследования является повышение эффективности прогнозирования сетевого трафика, за счет разработки метода, отличительной особенностью которого является прогнозирование трафика как многомерного случайного процесса с учетом взаимной зависимости отдельных потоков, производимых узлами сети. Методы. В работе рассмотрен алгоритм обучения искусственной нейронной сети (ИНС) на основе метода уменьшения значения корня средней квадратичной ошибки RMSE, а также предложены методы прогнозирования с использованием ИНС типа LSTM и адаптации параметров модели к изменяющимся условиям функционирования сети. Применение ИНС типа LSTM для прогнозирования многомерного случайного процесса, описывающего трафик в трехмерной сети высокой плотноcти, может дать лучшие результаты, чем прогнозирование отдельных потоков трафика, как независимых случайных процессов, за счет учета взаимных влияний между различными потоками трафика. Решение. Построение соответствующей модели, сбор статистики (получение обучающей выборки), обучение ИНС и выполнение прогноза требует использования вычислительных ресурсов. Таким образом эффективность прогнозирования можно определить, как снижение ошибки прогнозирования при сохранении объема используемых ресурсов или уменьшение объема ресурсов при сохранении ошибки прогнозирования. В ходе решения научной задачи выявлены критерии для выбора величины единичного интервала (лага), что в совокупности с интервалом прогнозирования существенно влияет на итоговый сценарий. Научная новизна работы заключается в оценке изменения ошибки погрешности при прогнозировании трафика трехмерной сети связи высокой плотности как многомерного случайного процесса, по сравнению с представлением прогноза этого же трафика как множества независимых случайных процессов. Значимость (теоретическая). Эффективность прогнозирования трафика как многомерного случайного процесса в трехмерной сети связи высокой плотности возрастает с увеличением размерности. Таким образом, такой трафик в задачах прогнозирования следует рассматривать как многомерный случайный процесс, размерность которого равна количеству узлов сети, производящих трафик. Значимость (практическая). Полученные в работе результаты в перспективе могут быть использованы с целью оптимизации функционирования системы управления трафиком

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Елагин Василий Сергеевич, Гребенщикова Александра Андреевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Traffic Prediction as a Multidimensional Random Process in a Three-Dimensional High-Density Internet of Things Network

Relevance. The relevance of the topic considered in the article lies in the active transformation of communication networks and the formation of a three-dimensional high-density communication network, which changes the structure of data traffic, therefore, for this type of network, a traffic model is considered as a multidimensional random process. The main purpose of the study is to improve the efficiency of network traffic forecasting by developing a method, the distinctive feature of which is traffic forecasting as a multidimensional random process, taking into account the mutual dependence of individual flows produced by network nodes. Methods. The paper considers an algorithm for training an artificial neural network (ANN) based on the method of reducing the root of the mean square error RMSE, and also proposes forecasting methods using LSTM-type ANNs and adapting model parameters to changing network operating conditions. The use of LSTM-type ANN for forecasting a multivariate random process describing traffic in a three-dimensional high-density network can yield better results than forecasting individual traffic flows as independent random processes due to the consideration of mutual influences between different traffic flows. The results. Building the corresponding model, collecting statistics (obtaining a training sample), training the ANN and performing the forecast require the use of computing resources. Thus, the forecasting efficiency can be defined as a decrease in the forecasting error while maintaining the volume of resources used or a decrease in the volume of resources while maintaining the forecasting error. In the course of solving the scientific problem, criteria were identified for selecting the value of a unit interval (lag), which, together with the forecasting interval, significantly affects the final scenario. The theoretical significance The scientific novelty of the work lies in the assessment of the change in the error in forecasting the traffic of a three-dimensional high-density communication network as a multivariate random process, compared to presenting the forecast of the same traffic as a set of independent random processes. Significance (theoretical). The efficiency of traffic forecasting as a multidimensional random process in a three-dimensional high-density communication network increases with increasing dimensionality. Thus, such traffic in forecasting problems should be considered as a multidimensional random process, the dimensionality of which is equal to the number of network nodes producing traffic. Significance (practical). The results obtained in the work can be used in the future to optimize the functioning of the traffic management system

Текст научной работы на тему «Прогнозирование трафика трехмерной сети Интернета вещей высокой плотности как многомерного случайного процесса»

Научная статья УДК 004.942

https://doi.org/10.31854/1813-324X-2024-10-4-38-47

(ее)

Прогнозирование трафика трехмерной сети Интернета вещей высокой плотности как многомерного случайного процесса

Василий Сергеевич Елагин, v.elagin@sut.ru

Александра Андреевна Гребенщикова grebenshikova.aa@sut.ru

Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича, Санкт-Петербург, 193232, Российская Федерация

Аннотация

Актуальность рассматриваемой в статье тематики состоит в активной трансформации сетей связи и формировании трехмерной сети связи высокой плотности, которая изменяет структуру трафика данных, поэтому и для такого рода сети рассматривается модель трафика как многомерного случайного процесса.

Целью исследования является повышение эффективности прогнозирования сетевого трафика, за счет разработки метода, отличительной особенностью которого является прогнозирование трафика как многомерного случайного процесса с учетом взаимной зависимости отдельных потоков, производимых узлами сети.

Методы. В работе рассмотрен алгоритм обучения искусственной нейронной сети (ИНС) на основе метода уменьшения значения корня средней квадратичной ошибки RMSE, а также предложены методы прогнозирования с использованием ИНС типа LSTM и адаптации параметров модели к изменяющимся условиям функционирования сети. Применение ИНС типа LSTM для прогнозирования многомерного случайного процесса, описывающего трафик в трехмерной сети высокой плотности, может дать лучшие результаты, чем прогнозирование отдельных потоков трафика, как независимых случайных процессов, за счет учета взаимных влияний между различными потоками трафика.

Решение. Построение соответствующей модели, сбор статистики (получение обучающей выборки), обучение ИНС и выполнение прогноза требует использования вычислительных ресурсов. Таким образом эффективность прогнозирования можно определить, как снижение ошибки прогнозирования при сохранении объема используемых ресурсов или уменьшение объема ресурсов при сохранении ошибки прогнозирования. В ходе решения научной задачи выявлены критерии для выбора величины единичного интервала (лага), что в совокупности с интервалом прогнозирования существенно влияет на итоговый сценарий. Научная новизна работы заключается в оценке изменения ошибки погрешности при прогнозировании трафика трехмерной сети связи высокой плотности как многомерного случайного процесса, по сравнению с представлением прогноза этого же трафика как множества независимых случайных процессов. Значимость (теоретическая). Эффективность прогнозирования трафика как многомерного случайного процесса в трехмерной сети связи высокой плотности возрастает с увеличением размерности. Таким образом, такой трафик в задачах прогнозирования следует рассматривать как многомерный случайный процесс, размерность которого равна количеству узлов сети, производящих трафик.

Значимость (практическая). Полученные в работе результаты в перспективе могут быть использованы с целью оптимизации функционирования системы управления трафиком.

Ключевые слова: трехмерная сеть связи, сеть связи высокой плотности, трафик, прогнозирование, искусственная нейронная сеть

Ссылка для цитирования: Елагин В.С., Гребенщикова А.А. Прогнозирование трафика трехмерной сети интернета вещей высокой плотности как многомерного случайного процесса / / Труды учебных заведений связи. 2024. Т. 10. № 4. С. 38-47. DOI:10.31854/1813-324X-2024-10-4-37-47. EDN:GCJROF

© Елагин В.С., Гребенщикова А.А., 2024

Original research

https://doi.org/10.31854/1813-324X-2024-10-3-38-47

Traffic Prediction as a Miltidimensional Random Process in a Three-Dimensional High-Density Internet of Things Network

Vasiliy S. Elagin, v.elagin@sut.ru

Aleksandra A. Grebenshchikova grebenshikova.aa@sut.ru

The Bonch-Bruevich Saint-Petersburg State University of Telecommunications, St. Petersburg, 193232, Russian Federation

Annotation

Relevance. The relevance of the topic considered in the article lies in the active transformation of communication networks and the formation of a three-dimensional high-density communication network, which changes the structure of data traffic, therefore, for this type of network, a traffic model is considered as a multidimensional random process. The main purpose of the study is to improve the efficiency of network traffic forecasting by developing a method, the distinctive feature of which is traffic forecasting as a multidimensional random process, taking into account the mutual dependence of individual flows produced by network nodes.

Methods. The paper considers an algorithm for training an artificial neural network (ANN) based on the method of reducing the root of the mean square error RMSE, and also proposes forecasting methods using LSTM-type ANNs and adapting model parameters to changing network operating conditions. The use of LSTM-type ANN for forecasting a multivariate random process describing traffic in a three-dimensional high-density network can yield better results than forecasting individual traffic flows as independent random processes due to the consideration of mutual influences between different traffic flows.

The results. Building the corresponding model, collecting statistics (obtaining a training sample), training the ANN and performing the forecast require the use of computing resources. Thus, the forecasting efficiency can be defined as a decrease in the forecasting error while maintaining the volume of resources used or a decrease in the volume of resources while maintaining the forecasting error. In the course of solving the scientific problem, criteria were identified for selecting the value of a unit interval (lag), which, together with the forecasting interval, significantly affects the final scenario.

The theoretical significance The scientific novelty of the work lies in the assessment of the change in the error in forecasting the traffic of a three-dimensional high-density communication network as a multivariate random process, compared to presenting the forecast of the same traffic as a set of independent random processes. Significance (theoretical). The efficiency of traffic forecasting as a multidimensional random process in a three-dimensional high-density communication network increases with increasing dimensionality. Thus, such traffic in forecasting problems should be considered as a multidimensional random process, the dimensionality of which is equal to the number of network nodes producing traffic.

Significance (practical). The results obtained in the work can be used in the future to optimize the functioning of the traffic management system.

Keywords: three-dimensional network, high-density network, traffic prediction, neural networks

For citation: Elagin V.S., Grebenshchikova AA Traffic Prediction as a Multidimensional Random Process in a Three-Dimensional High-Density Internet of Things Network. Proceedings of Telecommunication Universities. 2024;10(4): 38-47. (in Russ.) DOI:10.31854/1813-324X-2024-10-4-38-47. EDN:GCJROF

Введение

Развитие сетей беспроводной связи и беспроводного доступа приводит к высокой концентрации узлов сети в пространстве. Например, в многоквар-

тирных зданиях в зоне связи каждого из узлов сети может оказаться до нескольких десятков аналогичных узлов [1]. Таким образом, в подобных сетях создаются условия взаимного влияния между элементами сети. Потоки трафика, производимого

пользователями этих узлов, оказываются зависимыми. Степень этой зависимости определяется различными факторами, одним из которых является расстояние между узлами сети. В трехмерной сети наибольшее влияние оказывают ближайшие соседние узлы [2].

При построении сети с использованием принципов SDN [3], в целях управления потоками трафика и ресурсами сети необходимо получение прогнозируемых значений трафика. Для этого применяются различные методы, основанные на анализе статистики [4]. В большинстве случаев эти методы предполагают рассмотрение потоков, производимых отдельными узлами сети, как независимых случайных процессов [5]. Среди методов прогнозирования хорошо известны инструменты статистического анализа, например, ARIMA [6], а также применение искусственных нейронных сетей (ИНС). Широкое распространение в задачах прогнозирования получили модели ИНС типа LSTM (аббр. от англ. Long Short-Term Memory), которые показали положительные результаты в решении подобных задач [7], благодаря их «способности запоминать» характерные особенности случайных процессов.

Применение ИНС типа LSTM для прогнозирования многомерного случайного процесса, описывающего трафик в трехмерной сети высокой плотности, может дать лучшие результаты, чем прогнозирование отдельных потоков трафика, как независимых случайных процессов, за счет учета взаимных влияний между различными потоками трафика. Эти результаты можно оценить по уменьшению ошибки получаемого прогноза, которое отражается на эффективности функционирования сети (распределения трафика и ресурсов). Поэтому его можно рассматривать как способ повышения эффективности функционирования сети в целом.

В данной работе предлагается модель трафика трехмерной сети высокой плотности как многомерного случайного процесса и метод использования ИНС типа LSTM для его прогнозирования.

Модель трафика

Трафик в сетях, построенных с применением беспроводной связи, создается пользователями, которые случайным образом распределены в зоне обслуживания. В зависимости от способа построения сети, трафик данных передается между пользовательскими терминалами и базовой станцией или точкой доступа, или непосредственно между терминалами пользователей. При этом в каждой точке пространства имеют место сигналы всех узлов сети (базовых станций и терминалов), которые отличаются по уровню мощности. Одни из них могут быть приняты приемными устройствами, а другие имеют слишком малый уровень мощности и воспринима-

ются как дополнительный источник помех (шума) или вообще могут быть проигнорированы, если их уровень мощности слишком мал.

Таким образом, если рассматривать некоторое пространство, обслуживаемое сетью связи, то в каждой точке пространства можно наблюдать потоки трафика между элементами сети. Выбор точки наблюдения определяется целью задачи. Если рассматриваемая сеть построена с использованием точек доступа (базовых станций), то особую роль играют именно точки их размещения, т. к. в такой сети имеют место только потоки трафика между пользователями и точками доступа.

В трехмерной сети точки доступа распределены в пространстве, например, как это показано на рисунке 1.

Рис. 1. Пример размещения точек доступа сети в пространстве

Fig. 1. An Example of the Placement of Network Access Points

Трафик в такой сети - это трафик, производимый пользователями, подключенными к ее точкам доступа. В каждой из этих точек трафик представляет собой случайный поток пакетов (кадров, пакетов или сегментов, в зависимости от уровня рассмотрения, для общности будем называть пакетами). В общем случае эти потоки зависимы, так как передаваемые сигналы влияют на процесс передачи в соседних узлах, если используется один частотный канал.

Если две точки доступа оказываются в зоне связи друг друга, то они вынуждены распределять время своей активности так, чтобы интервалы их активности не совпадали и не перекрывались. Это приводит к возникновению зависимостей между потоками трафика в таких точках доступа. Аналогичная задача решается и когда точек доступа больше, чем две. В рассматриваемой модели их может быть гораздо больше. Для примера, в сетях семейства стандартов IEEE 802.11 [8] в многоквартирном жилом здании количество точек доступа,

сигнал от которых принимается с достаточно высоким уровнем мощности, может исчисляться несколькими десятками.

Поэтому трафик в трехмерной сети высокой плотности можно рассматривать как многомерный случайный процесс [9] в виде:

*(fc) = {хлъ.....хкт (1)

описываемый совместными функциями распределения:

F(V = [F1(x1,x2 ...xk,t).....Fk(xi,x2 ...xk,t)}, (2)

где X1(t), ...,Xk(t) - случайные процессы в выбранных точках (точках доступа) сети, которые представляют собой количество данных (пакетов), переданных за заданный интервал времени (лаг, от англ. Lag - запаздывание).

В случае независимости X1(t),...,Xk(t) каждый из процессов может быть описан своей функцией распределения, например, распределением Пуассона. Однако в общем случае эти процессы зависимы. Эта зависимость тем выше, чем ближе рассматриваемые точки. Иными словами, в конкретной точке сети трафик в наибольшей степени зависим от трафика ближайших соседей (точек доступа) и в меньшей степени - от удаленных. Таким образом, общая картина трафика в сети может быть описана многомерным процессом (1) и его функциями распределения (2).

При построении SDN для управления потоками трафика требуется информация о трафике и его прогнозируемых значениях. Для решения данной задачи предлагается использование ИНС типа LSTM. Применение ИНС для прогнозирования множества зависимых случайных процессов позволяет учесть, как влияние времени, так и взаимные влияния этих процессов друг на друга. Согласно [10, 11], ИНС типа LSTM используются для прогнозирования трафика в сотовых сетях и в транспортных системах. Также в исследовании [12] отмечается специализация LSTM в прогнозировании временных рядов благодаря ячеистой архитектуре. В таблице 1 представлены преимущества и недостатки моделей прогнозирования для временных рядов.

Таким образом, использование иных методов для решения задачи прогнозирования многомерного процесса либо не эффективно, либо слишком сложно [13]. Традиционные методы прогнозирования с использованием ARIMA, SARIMA и подобные, позволяют получать удовлетворительные прогнозы по отношению лишь к фактору времени, при наличии взаимной зависимости процессов прогноз оказывается менее эффективным.

Процесс прогнозирования трафика в вы-

сокой плотности можно описать последовательностью обработки трафика, как показано на рисунке 2.

ТАБЛИЦА 1. Недостатки и преимущества моделей прогнозирования

TABLE 1. The Advantages and Disadvantages of Forecasting Models

Модель прогнозирования Недостатки Преимущества

SARIMA ARIMA ARMA Прогнозирование данных основано исключительно на прошлых значениях Высокая интерпретируемость параметров

NN RNN LSTM GRU CNN GNN - низкая интерпретируемость параметров; - требуется большое количество гиперпараметров; - высокие вычислительные затраты на этапе обучения Согласно научной литературе, демонстрирует лучшие результаты по сравнению со статистическими подходами

X(t)

A

Сбор статистики

Прогноз/ Сбор статисти ки

П рогноз/

Сбор статистики Рис. 2. Сбор статистики и прогнозирование

Fig. 2. Collecting Statistics and Forecasting

Такая последовательность состоит из двух непрерывно повторяющихся фаз: сбора статических данных (результатом которой является выборка значений Dt) и прогнозирования (результатом которого является выборка значений Df).

Качество функционирования такой системы определяется достоверностью получаемых прогнозов.

Для оценки эффективности полученного прогноза чаще всего применяется средняя разница между значениями, спрогнозированными моделью, и фактическими значениями трафика - корень средней квадратичной ошибки (RMSE) [14]:

RMSEi =

M

п

(3)

i=i

где Xi - значение процесса на /-м отсчете интервала прогнозирования из выборки статистики. =

(0

= {х[° ...х^.х^ ...X® е Xi(t),i = 1...к, te Т,х]

значение на i-м отсчете интервала прогнозирова-

n(i) -(¿Л

ния из данных прогноза Dy = {х^ ...х^ }, n -

коли-

чество отсчетов; - выборка значений одного из случайных процессов Хг(С), .,Хк(ь); - его прогнозируемые значения.

Наряду с ЯМБЕ могут использоваться и другие оценки, такие как среднеквадратичная ошибка МБЕ

(аббр. от англ. Mean Square Error), средняя абсолютная ошибка MAE (аббр. от англ. Mean Absolute Error), коэффициент детерминации Д-квадрат. Все эти оценки характеризуют разницу между прогнозируемыми значениями и фактической реализацией процесса, а также межу данными обучения и выходными значениями ИНС. Использование различных оценок несколько отражается на получаемом результате, и их выбор является отдельной задачей. В данной работе используется наиболее распространенная оценка RMSE. Хотя следует отметить, что обсуждаемый подход к прогнозированию не зависит принципиально от выбранной оценки.

Оценка RMSE (или любая иная оценка из упомянутых выше) зависит от множества факторов, к которым можно отнести: свойства случайного (прогнозируемого) процесса, продолжительность интервала прогнозирования, количество отсчетов на интервале прогнозирования, продолжительность интервала (интервалов) сбора статистики и количество отсчетов на нем.

Масштаб времени

Выбор продолжительности интервала прогнозирования Tf и единичных интервалов (лагов) существенно влияет на результаты прогнозирования. Величина единичных интервалов времени влияет на оценку свойств потока (процесса). В частности, влияние величины единичных интервалов на свойства случайного процесса характеризуется степенью самоподобия [15]. Чем выше степень самоподобия, тем меньше это влияние. Рассмотрим выбор величины единичного интервала с различных позиций. Во-первых, с точки зрения выбора величины минимального и максимального интервала. А во-вторых, с точки зрения требований со стороны системы управления трафиком.

Минимальная величина единичного интервала определяет детальность представления трафика. Чем меньше эта величина, тем детальнее будет представлен процесс поступления заявок (пакетов, кадров или сегментов). Если устремить эту величину к нулю, то количество пакетов, поступивших за интервал, не превысит единицы (если принимать во внимание момент начала приема / передачи пакета), так как в линии связи пакеты передаются последовательно, а время передачи самого короткого пакета превышает продолжительность этого интервала. В этом случае случайный процесс будет представлен последовательностью нулей и единиц. И в реальном трафике нулей будет гораздо больше, чем единиц.

Таким образом, минимальная величина интервала - это величина, не превышающая время передачи самого короткого пакета:

< min

(5)

где ^т - минимальный размер пакета (бит); Ь -скорость передачи данных (бит/с).

Максимальная величина единичного интервала ограничена продолжительностью наблюдений и требованиями к объему статистического материала. Поскольку для решения задачи прогнозирования требуется набор статистических данных (обучающая выборка), то это требование можно интерпретировать как требование к максимальной величине единичного интервала:

umax _ _ ,

(6)

где т - количество значений в обучающей выборке; Тс - продолжительность наблюдений (продолжительность получения обучающей выборки, сбора статистики).

Интервал получения обучающей выборки Тс должен быть репрезентативен с точки зрения решаемой задачи. Репрезентативность процесса обеспечивается достаточной детализацией процесса изменения трафика. Если дискретный процесс Х(Ц является представлением некого непрерывного процесса, то для полного сохранения информации, согласно теореме В.А. Котельникова, величину, обратную единичному интервалу 1/и, необходимо интерпретировать как удвоенную верхнюю частоту спектра непрерывного процесса. В этом смысле величина единичного интервала не должна ограничивать верхнюю частоту спектра непрерывного процесса, а, следовательно, и его информативность.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Количество данных Хи, переданных за интервал и, случайно и зависит от средней интенсивности трафика. Среднее количество данных будет определяться как:

— UCL,

(7)

Очевидно, что значения этой величины могут лежать в пределах от нуля до величины скорости передачи данных в линии связи Ь:

0 < хи < Ъ, (8)

где Ь - скорость передачи данных.

Пусть /(хи) - плотность вероятности случайной величины.

Рассматривая эту величину с позиции информативности представления данных, количество информации (бит) в случайном процессе можно определить как:

К

= J /(x)log2/(x) dx.

(9)

и

п

QO

га

Согласно [16], связь с единичным интервалом и можно установить через коэффициент Херста:

т1-нР(т)(х) = Р(х), твП, (10)

где Н - коэффициент Херста; Н = 1 — (в); знак =

обозначает равенство распределений; ^(х) - распределение исходного процесса (полученного на интервалах и); Р(т^(х) - распределение процесса, полученного на т интервалах и.

С ростом коэффициента Херста (0 < Н < 1) распределения вероятностей исходного процесса и процесса, полученного при увеличении интервалов и в т раз, сближаются (10).

Из определения самоподобности второго порядка и коэффициента корреляции г(к) следует, что для 0 < Н < 1 при Н ± 0,5:

г(к)~Н(2Н — 1)к2Н-2, (11)

где к —

Согласно [17], если 0,5 < Н < 1, г(к)~ск-в, с > 0 -константа, в = 2 - 2Н и 0 < в < 1, тогда коэффициент корреляции медленно затухает, что является основной причиной несуммируемости и исходный процесс является долговременно зависимым:

ж

^ г(к) = ю. (12)

к=-ж

Для равенства (10) при 0 < в < 1 исходный процесс является строго самоподобным в широком смысле и имеет медленно убывающую зависимость [16].

Требования со стороны системы управления трафиком могут иметь первостепенное значение при выборе величины и. Функционирование системы управления предполагает сбор статистики (обучение), получение прогнозов, анализ состояния сети и принятие решения по управлению трафиком. Каждый из этих этапов имеет свои характеристики и требует определенных затрат времени. Это проявляется в определенных характеристиках управления. Тогда величина и должна соответствовать времени реакции системы управления (интервалу управления).

Таким образом, обобщая сказанное, можно сделать вывод, что выбор величины единичного интервала и (лага) зависит от таких факторов, как параметры канала связи, свойства трафика и характеристики системы управления.

Метод использования искусственных нейронных сетей

При использовании ИНС ЯМБЕ зависит от объема обучающей выборки Ют. Отрицательное влияние на прогноз может оказать как недостаточное, так и избыточное обучение, поэтому необходимо определить некоторый размер этой выборки, при котором ошибка минимальна [18].

Выбор параметров прогнозирования можно определить, как задачу оптимизации, целевой функцией (%) в которой является:

О = ттЯМБЕ^, т) , (13)

где Т - продолжительность обучающей выборки (размер выборки); т - количество эпох обучения.

Прогнозирование трафика - это непрерывный процесс, который выполняется в течение всего времени функционирования сети связи. Случайные процессы могут претерпевать как краткосрочные, так и медленные (долговременные) изменения. Для того, чтобы учитывать актуальную ситуацию, обучение ИНС должно производиться непрерывно с учетом требований к продолжительности периода прогнозирования. Соответствующий алгоритм приведен на рисунке 3.

Рис. 3. Алгоритм обучения ИНС

Fig. 3. The Learning Algorithm of Neural Networks

На этапе инициализации может задаваться начальная обучающая выборка йт продолжительностью Тс. Если такой выборки нет, то для ее получения проводится сбор статистики и непосредственное формирование этой выборки. Далее начинается циклическое обучение ИНС на основе начальной выборки, которое проводится за несколько эпох (циклов обучения). Критерием завершения обучения является отсутствие уменьшения значения ЯМБЕ. Если после очередной эпохи ошибка не снизилась, то обучение считается оконченным при числе эпох, равном т. Далее ИНС готова выполнить прогноз, что делается на следующем этапе - получение набора прогнозируемых значений йв.

Полученный прогноз йв может быть использован как результат в целях управления трафиком, а его качество оценивается сравнением с реальными данными, получаемыми в результате сбора статистики о трафике йт, на основе которых вычисляется оценка ЯМБЕ. Если полученная оценка свидетельствует о низком качестве прогнозирования, то производится корректировка интервала обучения Тс.

На рисунке 4 приведен пример прогнозирования случайного процесса, представляющего собой общий трафик в двух взаимозависимых точках доступа в пределах одного дня с 22:22:49 до 22:41:13.

50

0 20 0 40 0 60 0 800 1000 Время, с

a)

0 200 400 600 800 1000 Время, с

b)

Рис. 4. Пример прогнозирования трафика с использованием ИНС типа LSTM: a) RMSE = 6,28; b) RMSE = 7,29

Fig. 4. An Example of Traffic Forecasting Using an LSTM: a) RMSE = 6,28; b) RMSE = 7,29

Процесс (см. рисунок 4) представляет собой набор значений числа бит, переданных за интервалы, равные одной секунде.

На приведенных примерах показан двухмерный случайный процесс, включающий в себя два потока трафика (две точки доступа). Синяя кривая представляет полученные в результате измерений данные, оранжевая - аппроксимация исходного процесса ИНС после обучения, зеленая - прогнозируемый процесс на фоне реализации (синяя кривая). Полученные результаты продемонстрировали высокую точность предсказания на достаточно продолжительном интервале. Объем тренировочной выборки состоял из 740 наблюдений. Продолжительность интервала прогнозирования составила в данном примере 33 % от общей продолжительности наблюдений в 1104 отсчетов. Ошибка составила для процесса на рисунке 4а: ЯМБЕ = 6,28, а на рисунке 4Ь: ЯМБЕ = 7,29. Следует отметить, что из графиков визуально заметна достаточно высокая точность прогнозирования. Полученный процесс повторяет колебания реального процесса, благодаря тому, что ИНС находит сложную закономерность, незаметную на взгляд.

Эффективность метода

Целью прогнозирования случайного процесса является получение значения случайной величины (последовательности или множества случайных величин), которые будут иметь место в будущем. Качество прогнозирования оценивается метрикой, характеризующей ошибку, т. е. разницу между прогнозируемым значением и фактическим значением в момент, на который выполнен прогноз. Для решения задачи прогнозирования с помощью ИНС необходимо построение соответствующей модели, сбор статистики (получение обучающей выборки), обучение ИНС и выполнение прогноза. При этом расходуются вычислительные ресурсы. В таком случае эффективность прогнозирования можно определить, как снижение ошибки прогнозирования при сохранении объема используемых ресурсов или уменьшение объема ресурсов при сохранении ошибки прогнозирования.

В данном случае будем использовать первый подход, т. е. будем оценивать изменение ошибки прогнозирования при прогнозировании трафика трехмерной сети связи высокой плотности, как многомерного случайного процесса по сравнению с прогнозированием этого же трафика как множества независимых случайных процессов.

Будем оценивать ошибку прогнозирования с помощью ЯМБЕ, вычисляемого согласно (3).

Выражение (9) используется в обоих случаях, т. е. для случая прогнозирования трафика как многомер-

ного случайного процесса при параллельном прогнозировании к временных рядов, так и для случая прогнозирования трафика как к независимых временных рядов. Соответствующие ошибки прогнозирования обозначим как ЯМБЕб и ЯМБЕ!. Тогда эффективность прогнозирования трафика трехмерной сети высокой плотности, как многомерного случайного процесса будем оценивать в %:

Е = 100

RMSEd - RMSE, RMSE,

(14)

Значение (14) отражает относительное уменьшение ошибки прогнозирования за счет использования «параллельного» прогнозирования многомерного процесса, по сравнению с прогнозированием независимых случайных процессов. На рисунке 5 приведены результаты оценки эффективности прогнозирования трафика как многомерного процесса, где к - размерность.

E, %

40 35 30 25 20 15 10 5 0

k

1 3 5 7 9

Рис. 5. Оценка эффективности прогнозирования трафика как многомерного случайного процесса, согласно (14)

Fig. 5. The Effectiveness of Traffic Forecasting as a Multidimensional Random Process (14)

Из полученного графика видно, что эффективность прогнозирования трафика как многомерного случайного процесса в трехмерной сети связи высокой плотности возрастает с увеличением размерности. Очевидно, что при k = 1 эффективность равна нулю, так как в этом случае процесс является

одномерным. При росте размерности к эффективность метода возрастает, но скорость ее роста снижается. Такая зависимость вполне понятна, так как область взаимных влияний между отдельными потоками трафика в трехмерной сети не бесконечна, как было отмечено выше, она определяется ближайшими соседними узлами. В рассмотренном примере эффективность метода составила 35 % при размерности к = 10.

Заключение

Из полученных данных следует, что трафик трехмерной сети высокой плотности в задачах прогнозирования целесообразно рассматривать как многомерный случайный процесс, размерность которого равна количеству узлов сети, производящих трафик. Такой подход позволяет учесть взаимную зависимость потоков трафика, производимых соседними узлами сети. Прогнозирование сетевого трафика как многомерного процесса с помощью ИНС демонстрирует хорошую точность долгосрочного прогноза, в отличие от параметрических моделей типа ARIMA, которые применяются для краткосрочного прогнозирования одномерных процессов.

Качество прогнозирования трафика трехмерной сети высокой плотности как многомерного случайного процесса может быть оценено с помощью суммарной среднеквадратической ошибки, вычисляемой по всем измерениям случайного процесса. Продуктивность использования модели многомерного случайного процесса для описания трафика трехмерной сети высокой плотности может быть оценена относительным изменением суммарной сред-неквадратической ошибки. Ее применение позволяет повысить эффективность прогнозирования, согласно приведенному примеру, до 35 % (при размерности к = 10).

Эффективность прогнозирования предложенным методом зависит от размерности случайного процесса, возрастая с увеличением размерности; скорость увеличения эффективности зависит от характеристик сети связи, а именно - от количества взаимных влияний между узлами сети.

Список источников

1. Кучерявый А.Е., Парамонов А.И., Маколкина М.А., Мутханна А.С.А., Выборнова А.И., Дунайцев Р.А. и др. Трехмерные многослойные гетерогенные сверхплотные сети // Информационные технологии и телекоммуникации. 2022. Т. 10. № 3. С. 1-12. DOI:10.31854/2307-1303-2022-10-3-1-12. EDN:LHLYEM

2. Бушеленков С.Н., Парамонов А.И. Анализ и формирование структуры сети интернета вещей на основе моделей решеток // Электросвязь. 2021. № 7. С. 23-28. D01:10.34832/ELSV.2021.20.7.002. EDN:JIBLHT

3. Volkov A., Abdellah A.R., Muthanna A., Makolkina M., Paramonov A., Koucheryavy A. IoT traffic prediction with neural networks learning based on SDN infrastructure // Proceedings of 23rd International Conference on Distributed and Computer and Communication Networks (DCCN 2020, Moscow, Russia, 14-18 September 2020). Lecture Notes in Computer Science. 2020. Vol. 12563. IEEE, 2020. PP. 64-76. D0I:10.1007/978-3-030-66471-8_6. EDN:QRQIPV

4. Абделлах А.Р., Махмуд О.А., Парамонов А.И. Кучерявый А.Е. Прогнозирование задержки в сетях интернета вещей и тактильного интернета с использованием машинного обучения // Электросвязь. 2021. № 1. С. 23-27. D0I:10.34832/ ELSV.2021.14.1.002. EDN:IRYPFV

5. Вентцель А.Д. Курс теории случайных процессов. М.: Наука. Физматлит, 1996. 399 с.

6. Joshi M., Hadi T.H. A Review of Network Traffic Analysis and Prediction Techniques. 2015. URL: https://arxiv.org/ abs/1507.05722 (Accessed 25.08.24)

7. Ferreira G.O., Ravazzi C., Dabbene F., Calafiore G.C., Fiore M. Forecasting Network Traffic: A Survey and Tutorial With Open-Source Comparative Evaluation // IEEE Access. 2023. Vol. 11. PP. 6018-6044. D0I:10.1109/ACCESS.2023.3236261

8. Викулов А.С., Парамонов А.И. Постановка задачи замощения плоскости в применении к частотно-территориальному планированию сетей IEEE 802.11 // Радиотехнические и телекоммуникационные системы. 2021. № 1(41). С. 24-32. EDN:HNRRQ0

9. Миллер Б.М., Панков А.Р. Теория случайных процессов в примерах и задачах. М.: Физматлит, 2007. 320 c.

10. Manzoor S., Bajwa K.B., Sajid M., Manzoor H., Manzoor M., Ali N., et. al. Modeling of Wireless Traffic Load in Next Generation Wireless Networks // Mathematical Problems in Engineering. 2021. Iss. 1. P. 15. D0I:10.1155/2021/7293093

11. Wang J., Tang J., Xu Z., Wang Y., Xue G., Zhang X., et. al. Spatiotemporal modeling and prediction in cellular networks: A big data enabled deep learning approach // Proceeding of IEEE Conference on Computer Communications (Atlanta, USA, 01-04 May 2017). IEEE, 2017. PP. 1-9. D0I:10.1109/INF0C0M.2017.8057090

12. Luo X., Li D., Yang Y., Zhang S. Spatiotemporal traffic flow prediction with KNN and LSTM // Journal of Advanced Transportation. 2019. PP. 1-10. D0I:10.1155/2019/4145353

13. Hochreiter S., Schmidhuber J. Long short-term memory // Neural computation. 1997. Vol. 9. Iss. 8. PP. 1735-80. D0I:10.1162/neco.1997.9.8.1735

14. Kavitha A.K., Praveena S.M. Deep learning model for traffic flow prediction in wireless network // Automatika. 2023. Vol. 64. Iss. 4. PP. 848-857. D0I:10.1080/00051144.2023.2220203

15. Шелухин О.И., Осин А.В., Смольский С.М. Самоподобие и фракталы. Телекоммуникационные приложения. М.: Физматлит, 2008. 368 c. EDN:MVSWAB

16. Цыбаков Б.С. Модель телетрафика на основе самоподобного случайного процесса // Радиотехника. 1999. № 5. С. 24-31.

17. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 c. EDN:UKUJXH

18. Sjoberg J., Ljung L. 0vertraining, Regularization, and Searching for Minimum in Neural Networks. 1992. URL: https://www.researchgate.net/profile/J-Sjoberg/publication/2738519_0vertraining_Regularization_And_Searching_For_ Minimum_With_Application_To_Neural_Networks/links/02e7e519f37e9a2f6e000000/0vertraining-Regularization-And-Searching-For-Minimum-With-Application-To-Neural-Networks.pdf (Accessed 26.08.2024)

References

1. Koucheryavy A., Paramonov A., Makolkina A., Muthanna A. S. A., Vybornova A., Dunaytsev R. , et. al. 3 Dimension Multilayer Heterogenous Ultra Dense Networks. Telecom IT. 2022;10(3):1-12. (in Russ.) DOI:10.31854/2307-1303-2022-10-3-1-12. EDN:LHLYEM

2. Bushelenkov S.N., Paramonov A.I. Analysis and formation of the structure of the internet of things network based on lattice models. Telecommunications. 2021;7:23-28. (in Russ.) D0I:10.34832/ELSV.2021.20.7.002. EDN:JIBLHT

3. Volkov A., Abdellah A.R., Muthanna A., Makolkina M., Paramonov A., Koucheryavy A. IoT traffic prediction with neural networks learning based on SDN infrastructure. Proceedings of 23rd International Conference on Distributed and Computer and Communication Networks, DCCN 2020, 14-18 September 2020, Moscow, Russia. Lecture Notes in Computer Science, vol.12563. IEEE; 2020. p.64-76. DOI:10.1007/978-3-030-66471-8_6. EDN:QRQIPV

4. Abdellah A.R., Mahmud O.A., Paramonov A.I., Koucheryavy A. Delay prediction in IoT and tactile internet using machine learning approach. Telecommunications. 2021;1:23-27. (in Russ.) D0I:10.34832/ELSV.2021.14.1.002. EDN:IRYPFV

5. Wentzell A.D. A Course in the Theory of Stochastic Processes. Moscow: Nauka Publ.; 1996. 399 p. (in Russ.)

6. Joshi M., Hadi T.H. A Review of Network Traffic Analysis and Prediction Techniques. 2015. URL: https://arxiv.org/ abs/1507.05722 [Accessed 25.08.24]

7. Ferreira G.O., Ravazzi C., Dabbene F., Calafiore G.C., Fiore M. Forecasting Network Traffic: A Survey and Tutorial With Open-Source Comparative Evaluation. EEEAccess. 2023;11:6018-6044. D0I:10.1109/ACCESS.2023.3236261

8. Vikulov A.S., Paramonov A.I. Problem statement of tiling the plane for frequency and area planning of IEEE 802.11 networks. Radio Engineering and Telecommunication Systems. 2021;1(41):24-32. (in Russ.) EDN:HNRRQO

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Miller B.M., Pankov A.S. Theory of Random Processes in Examples and Problems. Moscow: Fizmatlit Publ.; 2007. 320 c. (in Russ.)

10. Manzoor S., Bajwa K.B., Sajid M., Manzoor H., Manzoor M., Ali N., et. al. Modeling of Wireless Traffic Load in Next Generation Wireless Networks. Mathematical Problems in Engineering. 2021;1:15. DOI:10.1155/2021/7293093

11. Wang J., Tang J., Xu Z., Wang Y., Xue G., Zhang X., et. al. Spatiotemporal modeling and prediction in cellular networks: A big data enabled deep learning approach. Proceeding of IEEE Conference on Computer Communications, 01-04 May 2017, Atlanta, USA. IEEE; 2017. p.1-9. DOI:10.1109/INFOCOM.2017.8057090

12. Luo X., Li D., Yang Y., Zhang S. Spatiotemporal traffic flow prediction with KNN and LSTM. Journal of Advanced Transportation. 2019:1-10. DOI:10.1155/2019/4145353

13. Hochreiter S., Schmidhuber J. Long short-term memory. Neural computation. 1997;9(8):1735-80. DOI:10.1162/neco. 1997.9.8.1735

14. Kavitha A.K., Praveena S.M. Deep learning model for traffic flow prediction in wireless network. Automatika. 2023;64(4):848-857. DOI:10.1080/00051144.2023.2220203

15. Sheluhin O.I., Smolskiy S.M., Osin A. V. Self-Similar Processes in Telecommunications. Moscow: Fizmatlit Publ; 2008. 368 p. (in Russ.) EDN:MVSWAB

16. Tsybakov B.S. Teletraffic model based on self-similar random process. Radiotechnica. 1999;5:24-31. (in Russ.)

17. Sheluhin O.I., Tenjakshev A.M., Osin A.V. Fractal Processes in Telecommunications. Moscow: Radiotehnika Publ.; 2003. 480 p. (in Russ.) EDN:UKUJXH

18. Sjoberg J., Ljung L. Overtraining, Regularization, and Searching for Minimum in Neural Networks. 1992. URL: https://www.researchgate.net/profile/J-Sjoberg/publication/2738519_Overtraining_Regularization_And_Searching_For_ Minimum_With_Application_To_Neural_Networks/links/02e7e519f37e9a2f6e000000/Overtraining-Regularization-And-Search ing-For-Minimum-With-Application-To-Neural-Networks.pdf [Accessed 26.08.2024]

Статья поступила в редакцию 10.07.2024; одобрена после рецензирования 29.07.2024; принята к публикации 05.08.2024.

The article was submitted 10.07.2024; approved after reviewing 29.07.2024; accepted for publication 05.08.2024.

Информация об авторах:

Василий Сергеевич

ЕЛАГИН

кандидат технических наук, доцент, доцент кафедры инфокоммуникационных систем Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича https://orcid.org/0000-0003-4077-6869

Авторы сообщают об отсутствии конфликтов интересов. The authors declare no conflicts of interests.

i Надоели баннеры? Вы всегда можете отключить рекламу.