МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ПОСТРОЕНИЯ МАРШРУТОВ СВЯЗИ В БЕСПРОВОДНЫХ AD-HOC- СЕТЯХ ПЕРЕДАЧИ ДАННЫХ

Пестин Максим Сергеевич

УДК 004.75

DOI: 10.24412/2071-6168-2022-8-121-128

МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ПОСТРОЕНИЯ МАРШРУТОВ СВЯЗИ В БЕСПРОВОДНЫХ AD-HOC- СЕТЯХ ПЕРЕДАЧИ ДАННЫХ

М.С. Пестин

Существует множество подходов к построению маршрутов связи в беспроводных децентрализованных сетях передачи данных. Однако в большинстве случаев они эффективно работают лишь в сетях с квазистатичной топологией сети. Длина маршрута, скорость его обнаружения, являющиеся основными метриками, используемые классическими алгоритмами, не позволяют прогнозировать, насколько маршруты будут эффективны в целом. Поэтому требуется комплексная оценка путей передачи данных на этапе их построения. В текущей работе было произведено исследование методов градиентного бустинга деревьев принятия решения и обобщённой регрессионной нейронной сети для определения качества маршрутов при их построении в беспроводных ad-hoc сетях. Алгоритмы были обучены прогнозировать показатели надёжности, сквозного времени приёма-передачи и Fs на основе частных маршрутных метрик. Сравнение производилось на тестовом наборе данных при помощи квадрата среднеквадратичной ошибки и коэффициента детерминации. Результаты экспериментального исследования продемонстрировали, что алгоритм градиентного бустинга лучше прогнозирует целевые показатели по сравнению с нейронной сетью, и может быть применён для оценки маршрутов связи в процессе их построения в беспроводных децентрализованных сетях передачи данных.

Ключевые слова: беспроводная ad-hoc сеть, маршрутизация трафика, маршрутная метрика, градиентный бустинг, обобщённая регрессионная нейронная сеть.

Введение. Принципы построения маршрутов передачи данных в беспроводных ad-hoc сетях [1] существенно отличаются от тех, которые применяются в классических проводных и беспроводных сетях связи [2]. С одной стороны, отсутствие потребности в специальной сетевой инфраструктуре, функциональная идентичность узлов связи (являющихся одновременно оконечными точками и роутерами) предоставляют большую гибкость при построении ad-hoc сетей. С другой стороны, условиями работы сети является динамичность топологии, обусловленная перемещением абонентов связи, их периодическое отключение или выход из строя, возникновение помех при передаче данных по радиоканалу. Ввиду этого маршруты связи имеют малое время жизни - во многих случаях до нескольких минут или десятков секунд.

Поэтому для функционирования ad-hoc сетей было разработано множество методов и алгоритмов обнаружения маршрутов и передачи данных, которые учитывают особенности рассматриваемых сетей. При этом выделяют проактивные и реактивные подходы к ad-hoc маршрутизации [3]. Проактивная (или табличная) маршрутизация является адаптацией подходов классической связи под требования ad-hoc сетей и подразумевает периодический обмен абонентами сети информацией об известных связях между узлами. На её основе производится формирование таблицы маршрутизации. Реактивная (или по запросу) маршрутизации предполагает поиск маршрута к целевому узлу только при необходимости. В режиме простоя сети или при отсутствии необходимости передачи данных к абоненту поиск маршрутов осуществляться не будет. В целом, реактивная маршрутизация лучше приспособлена для формирования ad-hoc сетей.

Однако существующие подходы эффективно работают лишь в сетях с квазистатичной топологией сети. Большенство классических алгоритмов в качестве маршрутных метрик используют длину маршрута или время передачи данных. Эти показатели не позволяют оценивать надёжность связи по маршруту, загруженность каналов и абонентов сети, динамику изменения показателей. Более полную информацию о производительности маршрутов может дать только анализ множества его показателей.

Подход к построению маршрутов связи в ad-hoc сетях. Для построения маршрутов передачи данных в беспроводных децентрализованных самоорганизующихся сетях связи предлагается использовать следующий двухэтапный реактивный алгоритм [4]. На первом этапе (прямой ход) определяются наиболее пригодные участки сети для передачи данных между абонентами S и D. На втором этапе (обратный ход), используя результаты прямого хода, производится построение оптимального маршрута между S и D.

На этапе прямого хода осуществляется широковещательная рассылка пакета поиска маршрута RouteSearch, который содержит информацию о формируемом маршруте и его метриках X производительности. Пакет, проходя через каждый транзитный узел, добавляет его в маршрут, а также обновляет частные метрики производительности маршрута. В результате работы алгоритма каждый абонент содержит несколько частично сформированных маршрутов, полученных от нескольких соседних узлов. При этом маршруты отсортированы по некоторой метрике Fs(X) (рис. 1).

V

\\ FsiX'AB)

We)

ад

-* RouteSearch --—RouteAnswer ^sWAB)*

Рис. 1. Схема поиска маршрута в предлагаемом подходе

На этапе обратного хода производится окончательное построение маршрута связи. Для этого осуществляется рассылка пакета RouteAnswer от абонента D к S. В качестве последующего абонента для пересылки RouteAnswer выбирается сосед, с которого на этапе прямого хода был получен лучший частично сформированный маршрут связи по метрике Fs(X).

Эффективность работы алгоритма зависит от качества функции Fs(X). Она должна учитывать требования к маршрутам по надёжности и оперативности доставки данных. Для этого она должна предсказывать сквозную задержку передачи данных по маршруту и долю их потерь. При этом на практике трудно подобрать аналитическую зависимость приведённых показателей от некоторого набора метрик. Ввиду этого целесообразно обратиться к алгоритмам машинного обучения. Поскольку требуется предсказывать вещественные величины, в нашем случае требуется решить задачу регрессии.

Качество маршрута будет оценивать при помощи метрики (1):

F = (1000 . PDR07) S E 2ED03 '

где PDR - коэффициент доставки данных (packed delivered ratio), E2ED - сквозное время передачи данных (end-to-end delay). В нашем случае PDR, E2ED и Fs являются целевыми переменными, которые требуется предсказать при помощи алгоритмов машинного обучения [5].

Алгоритмы машинного обучения. Для решения поставленной задачи будут использованы алгоритмы градиентного бустинга и общей регрессионной нейронной сети.

Деревья принятий решений (регрессионное дерево при применении в задачах регрессии) - средство поддержки принятий решений, способ представления правил в иерархической, последовательной структуре. В узлах дерева записаны атрибуты, от которых зависит принятие решения, а в листьях - значения целевой функции (рис. 2). Деревья решений обладают такими преимуществами, как отсутствие потребности в подготовки данных, способность работать с большим объёмом информации, возможность оценки при помощи статичности тестов. Однако ряд недостатков, а именно, сложность получения оптимального дерева, сложность настройки параметров метода, склонность к переобучению, снижают эффективность применения метода в задачах регрессии.

Однако эти недостатки преодолеваются, если они используются в ансамбле алгоритмов, в частности, в градиентном бустинге [6]. Градиентный бустинг над деревьями принятия решений представляет способ построения композиции решающих деревьев. Деревья строятся последовательно, и каждое последующее дерево стремится скомпенсировать ошибку уже построенных.

Построение композиции решающих деревьев производится по следующему алгоритму:

1) Подбираем некоторую функцию ошибок для задач регрессии, например, квадратичную функцию потерь (2).

L(y,, f (Xt)) = £(y, - f (Xt))2

^ min •

(2)

где у, - истинное значение целевой переменной, / (X) - композиция базовых алгоритмов, предсказывающих целевую переменную (3)

Л (X,) = са (X,) + с2а2 (X,) +... + скак (X,) . (3)

Х[14] <= 0.96 squared_em>r = 0.002 samples = 3072 valué = 0 884

X[14] < = 0 929

squared erre H" = 0-001

samples - 801

valué = 0.84

Х[13] <=0-921 squared_error = 0.001 samples = 2271 valué = 0.899

X[13] <= 0 901 square<J_error - 0-001 samples = 278 valué = 0.816 x(13! <= 0 904 squared_error = 0.001 samples = 523 valué = 0,852 Xt 14] <= 0.989 bquared_error = 0.001 samples - 1381 valué = 0 881 X[13J <= 0 95 squared_error - 0.001 samples = 890 vatue = 0 926

7~T

7~Y

7~T

squared_error = 0.0 samptes = 159 valué = 0805 squared_error = 0.0< samples =119 valué = 0.83 squared_error =0.0 samples = 323 vatue = 0.841 squared_error = 0.0 samples - 200 valué = 0871 squared_error = 0.0 samples - 850 valué = 0874 squared_error = 00 samples = 531 valué = 0894 squared_error = 0.0 samples = 641 valué = 0.918 squared_em>r = 0.0c samples = 249 valué = 0947

Рис. 2. Фрагмент дерева принятия решений (Rch - X[13], Rn - X[14])

2) Используя правила построения дерева принятия решения, произведём обучение алгоритма c¡a¡(Xi), который наилучшим образом предсказывает значение целевой переменной yi

(4).

fl(xi) = ca(xt). (4)

3) Вычисляем ошибку предсказания (5).

e = У - f1(X). (5)

4) В течение (K- 1) итераций j выполняем приведённые ниже действия.

4.1) Осуществляем построение дерева aj для того, чтобы скомпенсировать ошибку ei

(6).

(6)

L(ei,c2a2(Xt)) ^ min .

Константа Cj подбирается аналогично методу наискорейшего спуска [4].

4.2) Включаем полученный алгоритм в существующую композицию fj-1(X1) (7).

fj(Xi) = c1a1(Xi) + C2a2(Xi) +... + c^a^X,) + c^j{X,). (7)

4.3) Вычисляем разность между правильным ответом и текущим предсказанием из j алгоритмов, а именно, новое значение ошибки (8).

е = у - f1(X,). (8)

Основными параметрами градиентного бустинга над решающими деревьями являются количество деревьев в алгоритме, их глубина. У градиентного бустинга над решающими деревьями имеются следующие преимущества:

- позволяет достаточно точно восстанавливать искомую функцию;

- способен осуществлять работу с произвольными функциями потерь в задачах регрессии;

- меньше подвержен переобучению, чем другие алгоритмы.

Обобщенная регрессионная нейронная сеть (GRNN) является частным случаем ради-ально-базисных нейронных сетей [7]. Её структура предполагает наличие 2-ух промежуточных слоёв. Первый промежуточный слой сети GRNN состоит из радиальных элементов. Второй промежуточный слой содержит элементы, которые помогают оценить взвешенное среднее. Архитектура сети представлена на рис. 3 и имеет следующую математическую модель (9):

±yfi )х'X') ( Л {\х - X Y(X) = --, G(х,X¡)= exp '

Z g(X , X;)

\ - x;J)x - x)

2a2

(9)

,=i

где 0(Х, X) - Гауссово ядро, х,, у, - входы и выходы обучающей выборки.

GRNN копирует обучающую выборку и использует её для оценки отклика в произвольной точке. Выходное значение представляет взвешенное среднее выходов по обучающейся выборке. GRNN обладает следующими преимуществами:

- обучение сети производится за один проход, потребность в обратном распространении не требуется;

- высокая точность оценки;

- способна обрабатывать шумы на входных данных.

Для оценки эффективности приведённых алгоритмов будет использован язык python3. Для решения задачи регрессии при помощи градиентного бустинга будет задействована библиотека CatBoost [8], которая содержит готовые модели ансамбля решающих деревьев. CatBoost - открытая программная библиотека, разработанная компанией Яндекс и реализующая уникальный патентованный алгоритм построения моделей машинного обучения, использующий одну из оригинальных схем градиентного бустинга. Для применения в текущей работе GRNN будет использована реализация регрессионной модели из библиотеки NeuPy [9].

Анализ и подготовка данных. В ходе работы при помощи имитационной модели беспроводной самоорганизующейся сети [10] был собран набор данных. Параметры моделирования представлены в табл. 1. Каждая запись в наборе представляет массив частных метрик Х производительности маршрута связи, полученных в процессе его построения и является признаковым описанием маршрута. Кроме того, каждая запись содержит значения PDR и E2ED (end-to-end delay), рассчитанные по результатам функционирования маршрута связи. PDR и E2ED - целевые переменные, которые требуется предсказывать на основе массива частных метрик.

Таблица 1

Параметры модели ad-hoc сети при сборе данных_

Параметр Значение

Максимальная длина маршрута 5, 6, 7, ..., 19, 20

Скорость передачи данных 8 Кб/с.

Трафик между абонентами 2 Кб/с.

Максимальная скорость движения абонентов 15 м/с.

Модель движения абонентов Модель случайных перемещений на основе случайных точек

Радиус радиопередачи 400 м.

Размер карты 1500 х 1500 м2

Ограничение по виртуальному времени моделирования 1200 с.

В качестве признаков описания маршрута использовались следующие:

- N - длина маршрута;

- Уау, УтСх - средняя и максимальная скорости перемещения узлов маршрута;

- В\$1аю, Distmax - среднее и максимальное расстояния между абонентами маршрута;

- !аи, 1тах - общее и максимальное количество маршрутов, которые включают в свой состав транзитных абонентов;

- Lav, Lmax - средняя и максимальная загрузки каналов связи;

- Qav, Qmax - средний и максимальный размеры очереди пакетов на транзитных абонентах;

- Delayav, Delaymax - средняя и максимальная задержки пакета на узлах маршрута;

- Rch - доля данных, которые не теряются при прохождении пакетов через каналы беспроводной связи;

- Rn -доля данных, которые не теряются при прохождении пакетов через абонентов

сети.

Для оценки возможности построить качественные модели машинного обучения был произведён корреляционный анализ [11] между признаковым описанием маршрута связи и показателями PDR и E2ED. Результаты анализа представлены в табл. 2. Значения PDR имеют корреляцию среднего уровня с признаками N, Rch, Rn, а также несколько более слабую статистическую зависимость с Iaii, lmax, Lav, Lmax, Delayav, Delaymax. Показатель E2ED сильно коррелирует с признаками Delayav и Rn, и слабее с Delaymax, Qav, Lav, Iaii, Imax. FS имеет выраженную статистическую взаимосвязь с Iall, Lav, Qav, Delayav, Rch, Rn. Результаты корреляционного анализа демонстрируют возможность построить качественные модели машинного обучения, которые будут предсказывать PDR, E2ED, Fs.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 2

Корреляция между целевыми переменными и признаками_

Корреляция признаков и PDR

N Vav Vmax Distav Distmax Iall Imax

-0,53 -0,094 -0,09 -0,041 -0,028 -0,493 -0,36

Lav Lmax Qav Qmax Delayav Delaymax Rch Rn

-0,382 -0,35 -0,267 -0,188 -0,424 -0,364 0,569 0,681

Корреляция признаков и E2ED

N Vav Vmax Distav Distmax Iall Imax

0,297 -0,006 -0,008 -0,004 -0,002 0,499 0,34

Lav Lmax Qav Qmax Delayav Delaymax Rch Rn

0,461 0,32 0,449 0,235 0,765 0,399 -0,318 -0,65

Корреляция признаков и Fs

N Vav Vmax Distav Distmax Iall Imax

-0,47 -0,026 -0,028 -0,014 -0,013 -0,46 -0,32

Lav Lmax Qav Qmax Delayav Delaymax Rch Rn

-0,43 -0,31 -0,44 -0,25 -0,51 -0,35 -0,47 -0,64

Для проверки эффективности алгоритмов градиентного бустинга и нейронной сети набор данных будет разделён на обучающуюся (Хйап, PDRtrain, E2EDtram) и тестовую (Xtest, PDRtest, E2EDtest) выборки в пропорции 4:1. Отсутствие в наборе категориальных признаков упрощает решение задачи. Для стабильной работы алгоритма GRNN произведём нормирование признаков по формуле (10).

X', = ^^. (10)

где щ - среднее значение X) на обучающем наборе данных, о ^ - стандартное отклонение. Такой процедуре должны быть подвержены все признаки, поступающие на вход обобщённой регрессионной нейронной сети.

Экспериментальное исследование. В ходе экспериментального исследования производилось обучение алгоритмов градиентного бустинга и GRNN на одинаковой обучающей выборке, после чего эффективность их работы сравнивалась на тестовом наборе данных. Для исследования были использованы язык программирования руШопЗ, а также библиотеки catboost, содержащая алгоритм градиентного бустинга, и №иРу, содержащая алгоритм GRNN.

Для сравнения результатов работы алгоритмов использовались такие метрики обучения, как квадратный корень среднеквадратичной ошибки RMSE и коэффициент детерминации Л2 [12]. RMSE вычисляется по формуле (11).

RMSE ( y, Y ) =

1 l

у I ( - Y )2.

l i=i

(ii)

где у - массив истинных значений, У - массив предсказаний. Л вычисляется по следующей формуле (12).

I (у - г, )2

Я2(Т, у,)=1 - ( . (12)

- у)2

1=1

где у - среднее истинное значение целевой переменной.

В ходе экспериментального исследования алгоритмы были обучены отдельно для предсказывания PDR, E2ED и Fs. Результаты экспериментального исследования представлены в табл. 3. Для обучения алгоритма градиентного бустинга использовались стандартные настройки регрессора CatBoostRegressor (количество деревьев - 100, глубина дерева - 5). Для регрессора GRNN были установлены значения о, равные 0,7 для предсказания метрики PDR, 1,3 для предсказания E2ED, 1,0 для предсказания FS. Кроме того, в таблице представлены КМ8Е и Я2 для Fs - значение показателя аналитически рассчитанное на основе предсказанных PDR и E2ED по формуле (1).

Таблица 3

Результаты экспериментального исследования_

Предсказываемый показатель RMSE R2

Градиентный бустинг GRNN Градиентный бустинг GRNN

PDR 0,07 0,07 0,68 0,67

E2ED 11,57 15,1 0,95 0,92

Fs' 5,67 12,34 0,94 0,73

Fs 4,63 10,49 0,96 0,81

Результаты экспериментального исследования демонстрируют, что алгоритм градиентного бустинга лучше GRNN предсказывает метрики PDR, E2ED, Fs. При этом оба алгоритма относительно хорошо справились с предсказанием метрики E2ED и значительно хуже с предсказанием PDR. Коэффициент детерминации больше 0,8 свидетельствует о высоком качестве работы алгоритмов, в тоже время в тоже время значения R2 0,67 и 0,68 для PDR можно считать приемлемыми.

При этом градиентный бустинг значительно лучше предсказывает метрику Fo, что показывают значительно меньшее значение RMSE (в 2,27 раз меньше, чем для GRNN) и высокое значении R2, которое близко к 1,0. Аналитически рассчитанное значение Fs' несколько уступает в качестве предсказанному напрямую значению, поэтому для оценки маршрута связи целесообразно использовать показатель Fs, полученный при помощи алгоритма градиентного бустинга.

Заключение. В текущей работе была произведена оценка методов машинного обучения, а именно, градиентного бустинга и обобщённой регрессионной нейронной сети для прогнозирования качества маршрутов связи в беспроводных самоорганизующихся сетях передачи данных на основе частных маршрутных метрик. Для этого был собран набор данных, включающий информацию о метриках маршрутов связи и результатах их функционирования. Проведённый корреляционный анализ продемонстрировал высокую статистическую взаимосвязь ряда метрик и целевых показателей. Результаты экспериментального исследования демонстрируют высокие показатели эффективности работы алгоритма градиентного бустинга на тестовом наборе данных, поэтому его целесообразно использовать для оценки маршрутов связи при их построении в беспроводных децентрализованных самоорганизующихся сетях.

Исследование выполнено при финансовой поддержке правительства Тульской области в сфере науки и техники (грант № ДС/286).

Список литературы

1. Mobile Ad Hoc Networks: Current Status and Future Trends / Edited by Loo J.; Lloret Mauri J., Ortiz J. Boca Raton, FL: CRC Press, 2012. 538 p.

2. Олифер В.Г., Олифер Н.А. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов. 4-е изд. СПб.: Питер, 2010. 944 с.

3. Гоголева М.А. Классификация и анализ методов маршрутизации в Mesh-сетях // Радиотехника. 2008. № 155. С. 173-185.

4. Пестин М.С., Новиков А.С. Алгоритм многопутевой маршрутизации трафика в MANET сетях на основе анализа пропускной способности каналов связи // Вестник Рязанского государственного радиотехнического университета. 2022. № 80. С. 84-93. DOI: 10.21667/19954565-2022-80-84-93.

5. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. СПб.: Питер, 2017. 336 с.

6. Piryonesi S.M., El-Diraby T. «Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index. Journal of Infrastructure Systems», No. 26, vol. 1, 2020. 25 p. D0I:10.1061/(ASCE)IS.1943-555X.0000512.

7. Nader F., Hong G., Kazem M., Seyyed Ali S., Keramat H., Mohammad Reza E. «Nonlinear Poisson regression using neural networks: A simulation study», Neural Computing and Applications, No. 18, vol. 8. P. 939-943. D0I:10.1007/s00521-009-0277-8. S2CID 18980875.

8. Yegulalp S. Yandex open sources CatBoost machine learning library, 2020: [Электронный ресурс]. URL: https://www.infoworld.com/article/3209124/yandex-open-sources-catboost-machine-learning-library.html (дата обращения: 14.08.2022).

9. NeuPy. Neural Networks in Python. Официальный сайт: [Электронный ресурс]. URL: http://neupy.com/pages/home.html (дата обращения: 14.08.2022).

10. Пестин М.С., Новиков А.С. Имитационная модель беспроводной ad-hoc сети для исследования алгоритмов маршрутизации трафика // Прикладная информатика. 2020. Принято к публикации.

11. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. 10-е издание, стереотипное. М.: Высшая школа, 2004. 479 с.

12. Ивченко Г.И., Медведев Ю.И. Введение в математическую статистику. М.: Издательство ЛКИ, 2010. 600 с.

Пестин Максим Сергеевич, аспирант, maxime1996rus@mail.ru, Россия, Тула, Тульский государственный университет,

Научный руководитель: Новиков Александр Сергеевич, канд. техн. наук, доцент, thesis-tsu@yandex.ru, Россия, Тула, Тульский государственный университет

MACHINE LEARNING METHODS FOR CONSTRUCTING COMMUNICATION ROUTES IN WIRELESS AD-HOC - DATA TRANSMISSION NETWORKS

M.S. Pestin

There are many approaches to building communication routes in wireless decentralized data networks. However, in most cases they work effectively only in networks with a quasi-static network topology. The length of the route, the speed of its discovery, which are the main metrics used by classical algorithms, do not allow predicting how effective the routes will be in general. Therefore, a comprehensive assessment of data transmission paths is required at the stage of their construction. In the current work, a study was made methods of gradient boosting decision trees and GRNN to determine the quality of communication routes when they are built in wireless ad-hoc networks. Algorithms were trained to predict reliability, end-to-end round-trip times, and Fs based on private routing metrics. The comparison was made on a test data set using the square of the root mean square error and the coefficient of determination. The results of the experimental study showed that the gradient boosting algorithm predicts targets better than GRNN, and can be used to evaluate communication routes during their construction in wireless decentralized data networks.

Key words: wireless ad-hoc network, traffic routing, routing metric, gradient boosting,

GRNN.

Pestin Maxim Sergeevich, postgraduate, maxime1996rus@mail.ru, Russia, Tula, Tula State University,

Scientific advisor: Novikov Alexander Sergeevich, candidate of technical science, docent of computer engineering department, thesis-tsu@yandex. ru, Russia, Tula, Tula State University

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пестин Максим Сергеевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пестин Максим Сергеевич

MACHINE LEARNING METHODS FOR CONSTRUCTING COMMUNICATION ROUTES IN WIRELESS AD-HOC - DATA TRANSMISSION NETWORKS

Текст научной работы на тему «МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ПОСТРОЕНИЯ МАРШРУТОВ СВЯЗИ В БЕСПРОВОДНЫХ AD-HOC- СЕТЯХ ПЕРЕДАЧИ ДАННЫХ»