№ 6(30) 2010
Е. Л. Калишенко, К. В. Кринкин
Подходы к прогнозированию трафика в беспроводных те$Ь-сетях
Прогнозирование сетевого трафика играет важную роль в гарантировании заданного качества обслуживания — ОоБ. В статье проводится анализ известных подходов к прогнозированию трафика в сетях с высокой динамикой топологии, также авторами рассмотрены области их применения.
Введение
В настоящее время существенно возросла популярность беспроводных сетей среди конечных потребителей сетевых технологий. Это обусловлено целым рядом факторов, в том числе доступностью мобильных терминалов (телефонов, смартфонов, коммуникаторов, нетбуков) и сравнимостью характеристик беспроводных сетей со своими проводными аналогами. Иллюзия непрерывности сети востребована пользователями, что является серьезным стимулом для развития беспроводной сетевой инфраструктуры не только в масштабе офиса и квартиры, но и города.
Несмотря на заметный прогресс в области стандартизации беспроводных сетей, есть целый ряд нерешенных технических проблем. Одной из них является предсказание и управление трафиком. Исторически алгоритмы и протоколы маршрутизации уходят своими корнями в мир проводных сетей, где топология сети и структура потоков данных относительно стабильны. Существуют эффективные алгоритмы адаптивной маршрутизации, которые позволяют подстраивать процедуру выбора маршрутов под конкретную ситуацию. Как показано в [1], для сетей с высокой динамикой топологии, каковыми являются, например, mesh-сети стандарта IEEE 802.11s, адаптации недостаточно, и требуются проактивные процедуры. В настоящей статье рассматриваются из-
вестные подходы к прогнозированию трафика в сетях данного класса и области их применения.
Для полноты картины приведем наиболее распространенные виды беспроводных сетей:
• Аб-1пос-сети\ высокодинамичные одноранговые беспроводные сети с жесткими ограничениями по энергопотреблению и, как следствие, использующие в основном алгоритмы маршрутизации по требованию. Отсутствие иерархии при построении такого типа сетей приводит к малой пригодности их применения при большом числе узлов или необходимости обеспечивать постоянную, достаточно высокую пропускную способность.
• Сенсорные сети: датчики, измеряющие различные физические величины, объединенные в беспроводную сеть сбора измерительной информации. Отличаются крайне ограниченной функциональностью и низкой динамичностью и, как следствие, несложными алгоритмами маршрутизации.
• МевЬ-сети: самоорганизующиеся беспроводные сети с менее жесткими ограничениями на энергопотребление узлов по сравнению с ас1-1"юс-сетями и меньшей динамичностью — допускается наличие сети базовых станций, выполняющих роль пограничных маршрутизаторов и/или предоставляющих наборы постоянных сетевых сервисов. Каждый узел такой сети может являться маршрутизатором пакетов.
№ 6(30) 2010
Беспроводные Mesh-сети
Появление самоорганизующихся беспроводных mesh-сетей (Wireless Mesh Networks — WMN) позволило строить беспроводные сети практически без участия человека. Существуют 3 варианта построения сетей такого типа:
• WMN с плоской топологией: наиболее простой в построении тип WMN, близкий к ad-hoc-еети. Все узлы сети находятся на одном уровне иерархии и одновременно являются и клиентами, и маршрутизаторами.
• Иерархическая WMN: клиентские узлы формируют низший уровень иерархии сети, на более высоких уровнях находятся маршрутизаторы (в большинстве случаев выделенные), что обеспечивает постоянное прохождение трафика, в то время как трафик, проходящий через клиентские узлы, может прерываться, например, из-за временной недоступности узла. Ответственность за самоорганизацию такой сети лежит на выделенных маршрутизаторах, часть из которых имеет возможность предоставлять внешние сервисы, к примеру, доступ в Интернет.
• ГАбридные WMN: предполагают использование других видов беспроводных сетей для организации коммуникации (сотовые сети, WiMAX, спутниковые сети и др.) между узлами.
Динамичная природа WMN и ограничения на качество обслуживания (поддерживаемые сетевые сервисы, пропускная способность и др.) обусловливают ряд специфических задач при проектировании различных уровней сетевого взаимодействия. Одной из таких задач является переконфигурирование маршрутов при перемещении мобильного узла в пространстве. В отличие от проводных сетей, где маршрутизация осуществляется на сетевом уровне, в mesh введена маршрутизация на уровне доступа к среде (Medium Access Layer — MAC). Здесь разработаны модифицированные алгоритмы разделения среды посредством нескольких радиочастот для передачи данных. Также ведутся исследования по изучению возмож-
ности использования информации с других уровней иерархии сетевых протоколов (сетевого, транспортного), что, вероятно, позволит привлекать дополнительную служебную информацию о конкретной WMN.
Обеспечение предоставления сервисов на уровне приложений делает необходимой реализацию системы их регистрации и поиска в условиях меняющейся топологии и состава узлов сети.
Рассмотрим ряд идей, позволяющих с определенной точностью прогнозировать загрузку участков беспроводных сетей и тем самым оптимизирующих потоки трафика, предотвращая появление участков высокой загруженности, где это возможно. Наименования конкретных сетевых технологий и протоколов в статье не представлены во избежание излишних технических деталей. Внимание авторов сфокусировано на подходах к прогнозированию трафика.
Нейронные сети на вейвлетах
Прогнозирование сетевого трафика играет важную роль в гарантировании заданного качества обслуживания — ОоЭ. Традиционные методы прогнозирования трудно применимы на практике, главным образом, из-за сложности структуры сетевого трафика и большой ресурсоемкости, в то время как оптимизация маршрутов доставки пакетов должна проходить в реальном времени и базироваться на только что поступивших данных и, возможно, небольшой предыстории.
На основе прогнозирования сетевого трафика предлагается следующий алгоритм обеспечения бесперебойной передачи данных с постоянным ОоЭ [2]:
• Между источником и получателем формируются один основной и несколько вспомогательных маршрутов передачи данных, исходя из расстояния между узлами, пропускной способности канала и остаточной энергии (рис.1).
• Если хотя бы один из узлов основного пути прогнозирует перегрузку трафика (например, приоритизированным трафиком
№ 6(30) 2010
Рис. 1. Формирование маршрутов
реального времени — VoIP), уведомляющее сообщение посылается на источник.
• Передача данных осуществляется по первому вспомогательному маршруту до тех пор, пока сохраняется опасность загрузки основного пути.
Уравнение прогнозирования трафика основано на вейвлетных преобразованиях и может быть аппроксимировано набором ортогональных функций. Кроме того, линейную структуру входных параметров функции возможно реализовать нейронной сетью. Предложенная вейвлетная нейронная сеть имеет трехуровневую структуру:
о р входов для р значений временных рядов;
о п нейронов на среднем уровне, их число зависит от размера анализируемого временного ряда и заданной функции ошибок; о 1 нейрон на выходном уровне. Вейвлетная нейронная сеть относится к нелинейным методам прогнозирования трафика в противовес линейным, в большинстве своем основанных на фильтрах Калмана.
Анализ трафика беспроводных сетей показал наличие у него таких свойств, как самоподобие, многоуровневая структура и влияние на большие расстояния. Наличие этих свойств обусловливает применение не-
линейной модели прогнозирования. Данный алгоритм представляет собой баланс между вейвлетами, не применимыми в реальном времени в чистом виде, и нейронными сетями с медленной сходимостью и локальностью решения.
Симбиоз этих двух моделей демонстрирует лучшую производительность и адаптационную способность по отношению к другим нейронным сетям. На рисунке 2 приведен результат прогнозирования загрузки сети, полученный в симуляторе пэ2 с анализом трафика каждые 5 мин в общей сложности 100 раз.
Время (5 мни.)
Рис. 2. Результат симуляции в ns2
№ 6(30) 2010
Кластеризация по плотности трафика
Кроме оптимизации межузлового взаимодействия, в мобильных сетях существует задача распределения нагрузки между сетью базовых станций (СБС), обеспечивающих внешние сетевые сервисы, например, Интернет, телефонию. Работа СБС в чем-то похожа на работу тезИ-сегмента, за исключением того, что базовые станции не могут менять своего географического местоположения. Каждый мобильный узел является одновременно и клиентом, и точкой доступа. Обобщенная структура такой сети представлена на рис. 3 и состоит из набора шестигранных ячеек, в каждой из которых расположена базовая станция, обладающая возможностью обслуживать мобильные устройства не только в своем шестиграннике, но и в некоторой его окрестности [3].
Как правило, для каждой станции определен набор каналов обслуживания абонентов. Если все каналы данной базовой станции заняты, клиент не сможет совершить звонок. Кластеризация призвана выделить три группы станций:
1) перегруженные;
2) среднезагруженные;
3) простаивающие.
Рис. 3. Сеть базовых станций
В случае выявления группы сильно загруженных станций, радиальные, менее загруженные базовые станции, могут перехватить часть трафика, выделяя каналы из своих резервов. После кластеризации на основании плотности трафика с применением известных методов, например, ближайшего соседа, используется простая нейронная сеть, имеющая радиальную базовую функцию и позволяющая прогнозировать число каналов, которое потребуется в скором времени в конкретном кластере. После такого анализа становятся возможными резервирование и выделение нужного числа каналов у менее загруженных базовых станций. Идея резервирования каналов может быть распространена на клиентские mesh-сети, в которых вместо базовых станций выступают мобильные терминалы.
Graph Mining
Рассмотрим еще один интересный подход к прогнозированию загрузки сетей из области анализа загруженности автомагистралей. Так же, как и прогнозирование загрузки беспроводных сетей призвано оптимизировать маршруты доставки данных, так и анализ загрузки автомобильных дорог помогает системе навигации выбрать оптимальный маршрут с учетом текущей и прогнозируемой загруженности участка магистрали.
Модель, используемая в алгоритме [4], — граф, где узлы являются перекрестками и местами назначения, а ребра — улицами, соединяющими узлы. Основная метрика ребер графа — это скорость, с которой по данному ребру может передвигаться транспорт. Стоит отметить, что в случае с транспортом нельзя назвать точку назначения конкретного автомобиля, что осложняет алгоритм прогнозирования и снижает его точность, в то время как при анализе мобильных сетей место назначения пакетов всегда известно, что, видимо, должно положительно сказаться на его применении к беспроводным сетям.
65
№ 6(30) 2010
Прогнозирование в случае анализа графов сводится к определению веса ребер в некоторый момент времени в будущем. Основная идея алгоритма заключается в определении всех возможных позиций объекта на время прогнозирования.
Таким образом, вес каждого ребра увеличивается на величину вероятности пребывания на нем объекта. Для того чтобы определить возможные пути объекта, требуется выявить места его назначения, которые зависят от пути, уже им проделанного. Это достигается взятием первой точки из истории пути и применением алгоритма Дейк-стры для поиска кратчайших путей до всех узлов сети. В ходе увеличения веса ребер на основании вероятности достижения объектом конкретного узла учитывается предыдущий путь, им пройденный. Прибавка будет тем меньше, чем дальше место назначения от пройденного пути. Результаты испытаний описанного алгоритма представлены на рис. 4.
■S- 0 20 40 60 80
g. Время At (мин.)
Ï Рис. 4. Результаты натурных испытаний
Я
О
!
| Анализ временных рядов
о
%
Анализ временных рядов широко приме-з няется в проводных сетях, однако, для использования в клиентских беспроводных ceci тях требуется его модификация, позволяю-
щая минимизировать объем анализируемой информации. Одним из удачных алгоритмов является оптимизация маршрутов в беспроводных mesh-сетях между узлами сети без учета трафика, направленного во вне [5]. Основная задача — прогнозирование загруженности узла на основе истории потоков трафика и информации о корректировке алгоритмов маршрутизации в сети.
Входные данные алгоритма — временные ряды, полученные за определенный период времени, отражающие загруженность сети в некоторых единицах, например, байт/час. Первым шагом анализа временного ряда является выявление и удаление циклических дневных и недельных шаблонов. Чтобы уменьшить вклад случайного трафика, временной ряд проходит этап фильтрации. Следующий этап — построение регрессивной модели скорректированного трафика. Стоит отметить равномерное распределение функции ошибки, что позволяет говорить о результатах в виде среднего прогнозируемого значения и его дисперсии. На рисунке 5 приведен результат 976-часового эксперимента по прогнозированию трафика предложенным алгоритмом.
Process Mining
Каждый из рассмотренных подходов прогнозирования трафика, с одной стороны, обладает некоторыми преимуществами, а с другой — налагает определенные ограничения на топологию и динамику анализируемой беспроводной сети:
1. Нейронные сети на вейвлетах: эффективный алгоритм прогнозирования трафика, судя по проведенным экспериментам в симуляторе, не так полезен при недостаточной статистической информации о потоках трафика. Изменение топологии сети может не совпадать с увеличением трафика через узлы, становящиеся потенциально перегруженными.
2. Кластеризация по плотности трафика: подход подразумевает наличие сети статич-
№ 6(30) 2010
Время (день с 03/24/2002) Рис. 5. Результаты эксперимента
ных базовых станций, между которыми возможно перераспределить часть нагрузки. Однако перераспределение нагрузки необходимо производить и между конечными узлами сети, которые могут не иметь прямого доступа к базовой станции, кроме того, базовых станций может вообще не быть, и тогда в роли маршрутизаторов и поставщиков сервисов выступят перемещающиеся в пространстве узлы сети.
3. Graph Mining: алгоритм неустойчив к изменяющейся топологии сети из-за предположения о том, что граф остается неизменным во время анализа (аналогично «заморозке мира» в анализе графа достижимости объектов при сборке мусора java-машиной), а также ввиду вычислительной и алгоритмической сложности анализа постоянно меняющегося графа.
4. Анализ временных рядов: рассчитан только на анализ внутри сетевого трафика, так как методы избавления от шума и прогнозирования во временных рядах предполагают наличие периодических законов распределения потоков трафика, что нехарактерно для динамичных сетей с узлами, активно взаимодействующими с внешним миром.
Актуальным направлением для исследований является изучение возможности создания алгоритма, позволяющего определять шаблонные топологии сети, основанного на методах анализа процессов [6]. Этот алгоритм должен отслеживать изменение то-
пологии и предоставлять информацию для перераспределения маршрутов между узлами, которые в данной топологии прогнозируются менее загруженными. Цель — избежать ситуаций, схожих с представленными на рис. 6.
Важное преимущество такого подхода в том, что необходимая статистическая информация о самом трафике сети минимальна, главным образом, используется информация о взаимном расположении узлов, и на основе этого расположения проводят прогнозирование возможной загруженности какого-либо узла при неизменной политике маршрутизации. К сожалению, работ, посвященных изучению такого рода алгоритмов, нет.
Кроме рассмотренных, существуют алгоритмы, использующие для краткосрочного прогнозирования эволюционные методы загруженности сети и некоторые другие методы.
Заключение
Представленные алгоритмы хорошо применимы в беспроводных сетях с различными дополнительными ограничениями или свойствами:
• Алгоритм кластеризации по плотности трафика по своей природе рассчитан на сеть с базовыми станциями. В мезИ-сетях такие станции применяются для разгрузки мобильных устройств при маршрутизации
67
№ 6(30) 2010
Рис. 6. Перегруженные узлы
трафика, предоставляют выход во внешние сети.
• Анализ временных рядов применим в основном к сетям, обладающим свойством регулярности (периодичности) по отношению к какому-либо виду трафика.
• Graph Mining, пришедший из области анализа движения городского автотранспорта, рассчитан, главным образом, на статические или медленно меняющиеся топологии сети.
• Наиболее подходящим с точки зрения адаптируемости к структуре мобильных беспроводных сетей является метод, основанный на нейронных сетях с вейвлетами, однако, данных о его эффективности в условиях быстро меняющейся топологии сети пока недостаточно.
В дополнение к одному из методов прогнозирования загрузки динамичной беспроводной сети, например, метода нейронных сетей на вейвлетах можно использовать знания, накапливаемые в процессе обмена трафиком по отношению к загруженности отдельных узлов при определенных шаблонах топологий сети. Предлагается выявление стандартных шаблонов топологий, их изменение и прогнозирование перегруженных трафиком узлов, которые могут появ-
ляться вследствие динамичного изменения топологии сети.
Описок литературы
1. Кринкин К. В., Экало А. В., Яновский В. В. Алгоритмы адаптивной маршрутизации в динамических компьютерных сетях в условиях неполноты данных. Санкт-Петербургский гос. электротехнический ун-т им. В. И. Ульянова (Ленина) «ЛЭТИ», 2007.
2. Zhiyuan Li, Ruchuan Wang A. Multipath Routing Algorithm Based on Traffic Prediction in Wireless Mesh Networks // Proc. 5-th IEEE / Conf. on Natural Computation. Tianjin, 2009.
3. Usha J., Kumar Ajay and Shaligram A. D. Clustering Approach for Congestion in Mobile Networks // International Journal of Computer Science and Net-workSecurity. 2010. №2.
4. Hans-Peter Kriegel, Matthias Renz, Matthias Schubert, Andreas Zuefie. Statistical Density Prediction in Traffic Networks // Proc. 8-th / SIAM International Conference on Data Mining, 2008.
5. Liang Dai, Yuan Xue, Bin Chang, Yanchuan Cao, Yi Cui. Optimal Routing for Wireless Mesh Networks With Dynamic Traffic Demand // Mobile Networks and Applications. 2008. № 1.
6. Барсегян А., Холод И., Куприянов M. Анализ данных и процессов. БХВ-Петербург, 2009.
68