Научная статья на тему 'Методы повышения надежности в сетях SDN'

Методы повышения надежности в сетях SDN Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2273
292
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАДЁЖНОСТЬ / РЕЗЕРВИРОВАНИЕ / ПЕРЕМАРШРУТИЗАЦИЯ / АЛГОРИТМ ПРОЕКТИРОВАНИЯ / СЕТИ С ПРОГРАММНЫМ ЗАДАНИЕМ КОНФИГУРАЦИИ / SDN

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сергеева Т. П., Тетёкин Н. Н.

До недавнего времени основной технологией построения магистральных транспортных сетей связи России являлась технология синхронной цифровой иерархии (SDH), позволяющая обеспечивать автономное автоматическое обнаружение неисправностей и резервирование. Однако с течением времени пропускная способность систем SDH оказалась недостаточной для удовлетворения возросших и продолжающих расти потребностей телекоммуникационного рынка. Обеспечение надёжности сетей основано на обнаружении отказа и резервировании. Причем в сетях с новыми технологиями восстановление должно производиться за время, не превышающее 50 мс. Современной тенденцией в сетях с программным заданием конфигурации (SDN).является перенос основной нагрузки по повышению надежности с физического на более высокие уровни, вплоть до прикладного. Это соответствует переходу от аппаратного способа резервирования на программный способ. Приведен обзор последних разработок методов повышения надежности в сетях SDN. Для борьбы с потерей пакетов в сети (в том числе и в сетях SDN) и нахождения резервных маршрутов используется механизм перемаршрутизации. Во всех случаях решение задачи маршрутизации сводится к проблеме CSP (Constrained Shortest Path) проблеме построения кратчайших путей с учетом ограничений. В этом методе, решая задачу линейного программирования отыскивают минимальное значение функции стоимости всех путей, определяемой в виде суммы стоимостей всех формируемых на сети путей при выполнении ограничений по суммарной задержке. Проанализированы предлагаемые в литературе варианты решения задачи CSP, и указаны присутствующие в них нерешённые трудности, которые могут составить предмет для дальнейших исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы повышения надежности в сетях SDN»

Методы повышения надежности в сетях SDN

Ключевые слова: надёжность, резервирование, перемаршрутизация, алгоритм проектирования, сети с программным заданием конфигурации, SDN.

До недавнего времени основной технологией построения магистральных транспортных сетей связи России являлась технология синхронной цифровой иерархии (SDH), позволяющая обеспечивать автономное автоматическое обнаружение неисправностей и резервирование. Однако с течением времени пропускная способность систем SDH оказалась недостаточной для удовлетворения возросших и продолжающих расти потребностей телекоммуникационного рынка. Обеспечение надёжности сетей основано на обнаружении отказа и резервировании. Причем в сетях с новыми технологиями восстановление должно производиться за время, не превышающее 50 мс. Современной тенденцией в сетях с программным заданием конфигурации ^^лвляется перенос основной нагрузки по повышению надежности с физического на более высокие уровни, вплоть до прикладного. Это соответствует переходу от аппаратного способа резервирования на программный способ. Приведен обзор последних разработок методов повышения надежности в сетях SDN. Для борьбы с потерей пакетов в сети (в том числе и в сетях SDN) и нахождения резервных маршрутов используется механизм перемаршрутизации. Во всех случаях решение задачи маршрутизации сводится к проблеме CSP (Constrained Shortest Path) - проблеме построения кратчайших путей с учетом ограничений. В этом методе, решая задачу линейного программирования отыскивают минимальное значение функции стоимости всех путей, определяемой в виде суммы стоимостей всех формируемых на сети путей при выполнении ограничений по суммарной задержке. Проанализированы предлагаемые в литературе варианты решения задачи CSP, и указаны присутствующие в них нерешённые трудности, которые могут составить предмет для дальнейших исследований.

Сергеева Т.П., ФГУП ЦНИИС, Москва,

главный научный сотрудник, с.н.с., к.т.н., [email protected]

Тетёкин Н.Н., ФГУП ЦНИИС, Москва, старший научный сотрудник, к.т.н., [email protected]

До недавнего времени основной технологией построения магистральных транспортных сетей связи России являлась технология синхронной цифровой иерархии (СЦИ, SDH, Synchronous Digital Hierarchy). Системы SDH обладают уникальным свойством обеспечивать selfheelling — автономное автоматическое обнаружение неисправностей и резервирование (которое в нашей стране обозначено термином «самовосстановление»). Если выполнить переход от резервирования на физическом (аппаратном) уровне к резервированию на более высоких уровнях модели OSI, появляется ряд новых преимуществ. Во-первых, при программных способах имеется гораздо больше возможностей для резервирования, чем при аппаратных. Кроме того, операции резервирования на верхних уровнях являются прозрачными относительно нижних уровней модели. Например, если после попытки резервирования на физическом уровне (SDH) были зафиксированы отрицательные результаты такого резервирования, то требовалось выполнять дополнительное резервирование на сетевом уровне, причём эта операция должна начинаться с некоторой расчетной задержкой, что повышает время переключения и достаточно сложно реализуется [5]. Поэтому резервирование в сетях SDN, при котором решение о резервировании принимается на прикладном уровне (в плоскости управлении SDN), а его реализация выполняется в плоскости данных SDN, в наибольшей степени снимает зависимость от резервирования на других уровнях и повышает скорость переключения, вплоть до 50 мс, которое обеспечивается в сетях SDH.

К сетям с новыми технологиями, таким, как сети с программным заданием конфигурации (SDN), в настоящее время предъявляются высокие требования по надёжности (отказоустойчивости), в том числе к характеристикам восстановления сети после отказа, которое должно производиться незаметно для абонента за время, не превышающее 50 мс. Высокий уровень отказоустойчивости сети обеспечивается за счёт быстрого

обнаружения повреждений и устранения их последствий (т.е. восстановления связи) за короткое время. В данной статье рассматриваются лишь методы и восстановления при повреждениях на сети SDN и не рассматриваются вопросы мониторинга сети. Укажем лишь, что мониторинг производится путем периодической организации в плоскости данных сеансов протокола BFD (Bidirectional Forwarding Detection — двухстороннее обнаружение прохождения связи), в процессе проведения которых сетевые узлы (как соседствующие, так и связанные через неразветвляющуюся цепочку из некоторого числа промежуточных узлов) обмениваются друг с другом проверочными пакетами и пакетами-квитанциями о получении проверочного пакета с таким-то набором признаков, однозначно характеризующих данный пакет. Тем самым вводятся гарантии, что поток информационных пакетов не будет направлен по повреждённому участку сети.

В общем случае все механизмы обеспечения отказоустойчивости [1] подразделяются на два самостоятельных (хотя и имеющих некоторые общие признаки) класса: защитное переключение (или резервирование) и восстановление (или перемаршрутизация).

При защитном переключении резервные схемы типов 1+1 или 1:1 организуют одновременно с рабочим трактом, но в первом случае (схема 1+1) резервные ресурсы непосредственно заняты передачей текущей информации, а во втором (схема 1:1) - они находятся в «холодном резерве», т.е. схема резервирования подготовлена, но не активирована и подлежащая защите информация по ней не передаётся. При восстановлении резервные пропускные способности также могут быть выделены в двух вариантах: либо они расписаны заранее, либо их заранее не выделяют, а подбирают по мере необходимости из доступных на сети свободных (или высвобождаемых для парирования отказа) ресурсов. Основное отличие этих методов состоит в том, что при защитном переключении производится перевод трафика с основного пути на определенный фиксированный обходной путь, тогда как при восстановлении выбор обходного пути выполняется программно по указанному в таблице адресу, но на основе сведений о существующем на данный момент состоянии сети, т.е. динамически.

В сетях SDN для повышения отказоустойчивости плоскости данных используются как методы защитного резервирования, так и методы восстановления, а в плоскости управления также методы защитного резервирования контроллеров и их виртуализация, которая выполняется путем перемаршрутизации [2].

Защитное переключение в плоскости данных не требует в процессе резервирования участия протокола Open Flow. Схемы резервирования вводятся протоколом Open Flow заранее в таблицы коммутации коммутаторов.

Рассмотрим второй способ, когда протокол Open Flow организует собственный способ восстановления, основанный на перемаршрутизации - как основном действующем механизме этого протокола.

Для восстановления используется следующий алгоритм. После обнаружения сигнала отказа контроллером этот отказ фиксируется и составляется список трактов LSP, затронутых данным отказом. Для каждого из них на модели сети, действующей в контроллере, рассчитывается обходной путь, т.е. производится перемаршрутизация по описанному ниже алгоритму CSP на сохранившейся части сети. По результатам работы алгоритма CSP протокол OpenFlow корректирует таблицы коммутации в коммутаторах в соответствии с вновь рассчитанными маршрутами трактов.

Как указывалось в литературе [1], для борьбы с потерей пакетов в сети (в том числе и в сетях SDN) и нахождения резервных маршрутов используется механизм перемаршрутизации. Требуется найти на сети новый маршрут /•, но при этом не перегрузить звенья резервного пути более, чем на 70%. Выбор границы утилизации каналов на уровне 70% объясняется возрастанием задержки в сети при увеличении степени загруженности канала. Особенно резко задержка начинает увеличиваться после уровня загрузки канала, составляющего 70%. Поэтому данная характерная область на графике зависимости задержки в канале от степени его загруженности и выбрана в качестве предельной границы.

Во всех случаях решение задачи маршрутизации сводится к проблеме CSP (Constrained Shortest Path) - проблеме построения кратчайших путей с учетом ограничений, вводимых по некоторым дополнительным соображениям. В этом методе отыскивают минимальное значение функции стоимости всех путей, определяемой в виде суммы стоимостей всех формируемых на сети путей f((r) при выполнении ограничений по суммарной задержке /„(г), т.е. для каждого маршрута рассчитывают показатели

/с(г)= X с</ (])

(Л/Иг 4 ’

/о (О =

(/.у И Г

где с9 И d0 - коэффициенты стоимости и величины задержки для (ij)-ro ребра, соответственно.

Тогда, исходя из вычисленных согласно (1) показателей fc(r) и f0(r), задачу CSP с ограничениями можно (аналогично постановке задачи в [5]) сформулировать как

Метрика эффективности для каждого звена, рассматриваемого при поиске минимума стоимости маршрута в (2), состоит из двух дифференциальных оценок и определяется следующим образом:

cij = 8ij + dj V(/.y) eA (3)

где gv - дифференциальная оценка (штраф), определяющая превышение предельной загрузки (i.j)-ro ребра, a -

дифференциальная оценка задержки.

В состав существующей в сетях SDN системы контроля качества обслуживания OpenQoS включен программный блок управления маршрутами, в котором производится сбор текущих сведений об оценках g и которые называем

дифференциальными вследствие их зависимости от состояния сети, поскольку величины их изменяются в зависимости от текущего технического состояния и картины загруженности всей сети. Метод CSP одновременно решает вопрос повышения надёжности и обеспечения качества обслуживания.

Вычисленное по формуле (3) значение длины ребра используется при нахождении новых маршрутов в сети. Определение маршрутов представляет собой циклическую последовательную процедуру, когда окончательное значение маршрутов устанавливается при отсутствии изменений значений g,, для всех маршрутов цикла или, как вариант, когда

все такие изменения станут меньше заранее назначенного значения точности итерационной процедуры расчёта. Дифференциальную оценку g._ определим следующим образом:

Т„ -0,7x5,,

(4)

0,7 х By < Ту

0,

если 0,7 х В,, > 7*.

где Д - техническая пропускная способность ребра,

а Ту — объём трафика, поступающего в это ребро. Г рафик зависимости дифференциальной оценки превышения трафи-

V (т.е. от величины фак-

А

тической загрузки ребра) приведен на рис. 1.

Штраф за превышение предельной загрузки канала

1 0.9 0.8 0.7 0.6 0.5 0.4

^ —

Ґ

I

/

0.2 0.1

1

1

2 4 6 8 10 коэффициент загрузки канала

arg min

{fc(r)\r є R„, fu(r) < D„

(2)

Рис. 1. Дифференциальная оценка превышения предельной загрузки ребра

то есть на множестве возможных маршрутов /?,, необходимо найти маршрут г, такой, на котором функция стоимости /(г) минимальна и одновременно соблюдается условие,

что задержка /^(г) не превышает заранее заданного значения

Эта функция резко возрастает вблизи выбранного предельного значения загрузки канала, а поведение её («насыщение») при больших значениях аргумента не имеет практического значения, поскольку системы управления сетью никогда не направят в ребро поток трафика, превышающий (и тем более - превышающий многократно) техническую

ТЕХНОЛОГИИ

пропускную способность данного ребра. Поэтому выбранная в (4) достаточно простая зависимость, позволяющая упростить расчёты и не вносящая принципиальных ошибок в окончательные результаты, может быть рекомендована для проведения расчётов по управлению сетью. Дополнительное обсуждение роли компоненты g.. будет приведено ниже.

Выполнение маршрутизации в соответствии с методом CSP требует в качестве дифференциальных оценок стоимостей ребер вычислять их величины по формуле (4).

В [3] указано, что при расчётах значение dtJ принимается

равным 1. На наш взгляд, такое решение нужно считать первым приближением, так как для выбора наиболее эффективных путей необходимо учитывать реальную длину линии, но тогда возникает вопрос нормировки двух составляющих. Эта проблема требует решения, так как метод CSP в настоящее время предложен в МСЭ-Т в качестве новой рекомендации.

В соответствии с (1) маршрутизация в методе CSP эквивалентна тому, что кратчайший путь находится практически только по числу скачков (hop), так как значение g.. мало и в

реальном диапазоне нагрузок изменяется от 0 до 0,3, имея, по большей части, когда нагрузки не превышают 70% от технической пропускной способности ребра, просто нулевое значение.

Решение задачи многопродуктового потока сводится к последовательному решению однопродуктовых задач потока минимальной стоимости, а в однопутевом варианте - кратчайшего по стоимости пути. Это позволяет с помощью достаточно простой программной реализации решать задачу оптимальной маршрутизации для сетей больших размеров. Особенность метода CSP является быстрая сходимость и высокая скорость, что позволяет использовать его для решения задач в реальном времени, т.е. при эксплуатации сети.

Из соотношений d и g,. можно понять, что основную

роль в алгоритме маршрутизации играет задержка, определяемая расстоянием, выраженным количеством участков в маршруте, тогда как задержка из-за очередей в маршрутизаторах проявляется только при утилизации канала, превышающей 0,7 и составляет в сумме выражения (2) существенно меньшую величину, чем первая компонента. Это означает, что в качестве наилучшего (кратчайшего) пути, будет выбираться путь с меньшим числом звеньев.

Поэтому можно сделать вывод, что задержка за счёт очередей в маршрутизаторах считается существенно ниже, чем задержка распространения, т.е. очередями в маршрутизаторах в предложенной реализации метода CSP практически пренебрегают. Однако принципиальная возможность повышения роли задержек в очередях не потеряна и может быть реализована достаточно просто. Для этого в функцию (4) достаточно ввести весовой множитель, превышающий единицу, что изменит взаимное соотношение величин слагаемых с/ и g , и повлияет на окончательный выбор маршрутов. Определение величин такого весового коэффициента никем пока не сделано и может послужить темой для дальнейших исследований. Таким образом, все способы повышения качества обслуживания путём введения различных дисциплин обслуживания очередей для сетей SDN не используются.

Метод CSP ввиду его высокой скорости может использоваться как для определения обходных путей в реальном времени после обнаружения отказа во время эксплуатации сети, так и для предварительного определения обходных путей при проектировании сети. При полном расчёте надёжности необходимо также оценить надёжность управления в сетях SDN, которое производится с помощью контроллеров

Контроллер в сети SDN является ключевым элементом, поскольку он выполняет функции управления элементами сетевой инфраструктуры и потоками данных в сети. Характеристики надёжности сети SDN зависят непосредственно от соответствующих характеристик надёжности контроллера.

В настоящее время анализ характеристик сетей SDN находится в стадии исследования путем организации модельных или натурных экспериментов (опытные зоны). Например, в [3] указывается о проведении экспериментов на опытных сетях и для оценки надёжности измерялись такие параметры, как: количество отказов за время тестирования и время безотказной работы при заданном профиле нагрузок. Исследование надёжности показало, что при длительной работе все тестируемые сетевые операционные системы работали некорректно: наблюдалось закрытие соединений с коммутаторами, сбрасывание полученных сообщений, прочее. По этим причинам в [3] сделан вывод, что промышленная эксплуатация актуальных версий операционных систем (ОС) для сетей SDN в настоящий момент невозможна, по причине несоответствия требованиям надёжности и безопасности, предъявляемым к программному обеспечению (ПО) такого класса.

Необходимо учесть, что сделанные в [3] выводы относятся к периоду апреля 2013 г., тогда как технологии сетей SDN развиваются достаточно интенсивно. Можно предполагать, что появление виртуальных контроллеров с использованием технологий облачных вычислений позволят преодолеть указанные ограничения по надёжности контроллеров [4,6]. Достижение достаточного уровня надёжности в плоскости управления позволит считать технологию сетей SDN наиболее перспективной на ближайшие десятилетия.

Литература

l.ITU-T Recommendation Y.1720 (12/06). Protection switching for MPLS networks. 27 p.

l.Egilmez H.E., Dane S.T., Bagci K.T.. Tekalp A.M. OpenQoS: An OpenFlow Controller Design for Multimedia Delivery with End-to-End Quality of Service over Software-Defined Networks // APSIPA Annual Summit and Conf., Los Angeles, CA, Dec. 2012. pp. 194-202.

3.Guan X., Choi B.-Y., Song S. Reliability and Scalability Issues in Software Defined Network Frameworks //2013 Second GENI Research and Educational Experiment Workshop, pp. 216-227.

4.Hu Y., Wendong W.. Gong X.. Que X., Shiduan C., Reliability-aware Controller Placement for Software-Defined Networks // 2013 IFIP/IEEE International Symposium on Integrated Network Management (IM2013), pp. 672-675.

S.Sergeheva T.P.. Telekin N.N.. Design of Reliable Transport SDH Networks, Proc. of DRCN-2000 (Design of Reliable Communication Networks workshop), Munich, Germany, April 2000, p.304-307.

b.Aganval S., Kodialam M, Lakshman T.V.. Traffic Engineering in Software Defined Networks// 2013 Proceedings IEEE INFOCOM, paper no. 06567024, pp. 2211-2219.

Reliability Enhancement Methods for SDN Networks

Sergeeva T.P., ZNIIS, Chief research fellow, [email protected], Tetekin N.N., ZNIIS, senior research fellow, [email protected]

Abstract. Network reliability is based on failure detection and restoration. The service in new technology networks is to be restored in a time not exceeding 50 ms. Recent trend in SDN networks is to delegate main restoration duties from physical layer upwards to upper layers up to the application layer. This means the restoration to be executed not in hardware but by a software operation. The article presents a revew of latest developments in SDN networks reliability enhancement methods.

Keywords reliability, restoration, rerouting, SDN, design algorithm.

i Надоели баннеры? Вы всегда можете отключить рекламу.