Исследование свойств сигнального трафика протокола SIP
Ключевые слова:
сигнальный трафик, протокол SIP, управление сетью, IP-коммуникация, VoIP, параметр Херста
Рассмотрены подходы к изучению трафика IP-коммуникаций, дан обзор работ в области исследования сигнального трафика современных сетей связи. Проведен статистический анализ трафика протокола SIP (Session Initiation Protocol), собранного на сети крупного отечественного оператора IP-телефонии. В результате анализа в трафике выявлены свойства самоподобия, учет которых позволит оптимизировать управление сетью на базе протокола SIP.
Росляков А.В.,
д.т.н., профессор ПГУТИ
Кашин М.М.,
аспирант ПГУТИ
Введение
С появлением в середине 90-х годов прошлого столетия технологии передачи голоса по пакетной сети на базе протокола IP (Voice over IB VoIP) началась новая эпоха в телекоммуникациях — эпоха IP-телефонии. В настоящее время технология VoIP считается базовой при построении сетей следующего поколения NGN (Next Generation Networks). Сейчас IP-телефония — это уже не просто услуга для голосового соединения двух абонентов. Она включает в себя видео вызовы, многоточечные конференции разного типа (видео, аудио, web), передачу сообщений, документов, контроль доступности абонентов, роуминг и др. В связи с указанными изменениями термины IP-телефония или
VoIP перестали точно отражать суть предоставляемых услуг и появился термин IP-коммуникации (IP-communication).
Однако новая технология привнесла и новые задачи при расчете параметров сети связи. В отличие от традиционной телефонии, в IP-коммуникациях передача любых сообщений осуществляется по сети с помощью технологии коммутации пакетов, что накладывает свои особенности на характер нагрузки, размер буферов узлов сети, длины очередей в этих буферах и т.д.
Одно из важных свойств, которыми обладает трафик сетей с коммутацией пакетов — это свойство самоподобия, то есть сохранения своей структуры в разные масштабы времени. Традиционные методы расчета и моделирования, основанные на пуассоновских моделях, предполагали, что все поступившие в исследуемую систему вызовы взаимно независимы и интервалы времени между приходом двух последующих сообщений распределены в соответствии с экспоненциальным законом. В тоже время самоподобный трафик обладает медленно убывающей автокорреляционной функцией, плотность распределения вероятности интервалов между моментами прихода двух последовательных сообщений подчиняются степенному (в частности Парето) закону. Из-за таких свойств самоподобного трафика традиционные методы расчета дают слишком оптимистичные решения и приводят к недооценке реальной загрузки сети.
Самоподобие было найдено в трафике разных уровней модели OSI — транспортного (TCP/UDP/SCTP), прикладного (FTP, Telnet, HTTP). Для этих видов трафика разработаны соответствующие методы расчета и прогнозирования нагрузки. В последнее время в связи с бурным внедрением сетей на базе протокола SIP (Session Initiation Protocol) возникла необходимость теоретических и практических исследований характера сигнального трафика с це-
лью управления и оптимальной маршрутизации сообщений в сети SIP
Анализ исследований трафика IP-коммуникаций
Существует два основных подхода к исследованию трафика IP-коммуникаций:
• на уровне вызовов;
• на уровне пакетов.
При использовании первого подхода весь трафик рассматривается как поток отдельных вызовов, поступающих на исследуемую систему. В данном случае задача исследователей сводится к определению того, насколько трафик IP-коммуникаций отличается от трафика традиционной телефонии и насколько эти отличия (если таковые имеются) изменяют основные параметры, применяемые при расчете и проектировании сетей IP-коммуникаций.
Второй подход основывается на том факте, что технология IP-коммуникаций базируется на принципах пакетной коммутации. Для упрощения исследование трафика IP-коммуникация на уровне пакетов проводят с учетом его декомпозиции на две основные составляющие:
• трафик сигнальных сообщений для установления, изменения и разрушения сеанса связи (сигнализация);
• медиатрафик (голос, видео).
Каждый из этих типов трафика использует свои протоколы передачи, может передаваться по разным маршрутам, имеет разную структуру и имеет различные требования к качеству обслуживания QoS (Quality of Service), таким, как задержка, джиттер и потери пакетов.
Задача исследования трафика на уровне вызовов сводится к определению двух его основных характеристик:
• вероятностному закону распределения интенсивностей вызовов, поступающих на исследуемую систему;
• вероятностному закону распределения длительностей этих вызовов.
Большинство исследователей [1,2,3] сходятся во мнении что, распределение интенсивностей поступающих на систему вызовов достаточно точно описывается Пуассоновской моделью, в то время как распределение длительностей вызовов лучше описывается степенными законами, а не экспоненциальными, как это полагалось ранее в классических телефонных сетях. Конкретный вид степенного распределения зависит от масштаба и структуры сети.
Медиатрафик является очень чувствительным к таким параметрам QoS как задержка, джиттер, и менее чувствителен к небольшим потерям пакетов. Невыполнение требований QoS может привести к значительному ухудшению качества голосовой связи, воспринимаемого конечным пользователем. В связи с этим этот вид трафика получил наибольшее освещение в работах по изучению трафика IP-коммуникаций. Исследователи, изучавшие медиатрафик [4,5,6], дают различные предположения относительно аппроксимирующего распределения, его свойств и методов его моделирования, однако большинство из них сходится на нескольких выводах:
• традиционные модели (Пуассона), применяемые для описания телефонной нагрузки недостаточно точно описывают медиатрафик IP-коммуникаций;
• причинами различий исследованных моделей медиатрафика между собой могут быть различные реализации механизма определения голосовой активности VAD (Voice Active Detection), размер и тип исследуемой сети IP-коммуникаций, тип протокола сигнализации, дополнительные функции, выполняемые сетью, человеческий фактор и др.;
• функция распределения длительности периодов активности/неактивности (ON/OFF) источников медиатрафика протокола RTP имеет больше степенной характер, нежели экспоненциальный;
• агрегированный трафик от множества источников нагрузки на базе модели ON/OFF обладает самоподобными свойствами.
Сигнальный трафик в IP-сетях может передаваться с помощью различных протоколов, основными из которых являются SIFJ H.323, MGCP, H.248/MEGACO и SIGTRAN. В последнее время особую популярность приобрел протокол инициации сеансов SIP, что объясняет его использование в качестве основного протокола в сетях следующего поколения, стандартизируемых организациями ITU-T и IETF Данный тип сигнализации характеризуется относительно небольшой чувствительностью к параметрам QoS, однако, перегрузки в IP-сети могут привести к значительному увеличению времени
установления соединения или даже к невозможности его установить.
Трафик сигнализации IP-коммуникаций в основном исследовался на предмет расчета параметров QoS, таких как, средняя задержка установления соединения, вероятность неуспешного завершения установления соединения. В результате, для протокола SIP были разработаны специальные методики расчета таких параметров [10]. Так же были разработаны механизмы предотвращения перегрузок в сети сигнализации, однако, в их основе лежат простейшие методики, такие как, введение порогов обнаружения перегрузки буфера обработки сообщений, изменение таймеров ретрансляции, наращивание производительности оборудования [7, 2, 8, 9]. В целом всем работам в области исследования трафика SIP присущи следующие недостатки:
• подавляющее большинство работ используют искусственно созданный сигнальный трафик протокола SIP, который не в полной мере соответствует реальному трафику на сети;
• до сих пор не предложены математические модели, которые адекватно описывали бы трафик протокола SIP
В связи с этим представляет определенный теоретический и практический интерес исследование статистических свойств реального сигнального трафика протокола SIP, которое могло бы лечь в основу разработки более совершенного метода борьбы с перегрузками в сети. Поскольку трафик нижележащих уровней стека TCP/IP, а так же трафик медиа данных проявляют достаточно сильные свойства самоподобия, логично было бы предположить, что и трафик сигнализации обладает этими свойствами.
Статистический анализ сигнального трафика протокола SIP
Исходные статистические данные для анализа получены на сети одного из крупнейших российских операторов IP-телефонии. Узел, на котором собирались данные, в архитектуре протокола SIP представляет собой Full State Proxy/Registrar/Redirect, то есть SIP-прокси сервер, участвующий во всех фазах установления/разрушения вызова (голос, видео, факс), сервер регистрации и сервер переадресации. Данный узел реализует различные дополнительные виды обслуживания (ДВО):
• традиционные ДВО телефонной сети (удержание вызова, переадресация, ожидание вызова, 3-х сторонняя конференция и др.);
• специфические ДВО для сетей на базе протокола SIP (регистрация одного номера за несколькими устройствами, обратный вызов занятого абонента, передачи сообщений и др.).
Абоненты, зарегистрированные на сервере, принадлежали как деловому сектору, так и сектору домашних абонентов. В качестве абонентских устройств использовались обычные аналоговые телефоны и цифровые телефоны с функцией передачи видео и текстовых сообщений. Все это делает сигнальный трафик очень разнообразным и не похожим, по своей структуре, на сигнальный трафик в традиционных телефонных сетях связи.
Полученные данные представляют собой временные метки прихода различных сообщений (методов) протокола SIP (типа INVITE, NOTIFY, OPTION и др.), взятые из сигнальной трассировки, сделанной с помощью программы WireShaik (Ex-Ethereal). Точность временных отчетов — до 1 • 10-6 с. Данные собирались в
течение недели 24 часа в сутки (рис. 1). В итоге
550 000500 000 450 000400 000350 000300 000 250 000200 000150 000100 00050 000-
10000 15 000
25000 30000
45000 50 000 55000
Рис. 1. Исходный временной ряд Х числа сообщений SIP в течение недели
л
1 200 1 400 1 600 1 800 2 000
Рис. 2. Агрегированный ряд для уровня агрегации т = 10 секунд
Рис. 3. Агрегированный ряд Х<2°1 для уровня агрегации т = 20 секунд
Рис. 4. Агрегированный ряд Х40 для уровня агрегации т = 40 секунд
Результаты оценки параметра Хёрста различными методами
Метол оценки Исходный ряд X Агрегированный ряд хт Агрегированный ряд х{20) Агрегированный ряд хт
Я/Я статистика 0,729 0,543 0,436 0.298
94.45% 88,01% 84,49% 78,05%
Дисперсионный анализ 0.960 0,946 0,941 0.932
77.82% 57,90% 56,20% 56.45%
Мериодограммный метол 0,658 1.167 1.339 1.485
23.63% 71.00% 79,56% 84.99%
Метол абсолютных 0,414 0.115 0,052 0.278
моментов 47.22% 52,77% 54.92% 57.40%
Метол дисперсии остатков 0.973 1.188 1.295 1.409
95.86% 96.52% 98.06% 97.16%
Метод Эрби-Витча 0.567 0.637 0,677 0.766
[0.555-0.5781 [0.599-0.674] 10.620-0.7341 [0.674-0.8581
Метод Виттла 0,678 0.857 0.931 0.991
[0,668-0,688] [0.828-0,8861 10.890-0.9731 [0.932-1.0501
Примечание: Для Р/Б статистики, дисперсионного анализа, периодограммного метода, метода абсолютных моментов и метода дисперсии остатков указаны в каждой ячейке таблицы оценка параметра Хёрста и коэффициент корреляции (в %), а для методов Арби-Витча и Виттла — среднее значение оценки параметра Хёрста и 95 % доверительный интервал.
было получено около 5 • 106 временных отметок. На основании этих данных и проводился статистический анализ характера сигнального трафика SIP
Для начала временной ряд анализировался на предмет наличия в нем основных свойств самоподобного трафика:
— долговременная или медленно убывающая зависимость процесса проявляется, когда его автокорреляционная функция убывает гиперболически (по степенному закону);
— 1//-шум проявляется, когда спектральная плотность области низких частот неограниченно возрастает, стремясь к бесконечности при стремлении частоты к нулю;
— "тяжелохвостое" распределение, в отличие от "легкохвостых" распределений, имеющих экспоненциальное, быстрое убывание "хвоста", имеет медленное, гиперболическое убывание "хвоста";
— медленно убывающая дисперсия проявляется, когда дисперсия агрегированного процесса убывает медленнее, чем величина, обратная выборке агрегации (для достаточно больших значений выборок).
В результате исследования было выявлено, что временной ряд трафика сигнализации SIP обладает всеми вышеперечисленными свойствами.
Известно, что мерой самоподобия процесса может служить параметр Херста. Чем ближе параметр H к 1, тем больше процесс самопо-добен, то есть тем больше вероятность того, что если процесс возрастал/убывал в предыдущие промежутки времени, то он будет продолжать рост/убывание и дальше. В случае H = 0,5 можно говорить о полном отсутствии самоподобия, то есть приращения процесса на предыдущих шагах никак не повлияют на приращения в последующих шагах. В случае если значения параметра лежат в пределах 0 < H < 0,5, то вероятность того, что на следующем шаге процесс отклонится в сторону, противоположную той, в которую он отклонялся на предыдущем, тем выше, чем ближе параметр H к нулю. Для исходного временного ряда Х и агрегированных рядов Х<10), Х<20), Х40) с уровнями агрегации m = 10, 20 и 40 секунд соответственно (рис. 2-4) была произведена оценка показателя Херста различными методами: R/S статистики, дисперсионного анализа, периодограммным, абсолютных моментов, дисперсии остатков, оценок Эрби-Витча и Виттла. Результаты оценки параметра Хёрста различными методами приведены в таблице.
В результате оценки в среднем значение параметра Херста для исследуемого временного ряда находилось в пределах 0,6 < H < 0,8,
что позволяет сделать вывод о том, что исследуемый трафик действительно является самоподобным, то есть обладает долгой "памятью".
Выводы
Анализ работ в области исследования трафика IP-коммуникация показал, что большая часть из них посвящена медиатрафику и недостаточное внимание уделяется изучению трафика сигнализации. Необходимость в таком исследовании обусловлена поиском путей оптимизации маршрутизации сообщений в сети на базе протокола SIP. В процессе анализ сигнального трафика SIP, собранного на действующей сети одного из крупнейших российских VoIP операторов, были проанализированы его основные статистических характеристики — автокорреляционная функция, дисперсия, спектральная плотность, функция плотности распределения. В результате было выявлено, что все эти характеристики обладают свойством самоподобия. Также были получены различными методами оценки показателя Херста, являющегося мерой степени самоподобия процесса. Полученные оценки подтвердили выдвинутое предположение о фрактальной структуре сиг-
нального трафика SIP
Как известно, одним из важнейших свойств самоподобных процессов является долговременная "память", и, как следствие этого, имеется потенциальная возможность прогнозирования поведения процесса в будущем. Учитывая это свойство, в дальнейшем планируется разработать метод, который на основе прогноза сигнального трафика позволит изменять маршрут прохождения трафика и нагрузку на отдельные элементы сети сигнализации, и таким образом бороться с перегрузками в сети SIP
Литература
1. Duffy D.E Statistical Analysis of CCSN/SS7 Traffic Data from Working CCS Subnetworks/ D. E. Duffy, A. A. McIntosh, M. Rosenstein, W. Willinger// IEEE Journal on Selected Areas in Communications. — 1994. — Vol. 12, № 3. — P 544-551.
2. He Q Analyzing the Characteristics of VoIP Traffic [Электронный документ] / Q. He. — Режим доступа: library2.usask.ca/theses/available/etd-07132007-120004/unrestricted/thesis.pdf — 08.12.2008
3. Duffy D.E Analyzing telecommunications traffic data from working common channel signaling subnetworks / D. E. Duffy, AA. Mcintosh, M. Rosenstein, W.
Willinger // Interface Foundation of North America. — 1993. — Vol. 25. — P 156-165.
4. Trang D. D. Fractal Analysis and Modeling of VoIP Traffic// D.D. Trang, B. Sonkoly, S. Molnar// Telecommunications Network Strategy and Planning Symposium. — 2004. — Issue №1. — P123-130.
5. Jiang W. Analysis of On-Off Patterns in VoIP and Their Effect on Voice Traffic Aggregation/ W. Jiang, H. Schulzrinne// Ninth International Conference on Computer Communications and Networks. — 2000. — P. 82-87.
6. Осин А.В. Влияние самоподобности речевого трафика на качество обслуживания в телекоммуникационных сетях: автореф. дис. канд. тех. наук: 05.12.13: защищена 10.11.05 / А. В. Осин; МГУС. — Москва, 2005. — 20 с.
7. De Marco G. A Technique to Analyse Session Initiation Protocol Traffic / G. De Marco, G. Iacovoni// 11th ICPD. — 2005. — V2. — P 595 — 599.
8. Ohta M. Overload Control in a SIP Signaling Network/M. Ohta // ICISP apos — 2006. — P 11-12.
9. Иевлева Т.В. Обнаружение и предотвращение перегрузок оборудования Softswitch при регистрации SIP-телефонов / Т. В. Иевлева, С. В. Журавлев // Электросвязь. — 2007. — №12.
10. Серебренникова Н.В. Эволюция нормирования параметров качества протокола SIP / Н.В. Серебренникова, А.Б. Хатунцев // Вестник связи. — 2009. — №5. — С. 10-14.
Новая лаборатория компании КРОК "Виртуальная модель современного предприятия"
Компания КРОК объявила об открытии лаборатории решений управления бизнес-процессами и интеграции корпоративных приложений — "Виртуальная модель современного предприятия".
"За этот год мы значительно нарастили практический опыт реализации проектов по управлению бизнес-процессами и интеграции корпоративных приложений, а также стали партнерами практически всех ведущих производителей — лидеров в области BPM (Business Process Management), EAI и SOA. В нашей новой лаборатории мы готовы демонстрировать заказчикам, как применение данных технологий делает информационную инфраструктуру предприятия и бизнес-процессы более гибкими и прозрачными, сокращает затраты на их моделирование, внедрение и контроль, улучшает исполнительскую дисциплину и в результате — повышает конкурентоспособность предприятия", — сообщил Алексей Добровольский, директор по разработке ПО компании КРОК.
В лаборатории представлены решения классических вендоров, с которыми работает КРОК (IBM, EMC, Oracle, Microsoft), и новых партнеров по системам BPM и интеграции приложений:
• Lombardi Software — мировой лидер среди поставщиков систем для управления бизнес-процессами, согласно исследованиям Gartner и Forrester Research;
• Progress Software — производитель программных продуктов для разработки, развертывания, интеграции и управления бизнес-приложениями;
• Tibco Software — разработчик программных продуктов для интеграции корпоративных приложений, управления бизнес-процессами,
средств интеграции данных, управления и мониторинга сервисов предприятия;
• Azul Systems — разработчик и производитель аппаратно-программных платформ для исполнения бизнес-критичных приложений Java. Использование ускорителей Java в совокупности с другими аппаратными ускорителями (IBM DataPower, Cisco AON), предлагаемыми КРОК, позволяет создавать высоконагруженные интеграционные решения, преодолевать ограничения в масштабируемости и оптимизировать производительность критичных бизнес-процессов;
• Intalio — разработчик платформы управления бизнес-процессами Intalio BPMS. Единственная полная BPMS-платформа с открытыми исходными кодами.
"Из всех интеграционных решений именно системы управления бизнес-процессами максимально ориентированы на бизнес, обеспечивая прозрачность и прогнозируемость процессов компании. Эти решения очень востребованы именно сейчас, когда все компании активно борются за эффективность. Очень важно, что теперь мы имеем возможность показать эти решения в действии", — отметил Игорь Никулин, директор департамента информационных технологий компании КРОК.
В рамках лаборатории реализована интеграция нескольких бизнес-приложений. Приложения и пользователи взаимодействуют в границах автоматизированного бизнес-процесса. Лаборатория позволяет наглядно продемонстрировать взаимодействие продуктов различных вендоров для эффективного решения задач предприятия.