SCIENCE TIME
МОДЕЛИРОВАНИЕ СЕТИ ДОСТАВКИ КОНТЕНТА
Белавин Дмитрий Алексеевич, Национальный технический университет Украины «Киевский политехнический институт»
E-mail: dimabelavin@gmail.com
Аннотация: предложена экспериментальная модель сети доставки контента, на основе полученных результатов проведен анализ и сделаны выводы касающиеся актуальности использования различных способов перенаправления запросов в сетях доставки контента.
Ключевые слова: сеть доставки контента, маршрутизация, моделирование.
Сеть доставки (и дистрибуции) контента (англ. Content Delivery Network или Content Distribution Network, CDN) - географически распределенная сетевая инфраструктура, позволяющая оптимизировать доставку и дистрибуцию контента конечным пользователям в сети Интернет.
На скорость загрузки веб-страницы и ее содержимого сильно влияет то, насколько далеко пользователь находится от сервера. Это происходит из-за того, что при использовании технологии TCP / IP, применяемой для распространения информации в сети Интернет, задержки при передаче информации зависят от количества маршрутизаторов, находящихся на пути между источником и потребителем контента. Размещение контента между несколькими серверами средствами CDN сокращает сетевой маршрут передачи данных и делает загрузку сайта быстрее с точки зрения пользователя.
Основная идея построения сетей CDN заключается в дублировании (или зеркалировании) контента и/или сервисов основного сервера (origin server) несколькими периферийными серверами, называемыми репликами (replica) или суррогатными (surrogate), которые географически расположены на удалении от основного сервера и друг от друга, но вблизи от потребителя услуг [1].
Использование контент-провайдерами CDN способствует увеличению скорости загрузки интернет-пользователями аудио-, видео-, программного, игрового и других видов цифрового контента в точках присутствия сети CDN.
Введение
Среда моделирования
СЭ^т предназначен для тестовой оценки СЭК и построения экспериментальной модели. СЭ^т позволяет смоделировать такие сценарии перенаправления запросов клиента к серверу.
Варианты перенаправления запросов клиента:
- ближайший суррогатный сервер;
- случайный суррогатный сервер;
- суррогатный сервер с нагрузкой.
Ближайший суррогатный сервер:
Клиент перенаправляется на ближайший суррогатный сервер с точки зрения сетевых скачков. При отсутствии необходимого файла, суррогатной сервер извлекает объект из ближайшего альтернативного суррогатного сервера, который содержит нужный объект. Объект сохраняется в кэш-памяти, и затем доставляется клиенту. Если объекта нет вообще на любом суррогатном сервере, суррогатный сервер извлекает объект из ближайшего оригинального сервера. (рис. 1).
Если нет
Клиент
Суррогатный сермрЗ
Рис. 1 Концепция ближайшего суррогатного сервера Случайный суррогатный сервер:
Клиент перенаправляется на случайный суррогатный сервер. При отсутствии необходимого кэша, суррогатный сервер извлекает объект из случайного альтернативного суррогатного сервера, содержащий необходимый файл. Объект сохраняется в кэше, а затем он доставляется клиенту. Если объекта нет вообще на любом из суррогатных серверов, суррогатный сервер вытягивает объект из случайного оригинального сервера.
SCIENCE TIME
Суррогатный сервер с нагрузкой:
Клиент перенаправляется на ближайший суррогатного сервер с точки зрения сетевых скачков. Если суррогатный сервер загружен на ~ 95%, клиент перенаправляется на наименее загруженный суррогатный сервер. При отсутствии необходимого файла, сервер извлекает объект из ближайшего альтернативного суррогатного сервера, который содержит запрашиваемый объект. Опять же, если нагрузка ~ 95% сервер перенаправляет запрос на наименее загруженный суррогатный сервер, содержащий объект. Объект сохраняется в кэше, а затем он доставляется клиенту. Если объекта нет вообще на любом из суррогатных серверов, сервер извлекает объект из ближайшего оригинального сервера. Если нагрузка на оригинальный сервер будет ~ 95%, то суррогатный сервер перенаправляет запрос на наименее загруженный оригинальный сервер [2].
Концепция показана на рис 2 [3].
Рис. 2 Концепция распределения запросов по нагрузке на сервер
Часть топологии предложенной модели приведена на рисунке 3.
РС-РТ
а ■
Рис. 3 Топология сети CDN Результаты моделирования
Основные данные экспериментального моделирования в CDNsim могут быть получены из файлов STDOUT и STATS.
Рассмотрим файл STATS, который позволяет увидеть все запросы которые происходили в сети CDN, и время на их обработку. (Листинг 1)
Листинг 1 STATS
2.000000,SURRDGATE,s1074,MISS,10250 2.000000,ORIGIN,o1101,HIT,10250
COMPLETED,CLIENT,c1000,10250,0,2.000000,2.007321,-
Как мы можем видеть в момент времени 2.000000 суррогатный сервер 74 получил запрос на объект 10250 от клиента 1, но на этом сервере этот объект отсутствовал. После этого запрос перенаправляется на оригинальный сервер и с него клиент получает объект 10250. В момент времени 2.007321 запрос был выполнен.
Рассмотрим файл STDOUT, в котором хранится информация о времени, узлах сети и размер объекта который передавался в этот момент времени. (Листинг 2).
SCIENCE TIME
Листинг 2 STDOUT
UTIL_UP 9.0001 o1200 188464 UTIL_DOWN 9.00128 s1195 35038 UTIL_UP 9.00142 s1195 35038 UTIL_DOWN 9.00247 c1075 35038 UTIL_UP 15.0001 o1200 254076 UTIL UP 15.0001 o1200 298396
UTIL_DOWN показывает, что происходит передача объекта (данных). UTIL_UP сигнализирует о завершении передачи. Из этого файла мы можем получить время за которое сетью CDN был передан объект, а так же размер передаваемого объекта.
Перейдем к анализу полученных результатов моделирования и построения графиков на их основе.
Рис 4 отображает влияние количества клиентов на среднее время отклика.
Рис. 4 Зависимость времени отклика от количества клиентов в сети
На рис 5 представлена зависимость полезности от количества клиентов.
Полезность - это значение которое выражает отношение между количеством байтов, которые были обслужены к количеству байтов которые были вытянуты из оригинального или суррогатного сервера. Полезность находится в диапазоне [0,1] и показывает производительность CDN. Высокий уровень полезности указывает на хорошую производительность и уменьшает среднее время отклика для клиента.
Рис. 5
SCIENCE TIME
Зависимость полезности от количества клиентов
Следующим критерием оценки будет выступать коэффициент нахождения данных в кэш-памяти (Byte hit ratio) в зависимости от количества запросов (рис 6). Высокие значения указывают на оптимальное использование памяти сервера и меньше сетевой трафик.
О 2000 4000 6000 8000 10000 12000
Количество запросов
Рис. 6 Коэффициент нахождения данных в кэш-памяти в зависимости от
количества запросов
SCIENCE TIME
Рис. 7 отражает зависимость коэффициент нахождения данных (Hit ratio) от количества запросов. Это процент запросов клиент-к-CDN которые нашли необходимые данные на суррогатном сервере. Высокие значения указывают на качественное размещение контента на суррогатных серверах [3].
Рис. 7 Зависимость коэффициента нахождения данных от количества запросов
Исходя из результатов моделирования можно сделать следующие выводы:
- лучшие показатели времени отклика показал метод выбора суррогатного сервера в зависимости от расстояния;
- по показателю полезности метод выбора суррогатного сервера с нагрузкой показал лучшие результаты, но с увеличением клиентов другие методы по показателю полезности приближаются к нему;
- до 4 тыс. запросов выбор сервера по нагрузке показывает лучшие результаты по коэффициенту поступления данных в кэш-память, после 4 тыс. запросов начинают стремительно расти показатели метода ближайшего сервера, но даже сервер выбран случайным образом по показателю byte hit ratio показывает лучшие результаты чем выбор сервера по нагрузке;
- такая тенденция сохраняется и для коэффициента нахождения данных.
Тестирование проводилось при одинаковой модели сети. Она насчитывала
1000 роутеров, 1 оригинальный сервер, 100 суррогатных серверов.
SCIENCE TIME
Литература:
1. Content Delivery Networks / Buyya, Rajkumar; Pa-than, Mukaddim; Vakali, Athena (Eds.). - Springer, 2008. - 418 p. - (Series: Lecture Notes in Electrical Engineering).
2. Khai Hsiang Wong. Using Surrogate Servers for Content Delivery Network Infrastructure with Guaranteed QoS / Khai Hsiang Wong, Phooi Yee Lau, and Sungkwon Park / Journal of Advanes in Computer Networks - Mar. 2013 - Vol.1 - p. 34-38.
3. Stamos K. CDNsim: A Simulation Tool for Content Distribution Networks / ACM Transactions on Modeling and Computer Simulation (TOMACS) Volume 20 Issue 2, April 2010.