СИСТЕМЫ ТЕЛЕКОММУНИКАЦИЙ И СЕТЕВЫЕ ТЕХНОЛОГИИ
DOI: 10.24143/2072-9502-2017-2-80-87 УДК 621.397.132.19
О. Н. Пищин, А. А. Ивакин
СОКРАЩЕНИЕ РОСТА НАГРУЗКИ НА ТРАНСПОРТНУЮ СЕТЬ ОПЕРАТОРА СВЯЗИ НА ОСНОВЕ СИСТЕМЫ РАСПРЕДЕЛЕННОГО ХРАНЕНИЯ КОНТЕНТА
Рассматривается использование сетей, построенных по технологии LTE, для передачи мультимедиа. Отмечается, что использование транспортных сетей предыдущих поколений может служить ограничением при реализации таких услуг. Для решения этой проблемы предложено использовать систему распределенного хранения контента. Задача реализации такой системы разделена на несколько подзадач. Поскольку экономически неэффективно организовывать узлы системы на каждой площадке базовой станции, предложено выбирать их, используя алгоритмы кластеризации. Отмечается, что нет необходимости хранить всю доступную абоненту видеотеку на каждом узле. С учетом финансовых возможностей оператора объем памяти временного хранения контента может быть выбран по степенному распределению популярности видео. Для определения того, какие конкретно видео необходимо хранить в памяти временного хранения контента, предложена модель прогнозирования популярности контента. Для этого популярность видео рассмотрена как временной ряд. Приведен пример использования модели экстраполяции имеющихся данных и проанализирована применимость модели для описанной системы.
Ключевые слова: (LTE) Long Term Evolution, мультимедиа, распределенное хранение контента, кластеризация, прогнозирование популярности контента, временной ряд.
Введение
Появление технологий беспроводного доступа новых поколений знаменуется изменениями в лучшую сторону не только их количественных показателей (рост показателей пропускной способности, энергетической эффективности), но и качественных (возможность внедрения новых или повышение качества уже предоставляемых услуг до ранее недостижимого уровня). Примером может служить доставка мультимедиаконтента большого объёма (в первую очередь - видео высокого разрешения или HD-видеоконтента) - полноценная реализация этой услуги стала возможна с построением сетей стандарта четвёртого поколения LTE (Long Term Evolution). Общепринятым является развертывание базовых станций LTE на площадках уже существующих базовых станций сетей третьего и второго поколений, а также использование их инфраструктуры.
При таком подходе возникает проблема ограниченности пропускной способности транспортных сетей, особенно в районах с малой плотностью населения, где связь между базовой станцией и опорной сетью реализуется в основном не на базе волоконно-оптических линий связи (ВОЛС), а посредством радиорелейных линий связи (РРЛ) с недостаточным количеством канальной ёмкости [1, 2]. В таких условиях потенциал сетей доступа, построенных по технологии LTE, по пропускной способности используется не полностью. Помимо этого прогнозируется, что к 2020 г. в России на долю видео будет приходиться 75 % мобильного трафика данных (на конец 2015 г. этот показатель составлял 54 %) [3], а продажи онлайн-видео в России по итогам 2016 г. в денежном выражении уже выросли на 20 % [4].
Учитывая прогнозы по дальнейшему росту объемов информации, передаваемой в беспроводных сетях (рис. 1), и популярность потребления мультимедиаконтента посредством беспро-
водных абонентских устройств (рис. 2), следует отметить, что складывающаяся ситуация может привести к ухудшению качества предоставления услуги или отказу в обслуживании абонента и, как следствие, неминуемому оттоку клиентов абонентской базы.
Целью исследования являлся поиск способов повышения качества предоставления услуги доставки мультимедиаконтента на беспроводные устройства (потребителям контента).
Для достижения цели необходимо было решить следующие задачи:
- проанализировать процесс предоставления услуг по доставке мультимедиаконтента в современных реалиях рынка инфокоммуникаций;
- определить проблемные ситуации при предоставлении такого рода услуг;
- предложить возможное решение.
2015 2016 2017 2010 2019 2020
Рис. 1. Рост мобильной передачи данных в мире, эксабайт/мес. [3]
61% 58% 57% 38% 22%
Ноутбук ¡5="* Смартфон ГТланшег Смарт ТВ
Рис. 2. Популярность устройств для потребления мультимедиаконтента [5]
Очевидным способом решения вышеназванной проблемы становится повышение пропускной способности транспортных каналов, однако такое решение требует крупных материальных затрат со стороны оператора связи, что довольно часто, в условиях малонаселенных районов и аренды каналов связи, экономически неэффективно. Альтернативным решением может быть реализация системы доставки мультимедиаконтента, основанная на его распределенном хранении, функция которой будет заключаться в размещении наиболее популярных видео как можно ближе к абоненту, который в них нуждается.
В этом случае потребуется интеграция в инфраструктуру сети двух элементов - узлов и контроллера системы. Узел системы представляет собой сервер временного хранения информации, накапливающий наиболее популярный контент, который может быть востребован с наибольшей вероятностью. Физически этот контент размещается на площадке базовой станции, используя ее подключение к каналам связи и электроэнергии, и выступает в качестве прослойки между оборудованием доступа и транспортной сетью оператора. Контроллер системы выполняет функции общего управления системой, учета просмотров и прогнозирования популярности того или иного видео, а также выступает посредником между оператором и поставщиком контента.
При запросе абонентом воспроизведения видео контроллер системы учитывает просмотр и проверяет, есть ли требуемый контент в памяти временного хранения (ПВХ) узла системы, обслуживающего абонента.
При наличии запрашиваемого видео трансляция ведется с этого узла и транспортные и магистральные сети не загружаются (в отличие от традиционной схемы обслуживания). В случае отсутствия контента внутри системы его трансляция производится с сервера поставщика контента (согласно традиционной схеме). Похожий принцип реализуется на магистральном уровне системами сетей доставки контента (Content Delivery Network, CDN).
На рис. 3 представлена архитектура сети стандарта LTE, дополненная предлагаемой системой хранения необходимого видеоконтента. В стандарте LTE принято обозначать процесс доставки видеоконтента как мультимедийную вещательную услугу (Multimedia Broadcast Multicast Services, MBMS). Главным элементом, отвечающим за мультимедиауслуги, является центр вещательных услуг (Broadcast Multicast Service Center, BM-SC), который осуществляет функции обработки запросов пользователей, инициации, управления и прекращения соединения, тарификации, а также входной точки для поставщика контента (серверы, на которых хранится доступная абоненту видеотека). Однако в предлагаемой системе необходим посредник между видеотекой и оборудованием оператора - контроллер системы, функционал которого был описан выше. Шлюз мультимедийного вещания (MBMS Gateway) контролирует входящий мультимедиатрафик. Его роль заключается в трансляции пакетов абонентского трафика на базовые станции, а также в управлении MBMS-сессиями. Узел управления мобильностью (Mobile Management Entity) является стандартным элементом сети стандарта LTE, обрабатывающим служебную информацию для обеспечения эстафетной передачи сигнала (handover) и связанных с ней процессов сигнализации. Важным логическим элементом подсистемы MBMS является узел многосотовой/многоадресной передачи (Multi-cell/Multicast Coordination Entity, MCE), ответственный за распределение частотно-временных ресурсов для многосотовой MBMS-передачи. Этот узел может являться отдельным элементом сети и может быть интегрированным в базовую станцию [6, 7].
Рис. 3. Схема сети LTE с добавлением системы распределения медиаконтента:
БС - базовая станция
Реализация предлагаемой системы подразумевает под собой решение таких задач, как выбор места для узла системы, определение оптимального объема ПВХ узла и разработка механизма, позволяющего определять, какое видео необходимо хранить, сколько времени и на каком узле системы, т. е. создание модели прогнозирования популярности контента.
Выбор места расположения узла системы
Транспортная сеть оператора связи обычно имеет сложную разветвленную структуру, сочетающую в себе элементы различных топологий, при этом некоторые базовые станции выпол-
няют роль промежуточных пунктов, соединяющих транспортные потоки с нескольких других базовых станций. В таком случае размещать узлы системы на площадке каждой базовой станции экономически необоснованно. Задачу размещения узлов решим, используя аппарат кластерного анализа. Ограничивающим фактором здесь может являться бюджет оператора связи, который он готов потратить на реализацию системы.
Опишем задачу кластеризации базовых станций в условиях решаемой проблемы. Пусть
есть множество базовых станций А = {А1, А2, ..., Ап} числом п и множество численных характеристик В = {В1, В2,..., Вт} числом т, описывающих каждую базовую станцию. Характеристики
оператор выбирает самостоятельно, однако в их число обязательно должны входить пропускная способность транспортного канала базовой станции и число обслуживаемых абонентов.
Отдельной характеристикой следует считать достижимость, выраженную в виде квадратной матрицы достижимости R размером п. При существовании возможного транспортного канала между 7-й и --й базовыми станциями (7 = 1,..., п ; - = 1, ..., п) соответствующему элементу матрицы присваивается значение 1 (г,- = 1), в противном случае - 0 (г^. = 0).
Множество численных характеристик В описывает множество базовых станций А и может быть представлено в виде множества точек числом п в евклидовом пространстве размерностью т. Задачей кластерного анализа является разбиение множества базовых станций на кластеры числом k так, чтобы каждая базовая станция принадлежала бы только одному кластеру Sp(р = 1, ..., k), каждый кластер содержал бы сходные объекты, а разные кластеры - несходные объекты.
Найдем решение задачи кластеризации множества базовых станций, используя алгоритм поиска ^средних [8] и матрицу достижимости.
1. Задание множества базовых станций А, множества их численных характеристик В, а также числа кластеров k, равного числу узлов системы, запланированных оператором к внедрению (исходя из выделенного бюджета), и матрицы достижимости R.
2. Выбор случайным образом центров масс р е А искомых кластеров числом k. В качестве первого приближения предпочтительно использовать наиболее достижимые с точки зрения матрицы достижимости базовые станции, согласно целевой функции
п
М(А) = а^шах^ г1} .
3=1
3. Распределение базовых станций по кластерам исходя из их близости к центру масс, определяемой вычислением евклидова расстояния, с учетом матрицы достижимости R. Отметим, что в кластер не включаются базовые станции, недостижимые из центра масс на основании матрицы достижимости. Если центру масс рр соответствует базовая станция А2 (2 = 1,..., п), тогда для базовой станции АС1 (q = 1,..., п) можно записать следующее:
г,р =0 ^ Л * ^ (1)
Г,р = 1 ^ Л е V
4. Для полученных кластеров определяются центры масс и сравниваются с предыдущими. Если они различаются, работа алгоритма продолжается. В противном случае осуществляется переход к пункту 6.
5. Принимаются новые центры масс кластеров, осуществляется переход к пункту 3.
6. Завершение поиска.
Таким образом, можно записать следующую целевую функцию данного алгоритма:
F = агЕшт^Е А - рр )2. (2)
Р=1 АяеЯр
Учитывая (1), выражение (2) можно записать следующим образом:
k
к
F = ш^шп^^ - цр )2 .
р=1 \ р =1
Центр масс каждого определенного кластера будет соответствовать месту развертывания узла системы на площадке базовой станции. В пределах зоны действия базовых станций, составляющих кластер, абоненты будут, при наличии видео на узле, получать контент от этого узла. Отметим, что узел хранит контент, популярный у абонентов, находящихся в данной зоне.
Определение достаточного объема памяти временного хранения системы
Функционирование системы предполагает хранение наиболее популярного контента в максимальной близости к абоненту, который захочет этот контент получить. Объем ПВХ узла системы, содержащего этот контент, зависит от доступной пользователю видеотеки и ее объема и во многом определяется бюджетом, который оператор готов потратить на внедрение системы распределенного хранения контента. Однако, согласно принципу Парето, для обслуживания 80 % запросов на контент необходимо будет хранить в памяти лишь 20 % контента.
Чтобы оценить возможности применения данного принципа, было проведено исследование, описанное в [9]. Случайным образом было выбрано 100 фильмов и собрана информация о количестве их скачиваний в течение 34 дней. Затем была вычислена разность в числе скачива-ний между следующими друг за другом днями и получено абсолютное число просмотров за день для 33 дней. Число скачиваний в рамках данного эксперимента было приравнено к числу просмотров. Затем фильмы были расположены по числу скачиваний от наибольшего к наименьшему, т. е. проранжированы, что позволило распределить фильмы в видеотеке по популярности (рис. 4). Данное распределение имеет вид экспоненциального [10].
Номер фильма по рангу
Рис. 4. Распределение фильмов по популярности
На 20 % самых популярных фильмов, ранг которых составил от 1 до 20, пришлось в среднем 83,1368 % запросов на просмотр (максимально - 89,24 %, минимально - 78,17 %, среднеквадратичное отклонение составило 2,34 %). Из этого можно сделать вывод, что объем ПВХ узла, составляющий 20 % от объема видеотеки, доступной абоненту, достаточен для работы предлагаемой системы, при этом сокращение трафика в магистральной сети (при условии одинакового размера фильмов) составит порядка 80 %.
Рассмотрим популярность видео как временной ряд. Под временным рядом понимаются данные, последовательно измеренные через некоторые (равные) промежутки времени. Прогнозирование временных рядов требует их анализа и заключается в построении модели для прогнозирования будущих событий на основе известных событий прошлого и предсказания будущих данных до того, как они будут измерены1.
1 Данный аппарат относится к задачам эконометрики, например, к таким, как прогнозирование цены открытия биржи на основе анализа ее предыдущей деятельности.
Проанализируем просмотры одного из 100 фильмов (рис. 5). Напомним, что под числом просмотров будем понимать разницу между числом скачиваний фильма в два следующих друг за другом дня. Рассмотрим модель, основанную на экстраполяции - методе простого экспоненциального сглаживания (Single Exponential Smoothing, SES) [11]. Спрогнозируем популярность фильма на основе на имеющихся данных.
m о о.
о
Q.
О m н и V т s е; о
SC
Исходный ряд
1 3 5 7 9 11 13 15 17 19 2123 25 27 29 3133 День
Рис. 5. Прогнозирование популярности фильма
Проанализируем полученные результаты. Метод SES дает приемлемый результат, однако отмечается некоторое запаздывание в определении моментов изменения популярности - роста и спада, а также некоторая недооценка экстремумов ряда.
Абсолютного попадания не обеспечивает ни одна из моделей, однако их точности вполне достаточно для определения рентабельности хранения фильма в ПВХ контента. Точки пересечения графиков соответствуют полному совпадению прогноза и фактических данных.
Описанный выше механизм анализа популярности видео в системе необходимо применять для каждого видео и каждого узла системы, поскольку популярность видео определяется многими социальными факторами (средний возраст абонентов, география региона и т. п.).
Важно отметить, что определить, будет популярно то или иное видео, какими-либо машинными методами иногда не представляется возможным, особенно на этапе появления контента в видеотеке. Для таких ситуаций необходимо предусмотреть наличие экспертов, на основании мнения которых будет оцениваться возможность резкого роста популярности определенного контента. В качестве поводов для резких скачков могут служить оценка фильма критиками, попадание фильма в число номинантов или призеров кинопремий, фильм-продолжение, участие популярного актера и т. п. В таких случаях наблюдается резкий рост числа запросов на фильм. Продолжительность этого скачка уже можно спрогнозировать, используя описанную выше модель.
Заключение
Предложенная система распределенного хранения контента позволяет решить проблему доставки мультимедиа в сетях беспроводного доступа в условиях роста нагрузки на транспортные сети оператора связи. Узлы системы размещаются на площадках базовых станций, выбирать которые предложено на основе решения задачи кластеризации. Объем ПВХ узла описывается степенным распределением. Популярность видео прогнозируется как временной ряд. Результаты использования метода прогнозирования позволяют получить представление о будущих значениях количества просмотров.
Реализация предлагаемой системы, помимо разгрузки транспортной сети, позволяет также сократить расходы оператора на оплату магистрального трафика, уменьшить количество хопов (hop: англ. - прыжок) и, как следствие, время задержки до начала воспроизведения на абонент-
ском устройстве и повысить качество восприятия (Quality of Experience, QoE) услуги в целом. Оценка с использованием приближенного метода Парето говорит об ожидаемой высокой эффективности системы распределенного хранения контента.
СПИСОК ЛИТЕРА ТУРЫ
1. Петренко А., Краишкин С., Комаров П. Радиорелейные линии связи во второй декаде XXI века // Вестн. связи. 2011. № 2. С. 55-56.
2. Транспортные сети (Backhaul) для сетей широкополосной мобильной связи: тенденции и перспективы развития в России и в мире. URL: http://www.json.ru/ru/poleznye_materialy/free_ market_watches/analytics/transportnye_seti_backhaul_dlya_setej_shirokopolosnoj_mobilnoj_svyazi_tendencii_ i_perspektivy_razvitiya_v_rossii_i_v_mire/ (дата обращения: 25.01.2017).
3. Cisco: в ближайшие 5 лет мобильная передача данных может вырасти почти в 10 раз. URL: http://www.cisco.com/web/RU/news/releases/txt/2015/02/020515a.html (дата обращения: 25.01.2017).
4. Продажи онлайн-видео в России выросли на 20% в 2016 году. URL: https://www.searchengines.ru/prodazhi-online-video.html (дата обращения: 25.01.2017).
5. Initiative: как пользователи смотрят онлайн-видео в России и мире. URL: http://www.sostav.ru/publication/initiative-kak-polzovateli-smotryat-onlajn-video-v-rossii-i-mire-23957.html: (дата обращения: 25.01.2017).
6. Дмитриев В. Н., Ивакин А. А. Сравнение беспроводных технологий доставки видеоконтента // Вестн. Тамбов. гос. техн. ун-та. 2014. Т. 20, № 3. С. 466-479.
7. Дмитриев В. Н., Ивакин А. А. Анализ технологий предоставления мультимедиауслуг на мобильные терминалы // Вестн. Астрахан. гос. техн. ун-та. Сер.: Управление, вычислительная техника и информатика. 2014. № 1. С. 105-111.
8. Шумейко А. А., Сотник С. Л. Интеллектуальный анализ данных (Введение в Data Mining). Днепропетровск: Белая Е. А., 2012. 212 c.
9. BitTorrent трекер Rutracker.org. URL: https://rutracker.org/ (дата обращения: 25.01.2017).
10. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983. 471 с.
11. Соловьев В. И. Введение в эконометрику. М.: Дело, 2005. 55 с.
Статья поступила в редакцию 26.01.2017
ИНФОРМАЦИЯ ОБ АВТОРАХ
Пищин Олег Николаевич - Россия, 414056, Астрахань; Астраханский государственный технический университет; канд. техн. наук, зав. кафедрой связи; [email protected].
Ивакин Аркадий Алексеевич - Россия, 414056, Астрахань; Астраханский государственный технический университет; аспирант кафедры связи; [email protected].
O. N. Pishchin, A. A. Ivakin
REDUCING THE TRANSPORTATION NETWORK LOAD OF THE SERVICE PROVIDER USING DISTRIBUTED CONTENT STORAGE SYSTEM
Abstract. The paper focuses on networks operation based on LTE technology for multimedia transmission. It has been stated that the use of the last generation transport networks can become a constraint in the implementation of LTE technologies. To solve this problem the authors proposed
using the system of distributed content storage. The problem of realization of such a system is divided into several subtasks. Since it is not cost-effective to organize a system of nodes at each base station site, the authors suggested selecting the nodes using clustering algorithms. Also, there is no need to store the entire video library, which is available to subscribers, on each node. Taking into account financial resources of the operator, the amount of cache node may be selected according to the power distribution of the video's popularity. To determine which specific videos should be stored in the cache, there has been offered the model of predicting the popularity of content. For this, the popularity of the video is considered as a time series. The article presents the approbated model of extrapolation of existing data as an example and analyzes its applicability to the described system.
Key words: LTE (Long Term Evolution), multimedia, content distributed storage, clustering, content popularity forecasting, time series.
REFERENCES
1. Petrenko A., Kraishkin S., Komarov P. Radioreleinye linii sviazi vo vtoroi dekade XXI veka [Radio relay communication lines in the second decade of XXI century]. Vestniksviazi, 2011, no. 2, pp. 55-56.
2. Transportnye seti (Backhaul) dlia setei shirokopolosnoi mobil'noi sviazi: tendentsii i perspektivy razvitiia v Rossii i v mire [Transport network (Backhaul) for mobile broadband: trends and prospects of development in Russia and all over the world]. Available at: http://www.json.ru/ru/poleznye_materialy/ free_market_watches/analytics/transportnye_seti_backhaul_dlya_setej_shirokopolosnoj_mobilnoj_svyazi_tendencii _i_perspektivy_razvitiya_v_rossii_i_v_mire/ (accessed: 25.01.2017).
3. Cisco: v blizhaishie 5 let mobil'naia peredacha dannykh mozhet vyrasti pochti v 10 raz [Cisco: in the nearest 5 years mobile data transfer can increase almost in 10 times]. Available at: http://www.cisco.com/web/RU/news/releases/txt/2015/02/020515a.html (accessed: 25.01.2017).
4. Prodazhi onlain-video v Rossii vyrosli na 20% v 2016 godu [Sales on-line-video in Russia increased by 20% in 2016]. Available at: https://www.searchengines.ru/prodazhi-online-video.html (accessed: 25.01.2017).
5. Initiative: kakpol'zovateli smotriat onlain-video v Rossii i mire [Initiative: how users watch on-line-video in Russia and in the world]. Available at: http://www.sostav.ru/publication/initiative-kak-polzovateli-smotryat-onlajn-video-v-rossii-i-mire-23957.html: (accessed: 25.01.2017).
6. Dmitriev V. N., Ivakin A. A. Sravnenie besprovodnykh tekhnologii dostavki videokontenta [Comparison of wireless technologies of video-content distribution]. Vestnik Tambovskogo gosudarstvennogo tekhnicheskogo universiteta, 2014, vol. 20, no. 3, pp. 466-479.
7. Dmitriev V. N., Ivakin A. A. Analiz tekhnologii predostavleniia mul'timediauslug na mobil'nye terminaly [Analysis of providing multimedia services to mobile terminals]. Vestnik Astrakhanskogo gosudarstvennogo tekhnicheskogo universiteta. Seriia: Upravlenie, vychislitel'naia tekhnika i informatika, 2014, no. 1, pp. 105-111.
8. Shumeiko A. A., Sotnik S. L. Intellektual'nyi analiz dannykh (Vvedenie v Data Mining) [Data mining (Introduction into Data Mining)]. Dnepropetrovsk, Belaia E. A., 2012. 212 p.
9. BitTorrent treker Rutracker.org. Available at: https://rutracker.org/ (accessed: 25.01.2017).
10. Aivazian S. A., Eniukov I. S., Meshalkin L. D. Prikladnaia statistika: Osnovy modelirovaniia ipervichnaia obrabotka dannykh [Applied statistics: basics of modelling and primary data processing]. Moscow, Finansy i statistika Publ., 1983. 471 p.
11. Solov'ev V. I. Vvedenie v ekonometriku [Basics of econometrics]. Moscow, Delo Publ., 2005. 55 p.
The article submitted to the editors 26.01.2017
INFORMATION ABOUT THE AUTHORS
Pishchin Oleg Nickolaevich - Russia, 414056, Astrakhan; Astrakhan State Technical University; Candidate of Technical Sciences; Head of the Department of Communication; [email protected].
Ivakin Arkadiy Alekseevich - Russia, 414056, Astrakhan; Astrakhan State Technical University; Postgraduate Sudent of the Department of Communication; [email protected].