Научная статья на тему 'Разработка алгоритмов кластерного анализа концентрации абонентских устройств в системах мобильной связи'

Разработка алгоритмов кластерного анализа концентрации абонентских устройств в системах мобильной связи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
413
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕОРИЯ РАЗЛАДКИ / ПРОСТРАНСТВЕННО-ВРЕМЕННАЯ РАЗЛАДКА / ТРАФИКОВЫЕ ПРОЦЕССЫ / АЛГОРИТМ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ / АЛГОРИТМ FCM / УЗЕЛ СПРОСА / C-MEANS / THE THEORY OF DISORDER / SPATIOTEMPORAL DISCORD / TRAFFIC PROCESSES / FUZZY CLUSTERING ALGORITHM / FUZZY C-MEANS / FCM ALGORITHM / THE NODE DEMAND

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зотов Кирилл Николаевич, Кузнецов Игорь Васильевич, Салов Александр Сергеевич, Симбирцева Дарья Сергеевна, Стрельникова Любовь Владиславовна

В данной статье описывается метод нахождения аномальных зон, пространственно-временные изменения трафиковых процессов (изменения нагрузки) в сетях операторов мобильной связи, на основе теории разладки с последующим применением алгоритма кластеризации, для выделения узлов спроса. Радиоресурсы сетей связи подлежат оперативному распределению вследствие резких изменений концентрации абонентов в зоне обслуживания, вызванных особенностями использования мобильных сетей конечными пользователями. Ресурсы из менее нагруженных сот могут быть использованы для решения этой проблемы. Функция позиционирования мобильных станций оператора мобильной сети является важной проблемой современной науки. Для того, чтобы обеспечить эффективное управление радиоресурсами, необходимо понять мгновенное расположение мобильных станций (МС) с точностью, которая поможет найти участки с высокой концентрацией абонентов и идентифицировать узлы спроса внутри каждого кластера. В результате позиционирования получаются наборы нечетких областей возможного появления абонентов, которые будут сгруппированы. Наиболее подходящий алгоритм кластеризации нечетких множеств это FCM. Указанный алгоритм обработки данных с теорией разладки дает наиболее полное представление о количестве. В результате мы можем четко определить узлы спроса на карте области. Особенностями алгоритма FCM являются: возможность прогнозирования центров будущих кластеров в пространстве предварительной информации по концентрации абонентов; необходимость ввода количества кластеров; для получения центров масс кластеров (узлов спроса).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зотов Кирилл Николаевич, Кузнецов Игорь Васильевич, Салов Александр Сергеевич, Симбирцева Дарья Сергеевна, Стрельникова Любовь Владиславовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Development of algorithms for analyzing the concentration of a cluster of subscriber devices in mobile communication systems

This article describes a method for finding anomalous zones spatio-temporal changes traffic processes (load changes) in the networks of mobile operators based on the theory of disorder followed by fuzzy clustering algorithm to isolate nodes demand. The radio resources are subject to operational control because when subscribers move it can cause occasional congestions in mobile communication systems. The resources from less loaded parts can be used to solve this problem. Positioning function in MS mobile operator networks is an important problem of modern science. First step to provide efficient management of radio resources is the location of mobile stations (MS) with accuracy which help to find areas with high concentration of subscribers and identify nodes of demand inside each cluster. The set of fuzzy areas of possible appearance of subscribers is to be clustered. The most appropriate fuzzy clustering algorithm for that is FCM. The first data processing by change theory brings information about sufficient quantity of clusters for default variety of subscribers. As a result we can clearly identify the nodes of demand on a region map. The FCM algorithm’s features are: рossibility to set the centers of future clusters in space by prior information about concentration of subscribers; derivation of clustered areas of subscribers with assumptions about membership in particular cluster. Possibility to set quantity of clusters, and to derive the centre of mass of clusters.

Текст научной работы на тему «Разработка алгоритмов кластерного анализа концентрации абонентских устройств в системах мобильной связи»

Зотов К.Н. Zotov К.К

старший преподаватель кафедры «Телекоммуникационные системы» ФГБОУ ВО «Уфимский государственный авиационный технический университет», Россия, г. Уфа

Кузнецов И.В. Kuznetsov I. V.

доктор технических наук, профессор кафедры «Телекоммуникационные системы» ФГБОУ ВО «Уфимский государственный авиационный технический университет», Россия, г. Уфа

Салов А.С.

Salov A.S.

кандидат технических наук, доцент кафедры «Автомобильные дороги и технология строительного производства» ФГБОУ ВО «Уфимский государственный нефтяной технический университет», Россия, г. Уфа

Симбирцева Д. С. Simbirtseva D.S.

студентка ФГБОУ ВО «Уфимский государственный авиационный технический университет», Россия, г. Уфа

Стрельникова Л.В. Strelnikova Ь. V.

студентка ФГБОУ ВО «Уфимский государственный авиационный технический университет», Россия, г. Уфа

УДК 621.391.6

РАЗРАБОТКА АЛГОРИТМОВ КЛАСТЕРНОГО АНАЛИЗА КОНЦЕНТРАЦИИ АБОНЕНТСКИХ УСТРОЙСТВ В СИСТЕМАХ МОБИЛЬНОЙ СВЯЗИ

В данной статье описывается метод нахождения аномальных зон, пространственно-временные изменения трафиковых процессов (изменения нагрузки) в сетях операторов мобильной связи, на основе теории разладки с последующим применением алгоритма кластеризации, для выделения узлов спроса.

Радиоресурсы сетей связи подлежат оперативному распределению вследствие резких изменений концентрации абонентов в зоне обслуживания, вызванных особенностями использования мобильных сетей конечными пользователями. Ресурсы из менее нагруженных сот могут быть использованы для решения этой проблемы.

Функция позиционирования мобильных станций оператора мобильной сети является важной проблемой современной науки.

Для того, чтобы обеспечить эффективное управление радиоресурсами, необходимо понять мгно-

венное расположение мобильных станций (МС) с точностью, которая поможет найти участки с высокой концентрацией абонентов и идентифицировать узлы спроса внутри каждого кластера.

В результате позиционирования получаются наборы нечетких областей возможного появления абонентов, которые будут сгруппированы. Наиболее подходящий алгоритм кластеризации нечетких множеств - это FCM.

Указанный алгоритм обработки данных с теорией разладки дает наиболее полное представление о количестве. В результате мы можем четко определить узлы спроса на карте области.

Особенностями алгоритма FCM являются: возможность прогнозирования центров будущих кластеров в пространстве предварительной информации по концентрации абонентов; необходимость ввода количества кластеров; для получения центров масс кластеров (узлов спроса).

Ключевые слова: теория разладки, пространственно-временная разладка, трафиковые процессы, алгоритм нечеткой кластеризации, C-Means, алгоритм FCM, узел спроса.

DEVELOPMENT OF ALGORITHMS FOR ANALYzING THE CONCENTRATION OF A CLUSTER OF SUBSCRIBER DEVICES IN MOBILE COMMUNICATION SYSTEMS

This article describes a method for finding anomalous zones spatio-temporal changes traffic processes (load changes) in the networks of mobile operators based on the theory of disorder followed by fuzzy clustering algorithm to isolate nodes demand.

The radio resources are subject to operational control because when subscribers move it can cause occasional congestions in mobile communication systems. The resources from less loaded parts can be used to solve this problem.

Positioning function in MS mobile operator networks is an important problem of modern science.

First step to provide efficient management of radio resources is the location of mobile stations (MS) with accuracy which help to find areas with high concentration of subscribers and identify nodes of demand inside each cluster.

The set of fuzzy areas of possible appearance of subscribers is to be clustered. The most appropriate fuzzy clustering algorithm for that is FCM.

The first data processing by change theory brings information about sufficient quantity of clusters for default variety of subscribers. As a result we can clearly identify the nodes of demand on a region map.

The FCM algorithm's features are: рossibility to set the centers of future clusters in space by prior information about concentration of subscribers; derivation of clustered areas of subscribers with assumptions about membership in particular cluster. Possibility to set quantity of clusters, and to derive the centre of mass of clusters.

Key words: the theory of disorder, spatiotemporal discord, traffic processes, fuzzy clustering algorithm, Fuzzy C-Means, FCM algorithm, the node demand.

Введение

В процессе функционирования систем мобильной связи возникают резкие перегрузки в отдельных ее сегментах, обусловленные перемещением абонентов, что вызывает необходимость оперативного управления радиоресурсами. Так, в случае перегрузки сети в одной части зоны обслуживания могут быть задействованы ресурсы из менее загруженной ее части [1].

Для эффективного управления радиоресурсами системы сотовой связи необходимо позиционировать мобильные станции с точностью, позволяющей выявлять зоны аномального изменения концентра-

ции [2]. Функция позиционирования (местоопреде-ления) МС в сетях оператора сотовой связи является актуальной проблемой современной науки и может стать универсальным инструментом для решения целого ряда задач, напрямую не связанных с услугами связи [3].

Полученные в результате позиционирования массы абонентов представляют собой большие массивы. Обрабатывать каждого абонента не представляется возможным. С точки зрения эффективного управления необходимо объединить всех абонентов в конгломерации, удобные для дальнейшего управления.

Постановка задачи

Известные алгоритмы кластеризации нечетких множеств требуют априорных сведений о системе, таких как количество кластеров, на которые необходимо разбить данное множество, экспоненциальный вес объектов множества, параметр остановки алгоритма и некоторые другие [4].

Для определения минимального количества кластеров, в рамках поиска узлов спроса, первоначально необходимо определить зоны аномального изменения нагрузки на сеть оператора связи, их количество и расположение.

Для статистической «фильтрации» абонентов с последующим объединением их в группы (кластеры) на основе территориальной конгломерации предлагается использовать алгоритм теории разладки. В пространственно-временной области в режиме реального времени данная теория представляется наиболее эффективной по следующим параметрам:

1. Инвариантность к статистическим свойствам нагрузки.

2. Инвариантность к способу и началу счета.

3. Небольшое число выборок, приводящих к ответу.

4. Простой алгоритм принятия решения [5].

Однако данный способ имеет ряд ограничений:

1. Для каждого случая необходимо выбирать, по какому критерию будет происходить перебор алгоритма разладки (фактическая плотность абонентов сети или плотность запросов ресурсов сети в единицу времени, или какой-либо другой параметр, имеющий существенное влияние на работу сети связи).

2. Сложный выбор порогового значения разладки, при котором модель будет выдавать менее робастную картину разбиения.

3. Разомкнутость кластеров аномальных зон.

Применительно к концепции управления радиоресурсами систем мобильной связи общая задача кластеризации сводится к определению границ (координат) кластеров, по сути, являющихся агрегированным источником сообщений, а также классификации трафика этих источников сообщений. При этом решение задачи кластеризации должно происходить в режиме реального времени по виду передаваемых сервисов. Алгоритм кластеризации на основе разладки помогает определить количество необходимых кластеров. После определения числа кластеров появляется возможность применения алгоритмов нечеткой кластеризации (на основе данных по количеству аномальных зон, равному количеству кластеров, на которые следует делить множества абонентов).

Таким образом, первостепенной задачей при поиске кластеров будет являться задача определения границ аномальных зон как во временной, так и в пространственной области.

В результате первичной обработки данных с помощью теории разладки появляются сведения о количестве кластеров, на которые необходимо и достаточно разбивать исходное множество абонентов. Алгоритм FCM (Fuzzy Classifier Means) представляет собой частный случай алгоритма нечеткой кластеризации Густафсона - Кесселя и является наиболее простой его реализацией [6]. В результате применения данного алгоритма могут быть получены однозначно-идентифицированные на карте местности узлы спроса.

Решение задачи

Алгоритм кластеризации на основе разладки можно свести к следующим шагам:

Шаг 1. Определение выборки местоположений МС (x; y) в течение шага.

Шаг 2. Разбиение исследуемой области на подобласти с шагом, равным среднему значению ошибки позиционирования (наложение сетки).

Шаг 3. Определение границ разладки в выборке. Вычисляется функционал T (S) по формулам:

- . 2Si — S-з — S?

TdSCN; М))в = 1 3 2, Ш

•->3 +

¿JQ — J1 — JO

T(S<iN; М))у = Зс 1 2, (2)

где T(S(N) М)) - значение функционала при возрастающей нагрузке, а T(5(iV; М)) - значение функционала при убывающей нагрузке, при этом оба функционала существуют в t= [£ф, £ф + Д£д], где £ф - фактическое время; Д£д - дискрет времени, определяемый реальными условиями:

г N—M

Sl= (W-M)2 Z1^1'

N

• S>=W 1 М'

;=(iv-M)+1 N—M M

= mT 2 if'-f'!'(3)

V i=1 j=(N-M)+1

где N и M связаны геометрически (рисунок 1), N -длина развертки функционала T(S), Me[l,N]', % -значение нагрузки на базовую станцию (БС) в данный момент времени.

Шаг 4. Объединение множеств значений T(S) в один:

^ _ ГГ(с меньшими значениями),") (4) (Г(с большими значениями).)

Шаг 5. Определение соотношения:

|7-,|

Iii

^ ^пороговое'

N К

^^(Мд)4 114 - 9 II

min,

у =1 fc=l

^M/fc =l,Vk = l,..,K

j= 1

л?

0 £K,Vj = l,..,N.

к=1

Взвешенный центр гравитации выглядит следующим образом:

■ ак

9 =

(5)

где М-пороговое находится из статистических данных.

Шаг б. Выделение координат момента разладки:

(ж; у) = аг£ {7V(M(x; у), N(xK-, ук) - М(х; у))}. (6)

Для решения задачи во времени достаточно рассмотреть суточную нагрузку на сектора антенны БС оператора сотовой связи. Подробно рассматривается в примере.

Количество аномальных зон, полученных в результате применения алгоритма на основе разладки, легко определяется. Эти выходные данные первого алгоритма становятся входными условиями работы для второго алгоритма FCM.

Алгоритм выделения узлов спроса на основе FCM можно свести к следующим шагам:

Шаг 1. Определение местоположения центроидов (точка, относительно которой идет перебор значений принадлежности к кластеру, не является центом кластера).

Шаг 2. Определение необходимого количества кластеров (из данных, полученных в результате применения разладки).

Шаг 3. Работа алгоритма. Минимизация суммы всех взвешенных расстояний || d^ — Cj ||:

/\\dk-c/'О

<7-1)

к yN Л/ >>

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ViK-c/W

(9)

(10)

(7)

где q - фиксированный параметр, задаваемый перед итерациями. Для исследуемого множества К входных векторов dк и N выделяемых кластеров с. предполагается, что любой dk принадлежит любому с. с принадлежностью к интервалу [0, 1], где. - номер кластера; к - номер входного вектора; || || - матричная норма (Евклидова норма); е - заранее задаваемый уровень точности [7].

Принимаются во внимание следующие условия нормирования для ц: N

(8)

Шаг 4. Алгоритм FCM считается завершенным при выполнении следующего условия:

|| [/(*+!)_[/(£) || <£, (11)

где и^ и - матрицы принадлежности; £ - за-

ранее задаваемый уровень точности.

Шаг 5. Определение центра масс полученных нечетких фигур в виде конечных координат (х; у).

Данный алгоритм имеет ряд недостатков:

1. Нечеткая кластеризация подразумевает в своей основе работу по перебору одних и тех же данных из большого массива данных, что приводит к значительному увеличению времени обработки данных.

2. В случае большого количества исходных точек (моделируемое количество абонентов радиосети) вычислительные мощности обычных ЭВМ не справляются с поставленной задачей.

3. Алгоритм не дает четкого представления о границах раздела кластеров, так как пограничные абоненты могут относиться сразу к нескольким кластерам.

Пример. Подразумевается, что координаты каждой из десяти точек плоскости (абонентов сети) нам известны априори.

Как видно из рисунков 1 и 2, в случае резкого увеличения плотности абонентов сети на единице площади, алгоритм корректно выделяет ту ячейку, где произошла «разладка».

Моделирование данной задачи происходило в программе С+. Точки и начальные центры кластеров берутся случайным образом на поле размером 500 на 500 условных единиц длины. Максимальное количество итераций, заложенное в программу, равно 300. Погрешность расчетов 10-5.

Для представления временной разладки были взяты данные по БС оператора сотовой связи в городе Уфе (рисунок 3).

Из табличных данных, полученных встроенными средствами программного обеспечения БС, можно составить графики распределения нагрузки в течение суток на указанных секторах (направлениях).

Рис. 1. Алгоритм кластеризации на основе разладки

Рис. 2. Функция разладки при повышении и понижении нагрузки

Рис. 3. Расположение секторов антенны БС сотового оператора

Рис. 4. Суточная нагрузка на 1 сектор антенны БС сотового оператора

Как видно из рисунка 4, разладка во временном сегменте изучения вопроса определяется визуально, без привлечения дополнительных систем и комплексов. Однако для автоматизации процесса определения момента разладки применяются формулы 1, 2 и 3 данной статьи.

На рисунке 1 приведен пример действия алго-

ритма на основе теории разладки на малое количество точек с выделением двух аномальных зон. Для FCM-кластеризации задается на том же множестве точек количество кластеров, равное двум. Результат совместного использования двух алгоритмов представлен на рисунке 5.

Рис. 5. Симбиоз работы алгоритмов разладки и нечеткой кластеризации

Как видно из рисунка 5, результат работы алгоритма определения аномальных зон концентрации абонентов на основе разладки и алгоритма FCM-кластеризации дал практически полностью совпадающие результаты, а узлы спроса, в которых рекомендуется располагать базовые станции оператора сотовой связи, попадают в выделяемые зоны.

Таким образом, из конечного множества або-

нентов сети сотового оператора были выделены кластеры, внутри которых были выделены центры масс. Эти центры масс полученных кластеров (фигур) дают знание о точке наиболее высокой абонентской нагрузки в сети оператора связи, являющиеся узлами спроса.

Список литературы

1. Султанов А.Х. Об одном методе прогноза оптимальной зоны радиопокрытия сети мобильной связи [Текст] / А.Х. Султанов, И.В. Кузнецов, А.Э. Камалов // Вестник УГАТУ. - 2010. - С. 62-67.

2. Зотов К.Н. Разработка алгоритма повышения точности позиционирования мобильных станций на основе расчета статических параметров электромагнитного поля в неоднородной среде [Текст] / К.Н. Зотов // Вестник УГАТУ. - 2013. - Т. 17. - № 2(55).- C. 14-19.

3. Воробьев Н.П. Использование компьютерного моделирования для оценки электромагнитных загрязнений [Текст] / Н.П. Воробьев, А.А. Сошников, Е.В. Титов // Ползуновский вестник. - 2009. - № 4.

- С. 31-33.

4. Зотов К.Н. Повышение эффективности систем сотовой связи на основе релевантной кластеризации местоположения мобильной связи: Автореф. дис. ...канд. техн. наук [Текст] / К.Н. Зотов. - Уфа, 2014. - С. 16.

5. Бродский Б.Е. Алгоритм апостериорного обнаружения многократных разладок случайной последовательности [Текст] / Б.Е. Бродский, Б.С. Дар-ховский. - М.: Цниика, 1993. - С. 60-72.

6. Gustafson D.E. Fuzzy clustering with a fuzzy covariance matrix[Text]/ D.E. Gustafson, W.C. Kessel.

- Scientific Systems, Inc. 186 Alewife Brook Parkway Cambridge, Massachusets, 1978. - Р. 761-766.

7. Вятченин Д.А. Нечеткие методы автоматической классификации [Текст] / Д.А. Вятченин. -Минск: Технопринт, 2004. - 219 с.

References

1. Sultanov A.H. Ob odnom metode prognoza optimal'noj zony radiopokrytija seti mobil'noj svjazi [Tekst] / A.H. Sultanov, I.V. Kuznecov, A.Je. Kamalov// Vestnik UGATU. - 2010 . - S. 62-67.

2. Zotov K.N. Razrabotka algoritma povyshenija tochnosti pozicionirovanija mobil'nyh stancij na osnove rascheta staticheskih parametrov jelektromagnitnogo polja v neodnorodnoj srede [Tekst] / K.N. Zotov // Vestnik UGATU. - 2013. - T. 17. - № 2(55). - S. 14-19.

3. Vorob'ev N.P. Ispol'zovanie komp'juternogo modelirovanija dlja ocenki jelektromagnitnyh zagrjaz-nenij [Tekst] / N.P. Vorob'ev, A.A. Soshnikov, E.V. Titov // Polzunovskij vestnik. - 2009. - № 4. - S. 31-33.

4. Zotov K.N. Povyshenie jeffektivnosti sistem sotovoj svjazi na osnove relevantnoj klasterizacii mestopolozhenija mobil'noj svjazi: Avtoref. dis. ...kand. tehn. nauk [Tekst] / K.N. Zotov. - Ufa, 2014. - S. 16.

5. Brodskij B.E. Algoritm aposteriornogo obnaruzhenija mnogokratnyh razladok sluchajnoj posledovatel'nosti [Tekst] / B.E. Brodskij, B.S. Darhovskij. - M.: Cniika, 1993. - S. 60-72.

6. Gustafson D.E. Fuzzy clustering with a fuzzy covariance matrix[Text] / D.E. Gustafson, W.C. Kessel. - Scientific Systems, Inc. 186 Alewife Brook Parkway Cambridge, Massachusets, 1978. - P. 761-766.

7. Vjatchenin D.A. Nechjotkie metody avtomati-cheskoj klassifikacii [Tekst] / D.A. Vjatchenin. - Minsk: Tehnoprint, 2004. - 219 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.