--------------------□ □------------------------
Стаття присвячена огляду підходів до аналітичного моделювання процесів, що мають місце у чергах телекомунікаційного вузла у випадках, коли тривалість обслуговування має розподіл з «важким хвостом» Ключові слова: СМО, СКВ, функція розподілу
□---------------------------------------□
Статья посвящена рассмотрению подходов к аналитическому моделированию процессов, происходящих в очередях телекоммуникационного узла в случаях, когда длительность обслуживания имеет распределение с «тяжелым хвостом»
Ключевые слова: СМО, СКО, функция распределения
□---------------------------------------□
Article is dedicated to overview approaches of queueing processes analytical modeling in cases when service duration has «heavy tail» distribution
Key words: QS, MSD, distribution function --------------------□ □------------------------
УДК 261.391
АНАЛИЗ ПРОИЗВОДИТЕЛЬНОСТИ УЗЛА СЕТИ В УСЛОВИЯХ НЕСТАЦИОНАРНОГО ТРАФИКА
Ю.В. Андрушко
Аспирант
Кафедра телекоммуникационных систем Харьковский национальный университет радиоэлектроники пр. Ленина 14, г. Харьков, Украина, 61000 Контактный тел.: (057) 702-13-20 Е-mail: ya@kture.kharkov.ua
1. Введение
Неотъемлемой составляющей проектирования, эксплуатации и модернизации телекоммуникационных систем является аналитическое моделирование процесса их функционирования. Для этого активно используются модели и методы теории массового обслуживания [1 - 2].
На вход системы массового обслуживания (СМО) с накопителем конечной емкости т, 1 <т<~ . поступает пуассоновский поток заявок интенсивности X. Длительности обслуживания заявок имеют гамма-распределение с плотностью распределения
вида [3]: B(x) =
1
Р“Г(а)
или эквивалентно:
F(x) =
Г(а)
-, x > 0,
(1)
где и = ац ;
ц-1 = t - среднее время обслуживания; а = 1/о , о - СКО времени обслуживания.
Если при переполнении накопителя поступающая на систему заявка теряется и вновь не возобновляется, а так же t <~ и о<~, такая СМО в классификации Кендалла может быть описана как М / Г /1/m .
В рамках задачи аналитического моделирования процессов в телекоммуникационных системах особого внимания заслуживает моделирование процессов, происходящих в очередях телекоммуникационного узла. Большое внимание при моделировании этих процессов уделяется ситуациям, когда длительности обслуживания имеют распределение с так называемыми «тяжелыми хвостами» [2]. Основное свойство
распределения такого типа заключается в том, что его дополнительная функция распределения (ФР) медленно убывает при t . Распределения с «тяжелыми хвостами» также характеризуются тем, что имеют большие или неограниченные дисперсии. В рамках данного раздела будут проанализированы свойства процесса ограниченной очереди при пуассоновском или марковском входящем потоке заявок и гамма-распределении времени их обслуживания в условиях, когда среднеквадратическое отклонение (СКО) времени обслуживания неограниченно растет.
Несмотря на то, что гамма-распределение не является распределением с «тяжелым хвостом», однако при стремлении СКО (при фиксированном среднем значении) к бесконечности также неограниченно растет и дисперсия. Это позволяет предположить что результаты для процесса очереди, полученные в условиях неограниченного роста СКО, могут в той или иной мере отражать поведение характеристик очереди для случая ФР с «тяжелыми хвостами».
2. Аналитические выражения для сетевых характеристик
Если обозначить через рк стационарную вероятность того, что в системе М / Г /1/т в произвольный момент времени находится к заявок, для вычисления стационарного распределения вероятностей {рк,к = 1,М} (М = т +1 ), можно использовать следующие формулы:
Р1 = - Ро, Pk = -^k,k = 2,m Рм =1 - Г
(2)
(3)
Интенсивность выхода обслуженных заявок XD :
x
З
Хо = ц(1- рс).
(4)
Рассмотрим моменты распределения. Если плотность распределения времени обслуживания определяется формулой (1), то величины Рк = Рк(Х) вычисляются по следующим рекуррентным формулам:
Рс = (■
Х +V
(5)
Рассмотрим ситуацию, когда о ^ ~ . В этом случае, нельзя утверждать, что вероятности {рк,к = 0,М} задают стационарное распределение вероятностей, так как формулы получены в предположении, что ^р и
о конечны. Однако, исходя из них, можно получить выражения для некоторых показателей производительности СМО в условиях, когда о^~. Далее, предельные значения (при о ^ ~ ) исследуемых величин обозначены «*».
Выражение для Р0 в (5) приводится к виду:
1 4
Ро = (^)0 , (6)
где р = Х / ц=Х^.
Переходя в (6) к пределу при о^^, с учетом (5) получим:
Рк = ИтРк = с,к > 1.
Исходя из (3) при о ^ ~ : С** = X, с|* = 0,і = 2,т.
(7)
ностеи:
Рс =
1 + р’
р°к = с,к = 1,т,
Рм =
1+ Р'
(10)
(11)
Проанализировав (9) - (11) можно сделать вывод, что при о^~ СМО М/Г/1/т функционирует как система с двумя состояниями: состоянием (С), отвечающим ситуации, когда система М/М/1/С полностью свободна, и состоянием ( М ), соответствующим случаю, когда система занята обслуживанием и в неи находится М заявок.
Используя полученные формулы, можно получить предельные выражения для ряда других показателеи производительности СМО.
Из (9) - (11) для среднего числа заявок в системе
Г:
Мр
N = МрМ =
1+р
Для среднеИ длины очереди П*:
* * тр
п = тгрМ = —
(12)
(13)
Для интенсивности обслуженного потока - интенсивности выхода Х^ из (4) и (9):
Х (14)
х;=
1+р
Вероятности потерь я* определяется как: р
п = Рм =
1+Р
(15)
Приняв во внимание формулы Литтла ( Х(1 - п^ = П, Х(1 -п)у = N ), которые описывают связь среднеИ длины очереди П со средним временем ожидания w и среднее число заявок в системе N со средним временем пребывания заявки в системе V, для предельных значении w* и V* можно получить:
*т w =—, Ц
V = М
Ц
(16)
(17)
Основываясь на формулах (9) - (13), получим выражения для значении среднеквадратичных отклонений длины очереди Оп и числа заявок в системе о*т :
* т^/р
Оп =--------,
п 1+р
* М^/р Ок = 1+р .
(18)
(19)
Для получения выражения предельных значений показателей производительности, примем р = 1:
♦ ♦ ♦ 1
(8) Рс: = Рм = Я : ” У
п* N* М
вероят- =т = У = У’
(9) М
оП =т = У =У
(2С)
Если на вход рассмотренной системы поступает Марковский поток, который характеризуется матрицами Ли N порядка 1. Элемент Л ^ матрицы Л есть интенсивность перехода процесса генерации заявки с фазы 1 на фазу ] без поступления новой заявки, а элемент N матрицы N есть также интенсивность перехода процесса генерации заявки с фазы 1 на фазу ], но с поступлением новой заявки. Предполагается, что матрица N отлична от нулевой матрицы, а матрица Л = Л+ N неразложима.
Можно обозначить стационарную вероятность того, что в произвольный момент времени в системе нет заявок, а процесс генерации заявок находится на фазе 1 как р10, в таком случае р1к будет представлять стационарную вероятность того, что в произвольный момент времени в системе находится к заявок, а генерируемая заявка проходит фазу 1. Введем векторы Рл =(Р1к>Р2к>...>Р1к) ,к = 0,М. Для вычисления стационарного распределения вероятностей {рк,к = 0,М} состояний системы МАР/G/1/m можно использовать алгоритм, изложенный [4].
Для СМО МАР/ Г /1/т плотность распределения времени обслуживания определяется формулой (1). Прежде всего можно отметить, что выражения для предельных значений экспоненциальных моментов Рл
V
о
1
р
€
не зависят от параметра X. Поэтому для вычисления предельных (при о^~ ) значений вероятностей состояний системы МАР/ Г /1/т можно использовать (6) и (7) для вычисления предельных значений РС(а)
и РС(а):
в0(а) = в0 = 1, P0(a) = Pk = 0, k > 1;
P0(a) = в0 = 1, P0(a ) = Pk = 0, k > 1.
(21)
Используя полученные ранее результаты, можно показать, что:
1
C=
1 + p’
и, следовательно, p* 1
Po =n------,
0 1+ P
Р’кл——.
K 1+ P
(22)
(23)
Вероятности p0 = P0T1 и pM = PMT1 определяются формулами:
а)
p0 = pM
1
1+P, p
1 + p’
(24)
(25)
т.е. p0 и pM совпадают с аналогичными вероятностями для СМО MAP/Г/1/m .
Вероятность потери п для СМО MAP/G/1/m определяется формулой [4]:
п = -Р^ (26)
Предельное значение вероятности потерь п* для СМО MAP/Г/1/г вычисляется по той же формуле, что и для M / Г /1/m :
Р
п = pm =
1+p'
(27)
3. Численный анализ результатов
Далее приводятся результаты, полученные для СМО М/Г/1/т , иллюстрирующие сходимость по-
б)
Рис. 1. Вероятность простоя системы p0
а)
б)
Рис. 2. Вероятность потери заявки п
Рис. 3. Среднее число заявок в системе N
б)
3
казателей производительности системы при о^~ к их предельным значениям. На рис. 1 - 5 (в логарифмическом масштабе) приведены зависимости различных сетевых параметров от среднеквадратического отклонения времени обслуживания. Рис. 1 - 5 а) -иллюстрируют значения сетевых параметров при Х = 0,1, ц = 2 и т = 1000 для малых (р = 0,05), а рис.
1 - 5 б) - при Х = 1,8, ц = 2 и т = 500 для больших (р = 0,9) нагрузок.
ными ( о^~ ) значениями. Это также подтверждается расчетами, выполненными по формулам для (теоретических) предельных значений данных показателей. Следует заметить, что приведенные показатели производительности отражают поведение СМО в условиях малой загрузки (р = 0,05). Однако, как следует из графиков, при больших значениях СКО (о> 1000) вероятность потери заявки достаточно велика (п>0,04), что при значении емкости
б)
Рис. 4. Среднеквадратическое отклонение числа заявок в системе оп
Рис. 5. Среднее время пребывания заявки в системе V
б)
4. Выводы
В статье проведен анализ подходов к аналитическому описанию процессов очередей телекоммуникационного узла. Основное внимание при этом уделялось случаю, когда длительности обслуживания имеют распределение с так называемыми «тяжелыми хвостами». Был затронут ряд фундаментальных свойств и характеристик таких распределений, а так же показано, что, несмотря на то, что гамма-распределение не является классическим примером распределения с «тяжелым хвостом», в случаях когда СКО времени обслуживания заявки в узле о^~ , гамма-распределение приобретает свойства таких распределений. Используя известный математический аппарат для гамма-распределения, были получены формулы для нахождения значений важнейших показателей производительности сети для различных СМО. Кроме прочего, отдельно были затронуты ситуации с варьированием параметров загрузки и времени обслуживания заявки. В заключительном параграфе статьи был проведен численный анализ полученных результатов. На рис. 1 - 5 а) показано, что значения показателей производительности при о = 105 и о = 106 (два последних отсчета) для заданной точности вычислений совпадают, т.е. эти значения фактически можно считать предель-
накопителя т = 1000 порождает вопросы к достоверности. Также значительны среднее число заявок в системе, равное примерно 47 (с учетом среднеквадратичного отклонения число заявок в системе может быть более 260), и среднее время пребывания заявки в системе, которое при столь малой загрузке системы превышает 500 единиц времени.
Тем не менее, эти факты не кажутся неправдоподобными, если принять во внимание, что СМО рассматривается в условиях большого СКО времени обслуживания, что при фиксированном среднем времени обслуживания эквивалентно большой его дисперсии.
По результатам второго моделирования, СМО исследуется в условиях большой загрузки (р = 0,9). Так же как и для малой загрузки, при о> 10 значения показателей производительности, приведенные в двух предпоследних отсчетах, можно считать (при заданной точности вычислений) совпадающими с их предельными значениями, что также подтверждается расчетами для (теоретических) предельных значений этих показателей, которые представлены последним отсчетом на графиках. Для большой загрузки также наблюдается эффект значительного увеличения вероятности потерь с ростом СКО о , что опять же объясняется большой дисперсией времени обслуживания.
Е
Литература
1. Башарин Г.П. Анализ очередей в вычислительных сетях. Теория и методы расчета / Г.П. Башарин, П.П. Бочаров, Я.А. Коган
- М.: Наука. Гл. ред. физ.-мат. лит., 1989. - 336 с.
2. Шелухин О.И. Фрактальные процессы в телекоммуникациях : учеб, пособие / О.И. Шелухин, А.М. Тенякшев, А.В. Осин ; Под ред. Шелухина О.И. М.: Радиотехника, 2003. - 479с.
3. Абрамовиц, М. Справочник по специальным функциям с формулами, графиками и математическими таблицами : пер. с англ.
- М.: Наука, 1979. - 835с.
4. Бочаров П.П Теория массового обслуживания : учеб, пособие / П.П Бочаров, А.В. Печинкин М.: Изд-во РУДН, 1995. - 529с.
---------------------□ □------------------------
У статті розглянуто проблему спаму в соціальних мережах, класифікація легітимних і нелегітимних користувачів
Ключові слова: соціальні мережі, класифікація, спам, алгоритм
□---------------------------------------□
В статье рассмотрена проблема спама в социальных сетях, классификация легитимных и нелегитимных пользователей Ключевые слова: социальные сети, классификация, спам, алгоритм
□---------------------------------------□
The problem of spam in social networks, legitimate and non-legitimate users’ classification is considered in this article
Key words: social networks, classification, spam, algorithm ---------------------□ □------------------------
УДК 001.891:65.011.56
ПОДХОД К КЛАССИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ В СОЦИАЛЬНЫХ СЕТЯХ
А.А. Куликова
Кафедра искусственного интеллекта Харьковский национальный университет радиоэлектроники пр. Ленина,14, г. Харьков, Украина, 61166 Контактный тел.: (057) 337-27-53, 093-776-41-20 E-mail: ganna.kulikova@gmail.com
1. Введение
Социальные сети, привлекающие сегодня к себе всеобщее внимание пользователей Интернета, сформировались за очень короткий промежуток времени. Они объединяют в себе блоги (сетевые дневники), сети медиа-ресурсов, сети персональной информации (Му-Space, LinkedIn, Facebook, Вконтакте), системы закладок (del.icio.us), wiki-энциклопедии и другие. Данные Web-сайты представляют собой автоматизированную социальную среду для обеспечения коммуникации как отдельных, так и групп пользователей, объединенных общими интересами. Количество пользователей в этих сетях увеличивается с беспрецедентной скоростью, вызывая интерес у представителей науки, бизнеса и 1Т-индустрии [1]. Такие Web-сайты фактически представляют собой большое хранилище общедоступной информации, в первую очередь, персонального характера.
Однако в то же время развитие 1П;ете^ технологий проектирования социальных сетей привело к тому, что одной из основных проблем пользователей стал избыток информации, в том числе и незапрошенной,
- спама.
Спам представляет собой масштабную рассылку коммерческой, политической и иной рекламы (информации) или иного вида сообщений лицам, не выражавшим желания их получать. Значительная часть атак основана на методах социальной инженерии (привлечение пользователей недобросовестной рекламой и т.д.), другая - на использовании уязвимостей в механизмах работы социальных сетей. Существует достаточно много видов спама, распространяемого в социальных сетях, но, прежде всего, стоит отметить рекламу, некоторые виды мошенничества, фишинг, распространение вредоносного программного обеспечения.
Технологии рассылки спама в социальных сетях совершенствуются: спаммеры отмечают пользователей социальной сети на фотографиях, видеозаписях, добавляются в друзья, приглашают в группы и так далее, в целом используют все возможности социальной сети в корыстных целях.
Борьба со спаммерами в социальных сетях важна для улучшения сервисов, предоставляемых социальной сетью для участников, уменьшения количества нежелательного и опасного контента, а так же для развития самих социальных сетей.
3