УДК 65.012,123
ГРОМАДНЫЕ СЕТИ: ИССЛЕДОВАНИЯ И ПРАКТИКА УПРАВЛЕНИЯ © Н.А. Кинаш1, А.А.А. Наджи2, Н.И. Никуличев3, А.И. Труфанов4, А.А. Тихомиров5, С. Мйонг6, Й. Чой7, З. Ашурова8, А. Россодивита9, С.А. Гнатюк10, Р.А. Умеров11
1,2,3,4Иркутский государственный технический университет,
664074, Россия, г. Иркутск, ул. Лермонтова, 83.
5,6,7,8INHA University, 402-751, Republic of Korea,
Inchoen, Nam-gu,Yonghyun-dong, 253.
9San-Raffaele Hospital Scientific Foundation, University of Life and Health,
20132, Italy, Milan, Olgettina, 60.
10,11
, Национальный авиационный университет,
03058, Украина, г. Киев, пр. Космонавта Комарова, 1.
Представлен обзор исследований в новой предметной области комплексных сетей с вниманием к проблемам, проистекающим из крупномасштабности сетевых структур, требующих объемных хранилищ информации и высокой производительности вычислительных средств. Сформулированы первоочередные задачи в изучении подобных - громадных - сетей.
Ил. 3. Библиогр. 27 назв.
Ключевые слова: комплексные сети; управление; параллельные вычисления.
HUGE NETWORKS: STUDIES AND MANAGEMENT PRACTICE
N.A. Kinash, A.A.A. Naji, N.I. Nikulichev, A.I. Trufanov, A.A. Tikhomirov, S. Myong , Y. Choi , Z. Ashurova,
A. Rossodivita, S.A. Gnatyuk, R.A. Umerov
Irkutsk State Technical University,
83 Lermontov St., Irkutsk, 664074, Russia.
INHA University, 402-751, Republic of Korea,
Inchoen, Nam-gu, Yonghyun-dong, 253.
San-Raffaele Hospital Scientific Foundation, University of Life and Health,
60 Olgettina, Milan, Italy, 20132.
National Aviation University,
1 Cosmonaut Komarov pr., Kiev, 03058, Ukraine.
The article provides a review of researches in the new subject domain of integrated networks. It focuses on the problems
1 Кинаш Николай Александрович, аспирант, е-mail: [email protected]
Kinash Nikolai, Postgraduate, e -mail: [email protected]
2Наджи Абду Ахмад Али, аспирант, тел.: 89643526296, e-mail: [email protected]
Naji Abdu Ahmad Ali, Postgraduate, tel.: 89643526296, e-mail: [email protected]
3Никуличев Никита Игоревич, аспирант, е-mail: [email protected]
Nikulichev Nikita, Postgraduate, e -mail: z.knizhka @ mail.ru
4Труфанов Андрей Иванович, кандидат физико-математических наук, доцент кафедры технологии машиностроения, действительный член Международной академии информатизиции, e-mail: [email protected]
Trufanov Andrei, Candidate of Physicomathematical sciences, Associate Professor of the Department of Mechanical Engineering Technologies, Full Member of the International Academy of Informatization, e-mail: [email protected]
5Тихомиров Алексей Анатольевич, доктор экономических наук, профессор кафедры государственного управления, вицепрезидент Международной академии информатизации, e-mail: [email protected]
Tikhomirov Aleksei, Doctor of Economics, Professor of the Department of Public Administration, Vice-President of the International Academy of Informatization, e-mail: [email protected]
6Мйонг Сенгхван, доктор философии, профессор кафедры государственного управления , e -mail: [email protected] Myong Senghvan, Ph.D., Professor of the Department of Public Administration, e-mail: [email protected]
7Чой Йонгрок, доктор философии, профессор Института экономики и международной торговли, директор программы глобального электронного управления, e-mail: [email protected]
Choi Yongrok, Ph.D., Professor of the Institute of Economics and International Trade, Director of the program of global e-governance, e-mail: [email protected]
8Ашурова Замира, аспирант, e-mail: [email protected] Ashurova Zamira, Postgraduate, e-mail: [email protected]
9Россодивита Алессандра, доктор медицины, зав. отделением кардиологии, член WADEM, e-mail: [email protected] Rossodivita Alessandra, Doctor of Medicine, Head of the Department of Cardiology, member of WADEM, e-mail: [email protected]
10Гнатюк Сергей Александрович, доцент кафедры информационной безопасности, e-mail: [email protected] Gnatyuk Sergey, Associate Professor of the Department of Information Security, e-mail: [email protected]
11Умеров Рустем Амдиевич, аспирант, e-mail: [email protected] Umerov Rustem, Postgraduate, e-mail: rustem.amdy.umerov @ gmail.com
originating from the large-scale of network structures that require bulk data storage and high performance of computing facilities. First priorities in studying of the huge networks are formulated.
3 figures. 27 sources.
Key words: integrated networks; management; parallel computing.
Введение. Научные исследования сетевых структур (с числом узлов в сети более 1 млн) активизировались в начале XXI века, в первую очередь, в связи с уверенным использованием глобальной сети Интернет и развитием методов и технологий распределенных вычислений (рис.1).
Рис. 1. Сеть Интернет [3]
Такие сети называют «большими» или «крупно-масштабными»[1], в англоязычной литературе используют термины ”large”, “large-scale”, в последнее время - “massive”[2]. В настоящей работе предлагается характеризовать данные сети как «громадные».
При изучении громадных сетей серьезной проблемой является сбор практического материала для проведения исследований и последующего анализа этого материала. Требуются значительные финансовые и технические ресурсы, чтобы построить, например, социальную сеть страны с многомиллионным населением или сеть телефонных контактов в пределах города. С появлением инструментов глобальной сети Интернет оказалось возможным, например, посредством программного интерфейса (API) сделать выборку данных для построения подсети на основе социальных сетей (Facebook и подобных). Доступным стало построение сетей цитирования научных работ, соавторства, технологических компонентов Интернет и др. Системы распределенных вычислений (суперкомпьютеры, кластеры) и быстро развивающиеся информационные и коммуникационные технологии предоставили возможность для хранения полученных массивов данных большого объема и быстрой их обработки (расчета сетевых метрик).
Исследования в области громадных сетей развивались в двух основных направлениях:
• эмпирические наблюдения сетевых структур и
выявление их свойств;
• разработка моделей реалистичных сетей, в которых бы явственно проявлялись свойства, обнаруженные эмпирическим путем, и последующий анализ различных процессов в сети (эволюции самой сети, атак, каскадов и т.д.).
Эмпирические наблюдения громадных сетей. В одной из ключевых работ [4] исследовалась сеть сообщества актеров (215 тысяч узлов) и WWW(325 тысяч узлов). Было выявлено, что в этих сетях, как и в большинстве социальных, наблюдается степенной закон распределения связности k узлов:
P(k) ~ k-Г ,
где у - параметр, величина которого обычно находится в интервале 2+3.
Эти сети получили известность как безмасштаб-ные (scale-free).
Авторы [5] разработали поисковой робот (краулер) для сбора топологической информации в P2P сети Gnutella (самоорганизующаяся структура с независимыми участниками). Вначале краулер отправлял приветственное сообщение нескольким узлам в сети и ожидал ответа. Если от узла поступал ответ, краулер добавлял его в свой список. За 6 месяцев наблюдений была собрана база из 400 тысяч узлов, активность которых проявлялась в разное время. Причем, в среднем, одновременно активными были приблизительно 40 тыс. узлов. Характерно, что за месяц работы краулером собиралась информация объемом до 350 Тбайт. Однако, будучи достаточно быстродействующим, поисковый робот, тем не менее, не смог охватить динамику сети полностью. Поэтому полученные данные отражали природу сети только в определенный момент времени. В итоге авторы пришли к заключению, что сеть Gnutella в связности своих узлов следует комбинации степенного и равномерного законов распределения.
В [6] исследовалась объемная сеть телефонных звонков и коротких сообщений (SMS) 3,1 миллиона пользователей: 200 миллионов звонков и 300 миллионов SMS сообщений в течение одного и шести месяцев соответственно. Общий объем данных при этом составлял до 70 Гбайт. Авторы предложили модель Truncated Autocatalytic Process (TAP ), с помощью которой попытались объяснить существующие временные интервалы, во время которых у людей отсутствует всякая социальная активность.
Особый интерес представляет поиск сообществ в больших сетях ([5-7]).
Было обнаружено [7], что в социальных Интернет-сетях существует гигантский связный компонент и некоторое число групп, не принимающих никакого участия в общей жизни сети.
Сеть цитирования NEC CiteSeer database - 250000
статей и 4,5 миллиона цитат - строилась в [8]. Авторы выявляли сообщества и сделали вывод, что часть таковых возникает совершенно случайно и быстро распадается. Другая часть коммун, та что зарождается по определенным принципам, существует достаточно долго.
Многими исследователями изучался сетевой характер эпидемических процессов [9] и возможность эффективно противодействовать таким процессам. Безусловно, не остались без внимания распространение вирусных программ в сети Интернет (см., например, [5]), а также сопутствующая живучесть информации (т.е. почему одни сведения быстро исчезают в сети, другие же присутствуют долго) на примере P2P сети.
В целом проблемы надежности и безопасности сложных систем - одно из главных направлений теории и практики в любой предметной области. Например, в [10] изучалась сеть соавторов DBLP (узел -автор, связь - наличие соавторства) - 418 тысяч узлов и 2,7 миллиона узлов и сеть NetFlix (http://www.netflixprize.com/ [11]) - 2,6 миллиона узлов и 171 миллион связей. При этом проводился анализ, какие узлы имеет смысл защищать, чтобы обеспечить устойчивость сети к атаке, и какие узлы следует атаковать для быстрого уничтожения сети.
Анализ громадных сетей. Первоначальные модели больших сетей опирались на следующие предположения:
1. Степенное распределение в сети постоянно, не изменяется в процессе эволюции сети (модель предпочтительного присоединения).
2. Диаметр в сети медленно возрастает (модель малого мира).
Таким образом, в основном реальные сети рассматривались как статические объекты либо выполнялось малое число «снимков» сети в разные периоды времени. В [12] была предпринята попытка пересмотреть все предыдущие представления. Исследуя эволюцию 4 разных сетей, эмпирическим путем авторы пришли к следующим выводам:
1. С течением времени число связей (плотность) в сети возрастает по степенному закону.
2. Диаметр сети не только не возрастает, но уменьшается.
Авторы объясняют степенной характер увеличения плотности сети ассортативностью, которая также является неотъемлемым свойством больших реальных сетей. В [13] исследовались технические данные о контактах в системе Microsoft Messenger instant-messaging system[14]. Исследователи имели доступ только к характеристикам звонка - длительности и частоте, но не к содержанию переговоров. Через месяц сбора информации база данных содержала 30 миллиардов контактов между 240 миллионами участников. Далее строилась громадная сеть, в которую вошли 180 миллионов узлов и 1,3 миллиарда связей. В результате было выявлено, что громадные сети имеют высокую степень ассортативности по возрастному, географическому и языковому, но не гендерному признаку.
Моделирование громадных сетей. Изучение реальных крупномасштабных сетей является зачастую сложной, иногда неподъемной задачей из-за отсутствия технических или финансовых возможностей. На помощь приходят модели, однако вычислительных мощностей персональных компьютеров, даже современных, недостаточно для моделирования сетей размером более 1 миллиона узлов. Поэтому для задач такого рода используются кластерные системы с архитектурой MIMD (рис.2) подклассов distributed memory и shared memory.
Рис. 2. Многопроцессорные системы, обрабатывающие множественные потоки данных (Класс MIMD) [15]
Кроме того, исследователи столкнулись с тем, что алгоритмы, реализованные в таких программах, как BRITE, GT-ITM, JUNG, LEDA, неэффективны при работе с большими сетями [16]. Поэтому оказалась необходимой разработка новых эффективных алгоритмов, нацеленных на большие сети, с последующей адаптацией под распределенные вычисления.
В этом смысле примечателен экономичный алгоритм генерации сетей с различной топологией [17] R-MART , использующий рекурсивное разбиение матрицы смежности (МС). Алгоритм оперирует с 4 параметрами a, b, c, d , которые на каждом шаге итерационного процесса определяют, какой из четырех квадрантов МС будет выбран для добавления связи между узлами (рис.3).
Рис. 3. Алгоритм генерации сетей R-MART
В итоге, алгоритм рекурсивно добирается до минимальной ячейки матрицы (i,j) и заносит в нее единицу. Главное, что при этом возможна генерация параллельных связей.
Интересными представляются два оригинальных алгоритма генерации безмасштабных сетей [18]. С их помощью авторы построили сеть в 1 миллиард вершин и 5 миллиардов связей менее чем за 13 секунд на большом кластере Lawrence Livermore National Laboratory. Первый из алгоритмов, Parallel Barabasi-Albert, реализует схему предпочтительного присоединения. Сеть начинается с маленькой клики, далее на каждом шаге итерации добавляемый узел связывается с одним из имеющихся узлов, с вероятностью, пропорциональной степени последнего.
Второй алгоритм, Parallel Kronecker (PK) , является развитием генератора R-MAT и представляется одним из наиболее перспективных. Алгоритм PK, согласно анализу[19], способен моделировать большую часть свойств реальных сетей (безмасштабность, уменьшающийся диаметр и т.п.). Данный генератор основан на произведении, носящем имя Леопольда Кронекера [20]:
П?=1 0[[5)т 0 d ^[51 т0d ^
где k - число итераций; u - значение столбца; v - значение строки матрицы смежности соответственно; в-матрица инициатора (МИ); n - ее размерность.
Процесс генерации начинается с МИ размерностью n. Как правило, n = 2. Матрица инициатора заполняется значениями вероятностей выбора квадранта МС при ее рекурсивном разбиении.
В [21] схема предпочтительного присоединения реализована с помощью библиотеки MPI и адаптирована под кластеры с архитектурой distributed-memory.
Известен алгоритм генерации сети на основе изменения коэффициента кластеризации [22]. Авторы справедливо отметили: многие схемы при добавлении нового узла в сеть рассчитывают вероятность его присоединения к тому или иному существующему узлу на основе информации об узлах всей сети. При этом новый «сознательный» узел должен обладать всей полнотой сведений о сети, что на практике, разумеется, для громадных сетевых структур не наблюдается. Обычно для узла доступна полная информация только о каком-то локальном участке сети и агрегированные данные о сети в целом.
Практические примеры управления громадными сетями. Важной является интерпретация управления громадными сетями в государственном и корпоративном управлении [23, 24], управлении в противодействии глобальным угрозам [25], управлении глобальными транспортными и энергетическими потоками и др. Например, система дистанционного образования представляет собой объект со сложной функциональной и топологической структурой. Данный
объект содержит в себе: социальную (общение между учениками и преподавателями), технологическую (компьютеры, сети, серверы), программную (взаимосвязи программного обеспечения), логическую (политики доступа) сети, в каждой из которых могут быть задействованы сотни тысяч и миллионы узлов. В связи с этим, видится перспективным использование сетевого подхода громадных сетей для решения вопросов проектирования систем дистанционного образования, моделирования происходящих в них процессов с учетом национальных особенностей, эволюции и прогнозирования [26].
Заключение. В целом, исследования научного сообщества привели к следующим выводам о свойствах громадных сетей:
1. Сети реального мира имеют модульную структуру. Узел имеет много связей со своими «одногруппниками» и мало связей с узлами из других групп. Причем, максимальный размер модуля - сообщества составляет примерно 150 узлов.
2. Малый диаметр (теория шести рукопожатий).
3. Степенное распределение, что обычно связывают с эффектом предпочтительного присоединения: узел стремится присоединиться к тому узлу, у которого больше связей.
4. Ассортативность (связь между узлами с близкими свойствами).
5. Степенной характер коэффициента кластеризации.
6. С течением времени уменьшается диаметр сети и происходит ее уплотнение.
Эти выводы сделаны при изучении классических («плоских») сетей, моноплексов. Очевидно, что узлы реальной сети имеют разные типы связей, стратифицируя которые можно работать с конструкциями типа «сетевое кружево» [27]. Также сам узел может иметь множество свойств, оказывающих влияние на его взаимодействие с другими узлами. В плоской сети природа этих связей теряется и, как следствие, теряется важная часть топологической и информационной составляющих сети.
В последнее время стали появляться модели многослойных и взаимозависимых сетей, модели, учитывающие свойства узлов и связей, однако таковые ограничивались маломасштабными примерами.
Таким образом, в исследованиях громадных сетей отметим следующие границы:
1. Исследован узкий круг сетей (Интернет, технологические сети, Р2Р и социальные сети).
2. Не задействованы стволовые и композитные модели взаимозависимых мультиплексных сетей.
3. Недостаточно изучена динамика процессов.
Настоящий анализ даст возможность определить
перспективные направления и наметить пути дальнейших исследований громадных сетей
Библиографический список
1. Кочнев В.Ф., Сташин В.В. О выборе парадигмы математи- 2002/9.pdf
ческого моделирования крупномасштабных компьютерных 2. Frivolt G. Analysis of Massive Networks
сетей. Информост. «Радиоэлектроника и Телекоммуника- http://nazou.fiit.stuba.sk/home/misc/07-frivolt42.pdf (дата обра-
ции». Т.23, №5, 2002, с.9-10 http://www.rit.informost.ru/rit/5- щения 12.12.13).
3. http://ppt4web.ru/informatika/chto-takoe-internet.html (дата обращения 12.12.13).
4. Barabasi A.L. Albert R. Emergence of Scaling in Random Networks. Science 286(5439):509-512 (1999).
5. Ripeanu M., Foster I. Mapping the Gnutella Network: Properties of Large-Scale Peer-to-Peer Systems and Implications for System Design http://arxiv.org/pdf/cs/0209028.pdf (дата обращения 12.12.13)
6. Pedro O.S. Faloutsos F., Antonio A.F. Human Dynamics in
Large Communication Networks.
http://siam.omnibooksonline.com/2011 datamining/data/papers/2 12.pdf (дата обращения 12.12.13).
7. Haibo H., Xiaofan W., Evolution of a large online social network http://arxiv.org/pdf/0908.2163.pdf (дата обращения 12.12.13).
8. Hopcroft J., Khan O., Natural communities in large linked networks KDD '03 Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining, 2003, р.541-546
9. Tunc I., Shkarayev M.S. , Shaw B.H., Epidemics in Adaptive Social Networks with Temporary Link Deactivation, Journal of Statistical Physics, том 151, р. 355-366, 2013.
10. Tong H., Prakash B.A., Tsourakakis C., Eliassi-Rad T., Faloutsos C., Chau D.H. On the Vulnerability of Large Graphs. http://www.cs.cmu.edu/~badityap/papers/netshield-icdm10.pdf
11. Википедия http://en.wikipedia.org/wiki/Netflix_Prize
12. Leskovec J., Kleinberg J., Faloutsos С. Graphs over Time: Densification Laws, Shrinking Diameters and Possible Explanations by. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), 2005, р.324-329.
13. Leskovec J., Dynamics of large networks , PhD Dissertation, Machine Learning Department, Carnegie Mellon University, Technical report CMU-ML-08-111, 2008.
14. Википедия
http://en.wikipedia.org/wiki/Microsoft_Messenger_service
15. http://upload.wikimedia.org/wikipedia/commons/thumb/c/c6/ MIMD.svg/400px-MIMD.svg.png (дата обращения 12.12.13).
16. Brandes U., Batgelj V., Efficient Generation of Large Random Networks http://www.inf.uni-konstanz.de/algo/ publica-tions/bb-eglrn-05.pdf (дата обращения 12.12.13).
17. Chakrabarti D. R-MAT: A Recursive Model for Graph Mining https://www.siam.org/proceedings/datamining/2004/dm04_043c
hakrabartid.pdf (дата обращения 12.12.13).
18. Yoo A., Henderson K., Parallel Generation of Massive Scale-Free Graphs http://arxiv.org/pdf/1003.3684.pdf (дата обращения 12.12.13).
19. Leskovec J., Chakrabarti D. Realistic, Mathematically Tractable Graph Generation and Evolution, Using Kronecker Multiplication. http://www.cs.cmu.edu/~jure/pubs/kronecker-pkdd05.pdf (дата обращения 12.12.13).
20. Википедия
http://ru.wikipedia.org/wiki/Произведение_Кронекера.
21. Alamyz M., Madhav V. Distributed-Memory Parallel Algorithms for Generating Massive Scale-free Networks Using Preferential Attachment Model http://staff.vbi.vt.edu/maleq/ pa-pers/ppa.pdf (дата обращения 12.12.13).
22. Herrera C., Zufiria J. Generating Scale-free Networks with Adjustable Clustering Coefficient Via Random Walks http://arxiv.org/abs/1105.3347 (дата обращения 12.12.13).
23. Seunghwan Myeong, Younghoon Choi. Effects of Information Technology on Policy Decision-Making Processes: Some Evidences Beyond Rhetoric . Administration & Society 42(4) 441 -459 http://intlaas.sagepub.com/content/42/4/441.full.pdf (дата обращения 12.12.13).
24. Тихомиров А.А., Труфанов А.И. Новые сетевые модели для совершенствования процессов государственного регулирования URL: http://www.pitt.edu/~super1/lecture/lec43841/ index.htm (дата обращения 12.12.13).
25. A. Tikhomirov, A. Trufanov, A. Caruso, A. Rossodivita, E. Shubnikov, R. Umerov. Networks and Their Role in Counteracting Contemporary Global Threats: A New Model. NATO Science for Peace and Security Series - E: Human and Societal Dynamics, Volume 100: Handbook for Pandemic and Mass-Casualty Planning and Response. IOS Press, 2012. P. 217-225.
26. Кинаш Н.А., Наджи А.А.А., Тихомиров А.А., Труфанов А.И. Социальные и технологические проблемы дистанционного образования в Йеменской республике: интерпретация в сетевой модели // Вестник Иркутского государственного технического университета. 2012. №11. С.225-229.
27. Тихомиров А.А., Труфанов А.И., Носырева Л.Л., Носыре-ва Е.В. Математическое описание стволовых сетей: труды XVII Байкальской всерос. конф. Иркутск, 2012. Т.3. С.149-153.
УДК 681.53
ВЫЧИСЛЕНИЕ ПЕРИОДИЧЕСКОГО РАЗРЫВНОГО СИГНАЛА, ПРОХОДЯЩЕГО В ДИНАМИЧЕСКОЙ СИСТЕМЕ, С ПОМОЩЬЮ ЗАМЕЩАЮЩИХ ФУНКЦИЙ
л
© А.Н. Клепацкий1
Иркутский государственный технический университет,
664074, Россия, г. Иркутск, ул. Лермонтова, 83.
Предлагается способ представления периодического разрывного сигнала (воздействия), подаваемого на вход линейной динамической системы или возникающего после прохождения нелинейности, в виде части гармонического ряда. Разрывная функция заменяется мало отличающейся от нее непрерывной функцией, которая и разлагается в ряд Фурье. Исследованы свойства коэффициентов ряда и получена оценка погрешности, позволяющая найти число членов ряда для получения гарантированной точности вычислений.
Ил. 4. Библиогр. 2 назв.
Ключевые слова: ряд Фурье; разрывная функция; сходимость; суммирование; замещающая функция.
1 Клепацкий Александр Николаевич, кандидат технических наук, доцент кафедры общеинженерной подготовки филиала ИрГТУ в г. Усолье-Сибирское, доцент, тел.: 89021724073, e-mail: [email protected]
Klepatsky Alexander, Candidate of technical sciences, Associate Professor of the Department of General Engineering Training of ISTU, Usolsky Branch, Associate Professor, tel.: 89021724073, e-mail: [email protected]