УДК 316.77 Плисюк Андрей Григорьевич
аспирант кафедры социологии Северо-Кавказского федерального университета
МЕТОДОЛОГИЧЕСКИЕ ОСОБЕННОСТИ ПРИМЕНЕНИЯ СЕТЕВОГО АНАЛИЗА В ИССЛЕДОВАНИИ МОЛОДЕЖНЫХ ИНТЕРНЕТ-СООБЩЕСТВ [1]
Аннотация:
В статье рассматриваются теоретические и методологические подходы к анализу социальных сетей и виртуальных молодежных интернет-сообществ. Анализируется возможность применения аппарата теории графов к анализу виртуальных социальных сетей. В работе уделяется пристальное внимание истории возникновения и развития методологии сетевого анализа. Подробно рассматривается понимание социальных сетей в различных гуманитарных и социально-экономических науках.
Ключевые слова:
интернет-сообщество, анализ социальных сетей, методология сетевого анализа, теория графов, виртуальная стратификация.
Plisyuk Andrey Grigoryevich
PhD student, Sociology Department, North Caucasus Federal University
METHODOLOGICAL FEATURES OF THE NETWORK ANALYSIS APPLICATION IN THE STUDY OF YOUTH ONLINE COMMUNITIES [1]
Summary:
The article deals with theoretical and methodological approaches to the analysis of social networks and youth Internet communities. The possibility of application of the graph theory to the analysis of virtual social networks is analyzed. Special attention is paid to the history and development of the network analysis methodology. The author considers in detail interpretations of the social networks in various liberal arts and socioeconomic sciences.
Keywords:
Internet community, social network analysis, network analysis methodology, theory of graphs, virtual stratification.
Теория социальных сетей стала особенно популярна в научном сообществе в последнее десятилетие XX в. При этом некорректно говорить о том, что анализ социальных сетей - исключительно новое направление в междисциплинарной методологии. Интерес к исследованию сетей зародился в американской социологии еще в 20-е гг. ХХ в. Важный вклад в логику понимания сетей внесла дискретная математика, а конкретно теория графов. В 70-е гг. вместе с зарождением такой области, как Computer Science, интерес к исследованию больших сетей со стороны информатиков и математиков заметно увеличился. Методология сетевого анализа также активно использовалась и продолжает использоваться в такой области, как статистическая физика. Серьезное внимание на теорию и методологию изучения социальных сетей оказывает также и экономическая наука, прежде всего теория игр.
Одной из значимых проблем современного сетевого анализа является отсутствие устоявшейся и общепринятой методологии. Следствием этого является обилие профессиональных для сетевого анализа терминов, взятых из самых различных отраслей научного знания. Проведенный нами теоретический анализ содержания основных терминов, используемых в сетевом анализе, показывает, что для социологической науки присущи наиболее общие и обширные определения с широкой трактовкой используемых понятий. Специалисты в области дискретной математики используют гораздо более строгие определения, основанные на формулах и математических алгоритмах. Однако эти определения и математический подход в настоящее время не отличаются гибкостью и адаптивностью для анализа социальных явлений или процессов.
Специалисты по статистической физике исследуют в сетях различные свойства множеств возможных сетевых распределений. Экономисты исследуют независимых акторов и агентов, а также используют уже названную теорию игр и ее различные элементы с целью построения экономических моделей поведения в социальных сетях.
Таким образом, определенная сложность осуществления данного исследования представляется в комплементарности различных подходов, делающих акцент на исследовании социальных сетей. Кроме того, существует множество методологических ограничений в исследовании сложных сетей, которые в частности изучает статистическая физика.
В стратификационном анализе молодежных когорт в интернет-сообществах определенные ограничения в применении традиционного методологического аппарата социологической науки
видятся в том, что сетевая структура зачастую находится в маргинальном положении между случайной (случайные графы) и регулярной сетями. В случайных сетях сложно достоверно определить, как именно узлы сети соединяются друг с другом и какова плотность этой связи.
Однако scale-free networks (безразмерные или инвариантные сети), как и регулярные сетевые образования, обладают определенной универсальной структурой со схожими параметрами. В настоящее время многие социологи, занимающиеся исследованием социальных сетей, сосредоточены на процессах, происходящих в самих сетях, поверх сетевой структуры какого-либо объекта, например, процессах распространения слухов или убеждений. В данной статье сети рассматриваются как сложные объекты. Основное внимание уделяется их структуре и процессам, происходящим внутри сети, в частности стратификационным, а также процессам социальной мобильности.
Предпосылки исследования социальных сетей были заложены одним из классиков социологической науки Г. Зиммелем [2]. Он трактовал «формальную социологию» как исследование социальных взаимодействий в различных сообществах, не принимая во внимание их размеры, территориальную локализованность и сущностность. Французский социолог Э. Дюркгейм, говоря о социальной морфологии, также характеризовал порядок и взаимодействие в социальных структурах [3]. Я. Морено, разработав технику социометрии, вплотную подошел к современным трактовкам сетевого анализа.
Основатель гештальтпсихологии Ф. Хейдер разработал ряд основных понятий теории «баланса и равновесия» в познавательных ощущениях, основанной на алгебраических алгоритмах расчета взаимодействий между индивидами [4].
Используя логику Ф. Хейдера, Т. Ньюкомб исследовал межличностные взаимодействия [5, p. 11]. Ему принадлежит авторство знаменитой конструкции АВХ, в которой взаимодействия между элементами происходят взаимно. А и В, которых связывают позитивные взаимодействия, скорее будут стремиться к поддержанию похожих чувств в отношении элемента Х, который может являться идеей, объектом или же индивидом. При этом если взаимодействие А в отношении Х является устойчивым, а ориентация В на Х противоположна ей, возможны варианты, при которых А может изменить отношение В к Х, и наоборот.
В дальнейшем Т. Ньюкомб и Ф. Хейдер активизировали использование математического аппарата для исследования взаимодействий в межгрупповых отношениях. Связь теории графов и дискретной математики с социальными сетями послужила огромным толчком для дальнейшего развития сетевого анализа. Позже ряд западных ученых использовал теоретические конструкты ориентированных графов для изучения баланса в сообществах, которые состоят более чем из трех индивидов.
Родоначальником современного сетевого анализа в социальных науках считается антрополог А.Р. Рэдклифф-Браун, разработавший методологию сетевого анализа родственных связей при исследовании традиционных обществ [6].
В дальнейшем представители антропологической школы Дж.К. Митчелл и Дж.А. Барнес использовали похожие техники для определения сетевых свойств. В начале 1970-х гг. применение математических подходов и компьютерных алгоритмов расширило теоретическое понимание концепции социальных сетей и дополнило ее целым рядом новых терминов.
В настоящее время накоплено существенное количество эмпирических исследований, основанных на сетевом анализе, совершенствуется методология использования математических и компьютерных алгоритмов изучения сетей. При этом, однако, налицо определенный дефицит теоретических и методологических исследований, предметом которых является сетевой анализ.
К настоящему времени в научном сообществе сложился определенный консенсус относительно понимания различных подмножеств сети, а именно узлов и ребер. В качестве узлов чаще всего выступают отдельные индивиды или сообщества, в качестве ребер рассматриваются связи между ними. В данном эмпирическом исследовании этого консенсуса будем придерживаться и мы.
Однако необходимым условием образования сети является перераспределение ресурсов. Даже если акторы сети находятся в виртуальном пространстве, обмен этими ресурсами также должен происходить в виртуальном пространстве. Известный теоретик сетевого анализа М. Ка-стельс в своей работе «Информационная эпоха: экономика, общество и культура» вводит понятие сетевого пространства [7]. Ресурсы, которые перераспределяются внутри сети, представлены в виде виртуального пространства, а положение узлов внутри сети характеризуется удаленностью от центров распределения различных ресурсов. Нам представляется вполне уместным использование в данном исследовании терминов «сетевое пространство» и «виртуальное пространство» в трактовке М. Кастельса в качестве рабочих определений. Таким образом, мы подходим к определению понимания сетевой структуры в виртуальном пространстве.
Социальное взаимодействие акторов в социальной сети детерминирует обмен ресурсами разного типа. В качестве ресурсов в виртуальных социальных сетях выступают технологии, информация, символы, организационное взаимодействие, вокруг которых образуются интернет-сообщества. Все эти ресурсы в социальных сетях превращаются в электронные импульсы, основой которых является материальная опора.
В целом же сеть оказывает влияние на социальную организацию сообществ и, соответственно, на социальное пространство. Виртуальное пространство состоит из персональных микросетей, где реализация личных интересов индивидов реализуется через множество взаимодействий в интернет-сообществах.
Под социальной сетью мы будем понимать набор узлов (пользователей сети), связанных между собой одним или несколькими отношениями [8, p. 11]. Узлами также могут являться индивиды, веб-страницы, публикации и т. д. В качестве связей (или ребер) мы будем исследовать потоки информации и различных ресурсов. В качестве ресурсов мы будем также рассматривать сотрудничество, социальные отношения, обмен и т. д.
Российский социолог С.В. Бондаренко для анализа интернет-структур предлагает ввести в научный оборот понятие информационной стратификации [9, с. 145]. Информационная стратификация, по мнению ученого, основана на неравном доступе к информации. Мы считаем вполне правомерным согласиться с данной точкой зрения. В эпоху информационного общества данный тип неравенства становится важнейшим критерием дифференциации различных групп населения. Следовательно, можно было бы построить исследование на основе только лишь традиционного количественного опроса пользователей сети Интернет с целью определения барьеров, имеющихся у пользователей в доступе к глобальной информационной системе.
Однако мы считаем недостаточным только лишь традиционное анкетирование пользователей сети Интернет, поскольку оно не даст достоверного представления о структуре интернет-сообществ, членами которых они являются, а также о виртуальной структуре молодежных сообществ.
Под виртуальной стратификацией обычно понимают дифференциацию пользователей социальных сетей на основе неравномерности их доступа к символическому капиталу и интернет-ресурсам, потенциально доступным для получения, использования и тиражирования в интернет-сообществах.
Проанализировав различные источники по проблематике данного исследования, мы полагаем, что социоструктурный анализ интернет-сообществ представляет собой научный подход, основанный на методологии сетевого анализа, важнейшим компонентом которого является выявление и анализ социальных статусов, а также расстояния между статусами пользователей внутри интернет-сообщества.
В настоящее время большой интерес применительно к социоструктурному анализу молодежных когорт в интернет-сообществах вызывают неявные сообщества в социальных сетях. Под неявными сообществами мы будем понимать скрытые социальные структуры, существующие внутри тематического интернет-сообщества. Для того чтобы определить латентное (скрытое) сообщество, необходимо осуществить разбиение графа сети на непересекающиеся между собой группы узлов, внутри каждой из которых количество связей превышает число связей, соединяющих узлы разных групп. С точки зрения дискретной математики это означает осуществление кластеризации графа, где каждый из имеющихся кластеров характеризуется повышенной плотностью ребер.
В связи с этим, а также учитывая выбор методологии social network analysis в прикладном исследовании стратификации молодежных когорт, считаем необходимым воспользоваться сетевым анализом для более объективного освещения предмета исследования.
Мы полагаем, что объективным критерием анализа статуса участника интернет-сообщества, который необходимо исследовать через критерий влияния в сообществе, является такая метрика сетевого анализа, как авторитетность (authority). Она показывает значимость данного узла в сообществе и рассчитывается на основе ссылающихся на него других узлов. Под ссылками мы будем понимать те символические действия, которые совершаются в интернет-сообществах. Наиболее распространенными из них являются «лайки» (базовое понятие в виртуальных социальных сервисах, характеризующее условное одобрение действия другого пользователя), репосты (символическое действие, предполагающее тиражирование информации, размещенной другим пользователем) и комментарии (сообщения, которые оставляют пользователи после публикации первоначального поста). Подобная активность в виртуальных сообществах также называется степенью вовлеченности.
Следующим важным критерием оценки стратификации в интернет-сообществах является центральность (centrality). Центральность отражает влияние и значимость пользователя или группы пользователей внутри интернет-сообщества.
Важным показателем критерия влияния и значимости пользователя в интернет-сообществе является центральность по собственным векторам (или центральность по посредничеству, еigenvector centrality). Эта величина представляет собой рекурсивную характеристику важности вершины, получаемую из суммы важности связанных между собой вершин. То есть это наиболее важные узлы сети, через которые другие пользователи связаны между собой.
Важным показателем неравномерности влияния в сообществе является промежуточность (betweenness), характеризующая число присутствия вершины в кратчайших путях между любыми другими вершинами. Промежуточность играет важнейшую роль в характеристике распределения потоков внутри сети. В отличие от других сетевых метрик ве1шееппез8 centrality основана на анализе прямых связей и / или близости к другим связям. Очень часто эту меру сетевого анализа связывают с леммой о рукопожатиях.
Еще одной важной характеристикой графа (интернет-сообщества), которую мы будем использовать, является его плотность (dense graph). Плотность графа показывает долю ориентированных ребер (если граф ориентированный) по отношению к общему числу возможных связей. В данном исследовании плотность графа показывает, насколько интернет-сообщество является взаимосвязанным либо же дисперсным.
Еще одним важным показателем стратификации всего сообщества, а не отдельных узлов, является такая метрика, как PageRank. Она показывает, насколько часто пользователь, переходя по ссылкам (ребрам узла), будет попадать в данный конкретный узел.
Данный показатель определяется с помощью случайного блуждания по графу. Случайный блуждающий движется по сети, перемещается на случайный узел и начинает блуждать заново. PageRank равен доле пребывания на данном конкретном узле за время блуждания. Чем он больше, тем более авторитетен узел.
Кроме указанных показателей измерения статуса участника сетевого сообщества, важными для стратификационного анализа являются образование, возраст, доход и место проживания участника интернет-сообщества.
Таким образом, основной единицей анализа в нашем исследовании являются отдельные группы узлов или связи между ними.
Отдельно следует сказать о неопросных методах сбора информации, получаемой для дальнейшего анализа, используемых в подобного рода исследованиях. Для извлечения открытой информации, пригодной для дальнейшего сетевого анализа стратификации молодежных когорт в интернет-сообществах, на объектно-ориентированном скриптовом языке программирования написаны несколько программ синтаксического анализа с использованием таких алгоритмов, как LL-анализатор, метод рекурсивного спуска и LR-анализатор.
Для визуализации и построения социальных графов интернет-сообществ может использоваться открытая среда для разработки программных средств R Studio, свободно распространяемые языки программирования и статистических вычислений R и Python 2.7. При разработке программных кодов на языке R для визуализации и построения социальных графов используются такие библиотеки (сборники подпрограмм и объектов, используемые для разработки программного обеспечения), как igraph, TM (text mining), plyr, class, RTextTools, Snowballc и т. д.
Ссылки и примечания:
1. Статья подготовлена в рамках проекта РГНФ № 15-33-01350/15 «Коммуникативная солидарность в виртуальной сфере: проблемы информационного противоборства в современных локальных конфликтах».
2. Зиммель Г. Теория конфликтного функционализма. М., 1993.
3. Дюркгейм Э. Социология и социальные науки // Дюркгейм Э. Социология. Ее предмет, метод, предназначение. М., 1995.
4. Heider F. The Psychology of Interpersonal Relations. New York, 1958.
5. Martin A., Wellman B. Social Network Analysis: An Introduction // Handbook of Social Network Analysis / ed. by P. Carrington, J. Scott. Thousand Oaks, 2011.
6. Рэдклифф-Браун А.Р. Структура и функции в примитивном обществе: очерки и лекции. М., 2001.
7. Кастельс М. Информационная эпоха: экономика, общество и культура. М., 2000.
8. Haythornthwaite C. Strong, Weak, and Latent Ties and the Impact of New Media // The Information Society. 2002. № 5 (18). P. 385-401.
9. Бондаренко С.В. Стратификация в сетевых сообществах межличностного общения // Технологии информационного общества - Интернет и современное общество : материалы Всерос. объедин. конф. Санкт-Петербург, 20-23 ноября 2001 г. СПб., 2001.