Георгий Александрович НшоллЕнко
Санкт-Петербургский государственный университет, факультет социологии; Санкт-Петербургский филиал Института истории естествознания и техники им. С. И. Вавилова РАН Санкт-Петербург, Россия e-mail: [email protected]
УДК: 316.472.45
DOI: 10.24411/2079-0910-2019-12005
Перспективы использования цифровых следов исследователей для анализа их коммуникативных стратегий (на примере социальной сети ResearchGate)
Последнее десятилетие ознаменовалось активизацией процесса распространения и интеграции практик интернет-коммуникации. Исключением не стала и сфера науки, трансформирующаяся под воздействием практик, детерминированных новым фреймом социального взаимодействия — в терминологии Барри Веллмана и Ли Рейни — социальной операционной системы (Social OS).
Специфика «племени ученых», в частности сетевой характер взаимодействия, обеспечила стремительный переход к новым коммуникационным средствам, запустив процесс цифрови-зации науки, значительно расширив потенциальный географический охват коммуникации, а также ее интенсивность.
Существующие на данный момент интернет-сервисы для ученых, в том числе специализированные социальные сети, представляют собой сложные сетевые структуры, включающие в себя несколько типов акторов и актантов, начиная от исследователей и организаций, заканчивая мероприятиями и научными текстами.
В подобных условиях социальные сети становятся источником т. н. «цифровых следов» — данных, характеризующих сетевую активность пользователя. Подобное, как правило, автоматизированное, протоколирование действий ученого в сети открывает перед исследователями новые перспективы. Можно говорить о том, что «незримая коллегия» становится осязаемой, особенно если структура социальной сети позволяет рассматривать научную коммуникацию на нескольких уровнях (например, неформальная переписка или публикационная активность). Фактически, новые социальные реалии не только открывают новые поля для исследований (в том числе big data), но и позволяют пересмотреть применимость классических методов, в частности нереактивной стратегии социального исследования. В данной статье рассматривается перспектива использования данных из академической социальной сети ResearchGate для анализа коммуникативных стратегий исследователей. Ключевые слова: социология науки, социальные сети, ResearchGate, науковедение, большие данные, big data, научная коммуникация, нереактивная стратегия, наукометрия, метрики, индикаторы, библиометрия.
Тройственная революция и ее результаты
Грядущая революция Web 3.0 напрямую затронет большую часть населения Земли, так как число активных пользователей сети Интернет уже по состоянию на 2016 г. вплотную приблизилось к половине от популяции и только в 2017 г.
увеличилось еще на четверть миллиарда пользователей. Исходя из этих данных мы можем уверенно говорить, что 2018 г. стал знаковым в истории Всемирной Сети.
Нельзя отрицать, что распространение Интернета является крайне неравномерным и зависит от множества факторов, включающих не только технологические (например, электрификация или наличие других необходимых коммуникаций), но и социальные (уровень грамотности населения, превалирующие сферы деятельности в регионе и т. д.). Следовательно, воспринимать глобальную сеть как нечто действительно всеобъемлющее еще рано.
Для развитых стран, где число индивидуальных пользователей Интернета превышает 80 % населения и продолжает расти, характерна значительно более плотная интеграция интернет-сервисов в социальное взаимодействие. Развитие в данном направлении позволяет исследователям всерьез думать о возможности смены основополагающих парадигм эмпирического исследования в рамках социологии и смежных дисциплин.
Стоит отметить, что упомянутый рост числа пользователей сети Интернет был детерминирован процессами, получившими название «тройственная революция» (Triple Revolution) благодаря работам Барри Веллмана (руководитель лаборатории NetLab в Торонто, Канада) и Ли Рейни (директор исследовательского подразделения "Internet and Technology Research" Pew Research Center, Вашингтон, округ Колумбия, США). Суть данного социального феномена сводится к значительному взаимовлиянию технологического процесса и социальных практик, благодаря чему трансформируются как отдельные практики, так и сама архитектура социального взаимодействия, «социальная операционная система». В частности, «тройственная революция» характеризуется влиянием трех технологических детерминант:
1) возникновение социальных сетей;
2) мобильная революция;
3) глобальное распространение Интернета.
Необходимо учесть, что с момента публикации книги — манифеста «тройственной революции» "Networked: The New Social Operating System" [Wellman, Rainie, 2012] прошло уже более шести лет и, следовательно, описанные в ней процессы в некоторой степени трансформировались, постепенно приближаясь к естественному завершению. Фактически концепция Тройственной революции, за исключением некоторого исторического анализа генезиса сети Интернет, представленного в книге, сконцентрирована на социологическом и социально-антропологическом анализе трансформации повседневности, детерминированной процессами, которые сейчас объединяются терминологией Web 2.0 в ее широком понимании.
В частности, данная концепция фокусируется на интеграции сетевых сервисов в системообразующие практики социального взаимодействия. Во второй половине 2000-х гг. Интернет пережил первую перестройку правил сетевого взаимодействия, состоявшую в том, что резкий рост значимости социального взаимодействия привел к появлению новых видов интернет-взаимодействия. Речь идет о появлении и молниеносном распространении социальных сетей и, если рассматривать данный процесс в более широком смысле, о размытии границ между «интернет-потребителем» и «интернет-производителем». Так, новые механизмы социального взаимодействия, ставшие возможными благодаря внедрению принципиально новых архитектур интернет-сервисов, в значительной степени расширили горизонты возможностей для пользователя, где каждый смог создавать и распространять контент. Подобное сме-
щение, невозможное на этапе Web 1.0, скорее напоминавшей цифровые вариации печатных СМИ, а также «песочницу» для узкого круга ИТ-специалистов, породило не только экспоненциальный рост объемов информации в Сети, но и сотни новых видов создания и распространения контента, коммуникации и взаимодействия.
Данные процессы были многократно усилены за счет т. н. «мобильной революции», в рамках которой произошел сдвиг, в том числе, и в практиках использования мобильных устройств. Здесь речь идет не столько о мобильных телефонах и распространении телефонии, сколько об обеспечении мобильного доступа в Сеть, а также изменении самой механики взаимодействия человека с Сетью. Этот сдвиг можно условно отсчитывать с момента появления в продаже первой модели Apple1 iPhone (9 января 2007 г.), а также запуска интернет-магазина приложений App Store (10 июля 2008 г.). Новый тренд был моментально «подхвачен» рядом крупнейших производителей электроники и ПО, а рынок мобильных устройств полностью преобразился. Уже к 5 января 2010 г. количество загрузок из App Store превысило три миллиарда, а к маю 2018 г. это число преодолело отметку в 170 миллиардов2. Таким образом, мы можем констатировать не только постоянный рост числа активных мобильных устройств (аналитики прогнозируют, что в 2019 г. количество пользователей мобильных устройств Apple превысит 1 миллиард3), но и усиление тенденции «мобилизации» Сети. Стационарные компьютеры в основном становятся нишевым продуктом, в то время как мобильные устройства, позиции которых
Рис. 1. Процент пользователей сети Интернет от населения по состоянию на январь 2018 г. Источник: отчет Global Digital 2018
1 В данном разделе мы будем использовать статистику корпорации Apple как наиболее детализированную и релевантную, так как аналогичные тенденции свойственны всем крупным игрокам рынка.
2 https://techcrunch.com/2018/05/31/ios-app-store-has-seen-over-170b-downloads-over-130b-in-revenue-since-july-2010/
3 https://www.rbc.ru/rbcfreenews/5924e5e59a7947a57fbf2a7f
постоянно укрепляются за счет разработки и внедрения все более мощных и энергоэффективных аппаратных средств, захватывают новые сегменты рынка. Вполне осязаемым стал сдвиг на рынке социальных сетей, детерминированный появлением и распространением специализированных мобильных сервисов — социальной сети Instagram, Foursquare и т. д.
Итак, как минимум два процесса, описанные Барри Веллманом и Ли Рейни, — распространение и гегемонию социальных сетей, а также «мобильную революцию» — можно считать если не завершенными, то, как минимум, находящимися в «зрелой стадии» своего развития. Что же касается повсеместного распространения Интернета, то вектор социальных трансформаций за прошедшие шесть лет остался также неизменным. На данный момент в мире насчитывается более четырех миллиардов пользователей сети Интернет и это число продолжает расти. Наиболее высокие темпы роста наблюдаются в странах Африки, где только за прошлый год число пользователей Сети увеличилось на 20 %, и тенденция сохраняется. Количество интернет-пользователей в Мали за год увеличилось в шесть раз, а в ряде других стран — таких как Бенин, Нигер, Мозамбик — этот показатель удвоился за то же время. Статистика подтверждает векторы развития «тройственной революции». Продолжающиеся процессы «мобильной революции» являются одним из главных катализаторов сетевизации населения Земли. Аналитики агентства "We Are Social" в кооперации с SMM-платформой "Hootsuite" в качестве одного из ключевых факторов роста интернет-аудитории называют появление недорогих смартфонов и доступных тарифов на мобильный интернет. Так, по данным отчета Global Digital 20184, в 2017 г. более 200 млн человек впервые стали владельцами мобильных устройств, благодаря чему теперь можно сказать, что две трети от всего населения планеты имеют мобильный телефон. Более половины от числа всех активных мобильных устройств относятся к числу «умных», то есть предоставляют доступ к Сети и, в большинстве случаев, поддерживают возможность установки дополнительного ПО. При этом уже более 60 % всех мобильных подключений к сети Интернет являются широкополосными, что позволило за год удвоить средние показатели расхода трафика по всему миру (3 Гб в месяц). Данная статистика подтверждает тенденцию продолжения глобального распространения Интернета, и, как следствие, сетевизации пользователей, которые всегда могут воспользоваться всеми возможностями теперь уже действительно «всемирной паутины».
Вышеназванный доклад подтверждает и усиление позиций социальных сетей. Так, в 2017 г. число пользователей крупнейших социальных сетей ежедневно увеличивалось примерно на один миллион человек. При этом каждый месяц в социальных сетях взаимодействовали между собой более трех миллиардов пользователей и, что немаловажно, 9 из 10 пользователей использовали при этом мобильные устройства.
Итоговая статистика выглядит следующим образом: за 2017 г. число пользователей сети Интернет достигло 4,021 млрд человек (рост — 7 %). Аудитория социальных сетей к 2018 г. насчитывает 3,196 млрд то есть 79,5 % от общего числа пользователей Сети (рост — 13 %). При этом, в 2018 г. число владельцев мобильных устройств составило 5,135 млрд человек (рост — 4 %) — примерно 67 % от всего населения Земли5.
4 https://wearesocial.com/blog/2018/01/global-digital-report-2018
5 http://www.demoscope.ru/weekly/2017/0735/barom01.php
Рис. 2. Распределение интернет-трафика в зависимости от устройства по состоянию на январь 2018 г. Источник: отчет Global Digital 2018
Концепт Социальной операционной системы (Social OS), подкрепленный наблюдением за трансформацией повседневности, представленным в книге Веллмана и Рейни, включал в себя описание тенденции все большего взаимопроникновения всех сфер социальной жизни и новых технологий. Авторы предположили, что даже в условиях, когда человек просто не хочет использовать Сеть в своей повседневной жизни, сама структура социального взаимодействия, будь то работа, досуг или учеба, ставят его перед необходимостью включения в интернет-практики. Безаль-тернативность, детерминированная внедрением новых технологий, находит свое подтверждение и в статистике. В 2018 г., согласно подсчетам, среднестатистический пользователь Интернета проводит около 6 часов в день, пользуясь устройствами и сервисами, подключенными к Сети. При этом Российская Федерация занимает в опубликованном рейтинге срединную позицию — 6 ч 27 мин, находясь между США (6:30) и Италией (6:08). Лидирующую позицию занимает Таиланд (9:38), а вот процессы сетевизации в Марокко пока не столь сильны — эта страна находится в самом конце списка со средним показателем в 2 ч 53 мин.
Очень важным является не самый заметный сдвиг, проявляющийся в переходе значительной доли интернет-коммуникации из классических социальных сетей по типу Facebook в сторону мессенджеров. В 2017 г. рост аудитории WhatsApp и Facebook Messenger в два раза превышал рост аудитории самой сети Facebook, и эта тенденция лишь усиливается. В целом, органический охват и вовлеченность в Facebook за последний год сократились по некоторым показателям на 10 %, и эта тенденция также сохраняется.
В 2017 г. число пользователей Интернета в России увеличилось на 5 млн человек (прирост — 4 %), а количество пользователей социальных сетей возросло на 9 млн (прирост — 15 %). По состоянию на 2018 г., 47 % населения РФ — пользователи
социальных сетей. Мобильным интернетом пользуется 91,4 млн человек, а доля мобильного трафика выросла на 30 % за прошедший год. Таким образом, мы можем говорить о том, что все тренды «тройственной революции» релевантны и для Российской Федерации, а региональные векторы трансформации использования Интернета соответствуют глобальным.
Трансформация групп
Новые технические средства трансформировали коммуникационные практики, которые, в свою очередь, видоизменили формы социального взаимодействия. Барри Веллман и Ли Рейни пишут о технически детерминированном преобразовании общества, произошедшем в период с середины 1980-х гг. до наших дней. В частности, Барри Веллман говорит о преобразовании группового взаимодействия в сетевое. Различные виды социальных сетей, несомненно, существовали и ранее, но повседневность практически полностью была связана с группами, носящими, как правило, локальный характер. Долгое время коммуникация человека была ограничена тем кругом лиц, который находился в зоне досягаемости, и лишь изредка, при соблюдении особых условий, возможно было его расширить, например за счет переписки. Количество социальных связей каждого отдельного человека было достаточно ограниченным, в первую очередь, за счет расстояний. Однако это являлось лишь одним из факторов, к числу которых можно отнести, например, языковой барьер или культурные особенности региона.
Трансформации, детерминированные «тройственной революцией», в значительной степени расширили потенциальный географический охват коммуникации, а также ее интенсивность. Классические социальные группы в большинстве своем преобразовались в сети, породив множество новых связей между собой. Этот процесс, по замечанию Барри Веллмана, привел к размытию групповых границ и сделал коммуникацию более гибкой и интенсивной. В частности, сетевая коммуникация многократно повысила то, что условно можно назвать коэффициентом полезного действия, не только ускорив обмен информацией и, как следствие, ресурсами, но и расширив его географию до глобальной.
В отличие от групп, социальные сети обладают совершенно иной структурой. Социальные сети, по сути, представляют собой набор узлов (в роли которых могут выступать различные акторы: люди, организации или даже что-то неодушевленное, например веб-страницы), связанных между собой некоторыми отношениями, которые, в соответствии с математической теорией графов, могут быть как направленными (односторонними), так и ненаправленными (обоюдными).
Появление термина «социальная сеть» и начало осмысления этого феномена датируются серединой XX в. Сетевой анализ базируется на теории графов, которая благодаря Хайдеру и Морено была применена в рамках социальной психологии и антропологии для изучения структуры социального взаимодействия \Heider, 1944; Ие1йег, 1946; Ие1йег, 1958]. Развитием теории стала концепция «маленького мира», более известная как «теория шести рукопожатий», предложенная в 1969 г. Траверсом и Милгрэмом. Немаловажным достижением сетевой теории стала работа Марка Грановеттера «Сила слабых связей» (1973), описывающая феномен «слабых
связей» между различными социальными группами. Дальнейшее развитие теории привело к разработке алгоритмов кластерного моделирования [Вайт, 1976] и введения основных метрик [Фримэн, 1976]. С начала 1980-х гг. сетевой анализ стал использоваться во многих социологических направлениях и смежных дисциплинах. К концу 1990-х гг. сетевой анализ уже стал крупным пластом междисциплинарных исследований. Серьезный вклад в сетевые исследования внес Альберт-Ласло Барба-ши, выявивший с помощью анализа Интернета новый класс сетей, используемый для характеристики онлайн-коммуникации — «безмасштабные сети» [ВатЬаы, 2002; ВагаЬаы, 2011; ВагаЬаи1, 2018]. Дальнейшее изучение сетей связано в большей степени с развитием специализированного ПО и с концептом больших данных, а также с переосмыслением самой структуры Сети, и особенно возможности включения разноклассовых акторов6.
В отличие от эпохи раннего Интернета, период Web 2.0 характеризуется смешением интернет-практик и повседневности, благодаря чему разделение онлайн-связей и оффлайн-коммуникации акторов становится практически невозможным [Воаъе е1 а/., 2006; ШеИшап &а1., 2006]. Однако, подобная размытость видится проблемой лишь с относительно устаревших позиций, так как невозможность различения онлайн-и оффлайн-взаимодействия, по своей сути, никак не влияет на анализ существующих социальных сетей, являющихся по своей архитектуре гибридными. Данный подход вполне релевантен в тех случаях, когда дизайн исследования не подразумевает фокуса на средствах коммуникации и затрагивает лишь структуру связей и их свойства.
Стоит отметить, что изучение сетей не сводится исключительно к сетевому анализу, сфокусированному на структуре сети — ее узлов и связей. Характер связей, их причинность и многие другие факторы могут быть изучены как с помощью классических методов, таких как интервью, опрос или фокус-группы, так и с помощью нереактивной стратегии исследования.
Цифровые следы и нереактивная стратегия исследования
Как уже было сказано ранее, архитектура Web 2.0 в значительной степени размыла границу между производителями и потребителями контента и, таким образом, на данный момент практически каждый интернет-пользователь генерирует свой контент, тем самым оставляя т. н. «цифровые следы». Подобная информация может быть очень разной и включает в себя сотни видов «следов»: от фотографий и видеороликов до комментариев, лайков, репостов и даже обычной статистики использования ресурсов. Анализ цифровых следов, в свою очередь, заставляет переосмыслить классическую нереактивную стратегию социальных исследований.
Так же как и теория социальных сетей, нереактивная стратегия социальных исследований берет начало в доцифровую эпоху. Термины «незаметное» и «нереактивное исследование» впервые были упомянуты в работе «Незаметные меры: нереактивное
6 На данный момент существует несколько парадигм понимания социальных сетей. В частности, особого внимания заслуживает постмодернистское понимание сети, представленное в рамках акторно-сетевого подхода Бруно Латура или же концепта «ризомы» Делёза— Гваттари, допускающее включение в одну сеть узлов, принадлежащих к различным классам объектов, что невозможно в рамках классического сетевого анализа.
исследование в области социальных наук» Юджина Уэбба, Дональда Кэмпбелла и Ричарда Шварца, опубликованной в 1966 г. [Webb, Campbell, Schwartz, 1966]. Предложенная концепция нереактивной стратегии исследования выстраивалась через противопоставление «заметным» опросным методикам, то есть тем видам сбора информации, которые предполагают непосредственный контакт исследователя с респондентами. По мнению сторонников нереактивной стратегии, использование анкет и интервью может оказывать негативное влияние на массив полученных данных, детерминированное возможной реакцией респондента на непривычную ситуацию участия в социологическом исследовании.
«Арсенал методов, которые предлагались читателям книги для сокращения эффекта социальной желательности респондента и иных сложностей непосредственного опроса, включал в себя наблюдение, анализ документов и данных (на момент написания работы таковыми считались съемки видеокамер и диктофонные записи), а также изучение иных физических следов человеческой деятельности. К последним могли относиться, например, уровень изношенности разметки на переходах, демонстрирующий особенность поведения пешеходов, или цветы на могилах как часть ритуальных действий» [Николаенко, Федорова, 2017, с. 39]. Разумеется, социальные реалии значительно трансформировались за полвека, прошедшие с момента написания книги, и исследователи в настоящее время имеют доступ к значительно большему количеству следов, чем раньше. Развитие технологий вызвало буквально экспоненциальный рост числа следов человеческой деятельности — от камер CCTV во всех крупнейших городах мира, данных геопозиционирования GPS и ГЛОНАСС, статистики использования банковских карт и проездных билетов и до т. н. «цифровых следов» в сети Интернет.
Родоначальником виртуального направления нереактивных исследований можно считать Раймонда Ли [Lee, 2000], описавшего в 2000 г. возможные объемы и перспективы изучения интернет-данных.
Дальнейшее развитие интернет-исследований, поддерживаемое значительным развитием как аппаратных средств, так и программного обеспечения, расширило диапазон с воспроизводства классических методов с использованием цифровых средств (например, интервью или наблюдение, используемые в рамках цифровой этнографии), до анализа огромных массивов данных — Big Data. Исследователи Дэвид Лейзер и Джейсон Редфорд [Lazer, Radford, 2017] выделили три основных типа «полей» получения Big Data: виртуальное поведение пользователей на различных платформах, оцифрованные данные государственных и частных учреждений, оцифрованные данные, полученные непосредственно путем сбора в «реальной» жизни (например, фиксация открытых и закрытых wi-fi точек на пути следования актора).
Когда следы формируют большие данные
Появление больших данных в социологии, бесспорно, является следствием «тройственной революции» и последовавшей за ней цифровизации социальности. Первые научные статьи, посвященные большим данным, были опубликованы лишь в 2009 г. [Laser et al, 2009], когда количество пользователей Facebook достигло 150 млн чел.7, а корпорация Apple выпустила в продажу уже третье поколение смарт-
7 https://lenta.ru/news/2009/01/08/facebook/
фонов iPhone. При этом стоит отметить, что большие данные не являются строго прерогативой академической науки, так как потенциал анализа подобной информации был замечен и использован при моделировании потребительского поведения в коммерческом секторе.
Почему эти данные именно «большие»? По мнению Р. Китчина, большие данные характеризуются тремя переменными: размер, разнообразие и скорость накопления. «Согласно Р. Китчину, большие данные отличаются большим объемом; высокой скоростью накопления (они создаются здесь и сейчас и их объем может увеличиваться каждую секунду); многообразием формы; исчерпывающим характером (зачастую представляют всю совокупность); высокой дискретностью (что позволяет дробить данные на отдельные группы и легко их идентифицировать); возможностью привязки к другим типам данных; гибкостью (добавлять новую информацию и расширять объем)» [Губа, 2018, с. 215]. Однако мы можем говорить о том, что «большие данные», или "big data", — это скорее собирательное название, включающее в себя любые большие объемы онлайн-контента и данные, генерируемые электронными устройствами самостоятельно, а также данные государственных ведомств, часто представляющие собой огромные, исчерпывающие массивы информации.
Более того, по мнению исследователей, одним из ключевых отличий современных больших данных и данных, полученных, например, в результате переписи населения, является то, что они генерируются самостоятельно [Connelly, Playford, Gayle, Dibben, 2016, с. 2], а не собираются с целью исследования, то есть в большей степени соответствуют логике нереактивного исследования. Таким образом, социальные науки получили доступ к «масштабным данным о поведении людей на микроуровне» [Губа, 2018, с. 216], которые должны помочь преодолеть недостатки прежних данных [Golder, Macy, 2014].
Ключевым отличием больших данных от тех массивов информации, что были доступны исследователям ранее, можно считать исчерпываемость. «Исследователи вынуждены были строить гипотезы, которые учитывали социальное влияние через сильные связи отдельных людей, что не позволяло схватывать структурные характеристики сетей» [Губа, 2018, с. 219].
В данный момент социология выделяет четыре типа исследований больших данных: анализ массивов текста средствами вычислительной лингвистики; сетевой анализ; машинное обучение и онлайн-эксперименты [McFarland, Lewis, Golberg, 2015]. При этом стоит учитывать, что данный процесс по своей сути является двухсторонним, и некоторые методологические находки из области big data могут быть использованы при анализе относительно небольших массивов данных, а возможно, и в рамках качественных микросоциологических исследований.
Сама природа больших данных определяет ряд ограничений, среди которых одним из наиболее важных является проблема доступа [Golder, Macy, 2014]. Несмотря на то, что большие данные генерируются либо государственными организациями, либо посредством взаимодействия людей в сети, либо благодаря различным техническим средствам, агрегируются они на серверах, принадлежащих различным организациям. В данном случае возможные действия исследователей ограничены не только законодательством, но и политикой самой организации. Решение о свободной публикации массивов или об их предоставлении конкретным исследовательским центрам принимается исключительно руководством организации, обладающей этими данными.
Данные можно собрать и самостоятельно, например при помощи метода web-scraping, позволяющего «выкачивать» и систематизировать данные с различных ресурсов с помощью автоматизированного использования пользовательского интерфейса, что является практически безальтернативным способом в условиях закрытого доступа к программному интерфейсу сервисов (API).
Стоит признать, что социологическая теория была не готова к столь радикальным переменам в процедурах сбора и в характере данных, что привело к некоторому расколу и даже риску «колонизации» социальных наук инженерами-аналитиками. Однако, несмотря на некоторое лоббирование «чистого» анализа больших данных, пока еще рано говорить о создании атеоретической социальной науки. В любом случае, именно появление больших данных может стать рычагом, который позволил бы социологии и смежным дисциплинам выйти из состояния теоретического и эмпирического кризиса, преодолев ряд ставших уже классическими теоретико-методологических ограничений.
Подобная перестройка теоретико-методологического основания науки не может быть проведена в столь сжатые сроки (с момента публикации манифеста Лейзера [Lazer et al., 2009] не прошло и десяти лет), однако значительные прорывы в области анализа больших данных бесспорны. Кроме изучения интернет-активности пользователей и теоретической подготовки к развитию и распространению интернета вещей (IoT), методы анализа больших данных, преимущественно текстов, активно используются в социологии науки и социологии культуры, исторически в большей степени связанных с анализом текстов (страдающих от некоторого отставания методологии от теорий).
Visible College
Научная коммуникация, еще до послевоенного информационного бума, представляла собой сложную сеть, в значительной степени менее подверженную географическим и лингвистическим ограничениям, преодолеваемым за счет переписки (ученые априори являются образованными людьми), большей социальной мобильности, а также благодаря единым языкам научной коммуникации (в различные периоды ими были греческий, латынь, французский, немецкий и т. д.).
Коммуникация в рамках сети ученых долгое время обеспечивалась преимущественно перепиской, благодаря чему была постоянной и не требовала встреч тет-а-тет. В результате появились географически разрозненные сообщества ученых, к числу которых можно отнести «Незримую коллегию» (Invisible college) — клуб английских ученых-натурфилософов середины XVII в., название которого стало нарицательным в наши дни. В частности, концепт «незримой коллегии» или «невидимого колледжа» проник в социологию науки в начале 1970-х гг.; применительно к глобальной организации научного взаимодействия этот термин был использован К. Вагнер в работе «Новый Незримый Колледж: наука для развития» [ Wagner, 2008], а также в работе К. Ширки «Когнитивный избыток» [Shirky, 2010].
Бесспорно, «тройственная революция» не могла не затронуть сферу научных коммуникаций, потенциально в значительно большей степени заинтересованную в интенсификации информационного обмена и преодолении ограничений, свой-
ственных для «эры-до-интернета». В качестве технологического ответа на социальный запрос появились специализированные интернет-сервисы — академические социальные сети (Л8К)8, созданные с целью упрощения и интенсификации обмена информацией на всех возможных уровнях формализации, от публикации научных статей и монографий до неформального общения с помощью личных сообщений. Список сервисов для ученых не исчерпывается лишь академическими социальными сетями, и отдельного внимания заслуживают международные базы научных публикаций, сервисы цитирования, сервисы управления совместными проектами, площадки для интернет-семинаров (вебинаров), а также сервисы совместного написания и редактирования текстов (хотя и на этом список не исчерпывается).
Цифровые следы ученых. Кейс социальной сети ResearchGate
Особый интерес для исследования научной коммуникации представляет сеть ResearchGate (researchgate.net). Социальная сеть Rg была запущена в 2008 г. силами докторов медицинских наук Иджада Мадиша (Ijad Madish) и Сёрена Хофмайера (Sören Hofmayer), а также специалиста в области IT Хорста Фикеншира (Horst Fickenscher).
В качестве основного функционала сервиса создатели выделяют следующие возможности9:
1. Публикация и обмен текстами и исследовательскими данными (в т. ч. изображениями, таблицами и т. д.).
2. Обеспечение связи и возможностей совместной работы с соавторами, рецензентами, коллегами и специалистами.
3. Сбор статистики, характеризующей распространение каждой конкретной работы в отдельности и крупных институтов в целом.
4. Обеспечение возможности задавать вопросы профессиональному сообществу с целью решения проблем и поиска информации.
5. Публикация вакансий и, соответственно, возможность поиска работы в научно-исследовательской сфере по всему миру посредством сайта Rg.
6. Ведение открытого журнала исследования, а также возможность свободной подписки на аналогичные материалы.
Создатели сервиса Rg пытаются достичь возможности максимально свободного обмена исследовательской информацией в соответствии с логикой открытой науки.
За 10 лет с момента запуска сервиса штаб-квартира компании переехала из Ганновера в Берлин, число сотрудников превысило 300 человек, количество пользователей преодолело отметку в 15 млн на сайт было загружено более 100 млн текстов, а «география» сервиса расширилась до 193 стран. 89 % пользователей прошли постдипломную квалификацию (postgraduate qualification), и среди них можно найти 68 лауреатов Нобелевской премии.
К сожалению, несмотря на многочисленные просьбы со стороны исследовательского сообщества, администрация Rg не предоставляет доступа к API сайта, однако в свободном доступе можно найти некоторую статистику. По состоянию на 2017 г. распределение пользователей по научным дисциплинам выглядело следующим образом:
8 Например, researchgate.net; academia.edu; mendeley.com и т. д.
9 https://www.researchgate.net/about
Рис. 3. Распределение пользователей Rg по научным дисциплинам по состоянию на 2017 г.
Мы можем видеть, что уже в 2017 г. число зарегистрированных на сайте биологов превысило отметку в 1 млн чел. С учетом возможных пересечений дисциплин (Rg позволяет указывать до трех дисциплин для каждого пользователя) это число может быть практически удвоено за счет включения в выборку биохимиков, биофизиков и представителей других смежных специальностей.
Важной особенностью использования сети Rg является возможность построения выборок уже на основе гомогенной генеральной совокупности, ранее недоступная, в том числе, и при изучении таких сайтов общей направленности, как Facebook или Twitter. Фактически, ResearchGate предоставляет пул возможностей для анализа научной коммуникации практически на всех уровнях, так как сайт дает возможность ознакомиться с подписками и подписчиками каждой страницы, статистикой публикации и ее распространения, всеми видами коммуникации, за исключением личных сообщений. Мы можем говорить о том, что «незримая коллегия» стала зримой, и в руках у социальных исследователей оказался инструмент, позволяющий зафиксировать научную коммуникацию значительной (следовательно, в большинстве случаев репрезентативной) части исследователей по всему миру.
Иными словами, Rg создает вполне осязаемый фрейм научного взаимодействия, протекающего по определенным правилам и, следовательно, генерирующего структурированные данные, пригодные для социологического анализа. Структура «научного рынка», характеризующаяся высокой конкуренцией и, в соответствии с принципами менеджеризма (new public management), управляемая при помощи калькулируемых показателей — метрик, является по своей сути главным катализатором роста популярности академических социальных сетей. Столь быстрый рост числа пользователей Rg будет со временем сбавлять темп в связи с насыщением, истощением невовлеченных социальных ресурсов10 и особенностями внутренней
10 То есть по мере регистрации большинства пользователей в сети, что, с позиций теории Барри Веллмана и Ли Рейни, является неизбежным следствием цифровизации общества в соответствии с правилами «социальной операционной системы».
социальной динамики научного мира, не подразумевающими скачкообразного роста или падения числа исследователей при сохранении существующей структуры рынка труда.
Более того, ResearchGate может выступать не только как площадка для научной коммуникации, но и как стейкхолдер, управляющий всем фреймом взаимодействия внутри сети, тем самым подталкивая исследователей к новым формам взаимодействия или же «колонизируя» те типы коммуникации, которые еще не были включены в сетевой фрейм.
Перспективы, ограничения и выводы
Говорить о тотальной цифровизации научной коммуникации еще рано, особенно в условиях Российской Федерации и на постсоветском пространстве. Однако уже сейчас сеть является одним из главных инструментов построения слабых связей и источником информации в случае, когда иные средства поиска недостаточны или неэффективны в необходимой степени. Эмпирические исследования показывают, что далеко не все пользователи сети Rg демонстрируют высокую интенсивность интернет-коммуникации [Душина, Хватова, Николаенко, 2018]. По всей видимости, это свойства достаточно продолжительного переходного периода, характеризующегося также и перестройкой основных коммуникативных практик.
Стоит учитывать, что сторонним исследователям доступны не все данные, из-за чего методология web-scraping не может зафиксировать, например, интенсивность личной переписки, поисковых запросов, редактирования страницы и чтения опубликованной информации (в т. ч. профилей, статей, форумов и т. д.). Следовательно, «нулевые» метрики не могут выступать в качестве доказательства отсутствия сетевой активности. Однако это не исключает, например, моды на т. н. веб-присутствие, то есть пассивное присутствие в сети, детерминированное не необходимостью повышения собственной заметности (visibility), а стремлением соответствовать современным трендам, продиктованным «социальной операционной системой», выстроенной в соответствии с принципами Web 2.0.
Процесс цифровой трансформации научной коммуникации продолжается. Так, например, в случае с ResearchGate, аналитические сводки свидетельствуют не только о росте числа пользователей (более 15 млн по состоянию на декабрь 2018 г.), но и о значительном росте объема трафика. В глобальном рейтинге Alexa11 социальная сеть ResearchGate занимает 123 строчку (по состоянию на 7 апреля 2019 г.) в списке наиболее популярных сайтов мира, что, с учетом академической специфики этого ресурса, — впечатляющий результат, особенно если принять во внимание скачок на 26 позиций вверх, произошедший за последние три месяца.
Помимо количественных трансформаций, академические сети также подвержены и качественным, структурным изменениям. Так, исследования Хосе Ортеги (Jose Ortega) из Высшего совета по научным исследованиям Испании выявили процесс гомогенизации ландшафта социальных сетей [Ortega, 2017], благодаря чему дисциплинарная принадлежность исследователей играет все меньшую роль в процессе выбора площадки. Этот процесс играет критически важную роль при рассмотрении
11 https://www.alexa.com/siteinfo/researchgate.net
академических социальных сетей в качестве источника данных, поскольку детерминирует формирование мультидисциплинарной генеральной совокупности, позволяющей сопоставлять коммуникативные практики исследователей из различных областей в рамках единого сервиса, тем самым нивелируя проблему учета влияния функциональных особенностей различных площадок — одного из наиболее трудно преодолимых факторов интернет-исследований последних лет.
В подобных условиях нам видится оптимальным использование площадки ResearchGate.net в качестве основного источника данных об интернет-коммуникации ученых, тем более что эта площадка часто выходит на первую строчку рейтингов в категории «Наука»; например, в сводках сервиса игтйаг^еЬ11. Более того, сайт КезеагскОа1е, в отличие от его конкурентов — Иепйе1еу и Academia.edu — изначально выстраивался как социальная сеть ученых, и публикация текстов на нем является лишь одним из возможных сценариев использования ресурса: в распоряжении пользователя есть множество вариантов коммуникативных средств.
КезеагсНОа1е находится в состоянии перманентной трансформации, постепенно изменяя, расширяя и модернизируя практически все доступные механики. Рынок цифровых сервисов отличается достаточно быстрыми темпами развития и изменения, что не позволяет нам строить долгосрочных прогнозов по поводу перспектив сетей, в том числе и В&неагсНОа1е. Однако необходимость дальнейшего изучения этого сервиса сохраняется и требует разработки более совершенных теоретико-методологических инструментов.
Вместе с тем в Сети можно найти множество коммуникативных площадок, каждая из которых потенциально представляет собой интересный кейс трансформации социального взаимодействия в рамках науки. Существует множество подходов к изучению структур и функций новых форм коммуникации, однако в рамках данного текста мы предприняли попытку показать, какие теоретико-методологические перспективы, отличные от классических социологических методов исследования, могут быть использованы в процессе осмысления сетевой коммуникации.
Литература
Душина С. А., Хватова Т. Ю., Николаенко Г. А. Академические интернет-сети: платформа научного обмена или инстаграм для ученых? (на примере ResearchGate) // Социологические исследования. 2018. № 5. С. 121-131.
Николаенко Г. А., Федорова А. А. Нереактивная стратегия: применимость незаметных методов сбора социологической информации в условиях Web 2.0 на примере цифровой этнографии и Big Data // Социология власти. 2017. Т. 29. № 4. С. 36-54.
BarabasiA.-L. Linked: The New Science of Networks. NY: Perseus Books Group, 2002. 288 p.
BarabasiA.-L. Network science. Cambridge University Press, 2018. 475 p.
Barabasi A.-L., Gulbahce N, Loscalzo J. Network Medicine // Nature Reviews Genetics. 2011. № 12. P. 56-68.
Clay Sh. Cognitive Surplus: How Technology Makes Consumers into Collaborators. London: The Penguin Press, 2010. 256 p.
Freeman L. C. The Development of Social Network Analysis: A study in the sociology of science. Vancouver: Empirical Press, 2004. 208 p.
12 https://www.similarweb.com/website/researchgate.net
Golder S. A., Macy M. W. Digital Footprints: Opportunities and Challenges for Online Social Research // Annual Review of Sociology. 2014. Vol. 40. P. 129-152.
Granovetter M. S. The Strength of Weak Ties // American Journal of Psychology. 1973. Vol. 78. № 6. Р. 1360-1380.
Heider F. Social Perception and Phenomenal Causality // Psychological Review. 1944. Vol. 51. P. 358-374.
Heider F. Attitudes and Cognitive Organization // The Journal of Psychology. 1946. Vol. 21. P. 107-112.
Heider F. The Psychology of Interpersonal Relations. Eastford: Martino Fine Books, 2015. 334 p. LaserD. et al. Computational Social Science // Science. 2009. Vol. 323. № 5951. P. 721-723. Lazer D., Radford J. Data ex Machina: Introduction to Big Data //Annual Review of Sociology. 2017. Vol. 43. P. 19-39.
LazerD., PentlandA., AdamicL., AralS., BarabasiA.-L., BrewerD., ChristakisN., Contractor N., Fowler J., Gutmann M., Jebara T., King G., Macy M., Roy D., Van Alstyne M. Computational Social Science // Science. 2009. Vol. 323. № 5915. P. 721-723.
Lee R. Unobtrusive Methods in Social Research. Buckingham: Open University Press, 2000. 192 p. McFarland D.A., Lewis K., Goldberg A. Sociology in the Era of Big Data: The Ascent of Forensic Social Science // American Sociologist. 2015. Vol. 47. № 1. P. 12-35.
Ortega J. L. Toward a homogenization of academic social sites: A longitudinal study of profiles in Academia.edu, Google Scholar Citations and ResearchGate // Online Information Review. 2017. Vol. 41. Iss. 6. P. 812-825.
Travers J., Stanley M. An Experimental Study of the Small World Problem // Sociometry. 1969. Vol. 32. № 4. P. 425-443.
Wagner С. S. The New Invisible College: Science for Development. Washington, D.C.: Brook-ings Institution Press, 2008. 157 р.
Wellman B., Rainie L. Networked: The New Social Operating System. Cambridge; L.: MIT Press, 2012. 376 p.
The Perspectives of Using Digital Traces of Researchers
for Analyzing their Communication Strategies (by the Example of the Social Network "ResearchGate")
GeoroyA. NlKOLAENKO
St. Petersburg state University, Faculty of Sociology; S. I. Vavilov Institute for the History of Science and Technology, Russian Academy of Sciences, St. Petersburg, Russia e-mail: [email protected]
The last decade was marked by the intensification of the process of dissemination and integration of Internet communication practices. The science field is being transformed under the influence of practices determined by the new frame of social interaction — according to the terminology of Barry Wellman and Lee Rainey — of the social operating system (Social OS).
The specificity of the "tribe of scientists", especially the network nature of the interaction, secured a rapid transition to new communication tools which launched the process of digitization of science and greatly expanded both potential geographical scope and intensity of communication. The currently existing internet services for scientists including specialized social networks, are complex network structures that consist of several types of actors and actants ranging from researchers and organizations to events and scientific texts. In such conditions, social networks has become a source
of so-called "digital fingerprints" which mean the data characterizing the user's network activity. This automated (as a rule) logging of actions of a scientist in the network opens up new perspectives for researchers. It can be said that the "invisible college" becomes tangible, especially if the structure of a social network allows to consider scientific communication at several levels (for example, informal correspondence or publication activity). In fact, new social realities not only open up new fields for research (including Big Data), but also allow to review the applicability of classical methods, in particular, non-reactive social research strategies.
The article discusses the prospect of using data from the ResearchGate academic social network to analyze researchers' communication strategies.
Keywords: sociology of science, social networks, ResearchGate, big data, scientific communication, unobtrusive research, non-reactive research, digital fingerprints.
References
Barabasi, A.-L. (2002). Linked: The New Science of Networks, New York, NY: Plume.
Barabasi, A.-L. (2018). Network science, Cambridge: Cambridge University Press.
Barabasi, A.-L., Gulbahce, N., Loscalzo, J. (2011). Network Medicine, Nature Reviews Genetics, no 12, pp. 56-68.
Clay, Sh. (2010). Cognitive Surplus: How Technology Makes Consumers into Collaborators, London: The Penguin Press, 256 p.
Dushina, S.A., Khvatova, T.Yu., Nikolaenko, G.A. (2018). Akademicheskiye internet-seti: plat-forma nauchnogo obmena ili instagram dlya uchenykh? (na primere ResearchGate) [Academic Internet Networks: A Platform for Scientific Exchange or Instagramm for Scientists? (The Case of ResearchGate)], Sotsiologicheskiye issledovaniya, no 5, pp. 121-131 (in Russian).
Freeman, L.C. (2004). The development of social network analysis: A study in the sociology of science. Vancouver, BC: Empirical Press.
Golder, S.A., Macy, M.W. (2014). Digital Footprints: Opportunities and Challenges for Online Social Research, Annual Review of Sociology, no 40, pp. 129-152.
Granovetter, M.S. (1973). The Strength of Weak Ties, American Journal of Psychology, vol. 78, no 6, pp. 1360-1380.
Heider, F. (1944). Social perception and phenomenal causality, Psychological Review, no 51, pp. 358-374.
Heider, F. (1946). Attitudes and Cognitive Organization, The Journal of Psychology, no 21, pp. 107-112.
Heider, F. (1958). The Psychology of Interpersonal Relations, New York, NY: John Wiley & Sons.
Laser, D., Pentland, A., Adamic, L., Aral, S., Barabasi, A. — L., Brewer, D., ... van Alstyne, M. (2009). Computational Social Science, Science, vol. 323, no 5951, pp. 721-723.
Lazer, D., Radford, J. (2017). Data ex Machina: Introduction to Big Data, Annual Review of Sociology, no 43, pp. 19-39.
Lee, R. (2000). Unobtrusive methods in social research, Buckingham: Open University Press, 192 p.
McFarland, D.A., Lewis, K., Goldberg, A. (2015). Sociology in the Era of Big Data: The Ascent of Forensic Social Science, American Sociologist, vol. 47, no 1, pp. 12-35.
Nikolaenko, G.A., & Fedorova, A.A. (2017). Nereaktivnaya strategiya: primenimost' nezamet-nykh metodov sbora sotsiologicheskoi informatsii v usloviyakh Web 2.0 na primere tsifrovoy etnografii i Big Data [Non-Reactive Strategy: Unobtrusive Methods of Gathering Sociological Information in Web 2.0 Age — Evidence from Digital Ethnography and Big Data], Sotsiologiya vlasti, vol. 29, no 4, pp. 36-54 (in Russian).
Ortega, J.L. (2017). Toward a homogenization of academic social sites: A longitudinal study of profiles in Academia.edu, Google Scholar Citations and ResearchGate, Online Information Review, vol. 41, no 6, pp. 812-825.
Shirky, C. (2010). Cognitive Surplus: How Technology Makes Consumers into Collaborators, London: The Penguin Press.
Travers, J., Milgram, S. (1969). An Experimental Study of the Small World Problem, Sociometry, no 32, 4, Dec. 1969, pp. 425-443.
Wagner, C.S. (2008). The New Invisible College: Science for Development, Washington, D.C.: Brookings Institution Press.
Wellman, B., & Rainie, L. (2012). Networked: The New Social Operating System, Cambridge; L.: MIT Press.