Вестник Томского государственного университета. 2022. № 475. С. 58-66 Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal. 2022. 475. рр. 59-67
СОЦИОЛОГИЯ И ПОЛИТОЛОГИЯ
Научная статья
УДК 316.4
аог 10.17223/15617793/475/8
ПРОЗИС-анализ: возможности оценки реакции пользователей на значимые информационные поводы в сети Интернет
Роман Викторович Голубин1, Инна Александровна Исакова2, Александр Павлович Коротышев3, Павел Павлович Рыхтик4
122, 3 4 Нижегородский государственный университет им. Н.И. Лобачевского, Нижний Новгород, Россия
1 golubin-roman@mail.ru
2 inna_isakova@mail.ru
3 aleks_korotyshev@mail.ru
4 rykhtikpavel@yandex.ru
Аннотация. Представлены возможности применения в социологических исследованиях нового метода визуализации и анализа данных - ПРОЗИС-анализа. Метод предусматривает фиксацию шести показателей сетевой активности пользователей: число постеров, репосты, охват аудитории, запросы, источники, сообщения. ПРОЗИС-анализ позволяет оценивать уровень общественного интереса к любому значимому событию, отслеживать динамику распространения информации о них в глобальной сети.
Ключевые слова: социальная активность, сетевая активность, интернет, ПРОЗИС-анализ, постинг, ин-фоповод, охват аудитории, репост
Для цитирования: Голубин Р.В., Исакова И.А., Коротышев А.П., Рыхтик П.П. ПРОЗИС-анализ: возможности оценки реакции пользователей на значимые информационные поводы в сети Интернет // Вестник Томского государственного университета. 2022. № 475. С. 59-67. (М: 10.17223/15617793/475/8
Original article
doi: 10.17223/15617793/475/8
PROZIS-analysis: The possibility of assessing users' reaction to significant newsworthy events on the internet
Roman V. Golubin1, Inna A. Isakova2, Aleksandr P. Korotyshev3, Pavel P. Rykhtik4
i,2, 3 4 Lobachevsky State University of Nizhny Novgorod (Nizhny Novgorod, Russian Federation
1 golubin-roman@mail.ru
2 inna_isakova@mail.ru
3 aleks_korotyshev@mail.ru
4 rykhtikpavel@yandex.ru
Abstract. The article discusses the possibilities of using PROZIS-analysis, a new visualization and data analysis method in sociological research. The method allows fixing six indicators of users' network activity: the number of posters, reposts, audience coverage, requests, sources, messages. PROZIS-analysis allows assessing the level of public interest in any significant event/phenomenon/process, tracking the dynamics of the dissemination of information about it in the global network, including technologies for its targeted promotion. The fixation of specific numerical values of these indicators is carried out using the toolkit of available online services. In the framework of this study, the WordStat service from Yandex was used to estimate the number of user requests. For the other five, IQbuzz, which evaluates user posts on social networks, was used. Key indicators of network activity are divided into two groups: the first - "sources", "posters" and "messages" - characterizes those who actively disseminate information and how actively new ideas are being promoted in the Internet space; the second group - "reposts", "requests" and "coverage" - is the periphery, its analysis allows judging how new ideas arouse massive interest and how actively they are assimilated by users. Data from PROZIS-analysis are used to create PROZIS-diagrams. The PROZIS-diagram is an applied visualization and express analysis tool that reflects the dynamics of the core and periphery indicators, shows their interconnections, mutual influence over time. PROZIS-diagrams are divided into diffuse ones, showing the dynamics and scale of new ideas' diffusion, and logarithmic ones, suitable for long-term analysis. Expert assessment and competent interpretation of the data of PROZIS-diagrams allows making a quick assessment of the situation; obtaining an instant "snapshot" of the dissemination of information for a specific time period; and conducting a deeper sociological analysis, taking into account the sex and age composition of posters, their average activity,
© Голубин Р.В., Исакова И. А., Коротышев А.П., Рыхтик П.П., 2022
and the ratio of activity of the nucleus and the periphery. As an example of the implementation of the method, data on the socio-political activity of users during the preparation and organization of the meeting of Vladimir Putin and Joe Biden on June 16, 2021. In general, PROZIS-analysis is suitable for assessing the level of public interest in any significant event, tracking the dynamics of the dissemination of information about it in the global network.
Keywords: social activity, network activity, Internet, PROZIS-analysis, posting, newsworthy event, audience coverage, repost
For citation: Golubin, R.V., Isakova, I.A., Korotyshev, A.P. & Rykhtik, P.P. (2022) PROZIS-analysis: The possibility of assessing users' reaction to significant newsworthy events on the internet. Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal. 475. рр. 59-67. (In Russian). doi: 10.17223/15617793/475/8
Введение. С начала XXI в. человеческая цивилизация пережила беспрецедентный скачок в развитии коммуникационных технологий, оказавший значительное влияние на все аспекты жизнедеятельности. Интернет сегодня - больше, чем просто технология коммуникации, это глобальное социальное явление, которое способно трансформировать общественные отношения с пока еще не до конца предсказуемыми последствиями.
Тем не менее цифровизация повседневной жизни стала привычной реальностью: как сообщил замглавы Минкомсвязи России Алексей Волин [1], в 2020 г. в России пользователями интернета являются около 100 млн человек из 145 млн населения. По данным отчета «Global Digital 2021» аналитического центра We Are Social и Hootsuite [2], количество пользователей в России в 2021 г. выросло до 124 млн. Современный человек стремится постоянно оставаться на связи, не отрываясь надолго от потока цифровой информации. По данным отчета «Global Digital 2021», россияне проводят в социальных сетях 2 часа 28 минут (в мировом масштабе эта цифра составляет 2 часа 25 минут) [2].
При этом сетевая активность пользователей достаточно многообразна и проявляет себя во множестве различных форм, что ставит перед социологами проблемы, связанные с исследованиями новых социальных практик, не всегда поддающихся оценке классическими, формализованными методиками. Современные средства онлайн-мониторинга, входящие в прикладной инструментарий социологии, позволяют фиксировать количественные характеристики этой активности, открывая возможности для автоматизированного сбора эмпирического материала, использования математического инструментария и формализации оценок. Однако работа с этими данными сопряжена с определенным риском. Следует учитывать, что современный интернет наполнен средствами имитации пользовательской активности. К ним можно отнести как программные средства, созданные с целью искусственного увеличения, «накрутки» просмотров, лайков и репостов, так и живых пользователей, распространяющих информацию не из личных убеждений, а с коммерческими или развлекательными целями. Все это создает в рамках исследовательской методики достаточно важный «фактор автопостинга», способный исказить итоговые показатели пользовательской активности. Соответственно, первой задачей исследователя является выбор среди обширных эмпирических данных аналитики тех ключевых показате-
лей, которые позволят объективно оценить пользовательскую активность.
Теоретико-методологические подходы. Исследования, базирующиеся на цифровых технологиях и использующие возможности сети Интернет, в социологии проводятся уже более 20 лет, а сфера их применения, тематика, методическое разнообразие огромны. Объектами изучения становятся новые социальные практики поведения в глобальной сети: интернет-занятость [3], виртуальные социальные среды [4], потребительское поведение в цифровой экономике [5], интернет-аддикции [6], социальные медиа [7] и многое другое.
Одним из значимых трендов в социологии становится обсуждение роли больших данных в организации исследований: К.Н. Горлов [8], К.С. Губа [9], В.В. Волков, Д.А. Скугаревский и К.Д. Титаев [10], А.В. Одинцов [11], Р. Китчин [12], Е.В. Смирнов [13] и др.
Появление новых социальных практик требует от социологов совершенствования классических методов исследования: «За последние 20 лет процедура проведения интервью с использованием компьютерных технологий (CAPI) и другие виды компьютеризированных и онлайн-исследований стали наиболее востребованными и обсуждаемыми методами сбора эмпирических данных в социальных науках», - считает заведующий отделом методологии и методов социологических исследований Института социологии Федерального научно-исследовательского социологического центра РАН М.С. Косолапов [14].
Однако не менее актуальным остается поиск новых возможностей исследования, например, веб-скрейпинг [15], event-analysis [16], data minig [17], Vaal (количественный контент-анализ), SkaiTwi (статистический анализ связей в «Твиттере») и Gephi (сетевой и кластерный анализ) [18]. Ведущий научный сотрудник социологического факультета МГУ им. М.В. Ломоносова А.М. Долгоруков отмечает: «Будущее за социологическими теориями с новой онтологией и методами, способными обеспечить: а) прогнозирование и дизайн социальных систем в качестве сложным образом взаимодействующих симбиозов (онлайн- и офлайн-пространств); б) сбор, генерацию и анализ данных на основе по-новому организованных наблюдений» [19].
В прогнозировании социальных систем на основе анализа метаданных интернета больших успехов достигли западные ученые. Наиболее примечательной здесь выглядит обширная исследовательская про-
грамма социальных симуляций (Social-Sim program), финансируемая управлением перспективных исследовательских проектов Министерства обороны США (DARPA) и включающая интернациональный коллектив исследователей. В 2011 г. ими была опубликована статья «Социальный консенсус через влияние идейных меньшинств» [20], в которой апробирована методика цифрового моделирования распространения общественно значимой информации в социальных сетях.
Авторы описывали диффузный механизм распространения информации, предусматривающий нелинейный характер ее проникновения в общественное сознание. Тогда речь шла лишь о построении моделей этого процесса.
Однако за 10 лет данные исследования значительно продвинулись вперед: в статье 2020 г. «Многомасштабное моделирование онлайн-медиа с помощью SocialCube» [21] описан уже автоматизированный алгоритм, способный вести сбор эмпирических данных непосредственно в социальных сетях, преобразуя их в базы данных MySQL и JSON-файлы. Это позволяет вести машинную обработку данных, хранить, оценивать и анализировать огромное количество отдельных случаев, разрабатывая на этой основе оптимальные стратегии продвижения целевой информации в социальных сетях. Это - следующий шаг от социального прогнозирования к социальному инжинирингу.
Подобный технологический уровень остается недоступным для большинства отечественных исследователей. Тем не менее задача моделирования и прогнозирования общественных процессов остро стоит и для российского общества, находящегося в фазе обширных социальных трансформаций.
Анализ сетевой активности пользователей, их реакции на новую информацию востребован во множестве областей: от маркетинговых исследований до государственного управления. Целью настоящей статьи является апробация нового метода исследования сетевой активности пользователей - ПРОЗИС-анализа, способного стать новым инструментом в арсенале академической науки и экспертизы.
Аббревиатура ПРОЗИС отражает шесть основных количественных параметров, на которые опирается метод: постеры, репосты, охват, запросы, источники, сообщения. Они довольно объективно отражают активность интернет-аудитории и хорошо дополняют друг друга в рамках корреляционного анализа.
Сетевая активность пользователей достаточно многообразна, и можно предложить и другие метрики из обширного арсенала интернет-маркетинга: ER -индекс вовлеченности, ERR - индекс вовлеченности по охвату, AR - коэффициент виральности (рассчитываемый по различным показателям) и др. Однако эти инструменты адаптированы под оценку эффективности продаж и разработку маркетинговых стратегий, они оценивают не столько масштаб распространения информации, ее востребованность и резонанс-ность, сколько эффективность усилий по ее продвижению.
Из методики ПРОЗИС-анализа также исключен показатель «количество лайков», так как они наиболее подвержены искусственной раскрутке, что в значительной мере нарушает объективность данных. Однако отметим, что любые дополнительные метрики могут привлекаться к ПРОЗИС-анализу на всех трех этапах его экспертной оценки. Не входя в число основных показателей, они, тем не менее, способны повысить эффективность метода в том случае, если соотносятся с объектом исследования.
Рассмотрим шесть основных показателей подробнее:
1. Уникальные источники - число некомпилиро-ванных текстов, опубликованных по изучаемой тематике в заданный период времени. Учитываются как публикации интернет-СМИ, так и достаточно крупные тексты пользователей, например в блогах.
Данный показатель отражает, во-первых, заинтересованность активных интернет-постеров в тематике, а во-вторых, их готовность создавать по ней уникальный контент. Как правило, таких уникальных источников относительно немного, однако именно они дают начало распространению информации в сети, запускают диффузный механизм. Именно эти тексты служат основой для последующего копирования, репоста и рефлексии пользователей, они задают рациональное и чувственное восприятие новой информации.
Кроме того, этот показатель практически свободен от влияния автопостинга. Нейросетевые алгоритмы, способные генерировать связный уникальный текст, пока несовершенны и не используются для создания интернет-новостей. Если уникальный текст появляется, то можно утверждать, что его создал человек с личным или коммерческим мотивом.
2. Постеры - число аккаунтов, от лица которых были опубликованы сообщения по изучаемой тематике. Отражает заинтересованность рядовых интернет-пользователей в изучаемой тематике, а также масштабы распространения информации о ней. Строго говоря, общее число постеров включает себя также и уникальные источники. Однако люди редко создают уникальный контент, предпочитая просто копировать текст, привлекший их внимание. Поэтому число постеров, как правило, кратно превышает число источников.
Из всех отслеживаемых параметров этот наиболее подвержен влиянию автопостинга. В настоящее время достаточно распространены программные средства, позволяющие одному человеку одновременно вести переписку от лица нескольких пользователей. Активность этих «мультиаккаунтов» может искажать общую статистику, поскольку будет фиксироваться больше постеров, чем существует реальных пользователей (а тематика будет казаться популярнее). Впрочем, факт использования «мультиаккаунтов» сам по себе говорит о том, что некто предпринимает усилия по раскрутке данной тематики, т.е. она действительно становится популярнее.
3. Запросы - число запросов по изучаемой тематике, вводимых пользователями в поисковые интернет-сервисы. Отражает заинтересованность интернет-
сообщества в проблеме, стремление отслеживать ситуацию, целенаправленно искать новую информацию.
Это объективный показатель, поскольку люди вводят в поисковую строку только то, что востребовано, а целенаправленной «накруткой» или фальсификацией поисковых запросов (в отличие от постеров или просмотров) никто не занимается.
Определенной сложностью для данного показателя является сбор эмпирических данных. Проблема заключается в том, что онлайн-сервисы, ведущие мониторинг запросов, не предоставляют данные мгновенно. Так, сервис WordStat, анализирующий запросы в наиболее популярном в России поисковике Яндекс, предоставляет данные с задержкой на 1 месяц. Поэтому использовать этот показатель для экспресс-анализа не представляется возможным.
4. Охват аудитории - число пользователей, которые могли увидеть контент по изучаемой тематике (в публикациях интернет-СМИ, постах и лентах пользователей, комментариях к новостям и пр.). Данный показатель позволяет судить о масштабах распространения информации, ее способности затрагивать незаинтересованного пользователя, который не ищет ее целенаправленно.
Охват не аналогичен числу просмотров - встретив в сети информацию по изучаемой тематике, пользователь может и игнорировать ее. Тем не менее информация, обладающая широким охватом, всегда находится в «одном клике» от огромного числа пользователей. Она заполняет ленты и группы социальных сетей, комментарии под новостями, агрегаторы и форумы.
5. Репосты - число случаев, когда пользователи самостоятельно публикуют найденную информацию по изучаемой тематике на своих интернет-площадках (в группах, лентах, комментариях и др.). Отражает стремление пользователей делиться полученной информацией, распространять ее по доступным каналам. Репост - наиболее простой и часто применяемый метод тиражирования информации.
К сожалению, простота данного метода открывает широкие возможности для автопостинга. Репост разного рода информации осуществляют как реальные пользователи (в интересах коммерческих компаний и политических групп), так и программные средства. Тем не менее репост играет ключевую роль в работе диффузного механизма и его обязательно нужно отслеживать.
6. Сообщения - число текстовых сообщений, содержащих ключевые слова по изучаемой тематике. Показатель позволяет отследить масштаб распространения информации в сети, причем отслеживаются именно пользовательские сообщения социальных сетей, а не, к примеру, тексты официальных сайтов.
Число сообщений, несомненно, является основным показателем популярности тематики. Однако сам по себе он недостаточно информативен. Для создания полноценной научной картины распространения информации в сети требуется установить соотношение числа сообщений с другими показателями.
Фиксация конкретных числовых значений этих показателей ведется при помощи инструментария
доступных онлайн-сервисов. В рамках настоящего исследования для оценки числа пользовательских запросов использовался сервис WordStat [22] от компании Яндекс. Для остальных пяти - сервис [23], оценивающий пользовательские сообщения в социальных сетях. Существуют и другие подобные сервисы, однако они зачастую имеют более узкую сферу применения (к примеру, специализируются на интернет-СМИ) или низкую доступность.
Ключевые показатели сетевой активности можно разделить на две группы.
Первая - «источники», «постеры» и «сообщения» - характеризует тех, кто активно распространяет информацию. Зарождаясь в уникальных текстах источников, информация попадает к постерам, активно распространяющим ее посредством сообщений. Рост числа источников, постеров и сообщений, при стандартных условиях, предшествует росту репостов, запросов и просмотров и прямо стимулирует его. Поэтому эту группу вполне можно считать «информационным ядром» - центром распространения информации, по активности которого можно судить о том, насколько активно новые идеи продвигаются в интернет-пространстве.
Вторая группа показателей - «репосты», «запросы» и «охват» - вторична по отношению к первой. Усваивая новую информацию из СМИ, групп и лент социальных сетей, от активных блогеров, пользователи начинают интересоваться темой, читать и репо-стить материалы по ней. Показатели этой группы можно со всем основанием назвать периферией. Их анализ позволяет судить о том, как новые идеи вызывают массовый интерес и насколько активно усваиваются пользователями. Таким образом, если отбросить синергетические связи между ядром и периферией (которые, безусловно, существуют и требуют отдельного изучения), ядро распространяет информацию, а периферия ее усваивает.
Для корректного отображения, доступной визуализации и последующей оценки этих показателей имеет смысл ввести форму их графического изображения. Представляется, что этим целям может с успехом служить лепестковая диаграмма, на каждой из осей которой отображен один из ключевых показателей, или ПРОЗИС-диаграмма.
ПРОЗИС-диаграмма - прикладной инструмент визуализации и экспресс-анализа. Она отражает динамику показателей ядра и периферии, позволяет видеть их взаимосвязи, взаимовлияние с течением времени.
В качестве примера приведем данные о социально -политической активности пользователей в период подготовки и организации встречи В.В. Путина и Д. Байдена 16 июня 2021 г. Для составления ПРОЗИС-диаграммы собраны данные от 17 июня 2021 г. (табл. 1, рис. 1).
Заметно, что информация о встрече В. В. Путина и Д. Байдена была доступна широкой аудитории - охват составил 4 882 331 пользователя. Однако заметную сетевую активность проявила лишь небольшая группа пользователей - 101 источник и 1 230 постеров, которые и задали дискурс обсуждения. У основной массы
пользователей уровень интереса низкий, они готовы знакомится с материалами, но их интерес не приводит к активным действиям - репостам и запросам.
Т а б л и ц а 1
ПРОЗИС-показатели по запросу «Встреча В.В. Путина и Д. Байдена» от 17 июня 2021 г.
Показатель Значение
Уникальные источники 101
Постеры 1 230
Запросы 77 218
Охват 4 882 331
Репосты 324
Сообщения 2 500
исчисляются десятками, а охват - десятками миллионов. Тем не менее разная разметка осей делает ее неудобной для отслеживания долгосрочных процессов (когда один показатель может колебаться от сотен тысяч до единиц) и научного анализа, что делает диаграмму не универсальной. Так, для корректного отображения данных нужно менять шаг разметки для разных осей.
Т а б л и ц а 2
ПРОЗИС-показатели по запросу «Встреча В.В. Путина и Д. Байдена» от 15 и 17 июня 2021 г.
Показатель 15 июня 2021 г. 17 июня 2021 г.
Уникальные источники 76 100 101 132,8947368
Постеры 403 100 1 230 305,2109181
Запросы 12 807 100 12 807 100
Охват 1 434 644 100 4 882 331 340,3165524
Репосты 84 100 324 385,7142857
Сообщения 757 100 2500 330,2509908
Рис. 1. ПРОЗИС-диаграмма «Встреча В.В. Путина и Д. Байдена», данные от 17 июня 2021 г., 6 параметров
Если сопоставить данные за два дня: 15 июня 2021 г. (накануне встречи) и 17 июня 2021 г. (после встречи) (табл. 2), то можно зафиксировать другой эффект. Число уникальных источников (обычно это аккаунты СМИ или политически ангажированные пользователи) изменилось незначительно: с 76 до 101. При этом число постеров, которых действительно волнуют внешнеполитические события и которые готовы их обсуждать, выросло в три раза (рис. 2). Таким образом, СМИ удалось привлечь к встрече внимание активных интернет-пользователей, которые продолжили ее раскрутку самостоятельно. Далее распространение информации происходило уже без наращивания активности СМИ.
Таким образом, ПРОЗИС-диаграмма позволяет проводить сопоставительный анализ разных временных периодов по шести ключевым показателям сетевой активности. Этот тип диаграммы пригоден для быстрой оценки и презентации данных. Назовем его диффузной ПРОЗИС-диаграммой. Он хорошо показывает динамику и масштабы диффузии новых идей, демонстрирует, как из небольшого числа источников и постеров возникает массовый охват миллионной аудитории.
Заметной проблемой здесь является разметка шкал. Шесть выбранных параметров на практике могут иметь числовые показатели совершенно разного порядка, когда, к примеру, уникальные источники
Рис. 2. Диффузная ПРОЗИС-диаграмма «Встреча В.В. Путина и Д. Байдена», данные от 15 и 17 июня 2021 г.
В том случае, когда речь идет о глубоком анализе информационных процессов и распространении в обществе значимых идей, имеет смысл использовать логарифмическую шкалу, в которой длина отрезка пропорциональна логарифму отношения величин на его концах.
Представляется, что логарифмическая ПРОЗИС-диаграмма более пригодна для долгосрочного анализа и создает более объективную научную картину распространения информации в сети. На ее поле можно отразить (а затем сопоставить) результаты замеров по одной тематике в разные временные периоды. Впрочем, она не столь доступна и не слишком подходит для презентации результатов в неакадемической среде. Приведем в пример логарифмическую ПРОЗИС-диаграмму по данным табл. 1, характеризующей общественный интерес во встрече В.В. Путина и Д. Байдена (рис. 3.).
Экспертная оценка и грамотная интерпретация данных ПРОЗИС-диаграммы позволяют выявлять особенности распространения информации в интернете. При этом существует возможность оперативной оценки ситуации, получения мгновенного «снимка» распространения информации за конкретный времен-
ной период, а также возможность более глубокого социологического анализа с учетом половозрастного состава постеров, их средней активности, соотношения активности ядра и периферии и др.
Аналитическую работу с указанными показателями имеет смысл разделить на три уровня: уровень экспресс-анализа, уровень корреляционного анализа, уровень многофакторного анализа.
1-й уровень, экспресс-анализ, предполагает работу с 5 параметрами: постеры, репосты, охват, источники, сообщения (рис. 4). Шестой параметр - запросы, как уже отмечалось, становится доступен в онлайн-сервисах только через месяц обработки данных и, в большинстве случаев, не доступен для экспресс-анализа.
Рис. 3. Логарифмическая ПРОЗИС-диаграмма «Встреча В.В. Путина и Д. Байдена», данные от 15 и 17 июня 2021 г.
Рис. 4. ПРОЗИС-диаграмма встреча «В.В. Путина и Д. Байдена», данные от 17 июня 2021 г., 5 параметров
В случае, когда есть возможность дождаться данных по пользовательским запросам, можно применить и шестиосевую ПРОЗИС-диаграмму (см. рис. 1).
К примеру, большое количество источников говорит о том, что тема заинтересовала сразу множество пользователей и Интернет-СМИ, с большой вероятностью действующих независимо друг от друга.
Небольшое число источников, напротив, указывает на несколько отдельных центров распространения информации, которые пытаются организовать ее вброс в информационное пространство, как в примере
исследования интереса пользователей к встрече В.В. Путина и Д. Байдена.
Число постеров демонстрирует, насколько пользователи вовлечены в обсуждение темы или стремятся распространять новые идеи. Сообщения, собственно, и содержат в себе информацию об исследуемой теме, отражают ее распространенность в конкретный момент времени. Запросы и охват - объективный показатель общественного интереса к теме, а репосты дополнительно характеризуют стремление рядовых пользователей продвигать ее в информационном пространстве. Сведенные вместе, эти показатели создают
общую картину распространения информации в сети в момент времени, что, собственно, и составляет суть экспресс-анализа.
2-й уровень, корреляционный анализ, ставит своей целью сопоставление показателей ядра и периферии, а также их экспертную оценку.
К примеру, ограниченное число источников при большом количестве постеров и широком охвате говорит о том, что тему продвигают влиятельные ме-диафигуры, чье мнение с готовностью транслируют многочисленные сторонники. Приведем пример: в эфире «Матч ТВ» обсуждался чемпионат Евро-2020, где ведущий шутил над гостьей, та в ответ устроила истерику, возник скандал. История вызвала резонанс в среде шоу-бизнеса, и многие его представители сочли своим долгом сделать публикацию в поддержку того или иного участника конфликта. СМИ в течение длительного времени обсуждали эту историю (табл. 3, рис. 5).
В результате наблюдается большое число источников, постеров и сообщений при низком охвате и немногочисленных запросах, что позволяет предположить, что тема усиленно продвигалась в информационное пространство заинтересованными силами, но ответного интереса у интернет-аудитории не получила, несмотря на приложенные усилия.
Т а б л и ц а 3
ПРОЗИС-показатели по запросу «Скандал О. Бузовой и Д. Губерниева», данные от 24 июня 2021 г.
Показатель Значение
Уникальные источники 19
Постеры 274
Запросы 99 039
Охват 7 047 825
Репосты 2 096
Сообщения 384
общественного резонанса. 22 июня 2021 г. надпись дополнили, и она приняла вид «SOS. Путин». В тот же день фамилию президента убрали (скосили), однако эти события уже не остались незамеченными.
ПРОЗИС-анализ позволяет отследить, как 16 пользователям (источникам), для которых и была актуальна данная проблема, удалось за один день создать охват в 4 921 пользователя по вопросу, который ранее никого не волновал.
В любом случае корреляционный анализ, опираясь на ПРОЗИС-диаграмму, требует экспертной оценки, учета социально-политического (а порой экономического, культурного или другого) контекста, обстоятельств и факторов, под действием которых тематика продвигалась в информационном пространстве табл. 4). Не исключено, что сходные показатели ПРОЗИС-диаграммы могут, в разном социальном контексте, свидетельствовать о разных процессах и явлениях (рис. 6).
Т а б л и ц а 4 ПРОЗИС-показатели по запросу «SOS. ПУТИН», данные от 23 июня 2021 г.
Показатель Значение
Уникальные источники 16
Постеры 61
Запросы 140
Охват 4 921
Репосты 29
Сообщения 121
уникальные источники 10000
сообщения
репосты
постеры
запросы
Рис. 5. ПРОЗИС-диаграмма «Скандал О. Бузовой и Д. Губерниева», данные от 24 июня 2021 г., 6 параметров
Многочисленные запросы и репосты, при небольшом числе уникальных источников и относительно немногочисленных постерах, могут указывать на попытки СМИ замалчивать актуальную для общества тему. Приведем пример: в Нижнем Новгороде на поле около недостроенного ЖК «Новинки Smart Sity» в начале июня появилась надпись «SOS» - так обманутые дольщики попытались привлечь внимание властей к своим проблемам. Это не вызвало заметного
Рис. 6. ПРОЗИС-диаграмма «SOS. ПУТИН», данные от 23 июня 2021 г., 6 параметров
3-й уровень, многофакторный анализ, предполагает более глубокое изучение шесть основных характеристик, в том числе с использованием расширенных эмпирических данных.
В качестве примера можно привести такой показатель, как «среднее число сообщений на постер» (автоматически рассчитывается сервисом IQbuzz). Чем выше данный показатель, тем более сплоченная и мотивированная группа людей работает над раскруткой тематики. Рядовой пользователь, заинтересовавшийся темой в ходе обычного интернет-серфинга, редко пишет более 2-3 сообщений (в усредненных показателях). Большая активность, помимо искреннего интереса, может также говорить об идеологической ангажированности или коммерческом интересе.
Сопоставление динамики таких показателей, как «источники», «постеры» и «сообщения», позволяет судить о виральности исследуемой тематики. Виральность - это готовность пользователя создавать собственный контент
на основе найденного в сети. Если рост числа постеров влечет за собой рост также числа сообщений и уникальных источников, тематика стала столь популярной, что распространяется самими пользователями.
Заключение. Предложенный метод ПРОЗИС-анализа позволяет оценивать общественную реакцию на значимые информационные поводы путем анализа сетевой активности пользователей.
Метод основан на анализе шести параметров: число постеров и репостов, охват аудитории, запросы в поисковых системах, уникальные текстовые источники и сообщения. Эти показатели достаточно объективно отражают активность интернет-аудитории и хорошо дополняют друг друга в рамках корреляционного анализа. Поэтому метод позволяет как оперативно оценивать реакцию общества на значимые информационные поводы (уровень экспресс-анализа), так и отслеживать глубинные процессы трансформации общественного сознания (уровень
многофакторного анализа). Он может найти применение в академической науке, исследующей изменения в общественном восприятии, пути и методы распространения информации в современном обществе, теорию и практику общественной коммуникации. Не менее полезным он может стать и для экспертов-практиков, работающих в сфере маркетинговых исследований.
Метод, как и многие интернет-методики социологических исследований, имеет специфические ограничения, связанные с чистотой выборки, техническими возможностями сервисов сбора данных, фактором автопостинга и пр. Однако представляется, что в российской науке, в отличие от западной, возможности глобальной сети в недостаточной мере используются для анализа социальных процессов. Это актуализирует деятельность по разработке и апробации новых исследовательских методов, одним из которых и может стать ПРОЗИС-анализ.
Список источников
1. Замглавы Минкомсвязи назвал число пользователей Интернета в России // МИА «Россия сегодня» : официальный сайт. URL:
https://ria.ru/20200830/internet-1576488498.html (дата обращения: 10.07.2021).
2. Global Digital 2021 // We Are Social : официальный сайт. URL: https://wearesocial.com/blog/2021/01/digital-2021-the-latest-insights-into-the-
state-of-digital (дата обращения: 10.07.2021).
3. Хусяинов Т.М. Идентичность самозанятых интернет-работников // Вестник Нижегородского университета им. Н.И. Лобачевского. Серия:
Социальные науки. 2017. № 1 (45). С. 127-131.
4. Васенина И.В., Прончев Г.Б. Виртуальные социальные среды как инструмент мотивации молодежи к общественно-политической
деятельности // Социодинамика. 2018. № 4. С. 1-11.
5. Алимова А.А. Особенности потребительского поведения современных пользователей интернет-среды // Ученые записки Крымского
инженерно-педагогического университета. Серия: Педагогика. Психология. 2017. № 4 (10). С. 24-28.
6. Колесниченко М.Б., Колупаева В.В. Социальные аспекты интернет-зависимости молодежи // Вестник Пермского национального
исследовательского политехнического университета. Социально-экономические науки. 2017. № 1. С. 97-105.
7. Мельникова Н.И. Метрики социальных медиа как социальный капитал // Вестник Саратовского государственного технического
университета. 2012. Т. 4, № 1 (68). С. 253-258.
8. Горлов К.Н. Социально-политические вызовы больших данных // Социально-политические науки. 2019. № 6. С. 32-37.
9. Губа К.С. Большие данные в исследовании науки: новое исследовательское поле // Социологические исследования. 2021. № 6. С. 24-33.
10. Волков В.В., Скугаревский Д.А., Титаев К.Д. Проблемы и перспективы исследований на основе big data (на примере социологии права) // Социологические исследования. 2016. № 1 (381). С. 48-58.
11. Одинцов А.В. Социология общественного мнения и вызов big data // Мониторинг общественного мнения: экономические и социальные перемены. 2017. № 3 (139). С. 30-43
12. Китчин Р. Большие данные, новые эпистемологии и смена парадигм // Социология: методология, методы, математическое моделирование. 2017. № 44. С. 111-152.
13. Смирнов Е.В. Описание проблемы обработки и использования результатов анализа больших данных (big data) // Информационно-экономические аспекты стандартизации и технического регулирования. 2018. № 6 (46). С. 9.
14. Терентьев Е.А., Мавлетова А.М., Косолапов М.С. Интервьюирование с помощью компьютерных технологий в лонгитюдных обследованиях домохозяйств // Мониторинг общественного мнения: Экономические и социальные перемены. 2018. № 3. С. 47-64.
15. Вилкова О.В. К вопросу о научной осмысленности применения веб-скрейпинга как метода сбора данных в социологических исследованиях // Вестник Томского государственного университета. Философия. Социология. Политология. 2020. № 54. С. 163-175.
16. Олешкова А.М. Интернет-мем как предмет социологического исследования: возможности применения метода событийного анализа (event-analysis) // Общество: социология, психология, педагогика. 2020. № 10 (78). С. 54-57.
17. Мальцева А.В., Шилкина Н.Е., Махныткина О.В. Data minig в социологии: опыт и перспективы проведения исследования // Социологические исследования. 2016. № 3 (383). С. 35-44.
18. Крыштановская О.В. Бесконтактная социология: новые формы исследований в цифровую эпоху // Цифровая социология. 2018. Т. 1, № 1. С. 4-8.
19. Долгоруков А.М. Интернет и будущее социологии // Мониторинг общественного мнения: экономические и социальные перемены. 2015. № 2 (125). С. 32-43. doi: 10.14515/monitoring.2015.2.03
20. Xie J., Sreenivasan S., Korniss G., Zhang W., Lim C., Szymanski B.K. Social consensus through the influence of committed minorities // Physical Review E. 2011. Vol. 84. Art. 011130.
21. Abdelzaher Т., Han J., Hao Y., Jing A., Liu D., Liu S., Nguyen H.H., Nicol D.M., Shao H., Wang T., Yao S., Zhang Y., Malik O., Dipple S. Flamino J., Buchanan F., Cohen S., Korniss G., Szymanski B.K. Multiscale online media simulation with SocialCube // Computational and Mathematical Organization Theory. 2020. Vol. 26. P. 145-174. doi: 10.1007/s10588-019-09303-7
22. Wordstat: подборка слов Яндекс. URL: https://wordstat.yandex.ru/ (дата обращения: 01.04.2021).
23. IQbuzz: сервис мониторинга социальных медиа- и онлайн-СМИ. URL: https://www.iqbuzz.pro/ (дата обращения: 01.04.2021).
References
1. MIA Rossiya segodnya. (2020) Zamglavy Minkomsvyazi nazval chislo pol'zovateley Interneta v Rossii [The Deputy Head of the Ministry of
Telecom and Mass Communications named the number of Internet users in Russia]. MIA Rossiya segodnya. [Online] Available from: https://ria.ru/20200830/internet-1576488498.html (Accessed: 10.07.2021).
2. We Are Social. (2021) Global Digital 2021. [Online] Available from: https://wearesocial.com/blog/2021/01/digital-2021-the-latest-insights-into-
the-state-of-digital (Accessed: 10.07.2021).
3. Khusyainov, T.M. (2017) Identity of self-employed e-workers. Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. Seriya: Sotsial'nye
nauki — Vestnik of Lobachevsky State University of Nizhni Novgorod. Series: Social Sciences. 1 (45). pp. 127-131. (In Russian).
4. Vasenina, I.V. & Pronchev, G.B. (2018) Post-graduate student, the department of Source Studies, Moscow State University. Sotsiodinamika —
Sociodynamics. 4. pp. 1-11. (In Russian). DOI: 10.25136/2409-7144.2018.4.2597
5. Alimova, A.A. (2017) Features of consumer behavior of modern users of the internet environment. Uchenye zapiski Krymskogo inzhenerno-
pedagogicheskogo universiteta. Seriya: Pedagogika. Psikhologiya. 4 (10). pp. 24-28. (In Russian).
6. Kolesnichenko, M.B. & Kolupaeva, V.V. (2017) Social aspects of the youth internet-dependence. Vestnik Permskogo natsional'nogo
issledovatel'skogo politekhnicheskogo universiteta. Sotsial'no-ekonomicheskie nauki — PNRPU Sociology and Economics Bulletin. 1. pp. 97105. (In Russian). DOI: 10.15593/2224-9354/2017.1.8
7. Mel'nikova, N.I. (2012) Social media metrics as the social capital. Vestnik Saratovskogo gosudarstvennogo tekhnicheskogo universiteta. 4-1 (68).
pp. 253-258. (In Russian).
8. Gorlov, K.N. (2019) Social-political big data challenges. Sotsial'no-politicheskie nauki — Sociopolitical Sciences. 6. pp. 32-37. (In Russian).
9. Guba, K.S. (2012) Big Data in studies of science: new research field. Sotsiologicheskie issledovaniya. 6. pp. 24-33. (In Russian). DOI:
10.31857/S013216250013878-8
10. Volkov, V.V., Skugarevskiy, D.A. & Titaev, K.D. (2016) Problems and prospects for studies based on big data (the case of sociology of law).
Sotsiologicheskie issledovaniya. 1 (381). pp. 48-58. (In Russian).
11. Odintsov, A.V. (2017) Sociology of public opinion and the big data challenge. Monitoring obshchestvennogo mneniya: Ekonomicheskie i sotsial'nye peremeny — Monitoring of Public Opinion: Economic and Social Changes. 3 (139). pp. 30-43. (In Russian). DOI: 10.14515/monitoring.2017.3.04
12. Kitchin, R. (2017) Big data, new epistemologies and paradigm shifts. Sotsiologiya: metodologiya, metody, matematicheskoe modelirovanie — Sociology: Methodology, Methods, Mathematical Modeling (4M). 44. pp. 111-152. (In Russian).
13. Smirnov, E.V. (2018) Description of the problem of processing and using the results of the analysis of big data (big data). Informatsionno-ekonomicheskie aspekty standartizatsii i tekhnicheskogo regulirovaniya. 6 (46). P. 9. (In Russian).
14. Terent'ev, E.A., Mavletova, A.M. & Kosolapov, M.S. (2018) Computer assisted personal interviewing for longitudinal household studies. Monitoring obshchestvennogo mneniya: Ekonomicheskie i sotsial'nye peremeny — Monitoring of Public Opinion: Economic and Social Changes. 3. pp. 47-64. (In Russian). DOI: 10.14515/monitoring.2018.3.03
15. Vilkova, O.V. (2020) Web scraping as a method of data extraction in sociological studies: on scientific applicability. Vestnik Tomskogo gosudarstvennogo universiteta. Filosofiya. Sotsiologiya. Politologiya — Tomsk State University Journal of Philosophy, Sociology and Political Science. 54. pp. 163-175. (In Russian). DOI: 10.17223/1998863X/54/16
16. Oleshkova, A.M. (2020) Internet meme as the subject of social studies: opportunities of event analysis application. Obshchestvo: sotsiologiya, psikhologiya, pedagogika. 10 (78). pp. 54-57. (In Russian). DOI: 10.24158/spp.2020.10.8
17. Mal'tseva, A.V., Shilkina, N.E. & Makhnytkina, O.V. (2016) Data mining sociology: experience and outlook for research. Sotsiologicheskie issledovaniya. 3 (383). pp. 35-44. (In Russian).
18. Kryshtanovskaya, O.V. (2018) Contactless sociology: new forms of research in a digital age. Tsifrovaya sotsiologiya — Digital Sociology. 1 (1). pp. 4-8. (In Russian). DOI: 10.26425/2658-347X-2018-1-4-8
19. Dolgorukov, A.M. (2015) Internet and prospects of sociology. Monitoring obshchestvennogo mneniya: Ekonomicheskie i sotsial'nye peremeny — Monitoring of Public Opinion: Economic and Social Changes. 2 (125). pp. 32-43. (In Russian). DOI: 10.14515/monitoring.2015.2.03
20. Xie, J. et al. (2011) Social consensus through the influence of committed minorities. Physical Review E. 84. Art. 011130.
21. Abdelzaher, T., et al. (2020) Multiscale online media simulation with SocialCube. Computational and Mathematical Organization Theory. 26. pp.
145-174. DOI: 10.1007/s10588-019-09303-7
22. Yandex Wordstat. (n.d.) [Online] Available from: https://wordstat.yandex.ru/ (Accessed: 01.04.2021). (In Russian).
23. IQbuzz: servis monitoringa sotsial'nykh media i onlayn-SMI [IQbuzz: social media and online media monitoring service]. (n.d.) [Online] Available from: https://www.iqbuzz.pro/ (Accessed: 01.04.2021).
Информация об авторах:
Голубин Р.В. - канд. ист. наук, декан факультета социальных наук, зав. кафедрой социальной безопасности и гуманитарных технологий Нижегородского государственного университета им. Н.И. Лобачевского (Нижний Новгород, Россия). E-mail: golubin-roman@mail.ru
Исакова И.А. - канд. социол. наук, доцент кафедры общей социологии и социальной работы Нижегородского государственного университета им. Н.И. Лобачевского (Нижний Новгород, Россия). E-mail: inna_isakova@mail.ru Коротышев А.П. - канд. ист. наук, доцент кафедры социальной безопасности и гуманитарных технологий Нижегородского государственного университета им. Н.И. Лобачевского (Нижний Новгород, Россия). E-mail: aleks_korotyshev@mail.ru Рыхтик П.П. - старший преподаватель кафедры социальной безопасности и гуманитарных технологий Нижегородского государственного университета им. Н.И. Лобачевского (Нижний Новгород, Россия). E-mail: rykhtikpavel@yandex.ru
Авторы заявляют об отсутствии конфликта интересов.
Information about the authors:
R.V. Golubin, Cand. Sci. (History), Dean of the Faculty of Social Sciences, Head of the Department of Social Security and Humanitarian Technologies, Lobachevsky State University of Nizhny Novgorod (Nizhny Novgorod, Russian Federation). E-mail: golubin-roman@mail.ru
I.A. Isakova, Cand. Sci. (Sociology), associate professor, Lobachevsky State University of Nizhny Novgorod (Nizhny Novgorod, Russian Federation). E-mail: inna_isakova@mail.ru
A.P. Korotyshev, Cand. Sci. (History), associate professor, Lobachevsky State University of Nizhny Novgorod (Nizhny Novgorod, Russian Federation). E-mail: aleks_korotyshev@mail.ru
P.P. Rykhtik, senior lecturer, Lobachevsky State University of Nizhny Novgorod (Nizhny Novgorod, Russian Federation). E-mail: rykhtikpavel@yandex.ru
The authors declare no conflicts of interests.
Статья поступила в редакцию 22.10.2021; одобрена после рецензирования 07.02.2022; принята к публикации 28.02.2022.
The article was submitted 22.10.2021; approved after reviewing 07.02.2022; accepted for publication 28.02.2022.