СОЦИОЛОГИЯ МОЛОДЕЖИ
DOI: 10.14515/monitoring.2017.4.11 Правильная ссылка на статью:
Нагорный О. С. Репрезентация этничностей в русскоязычных социальных медиа // Мониторинг общественного мнения : Экономические и социальные перемены. 2017. № 4. С. 165—184. DOI: 10.14515/monitoring.2017.4.11. For citation:
Nagornyy O. S. Representation of ethnicity in the Russian-speaking social media. Monitoring of Public Opinion: Economic and Social Changes. 2017. № 4. P. 165—184. DOI: 10.14515/ monitoring.2017.4.11.
О. С. Нагорный * РЕПРЕЗЕНТАЦИЯ ЭТНИЧНОСТЕЙ В РУССКОЯЗЫЧНЫХ СОЦИАЛЬНЫХ МЕДИА
РЕПРЕЗЕНТАЦИЯ ЭТНИЧНОСТЕЙ В РУССКОЯЗЫЧНЫХ СОЦИАЛЬНЫХ МЕДИА
НАГОРНЫЙ Олег Станиславович — стажер-исследователь Лаборатории интернет-исследований Национального исследовательского университета «Высшая школа экономики» в Санкт-Петербурге, Санкт-Петербург, Россия. E-MAIL: [email protected] ORCID: 0000-0002-0892-8212
REPRESENTATION OF ETHNICITY IN THE RUSSIAN-SPEAKING SOCIAL MEDIA
Oleg S. NAGORNYY1—Research Assistant E-MAIL: [email protected] ORCID: 0000-0002-0892-8212
1 Internet Studies Lab, National Research University Higher School of Economics Campus in St. Petersburg, St. Petersburg, Russia
Аннотация. Представлены результаты исследования, выполненного в парадигме анализа больших данных. Цель работы заключается в выявлении характеристик этнического дискурса в русскоязычных социальных медиа и определении места северокавказских этничностей в этом дискурсе. Информационной базой исследования
Abstract. The paper presents the results of a study based on the Big Data paradigm analysis. The study aims at defining the features of the ethnic discourse in the Russian-speaking social media and the place of the North Caucasus ethnicities in this discourse. The informational basis for the study is 2,659,849 social media publications containing ethno-
* Нагорный Олег Станиславович — победитель V Всероссийского конкурса дипломных работ в области социологии 2016—2017 «Дипломник года» в номинации «Лучшая дипломная работа магистра» с работой «Репрезентация этничностей в российских социальных медиа (на примере народов Северного Кавказа)». Научный руководитель Кольцова Елена (Олеся) Юрьевна.
выступили 2659 849 текстов социальных медиа, содержащих этнонимы. Выявлено, что тематическая структура этнического дискурса содержит большое количество проблемных тем, которые обсуждаются преимущественно мужчинами. Также показано, что этнонимы, обозначающие народы Северного Кавказа, значимо чаще употребляются в контексте тем преступности и терроризма.
Ключевые слова: этничность, Интернет, социальные медиа, дискурс, тематическое моделирование, Северный Кавказ
Благодарность. В данной научной работе использованы результаты проекта «Интернет как социо-технический феномен», выполненного в рамках Программы фундаментальных исследований НИУ ВШЭ в 2017 году.
nyms. The author concludes that the ethnic discourse is full of problematic topics mainly discussed by male participants. The study shows that the ethnonyms related to the North Caucasus peoples are often used in the context of crime and terrorism.
Keywords: ethnicity, Internet, social media, discourse, thematic modeling, North Caucasus
Acknowledgements. The results of the project «The Internet as a socio-tech-nical phenomenon», carried out within the framework of the Basic Research Program at the National Research University Higher School of Economics (HSE) in 2017, are presented in this work.
Этнические процессы, происходящие в России, всегда привлекали внимание отечественных социальных исследователей. В таком полиэтническом обществе, как наше, актуальность этнических исследований обосновывается необходимостью корректировать социальную политику с учетом интересов представителей заинтересованных групп. Для этого необходимо понимать, какие требования они выдвигают и какие требования предъявляются к ним. Эту деятельность традиционно выполняют полстерские организации, такие как ВЦИОМ и ФОМ, которые периодически проводят опросы общественного мнения с целью мониторинга состояния межнациональных отношений 1.
Однако недавно, благодаря развитию информационных технологий и повсеместному проникновению Интернета, социологии общественного мнения был брошен вызов со стороны так называемых Big Data — больших данных [Одинцов, 2017]. Этот термин относится не только к электронным данным, которые отличаются большим объемом, высокой скоростью производства и разнообразием форм. Работа с большими данными также предполагает новые, интеллектуальные
1 См., например: Инфографика по теме «Межнациональные отношения. Национализм» [Электронный ресурс] // ВЦИОМ. URL: https://infographics.wciom.ru/theme-archive/society/social-problems/interethnic.html (дата обращения: 24.08.2017).
методы их анализа, дающие возможности извлечения нетривиальных знаний из собранного массива данных (data mining).
В данной работе мы представляем исследование, выполненное в такой парадигме. При помощи анализа больших текстовых данных мы выявляем характеристики этнического дискурса в русскоязычных социальных медиа. Более конкретно: в текстах сообщений пользователей Рунета мы выявляем структуру связей между этническими категориями, строим тематический профиль этнического дискурса и затем устанавливаем, как этнические категории распределяются по темам сообщений.
Особое внимание уделено месту северокавказских этничностей в структуре этого дискурса, поскольку в социологической литературе показывается, что именно к народам этого региона остальные россияне испытывают наиболее негативные эмоции 2 [Ахметьева, 2007].
Современные тенденции в изучении расы и этничности
Цель обзора современных тенденций в этнических исследованиях — демонстрация того, что именно новый подход к изучению общественного мнения о проблеме этничности на основе анализа больших данных наилучшим образом удовлетворяет требованиям, выдвинутым исследователями этничности, стоящими на переднем крае развития этой предметной области.
Тема этничности является одной из сквозных тем в социологических науках. В последние десятилетия количество эмпирических исследований на этническую тематику увеличивалось так быстро, что развитие концептуального аппарата этого поля не поспевало за столь высокими темпами [Brubaker, 2009: 1]. Осознавая эти проблемы, академическое сообщество попыталась выработать язык, который мог бы являться подходящим инструментом для анализа этнических процессов. Одна из самых успешных попыток такого рода случилась в 1980-е годы, когда на смену примордиалистским концепциям, рассматривающим этничность в качестве фундаментальной характеристики человека, укорененной в самой его природе, пришел инструментализм, или, как его еще называют, конструктивизм [Spencer, 2006: 76]. Название этого подхода свидетельствует о новом взгляде на этничность: она теперь понимается как продукт социальной среды, который сознательно и рационально конструируется индивидами в процессе коммуникации и служит достижению инструментальных целей. За несколько десятилетий конструктивизм завоевал всеобщее признание и стал наиболее популярным способом осмысления этничности. На данный момент мало кто из исследователей настаивает на том, что этнические группы и расы предопределены и неизменны; большинство согласны с конструируемой и изменчивой природой этничности. Такое единодушие позволяет некоторым ученым утверждать, что «сейчас все мы являемся конструктивистами» [Brubaker, 2009: 28].
2 См. презентацию: Bodrunova S., Koltsova O., Koltsov S., Nikolenko S. Are «Migrants» All the Same? Mapping Attitudes to the Resettlers From Post-Soviet South in the Russian Blogosphere [Электронный ресурс] // The European Consortium for Political Research (ECPR). 2016. URL: https://ecpr.eu/Events/PaperDetails.aspx? PaperID=30392&EventID=95 (дата обращения: 24.08.2017).
Несмотря на радушие, проявленное по отношению к этой концепции со стороны большинства ученых, некоторые указывают на ее недостатки и предлагают пути дальнейшего развития данного направления. Громкая и удачная попытка критики традиционного конструктивизма была предпринята Роджерсом Брубейкером, который в качестве одной из двух основных причин написания своей монографии «Этничность без групп» указывал на «самоуспокоенный конструктивизм» [Брубейкер, 2012: 17]. Самоуспокоенность, по его мнению, выражается в том, что благодаря своей популярности конструктивизм сделался «скучным, тривиальным, плоским и невыигрышным», став «воплощением академической респектабельности, даже ортодоксии», и, как следствие, утратив способность ставить острые вопросы и порождать неожиданные ответы. Для решения этой проблемы Брубейкер предложил отказаться от понимания этничности как группы и интерпретировать ее «в реляционных, процессивных, динамических, событийных и разукрупненных терминах» [Там же].
И хотя, будучи процитированной более тысячи раз, работа Роджерса Брубейкера оказала большое влияние на развитие как представлений об этничности, так и конструктивистских взглядов в целом, стимулировав продуктивную дискуссию в этом поле академической деятельности, она, тем не менее, в полной мере не ответила на вопрос, чем для социологов является этничность и как ее изучать. Многословное описание свойств желаемого определения этничности, данное Роджерсом Брубейкером, не кристаллизовалось в конкретную дефиницию — этничность по-прежнему осталась слишком неоднозначной и «вязкой» аналитической категорией.
Радикальное решение проблемы, связанной со сложностью использования понятия этничности как аналитической категории, предложили Боб Картер и Стив Фентон [Carter, Fenton, 2010], которые развили идеи Брубейкера и попытались сделать следующий шаг на пути переосмысления этого термина. По их мнению, главная проблема понятия этничности состоит в неясности его социологического смысла и отсутствии внутренней логической связности. Социологи, считают авторы, в своих определениях этничности слишком полагаются на ее обыденное значение и понимают этничность как фактор, как социальную силу, которая может выступать в качестве самостоятельной причины социальных изменений. Для выхода из этой ситуации они предлагают признать, что понятие этничности является исторически обусловленным описанием определенной социальной ситуации, и отказаться от понятий расы и этничности как самостоятельных категорий социологического анализа [Carter, Fenton, 2010: 14]. Вместо этого авторы хотят перейти к рассмотрению этничности и производных от нее понятий как «практических категорий», которые складываются на пересечении более общих понятий, таких как «власть», «действие», «социальные отношения», «ресурсы» и др. Таким образом, ключевым вопросом должно стать не то, как этничность влияет на что-то, а при каких условиях некоторые социальные акторы интерпретируют данную социальную ситуацию, используя понятие этничности [Carter, Fenton, 2010: 10]. Можно сказать, что авторы меняют роль этого понятия с объясняющего, используемого социологами в качестве аналитического инструмента, на подлежащее объяснению, используемое социальными акторами, которых изучают социологи.
Полагаем, что позиция, высказанная в данной работе, не только соответствует последним трендам в развитии этнических исследований, но, что важнее, открывает возможности для наиболее гибкого и плодотворного анализа этнических процессов. Именно поэтому предметом нашего исследования является не этничность, а дискурс об этничности, то есть коммуникативные акты в которых люди говорят о том, что считается этничностью, и социальный контекст их воспроизводства и создания.
Размышляя о способах организации исследования этнических процессов в СМИ, другие социологи пришли к похожим выводам. Так, рассматривая теоретические аспекты трансформации контекстуальных сообщений средств массовой коммуникации о ситуациях этнокультурного контакта в публичный дискурс об этничности, Ф. Барков пишет, что «для понимания механизмов взаимодействия и роли латентных интерпретативных структур, заложенных в дискурсивных, символических и аффективных формах воспроизводства этносоциальной идентичности, функционирующих в повседневном и информационном пространстве, необходимо аналитическое рассмотрение сценариев их взаимодействия и взаимной трансформации на основе теории дискурсивного анализа» [Барков, 2013: 207].
Поскольку дискурс является крайне неоднозначным понятием, нагруженным множеством не всегда пересекающихся и даже конкурирующих смыслов, мы будем пользоваться популярным в отечественном языкознании определением дискурса как текстом в социальном контексте [Негрышев, 2014: 150], широко известным по работам Тёна ван Дейка, использующего это понятие в качестве центрального концепта в развиваемого им критического дискурс-анализа. Данная теория разработана в рамках лингвистической группы теорий медиа и коммуникации, сторонники которой понимают язык не как код, который может быть однозначно декодирован получателем, а, скорее, как пространство смыслов, каждый из которых может быть актуализирован в той или иной ситуации [Кирия, Новикова, 2017: 300—303]. Фокус внимания здесь переносится на интерпретацию сообщения и факторов, влияющих на нее. В используемом в настоящей работе понятии дискурса отношения текста и контекста занимают центральное место. Именно выявлению сложных взаимосвязей между текстами об этничности и контекстом их воспроизводства при помощи анализа больших данных из социальных медиа и посвящена данная работа. Мы предполагаем, что употребление этнонимов и этнофолизмов значимо связано с такими элементами контекста, как место, время, тематика сообщения, и на основе анализа этих связей хотим определить, специфику освещения различных народов в социальных медиа.
У читателя может возникнуть вопрос, корректно ли применять эту теоретическую рамку для автоматизированного анализа текстов социальных медиа, поскольку большинство исследований в этой парадигме выполнены в качественной традиции, предполагающей «вчитывание» исследователя в текст и его интерпретацию. Однако дискурс-исследования, представляя собой широкую теоретическую рамку, не накладывают ограничений на методы исследования. Ван Дейк замечает, что дискурс-анализ может комбинировать различные виды анализа, как качественные, так и количественные [Дейк, 2013: 20]. Некоторые
исследователи даже предлагают использовать критический дискурс-анализ как теоретическую рамку при анализе современных информационных систем, к которым относятся и социальные медиа [Connie, Salam, 2013]. Они утверждают, что когда концептуализация сферы социальных медиа не поспевает за ее развитием и количеством эмпирических исследований в этой области, критический дискурс-анализ может предоставить наиболее подходящие инструменты для теоретического осмысления таких явлений, как кибербуллинг. По их мнению, именно социальные медиа, представляя собой новый формат дискурсивной системы, наилучшим образом воспроизводят традиционную диалогичную структуру человеческого общения, для исследования которой был предназначен дискурс-анализ. Иными словами, социальные медиа способствуют коммуникации, внося минимум искажений.
Заканчивая обзор современных тенденций в исследованиях этничности, отметим, что одной из основных является изучение этнических процессов в сети Интернет. В качестве примера можно привести статьи, авторы которых изучали различия в самопрезентации этнических групп в социальной сети Facebook [Grasmuck, Martin, Zhao, 2009] и при помощи анализа гиперссылок исследовали, как Интернет повлиял на самопрезентацию этнических диаспор [Diminescu, Loveluck, 2014]. Российские социологи также не остались в стороне от этнических исследований в Интернете, сосредоточившись на изучении сообществ в российской социальной сети «ВКонтакте», где они исследовали конструирование татарской идентичности [Suleymanova, 2009], выявляли и анализировали кластеры сети, построенной на основе членства пользователей «ВКонтакте» в кавказских группах [Alexandrov, Gorgadze, Musabirov, 2016].
Этнические исследования в Интернете не ограничиваются только лишь описанием того, как этничность проявляет себя онлайн. Ученые из США обнаружили, что доступ в Интернет положительным образом коррелирует с количеством преступлений на почве расовой ненависти, причем положительная связь сильнее в районах с более высоким уровнем расизма [Chan, Ghose, Seamans, 2016].
Таким образом, соглашаясь с тем, что в центр объяснительной модели необходимо поставить не этничность как таковую, а дискурс об этничности, и принимая во внимание, что концепция дискурс-анализа предоставляет инструменты для изучения современных информационных систем, можно сделать вывод о правомерности изучения феномена этничности при помощи анализа больших текстовых данных из социальных медиа с использованием дискурс-анализа как теоретической рамки.
Гипотезы и данные
В исследовании поставлены две задачи. Во-первых, описать макрохарактеристики этнического дискурса, во-вторых, определить место северокавказских этничностей в нем. Исходя из этой цели, поставлены следующие исследовательские вопросы:
1. Как связаны между собой выделенные этнические категории? Какой принцип лежит в основе их совместной встречаемости в одних текстах?
2. Какова тематическая структура этнического дискурса?
Также нами были сделаны следующее предположения, касающиеся места народов Северного Кавказа в структуре этого дискурса:
1. Народности Северного Кавказа представлены в текстах социальных медиа как единая категория.
2. Народности Северного Кавказа чаще упоминаются в текстах социальных медиа про преступность и терроризм.
3. Существует ядро веб-сайтов, на которые ссылаются авторы текстов, дающие негативное определение северокавказских этничностей.
Для достижения поставленных задач были собраны сообщения, из которых состоит этнический дискурс в социальных медиа. Сбор данных выполнялся при помощи сервиса мониторинга социальных медиа IQBuzz, который позволяет искать общедоступные сообщения пользователей сотен социальных сетей и форумов по ключевым словам. Перед началом использования сервиса был составлен всеобъемлющий список слов, включающий названия 97 этнических категорий на территории России. В этот список вошли не только этнонимы, но и этнофолиз-мы, политнонимы, устаревшие слова и обобщенные наименования нескольких народов (кавказец). Например, для поиска текстов, относящихся к азербайджанцам, были подобраны следующие слова: «азер», «азерка», «азербот», «азерботка», «азербайджанец», «азербайджанка». Из этих слов была сформирована этническая категория под названием «азербайджанцы». Формируя этнические категории, мы старались разделить общеупотребительное и оскорбительные наименования народов, таких как «жид» и «еврей», «украинец» и «хохол».
Период, за который собирались тексты, был ограничен началом 2014 — концом 2015 гг. Мы исключили тексты, авторы которых или проживали не в России, или регион их проживания не был распознан, и осуществили поиск выделенных этнических категорий в текстах. В результате выборка составила 2659 849 текстов, из которых 82 % составляли тексты самой популярной в России социальной сети «ВКонтакте». Далее тексты прошли через стандартную процедуру предварительной обработки, включающую в себя токенизацию, лемматизацию, удаление стоп-слов.
Особенность используемого инструмента сбора данных IQBuzz заключается в том, что полностью неизвестно, как именно собираются данные и насколько полна и репрезентативна полученная выборка. На главной странице сервиса IQBuzz утверждается, что он отслеживает «все упоминания в интернет-среде». Мы не имеем возможности проверить точность этого утверждения, как, впрочем, собрать необходимые данные каким-либо другим образом, кроме как с использованием аналогичных агрегаторов.
Этнические макрокатегории
Для определения этнических макрокатегорий мы построили сеть, узлами которой стали этнические категории, а сила связей между ними рассчитывалась на основе матрицы совместной встречаемости всевозможных пар категорий в одном тексте. Затем к полученной сети был применен алгоритм кластеризации Infomap [Rosvall, Bergstrom, 2008], который и позволил выделить кластеры, представляющие искомые макрокатегории. На рис. 1 представлена сеть этнических категорий, созданная на основе анализа их совместной встречаемости.
БейНап
Обозачсния кластеров
Центральная Азия Исторический Восточные славяне Нацмен-Русня Этнофолизмы Северный Кавказ
Рисунок 1. Карта этнических кластеров
Карта этнических категорий демонстрирует связи между всеми этническими категориями и макрогруппами этничностей. Размер узлов сети соответствует центральности этнической категории и отражает количество документов, в которых она встречается. Узлы, принадлежащие к одному кластеру, окрашены одинаково. Этнические категории сгруппировались в основном на основании этнокультурного сходства. Лишь в нескольких кластерах связи между этничностями установились на основе наличия конфликта между ними. Также присутствует один кластер, отличающийся от всех остальных, поскольку его в основном составляют не обычные этнонимы, а этнофолизмы.
Самый большой кластер, обозначенный сиреневым цветом, включает в себя 17 этнических категорий, большинство из которых обозначает народы Восточной
Европы: русские, украинцы, европейцы, россияне, славяне и др. Кластеры голубого и красного цветов включают в себя народы Севера России, Сибири и Дальнего Востока. Исключение составила лишь категория «аланы», этнонимы которой часто встречались с этнонимами из категории «тувинцы», что привело к образованию, возможно окказионально, сильной связи между ними, перетянувшей «аланов» в кластер северных этничностей. Оранжевый кластер весьма разнороден и включает в себя в основном как тюркские народы России (татары, башкиры, чуваши, караимы), так и финно-угорские (мордва, удмурты, марийцы, эрзяне). В отдельный кластер (серо-синий цвет) выделены слова, обозначающие прибалтийские народы, которые по какой-то причине оказались связаны с категорией «грузины», входящей в кластер народов Южного Кавказа (серо-фиолетовый цвет). Категории, представляющие тюркские народы, населяющие Центральную Азию (азиаты, казахи, узбеки, киргизы, туркмены, уйгуры и восточноевропейцы в качестве исключения), образовали кластер зеленого цвета. Все эти кластеры выделены на основе этнокультурного сходства.
С центрально-азиатским кластером связан другой, исторический кластер, включающей в себя категории «монгол», «казак», «басурманин» и «инородец». По присутствию устаревших и бранных слов можно сделать вывод о том, что данный кластер образовался из текстов военно-исторической тематики, в частности относящихся в монгольскому иго. Бирюзовый кластер включает в себя названия трех восточнославянских народов: великороссов, малороссов и белорусов.
Оставшиеся три кластера наиболее интересны для нас. Первый включает всего две категории: «нацмен» (сокращение от «национальные меньшинства») и этнофолизм «русня». Наличие такой пары, вероятно, маркирует конфликтные, неприязненные отношения между титульной нацией РФ и другими народами. Два оставшихся кластера (желтый и жёлто-зелёный) связаны между собой и тоже свидетельствуют о наличии конфликтных отношений. Судя по положению в сети, желтый кластер большей частью состоит из этнофолизмов, обозначающих народы Азии и Северного Кавказа. Примечательно, что в этот же кластер входят категории «кавказец» и «дагестанец», для которых более ожидаемо было бы находиться вместе с другими этничностями Северного Кавказа в жёлто-зелёном кластере. На основании полученной визуализации можно предположить, что слова «дагестанец» и «кавказец» (и производные от них) чаще встречаются с этнофолизмами, такими как «хач» и «чурка», чем с этнонимами, обозначающими проживающие в том же регионе народы. Эта находка свидетельствует о наличии языка вражды в текстах про народы Северного Кавказа.
Темы этнического дискурса
Следующей интересующей нас характеристикой этнического дискурса является его тематический профиль, полученный при помощи метода тематического моделирования LDA. Тематическое моделирование уже успешно использовалось для выявления тем этнических текстов [Alexandrov, Gorgadze, Musabirov, 2016; Apishev et al., 2016; Nikolenko, Koltcov, Koltsova, 2017].
Мы построили тематическую модель на 97 тем по числу выделенных этнических категорий. После интерпретации текстов, принадлежащих каждой теме с наи-
большей вероятностью, 65 темам были присвоены ярлыки, 32 темы оказались неинтерпретируемыми. Результаты кодирования 25 самых распространенных тем представлены в колонке «Название темы» табл. 1. Не все темы модели касаются непосредственно этничности. В тематическом наборе присутствуют темы про преступность, политику, работу, кино, семью, экономику, флот, армию, жилье и другие. Сравнивая этот набор тем с темами, полученными в предыдущем исследовании лаборатории интернет-исследований НИУ ВШЭ в Санкт-Петербурге на случайной выборке из социальной сети «ВКонтакте» (представляющими своего рода «естественную» тематическую структуру типичного сайта социальных медиа) ^У^ч Nagornyy, Koltsova, 2017], можно сказать, что в нем присутствует намного больше тем, затрагивающих социально значимую, а не повседневно-бытовую проблематику.
Таблица 1. Наиболее распространенные темы этнического дискурса
Номер Название темы Относительная за-метность темы
1 Отношения русских с другими народами 6,1 %
2 Украино-российские отношения 4,9 %
3 Российское общество, Россия как национальное государство 3,1 %
4 Революция 2013 г. на Украине 2,9 %
5 Конфликтные отношения России с Западом 2,8 %
6 Дети и семья 2,7 %
7 Порно 2,7 %
8 Неинтерпретируемая тема 2,6 %
9 Неинтерпретируемая тема 2,5 %
10 Деятельность российских властей 2,3 %
11 Народы Северного Кавказа, ислам, терроризм 2,1 %
12 Неинтерпретируемая тема 2,0 %
13 Поэзия 1,9 %
14 Экономика 1,8 %
15 Психология и дети 1,8 %
16 Преступления и убийства 1,7 %
17 Фильмы, фестивали, спектакли 1,7 %
18 ВОВ 1,6 %
19 Древние славяне 1,6 %
20 Туризм и отдых 1,6 %
21 Христианство и православие 1,5 %
22 Неинтерпретируемая тема 1,5 %
23 Татары и другие тюркские народы 1,3 %
24 Американо-российские отношения, осуждение США 1,3 %
25 Интернет 1,3 %
Относительная заметность рассчитывается через отношение суммы вероятностей темы во всех документах к сумме вероятностей по всем темам и показывает ее представленность в этническом дискурсе. Оказалось, что более всего заметны темы, связанные с событиями на востоке Украины — четыре из пяти самых заметных тем затрагивают эту проблематику.
Следующим шагом были определены этнические категории, характерные для темы преступности, что позволило проверить выдвинутые гипотезы. Во многих работах можно встретить утверждения о том, что СМИ являются мощным источником распространения расистского дискурса РУК 1984], особенно о народах Северного Кавказа [Ахметьева, 2007; Кугай, Ковалева, 2015; Карпенко, 2002; Шнирельман, 2007] и «лицах кавказской национальности» [Левинсон, 2005; Мамедов, 1999]. Имея в числе полученных тем тему про преступность (тема № 14), мы можем определить, какие этничности значимо чаще упоминаются в контексте сообщений на данную тему, проверив таким образом, присутствует ли выявленная в СМИ предвзятость в текстах пользователей социальных медиа.
Самые вероятные слова для темы преступлений и их последствий, полученной в результате применения алгоритмов тематического моделирования, следующие: убийство, время, дело, группа, задержать, преступление, полиция, находиться, убитый, сотрудник, день, дом, суд, погибнуть, район, место, преступник, имя, получить, произойти, город, погибший, смерть, полицейский, убить, февраль, лагерь, тюрьма, начальник, уголовный. Среди этих слов мы не встречаем ни одного, относящегося к какой-либо этнической категории, что пока не позволяет сделать вывод о наличии предвзятости в социальных медиа. Сделаем следующий шаг и посмотрим, какие этнические категории значимо более характерны для данной темы, чем другие (табл. 2).
Таблица 2. Этнические категории, характерные для темы «Преступления и убийства»
Этническая категория Z-значение
Ингуш 2,0683
Манси 1,9923
Кавказец 1,8843
Z-значение, равное 1,8843, соответствует уровню значимости в 6 %, что дает основание утверждать, что тема «преступность» не является этнически нейтральной. Она значимо более характерна для текстов, в которых встречается упоминание трех этнических категорий: «ингуш», «манси» и «кавказец», причем две из них— «ингуш» и «кавказец» — относятся к народам Северного Кавказа. Эти результаты подтверждают выводы, сделанные в ранее упомянутых работах о предвзятости к определенным этничностям при освещении преступлений, и согласуются с результатами опроса Фонда «Общественное мнение», который показал, что среди уверенных в более высоком уровне преступлений со стороны представителей некоторых этносов большая часть считает такими представителями выходцев из Северного Кавказа 3.
3 Указывать ли национальность преступников в СМИ? [Электронный ресурс] // ФОМ. URL: http://fom.ru/Bezopasnost-i-pravo/10586 (дата обращения: 24.08.2017).
К схожим выводам о наличии предвзятости в социальных медиа к народам Северного Кавказа нас приводит анализ темы «народы Северного Кавказа, ислам, терроризм». Взглянем на самые вероятные для нее слова: Чечня, чеченский, Дагестан, мусульманин, Кадыров, террорист, боевик, чеченец, Кавказ, ислам, Грозный, исламский, республика, Аллах, мусульманский, теракт, Рамзан, Мансур, Эйваза, мечеть, брат, воевать, Али, имам, Иса, арабский, дагестанский, Россия, Махачкала, дагестанец.
Здесь смешаны три разные темы. Первая из них рассказывает про народы и республики Северного Кавказа, вторая — про терроризм и боевиков, а третья — про ислам. Такое соседство свидетельствует о том, что в социальных медиа эти три явления тесно связаны между собой: как выходцы с Кавказа, так и ислам присутствуют в социальных медиа в контексте терроризма. В глазах её аудитории терроризм приобретает, таким образом, этнические и религиозные черты. Список этнических категорий, характерных для данной темы («лезгин», «даргинец», «аварец», «кумык», «чечен», «вайнах», «дагестанец»), лишь подтверждает эти выводы.
Анализ динамики представленности этой темы позволяет выделить лишь один временной промежуток, приходящийся на середину ноября 2015 г., когда заметность темы терроризма в социальных медиа значительно возросла. 13 ноября 2015 г. в Париже произошла серия крупных террористических атак, в которых погибло более ста человек. Такое резонансное событие вызвало заметную дискуссию в медиа, в том числе социальных, что и нашло отражение на графике (см. рис. 2).
Характеристики авторов
Статистика по авторам следующая: на 2659 849 текстов приходится 843158 уникальных авторов. Относительно гендерных различий среди авторов текстов на этническую тематику можно сделать вывод, что это преимущественно мужская тема — количество мужчин почти в два раза превышает количество
женщин (421551 мужчин против 277408 женщин, гендер 144199 авторов остался неизвестным). Более того, среди авторов текстов про этничность мужчин не только больше, они также более активны: на одного мужчину в среднем приходится 3,10 сообщения, а на женщину — 2,43. Такие цифры совершенно не характерны для социальных медиа, основной аудиторией которых являются, как правило, женщины. Так, предыдущие исследования показывают, что женщины более активно пользуются социальными медиа по сравнению с мужчинами [Gender Considerations..., 2016; Mazman, Usluel, 2011]. Наблюдаемое различие между общей тенденцией и нашими данными свидетельствует о том, что тема этничности имеет ярко выраженную гендерную окраску. Этот вывод согласуется с исследованиями, указывающими на различные тематические предпочтения мужчин и женщин. Так, Катерина Бишопин замечает, что «в большинстве тематических областей между мужчинами и женщинами могут быть выявлены устойчивые различия» [Bischoping, 1993: 11]. Например, она указывает на то, что мужчины более активно коммуницируют на «проблемные темы», такие как война или политика. По-видимому, в проблемности этнической темы и близости ее к социально-политической тематике и состоит природа выявленных нами различий: будучи потенциально проблемной, она более активно обсуждается мужчинами.
Источники негативного отношения к народам Северного Кавказа
Одна из задач данного исследования состояла в том, чтобы определить источники, на которые ссылаются авторы текстов, содержащих оскорбительные названия народов Северного Кавказа. Такой анализ может выявить сайты сети Интернет, являющиеся центрами антикавказских настроений и провоцирующие межэтнические распри. Большинство исследований этничности в интернет-медиа фокусируются на определении признаков языка вражды в текстах, в то время как определение источников, на которые ссылаются авторы текстов, распространяющих этот язык, остается малоизученной, но безусловно актуальной областью исследования.
В качестве индикатора присутствия языка вражды было выбрано наличие в текстах одного из трех этнофолизмов: «хач» [Стернин, 2013], «чурка» [Баринова, 2013] и «черножопый» (см.: Елистратов 4). Каждый из этих терминов используются для уничижительного обозначения выходцев с Северного Кавказа, и наличие любого из них в тексте может быть рассмотрено как свидетельство использования языка вражды. По сравнению с анализом тональности, корректность которой зависит от качества словарей, наличие этих слов является более надёжным индикатором враждебного отношения.
Напомним, что мы предполагали существование ядра веб-сайтов, на которые ссылаются авторы негативных сообщений о народах Северного Кавказа. Такое ядро могут составлять экстремистские ресурсы или новостные заметки ведущих СМИ, в которых описывается резонансная ситуация, вызывающая негативные чувства по отношению к этим народам.
4 Елистратов В. С. Словарь русского арго. М. : Изд-во «Русские словари», 2000.
Таблица 3. Источники негативного отношения к народам Северного Кавказа
№ URL Кол-во ссылок Содержание
1 http://vk.cc/3TPyti 376 Страница не найдена
2 http://vk.cc/3Sn5JO 374 Страница не найдена
3 https://vk.com/doc87849292_414903762 ?hash=ff88964fe6f3f2b500&dl=6017dcd8d 4fd272bb1 311 Пользователь, который разместил документ, заблокирован
4 http://skypeteacher.net/price.html 311 Уроки английского по Skype
5 http://vk.com/selfiorel 147 Селфи Орел
6 http://vk.com/club55945580 139 Свободный Русский Информационный Портал
7 https://www.youtube.com/channel/ UCFeC 0pD 5hsrWEUOeaXL-Dfg?sub_ 87 Аккаунт заблокирован
8 http://youtu.be/-6J9rkPW76A 57 Аккаунт заблокирован
9 http://marika7415.blogspot.com 47 Блог удален
10 https://yadi.skAI/JXKiTizXA2WQoq8 46 Файл недоступен
11 https://vk.com/harmageddoo 46 ХРОНИКИ АРМАГЕДДОНА
12 https://www.youtube.com/channel/ UCF3OjrVNqJSY 89СНС]01-^ 40 Аккаунт заблокирован
13 http://vkontakte.ru/club18448362 40 Русские Патриоты Ф II Ф Союз Славян
14 http://vk.cc/3waHPa 39 Страница не найдена
15 https://yadi.sk/d/VnwZMYUoWRG4j 34 Файл недоступен
16 http://vk.com/ album220495713_185213549 34 Альбом недоступен
17 https://yadi.sk/d/MEYUZT-IWR 4QR 34 Файл недоступен
18 http://www.youtube.com/ watch?v=UWd6fmrBxY 8 34 Аккаунт заблокирован
19 https://yadi.sk/d/rpTPE 70kf4Yfo 34 Файл недоступен
20 http://www.colta.ru/articles/society/1034 34 Кто не прыгает — тот жид! ДМИТРИЙ ПАШИНСКИЙ ПОБЫВАЛ НА ТРАДИЦИОННОЙ ОСЕННЕЙ ЗАБАВЕ — «РУССКОМ МАРШЕ»
21 http://www.youtube.com/ watch?v=WrUW7ywVjPA 34 Кто не прыгает — тот чурка (хач)! Гей! Гей! Москва — Санкт Петербург 2011—2013
22 http://www.youtube.com/ watch?v=ZrmpjjczcV8 34 Болотная: кто не прыгает тот хач
23 http://vk.com/guitars_spb 34 Страница не найдена
24 http://youtu.be/tlhbBaAJrrE 31 Путин сдал Россию. Москву зальют кровью Русских
25 http://youtu.be/H6fRa65dXF4 31 Конец Русских в России. Только факты!!! Смотреть всем!!!
В табл. 3 представлены гиперссылки, встречающиеся в текстах, содержащих хотя бы один из выделенных этнофолизмов. Количество таких текстов составило 131 073 штуки. Прежде всего обращает на себя внимание количество недоступных и заблокированных страниц: на 15 из 25 самых частых ссылок на момент написания работы невозможно было зайти. Это может свидетельствовать о работе систем блокирования оскорбительного и разжигающего межнациональную рознь контента.
Следующий интересный факт состоит малом количестве платформ, на которые ссылаются авторы текстов: в основном это видеохостинг «Youtube», социальная сеть «ВКонтакте» и файлообменник «Яндекс.Диск». Лишь две ссылки из числа 25 самых популярных не относятся к этим трем платформам. Такое невысокое разнообразие источников говорит об отсутствии отдельного центра антикавказского движения. Платформами для языка вражды являются обычные сайты социальных медиа, что позволяет администрации этих сайтов быстро блокировать распространение оскорбительной информации. Авторы сообщений, содержащих этнофолизмы, используемые для обозначения народов Северного Кавказа, не ссылаются на обычные медиа, например, на сайты газет или телевизионных каналов, что говорит о замкнутости этнического дискурса социальных медиа на самом себе: авторы, пишущие эти сообщения, ссылаются на других таких же авторов, пишущих анонимные посты в группах социальной сети или выкладывающих видео на «Youtube». Полученные результаты также опровергают нашу гипотезу о наличии ядра ресурсов, на которые ссылаются авторы текстов, содержащих выделенные этнофолизмы—чаще всего это страницы в широко распространенных социальных медиа.
Не все из выявленных сайтов выполняют ту роль, которую мы от них ожидали, а именно используются для обсуждения народов Северного Кавказа и их представителей в негативных тонах. Например, высокое место в списке страницы с адресом http://skypeteacher.net/price.html обусловлено большим количеством рекламных сообщений, в которых рассказывается якобы реальная история о жестокой школьной учительнице, называвшей своего иноэтничного ученика «чуркой нерусской». В конце сообщений читателю со ссылкой на данный сайт предлагается попробовать услуги репетитора по английскому языку.
Впрочем, нам удалось обнаружить группы в социальной сети «ВКонтакте» и видео на Youtube, которые сообщают информацию, на самом деле несущую в себе негативный эмоциональный заряд по отношению к северокавказским этнич-ностям. Пафос большинства таких информационных ресурсов основан на противопоставлении русских, которые выступают в качестве жертвы, и представителей Северного Кавказа, описываемых в качестве агрессоров (см. заголовки «путин сдал Россию. Москву зальют кровью Русских», «Конец Русских в России. Только факты!!! Смотреть всем!!!»). Сюжет других разворачивается вокруг так называемых «русских маршей», а третьи, такие как группы «Свободный Русский Информационный Портал» и «Русские Патриоты Ф||Ф Союз Славян», эксплуатируют националистическую тематику.
Заключение
Данная работа была нацелена на описание характеристик этнического дискурса и определение в нем места северокавказских народностей. Большинство научных
работ, раскрывающих тему этничности, фокусируется на анализе отдельных этнических диаспор, поэтому сложно найти масштабные исследования, посвященные этническому дискурсу на определенном языке и устанавливающие отношения между всеми основными этническими группами, проживающими на территории, населенной носителями данного языка. Благодаря собранной при помощи ме-диа-агрегатора IQBuzz информационной базе, состоящей из 2659 849 текстов сообщений социальных медиа, содержащих хотя бы одну их 97 выделенных постсоветских этнических категорий, данное исследование описывает значительную часть этнического дискурса, происходящего в русскоязычных социальных медиа.
Нами было выявлено, что тематическая структура этнического дискурса заметно отличается от тематической структуры типичного сайта социальных медиа, которым является социальная сеть «ВКонтакте». Тексты, в которых присутствуют этнонимы, содержат намного больше проблемных тем про политику, этничность и религию, обсуждаемых преимущественно мужчинами, в то время как в «естественном» тематическом профиле, построенном на случайно отобранных текстах пользователей «ВКонтакте», превалирует социально-бытовая тематика. Выявленное различие свидетельствует о том, что этнический дискурс в целом является проблемным полем, на котором протекает острая и зачастую конфликтная коммуникация, имеющая потенциал перерасти в деятельность по определению социальных проблем.
В тематической структуре текстов социальных медиа мы выделили наиболее заметные темы. Наибольшую долю в этническом дискурсе занимают темы, затрагивающие украино-российские отношения по поводу конфликта последних лет. В данном случае сложно разделить этническую и политическую тематику, поскольку конфликт между государствами проецируется в сферу межэтнических отношений.
Вместе с тематической структурой этнического дискурса мы также описали другое его измерение — этнические макрокатегории, то есть группы этнонимов, которые наиболее часто встречаются в одних и тех же текстах. Анализ полученных макрокатегорий показал, что наиболее частым основанием близости этнонимов выступает их этнокультурная общность, хотя встречаются и другие основания, такие как конфликтные отношения и принадлежность к классу этнофолизмов.
Помимо описательной части данная работа содержит и конфирматорный элемент, заключающийся в проверке гипотез, выдвинутых относительно репрезентации северокавказских народностей в текстах социальных медиа. Мы определили, что эти этничности представлены в этническом дискурсе как единая макрокатегория, четко отделенная от всех остальных макрокатегорий, кроме той, в которую попали различные этнофолизмы. Такое соседство свидетельствует о том, что северокавказские этнонимы «кавказцы» и «дагестанцы» чаще упоминаются в текстах совместно с оскорбительными наименованиями, чем другие этнонимы, обозначающие народы данного региона. Это говорит о распространенности языка вражды по отношению к упомянутым народам.
Далее мы выяснили, что понятия, обозначающие северокавказские этнонимы, ислам и терроризм, объединены в одну тему, что свидетельствует о связи между этими тремя явлениями в текстах социальных медиа. Мы также обнаружили, что тема преступности не является этнически нейтральной, будучи статистически значимо более выраженной для категорий «Ингуш», «Манси», «Кавказец».
Наконец, последней задачей данной работы было определение источников, на которые ссылаются в своих текстах авторы, использующие оскорбительные наименования северокавказских народностей. Мы определили, что (1) количество таких источников относительно невелико, (2) они не представляют собой отдельного экстремистского веб-сайта, а размещаются в основном в социальных медиа, что (3) технически позволяет администрации этих ресурсов оперативно блокировать их.
Список литературы (References)
Ахметьева В. Люди с песьими головами: образ чеченцев в российских СМИ // Язык вражды против общества / ред. А. Верховицкий. М. : Центр «Сова», 2007. C. 203—211.
Akhmetieva VPeople with dog's heads: representations of the Chechen people in the Russian media. In: Verkhovitskii A. (ed.) (2007) Hate speech against society. Moskva: Tsentr «Sova». P. 203—211. (In Russ.)
Баринова А. Языковая репрезентация собирательного образа мигранта в российском обществе // Вопросы психолингвистики 2013. Т. 2. № 18. С. 174—181.
Barinova A. (2013) Conceptualizing A Migrant In Russian Society: An Ethnic Slur 'Churka' In Terms Of Migration Discourse. Journal of Psycholinguistics. Moscow: Institut yazykoznaniya RAN. Vol. 2 (18). P. 174—181. (In Russ.)
Барков Ф. А. Методология исследования взаимосвязи дискурса об этнической идентичности и контекстуальных сообщений СМИ // Вестник МГИМО Университета. 2013. № 1 (28). С. 205—208.
BarkovF. A. (2013) Modern methodological approaches to the study of the interrelation between everyday discourse about ethnic identity and contextual posts of the mass communication. MGIMO University Bulletin. No. 1 (28). P. 205—208. (In Russ.)
Брубейкер Р. Этничность без групп. М. : Изд. дом Высшей школы экономики, 2012.
Brubaker R. (2012) Ethnicity without groups. Moscow: Izd. dom Vysshei shkoly ekonomiki. (In Russ.)
Дейк Тён ван. Дискурс и власть : Репрезентация доминирования в языке и коммуникации. М. : Либроком, 2013.
Teun Adrianus Van Dijk (2013). Discourse and Power. Contributions to Critical Discourse Studies. Moscow: Librokom. (In Russ.)
Карпенко О. Языковые игры с «гостями с юга»: «кавказцы» в российской демократической прессе 1997—1999 годов // Мультикультурализм и трансформация постсоветских обществ. М. : ИЭА РАН, 2002. С. 183—188.
Karpenko O. (2002) Language games with the 'Guests from the South': 'Caucasians' in the Russian democratic press 1997—1999. In: Multiculturalism and the Transformation of Post-Soviet Societies, Moscow: IEA RAN. P. 183—188. (In Russ.)
Кирия И. В., Новикова А. А. История и теория медиа: учебник для вузов : Учебники ВШЭ. М. : Издательский дом Высшей школы экономики, 2017.
Kiriya I. V., Novikova A. A. (2017) History and theory of media: Textbook: HSE textbooks. Moscow: Izdatel'skii dom Vysshei shkoly ekonomiki. (In Russ.)
Кугай А. И., Ковалева А. М. Расистский дискурс электронных СМИ как фактор конструирования межэтнических конфликтов // Управленческое консультирование. 2015. № 1 (73). С. 86—93.
Kugai A. I., Kovaleva A. M. (2015) Racist Discourse of Electronic Mass Media as Factor of Designing of the Interethnic Conflicts. Journal Administrative Consulting. No. 1 (73). P. 86—93. (In Russ.)
Левинсон А. «Кавказ» подо мною. Краткие заметки по формированию и практическому использованию «образа врага» в отношении «лиц кавказской национальности». В кн.: Образ врага / ред. Л. Гудков. М. : О. Г. И., 2005. С. 276—302.
Levinson A. « «Caucasus» under me. Notes about creating and using the «enemy image» regarding «persons from the Caucasus». In: Gudkov L. (ed.) (2005) Enemy image. Moscow: O.G.I. P. 276—302. (In Russ.)
Мамедов М. «Лицо кавказской национальности». К вопросу о массовых предрассудках и меняющихся стереотипах // Центральная Азия и Кавказ. 1999. № 3.
Mamedov M. (1999) «Person from the Caucasus». On mass prejudices and changing stereotypes. Central Asia and the Caucasus. No. 3. (In Russ.)
Негрышев А. Текст в перспективе стилистики и дискурс-анализа: к методологии исследования на материале новостного медиадискурса // Stylistyka. 2014. № 23. С. 149—162.
Negryshev A. (2014) Text through stylistics and discourse analysis: towards methodology based on news media discourse. Stylistics Journal. V. 23. P. 149—162. (In Russ.)
Одинцов А. В. Социология общественного мнения и вызов Big Data // Мониторинг общественного мнения : Экономические и социальные перемены. 2017. № 3. С. 30—43.
OdintsovA. V. (2017) Sociology of public opinion and the Big Data challenge. Monitoring of Public Opinion: Economic and Social Changes. No. 3. P. 30—43. (In Russ.)
Стернин И. А. Неполиткорректные наименования лиц в языковом сознании носителя языка // Политическая лингвистика. 2013. № 1 (43). С. 191—197.
Sternin I. A. (2013) Politically incorrect national names in language consciousness of language's possessor. Political Linguistics. No. 1 (43). P. 191—197. (In Russ.)
Шнирельман В. А. СМИ, «этническая преступность» и мигрантофобия // В сб. ст.: Язык вражды против общества / ред. А. Верховицкий. М. : Центр «Сова», 2007. С. 107—150.
Shnirelman V. A. (2007) Media, «ethnic crime» and migrantophobia. In: Verkhovitsky A. (ed.) The language of enmity against society. Moscow: «Sova». P. 107—150. (In Russ.)
Alexandrov D., Gorgadze A., Musabirov I. (2016) Virtual Caucasus on VK Social Networking Site. Proceedings of the 8th ACM Conference on Web Science: WebSci '16/ 00000. New York, NY, USA: ACM. P. 215—217.
Apishev M., Koltcov S., Koltsova O., Nikolenko S., Vorontsov K. (2016) Mining Ethnic Content Online with Additively Regularized Topic Models. Computacion y Sistemas. Vol. 20. No 3. P. 387—403.
Bischoping K. (1993) Gender differences in conversation topics, 1922—1990. Sex Roles. Vol. 28. No 1—2. P. 1—18.
Brubaker R. (2009) Ethnicity, race, and nationalism. Annual Review of Sociology. Vol. 35. P. 21—42.
CarterB. (2010) Fenton S. Not Thinking Ethnicity: A Critique of the Ethnicity Paradigm in an Over-Ethnicised Sociology. Journal for the Theory of Social Behaviour. Vol. 40. No 1. P. 1—18.
Chan J., Ghose A., Seamans R. (2016) The internet and racial hate crime: Offline spillovers from online access. MIS Quarterly: Management Information Systems. Vol. 40. No 2. P. 381—403.
Connie S. A., Salam A. F. (2013) Critical Discourse Analysis: Toward Theories in Social Media. Proceedings of the Nineteenth Americas Conference on Information Systems, Chicago, Illinois, August 15—17. URL: https://pdfs.semanticscholar.org/e249/c28 9b092cf2fae8e15d60521e0158415e65d.pdf (accessed: 21.08.2017).
Dijk T. A. van. (1984) Prejudice in Discourse: An analysis of ethnic prejudice in cognition and conversation. Prejudice in Discourse. John Benjamins Publishing.
Diminescu D, Loveluck B. (2014) Traces of dispersion: Online media and diasporic identities. Crossings: Journal of Migration & Culture. Vol. 5. No 1. P. 23—39.
Gender Considerations in Online Consumption Behavior and Internet Use (2016) Ed. by R. English, R. Johns. IGI Global.
Grasmuck S., Martin J., Zhao S. (2009) Ethno-Racial Identity Displays on Facebook. Journal of Computer-Mediated Communication. Vol. 15. No 1. P. 158—188.
Mazman S. G., Usluel Y. K. (2011) Gender Differences in Using Social Networks. Turkish Online Journal of Educational Technology. TOJET. Vol. 10. No 2. P. 133—139.
Nikolenko S. I., Koltcov S, Koltsova O. (2017) Topic modelling for qualitative studies. Journal of Information Science. Vol. 43. No 1. P. 88—102.
Rosvall M., Bergstrom C. T. (2008) Maps of random walks on complex networks reveal community structure. Proceedings of the National Academy of Sciences. Vol. 105. No 4. P. 1118—1123.
Rykov Y., Nagornyy O., Koltsova O. (2017) Digital Inequality in Russia through the Use of a Social Network Site: A Cross-Regional Comparison. Communications in Computer and Information Science. (In print)
Spencer S. (2006) Race and Ethnicity: Culture, Identity and Representation. Race and Ethnicity. London: Routledge.
Suleymanova D. (2009) Tatar Groups in Vkontakte: The Interplay between Ethnic and Virtual Identities on Social Networking Sites. Digital Icons: Studies in Russian, Eurasian and Central European New Media. Vol. 1. No 2. P. 37—55.