Журналистика данных в качественной прессе: жанровые и тематические особенности
Михаил Макеенко, Александра Шилина
В статье представлены результаты исследования тематического и жанрового своеобразия публикаций, основанных на большихданных в зарубежной и российской качественной прессе за 2014-2016 гг. Проведенный анализ показал, что большинство материалов журналистики данных представляют собой комментарии автора к обработанным данным. Однако по тематике подобные материалы отличаются от публикаций традиционной журналистики не значительно: наиболее часто встречается экономическая и политическая проблематика. Авторы предлагаютинтерпретацию полученных результатов в контексте интеграции изучения воздействиядатафикации на современную журналистику.
Ключевые слова: журналистика данных, большие данные,датафикация, открытые данные, современная журналистика, жанры журналистики.
© Макеенко Михаил Игоревич
кандидат филологических наук,
доцент кафедры теории и экономики СМИ
факультета журналистики
МГУ имени М.В. Ломоносова
(г. Москва, Россия), makeenko.mikhail@smi.msu.ru
© Шилина Александра Геннадьевна
соискатель кафедры теории и экономики СМИ
факультета журналистики
МГУ имени М.В. Ломоносова,
аналитик венчурного фонда активного участия
в криптосетях Paradigm Fund
(г. Москва, Россия), alexandrashilina@mail.ru
В начале XXI в. в России и за рубежом формируется новое направление журналистики - журналистика данных (англ. data journalism). Несмотря на активное использование термина профессионалами и исследователями медиа, необходимо признать, что за прошедшие годы явление не получила четкой дефиниции, и журналистика данных остается форматом, который вызывает дискуссии в отраслевом и академическом сообществе. Первоначально термин «журналистика данных» употреблялся для обозначения использования в журналистике наряду с традиционным текстом структурированных, машиночитаемых данных (Holovaty, 2006), и наиболее распространенное позднейшее определение принципиальных отличий не содержит: это процесс «сбора, очистки, организации, анализа, визуализации и публикации данных для создания журналистских материалов» (Howard, 2014).
С нашей точки зрения, важнейшим критерием, определяющим развитие журналистики данных в 2010 гг., должно было стать распространение и проникновение в журналистику при подготовке материалов СМИ так называемых больших данных (англ. big data) - массивов данных огромных объемов и многообразия, которые из-за этих критериев не могут быть собраны,
сохранены и проанализированы без специальных программных инструментов обработки. При этом, как показывает опыт и первые результаты нашего исследования, далеко не всегда публикации, относимые сообществом к журналистике данных, содержат в качестве первоисточника именно большие данные в их признанном понимании, часто материалы основываются на наборах крупных цифровых данных, не требующих для обработки сложных программных инструментов.
Учитывая этот фактор, в нашей статье мы разграничиваем большие данные в их принятом обозначении и выделяемые нами количественные данные - гибридный тип данных, являющийся основой большинства публикаций зарубежной и отечественной журналистики данных. Под количественными данными мы предлагаем понимать наборы данных небольших объемов и разнообразия, которые могут быть обработаны человеком с использованием любого из существующих традиционных статистических инструментов: статистические данные, данные социологических исследований, рейтинги и пр., уже давно являющиеся привычными информационными поводами в журналистике.
Это положение позволяет нам провести разграничение между журналистикой данных в широком понимании, охватывающей целый спектр материалов, публикуемых в соответствующих рубриках, и условной журналистикой больших данных как специализированного направления в журналистике, когда материалы создаются с использованием информации, полученной из соответствующих по масштабам и сложности обработки цифровых баз данных.
Соответственно, в рамках статьи мы используем следующее рабочее определение журналистики данных: журналистика данных - это направление в журналистике, основой которого является обработка любых так называемых количественных
данных, которые могут служить информационным поводом или быть частью материала, обогащая его. При этом особое значение приобретает визуальная презентация этих данных аудитории. В то же время в статье отдельное внимание уделено условной журналистике больших данных -направлению, в основе которого лежит работа журналиста именно с большими данными в соответствии с их пониманием современными специалистами как цифровой информации, которую невозможно обрабатывать традиционными способами.
Цель данной статьи - выявить отличительные характеристики публикаций журналистики (больших) данных, в частности их тематическое и жанровое своеобразие.
Степень разработанности темы исследования
Практики журналистики данных пока в достаточной степени не систематизированы и не отражены комплексно в научной литературе. Базовыми для изучения характеристик больших данных и их использования в журналистике являются работы С. Парази, (2015), С.К. Льюиса и О. Уэстлунда (2015), исследование влияния инноваций на работу журналистов А. Гюннильда (2014) и анализ последствий появления вычислительной журналистики и журналистики данных на работу в редакциях М. Коддингтона (2015). Значительное место занимают работы, посвященные изучению специфики журналистики данных разных стран, в частности исследования специфики американской журналистики данных Л. Финк и К. Андерсона (2015); работы журналиста с цифровыми данными в редакциях Чикаго С. Парази и Е. Да-гираль (2012) и Нью-Йорка В. Уэбера и Х. Ролла (2013). Первые попытки осмысления становления британской журналистики данных предприняли Э. Борхес-Рэй (2016, 2017), Л. Ханнафорд (2015) и М. Найт (2015). Одна из наиболее полных класси-
фикаций материалов журналистики дан- 360 публикаций (по 180 в каждом издании, ных предлагается в работе Ф. Штальфа по 60 в год).
(2017). Для определения универсальных Выбор практик этих изданий как наибо-характеристик журналистики данных он лее показательных кейсов обусловлен не опирается на метод контент-анализа при только их востребованностью среди чита-изучении публикаций ведущих британ- телей и авторитетностью у профессиональ-ских и немецких качественных изданий. ного сообщества, но и более прикладными Результаты исследования показывают, что для нашего контекста характеристиками: журналисты полагаются преимущественно они оказались среди первых медиа, начав-на предварительно обработанные данные, ших целенаправленно развивать журнали-полученные от национальных организа- стику данных, при этом они «маркируют» ций и правительственных органов; самая подобные материалы с помощью специ-распространенная тематика публикаций - ально созданных онлайн-разделов. По-политическая, темы - параллельные тра- следнее, с одной стороны, упрощает пра-диционным новостям. ктическую задачу по отбору публикаций
В российском академическом сообществе для исследования, а с другой - позволяет исследования журналистки данных мало- видеть в них концентрированный пример числены. Использованию новых форматов понимания журналистики данных как за-цифровых данных в отечественной журна- падным академическим сообществом, так листике посвящены работы А. Валеевой и журналистами и редакторами, которые (2017), С. Вартанова (2017), И. Радченко и чаще всего при изучении или обсуждении А. Сакоян (2014), М. Шилиной (2013) и др. данного предмета ссылаются именно на Большинство авторов подчеркивают, эти ресурсы как показательные. При этом что журналистика данных до сих пор на- необходимо оговорить, что опыт двух из-ходится на этапе становления и изучают даний может рассматриваться в большей ее, основываясь на методах наблюдения степени как кейсы, но при этом в них за счет и интервьюирования. В нашей статье мы показательности объектов отражается, на изучаем контент журналистики данных ко- наш взгляд, и общее состояние журналис-личественными методами. тики данных в настоящий момент.
Первичная выборка публикаций The Методика исследования Guardian Datablog - сплошная. Публикации
Основные методы, используемые в на- The Upshot отбираются методом случайно-шем исследовании, - кейс-стади на осно- го отбора из генеральной совокупности ве количественного контент-анализа двух (простая вероятностная выборка) для ре-зарубежных изданий и контент-анализ при левантного сравнения с публикациями The изучении отечественных СМИ. Характери- Guardian Datablog. Тематика и жанр изуча-стики журналистики данных изучаются на ются в публикациях, основанных не просто материалах 2014-2016 гг., когда она уже на количественных, но на больших данных широко представлена в медиа и активно (139 статей в двух изданиях), и сравнива-изучается академическим сообществом. ются с тематикой и жанровыми особенНа первом этапе рассматриваются ностями публикаций основных изданий, публикации журналистики данных веду- размещенных на сайтах The Guardian и The щих глобальных СМИ - зарубежных газет New York Times от 28 марта 2018 г. В этот и The Guardian и The New York Times, размещае- предшествовавшие дни не происходило мые на их сайтах в специализированных событий, которые привлекали бы к себе разделах The Guardian Datablog и The Upshot: повышенное внимание и потенциально
могли исказить тематический и жанровый но крупные подкатегории: политика, эко-баланс, складывающийся в изучаемых из- номика/бизнес, здравоохранение, спорт,
даниях. При этом массив публикаций (126), преступность, культура, образование/тех-вышедших за один день, видится нам до- нологии/социальные отношения /природ-статочным для того, чтобы дать представ- ные явления, другое (потенциально - нау-ление об использовании в газетах опре- ка, мода, путешествия и пр.). Применяемая
деленных жанров и тематик. в данном исследовании классификация
На втором этапе исследуются публикации создавалась с опорой на классификатор
авторитетных российских качественных из- Ф. Штальфа (2017), который пользовался
даний «Коммерсант daily»,«Новая газета», им при изучении журналистики данных в
«Деньги», «Власть», «РБК», Forbes, The New ведущих зарубежных изданиях. (Отметим, Times. По итогам первичного мониторин- что мы посчитали нецелесообразным вы-
га выявляются публикации журналистики делять очень узкие тематические группы данных, релевантные материалам в зару- на этапе первичного анализа.) бежной качественной прессе (1564 статьи), Категория «жанр» рассматривается по
основанные на количественных данных и объединенной классификации А.В. Колес-
больших данных. Материалы, содержащие ниченко 2008 и 2018 гг. В работе 2008 г. ав-большие данные (171 статья в семи изда- тор выделяет следующие жанры журналис-
ниях), анализируются по той же схеме, что тики: комментарий, аналитическая статья, и зарубежные публикации. Для подтвер- расширенная новость, короткая новость,
ждения возможного наличия в публикаци- «песочные часы», экспертное интервью,
ях журналистики данных тематической и информационное интервью, личностное жанровой специфики публикации, осно- интервью, ньюс-фиче, фиче, репортаж, порт-ванные на больших данных, сравнивают- рет (Колесниченко, 2008). В статье 2018 г. ся с другими материалами рассматрива- представлены также жанры, как расширен-
емых изданий. Дополнительно изучаются ная новость, аналитическая статья, корот-
все 168 материалов в семи изданиях за один кая новость, репортаж, портрет, колонка, день - 25 июня 2016 г., по тому же крите- случай/житейская история, подборка, ре-
рию, что и зарубежные эмпирические объ- комендация, реконструкция, тест, рецен-екты. Исследуются следующие номера из- зия, тест-драйв, мультимедийный лонгрид
даний от 25.07.2016 г.: «Власть» № 29 (1184), (формат), опрос (знаменитостей, публики),
«Деньги» № 29 (1087), «Коммерсантъ» № кейс, ответ, карточки, онлайн-трансляция,
132/П (5882), «Новая газета» № 80. Для расследование, анонсирование книг, об-
The New Times выбран выпуск № 22 (412) зор матча (Колесниченко, 2018). от 27 июня 2016 г. (ближайший к условной В рамках нашего исследования при дате номер, так как 25 июня 2016 г. жур- изучении жанровых особенностей пуб-
нал не выходил). Анализируются отдельно ликаций категория «жанр» разбивается
взятые июльские номера журналов «РБК» на следующие подкатегории: «песочные
и Forbes за 2016 г., условно привязанные к часы», информационное интервью, ньюс-
выбранной дате. фиче, экспертное интервью, личностное На заключительном третьем этапе ис- интервью, комментарий (в том числе как
следования сравниваются тематические и комментарий к данным), фиче, расширен-жанровые особенности публикаций зару- ная новость, аналитическая статья, корот-
бежной и российской журналистики данных. кая новость, репортаж, портрет, колонка,
В рамках исследования категория «тема- случай/житейская история, подборка, ре-
тика» разбивается на следующие достаточ- комендация, реконструкция, тест, рецен-
25
Таблица 1. Тематика публикаций, основанных на больших данных, в материалах онлайн-ресурсов The Guardian Datablog и The Upshot, 2014-2016 гг.
Таблица 2. Жанры публикаций,основанных на больших данных, на онлайн-ресурсах The Guardian Datablog и The Upshot, 2014-2016 гг.
Тема Число публикаций, n=139
Экономика / бизнес 37
Политика 29
Здравоохранение 20
Спорт 11
Преступность 10
Культура 4
Образование 2
Природные явления 2
Социальные проблемы 2
Технологии 2
Другое 20
Жанр Число публикаций, n=139
Комментарий 64
Аналитическая статья 27
Расширенная новость 25
Карточки 5
Короткая новость 3
Кейс 2
Подборка 2
Тест 2
Экспертное интервью 2
Информационное интервью 1
Репортаж 1
Ньюс-фиче 1
Портрет 1
Другое 3
зия, тест-драйв, мультимедийный лонгрид (формат), опрос (знаменитостей, публики), кейс, ответ, ка рточ ки, онлайн -трансляция, расследование, анонсирование книг, обзор матча. Мы понимаем, что публикации журналистики данных могут не включать некоторые из перечисленных жанров, однако подробная классификация представляется нам необходимой при изучении материалов традиционной журналистики рассматриваемых изданий и сравнении выявленных жанровых особенностей с характеристиками публикаций,основанных на больших данных.
Результаты исследования
В ходе первого этапа исследования выявляются обобщенные характеристики контента зарубежной журналистики данных - тематическое и жанровое своеобразие публикаций.
Мы видим, что публикации The Guardian Datablog и The Upshot, основанные на больших данных, не раскрывают особые или специализированные темы (см. табл. 1). Большинство из них посвящено бизнесу и различным аспектам экономики (37 публикаций из 139), а также политическим процессам и явлениям (29). Теме здравоохранения посвящено 20 публикаций, спорту - 11, преступности - 10, культуре - 4, образованию, природным явлениям, социальным проблемам и технологиям - по 2. В остальных 20 публикациях доминирует другая тематика, не охваченная классификатором (мода, путешествия, наука и пр.).
Доминирующий жанр в публикациях зарубежной журналистики данных - комментарий (см. табл. 2). Большинство материалов представляют собой авторский текст с пояснением к проанализирован -
Таблица 3. Соотношение жанров материалов The Guardian Datablog и The Upshot, основанных на больших данных, и материалов The Guardian и The New York Times от 28 марта 2018 г.
Жанр Доля жанров в публикациях The Guardian Datablog и The Upshot, основанных на больших данных, n=139 (%) Доля жанров в публикациях The Guardian и The New York Times от 28 марта 2018 г., n=126(%)
Комментарий 46 6
Аналитическая статья 19 10
Расширенная новость 18 37
Карточки 4 0
Короткая новость 2 7
Кейс 1 0
Подборка 1 0
Тест 1 0
Экспертное интервью 1 4
Информационное интервью 1 0
Репортаж 1 6
Ньюс-фиче 1 0
Портрет 1 4
Личностное интервью 0 2
Колонка 0 5
Рецензия 0 5
Обзор 0 5
Фиче 0 2
Житейская история 0 2
Некролог 0 2
Анкета 0 1
Обзор матча 0 1
Очерк 0 1
Мультимедийный лонгрид 0 2
Другое 2 0
ным данным (64 из 139). Другие жанры - на сайте результаты визуализации дан-аналитическая статья (27) и расширенная ных без какой-либо текстовой состав-новость (25). Встречаются также материалы ляющей.
в форме карточек, подборок, тестов. Три Для выявления тематической и жан-публикации не были отнесены нами ни ровой специфики журналистики данных к одному жанру, предложенному в клас- публикации сравниваются с материалами сификации А.В. Колесниченко, так как основных изданий The Guardian и The New они представляют собой размещенные York Times, размещенными на сайтах газет
27
Таблица 4. Соотношение тематики публикаций The Guardian Datablog и The Upshot, основанных на больших данных, и публикаций The Guardian и The New York Times от 28 марта 2018 г.
Тема Доля в публикациях The Guardian Datablog и The Upshot, основанных на больших данных, n=139 (%) Доля в публикациях The Guardian и The New York Times от 28 марта 2018 г., n=126 (%)
Экономика / бизнес 27 6
Политика 21 19
Здравоохранение 14 5
Спорт 8 10
Преступность 7 6
Культура 3 15
Образование 1 1
Природные явления 1 2
Социальные отношения 1 2
Технологии 1 7
Другое 14 26
за один день - 126 публикаций (выборка - Сравнение материалов The Guardian и The сплошная) (см. табл. 3, 4). New York Times и публикаций журналистики
Публикации The Guardian и The New York данных в специализированных разделах Times в основном посвящены политике, куль- показывает, что публикации, основанные туре и спорту. Часть статей раскрывает те- на больших данных, обладают меньшим мы преступности, экономики, технологий, тематическим и жанровым разнообразием. здравоохранения. В нескольких публика- На втором этапе исследования изучается циях освещаются события, связанные с тематика и жанр публикаций, основанных природными явлениями и социальными на больших данных в российской прессе. проблемами. Около четверти публикаций Выявляется, что большинство рассматри-(33 из 126) затрагивают другие специали- ваемых публикаций посвящено бизнесу зированные темы, не вошедшие в класси- и различным аспектам экономики (54 пуб-фикатор. Так, значительная часть материа- ликации из 171), а также политическим ас-лов посвящена моде, науке, путешествиям, пектам. Теме культуры (включающей кино, вопросам, связанным с недвижимостью, искусство и др.) - 13 публикаций, здраво-проведением досуга, едой и др. В выбор- охранению и медицине - 9, преступности ку попали также три некролога. Подобное и образованию - по четыре, спорту, при-разнообразие тем в публикациях класси- родным явлениям и социальной пробле-ческой журналистики наглядно подчерки- матике - по три. В значительной части пуб-вает ее отличие от журналистики больших ликаций доминирует другая тематика, не данных, где чаще всего материалы пред- охваченная классификатором (31 из 171): ставлены в форме расширенной новости, туризм, демография, наука и др. (см. табл. 5). аналитической статьи, репортажа, корот- Жанровое своеобразие рассматрива-кой новости, интервью. Реже встречаются емых публикаций заключается в том, что обзор, комментарий, рецензия и портрет. они чаще всего представляют собой ком-
Таблица 5. Тематика публикаций, основанных на больших данных, в российских качественных изданиях, 2014-2016 гг.
Таблица 6. Жанры публикаций, основанных на больших данных, в российских качественных изданиях, 2014-2016 гг.
Тема Число публикаций, п=171
Экономика / бизнес 54
Политика 47
Культура 13
Здравоохранение 9
Преступность 4
Образование 4
Спорт 3
Природные явления 3
Социальные отношения 3
Технологии 0
Другое 31
Жанр Число публикаций, п=171
Комментарий 66
Расширенная новость 35
Аналитическая статья 29
Расследование 8
Мультимедийный лонгрид 7
Карточки 6
Подборка 5
Короткая новость 4
Репортаж 4
Ньюс-фиче 2
Опрос (знаменитостей, публики) 2
Кейс 2
Колонка 1
Иное 0
Таблица 7. Соотношение тематики публикаций в российских качественных изданиях 25 июля 2016 г. и публикаций, основанных на больших данных, в российских качественных изданиях в 2014-2016 гг.
Тема Доля в публикациях российской качественной прессы, 25 июля 2016 г., п=168(%) Доля в публикациях российской качественной прессы, основанных на больших данных 2014-2016 гг., п=171 (%)
Экономика / бизнес 24 32
Политика 17 27
Культура 16 8
Преступность 11 2
Спорт 9 2
Здравоохранение 8 5
Образование 3 2
Природные явления 1 2
Социальные отношения 2 2
Технологии 2 0
Другое 7 18
29
Таблица 8. Соотношение жанров публикаций в российских качественных изданиях 25 июля 2016 г. и публикаций, основанных на больших данных, в российских качественных изданиях в 2014-2016 гг.
Жанр Доля в публикациях российской качественной прессы, 25 июля 2016 г., 11=168 (%) Доля в публикациях российской качественной прессы, основанных на больших данных, 2014-2016 гг., п=171 (%)
Короткая новость 21 2
Аналитическая статья 11 17
Колонка 9 1
Расширенная новость 8 20
Кейс 7 1
Экспертное интервью 5 0
Карточки 5 4
Репортаж 5 2
Реконструкция 4 0
Личностное интервью 4 0
Рецензия 3 0
Случай / житейская история 2 0
Обзор 2 0
Подборка 2 3
Информационное интервью 2 0
Расследование 1 5
Тест-драйв 1 0
Рейтинг 1 0
Ответ на вопрос 1 0
Песочные часы 1 0
Анонс 1 0
Портрет 1 0
Очерк 1 0
Ньюс-фиче 1 1
Некролог 1 0
Рекомендация 1 0
Комментарий 0 39
Мультимедийный лонгрид 0 4
Опрос (знаменитостей, публики) 0 1
Иное 0 0
Таблица 9. Соотношение тематики публикаций, основанных на больших данных, в зарубежных и российских качественных изданиях, 2014-2016 гг.
Тема Доля публикаций (%)
Зарубежные, п=139 Российские, п=171
Экономика / бизнес 27 32
Политика 21 27
Здравоохранение 14 5
Спорт 8 2
Преступность 7 2
Культура 3 8
Образование 1 2
Природные явления 1 2
Социальные отношения 1 2
Технологии 1 0
Другое 14 18
Таблица 10. Соотношение жанров публикаций, основанных на больших данных, в зарубежных и российских качественных изданиях, 2014-2016 гг.
Жанр Доля публикаций (%)
Зарубежные, п=139 Российские, п=171
Комментарий 46 39
Аналитическая статья 19 17
Расширенная новость 18 20
Карточки 4 4
Короткая новость 2 2
Кейс 1 1
Подборка 1 3
Тест 1 0
Экспертное интервью 1 0
Информационное интервью 1 0
Репортаж 1 2
Ньюс-фиче 1 1
Портрет 1 0
Расследование 0 5
Мультимедийный лонгрид 0 4
Опрос (знаменитостей, публики) 0 1
Колонка 0 1
Другое 2 0
31
ментарии к проанализированным данным. встречаемыми являются публикации на Также встречаются расширенная новость, экономические и политические темы, в рос-аналитическая статья, расследование, муль- сийской прессе большее внимание уделя-тимедийный лонгрид, репортаж. Часть ста- ется культурной проблематике - 8% от пуб-тей, попавших в выборку, представлена в ликаций (3% в зарубежных СМИ). В свою жанрах, характерных для онлайн-СМИ - очередь, среди публикаций зарубежной в форме карточек, подборки, кейса (см. журналистики данных чаще встречаются табл. 6). материалы на тему спорта (8%, в россий-
Для выявления тематической и жан- ской прессе - 2% ), преступности (7% и ровой специфики журналистики больших 2% соответственно) и здравоохранения данных публикации сравниваются с дру- (14%, в российских СМИ - 5%). Значитель-гими материалами рассматриваемых из- ная часть материалов посвящена другим, даний: дополнительно изучаются мате- специализированным темам (см. табл. 9). риалы за один условный день - всего 168 Публикации российской и зарубежной публикаций (см. табл. 7, 8). качественной прессы, основанные на боль-
Сравнение показывает, что публикации, ших данных, обладают определенной жанро-основанные на больших данных, отобран- вой спецификой: большинство материалов ные в ходе мониторинга на первом этапе представляют собой комментарии автора исследования, не значительно отличают- к обработанным данным. Особенностью ся от традиционных журналистских мате- российской журналистики данных являет-риалов, представленных в российской ка- ся то, что часть ее материалов создается в чественной прессе. Так, экономика, поли- жанре расследований и в формате мульти-тика и культура являются наиболее часто медийных лонгридов, при том что подоб-встречающимися темами как в большинст- ная практика полностью отсутствует в пуб-ве материалах журналистики данных, так и ликациях зарубежной прессы. Возможно, в традиционных публикациях российской на это соотношение повлиял тот факт, что прессы. Однако при этом в публикациях в российскую выборку попали издания, в журналистики данных встречается меньше которых публикуются материалы, ориен-материалов, посвященных теме преступ- тированные на крупные журналистские ности, характерных для общественно-по- формы (см. табл. 10). литических изданий. Соотношение другой
тематики примерно одинаково. Выводы и дискуссия
Публикации журналистики данных ме- Анализ и интерпретацию данных, полу-нее разнообразны по жанру. Чаще всего ченных при изучении зарубежных кейсов они представлены в форме комментариев и российского опыта, можно проводить в к данным. Остальные публикации изданий рамках двух контекстов. Первый из них, создаются в широком диапазоне жанров: более узкий, связан с выявлением харак-от классических информационных - ин- теристик непосредственно журналистики тервью, расширенной и короткой новости, данных. Второй же может быть более ши-«песочных часов» и др. - до тест-драйвов, роким и ориентированным на дискуссии некрологов, рейтингов и анонсов. о развитии современной журналистики
На третьем этапе исследования выяв- в целом. ляется различие набора жанров и темати- Собранные данные показывают мини-ки изученных публикаций зарубежной и мальные различия в тематических и жан-российской журналистики больших дан- ровых доминантах отобранных образцов ных. Несмотря на то, что наиболее часто российской и зарубежной журналистики
(больших) данных, что может быть основанием для того, чтобы говорить о формировании универсальной модели журналистики (больших) данных. В рамках нашего исследования замеры происходили по укрупненным тематическим группам и показали доминирование политической и экономической тематики. Немного более высокий интерес к криминалу и здравоохранению в англо-американских изданиях и к культуре в отечественных можно объяснить как национальными особенностями, так и форматом попавших в выборку изданий. При этом дальнейшее развитие «тематического подхода» видится нам в детализации классификатора - например, с ориентацией на опыт российских контент-аналитических исследований последних лет (Свитич, Смирнова, Ширяева, Шкондин и др., 2016).
Анализ жанровых доминант выявил преобладание в журналистике (больших) данных аналитических жанров (в первую очередь, комментария и аналитической статьи) при меньшем разнообразии жанровой палитры по сравнению с контентом ведущих качественных изданий в целом. Доли расширенной новости в выбранных российских и зарубежных образцах журналистики данных тоже почти совпадают и составляют около одной пятой изученного контента. Важным направлением для дальнейшего сбора информации и научной рефлексии может стать выявление того, насколько такое соотношение жанров естественно для журналистики данных и насколько использование (больших) данных как основы инфоповода влияет на выбор редакциями тех или иных жанров/групп жанров.
Такие направления исследовательского интереса могут стать основой для развития эмпирических исследований и теоретиче-
ского осмысления отечественными специалистами темпов и масштабов изменений, происходящих в журналистике под влиянием цифровизации и производной от нее медиаконвергенции. Изучение их влияния на журналистские культуры (Hanitzsch, Hanusch, Mellado, Anikina M. et al., 2011; Anikina, 2014), рабочие практики (Галкина, Вырковский, Колесниченко, Образцова, 2016; Вырковский, Галкина, Колесниченко, Образцова и др., 2017; Баранова, 2017) и конечный продукт - медиатексты (Колесниченко, 2018; Вырковский, Галкина, Колесниченко, Образцова, 2016; Фомичева и др., 2019) показывают, что вызванные цифровизацией изменения в журналистике происходят медленнее и точечнее, чем часто представляется. На наш взгляд, все более актуальным становится интеграция в отечественный научный дискурс дата-фикации, как еще одного производного от цифровизации, и ее влияние на журналистскую работу и тексты.
Использование результатов обработки больших данных в журналистике потенциально должно оказывать влияние на сегмент журналистики (больших) данных и формировать у нее определенные специфические черты. Полученный нами опыт изучения журналистских практик и основных характеристик опубликованных текстов позволяет, с одной стороны, считать, что по ключевым критериям журналистика (больших) данных практически не выбивается сегодня из актуальных тенденций развития журналистики в целом и вызывает такие же плавные и точечные трансформации. С другой - отмеченные на настоящем этапе отдельные специфические черты все-таки могут говорить о потенциале исследований эффектов датафикации при выявлении воздействия цифровизации на современную журналистику.
33
Библиография
Баранова Е.А. Новые журналистские компетенции в условиях медиаконверген-ции: мифы и реальность// Вестн. РУДН. Сер.: Литературоведение. Журналистика. 2017. Т. 22. № 1. С. 177-188.
Вартанов С.А. Большие данные в онлайн-СМИ: подходы и стратегии использования // Медиаскоп. 2017. Вып. 4. Режим доступа: http:www.mediascope.ru/2375
Вырковский А.В., Галкина М.Ю., Колесниченко А.В., Образцова А.Ю. Жанровая структура работы журналиста // Вестн. Воронежск. гос. ун-та. Сер.: Филология. Журналистика. 2016. № 2. С. 86-92.
Вырковский А.В., Галкина М.Ю., Колесниченко А.В., Образцова А.Ю. и др. Мультимедийные элементы в современном медиатексте// Медиаскоп. 2017. Вып. 3. Режим доступа: http://www.mediascope.ru/2364
Галкина М.Ю., Вырковский А.В., Колесниченко А.В., Образцова А.Ю. Конвергенция в работе российского журналиста // Медиаскоп. 2016. Вып.1. Режим доступа: http:// www.mediascope.ru/node/2079
КолесниченкоА.В. Востребованность жанров журналистских текстов в онлайновых СМИ // Вестн. Моск. ун-та. Сер. 10: Журналистика. 2018. № 1. С. 26-42. DOI: 10.30547/ vestnik.journ.1.2018.2642
Колесниченко А.В. Практическая журналистика: учеб. пособие. М.: Изд-во Моск. ун-та, 2008.
Свитич Л.Г., Смирнова О.В., Ширяева А.А., Шкондин М.В. и др. Газеты средних и малых городов России в 2010-х гг. Контент-аналитическое исследование: колл. моногр. М.: Фак. журн. МГУ, 2016.
Фомичева И.Д. и др. Анализ качества медиатекстов на столичных информационно-разговорных радиостанциях // Вестн. Санкт-Петербургск. ун-та. Язык и литература. 2019. Т. 16. № 1. С. 48-65. DOI: 10.21638/spbu09.2019.104
Шилина М.Г. Data Journalism - дата-журналистика, журналистика метаданных -в структуре медиакоммуникации: к вопросу формирования теоретических исследовательских подходов // Медиаскоп. 2013. Вып. 1. Режим доступа: http://www.mediascope. ru/node/1263
Anikina M. E. (2014) Journalism as a Profession in the First Decades of the 21st Century: the Russian Context. World of Media. Journal of Russian Media and Journalism Studies: 233-252.
Borges-Rey E. (2017) Towards an Epistemology of Data Journalism in the Devolved Nations of the United Kingdom: Changes and Continuities in Materiality, Performativity and Reflexivity. Journalism. DOI: 10.1177/1464884917693864
Borges-Rey E. (2016) Unravelling Data Journalism: A Study of Data Journalism Practice in British Newsrooms. Journalism Practice 10 (7): 833-843. DOI: 10.1080/17512786.2016.1159921 Coddington M. (2015) Clarifying Journalism's Quantitative Turn: A Typology for Evaluating Data Journalism, Computational Journalism, and Computer-Assisted Reporting. Digital Journalism 3 (3): 331-348. DOI: 10.1080/21670811.2014.976400
Fink K., Anderson C. (2015) Data Journalism in the United States: Beyond the "Usual Suspects". Journalism Studies 16 (4): 467-481. DOI: 10.1080/1461670X.2014.939852
Gynnild A. (2014) Journalism Innovation Leads to Innovation Journalism: The Impact of Computational Exploration on Changing Mindsets. Journalism 15 (6): 713-730. DOI: 10.1177/1464884913486393
Hanitzsch T., Hanusch F., Mellado C., Anikina M. et al. (2011) Mapping Journalism Cultures Across Nations. Journalism Studies 12 (3): 273-293. DOI: 10.1080/1461670X.2010.512502 Hannaford L. (2015) Computational Journalism in the UK Newsroom: Hybrids or Specialists? Journalism Education 4 (1): 6-21.
Holovaty A. (2006) A Fundamental Way Newspaper Sites Need to Change. Режим доступа: http://www.holovaty.com/writing/fundamental-change/
Howard A.B. (2014) The Art and Science of Data-Driven Journalism. Columbia University Academic Commons. DOI: 10.7916/D8Q531V1
Knight M. (2015) Data Journalism in the UK: A Preliminary Analysis of Form and Content. Journal of Media Practice 16 (1): 55-72. DOI: 10.1080/14682753.2015.1015801
Lewis S. C., Westlund O. (2015) Big Data and Journalism: Epistemology, Expertise, Economics, and Ethics. Digital Journalism 3 (3): 447-466. DOI: 10.1080/21670811.2014.976418 Parasie S., Dagiral E. (2012) Data-Driven Journalism and the Public Good: "ComputerAssisted-Reporters" and "Programmer-Journalists" in Chicago. New Media & Society 15: 853-871.
Parasie S. (2015) Data-Driven Revelation? Epistemological Tensions in Investigative Journalism in the Age of 'Big Data'. Digital Journalism 3 (3): 364-380. DOI: 10.1080/21670811.2014.976408 Radchenko I., Sakoyan A. (2014) The View on Open Data and Data Journalism: Cases, Educational Resources and Current Trends. In: Ignatov D.I., Khachay M.Y., Panchenko A., et al. (eds.) Analysis of Images, Social Networks and Texts. Cham: Springer, pp. 47-54.
Stalph F. (2017) Classifying Data Journalism. A Content Analysis of Daily Data-Driven Stories. Journalism Practice 12 (10): 1332-1350. DOI: 10.1080/17512786.2017.1386583
Valeeva A. (2017) Open Data in a Closed Political System: Open Data Investigative Journalism in Russia. Reuters Institute for the Study of Journalism. University of Oxford. Режим доступа: http:.reutersinstitute.politics.ox.ac.uk/sites/default/files/2017-10/Valeeva_Open%20 data%20and%20investigative%20journalism%20in%20Russia.pdf
Weber W. and Rall H. (2013) 'We are journalists': Production practices, attitudes and a case study of the New York Times newsroom. In: Weber W., Burmester M., Tille R. (eds.) Interaktive Infografiken. Berlin: Springer, pp. 161-172.