Феномен журналистики данных в зарубежных СМИ (на материале призёров конкурса ''Data Journalism Awards'')
Лисицин Макар Евгеньевич
кандидат филологических наук
соискатель, кафедра Медиаречи, Российский Государственный Гуманитарный Университет 125252, Россия, Москва область, г. Москва, ул. Новопесчаная, 19
И makarlisitsin@gmail.com
Статья из рубрики "Литературоведение"
Аннотация.
Предметом исследования являются зарубежные проекты в области журналистики данных (дата-журналистики) на материале победителей конкурса «The Data Journalism Awards» в период с 2014 по 2017 г. Несмотря на то что сам термин «журналистика данных» появился лишь в 2010 г., работы подобного толка создавались задолго до этого времени. Цель этой статьи - определить основные аспекты феномена с точки зрения зарубежных СМИ. Особое внимание уделяется стилистическим характеристикам феномена и техническим особенностям производства контента. Методы контент-анализа и индукции позволяют прийти к выводу о том, что журналистика данных предполагает наличие двух условий: база данных как источник контента и визуализация данных как способ рассказать «историю». Научная новизна исследования заключается в выявлении автором общих характеристик и особенностей проектов, что позволяет прийти к целостному пониманию феномена «журналистика данных», научный статус которого в России на данный момент не определён. Также автором выявляются ключевые различия между понятиями «инфографика», «журналистское расследование» и «журналистика данных».
Ключевые слова: журналистика данных, дата-журналистские проекты, инфографика, журналистские расследования, конкурсы по журналистике, зарубежная журналистика, открытые данные, массив данных, визуализация данных, обработка данных
DOI:
10.25136/2409-8698.2019.1.29056
Дата направления в редакцию:
22-02-2019
Дата рецензирования:
23-02-2019
Дата публикации:
23-02-2019
Понятие журналистики данных
Термин «журналистика данных» появился в 2010 г., когда немецкий журналист Мирко Лоренц (Mirko Lorenz) и Европейский центр журналистики организовали первую международную конференцию по журналистике данных в Амстердаме. Обычно под журналистикой данных (далее - ЖД) понимают направление в журналистике, при котором журналистом производится анализ крупных массивов данных и их последующая визуализация с целью выявить некую закономерность или факты. Термин был сформулирован в связи с ростом объёма открытых данных в Интернете - то есть данных, которые государственные и другие учреждения публикуют в открытом доступе.
ЖД активно исследуется в США[15], Великобритании i13—18—17—Согласно исследованию, проведённому профессором Университетского колледжа Дублина Бахаре Херави (Bahareh Heravi), на 2018 год в мире существует 219 образовательных модулей, в рамках которых изучается ЖД, причём 146 из них преподаются в США и 12 - в Великобритании. В России также есть магистерская программа «Журналистика данных», которая читается в Высшей Школе Экономики. Академическим руководителем программы является В. С. Бережная. Пол Брэдшоу (Paul Bradshaw) в «Пособии по журналистике данных» писал, что Ж Д может помочь журналисту рассказать сложную «историю» с помощью инфографики, а также объяснить, какое отношение она имеет непосредственно к читателю. Данные, по мнению учёного, могут быть как источником ЖД, так и
инструментом, с помощью которого автор рассказывает «историю» [14, с 9-10]. Эрон Пилхофер (Aron Pilhofer) описывает ЖД как «зонтичный термин», к которому можно
отнести различные инструменты, техники и подходы к сторителлингу [14, с 11]. Профессор Б. Херави понимает ЖД как «способ находить ''истории'', интересные аудитории, в данных, и рассказывать эти ''истории'' в наиболее адекватной манере для публичного
пользования» USi. С. Роджерс, главный редактор дата-журналистского блога британской «Гардиан», в своей книге «Facts Are Sacred» отмечает, что корни ЖД лежат в сфере «публичных данных». По его мнению, с тех пор как в 2009 г. был запущен сайт открытых данных data.gov, был установлен принцип: все государственные данные должны быть раскрыты и доступны публично. Роджерс считает эту дату ключевой в развитии Ж Д. Он
даже называет ЖД «журналистикой открытых данных» [18———308-312]. В главе «Genealogies of Data Journalism» второго издания «Пособия по журналистике данных» К.У. Андерсон затрагивает историю («генеалогию») ЖД. Учёный называет дата-журналистов «апостолами уверенности», отмечая, что они стремятся создавать контент, свободный от принадлежности к какому-либо политическому течению. Это удаётся им благодаря тому, что данные в материале Ж Д и являются самим журналистским контентом.
Журналистика данных развивается на Западе достаточно быстро: проводятся профильные конференции; многие крупнейшие СМИ создают соответствующие колонки и в некоторых случаях команды и департаменты, ответственные за производство контента. Исследователи соглашаются в том, что ЖД тесно связана с публичными, открытыми данными. Отмечаются такие характеристики ЖД как объективность и использование графических инструментов для представления информации.
Среди отечественных учёных и практиков феномену уделяют внимание С. И. Симакова [7-9], М.А. Пильгун [5], И. В. Бегтин Ш, В. В. Росликова [6], М. Н. ШестрюковаП. П. Чернецкий А. Г. Шилина [12]. И. В. Бегтин так характеризует ЖД: «Это данные и
история, вместе поданные как единое целое и предоставляемые через современные
интерфейсы» -Ш. В. В. Росликова определяет ЖД как «повествование с опорой на базы данных и как непосредственно сами структурированные данные (отсылка к исконному
значению слова «data»)» с 162].По мнению С. И. Симаковой, ЖД - это в первую очередь обобщение большого массива данных, которые могут служить инструментом для того, чтобы показать историю, либо фундаментом для неё, либо и тем и другим
одновременно с-—I67!. А. Г. Шилина, исследуя дата-журналистские публикации в отечественных журналах, выявляет следующие характеристики ЖД: полисубъектность, доминирование вербального контента, статическая визуализация, отсутствие интерактивности, плотное взаимодействие с аудиторией. Анализируя материал в журналах «Власть», «Деньги», «Форбс», «Секрет фирмы» и «Эксперт», учёный делает вывод о том, что российские авторы дата-журналистского материала пока что не
ассоциируют свои работы с проектами ЖД -12, с 13-141. м. А. Пильгун характеризует ЖД как «направление, в основе которого лежат обработка данных и их использование для создания журналистского материала». Учёный указывает на то, что контент ЖД может быть представлен в различных формах: инфографика, интерактивная карта или график. Она также отмечает такую важную характеристику ЖД как объективность -t^.
Итак, российские учёные соглашаются на том, что материал ЖД создаётся с опорой на проанализированный массив данных. Тем не менее, разные учёные делают акцент на разных характеристиках ЖД, считая их значимыми для понимания природы феномена. Из представленных дефиниций становится ясно, что ЖД тесно связана с визуальными способами представления информации и инфографикой как таковой, однако границы между этими понятиями могут быть неясны без углубления в суть каждого из терминов.
Приняв во внимание различные определения понятия, можно сказать, что его научный статус определён неясно. Несмотря на то что его официальная история не насчитывает и десяти лет, проекты, попадающие под «формат» ЖД, можно найти задолго до времени зарождения термина. Это наводит на мысль о том, что применяемые дата-журналистами методы не новы - новы, скорее, инструменты, помогающие в обработке данных и подготовке визуализаций. В этой статье мы попытаемся выявить ряд характеристик, присущих ЖД, а также проведём различия между понятиями «ЖД», «инфографика» и «журналистское расследование», которые часто имеют тесную взаимосвязь. В этом нам поможет анализ победителей первого и единственного международного конкурса в области ЖД «Data Journalism Awards».
Проекты конкурса «Data Journalism Awards»
Конкурс «Data Journalism Awards» проводится ежегодно с 2011 г. Мы проанализируем проекты, победившие в 3 номинациях:
1) «Лучшее расследование, основанное на данных» (Bestdata-driveninvestigation);
2) «Лучшая визуализация данных» (Best data visualisation);
3) «Лучшее приложение или сайт в области журналистики данных» (Best data journalism application or website);
Данные категории позволяют увидеть главные стороны ЖД как направления. Первая и вторая категории были выбраны с целью рассмотреть связь Ж Д с визуальными методами представления информации и расследованиями. Третья категория позволяет захватить случайные проекты, отмеченные вниманием западных медиа, что дополнит картину
феномена.
Мы последовательно рассмотрим проекты, победившие в каждой категории за 4 года (2014—2017), последовательно приведя их в 3 таблицах.
Таблица 1
Победители категории «Лучшее расследование, основанное на данных»
Год Проект Автор проекта
2014 Homes for the Taking («Дома на раздачу») «Вашингтон пост» (The Washington Post)
2015 SwissLeaks («Швейцарские утечки») ICIJ (Международный консорциум журналистских расследований)
2016 Panama Papers («Панамские бумаги») ICIJ (Международный консорциум журналистских расследований)
2017 Unfounded («Необоснованно») «Глоб энд Мейл» (Globe and Mail)
«Homes for the Taking» - серия публикаций о проблемах бездомных в США. Проект представляет собой отельную страницу на сайте «Вашингтон Пост», объединяющую серию из 19 историй, поданных в формате обычного текста, видео и инфографики. Материал характеризовали как проект, разрушивший «одну из старейших национальных систем взыскания долгов». В Округе Колумбия инвесторы девелоперских компаний исторически имели права взыскания имущества лиц, не справлявшихся с уплатой налогов. Однако данная мера превратилась, по мнению авторов проекта, в инструмент шантажа. В своём расследовании журналисты приводят примеры того, как инвесторы отбирали дома у лиц преклонного возраста, страдающих деменцией, или людей, находящихся в коме. В течение недели после публикации в Интернете материал набрал 4,5 млн. просмотров, сумев привлечь внимание муниципальных властей. Это привело к тому, что мэр города отменил все залоговые права на дома, проданные в 2013 г., а городской совет принял закон, предотвращающий возможность взыскивать права на недвижимость из-за небольшого налогового долга и защищающий пожилых людей, ветеранов и инвалидов. В ходе работы над проектом журналисты «Вашингтон Пост» отслеживали около 12 тыс. налоговых удержаний и сортировали более 120 тыс. государственных документов. Репортёры обнаружили более сотни ошибок в работе налоговой инспекции, из-за которых владельцы домов были вынуждены продолжать бороться за своё имущество даже после уплаты всех налогов.
«SwissLeaks» (от англ. «leaks» - «утечки») - журналистское расследование, проведённое Международным консорциумом журналистских расследований совместно с «Монд» (LeMonde), «Гардиан» (TheGuardian^ ещё 75 другими СМИ. Проект был назван самым масштабным сотрудничеством в истории журналистики. Расследование раскрывает, как швейцарское отделение банка HSBC сотрудничало с налоговыми уклонистами по всему миру ради собственных выгод. Благодаря французской газете «Монд» Консорциум сумел получить доступ к более чем 100 тыс. клиентам банка, владеющими активами на общую сумму более 100 млрд долларов. Консорциум объединил полученные данные и опубликовал на онлайн-платформе, которую сделал доступной для журналистов и СМИ из других стран. Итоговая страница, набравшая более 10 млн просмотров, впоследствии стала фундаментом для написания сотен статей другими СМИ. Анализ показал, что банк знал о нарушениях, что привело к возбуждению на него уголовного дела. Итогом стало возбуждение уголовного дела против банка HSBC и ещё 50 французских граждан. Руководство банка опубликовало публичные извинения
и уволило некоторых членов правления. Были возбуждены расследования в отношении публичных персон, которые были клиентами банка: например, двух бывших министров Мальты и супруги бывшего президента Сербии. При подготовке материала использовалось большое количество программ для извлечения и обработки данных, среди которых программное обеспечение для обработки данных «Talend Open Studio», система управления базами данных «SQL Server», язык программирования C#, система управления базами данных «Neo4j» и программное обеспечение для анализа социальных сетей и визуализации «Linkurious».
Призёром за лучшее расследование в 2016 году стал проект PanamaPapersупомянутого выше Международного консорциума журналистских расследований. Проект освещает утечку конфиденциальных документов панамской юридической компании «Моссак Фонсека» (Mossack Fonseca), которые были переданы немецкой газете «Зюддойче цайтунг» (Süddeutsche Zeitung)от анонимного источника в 2015 году. Консорциум изучал эти документы в течение года. Итогом стала публикация, сделанная 3 апреля 2016 г. Результаты исследования охватывают период с 1977 по 2015 г. Речь в ней идет о наличии скрытой собственности политиков нескольких стран, среди которых 12 действующих и бывших глав государств. В архиве содержится более 11,5 млн файлов с именами государственных служащих разных стран и их друзей, имеющих офшорные компании. Авторы проекта произвели обработку 2,6 терабайтов данных, покрывающих 214 тыс. оффшорных компаний. Для того, чтобы сделать это возможным, консорциум создал виртуальный отдел новостей, в котором журналисты могли общаться друг с другом без угрозы утечки информации. Его сотрудники также использовали более десятка технологических инструментов для безопасной коммуникации, извлечения текста и разработки баз данных. Среди них - упомянутые выше «Talend», «Neo4j», «Linkurious». Для извлечения данных журналисты использовали ПО «Apache Tika» и «Apache Solr», а для безопасного общения - шифровальщик «PGP», безопасную электронную почту «Hushmail» и приложение для мгновенного обмена сообщениями «Signal». В течение двух месяцев после публикации материал набрал более 70 млн. просмотров.
«Unfounded» - расследование канадской ежедневной газеты «Глоб энд мейл», длившееся на протяжении 20 месяцев. Оно посвящено раскрытию того, как канадская полиция справляется с делами о сексуальном насилии. Целью проекта, как заявляла газета, было помочь канадцам понять, с какими проблемами сталкиваются жертвы сексуального насилия в стране и, таким образом, подвести их к действиям, направленным на осуществление изменений на государственном уровне. «Unfounded» (от анг.: «необоснованно») - это метка, которую канадские полицейские присваивают делам в том случае, если считают обвинение в насилии необоснованным. Как оказалось, канадские статистики перестали вести счёт этим меткам в 2002 г. В виду этого журналисты «Глоб энд мейл» решили самостоятельно собрать эти данные из 175 полицейских участков.
Рис . 1. Карта из материала «Unfounded» («Глоб энд мейл», 2017 г.)
Опрос показал, что с 2010 по 2014 год подобная метка присваивалась к делу каждого пятого канадца, заявившего о случае насилия. Расследование также показало, что заявления о сексуальном насилии трактовались полицией как необоснованные в два раза чаще, чем заявления о физическом насилии. Результатом работы журналистов стал сайт с большим количеством интерактивных графиков, показывающих процент таких меток в каждом из участков; с примерами интервью и классической текстовой «историей». Пример графика на рисунке 1иллюстрирует, что чем больше в штате полиции женщин, чем меньше подобных меток присваивается заявлениям о сексуальном насилии. Это говорит о наличии субъективного подхода у полицейских-мужчин к делам такого рода. В ходе расследования журналисты подали более 300 запросов, ссылаясь на Закон о свободе информации. Для того чтобы отслеживать и проверять поступающие данные репортёры создали собственный инструмент, позволяющие преобразовать стандартный массив данных в различные форматы. Расследование стимулировало полицию Канады пересмотреть более 37 тыс. дел, а федеральное правительство выделило 100 млн. долларов для борьбы с гендерным насилием.
Как и всякое журналистское расследование, приведённые выше 4 проекта носят социально значимый характер и освещают острые темы: налоговые манипуляции, офшорные компании и гендерную дискриминацию. При подготовки материалов журналистами использовалось большое количество ПО для обработки и извлечения данных. В случаях «SwissLeaks» и «Unfounded» репортёры также пользовались самостоятельно разработанными инструментами. Все проекты создавались больше года. В каждом материале присутствуют в разных пропорциях текст и интерактивная графика, с помощью которой авторы транслируют читателю смысл полученных ими данных.
Таблица 2
Категория «Лучшая визуализация данных»
Год Проект Автор проекта
«Нью-Йорк
20Д4 Reshaping New York («Обновляя Нью-Йорк»)
York Times)
2015 Battling Infectious Diseases in the 20th Century: The Impac of Vaccines («Борьба с инфекционными заболеваниями в XX веке: влияние вакцин») «Уолл-Стрит Джорнэл»
2016 Spies in the Skies («Шпионы в небе») BuzzFeed
2017 Rhymes Behind Hamilton («Рифмы Гамильтона») «Уолл-Стрит Джорнэл»
Reshaping New York- это масштабная визуализация архитектурных изменений Нью-Йорка за 12 лет, в течение которых Майкл Блумберг был мэром города. Интерактивная визуализация размещена на сайте, в верхнем левом углу которого посетителю предлагается нажать на кнопку с надписью «Начать тур» (Begin the tour).
Рис . 2. Инфографика из материала «Reshaping New York» («Нью-Йорк Таймс», 2014 г.)
Далее с помощью стрелок посетитель может ознакомиться с изменениями различных районов города, сравнивая фотографии разных лет. Масштабная 3D-карта города служит своеобразным путеводителем и направляет зрителя в тот или иной район. Красным цветом отмечены здания, возведённые во время правления мэра Блумберга. Текстовые блоки в левой части экрана освещают историю строительства новых районов и отдельных зданий. Проект опирается на записи о городских постройках, что позволило включить в визуализацию более миллиона зданий. Уровень точности визуализации крайне высок: читатель может увидеть архитектурные детали и даже людей.
«Battling Infectious Diseases in the 20th Century: The Impact of Vaccines» посвящённый влиянию вакцинации на здоровье детей.
прое кт,
Рис . 3 . Инфографика из материала «Battling Infectious Diseases in the 20th Century: The Impact of Vaccines» («Уолл-Стрит джорнэл», 2015 г.)
Он отражает эффективность вакцинных мер в борьбе с корью, гепатитом А, свинкой, коклюшем, полиомиелитом, краснухой и оспой за последние 70 лет, принятых в 50 штатах США. Проект представляет собой сайт, содержащий интерактивные диаграммы, отражающие падение уровня заболеваемости каждой из болезней в каждом штате с 1930 по 2010 г., доказывая эффективность вакцинации. Он был создан, в частности, в ответ на рост в Америке в 2014 и 2015 гг. числа родителей, выступающих против вакцинации детей. В отличие от рассмотренных выше примеров в нём практически отсутствует текст - «историю» рассказывают семь интерактивных диаграмм. Благодаря точности визуализаций читатель видит очевидность эффективности вакцин. Работа вызвала отклик многих статистиков и дизайнеров, о ней писали сайты «Functional Art», «Visualising Data» и «SAS.com», а Билл Гейтс опубликовал один из графиков в своём «Твиттере». Журналисты использовали в работе программы MicrosoftExce^ Highcharts.
«Spies in the Skies» - проект американской BuzzFeed, посвящённый тому, как самолёты ФБР и Министерства Внутренней Безопасности летали над американскими городами. Для реализации поставленных задач журналисты использовали технологию машинного обучения, посредством которой «научили» компьютер отслеживать и распознавать определённые виды самолётов, сопоставляя их с данными сайта «Flightradar24» (публичный веб-сервис, позволяющий наблюдать за положением воздушных судов). За основу репортёры взяли данные о почти 20 тыс. полётах и загрузили в компьютер, который через некоторое время научился различать различные виды воздушных суден. Так репортёры сумели получить доступ к полётам самолётов ФБР (данные о которых обычно скрываются), составив карту нескольких тысяч рейсов в период с августа по декабрь 2015 г. В итоге они доказали, что представители властей активно следят за
гражданами некоторых американских штатов, держа это в тайне. Результаты расследования опубликованы на интернет-странице и включают интерактивную инфографику и текст. Именно представленные в виде карты результаты и анимация, сопоставленная со временем, позволили проекту получить премию. В работе журналисты использовали скрипты «Python» и «R».
Рис. 4. Инфографика из материала «Spies in the Skies» (BuzzFeed, 2016 г.)
Публикация «Rhymes Behind Hamilton» анализирует алгоритмы и текстовую структуру композиций в бродвейском мюзикле «Гамильтон», выпущенном в 2015 году и получившим Пулитцеровскую премию и «Грэмми». Композиции, звучащие в мюзикле, являются необычным сочетанием классического мюзикла и хип-хопа. «Уолл-Стрит джорнэл» проанализировал ряд четверостиший из нескольких песен, особое внимание уделяя рифме и стихотворному размеру, взяв за анализ фонетические исследования. Полученные результаты опубликованы на странице проекта в виде текста и интерактивной инфографики со звуком. Посетитель страницы может проиграть её, услышав отрывок из песни, и по ходу звучания инфографика будет подсвечивать каждый слог в слове, сопоставляя его с другими при помощи цвета. Репортёры также создали визуализацию, которая позволяет читателю создать своё собственное четверостишие, опираясь на алгоритм, выведенный «Уолл-Стрит джорнэл». Благодаря этим новациям проект был отмечен вниманием: создатель мюзикла опубликовал в своём блоге восторженный отзыв; десятки медиа написали о нём статьи; а опубликованный алгоритм привлёк внимание преподавателей литературы в качестве учебного инструмента. Авторы применяли язык программирования Phyton. Для визуализации они использовали библиотеку JavaScriptD3.
er
#
о
^^ 4 А.
♦ 4 ♦ >
F-
däJ
Leslie Odam Jr.
How does a Ejastard, orphan, son of a whore and a Scotsman, dropped in the middle of a Forgotten spot in the Caribbean by providence Impoverished, in squalor Grow up to be a hero and a scholar? "Alexander Hamilton" on "Hamilton (Original Broadway Corf Recording)"
Рис. 5. Инфографика из материала «Rhymes Behind Hamilton» («Уолл-Стрит джорнэл»,
2017 г.)
Все четыре проекта, победивших в категории «Лучшая визуализация», объединяет интерактивность: читатель может манипулировать данными и взаимодействовать с контентом, получая разные показатели. Все они также созданы благодаря применению навыков программирования и сложных технологий обработки данных, которые (как, например, в случае материала «Уолл-Стрит Джорнэл») сложнее тех, что использовались в журналистских расследованиях, рассмотренных нами выше. Иными словами, все 4 проекта в известной степени инновационны с технологической точки зрения. Они также имели значительную огласку в СМИ и Интернете.
Таблица 3
Категория «Лучшее приложение или сайт»
Категория Проект Автор проекта
2014 Open Statement of Assets from Argentina's Main Public Officia («Открытое заявление об активах главного должностного лица Аргентины») «Насьон»
2015 LA NACION DATA: Open Data Journalism for Change («Данны ''Насьон'': журналистика открытых данных как источник перемен») е «Насьон»
2016 Сайт FiveThirtyEight.com FiveThirtyEight
2017 Rutas del Conflicto («Пути конфликта») Rutas del Conflicto
Open Statement of Assets from Argentina's Main Public Official- проект, призванный облегчить гражданам Аргентины публичный доступ к данным о доходах должностных лиц. В то время в Аргентине не было единой базы данных с этой информацией, доступной в онлайн-режиме, ровно как и не существовало закона о свободе информации. Репортёры газеты «Насьон» посчитали, что такая информация должна быть доступна публично. Так, они вместе с добровольцами из трёх неправительственных организаций решили создать сайт с этими данными. На свои запросы они получили более 1,5 тыс. файлов по 5-7 страниц каждый и вручную переносили данные в компьютер. Проект готовился на протяжении года. Результатом стало новостное приложение с удобным визуальным интерфейсом, предоставляющее читателю доступ к этой информации.
В 2015 г. аргентинская газета «Насьон» вновь победила в категории «Лучший сайт» с проектом «Open Data Journalism for Change». Это продолжение их большого проекта по публичному раскрытию данных, освещённого выше. Материалы отличаются большим разнообразием: от визуализации карьерного пути кандидатов на выборы до данных о субсидиях для системы наземного транспорта в Аргентине. В этот раз журналисты и волонтёры произвели обработку более 10 тыс. файлов с данными. Результатом стал сайт «LA NACION DATA», который и получил премию. Для аргентинских медиа этот проект имел высокое значение - главным образом, в виду закрытости информации подобного рода. Журналисты использовали используя бесплатные инструменты многократного использования, такие платформы и ПО как «CartoDB», «Timeline.js», «TimelineSetter», «Tableau», «Tabula», «DocumentCloud».
«FiveThirtyEight.com»- это сайт, созданный бывшим специальным корреспондентом «ABCNews», статистиком и писателем Нейтом Сильвером (Nate Silver). Сайт появился в 2008 г., и сначала его тематика была спортивной, так как прошлое Сильвера тесно связано с бейсболом и статистикой игр. К 2016 г. сайт стал представлять качественный
дата-журналистский контент о спорте, политике и экономике. Публикуемый материал имеет формат графиков и диаграмм, сопровождаемых текстом. В процессе его подготовки часто используется статистический анализ и социологические опросы. Проект Сильвера получил известность в том числе благодаря своим прогнозам результатов президентских выборов и выборов в сенат США. К примеру, сайт успешно предсказал победу Барака Обамы на президентских выборах в США 2012 года. Проект получил приз за свою технологические инновации и качественную глубокую аналитику.
«Rutas del Conflicto» - независимое колумбийское СМИ, созданное для сбора данных о гражданской войне в Колумбии, начавшейся в 1964 году и закончившейся в 2016. На одноимённом сайте его создатели разместили данные о 728 убийствах, произошедших в стране с 1982 года. Репортёры разработали приложение, которое, используя технологию GPS, позволяло пользователю видеть, какие массовые убийства произошли в радиусе 50 км. от его собственного местоположения. На сайте приводятся истории родственников и выживших. Одной из целей проекта является фиксация исторической памяти о конфликте, «информация о котором может быть использована учителями, образовательными учреждениями и социальными лидерами». Сайт включает в себя интерактивные карты, графики и таймлайны. Проект был отмечен награждён за технологические новации, удачную комбинацию инструментов ЖД и журналистского расследования, а также за вклад в борьбу за миротворчество.
Мы видимо, что все 4 проекта, победившие в последней категории, также созданы с применением технологий и ПО различного рода. Три из них имеют очевидное социальное значение, а сайт «FiveThirtyEight.com» поднимает вопросы политического характера.
Очевидно, что в выборе лауреата играет роль совокупность многих факторов сразу: освещение актуальных событий, технологическая новизна, трудоёмкость процесса журналистов при подготовке материала, удобство и привлекательность визуализации. Тем не менее рассмотренные проекты позволяют сделать вывод о как минимум двух условиях, которые должны соблюдаться при подготовке материала, которые жюри конкурса относят к Ж Д. Первое: наличие массивов данных, которые авторы материала находят и обрабатывают для выявления ранее не установленных фактов и связей. Часто они делают это с помощью специализированных компьютерных программ. Второе: визуализация результатов, полученных благодаря манипуляциям с данными, в виде интерактивной или статичной инфографики, диаграмм или 3D-моделей. Однако последнее не означает, что ЖД предполагает отсутствие текста: в большинстве проектов он присутствует как в виде кратких пояснений к визуализациям, так и в форме полноценного журналистского повествования. Создание дата-журналистского проекта имеет многие признаки журналистского расследования. Это не представляется удивительным: журналисты, проводящие расследования, обрабатывают, как правило, большое количество данных. Но можно задаться вопросом: получили бы материалы, победившие в номинации «Лучшее расследование», призовые места, если бы были представлены исключительно в виде текста? Знать наверняка это нельзя, однако можно провести грань между ЖД, журналистским расследованием и инфографикой.
Журналистика данных, журналистское расследование и инфографика
Характер ЖД, бесспорно, дает основания связать её с информационными жанрами журналистики. Особенности её формата позволяют публиковать материалы Ж Д как в печатных изданиях, так и в Интернете, однако во втором случае для ЖД, очевидно, открывается гораздо больше возможностей. Некоторые же примеры дата-журналистского
материала, созданные в виде интерактивной инфографики, просто нельзя, с технической точки зрения, распространять на печатных носителях. ЖД становится всё более сложной и интерактивной, а значит, уверенно переходит со страниц газет и журналов на интернет-страницы.
Что касается журналистского расследования (далее - ЖР), то, согласно Е. И. Губенко, его цель всегда специфична: например, исследовать скрытые стороны различных явлений человеческой деятельности; установить причину определенного процесса или ситуации с целью получить новые, неизвестные или не принятые во внимание факты [2: с. 50]. Предметом же журналистского расследования, по мнению Е. И. Губенко, становится какое-либо «громкое» негативное явление, которое невозможно не заметить. Однако научный статус журналистского расследования - как и статус ЖД - определён неясно. Как отмечает М. Н. Ким, «будучи расследованием, журналистский материал относили то ли к аналитической журналистике, то ли к художественной публицистике»
Ci 166]. То, что объединяет журналистское расследование с ЖД - это подход к фактам. Как пишет Губенко, анализ в ЖР сводится к развёрнутой оценке фактов и тщательной
аргументации выдвигаемого тезиса [2, с 52]. Среди очевидных отличий можно выделить отсутствие прямой связи между журналистским расследованием и использованием инструментов для обработки и визуализации данных. История журналистских расследований уходит на несколько столетий назад. Например, согласно Д. В. Неренц, признаки первого журналистского расследования в США можно увидеть в газете «Publick Occurrences Both Forreign and Domestick» («Внутрение и внешние публичные происшествия») от 1690 года [4, с—1051 Поэтому можно сделать вывод о том, что журналистское расследование - более широкое понятие, нежели журналистика данных, и первое может включать в себя второе, но только при условии, если в процессе расследования журналист использует программное обеспечение для обработки данных, а также для их репрезентации в виде графики. В то же время не всякий дата-журналистский материал можно отнести к жанру журналистского расследования.
Инфографика же - это графический способ подачи информации, облегчающий восприятие данных большого объёма. Цель инфографики - быстро и чётко преподнести сложную информацию. Инфографика опирается на предположение о том, что человек способен воспринимать визуальную информацию значительно легче и быстрее текстовой. Её история уходит на 2000 лет вперёд, однако мы отметим два наиболее важных события, определивших облик современной инфографики. Первым из них является создание в 1993 г. английским чертёжником Гарри Беком (Harry Beck) первой карты лондонского метро, показывающей только линии для описания общественных маршрутов транзита и станций. Карта не была привязана к точному географическому расположению станций и не учитывала расстояния между ними. Поначалу она была воспринято негативно руководством лондонского метрополитена, но когда в том же году метро, автобусы, речные трамваи и пригородные автобусы были объединены в «Лондонское управление пассажирского транспорта», карту решили протестировать, и она имела огромный успех среди пассажиров. Так Бек перенес визуальные диаграммы в повседневную жизнь. После этого большинство карт метро стали создаваться по подобию карты Бека, а инфографика стала развиваться быстрее, проникая в различные сферы общественной жизни. Другие значимое событие относится к 1983 г. - год выхода книги Эдварда Тафти (Edward Tufte), американского статистика и политолога, которого называют «отцом инфографики». Тафти защитил кандидатскую диссертацию по политологии в Йельском университете и в 1970-х он начал преподавать статистику в Принстонском университете. Тогда его начала интересовать тема эффективной
визуализации данных. Обнаружив малое число исследований на интересовавшую его тему, он стал делать это самостоятельно. Около 10 лет спустя он объединил результаты своих исследований в книгу «The Visual Display of Quantitative Information» («Визуальное представление количественных данных»), сделавшую его крупнейшим специалистом по информационной графике.
Итак, инфографика - это графическое представление данных, однако не любая инфографика предполагает обработку этих данных. Тем более, как мы видим из примера Гарри Бека, области применения инфографики выходят далеко за пределы журналистики и могут включать в себя статистику, образование, географию, астрономию. Как же соотносятся инфографика и журналистика данных? Инфографика - это один из форматов дата-журналистского контента. Это в некотором роде язык журналистики данных. Все работы дата-журналиста содержат инфографику (или другие приёмы визуализации), поскольку она способна просто и наглядно передать читателю основное послание, содержащееся в «сухих» громоздких данных. При этом, разумеется, не любая инфографика является продуктом ЖД.
В итоге, как мы видим, под определение «журналистика данных» могут попадать совершенно различные материалы с точки зрения формата. Это может быть масштабное расследование, и интернет-страница с текстом и интерактивными графиками, и дата-журналистский сайт. Ж Д тесно связано с журналистскими расследованиями. Однако, как мы указали выше, ЖР - более широкое понятие, чем ЖД, и может включать в себя последнее. Чётких предписаний относительно формата контента ЖД, как мы видим, нет, хотя все материалы включают в себя как элементы инфографики, так и текст. Все проекты объединяет тот факт, что они основаны на обработке массивов данных (как ручной, так и автоматической) и предполагают на их основе установление некой «общей картины», скрытых связей и закономерностей. Это можно отнести к ключевым характеристикам ЖД. Мы также склонны согласиться с мнением Э. Пилхофера относительно того, что Ж Д - «зонтичный термин», поскольку у подобного контента нет чётких границ. Также подтверждается замечание С. Роджерса о том, что ЖД непосредственно связана с открытыми данными, и принцип объективности, о котором упоминал К. У. Андерсон. ЖД - это действительно обобщение большого массива данных, как писала С. И. Симакова. И, как метко подметила М. А. Пильгун, в основе ЖД как направления лежит обработка этих данных. Объединяя все основные характеристики и подкрепляя их выводами, сделанными на основе анализа рассмотренных проектов, мы предлагаем рабочее определение феномена. Журналистика данных- это обобщённое понятие, указывающее на способ создания журналистского материала, при котором журналист находит, агрегирует и представляет аудитории открытые данные с целью выявить ранее неизвестные факты, закономерности и тенденции, которые он иллюстрирует с помощью приёмов визуализации и текстовых пояснений, сопровождая их (обычно)ссылками на первичный источник данных.
Данное определение содержит в себе основные выявленные нами характеристики феномена и поможет лучше определить научный статус понятия, который, тем не менее, неминуемо будет меняться по мере развития технологий и их проникновения в процесс создания журналистских повествований, что, как мы думаем, приведёт к исчезновению границу между ЖД и информационными жанрами журналистики вообще.
Библиография
1. Бегтин И. В. Готовы ли мы к журналистике данных? // Полит.ру. 2013. 29 апреля.
URL: http://polit.ru/article/2013/04/29/data_journalism/ (дата обращения: 12.12.18).
2. Губенко Е. И. К определению жанровой принадлежности журналистских расследований // Мир лингвистики и коммуникации: электронный научный журнал. -2009. №15. С. 49-59.
3. Ким M. H. Качественные социологические методы в труде журналиста / Социология журналистики: Очерки методологии и практики / Под ред. С. Г. Корконосенко. М., 1998. С. 162-180.
4. Неренц Д. В. Эволюция журналистских расследований в США // США и Канада: экономика, политика, культура. 2015. №8. С. 105-118.
5. Пильгун М.А. Журналистика данных - будущее медиа // ICTNEWS. 2016. №7. С. 46.
6. Росликова В. В. Визуализация данных большого объема в журналистике // Современная периодическая печать в контексте коммуникативных процессов. Мультимедийный потенциал журналистики. No 1 (10) / отв. ред. Б.Я. Мисонжников. СПб.: С.-Петерб. ун-т, И-т «Высш. шк. журн. и мас. коммуникаций», 2016. C. 161166.
7. Симакова С. И. Журналистика данных как современное направление журналистики // Знак: проблемное поле медиаобразования. 2013. №1 (11). С. 52-56.
8. Симакова С. И. Журналистика данных как фактор, влияющий на развитие визуализации журналистского контента // Журналистика в системе альтернатив-ных источников информации: сборник материалов научной конференции кафедры журналистики 14 марта 2017 г. / отв. ред. О.Н. Савинова. Н. Новгород, 2017. С. 166-171.
9. Симакова С. И. История журналистики данных // Известия высших учебных заведений. Уральский регион. 2016б. No 3. С. 114-120.
10. Чернецкий П. П. Журналистика данных как фактор объективности в сетевых СМИ // Филологические науки. Вопросы теории и практики. 2015. No 6-1 (48), ч. 1. С. 189192.
11. Шерстюкова М. Н. Дата-журналистика как новое направление в системе средств массовой коммуникации// Медиа. Информация. Коммуникация. 2012. No 1. C. 1214. URL: http://mic.org.ru/2012g/1-nomer-2012/65-1-shestukova-2.
12. Шилина А.Г. Журналистика данных в качественных российских журналах: опыт идентификации // Вестник Тверского государственного университета. Серия «Филология». 2016. No 3. С. 222-228.
13. Bradshaw P. Data Journalism Heist. How to get in, get the data, and get the story out-and make sure nobody gets hurt. Leanpub. 2013. p. 5.
14. Gray J. Data Journalism Handbook. J. Gray, L. Bounegru, L. Chambers. O'Reilly Media. 2012. pp. 9-10.
15. Heravi B. 3WS of Data Journalism Education: What, Where and Who? Taylor & Francis. 2018. URL: https://researchrepository.ucd.ie/bitstream/10197/9421/1/BHeravi-3Ws_of_Data_Journalism_Education.pdf
16. Hernry Riche N. Data-Driven Storytelling. A K Peters/CRC Press. Visualization Series. 2018. pp. 4-5.
17. Miller C. Getting Started with Data Journalism. Writing data stories in any size newsroom. First Edition. 2016. p. 9.
18. Rogers S. Facts Are Sacred. Faber and Faber. 2013. 320 p