Научная статья
УДК 070 (075.8)
DOI 10.25205/1818-7919-2022-21-6-59-68
Тренды массмедиа: применение искусственного интеллекта, машинного обучения, CEO-инструментов и дата-журналистики в контексте мирового медиаландшафта
Анна Александровна Шнайдер
Балтийская международная академия Рига, Латвия
anshnaider@gmail.com, https://orcid.org/0000-0002-4836-073X Аннотация
Статья посвящена анализу применения искусственного интеллекта, машинного обучения, больших данных, дата-журналистики, СЕО-продвижения в средствах массовой информации. Автор делает небольшой экскурс в понятие «дата-журналистика», описывает существующие понятия в российской и зарубежной научной литературе. Приводятся основные временные промежутки появления дата-журналистики в США, России и Латвии. Автор рассматривает на примерах публикаций, как применяются технологии искусственного интеллекта и машинного обучения в крупных редакциях: «Forbes», «Reuters», «The Guardian» и др. Это исследование основано как на первичных, так и на вторичных источниках качественных данных, которые помогли детально рассмотреть влияние новых технологий на онлайн СМИ, понять проблемы и возможности для работы в постоянно меняющемся медиаландшафте. На основе эмпирической базы автор рассматривает применение дата-журналистики в Латвии - на примере материалов, опубликованных автором в печатном журнале «Forbes Latvija» в 2017-2019 гг. Основываясь на методах исследования и применении СЕО-инструментов в написании статей на английском языке для ИТ-компании в период с 2019-2021 гг., автор рассматривает влияние СЕО-продвижения в традиционных, новых и корпоративных медиа. На сегодняшний день в массмедиа вырисовывается тенденция влияния корпоративной журналистики на повестку дня, а рассмотрев более детально этот вопрос, автор приводит примеры конкретных инструментов СЕО-продвижения, которые помогают корпоративным медиа в осуществлении этой цели. Ключевые слова
СЕО-оптимизация, журналистика данных, дата-журналистика, искусственный интеллект, машинное обучение, корпоративная журналистика, пиар Для цитирования
Шнайдер А. А. Тренды массмедиа: применение искусственного интеллекта, машинного обучения, СЕО-ин-струментов и дата-журналистики в контексте мирового медиаландшафта // Вестник НГУ. Серия: История, филология. 2022. Т. 21, № 6: Журналистика. С. 59-68. DOI 10.25205/1818-7919-2022-21-6-59-68
© Шнайдер А. А., 2022
Mass Media Trends:
Implementation of AI, ML, SEO and Data Journalism in the Worldwide Media Landscape
Anna A. Shnaider
Baltic International Academy Riga, Latvia
anshnaider@gmail.com, https://orcid.org/0000-0002-4836-073X Abstract
This article refers to the use and implementation of new technologies, like AI (Artificial Intelligence), ML (Machine Learning), Big Data, data journalism and SEO optimization in traditional media, new media and brand journalism. The author explains what is "data journalism" in the opinion of Russian and English-speaking researchers. The article describes the main accidents and dates of the establishing of date journalism in the USA, Russia. The author examines how artificial intelligence and machine learning are implemented by editorial offices, as an example author takes "Forbes", "Reuters", "The Guardian" and other media outlets. This study is based on both primary and secondary sources of qualitative data to understand the challenges and opportunities to work in the ever-changing media landscape. Based on the empirical base, the author examines the implementation of data journalism in Latvia - using the materials published in collaboration with the author in the print magazine "Forbes Latvija" during the period of 20172019. Based on research methods and the use of SEO tools while writing articles in English for an IT company in the period from 2019-2021, the author examines the impact of SEO promotion in traditional media, new media and brand journalism. There is a tendency nowadays that brand journalism is affecting the agenda of media, and having considered this issue in more detail, the author gives examples of specific SEO optimization and promotion tools that help brand journalism in achieving this goal. Keywords
SEO optimization, data journalism, Artificial Intelligence, Machine Learning, Big Data, brand journalism, communication For citation
Shnaider A. A. Mass Media Trends: Implementation of AI, ML, SEO and Data Journalism in the Worldwide Media Landscape. Vestnik NSU. Series: History and Philology, 2022, vol. 21, no. 6: Journalism, pp. 59-68. (in Russ.) DOI 10.25205/1818-7919-2022-21-6-59-68
Введение
В современном медиаландшафте действующие журналисты вынуждены пересмотреть ряд рабочих вопросов, и это касается журналистов по всему миру. С развитием технологического прогресса, появлением конвергентных СМИ от журналиста требуется несколько иная, чем раньше, работа. Журналист - это уже не пропагандист, как ранее, а мультименеджер, на плечи которого ложатся редакционные вопросы, рабочие процессы, бизнес-модели и умение использовать технологические платформы. В таких условиях СМИ находятся в постоянном инновационном процессе. На сегодняшний день в мире 3,96 миллиарда пользователей социальных сетей, из них 3,91 миллиарда использует для этого мобильное устройство \ Аудитория привыкла получать информацию мгновенно, а для этого журналисту нужно обладать навыками дигитальной журналистики, в том числе навыками мобильной журналистики (MoJo journalism) и журналистики данных (Data journalism).
В научном мире к сегодняшнему дню так и не появилось единственно верного объяснения понятия «дата-журналистика», однако велись исследования, в которых авторы приводили свои определения.
Так, американский дата-журналист П. Брэдшоу в «Пособии по журналистике данных» [Bradshaw, 2012] отмечает, что это навык поиска информации и умение представить на суд
1 Global Report. 2020. URL: https://www.hootsuite.com/pages/digital-2020 (accessed 13.02.2021).
читателя захватывающую историю, основанную на огромном количестве разнообразной числовой информации, которая стала общедоступной.
Современные греческие исследователи дата-журналистики А. Веглис и К. Братсас определили журналистику данных как процесс извлечения полезной информация из данных, написание статей на основе информации и внедрение визуализации (в некоторых случаях интерактивной) в статьи, которые помогают пользователям понять важность истории [Veglis, Bratsas, 2017, р. 227].
Российские исследователи также изучают дата-журналистику. Так, М. Г. Шилина [2013] говорит, что журналистику данных можно и нужно понимать как «набор специфических навыков для поиска, анализа, визуализации информации цифровых источников метаданных для формирования интерактивных форматов уникальной подачи авторского аналитического контента и эффективного взаимодействия с аудиторией».
В целом, и зарубежные, и российские исследователи подразумевают под дата-журналистикой схожие понятия. Общее, в чем согласны ученые, - это то, что в работе традиционному журналисту необходимо обладать навыками программирования и умением работать с определенными техническими инструментами, например с извлечением данных («Tabula», «document cloud»), очисткой и анализом данных («Google spreadsheets», «open refine»), визуализацией данных («Datawrapper», «flourish») и фреймворками, которые помогают программировать («workbench»), в отдельных случаях - языками программирования («Python», «Java»).
В России на сегодняшний день специализация «дата-журналистика» есть в Высшей школе экономики. Специальность «дата-журналист» можно найти в различных университетах Европы, США, Канады. Среди них: University of West of Scotland, TU Dortmond, University of Zurich, Universidad Loyola Andaluca, University of King's College Halifax и мн. др. 2 В ЮНЕСКО даже разработали и предложили свои «curricula» (требования) для модернизации обучения журналистов, а среди дисциплин, которые следует ввести, по их мнению, в учебных заведениях, есть и дата-журналистика 3.
В наши дни медиабизнес столкнулся со следующими тенденциями: внушительным ростом появления новостей и нехваткой человеческих ресурсов, чтобы их освещать. Крупные мировые СМИ смогли ответить на этот вызов, в работу редакций были внедрены автоматизированные системы, производящие контент самостоятельно.
Первым на подобный эксперимент согласилось агентство «Associated Press» 4. С 2013 г. в медиакомпании используются технологии искусственного интеллекта (Artificial Intelligence, ИИ) с целью автоматизации процесса создания новостного контента. Также были использованы и внедрены и более сложные алгоритмы машинного обучения (Machine Learning, МО), которые способны анализировать большое количество данных, находить закономерности в текстовых данных, обобщать их и выделять наиболее полезную информацию, так что журналист уже может создавать свой уникальный контент на основе проделанной за него работы гораздо быстрее.
Методы
В качестве эмпирической базы исследования были проанализированы материалы новых медиа, блоги крупных частных компаний из различных сфер, в том числе анализ блога транснациональной нефтегазовой компании «BP» за 2013-2020 гг.; клиенты технического инстру-
2 Medium. URL: https://medium.com/ucd-ischool/where-in-the-world-can-i-study-data-journalism-44c006e55ea5 (accessed 20.02.2021).
3 Unesco curricula. URL: http://www.unesco.org/new/en/communication-and-information/resources/publications-and-communication-materials/publications/full-list/model-curricula-for-journalism-education-a-compendium-of-new-syllabi/ (accessed 15.03.2021).
4 Associated Press. AI. URL: https://www.ap.org/discover/artificial-intelligence (accessed 20.03.2021).
мента «ARC Publishing». Были проанализированы сайты статистических ведомств, официальные базы данных. В частности, сайт Росстата 5, портал открытых данных РФ, портал WikiLeaks 6 и др. Автор также подверг анализу дата-материалы российских и американских СМИ, вызвавшие наибольший резонанс в истории появления и становления дата-журналистики. Во время поиска дата-материалов на русском и английском языках были проанализированы такие сайты, как «The Pudding» 7, «Financial Times» 8, платформы «Youtube» 9 и «Яндекс.Мастер» 10. На этих сайтах можно найти различные примеры дата-материалов. В 2019 г. сайт «The Pudding» получил премию лучшего сайта года в номинации «Проект в онлайн-журналистике» («General Excellence in Online Journalism, Micro Newsroom»). В проектах на сайте «The Pudding» читатель выступает в роли участника, от его действий зависит, как далее будет меняться материал. У «Яндекс.Мастер» имеется ряд исследований, основанных на анализе большого количества данных. И эти работы можно смело считать примерами дата-журналистики, в том числе и материал «Во сколько обходится личный автомобиль» 11.
Автором статьи были исследованы материалы журналов «Forbes Latvija» и «IR», выходящих в Латвии, за 2017-2019 гг. на предмет публикаций дата-материалов. Автор участвовал в разработке, сборе, обработке и публикации материалов на основе принципов дата-журналистики в печатном журнале «Forbes Latvija» в период 2017-2019 гг. В частности, были рассмотрены примеры публикаций «Топ стартапов в Балтии» 12, «Топ успешных женщин Латвии» 13, вышедших в печатных версиях журнала «Forbes Latvija» (2019). Благодаря участию в создании этих дата-материалов автору удалось собрать как первичные, так и вторичные источники качественных данных.
Автор является пишущим автором для английской ИТ-компании 14, в связи с чем ему удалось сопоставить использование СЕО-инструментов в продвижении контента в традиционных, новых и корпоративных медиа. Проанализировав материалы, вышедшие в период 20192021 гг., автор выявил тенденции влияния СЕО-продвижения на повестку дня СМИ.
Методы описания и обобщения, использованные в проведенном исследовании, позволили выделить основные даты и события в развитии дата-журналистики в США и России, провести небольшой экскурс в дата-журналистику Латвии, а также описать существующие различия.
Результаты Дата-журналистика в Латвии
Латвия, как и другие страны, в сфере журналистики идет по своему пути развития, в том числе и в направлении дата-журналистики. С 2012 г. в стране существует «School of Data», где обучают работать с данными, - в результате можно увидеть работы в виде инфографики и в других форматах. Школа предлагает две формы обучения - онлайн и оффлайн. На дан-
5 Федеральная служба государственной статистики. URL: https://www.gks.ru/ (дата обращения 20.03.2021).
6 WikiLeaks. URL: https://wikileaks.org (accessed 20.03.2021).
7 The Pudding. URL: https://pudding.cool (accessed 20.03.2021).
8 One belt, one road. Financial Times. URL: https://ig.ft.com/sites/special-reports/one-belt-one-road/?mhq5j=e3 (accessed 20.03.2021).
9 Как коронавирус распространяется по миру. Хронология. URL: https://www.youtube.com/watch?v=Qukh KKK8s4M (дата обращения 20.03.2020).
10 Во сколько обходится автомобиль. URL: https://yandex.ru/company/researches/2020/auto-cost (дата обращения 20.03.2020).
11 Яндекс.Мастер. Во сколько обходится личный автомобиль. URL: https://yandex.ru/lab/calculator-auto/ (дата обращения 20.03.2020).
12 Перепечатанный материал Forbes Latvija. URL: http://www.baltic-course.com/rus/tehnology/?doc=152236 (дата обращения 20.03.2021).
13 Forbes Latvija. 2019. Print issue.
14 FortySeven Software Professionals. URL: https://fortyseven47.com/blog/ (accessed 20.03.2021).
ный момент они выпустили 6 000 учеников 15. Где можно встретить дата-материалы? В стране выпускается ряд бизнес-ориентированных журналов, среди которых «Forbes Latvija», «IR». По сути, эти два журнала являются конкурентами, и, анализируя их контент за 2017— 2019 гг., можно сделать вывод, что журналы пытались приподнести одни и те же материалы с использованием разной методологии. В качестве примера можно рассмотреть материалы «Топ успешных женщин Латвии» 16 и «Топ стартапов Балтии», в создании которых автор принимал участие. После выхода в свет журналов с дата-материалами «Топ стартапов в Балтии», а также «Топ женщин-предпринимателей Латвии» эти материалы «вдохновили» другие бизнес-издания, конкурирующие с журналом «Forbes Latvija». Это говорит не только о популярности темы, качестве проделанной работы, но и о желании конкурентов создать похожий дата-материал, при этом не имея аналогичной системы подсчета, что в данном случае имело первичное значение. Дата-журналист, как правило, работает в команде с программистом или журналистом, обладающим навыками программирования, для создания правильной формулы анализа больших данных. На тот момент в журнале работал приглашенный специалист, в команде с которым были созданы упомянутые дата-материалы. Именно поэтому конкретные дата-материалы считаются одними из лучших примеров дата-материалов в Латвии. Позднее были попытки повторить такого рода дата-материалы, в том числе и другими изданиями, однако они показывали совершенно другие данные на те же самые темы, что не соответствовало действительности. Дата-материал отличается от других журналистских материалов также и тем, что он основан на анализе огромного количества данных, поэтому представляет собой объективную информацию. Такие материалы содержат в себе цифры: сумма зарплат, сумма уплаченных налогов, сумма дохода и т. д. В подготовке дата-материалов для журнала «Forbes Latvija» все данные были взяты из официальной базы данных Латвии «Lursoft» 17, где можно найти финансовую информацию, отчеты любой компании, зарегистрированной в Балтии. На основе этих количественных данных с помощью специальной формулы высчитывались самые прибыльные компании, доходные бизнесы и выводилась наиболее достоверная и объективная информация, которая позволила создать топы. Такие серьезные дата-материалы выходят в журналах достаточно редко, поскольку на их подготовку уходит много времени, они требуют от журналиста иных навыков и участия расширенной команды. Чтобы в этом убедиться, можно отследить выход подобных материалов у других франшиз журнала «Forbes». При этом отмечается, что в Латвии наблюдается рост свободы слова в прессе, поэтому прогнозируется рост количества появления дата-материалов и дата-журналистов 18.
Использование технологий искусственного интеллекта и машинного обучения
В 2018 г. на основе искусственного интеллекта «Forbes» создал систему «Bertie» 19, которая сама создает контент (пишет статьи) и придумывает заголовки. «The Washington Post» разработала систему «Heliograf», которая помогает создавать тексты (статьи), увлекающие потенциальную аудиторию и заставляющие ее дочитать текст до конца. Их система доступна как отдельный сервис 20. «ARC Publishing» - для брендов и для издателей. «Bloomberg» использует программу «Cyborg» для создания и управления контентом. «The Guardian» 21, «As-
15 School of Data. URL: https://schoolofdata.org/our-history/ (accessed 15.03.2021).
16 Forbes Latvija. 2019. Print issue.
17 Официальная база данных Балтии Lursoft. URL: https://www.lursoft.lv (accessed 28.03.2021).
18 Self-censorship in Latvian journalism: A research note Anda Rozukalne First Published January 7, 2020. URL: https://doi.org/10.1177/0267323119897799 (accessed 28.03.2021).
19 Forbes. Bertie. URL: https://www.forbes.com/sites/enriquedans/2019/02/06/meet-bertie-heliograf-and-cyborg-the-new-journalists-on-the-block/?sh=76101f8f138d (accessed 20.02.2021).
20 ARC Publishing. URL: https://www.arcpublishing.com/solutions/brands (accessed 20.02.2021).
21 The Guradian. URL: https://www.theguardian.com/technology/artificialintelligenceai (accessed 20.02.2021).
sociated Press» и «Reuters» 22 используют механизмы ИИ для создания отчетов акционеров, юридических документов, пресс-релизов, общих отчетов и статей.
В России в 2018 г. была запущена платформа «MediaDigger» на основе ИИ 23. Технологии ИИ и МО экономят время пользователя и позволяют журналистам работать еще более эффективно. И всё же при внедрении в работу редакций автоматизированных систем, позволяющих не только самостоятельно производить контент, но и анализировать информацию. Необходимо понимать, что «ни одна машина не может, например, посмотреть на связь между двумя организациями, подумать: "это странно" или сделать соответствующие звонки, поговорить с нужными людьми или провести исследование, необходимое для того, чтобы прийти к объективному результату» 24. Безусловно, применение и использование технологий ИИ и МО облегчают работу журналистов, но на данном этапе своего развития они не способны взять на себя функцию творческой реализации.
Использование СЕО-оптимизации
Для бизнеса, причем не важно, какого размера, наличие блога на сайте - это еще один способ привлечения клиентов. Специалисты по СЕО (SEO - Search Engine Optimization, поисковая оптимизация) рекомендуют привлекать клиентов через блог компании. Обычно при создании статей такого типа используются определенные рекомендации программ на основе ИИ, которые обрабатывают огромное количество статей по похожей тематике и выдают полное техническое задание для копирайтера. Российские аналоги подобных программ - это «Яндекс.Мастер» 25, среди зарубежных можно упомянуть «SurfSeo» 26.
К помощи подобных технологий прибегают компании, бренды, корпорации. Это означает, что роль корпоративной журналистики в мировом медиаландшафте приобретает всё большую значимость [Шнайдер, Колосова, 2020, с. 167]. Общая цель у блогов - сконвертировать потенциального клиента и продать ему свой товар или услугу. Например, транснациональная нефтегазовая компания «BP» в своем блоге 27 публикует статьи, созданные с помощью «ARC Publishing», упомянутого выше. Проанализировав блог компании с 2013 г., можно заметить, что в начале это были официальные публикации в стиле пресс-релизов, а к 2016 г. рубрикат значительно увеличился, и там стали публиковаться полезные статьи на темы защиты окружающей среды, развития технологий и т. д. Это произошло за счет использования технологии «ARC Publishing», а также за счет использования методов СЕО-оптимизации контента. Несмотря на то что это блог транснациональной компании, а не журнал, компания также следит за трендами массмедиа и предоставляет такой контент, который будет интересен не только существующим клиентам компании, но и потенциальным партнерам. Так, например, заключительный материал за 2021 г. назывался «Наш 2021 год в фото» 28 и публиковал мультимедийный контент, содержащий иллюстрации, ссылки для переходов на другие страницы сайта и минимум текста. Когда мы видим, что такие крупные компании уделяют столько внимания развитию своего блога, то понимаем, что со стороны малого и среднего бизнеса создается еще больший запрос на наличие и ведение блога, согласно всем последним тенденциям: генерация контента при помощи технологий МО и ИИ, применение ключевых слов
22 The Reuters. URL: https://www.thomsonreuters.com/en/reports/2018-ai-predictions.html (accessed 20.02.2021).
23 MediaDigger. URL: http://mediadigger.ru/about/ (accessed 20.02.2021).
24 The Future of Augmented Journalism: A guide for newsrooms in the age of smart machines. Francesco Marconi, Alex Siegman and Machine Journalist. URL: https://insights.ap.org/uploads/images/the-future-of-augmented-journa lism_ap-report.pdf (accessed 21.02.2021).
25 Яндекс.Мастер. URL: https://yandex.ru/support/webmaster/ (дата обращения 15.02.2021).
26 SurfSeo. URL: https://surferseo.com/ (accessed 15.02.2021).
27 BP. URL: https://www.bp.com/en/global/corporate/news-and-insights.html#searchCards-news-and-insights (accessed 15.02.2021).
28 BP. Our Top 2021 in photo. URL: https://www.bp.com/en/global/corporate/news-and-insights/reimagining-energy/bp-year-in-pictures-2021.html (accessed 21.02.2021).
в заголовках и статьях (инструментов СЕО-оптимизации), которые выводят эти тексты на первые места в поисковиках, а также создание мультимедийного контента, инфографики и, при наличии ресурсов, дата-материалов. Более того, некоторые дата-материалы, публикуемые на сайтах компаний, такие как анализ, отчеты, подготавливаются специальными компаниями, в которых работают дата-журналисты, например «Gartner» 29.
Рассмотрим первичные и вторичные данные проведенного автором исследования. При создании блога ИТ-компании первичная задача была - наличие блога. После того, как были написаны и опубликованы первые 10 статей, блог вышел в свет. Однако статьи не появлялись в поисковике даже при введении ключевых слов. Когда для написания статей начали использовать инструменты СЕО-продвижения, статьи стали просматриваться чаще. Статьи, написанные с помощью СЕО-помощника, получили 49 400, 26 892, 17 462 просмотров (см. рисунок), тогда как первые статьи, написанные без учета рекомендаций, получили всего несколько просмотров в период 2020-2021 гг. Для написания статей с помощью инструментов СЕО-оптимизации контента имеется ряд рекомендаций относительно количества слов, количества заголовков, абзацев, ключевых слов, ответов на актуальные вопросы по теме и т. д. Эти рекомендации формируются на основе анализа больших данных - анализа статей на такую же тему в различных источниках. Таким образом, с помощью подобных программ и с учетом рекомендаций при создании контента можно добиться того, чтобы любая статья вышла в топ запросов поисковиков.
Page Pageviews 4» Unique Pageviews Avg. Time on Page Entrances Bounce Rate % Exit Page Value
183,775 % of Total: 100.00% (183.775) 168,956 % of Total: 100.00% (168,956) 00:03:27 Avg for View 00:0327 (0-00%) 156,135 % of Total: 100.00% (156,135) 90.97% Avg for View: 90.97% (000%) 84.96% Avg for View: 84.96% (0.00%) $0.00 % of Total: 0.00% ($0.00)
- /news/top-7-languages-for-web-app-develop ,T| ■ ment/ 49,490 (26.93%) 47,221 (27.95%) 00:05:51 47,041 (30 13%) 94.95% 94.49% $0.00 (0.00%)
2 /news/best-programming-languages-for-mob T ile-app-deveiopment/ 26,892 (14.63%) 25,478 (15.08%) 00:06:06 25,373 (16.25%) 94.49% 93.96% $0.00 (0.00%)
3 /news/5-reasons-why-software-development ' 4s-important/ 17,462 (9.50%) 15,747 (9.32%) 00:06:51 15,724 (10.07%) 90.96% 89.69% $0.00 (0.00%)
Количество просмотров статей в блоге Number of views per article
Сегодня автоматизируются и дигитализируются все сферы - от оплаты квитанций до покупки продуктов в интернет-магазинах. Бизнесы заинтересованы в дополнительной прибыли, а новые медиа - в больших количествах просмотров, лайках, отметках «поделиться». Современная жизнь диктует тренды массмедиа, а технологии позволяют это осуществить.
Дискуссия Дата-журналистика
В США уже в 1950-х гг. существовало понятие «компьютерная журналистика» («computer-assisted reporting», CAR), которое позднее скорректировалось и трансформировалось в понятие «журналистика данных». Впервые метод CAR использовался в 1952 г., когда телекомпания CBS с его помощью обрабатывала результаты президентских выборов [Рачинский, 2011]. Еще одной значимой датой в истории развития дата-журналистики стал 1967 г.: в Детройте Филип Мейер из «Detroit Free Press» 30 использовал те же методы для обработки статистических данных, чтобы определить, влияет ли уровень образования протестующих на участие в уличных протестах.
29 Gartner. URL: https://www.gartner.com/en (accessed 21.02.2021).
30 Detroit Free Press. URL: https://investigatingpower.org/philip-meyer/ (accessed 15.02.2020).
В 1970-е гг. был произведен ряд расследований, в том числе и проект «Документы Пентагона» - тайная история действий, осуществленных Министерством обороны США во время Вьетнамской войны. В 1989 г. Брант Хьюстон и Дженнифер Лафлер создают один из первых образовательных центров - «Национальный институт компьютерной отчетности» («National Institute for Computer-Assisted Reporting - NICAR») 31, где обучают всех желающих работе с большим количеством информации с помощью компьютера.
В 1970-1990 гг. разгромные материалы публиковали журналисты Дональд Барлетт и Джеймс Стил из «The Philadelphia Enquire». Они стали первыми журналистами, получившими две Пулитцеровские премии. Результатом их работы стал фундаментальный труд «Америка: что пошло не так?» 32, вышедший в свет в 1990 г. В 1996 г. авторы выпустили книгу «Америка: кто украл мечту?» 33, в которой они объяснили, как СМИ повлияли на идеологию среднестатистического американца.
В 2000 г. появляется доступ к оцифрованным электронным базам данных. В 2001 г. появляется термин «Big Data» («большие данные»), о котором упоминает Даг Лени из исследовательской компании «Gartner» 34. Его доклад был посвящен понятию «3V, Volume, Velocity and Variety» (Объем, скорость и разнообразие). Иными словами, большие данные - это увеличение скорости, объемов, типов и поступления новых данных. Одним из значимых событий в то время следует считать появление ресурса «WikiLeaks» 4 октября 2006 г. В рамках проекта был создан «Афганский военный дневник», содержащий 91 000 секретных отчетов об Афганской войне за период 2004-2010 гг. 35 В 2000-е гг. появляются материалы в стиле инфографики и мультимедийные проекты. Можно сказать, что на сегодняшний день дата-журналистика наиболее качественно представлена именно в американских СМИ.
В России развитие дата-журналистики происходит иначе. Важной датой в истории становления журналистики данных в России стал 1999 г., когда появился официальный сайт Росстата (Федеральной службы государственной статистики) 36. С этого момента стали появляться различные исследования, основанные на открытых данных. Росстат и сегодня публикует данные о разных сферах жизни человека, что, в свою очередь, открывает большой потенциал для создания полноценных исследований.
С помощью правильной обработки больших данных дата-журналисты могут предоставить аудитории такие материалы, которые позволят находиться в курсе всех новостей, не тратя на это много времени. В большинстве своем люди не обучены работать с большими данными, не умеют их понимать и не могут выбрать из доступной информации то, что важно. Таким образом, дата-журналисты становятся посредниками между большими данными и аудиторией, превращая массивы информации в легко читаемые материалы [Lesage, Hackett, 2014].
«Графика и визуализация должны быть инструментом для восприятия вашими глазами и мозгом того, что находится за пределами их естественной досягаемости», - отмечает Ал-берто Кови [Kovi, 2013]. Но должны ли сами журналисты обладать этими навыками? [Young et al., 2018]. Исследователи также задаются вопросами, могут ли журналисты сотрудничать с графическими дизайнерами и работать в тандеме? [Engebretsen et al., 2018]. Возможно, работа дата-журналистов должна сопровождаться и работой других специалистов, кто может обличать огромные объемы информации в полезный наглядный материал.
31 NICAR. Investigative Reporters & Editors. URL: https://www.ire.org/nicar/ (accessed 15.06.2020).
32 Barlett D., Steel J. America: What Went Wrong? Rigging the Game. Official Site of Donald Barlett and James Steel. URL: http://barlettandsteele.com/journalism/inq_wwr_1 (accessed 13.04.2020).
33 Barlett D., Steel J. America: Who Stole the Dream? Official Site of Donald Barlett and James Steel. URL: http://barlettandsteele.com/books/am_dream (accessed 09.10.2020).
34 Doug Laney. 3D Data Management: Controlling Data Volume, Velocity, and Variety, Gartner, file no. 949. 6 February 2001. URL: http://blogs.gartner.com/douglaney/files/2012/01/ad949-3D-Data-Management-ControllingData-Volume-Velocity-and-Variety.pdf (accessed 20.03.2021).
35 WarDiaries. WikiLeaks. URL: https://wardiary.wikileaks.org/ (accessed 15.03.2021).
36 Федеральная служба государственной статистики. URL: https://www.gks.ru/ (дата обращения 26.02.2021).
Заключение
В данной статье был обсужден ряд вопросов, связанных с дата-журналистикой, в том числе существующие понятия, значимые вехи в истории появления и развития журналистики данных в США, России, Латвии.
Многие исследователи говорят, что дата-журналистика - это новый тренд СМИ. При этом на российском рынке он появился сравнительно недавно и только начинает завоевывать свою аудиторию, так же как и в Латвии, тогда как в США существует десятки лет и имеет не только последователей среди дата-журналистов, но и центры обучения.
При обсуждении дата-журналистики важно понимать, что сегодня мы живем в эпоху больших данных («Big Data»), и в этом аспекте дата-журналистика может стать триггером для создания новых жанров журналистики, изменения роли и профессиональных качеств журналиста. Дата-журналистика может положительно повлиять на использование больших данных, поскольку традиционные журналисты зачастую не способны быстро их обработать. Она также решает проблему фейковых новостей, которая сегодня особенно распространена в информационном пространстве.
Простой пользователь конвергентного СМИ, новостного сайта является для этих технологий объектом исследования. На основе его привычек технологии МО и ИИ создают новостную ленту, соответствующую его интересам. В данном случае речь не идет о том, чтобы заменить журналистов роботами, хотя и это обсуждается в научном сообществе [Latar, 2015]. Речь, скорее, идет об оптимизации процессов сбора информации, для того чтобы увеличить скорость передачи новости и монетизации контента.
Поскольку на сегодняшний день специалисты по дата-журналистике единичны, то для развития этого направления необходимо ввести подобную дисциплину в учебных заведениях. Профессия журналиста видоизменяется, и журналист уже должен привыкнуть к тому, что ему все время необходимо получать новые навыки.
Тема дата-журналистики на сегодняшний день изучена слабо, она требует большего внимания со стороны исследователей, в том числе чтобы изучить ее влияние на традиционные и новые медиа.
Список литературы
Рачинский С. Журналистика баз данных: модный тренд или будущее профессии? // New Media Institute. 2011. URL: http://newmedia.in.ua/articles/business/zhurnalistika-baz-dannyx-modnyj-trend-ili-budu shhee-professii.html (дата обращения 20.03.2021). Шилина М. Г. Data Journalism - дата-журналистика, журналистика метаданных - в структуре медиакоммуникации: к вопросу формирования теоретических исследовательских подходов // Медиаскоп. 2013. № 1. URL: http://www.mediascope.ru/node/1263 (дата обращения 14.03.2021).
Шнайдер А., Колосова А. СМИ Латвии: История развития и современность. М.: Первое
экономическое изд-во, 2020. 230 с. Bradshaw P. Data Journalism Handbook. 2012. URL: https://datajournalismhandbook.org/ up-
loads/first_book/DataJournalismHandbook-2012.pdf (accessed 09.10.2020). Engebretsen M., Kennedy H., Weber W. Data Visualization in Scandinavian Newsrooms. Emerging Trends in Journalistic Visualization Practices. Nordicom Review, 2018, pp. 1-16. DOI 10.2478/nor-2018-0007 Kovi A. An Introduction to Information Graphics and Visualization. 2013. URL: https://ptgmedia.
pearsoncmg.com/images/9780321834737/samplepages/0321834739.pdf (accessed 28.03.2021). Latar N. The Robot Journalist in the Age of Social Physics: The End of Human Journalism? 2015. DOI 10.1007/978-3-319-09009-2 6
Lesage F., Hackett R. A. Between Objectivity and Openness - The Mediality of Data for Journalism. Media and Communication, 2014, no. 2 (2), pp. 42-54. DOI 10.17645/mac.v2i2.128 Veglis A., Bratsas C. Reporters in the age of data journalism: The case of Greece. Journal of Applied Journalism & Media Studies, 2017, no. 6 (2), pp. 225-244. Young M. L., Hermida A., Fulda J. What Makes for Great Data Journalism? Journalism Practice, 2018, no. 12 (1), pp. 115-135. DOI 10.1080/17512786.2016.1270171
References
Bradshaw P. Data Journalism Handbook. 2012. URL: https://datajournalismhandbook.org/ up-
loads/first_book/DataJournalismHandbook-2012.pdf (accessed 09.10.2020). Engebretsen M., Kennedy H., Weber W. Data Visualization in Scandinavian Newsrooms. Emerging Trends in Journalistic Visualization Practices. Nordicom Review, 2018, pp. 1-16. DOI 10.2478/nor-2018-0007 Kovi A. An Introduction to Information Graphics and Visualization. 2013. URL: https://ptgmedia.
pearsoncmg.com/images/9780321834737/samplepages/0321834739.pdf (accessed 28.03.2021). Latar N. The Robot Journalist in the Age of Social Physics: The End of Human Journalism? 2015.
DOI 10.1007/978-3-319-09009-2_6 Lesage F., Hackett R. A. Between Objectivity and Openness - The Mediality of Data for Journalism. Media and Communication, 2014, no. 2 (2), pp. 42-54. DOI 10.17645/mac.v2i2.128 Rachinsky S. Zhurnalistika baz dannykh: modnyi trend ili budushee professii? [Journalism of Database: A Fashion Trend or the Future of the Profession]. New Media Institute, 2011. (in Russ.) URL: http://newmedia.in.ua/articles/business/zhurnalistika-baz-dannyx-modnyj-trend-ili-budu-shhee-professii.html (accessed 20.03.2021). Shilina M. G. Data Journalism - data-zhurnalistika, zhurnalistika metadannykh - v strukture me-diakommunikatsii: k voprosu formirovania teoreticheskikh issledovatel'skikh podhodov [Data Journalism - Data Journalism, Metadata Journalism - in the Structure of Media Communication: On the Issue of the Formation of Theoretical Research Approaches]. Mediaskop [Media-scope], 2013, no. 1. (in Russ.) URL: http://www.mediascope.ru/node/1263 (accessed 14.03. 2021).
Shnaider A., Kolosova A. SMI Latvii: Istoria razvitia i sovremennost' [Media of Latvia: History of
Development and Modernity]. Moscow, 2020, 230 p. (in Russ.) Veglis A., Bratsas C. Reporters in the age of data journalism: The case of Greece. Journal of Applied Journalism & Media Studies, 2017, no. 6 (2), pp. 225-244. Young M. L., Hermida A., Fulda J. What Makes for Great Data Journalism? Journalism Practice, 2018, no. 12 (1), pp. 115-135. DOI 10.1080/17512786.2016.1270171
Информация об авторе Анна Александровна Шнайдер, доктор филологических наук
Information about the Author Anna A. Shnaider, Doctor of Sciences (Philology)
Статья поступила в редакцию 08.04.2021; одобрена после рецензирования 08.05.2021; принята к публикации 05.03.2022 The article was submitted 08.04.2021; approved after reviewing 08.05.2021; accepted for publication 05.03.2022