Научная статья на тему 'СРАВНИТЕЛЬНЫЙ АНАЛИЗ СТРУКТУРНО-СОДЕРЖАТЕЛЬНЫХ ЭЛЕМЕНТОВ МАШИННЫХ И ЖУРНАЛИСТСКИХ НОВОСТНЫХ СООБЩЕНИЙ'

СРАВНИТЕЛЬНЫЙ АНАЛИЗ СТРУКТУРНО-СОДЕРЖАТЕЛЬНЫХ ЭЛЕМЕНТОВ МАШИННЫХ И ЖУРНАЛИСТСКИХ НОВОСТНЫХ СООБЩЕНИЙ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
364
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБОТИЗИРОВАННЫЕ НОВОСТИ / СТРУКТУРНО-СОДЕРЖАТЕЛЬНЫЙ АНАЛИЗ / ПЕРЕВЕРНУТАЯ ПИРАМИДА / ЗАГОЛОВОК / ЛИД И КОРПУС НОВОСТИ / ROBOTIC NEWS / STRUCTURAL AND CONTENT ANALYSIS / INVERTED PYRAMID / HEADLINE / LEAD / BODY OF NEWS / QUOTATION

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Лукина Мария Михайловна, Палашина Екатерина Александровна

В статье впервые в отечественных медиаисследованиях продемонстрированы результаты сравнения текстов, созданных алгоритмом и написанных человеком. Для пилотажного сравнительного анализа новостных сообщений на экономическую тему информационного агентства «Интерфакс» была использована основанная на структурно-функциональном анализе методика качественного разбора журналистских текстов. Авторы полагают, что эта методика применима для осуществления дальнейших исследований, в частности количественного анализа, основанного на выборках больших массивов новостных текстов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A COMPARATIVE ANALYSIS OF STRUCTURAL AND CONTENT ELEMENTS OF MACHINE AND JOURNALISTIC NEWS REPORTS

Media digitalization and the exponential growth of open data sources have made it possible to adapt computing methods not only to collect, process, verify and distribute content, but also to create journalistic texts - an operation which until recently has been exclusively available to professional journalists. Weather, sports, stock markets and a number of other topics have become widely used by newsrooms for generating stories via text algorithmic solutions. In terms of its structure, the artificially created robotic news is not radically different from the texts written by human journalists. However, the fact of their inclusion in the media process piques the interest of media professionals and academic circles. This paper is one of the first in Russian media studies to provide the results of a comparative analysis of robotic texts and those created by human journalists. For the pilot comparative analysis of economic news reports of the Russian news agency Interfax, a methodology for the qualitative analysis of journalistic texts based on a structural-functional analysis was applied. The authors believe that this very technique could be used in further research procedures, including quantitative analysis based on larger samples.

Текст научной работы на тему «СРАВНИТЕЛЬНЫЙ АНАЛИЗ СТРУКТУРНО-СОДЕРЖАТЕЛЬНЫХ ЭЛЕМЕНТОВ МАШИННЫХ И ЖУРНАЛИСТСКИХ НОВОСТНЫХ СООБЩЕНИЙ»

Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Мария Лукина Екатерина Палашина

В статье впервые в отечественных медиаисследованиях продемонстрированы результаты сравнениятекстов, созданныхалгоритмом и написанныхчеловеком. Для пилотажного сравнительного анализа новостных сообщений на экономическуютему информационного агентства «Интерфакс» была использована основанная на структурно-функциональном анализе методика качественного разбора журналистскихтекстов. Авторы полагают, что эта методика применима для осуществления дальнейших исследований, в частности количественного анализа, основанного на выборках больших массивов новостныхтекстов. Ключевые слова: роботизированные новости, структурно-содержательный анализ, перевернутая пирамида, заголовок,лид и корпус новости.

© Лукина Мария Михайловна

кандидат филологических наук, доцент кафедры

новых медиа и теории коммуникации

факультета журналистики

МГУ имени М.В. Ломоносова

(г. Москва, Россия), [email protected]

© Палашина Екатерина Александровна

магистрант кафедры теории и экономики СМИ

факультета журналистики

МГУ имени М.В. Ломоносова

(г. Москва, Россия), [email protected]

Введение

Автоматизированное цифровое производство, управляемое интеллектуальными системами, проникло в разные структуры и процессы медиаиндустрии, в том числе в этап создания текстов. Одними из первых использовать алгоритмы для генерации контента стали крупные информационные агентства, работающие с большим потоком входящей финансовой информации. Алгоритмы, позволяющие создавать новости без участия человека, обеспечили молниеносную скорость создания сообщений, позволили максимально оперативно снабжать информацией свою аудиторию.

Первые опыты алгоритмизации новостей стали проводить такие информационные гиганты, как Associated Press, Bloomberg, затем к ним присоединились игроки журнального и газетного рынка. Эксперименты начали проводиться с 2013 г. Лидером по внедрению этих решений среди медийных компаний стало информационное агентство Associated Press. По словам его бизнес-редактора Филаны Паттерсон, к 2015 г. автоматизация освободила примерно 20% времени, необходимого журналистам на обработку данных и подготовку финансового блока новостей, что, в свою очередь, позволило им сконцент-

рироваться на творческой работе. Другим важным преимуществом применения алгоритмов Паттерсон назвала уменьшение вероятности ошибок в текстах1.

В отличие от зарубежных медиа, где практика использования готовых автоматизированных решений в производстве контента в последние годы стала неотъемлемой частью рабочего процесса, в России алгоритмы для создания новостных сообщений применяют лишь немногие редакции. К ним относятся информационные агентства «Интерфакс» и ТАСС, онлайн-издание Sports.Ru, женский глянцевый журнал ELLE и, конечно, поисковая система «Яндекс». По словам директора АНО «Информационная культура» Ивана Бегтина, применение алгоритмических решений в журналистике есть следствие «экономической целесообразности, о которой задумываются медиакомпании, чтобы не содержать человека, который писал бы про курсы ЦБ». Эксперт отметил, что «таких направлений в журналистике, где робот может заменить человека, найдется не более десятка, например, спорт, погода и др.»2.

Теоретический обзор

Теоретическим осмыслением алгоритмических решений в журналистике и медийной практике зарубежные исследователи начали заниматься с конца 2010 гг. Изучались разные аспекты, связанные с их применением, в том числе возникающие проблемы подотчетности (Hamilton, Turner, 2009), социологии феномена (Anderson, 2012), практики в разных ньюсрумах (Karisen, Stavelin, 2014), изменения в характере журналистского труда (Carlson, 2015), авторства (Monta, Reich, 2017), этических перспектив алгоритмических решений (Hollbuncher, Dorr, 2017), описывался также их статус-кво на определенный период (Graefe, 2016) и др.

Российский исследовательский дискурс не столь разнообразен, статьи посвящены изучению опыта роботизации в зарубежных СМИ (Иванов, 2015), проблемам транспарентности роботизированной журналистики (Иванов, 2017), роботизации медиапроизводства в контексте «журналистики смысла» (Зорин, 2016), теоретизации в фокусе журналистского образования (Замков, Крашенинникова, Лукина, Цынарёва, 2017). Отечественных разработок в области исследования созданного алгоритмами контента не проводилось.

Отечественный опыт роботизированной журналистики

Безусловным лидером в создании автоматических новостных лент является поисковая система «Яндекс», которая осенью 2015 г. запустила специальный сервис для СМИ «Яндекс для медиа»3. В своем блоге компания объяснила, что «информация поступает от ряда сервисов "Яндекса" -Пробок, Погоды и Поиска, обрабатывается с помощью алгоритмов и отображается в специальном интерфейсе для СМИ или рассылается подписчикам <...> в нашем "агентстве" нет ни одного корреспондента - только статистика и алгоритмы»4.

Своим подписчикам «Яндекс для медиа» предлагает новости, сортированные в соответствии с шестью тематическими блоками: интересы пользователей, пробки, погода, кино, музыка и электронная коммерция. Роботы оперативно сообщают о заторах на дорогах, передают последние метеосводки. Особенность решений «Яндекса» в его персонализированном интерфейсе, а формат подачи контента зависит от типа СМИ. Телеканалам, например, предлагают тексты для бегущей строки или адаптированные под телевизионное вещание готовые виджеты, радиостанциям - специальный интерфейс с обновлением информации в режиме ре-

ального времени, а печатным и онлайн- зательная оповещающая читателя марки-изданиям - электронную рассылку или ровка: «Это автоматическое сообщение». ленту уведомлений в виде RSS. Главный Использование алгоритмов в «Интеруспех предлагаемой «Яндексом» автома- факсе» не ограничивается генерацией тек-тизированной новостной ленты создатели стов, их применяют в ньюсрумах и в каче-видят в высвобождении временных ре- стве помощников при работе журналистов сурсов сотрудников редакций: «Готовые с входящим потоком информации. «У нас сводки новостей, которые можно сразу же каждый журналист мониторит в режиме ре-зачитать в эфире или использовать для ального времени как минимум 250 сайтов подготовки сюжета, позволят новостни- ежедневно, - говорит Юрий Погорелый, -кам сэкономить самый важный для них это им помогают делать специальные про-ресурс - время»5. граммы, которые выявляют инфоповоды,

Из производителей новостей в отече- а пишут текст сами журналисты на базе то-ственных СМИ первопроходцем по при- го, что узнали от роботов»7. В перспективе менению алгоритмических решений при- «Интерфакс» планирует развивать новые нято считать информагентство «Интер- направления автоматизации, в частности факс». Ленты с автоматизированными в области обработки большого количест-сообщениями появились там еще в се- ва данных. Например, просмотреть в оди-редине 1990 гг., и до сих пор с помощью ночку все решения арбитражных судов обработки структурированных данных журналист не в состоянии, а вот роботу роботы освещают некоторые сегменты справиться с такой задачей под силу. По экономического сектора: котировки акций, словам Погорелого, «роботы не создают курсы валют, изменение цен на товары какое-то новое знание, а лишь обрабаты-и др., также частично автоматизирована вают то, что уже есть». Ежедневно при уча-статистика по банкам и отчетности ВВП. стии роботов агентство публикует сотни По словам заместителя генерального ди- единиц информации, включая статистику, ректора «Интерфакса» Юрия Погорелого, отчетность, результаты торговли на орга-реализацией и постоянным апгрейдом низованных рынках и др. И такая частич-роботизированных разработок занима- ная замена ручного труда обеспечивает ется собственное подразделение служ- при выполнении рутинных задач серь-бы новостей агентства, в которую входит езную экономию времени журналистов. группа (Т-специалистов6. ТАСС в отличие от «Интерфакса» робо-

Производство автоматических ново- тизацией занимается последние несколько стей в «Интерфаксе» осуществляется, как лет и по некоторым направлениям лишь правило, в цикле полной автоматизации. в экспериментальном режиме. В частно-В этом случае работа алгоритма автономна сти, ТАСС реализует два ключевых про-и новость выпускается роботом на ленту екта, связанных с роботожурналистикой. автоматически, без участия журналиста. К первому относится написание заметок Однако существует режим и неполной ав- алгоритмами на основе входных данных. томатизации, когда подготовленный ма- Находящаяся в разработке программа уме-шиной текст перед отправкой на ленту ет анализировать дискретные данные и утверждает редактор. Юрий Погорелый может создавать новостные сообщения о говорит, что схема автоматизации зависит курсах валют, расходах бюджета и др. На от уровня сложности информации. Однако момент тестирования нового инструмента и в том, и в другом случае в конце каждой процесс строго контролировался редак-роботизированной новости ставится обя- торами, что было связано в первую оче-

редь с необходимостью предотвращения а робот. У него это получается гораздо быст-ошибок. Программисты информационного рее и с меньшими затратами», - говорит агентства также обучили программу мо- о планах ТАСС Михаил Лукин. ниторингу динамических данных с целью автоматизации биржевого и финансового Методик

потока информации в будущем. Налаживая Для сравнительного анализа новост-этот механизм, ТАСС экспериментировал ных сообщений была выбрана основанная с оперативным отслеживанием новостей на структурно-функциональном анализе с сайта Московской биржи. методика качественного разбора журна-

Однако особое внимание редакция листских текстов. В качестве эмпирической уделяет второму проекту: системе авто- базы использовались новостные сообще-матической категоризации текстов. Ана- ния на экономическую тему информаци-лизируя содержание каждого сообщения, онного агентства «Интерфакс». робот классифицирует его в соответствии В рамках исследования был постав-с рубриками, геолокациями и объектами. лен ключевой вопрос: в чем отличие текс-Кстати, аналогичная система применяет- тов, созданных алгоритмом, от написан-ся в американском новостном агентстве ных профессиональными журналистами? Associated Press, где каждый материал про- Сравнивались машинные и журналистские пускается через специальные автомати- тексты на предмет соответствия опреде-зированные «фильтры». ленным критериям структуры и содержа-

Эту технологию первыми начали при- ния новостного сообщения. менять региональные ленты ТАСС, затем Алгоритм автоматической генерации агентство категоризовало экономический «Интерфакса» участвует в написании но-раздел. «Эту разработку я считаю важ- востей на темы, связанные с рынком ценным достижением, благодаря которой воз- ных бумаг, курсами валют, деятельностью можно "выпечь" любую новостную ленту, Банка России (ЦБ), включая остатки де-что позволяет информагентству охватить нежных средств на корреспондентских мелких клиентов и заработать на этом», - счетах, отзывы лицензий у коммерческих объясняет заместитель главного редактора банков, установление цен на драгоцен-ТАСС Михаил Лукин8. Категоризация также ные металлы, анонсом макроэкономиче-минимизировала трудовые затраты ре- ских показателей, праздниками ведущих дакции. По словам Лукина, алгоритм, по стран мира.

сути, заменяет труд почти четырех журна- В качестве единиц контент-анализа были листов, чья работа была бы необходимой выбраны новостные тексты, опубликован-в случае ручного создания такой персо- ные на ленте финансово-экономической нализированной ленты. информации «Интерфакса» в октябре-но-

Осознавая перспективность этой тех- ябре 2018 г. Всего для исследования было нологии, разработчики ТАСС намерены отбрано 50 публикаций разного объема, в создать универсальный алгоритм, который статье для разбора использовано шесть ти-будет обрабатывать более сложные дан- повых новостей (три произведены роботом, ные - например, отчеты компаний, пресс- (три написаны журналистами). релизы и метеосводки. Для наполнения Ограниченность выборки объясняет-материалов предполагается автомати- ся тем, что для новостных сообщений ин-зировать также архивы информагентст- формационного агентства, специализи-ва. «Не человек будет смотреть, в какой рующегося на финансово-экономической период курс доллара поставил рекорд, информации, характерно следование шаб-

75

лонам и строгая композиция, соответст- ны на предмет наличия или отсутствия

вующая сформированным и устоявшимся структурно-содержательных компонентов:

редакционным стандартам. Новости, соз- заголовка/хедлайна; лида; корпуса/тела

данные как алгоритмом, так и человеком, новости; бэкграунда. В ходе исследования должны отвечать этим статндартам, про- анализировалось также использование

писанным в разработанном агентством структурного принципа «перевернутой

«Интерфакс» стайлгайде9, в связи с этим пирамиды», т.е. изложение сообщения по

рандомно выбранные эмпирические объ- степени важности от главного к второсте-

екты представляются релевантными для пенному, и полноты содержания, которое

исследования. раскрывается ответами на вопросы кто?

В качестве индикаторов сравнитель- что? где? когда? почему? как? ного контент-анализа новостных сообще- Сравнение проводилось и в соответствии ний, произведенных роботами и журнали- с такими критериями, как объем сообще-стами, были выбраны следующие струк- ния, длина предложений, насыщенность турно-содержательные характеристики числовыми данными, расчетными величии элементы: нами, а также специальной терминологией.

• заголовок/хедлайн (вид, его соответствие теме); Тексты, созданные алгоритмом

• лид (расставленные акценты); Пример 1.

• корпус/тело новости (использование Средний курс продажи наличного доллара цитат, ссылок и их виды, фактологическая США в банках Москвы достиг минимального наполненность)' значения за месяц и составляет 66,4822 руб.

бэкграунд (наличие, функции);

23 ноября. «Финмаркет» - Минимальное

значение за месяц (с 24 октября по 23 ноября) -

• полнота содержания (ответы на во- „ „„_,_, 4 к к ' -, -, , -, , ,, 66,4822 руб. за доллар, максимальное значение

просы кто? что? где? когда? почему? как?); с ОС;ПО г ' ' - 68,6428 руб. за доллар, среднии курс продажи

• насыщенность числ°выми данными; за месяц снизился на 0,02 руб.

• насыщенность расчетными величи- Это автоматическое сообщение (23.11.2018). нами;

• насыщенность специальной терми- Анализируемая новость посвящена сред-нологией; нему курсу продажи наличного доллара

• длина предложений. США в банках Москвы за месячный пери-

Чтобы зафиксировать результаты срав- од с 24 октября по 23 ноября 2018 г. Она

нительного контент-анализа были раз- относится к наиболее распространенно-работаны рабочие таблицы (см. табл. 1 му виду коротких автоматизированных и 2), которые демонстрируют ключевые сообщений о курсах иностранных валют. особенности новостных публикаций ал- Новость включает заголовок (хедлайн), горитмической природы и публикаций, который отражает главную суть новости, созданных человеком. а также изложенный в одном предложе-

нии корпус новости. По своей структуре Результаты новость напоминает срочную новость, или

Пилотный зондаж структурно-содер- «молнию», так как в анализируемом случае жательных элементов новостных заметок вся информация сформулирована сжато, проводился на материалах информацион- всего в нескольких фразах. Главной опо-ного агентства «Интерфакс/Финмаркет». рой текста служат цифры, которые явля-Ниже приводятся результаты анализа но- ются основными смысловыми единица-востных сообщений, которые рассмотре- ми контента, посвященного узкой обла-

сти финансовых отношений. Информация сийскому рублю на основе средневзвешенного значения курса доллара США на торгах со

представлена в соответствии с правилом сроком расчетов «завтра», сложившегося по

«перевернутой пирамиды». Текст отвеча- состоянию на 11:30 дня торгов.

ет лишь на часть вопросов «что произош- Источник данных - Московская биржа.

ло? где и когда произошло?». Структурные (28.11.2018).

элементы лид и бэкграунд отсутствуют.

В новости используется принятый в Данная автоматическая новость также

«Интерфаксе» дейтлайн, указывающий, посвящена курсу валют, но по сравнению

когда и кем передана информация10. В с предыдущим примером она более рас-

конце сообщения агентство маркирует ширена и сочетает в себе все структурные

алгоритмическую природу новости - «это элементы: заголовок (хедлайн), лид, кор-

автоматическое сообщение». Материал пус и бэкграунд. Хедлайн в соответствии

изобилует цифрами, причем не округлен- со стандартами новостного агентства со-

ными, а максимально точными (дробные держит основную информацию; контек-

числовые значения). стуальный бэкграунд состоит из одного Объем новостного сообщения состав- предложения и выполняет функцию спра-ляет 50 слов, насыщенность текста чи- вочной информации. Новость также снаб-

словыми данными исчисляется шестью жена дейтлайном и строится по мере сни-

словами, что от общего объема текста жения значимости информации, отвечая

составляет 12%. В новости отсутствуют при этом не на все возможные для жанра

расчетные величины (выражаемые, как «перевернутой пирамиды» вопросы.

правила, в процентах, количестве раз), В представленной новости робот не а также специальная терминология. Дли- только указывает на показатель курса

на предложений не превышает 30 слов. доллара, но и детализирует ее, включая

Пример 2. в сообщение сравнение курса и объемов

Средневзвешенный курс доллара США к рос- торгов за предыдущие периоды, а также

сийскому рублю со сроком расчетов «завтра» бэкграунд, рассказывающий с какого вре-

66состоянию на 11:30 мае 28 н°ября гостам мени, как и когда Банк России устанавли-

66,9436 руб. вает официальный курс доллара.

28 нояИря. «Финмаркет» - На 11:30 мск сред- Как и в Примере 1, сообщение содержит невзвешенный курс доллара США к российскому

большой объем количественной инфор-

рублю со сроком расчетов «завтра» на торгах

Московской биржи повысился на 789 пунктов мации с максимальной точностью (дроИ-

(1 пункт соответствует 0,01 коп.) по сравнению ные числовые значения). Помимо стан-

со средневзвешенным курсом предыдущего дартной для автоматических сообщений

торгового дня и составил 66,9436 руб. По срав- «Интерфакса/Финмаркета» маркировки,

нению с уровнем, сформировавшимся к этому обозначающей авторство алгоритма, в

времени накануне, средневзвешенный курс новости указан источник данных - Мос-

доллара вырос на 1636 пунктов. ковская биржа.

Минимальная цена 66,76 руб. максима^- Всего в новостной публикации 158 слов,

ная - 67,06 руб. Было заключено 4615 сделок. насыщенность текста числовыми данными

Объем торгов безучета внесистемных сделок исчисляется в количестве 17 слов, что от составил 35982 млн руб., что на 175% выше г г лг,

п общего объема текста составляет 10,7%. среднего значения за последний месяц. Послед- „ ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

няя сделка была совершена по курсу 67,0025 Всего одно слово (0,6%) указывает на рас-руб за доллар четную величину. Насыщенность специаль-

С 15 апреля 2003 г. Банк России устанавли- ной терминологией равняется почти 2% вает официальный курс доллара США к рос- (к экономической лексике относится три

77

слова). Длина предложений варьируется от Москва. 20 ноября. «Интерфакс» - Существенное снижение нефтяных цен и рост их во-

11 до 39 слов.

Пример 3.

латильности практически не оказали влияния на динамику курса рубля, говорится в обзоре

Загруженность Кутуз^шт проспекта зна- рИсКоВ финансовых рынков, опубликованном

чительно выше обычного. на сайте ЦБ РФ

Москва. 28 ноябРя, 21:03. <<Яндекс ПРобки» «Даже на фоне столь существенного падения

Неожиданно плотное движение сейчас на Куту- цен на нефть в октябре продолжилось снижение

зовском проспекте. Загруженностьмагистрали ожидаемой волатильности рубля по отношению

изцен28а -7 (5аллов, что на 4 балла выше обыч- к доллару США», - подчеркивает ЦБ. Регулятор

ного Í28.11.2018). отмечает, что уровень ожидаемой волатильно-

Отдельного упоминания заслуживают сти по паре «доллар США/рубль» на срок 3 ме-

автоматизированные новости, подготов- сяца восстановился до значений, предшеству-

.. . ющих всплеску волатильности на рынках стран

ленные «ИнтеРфаксом» в сотРудничестве с развивающимися рынками в августе. «Прио-

с «Яндексом». К ним относятся короткие становка покупок валюты в рамках бюджетного

ro^^H^ а также расширенныеобзоры, правила позволяла сдерживать волатильность

посвященные пробкам и транспортной за- рубля даже в условиях значительного снижения

груженности дорог больших российских мировых цен на нефть. Этому способствовали

городов, включая Москву и Санкт-Петер- и принятые Банком России решения по ключе-

бург. Публикация (пример 3) подготовлена вой ставке», - считает Банк России.

роботом «Яндекса» и инкорпорирована в Регулят°р отмечает, что с°гласн° междуна-

ленту новостного агентства в рамках про- родным исследованиям, снижение волатиль-

екта «Яндекс для медиа», в соответствии ности валютного курса т^стаует сдер™-

с которым «Интерфакс» вместе с пакетом нию доходностей государственных облигаций

в национальных валютах. Отношение между

собственного автоматизированного кон-

к уровнем волатильности на валютном рынке и

тента также использует пакет автомати- стоимостью государственных заимствований в ческих новостей «Яндекса» по пробкам. России соответствует пропорциям, характерным В частности, структурно-содержатель- для emerging markets economies (EME) в целом. ный скелет представленной новости со- «Текущая динамика обменного курса рос-стоит из заголовка, дейтлайна, корпуса сийского рубля была обусловлена общим хаи содержит сообщение о загруженности рактером движения потоков капитала на рын-одной из главных магистралей Москвы ках ЕМЕ. Существенные °ткл°нения вниз трав максимальной упрощенной и краткой ектории движения обменного курса рубля от

форме.

направления притока/оттока капитала на рынки

™тп„и„„,„:т,„„„ „г,™ ЕМЕ наблюдались в периоды повышенной во-Новость, состоящая из 30 слов, содер- к

латильности в апреле и августе, однако ниве-

жит не более двух, относящихся к катего- лировались в последующие периоды по мере

рии числовых данных, что в процентном нормализации рыночной конъюнктуры», - го-

соотношении от общего количества вы- ворится в обзоре

ражено как 6,6%. Расчетные величины и «Ситуация на российском финансовом рынке

терминология в тексте отсутствуют. Пред- в октябре являлась стабильной. Динамика ры-

ложения короткие - от шести до 12 слов. ночных индикаторов соответствовала тенденциям, характерным для стран с развивающимися

Тексты, созданные журналистами рынками в целом. Риски являлись сбалансиро-

Пример 4. ванными», - подчеркивается в обзоре.

Новости «Интерфакса» ЦБ напоминает, что риски более серьезно-

Снижение цен на нефть и их волатильность го снижения нефтяных цен были связаны с со-

практически не оказали влияния на динамику общениями Саудовской Аравии о нежелании

курса рубля в октябре - ЦБ РФ. допустить формирование дефицита сырья на

мировом рынке и своей возможности нарастить Эльвира Набиуллина в кулуарах форума «ВТБ добычу нефти до 12 млн баррелей в сутки. На Капитала» «Россия зовет!». этом фоне снижение мировых цен на нефть в «Мы будем рассматривать и повышение став-октябре оказалось максимальным за два го- ки, и сохранение ставки, и возможности», - ска-да: цены марок нефти Brent и Urals в долларах зала глава ЦБ.

США снизились на 8,8% и 9,8% соответственно. «Мы 14 декабря собираемся на очередное Служба финансово-экономической инфор- заседание совета директоров и, как всегда, бу-мации (20.11.2018). дем рассматривать все факторы, текущие тен-

денции, уточнять наш прогноз, будем рассма-Новость, написанная журналистом, по- тривать тенденции в инфляции, инфляционных священа динамике курса рубля. От пре- ожиданиях, что пр°исх°дит в экономике, на дыдущих автоматических публикаций рынке труда, и принимать решение. Есть мно-

она отличается объемом, а также нали- го факторов, которые мы будем принимать во

внимание, для того чтобы принять решение по-

чием цитат и прямой ссылки на источник

сле обсуждения», - добавила Э. Набиуллина.

в корпусетекста. В подтвераденше своих цб о^чает разные тенденции со стороны слов журналист информагентства при- внешних и внутренних факторов. «Что каса-водит выдержки из обзора финансовых ется, например, внешних рисков, на которые рынков, опубликованных ЦБ, ссылаясь мы всегда обращаем внимание, мы видим, что на регулятор банковской системы в ка- чуть-чуть стабилизировалась ситуация с разви-ждом абзаце. вающимися рынками, это, прежде всего, связа-

Новость также строится по принципу но со стабилизацией ситуации в странах, кото-«перевернутой пирамиды», отвечая на клю- рые испытывали наибольшую волатильность. чевые вопросы, выраженные формулой чуть-чуть ослабли некоторые ожидания санк

ций, срок их введения. Но при этом мы видим изменения на рынке нефти», - отметила пред-

5W+H. Текст образован такими элементами, как заголовок (хедлайн),отражающий седатегБаниРосТии

главную тему и суть новости, прямой лид Со стороны внутренних факторов ЦБ оби корпус. в соответствии с разработанны- ращает внимание на приближение инфляции ми и принятыми агентством стандартами к цели. «Мы видим, что инфляция уже близка создания материалов в начале новости к нашей цели, и приближение к нашей цели находится дейтлайн. снизу произошло быстрее, чем мы ожидали.

Объем публикации - 322 слова. В отли- Инфляционные ожидания пока остаются на чие от предыдущих примеров большин- повышенном уровне неровном: они в октябре ство предложений длинные, в среднем их сн^шс^ в нгафе мы видим ^ятъ неюттор^ размер более20 слов. Числовые и расчет- повышение ^фяяц^ых ожиданий. Ситуа-

ные величины представлены в меньшем ция на рынке труда при этом характеризуется

практически полной занятостью», - добавила количестве, по два-три слова на весь текст, Э Набиуллина

что в процентном соотношении составля- ■ ключевая ставка ЦБ сейчас составляет 7,50% ет 0,6% и 0,9% соответственно. Насыщен- (26 11 2018) ность специальной терминологией - 2,2%

(семь слов на текст). В анализируемом примере представ-

Пример 5. лена новость о возможном повышении

ЦБ Рф 14 декабряр^шотри-г и п°вышeниe, ключевой ставки Центрального Банка.

и сохранение ключевой ставки - Набиуллина Текст построен на основе прямой речи

Москва. 28 ноября. «Интерфакс» - ЦБ Рф главы ЦБ Эльвиры Набиуллиной. Журна-на заседании совета директоров 14 декабря

с- лист использует прямые цитаты предсе-

будет рассматривать и повышение, и сохране- ' г 4 г м

ние ключевой ставки, учтет все факторы, сооб- дателя Банка России в качестве главного

щила журналистам председатель Банка России источника новости, упоминая при этом,

79

что разговор с ньюсмейкером прошел в

прогнозном горизонте продолжится реализа-

, -т ция денежно-кредитном политики в рамках

кулуарах инвестици°нног° форума. Так режима инфляционного таргетирован^я. Осо-

авт°р материала акцентирует внимание бое внимание Банк России продолжит уделять

на эксклюзивности представленной в но- мониторингу рисков финансовой стабильно-

вости информации. сти и ее поддержанию. Бюджетная политика

В структуре сообщения три элемента: продолжит проводиться в рамках бюджетных

заголовок (хедлайн), дэйтлайн, прямой правил, направленных прежде всего на изо-

лид и корпус, бэкграунд отсутствует. Уже ляцию ключевых внутренних экономических

в заголовке дается отсылка к главному параметров от волатильной внешнеэкономи-

источнику информации. Лид, по сути, яв- ческой конъюнктуры и создание устм^ для

ляется расширенной версией заголовка. устойчивого экономического росга. "Гарифная

Текст характеризуется полнотой содержа- политика будет проводиться в соответствии с

долгосрочными принципами тарифного регу-

ния благодаря ответам на основные, при- лирования, приоритетом которых ¿сохранится

сущие новостному жанру вопросы. ограничение темпов роста цен на услуги есте-

Всего новость состоит из 256 слов. Объ- ственных монополий уровнем инфляции», -

ем использования числовых данных, рас- описывают в министерстве базовый сценарий

четных величин и терминов мал: три, одно долгосрочного прогноза.

и три слова, которые в процентном рас- Средний темп роста экономики ожидается

чете составляют следующую величину: министерством в 2018-2024 годах на уровне

1,2%, 0,4% и 1,2%. Длина предложений - 2,7% в im в 2025-2030 щцах - 3,2% в im в

от шести до 39 слов. 2031-2036 года х - 3,0% в год.

Пример 6 Минэкономразвития также подготовило и

К 2036 году ВВП РФ вырастет в 1,7 раза, ре- консервативный вариант долгосрочного прог-альные доходы населения - в 1,5 раза - прог- нгаа где цены на нефть к 2020 году ^уо^тся ноз Минэкономразвития до $43 за баррель и плавно повышаются до $52

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

28 ноября. Finmarket.ru - Рост российско- к 2030 году. Вэтом сценарии темпы роста ВВП

го ВВП в базовом варианте прогноза в долго- ниже на несколько десятых процентных пунк-

срочной перспективе будет колебаться около тов в год, чем в базовом варианте (28.11.18). 3% в год, что означает рост экономики в 1,7 раза

к 2036 году относительно 2018 года, говорится Новость посвящена макроэкономиче-

в долгосрочном прогнозе Минэкономразви- ской теме, а именно прогнозу роста ВВП в

тия, утвержденном на прошлой неделе пра- России. Структура сообщения стандартна

вительством. для такого вида новостей и включает та-

Согласно базовому варианту долгосроч- кие элементы, как заголовок, прямой лид

ного прогноза, инвестиции к 2036 году выра- и корпус, в каждом из которых содержится

стутв 22раза к 2018 году, промпроизводство - отсылка к ведомству Минэкономразвития.

в ираза, реальные д°х°ды населения - в 1,5 ра- информация излагается журналистом по

за, реальная заработная плэта - в 1,6 раза, pоз- принципу от главного к второстепенному, ничная торговля - также в 1,6 раза.

отвечая на основные вопросы за исклю-Минэкономразвития России заложило в ба- г

чением объяснения причин — «почему?»

зовый сценарий предпосылку о постепенном

снижении цен на нефть марки Urals до уровня Автор публикации детализирует свой $52-53 за баррель в 2025-2030 гг. с последу- текст подробной прямой цитатой из базо-ющим ростом в номинальном выражении тем- вого отчета-прогноза министерства. Но-па долларовой инфляции - до $58 в 2036 году. вость также изобилует цифрами: точными «В части внутренних условий социально- датами, процентами и другими величина-экономического развития в базовый сцена- ми, раскрывающими основные макроэко-рий заложены следующие предпосылки. На номические показатели, что, в свою оче-

Таблица 2. Объем заметок, насыщенность числовыми данными, расчетными величинами и специальной терминологией

Таблица 1. Структурные элементы новостных заметок, созданных алгоритмом и человеком

Номер новости (пример) Заголовок Лид Корпус (тело) Бэкграунд Полнота содержания (ссылки на источники, цитаты ньюсмейкеров)

1 + - + - -

2 + + + + -

3 + - + - -

4 + + + - +

5 + + + - +

6 + + + - +

Номер новости (пример) Объем новости (в словах) Насыщенность числовыми данными, % Насыщенность расчетными величинами, % Насыщенность специальной терминологией, % Длина предложений (в словах)

1 50 12 — — 18, 29

2 158 10,7 0,6 1,9 11, 16, 21, 29, 35, 39

3 30 6,6 — — 6,7, 12

4 322 0,9 0,6 2,2 6, 9, 13, 13, 16, 18, 19, 20, 23, 23, 27, 28, 30, 36, 37

5 256 1,2 0,4 1,2 6, 8,10, 12, 12, 12, 13, 14, 18, 20, 21, 33, 33, 39

6 303 6,9 4,2 3,3 12, 12, 13, 17, 18 27, 28,28, 31, 37, 38, 39

редь, делает сообщение информационно насыщенным.

Объем новостного сообщения - 303 слов. Насыщенность числовыми данными -6,9% (21 слово от суммарного количества), а насыщенность расчетными величинами 4,3% (13 слов от суммарного количества). В тексте также было найдено 10 терминов, насыщенность которых измеряется в показателе 3,3%. Предложения в отличие от автоматических новостей также длинные. В составе бо-

лее половины предложений от 25 до 39 слов в каждом.

В ходе проведенного авторами исследования изучалось в том числе использование структурного принципа «перевернутой пирамиды», т.е. изложения сообщения по степени важности от главного к второстепенному, а также полноты содержания, которое раскрывается ответами на вопросы кто? что? где? когда? почему? как? (см. табл. 1). Новостные сообщения также сравнивались в соответствии с та-

81

кими критериями, как насыщеннось чи- ров, ссылки на «человеческие» источники,

словыми данными, расчетными величи- в-третьих, полнота содержания раскрыва-

нами, специальной терминологией, длина ется с помощью вопросов как? и почему?,

предложений (см. табл. 2). устанавливающих причинно-следственные

связи события, которые алгоритмы пока

Заключение не научились восстанавливать.

Для пилотажного анализа созданных с Автоматические новости по своему

помощью алгоритма и написанных журна- объему уступают новостям, подготов-

листами новостных сообщений информа- ленным человеком. В машинных текстах

ционного агентства «Интерфакс» на эконо- также короче длина самих предложений.

мическую тему была использована методи- Такую разницу можно объяснить тем, что

ка качественного разбора журналистских алгоритмы, не обладающие в отличие от

текстов. В результате сравнения исследо- профессионального журналиста способ-

ватели пришли к следующим выводам. Су- ностью мыслить, анализировать и гра-

щественных отличий между машинным и мотно выстраивать в тексте причинно-

журналистским текстом в рассмотренных следственные связи, пока не способны

материалах выявлено не было, большин- производить большие полноценные текс-

ство структурно-содержательных компо- ты. Освоение технологий автоматизации

нентов, а именно заголовок/хедлайн; лид; пока осуществляется в простых формах

корпус присутствуют в изученных как в журналистского текста, поэтому работу

алгоритмических, так и журналистских алгоритма можно изучать исключительно

новостных сообщениях. И в тех, и в дру- в рамках коротких новостных сообщений,

гих новостях (кроме примера 2) отсутст- похожих по своей форме на оперативные

вовал бэкграунд в силу того, что в фокусе оповещения.

внимания были краткие новости, иногда в Показатель насыщенности числовыми

формате молний. Исследование показало, данными автоматических новостей вы-

что по своим семантическим и стилисти- ше, чем показатель текстов не алгорит-

ческим особенностям текст журналиста мической природы. Это связано с тем, что

мало чем отличается от машинного текста алгоритмы работают в первую очередь

в силу специфики письма, используемого с изменениями в насыщенных числовой

для написания экономических информа- информацией данными. Приоритетная

ционных сводок по конкретным отраслям задача автоматизированного подхода

рынка. Тексты, выбранные для сравнения, заключается в работе с готовыми текс-

не содержали ни языковых неточностей товыми шаблонами, каждый раз требу-

(включая орфографические, пунктуаци- ющими ввода новых данных, касающихся,

онные, стилистические), ни логических например, точных значений изменивше-

ошибок. гося курса валют, стоимости ценных бумаг,

Однако при всей схожести новости, со- драгоценных металлов или информации зданные журналистом, по сравнению с о загруженности дорог. Наличия точных роботизированными текстами отличают числовых данных также постоянно требу-следующие черты: во-первых, для них ха- ет унифицированность формата анонса рактерно наличие более разнообразно- макроэкономических показателей, в кого и исчерпывающего фактологического торых обязательным является указание материала, во-вторых, привлекается ин- даты и времени выхода нового анонса. формация, которую невозможно собрать с При этом автоматические сообщения помощью алгоритма, - цитаты ньюсмейке- редко содержат расчетные величины, ука-

зывающие на процентные показатели, а также сравнения, выраженные в количестве раз. Такая особенность объясняется тем, что авторы новостной ленты «Интерфакса» в отличие от алгоритма не только фиксируют информацию, но и перерабатывают ее, преобразуют в более простой вид, тем самым облегчая читателю процесс чтения и понимания и экономя его время. Анализ показал, что тексты журналистов могут отображать тенденции, динамики, зависимости, возможные прогнозы, которые сложно представить в публикации робота без привлечения расчетных величин.

Насыщенность специальной терминологией у автоматизированных и неавтоматизированных новостей относительно одинаковая. В силу специфики экономической тематики наличие в текстах специальной экономической лексики - естественное и необходимое условие, позволяющее осуществлять коммуникацию с целевой аудиторией, в которую входят преимущественно участники деловых отношений. Однако в отличие от новостей, подготовленных журналистами, употреб-

ление терминологии в автоматических новостях реализуется в рамках шаблонных речевых конструкций. Другая особенность заключается в отсутствии раскрытия значения терминов. Это можно объяснить целью адресной доставки информации.

Заместитель генерального директора «Интерфакса» Юрий Погорелый, рассказывая об особенностях автоматических новостей, отмечает: «Машинные тексты всегда одинаковые. По стилю это такое же информационное сообщение. Но если говорить о сути вещей, то такой текст всегда будет абсолютно стандартизованным»11. Заместитель главного редактора ТАСС Михаил Лукин также уверен в том, что пока преимущество сохраняется за журналистом, несмотря на огромную пользу алгоритмов в генерации новостей, благодаря которым удается анализировать большие массивы структурированных данных и в определенных ситуациях работать быстрее и эффективней человека. Он отмечает, что есть операции, которые человек делает лучше, чем машина, и, видимо, будет делать лучше всегда.

Примечания

1 Associated Press: Automated Insights. Режим доступа: https://automatedinsights. com/customer-stories/associated-press (дата обращения: 21.11.2018).

2 Выступление на круглом столе «Роботожурналистика: современное состояние и перспективы развития» (НИУ ВШЭ, 22 декабря 2017 г.).

3 Голицына А. «Яндекс» создает информагентство, где новости станут писать роботы // Ведомости. 2015. Окт., 25. Режим доступа: https://www.vedomosti.ru/ technology/articles/2015/10/25/614215-yandeks-informagentstvo-roboti (дата обращения: 21.11.2018).

4 Блог Яндекса: Яндекс для медиа. 2015. Ноябрь, 10. Режим доступа: https://yandex. ru/blog/company/99487 (дата обращения: 21.11.2018).

5 Там же.

6 Интервью авторов с заместителем генерального директора «Интерфакса» Ю. Погорелым. 2017. Дек., 13.

7 Там же.

83

8 Интервью авторов с заместителем главного редактора ТАСС М. Лукиным. 2017. Дек., 14.

9 Технология новостей от Интерфакса / под ред. Ю.А. Погорелого. М.: Аспект Пресс, 2011.

10 Там же. С. 10-11.

11 Интервью авторов с Ю. Погорелым. Библиография

Замков А.В., Крашенинникова М.А.,Лукина М.М., Цынарёва Н.А. Роботизированная журналистика: от научного дискурса к журналистскому образованию // Медиаскоп. 2017. Вып. 2. Режим доступа: http://www.mediascope.ru/2295

Зорин К.А. Медиафутурология: «журналистика смысла» в условиях роботизации медиапроизводства и общества // Медиаскоп. 2016. Вып. 1. Режим доступа: http:// www.mediascope.ru/node/2078

Иванов А.Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак: Проблемное поле медиаобразования. 2015. № 2 (16). С. 32-38.

Иванов А.Д. Транспарентность роботизированной журналистики: как новые технологии угрожают принципам профессии // Вестн. Челябинск. гос. ун-та. 2017. № 8 (404). С. 28-32.

Anderson W. (2012) Towards a Sociology of Computational and Algorithmic Journalism. New Media and Society 15 (7): 1005-1021.

Carlson M. (2015). The Robotic Reporter: Automated Journalism and the Redefinition of Labor, Compositional Forms, and Journalistic Authority. Digital Journalism 3: 416-431.

Graefe A. (2016) Guide to Automated Journalism. Tow Center for Digital Journalism, Columbia Journalism School.

Hamilton J.T, Turner F. (2009) Accountability Through Algorithm: Developing the Field of Computational Journalism. Режим доступа: http://cjlab.stanford.edu/files/Accountability%20 through%20algorithm_Developing%20the%20field%20of%20computational%20journa-lism.pdf

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Hollbuncher K., Dorr K.N. (2017) Ethical Challenges of Algorithmic Journalism. Digital Journalism 5 (4): 404-419. DOI: 10.1080/21670811.2016.1167612

Karlsen J., Stavelin E. (2014) Computational Journalism in Norwegian Newsrooms. Journalism Practice 8 (1): 34-48. DOI: 10.1080/17512786.2013.813190

Monta T., Reich Z. (2017) I, Robot. You, Journalist. Who is the Author? Authorship, Bylines and Full Disclosure in Automated Journalism. Digital Journalism 5 (7): 829-849. DOI: 10.1080/21670811.2016.1209083

i Надоели баннеры? Вы всегда можете отключить рекламу.