Научная статья на тему 'АВТОМАТИЗАЦИЯ ФАКТЧЕКИНГА В ЖУРНАЛИСТИКЕ: ОГРАНИЧЕНИЯ И ПЕРСПЕКТИВЫ РАЗВИТИЯ'

АВТОМАТИЗАЦИЯ ФАКТЧЕКИНГА В ЖУРНАЛИСТИКЕ: ОГРАНИЧЕНИЯ И ПЕРСПЕКТИВЫ РАЗВИТИЯ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
332
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТЧЕКИНГ / АВТОМАТИЗАЦИЯ ФАКТЧЕКИНГА / СИСТЕМЫ АВТОМАТИЗАЦИИ ФАКТЧЕКИНГА / ДОСТОЙНЫЕ ПРОВЕРКИ УТВЕРЖДЕНИЯ / ФЕЙКОВЫЕ НОВОСТИ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Королев Игорь Александрович

Широкая техническая и социальная медиатизация повлекла за собой значительное увеличение циркулирующей в медиапространстве непроверенной информации, в том числе фейко-вых новостей. Одним из способов преодоления проблемы недостатка ресурса у редакций СМИ для качественной и оперативной обработки возросших потоков непроверенной информации является автоматизация процесса установления достоверности фактов/фактических утверждений (фактчекинга). В статье на основании анализа шести популярных систем автоматизированного фактчекинга («ClaimBuster», «ClaimPortal», «Squash», «AFCNR», «Full Fact» и «Context-Aware») раскрыты основные принципы и алгоритмы работы подобных систем, а также выявлены ограничения и перспективы развития данного направления автоматизации журналистики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATION OF FACT-CHECKING IN JOURNALISM: LIMITATIONS AND PROSPECTS FOR DEVELOPMENT

Widespread technical and social mediatization has led to a significant increase of unverified information (including fake news) circulating in the media space. One of the ways to overcome the problem of deficit of resources for media editorial offices for high-quality and efficient processing of increased volume of unverified information is to automate the process of establishing the reliability of facts/factual claims (fact-checking). Based on the analysis of six popular automated fact-checking systems ("ClaimBuster", "ClaimPortal", "Squash", "AFCNR", "Full Fact" and "Context-Aware"), the article reveals the basic principles and algorithms of the functioning similar systems, as well as the limitations and prospects for the development of this field of journalism automation.

Текст научной работы на тему «АВТОМАТИЗАЦИЯ ФАКТЧЕКИНГА В ЖУРНАЛИСТИКЕ: ОГРАНИЧЕНИЯ И ПЕРСПЕКТИВЫ РАЗВИТИЯ»

УДК 070

И. А. Королев

Белорусский государственный университет

АВТОМАТИЗАЦИЯ ФАКТЧЕКИНГА В ЖУРНАЛИСТИКЕ: ОГРАНИЧЕНИЯ

И ПЕРСПЕКТИВЫ РАЗВИТИЯ

Широкая техническая и социальная медиатизация повлекла за собой значительное увеличение циркулирующей в медиапространстве непроверенной информации, в том числе фейко-вых новостей. Одним из способов преодоления проблемы недостатка ресурса у редакций СМИ для качественной и оперативной обработки возросших потоков непроверенной информации является автоматизация процесса установления достоверности фактов/фактических утверждений (фактчекинга). В статье на основании анализа шести популярных систем автоматизированного фактчекинга («ClaimBuster», «ClaimPortal», «Squash», «AFCNR», «Full Fact» и «Context-Aware») раскрыты основные принципы и алгоритмы работы подобных систем, а также выявлены ограничения и перспективы развития данного направления автоматизации журналистики.

Ключевые слова: фактчекинг, автоматизация фактчекинга, системы автоматизации фактче-кинга, достойные проверки утверждения, фейковые новости.

Для цитирования: И. А. Королев. Автоматизация фактчекинга в журналистике: ограничения и перспективы развития // Труды БГТУ. Сер. 4, Принт- и медиатехнологии. 2022. № 2 (261). С. 50-56.

Igor Korolev

Belarusian State University

AUTOMATION OF FACT-CHECKING IN JOURNALISM: LIMITATIONS AND PROSPECTS FOR DEVELOPMENT

Widespread technical and social mediatization has led to a significant increase of unverified information (including fake news) circulating in the media space. One of the ways to overcome the problem of deficit of resources for media editorial offices for high-quality and efficient processing of increased volume of unverified information is to automate the process of establishing the reliability of facts/factual claims (fact-checking). Based on the analysis of six popular automated fact-checking systems ("ClaimBuster", "ClaimPortal", "Squash", "AFCNR", "Full Fact" and "Context-Aware"), the article reveals the basic principles and algorithms of the functioning similar systems, as well as the limitations and prospects for the development of this field of journalism automation.

Keywords: fact-checking, fact-checking automation, fact-checking automation systems, check-worthy claims, fake news.

For citation: I. Korolev. Automation of fact-checking in journalism: limitations and prospects for development. Proceedings of BSTU, issue 4, Print- andMediatechnology, 2022, no. 2 (261), pp. 50-56 (In Russian).

Введение. Повсеместное развитие технологий, широкая социальная медиатизация и конвергенция редакций СМИ с платформами социальных медиа повлекли за собой значительное увеличение объемов и скорости циркуляции «информационного мусора», в том числе фейко-вых новостей. Реакция журналистского сообщества на столь масштабные изменения в функционировании медиапространства реализовалась в выработке практики фактчекинга - установления достоверности уже циркулирующих в медиапространстве фактов/фактических утверждений, - институционализация которой получила реализацию в появлении фактчекинговых

организаций и специализированных отделов в редакциях СМИ.

Сразу отметим, что в англоязычной традиции в качестве объекта фактчекинга зачастую выступают высказывания политических лиц разных уровней, поэтому вместо закрепившегося в русскоязычной академической среде понятия «факт» в англоязычных исследованиях приоритетным является употребление термина «фактическое утверждение» («factual claim»). В данном исследовании, во избежание терминологического дублирования, понятия «факт» и «фактическое утверждение» будут использоваться в качестве синонимов.

Как показало проведенное в 2018 году исследование, фейковые новости распространяются в шесть раз быстрее настоящих [1, с. 1148]. Фактче-кинг же является интеллектуально сложным, трудоемким и длительным процессом: «специалистам требуется около одного дня, чтобы исследовать и написать стандартную статью об одном фактическом утверждении» [2]. К тому же ресур-созатратной является не только проверка фактических утверждений, но и их отбор, который, несмотря на некоторую факультативность по отношению к основной задаче, также является важным этапом рабочего процесса фактчекера. Сложность данного этапа заключается в том, что в ходе отбора утверждений фактчекеру необходимо решить сразу несколько задач, среди которых определение принципиальной проверяемости фактического утверждения, оценка его общественной значимости, а также соизмерение его потенциального вреда с необходимыми для проверки усилиями.

В результате того, что редакции СМИ и факт-чекинговые организации вынуждены «сосредотачиваться на национальных событиях и выдающихся личностях» [3], «многие заслуживающие проверки утверждения остаются непроверенными» [4]. Согласно исследованию, проведенному в 2020 году британской фактчекинговой организацией «Full Fact», даже в крупных редакциях СМИ отделы, занимающиеся проверкой фактов, обычно не превышают десяти человек [5]. Отсюда следует, что сегодня у редакций СМИ и фактчекинговых организаций недостаточно ресурсов для эффективного противодействия «информационному мусору», ввиду чего актуализируется потребность в разработке и применении автоматизированных инструментов фактчекинга, способных помочь журналистам оперативно обрабатывать большие объемы фактической информации. Особенно остро такая необходимость проявляется в периоды электоральных кампаний, характеризующихся экспонентным ростом требующих проверки фактических утверждений.

Западные исследователи уже более десяти лет разрабатывают способы повышения скорости обработки информации путем внедрения в журналистский процесс современных технологий. Считается, что исследования в области автоматизации фактчекинга берут начало с опубликованной в 2011 году статьи «Вычислительная журналистика: призыв к "оружию" для исследователей баз данных» [3], в которой исследовательская команда во главе с Сарой Коэн задается вопросом: «смогут ли вычислительные технологии, сыгравшие немалую роль в упадке традиционных СМИ, стать спасителем традиций журналистики как "сторожевого пса"?» и отмечает, что «для вычислительной журналистики важно сохранить журналистские принципы и облегчить проверку фактов» [6, с. 148].

Данная статья содержит идею о том, что в будущем и журналисты, и простые пользователи Сети смогут проверять фактические утверждения путем запросов в базы данных. Забегая вперед, отметим, что этот принцип сегодня действительно лежит в основе существующих систем автоматизированного фактчекинга.

Одним из первых русскоязычных исследований об автоматизации журналистики стала статья А. Д. Иванова «Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ», опубликованная в 2015 году. В статье исследователь отмечает, что семантическое значение понятий «автоматизированная журналистика», «алгоритмическая журналистика» и «роботизированная журналистика» «сводится к указанию на использование особых автоматизированных инструментов ("роботов", "ботов" и в т. ч. "алгоритмов") для выполнения журналистских функций по сбору и обработке информации, а также для написания готовых текстов без участия человека» [7, с. 34]. Опираясь на мнение А. Д. Иванова, резонно предположить, что наиболее релевантным для определения процедур проверки информации при помощи автоматизированных систем является понятие «автоматизированный фактчекинг». К тому же данное понятие уже получило широкое распространение в англоязычной исследовательской среде.

Таким образом, целью исследования является установление принципов работы систем автоматизированного фактчекинга, а также выявление перспектив и ограничений развития данного направления автоматизации журналистики. Для решения поставленной цели будет проведен анализ функций некоторых из разработанных систем автоматизированного фактчекинга.

Основная часть. Системы автоматизированного фактчекинга, в отличие от технических инструментов, решающих отдельные задачи (в частности, фото и видеоредакторов, поисковых систем, онлайн-карт, баз данных), способны автоматизировать весь процесс проверки: от поиска достойных проверки фактических утверждений до вывода на экран заключения об их достоверности.

Сегодня автоматизация фактчекинга получила широкое распространение в западной журналистике, где фактчекинговые организации традиционно фокусируются на установлении достоверности фактических утверждений политиков разных уровней, поэтому существующие системы автоматизированного фактчекинга также в большинстве своем концентрируются на политической сфере.

Рассмотрим принципы и алгоритмы работы некоторых из существующих систем.

«ClaimBuster». Среди находящихся в свободном доступе систем можно выделить «QaimBшter» - разработку кафедры инженерии

и компьютерных наук Техасского университета в Арлингтоне, позиционирующую себя как «первую в мире систему сквозной проверки фактов» [8].

Принцип работы системы основан на пяти компонентах.

Компонент «Claim Monitor» («монитор утверждений») концентрируется на постоянном мониторинге и извлечении текстов из источников, за которыми следит система. В извлеченных «монитором утверждений» текстах «Claim Spotter» («контролер утверждений») определяет заслуживающие проверки (т. е. социально-значимые и проверяемые в принципе) фактические утверждения. В зависимости от степени фактичности каждому выбранному «контролером утверждений» заявлению «ClaimBuster» присваивает оценку от 0,0 до 1,0.

После извлечения из текста достойного проверки фактического утверждения компонент «Claim Matcher» («средство сопоставления утверждений») направляет содержащий данное фактическое утверждение запрос в базу данных, представляющую собой архив когда-либо проведенных фактчекинговыми организациями проверок фактов. Из этой базы данных «средство сопоставления утверждений» извлекает релевантные запросу утверждения (если таковые имеются). В случае если совпадений с уже когда-либо проверенными фактами не было найдено, следующий компонент системы - «Claim Checker» («средство проверки утверждений») - собирает подтверждающие или опровергающие доказательства для выбранного утверждения из базы «Wolfram Alpha» и поисковой системы «Google». Наконец, «Fact-check Reporter» («репортер проверки») комбинирует отчет из предоставленной предыдущими компонентами информации и представляет его пользователю.

Интерфейс системы «ClaimBuster» позволяет пользователям как просматривать уже проверенные системой тексты (например, стенограммы дебатов кандидатов в президенты США), так и самостоятельно «прогонять» через «контролер утверждений» интересующие их фрагменты текста и отдельные фактические утверждения. В первом случае система выделит в уже проверенных текстах заслуживающие проверки утверждения разными оттенками синего цвета, пропорционально оценкам их фактичности от «контролера утверждений». При этом некоторые из отмеченных как достойные проверки утверждений смогут быть проверены: при нажатии на них в левом столбце пользователю отобразятся результаты поиска в «Wolfram Alpha» и «Google», в правом столбце - результаты поиска в базе данных проверенных фактов. Во втором случае «ClaimBuster» оценит загруженный пользователем текст на предмет фактичности представленных в нем утверждений, а также организует проверку для запрашиваемого факта [9].

«ClaimPortal». Следом за «ClaimBuster» стоит рассмотреть разработанную этой же кафедрой систему «ClaimPortal», специализирующуюся на контенте социальной сети «Twitter» [3]. При помощи «контролера утверждений» от «ClaimBuster» система «ClaimPortal» присваивает каждому «твиту» оценку достоверности, показывающую, содержит ли «твит» достойное проверки фактическое утверждение.

Как и «ClaimBuster», «ClaimPortal» доступен для всех желающих. Интерфейс системы предполагает, что пользователь может сортировать посты по степени фактичности (от более фактичных к менее фактичным и наоборот), дате (в порядке прямой и обратной хронологии), а также выбирать посты за определенный промежуток времени [10].

Помимо выставления оценок фактичности утверждений, функционал «ClaimPortal» предлагает пользователю анализ и сравнение степени фактичности утверждений разных политических лиц США. Например, можно сравнить, чьи заявления в «Twitter» (республиканцы или демократы) в период избирательных кампаний в большей мере основывались на фактах. Также касательно некоторых «твитов» система предоставляет информацию о связанных с ними уже проверенных фактических утверждениях.

«Squash». Целью системы «Squash» является отображение результатов проверки фактов на видеоэкране во время дебатов или политических выступлений. Система позволяет пользователям следить за важными политическими выступлениями при помощи веб-сайта с прямой трансляцией. При этом подача трансляции задерживается примерно на 30 секунд [11], за которые происходит проверка запрашиваемых утверждений.

На первом этапе процесса проверки система «слушает» речь или дебаты, отправляя аудио в «Google Cloud», где оно преобразуются в текст. Стоит, однако, отметить, что «Squash» периодически не справляется с преобразованием аудиозаписей в корректный текст: сложности возникают из-за того, что качество звука на политических дебатах не всегда бывает идеальным, а участники периодически повышают голос и перебивают друг друга. В случае успешного преобразования аудио в текст «Squash» при помощи уже упоминавшегося компонента «контролер утверждений» от «ClaimBuster» определяет достойные проверки фактические утверждения, после чего система анализирует онлайн-базу данных на предмет совпадения выбранного утверждения с уже имеющимися проверками фактов, сделанными независимыми фактчекинговыми организациями. Далее инструмент редактирования «Gardener» помогает редакторам отсеивать нерелевантные совпадения.

Если все этапы работы системы завершились успешно, на экране появляется отчет о правдивости или ложности запрашиваемого утверждения [12].

«Automated Fact Checking in the News Room». Система автоматизированного фактче-кинга в отделе новостей (AFCNR) направлена на поиск доказательств правдивости или ложности заданного пользователем фактического утверждения. В 2019 году система была протестирована одиннадцатью журналистами BBC [13, с. 3580].

Принцип работы системы основан на трех компонентах. В первом компоненте AFCNR осуществляет поиск и отбор наиболее релевантных проверяемому фактическому утверждению документов, хранящихся в собранном системой архиве. В конце этого шага программа получает около 10 000 связанных с утверждением документов.

Во втором компоненте AFCNR в соответствии с определенной формулой ранжирует представленные в отобранных документах предложения по релевантности. Принцип ранжирования схож с алгоритмами работы поисковых систем: чем ближе расстояние между совпадающими словами в предложении, тем выше релевантность. Эта оценка максимальна, если все слова в предложении точно соответствуют запрашиваемому утверждению, и экспоненциально уменьшается с увеличением расстояния между словами. Далее система фильтрует ранжированные предложения по определенным параметрам для увеличения разнообразия доказательств, отображающихся пользователю на этапе вывода. После чего система производит повторное ранжирование предложений по специальной формуле. В среднем после этих шагов на одно проверяемое утверждение приходится около 76 связанных с ним предложений [13, с. 3581]. В заключении данного компонента система выбирает из ранжированных предложений только те, что превышают определенное пороговое значение релевантности. Данная процедура уменьшает количество потенциальных доказательств, имеющих лишь незначительное отношение к утверждению. После этого шага в среднем из 76 выбранных на предыдущем этапе предложений остается всего около 25.

В третьем компоненте AFCNR классифицирует каждое из извлеченных предложений с точки зрения того, поддерживает ли они запрашиваемое утверждение, опровергает его или просто связано с ним (оценка: «другое»). Предложения отображаются пользователю в трех столбцах: слева пять наиболее релевантных предложений, поддерживающих утверждение, посередине пять наиболее релевантных предложений, опровергающих утверждение, и справа пять иных предложений, относящихся к утверждению. Внизу экрана пользователь также может видеть общую оценку о том, поддерживают

ли, опровергают ли или просто связаны с запрашиваемым утверждением отобранные системой предложения.

На данный момент система находится в состоянии доработки, однако на видеохостинге «Vimeo.com» размещено видео с подробной инструкцией по использованию ее демоверсии [14].

Проблема отбора достойных проверки фактических утверждений. Для анализа доступных сегодня функций по автоматизации отбора достойных проверки фактических утверждений рассмотрим две специализирующихся на данном этапе процесса фактчекинга системы («Full Fact» и «Context-Aware»), а также компонент «контролер утверждений» рассмотренной выше системы «ClaimBuster». Представленные системы в первую очередь акцентируют свое внимание на политических дебатах.

Основой для разработки систем послужили модели машинного обучения, построенные на основе выборок утверждений, которым волонтеры или фактчекинговые организации выставили отметку по одной из классификаций: дивариантной (достойное/недостойное проверки) или тривари-антной (фактическое и важное утверждение, фактическое и неважное, важное и нефактическое).

Так, компонент «контролер утверждений» системы «ClaimBuster» обучен на собственном наборе данных, насчитывающим 8015 предложений из 30 президентских дебатов с 1960 по 2012 годы, аннотированных (т. е. получили одну из вышеуказанных отметок) студентами, профессорами университетов и журналистами [2]. Набор данных системы «Full Fact» состоит из 5571 предложения, 4777 из которых были анно-тированны волонтерами и 794 взяты из базы проверенных утверждений «Full Fact») [15]. Разработчики системы «Context-Aware» использовали 5415 предложения, полученных из четырех стенограмм президентских и вице-президентских дебатов в США 2016 года, размещенных на сайтах авторитетных фактчекинговых организаций и СМИ (включая «FactCheck», «PolitiFact», CNN, NYT, WP и NPR) [16].

Принцип работы систем построен на учете различных характеристик, которыми, по мнению разработчиков, должны обладать достойные проверки утверждения, и их ранжировании по значимости. Так, разработчики системы «Context-Aware» помимо базовых характеристик, учитывающих контекст, семантику и тематику утверждений, загрузили в модель дополнительные характеристики, которые с большей вероятностью будут свидетельствовать о наличии достойного проверки утверждения [16]. Среди таковых, в частности, негативный характер предложений; наличие в предложениях имен собственных; употребление глагольных форм

прошедшего времени; количество символов в предложении (более короткие предложения, как правило, с меньшей вероятностью содержат утверждение, заслуживающее проверки); позиция предложения (предложение на границах прямой речи говорящего может содержать реакцию на другое утверждение или может спровоцировать реакцию, которая, в свою очередь, может сигнализировать о том, что утверждение заслуживает проверки); а также наличие в утверждении обвинения в адрес оппонентов.

Ограничения систем автоматического фактчекинга. На данном этапе своего развития существующие системы имеют существенные ограничения.

Во-первых, принцип работы систем зачастую предполагает поиск совпадений в базах существующих проверок фактов от редакций и независимых фактчекинговых организаций, при этом сами базы еще не имеют достаточного для эффективной работы систем количества выполненных проверок. Наглядный пример этому - инцидент с системой «Squash», которая во время одной из пресс-конференций президента Джо Байдена смогла найти только два совпадения в базах проверенных фактов более чем за час. Проблему усугубляет и то, что в базах данных уже проверенных фактических утверждений в основном хранятся заявления национального и межнационального характера, что значительно снижает эффективность работы систем при проверке утверждений от представителей власти местных уровней.

Во-вторых, существующие системы автоматизированного фактчекинга в основном концентрируются на англоязычном сегменте Сети. Вместе с тем ложные заявления имеют свойство быстро переводиться с английского на множество национальных языков и широко распространяться за пределами англоязычного сегмента. Ввиду этого возрастает вероятность того, что даже после опровержения ложного заявления оно продолжит циркулировать за пределами англоязычного сегмента Сети.

В-третьих, достоверность фактов не всегда может быть установлена в модели «правда/ложь»: даже самые фактические утверждения могут быть верными лишь отчасти или вводить в заблуждение при отсутствии контекста. Ввиду этого установление достоверности фактических утверждений в бинарной системе «правда/ложь» может нести потенциальную опасность для читателей. Следовательно, чтобы помочь аудитории получить полное представление о фактическом утверждении, на этапе представления информации в системе по-прежнему должен находиться пользователь-редактор, способный дать заключению системы о правдивости/ложности утверждения необходимый бэкграунд.

В-четвертых, определенные сложности представляет временный характер многих фактических утверждений. Например, в случае распространения какой-либо инфекции утверждение об уровне заражения может быть неверным сегодня, но верным на следующей неделе, и поэтому повторное использование предыдущих проверок потребует особой осторожности [4]. Следовательно, базы данных утверждений должны постоянно актуализироваться, что в условиях недостатка ресурсов также вызывает существенные сложности.

Отдельно отметим ограничения, связанные с этапом отбора достойных проверки фактических утверждений. Во-первых, ввиду отсутствия достаточной базы из уже проверенных фактических утверждений системам автоматизированного факт-чекинга сложнее определять, какое утверждение достойно или недостойно проверки. Во-вторых, существующие системы выделяют все достойные проверки утверждения, в то время как фактчекеры акцентируют внимание только на тех фактических утверждениях, которые представляют общественный интерес. При этом принимая решения о том, какие фактические утверждения представляют общественный интерес, а какие нет, фактчекеры полагаются на свой опыт и осведомленность о повестке дня, что практически невозможно закодировать в модели машинного обучения.

Наконец, нерешенным остается вопрос относительно ограничений, связанных с предоставлением результатов работы систем автоматизированного фактчекинга в открытый доступ. Сегодня редакции СМИ и фактчекинговые организации придерживаются строгих редакционных стандартов и стараются публиковать исследования проверки фактических утверждений только после тщательной перепроверки всех данных. При внедрении же в процесс проверки автоматизированных систем почти неизбежны ошибки, а публикации некорректных проверок фактических утверждений могут серьезно подорвать репутацию института СМИ [4].

Резюмируя обзор систем автоматизированного фактчекинга, отметим, что алгоритм работы существующих систем в основном схож и состоит из четырех этапов: мониторинга источников (зачастую из области политики), отбора достойных проверки утверждений, поиска доказательств правдивости/ложности утверждений и вывода заключения относительно их достоверности. Данный алгоритм может быть сокращен до отбора достойных проверки утверждений (как в случае с «CalimPortal») или проверки заданных фактических утверждений (как в случае с AFCNR), а также дополнен переводом исходного аудио в текстовый формат (как в случае «Squash»), что особенно актуально для онлайн-фактчекинга важных политических выступлений и дебатов.

Отдельного исследовательского внимания заслуживает проблема отбора достойных проверки утверждений. Предназначенные для этого компоненты систем («Claim Spotter» системы «ClaimBuster») или самостоятельные системы («Full Fact», «Context-Aware»), построенные на основе моделей машинного обучения, концентрируются на оценивании социальной значимости и принципиальной проверяемости присутствующих в рассматриваемом тексте фактических утверждений. Принцип работы данных компонентов/систем построен с учетом различных характеристик, которыми с большей вероятностью должны обладать достойные проверки утверждения.

Наконец, существующие системы автоматизированного фактчекинга имеют существенные ограничения, связанные как с отбором, так и проверкой фактических утверждений. Среди таковых можно выделить недостаточный объем баз данных уже проведенных проверок фактов и необходимость их постоянной актуализации, охват исключительно англоязычного сегмента Сети, трудности в предоставлении аудитории контекста для корректной интерпретации проверенного факта.

Указанные ограничения не позволяют существующим системам эффективно функционировать без вмешательства редактора-человека.

Заключение. В данный момент автоматизация фактчекинга находится на начальном этапе, а существующие системы не работают настолько эффективно, чтобы их результаты могли быть предоставлены в открытый доступ. Ввиду этого использование журналистами систем автоматизированного фактчекинга представляется полезным лишь в качестве вспомогательного инструмента для выполнения отдельных процессов, например поиска скрытых в больших текстовых документах или аудиовизуальных записях доказательств правдивости/ложности какого-либо утверждения. Вместе с тем исходя из стремительного развития систем автоматизированного факт-чекинга можно предположить, что в будущем (при преодолении обозначенных ограничений) данные системы смогут значительно ускорить процессы проверки фактов, став одним из наиболее эффективных инструментов противодействия «информационному мусору», в том числе фейковым новостям.

Список литературы

1. Vosoughi S., Roy D., Aral S. The spread of true and false news online // Science. 2018. Vol. 359, No. 6380. P. 1146-1151. DOI: 10.1126/science.aap9559.

2. Hassan N., Adair B., Hamilton J., Li Ch., Tremayne M., Yang J., Yu C. The Quest to Automate Fact-Checking // Computation+Journalism Symposium. URL: http://cj2015.brown.columbia.edu/papers/automate-fact-checking.pdf (дата обращения: 28.02.2022).

3. Majithia S., Arslan F., Lubal S., Jimenez D., Arora P., Caraballo J., Li Ch. ClaimPortal: Integrated Monitoring, Searching, Checking, and Analytics of Factual Claims on Twitter // ACL. URL: https://aclanthology.org/P19-3026.pdf (дата обращения: 28.02.2022).

4. Nakov P., Corney D., Hasanain M., Alam F., Elsayed T., Barron-Cedeno A., Papotti P., Shaar Sh., Da San Martino G. Automated Fact-Checking for Assisting Human Fact-Checkers // Cornell University arXiv e-print repository. URL: https://arxiv.org/pdf/2103.07769.pdf (дата обращения: 28.02.2022).

5. The Challenges of Online Fact Checking // Full Fact. URL: https://fullfact.org/media/uploads/coof-2020.pdf (дата обращения: 28.02.2022).

6. Cohen S., Li Ch., Yang J., Yu C. Computational journalism: A Call to Arms to Database Researchers // 5th Biennial Conference on Innovative Data Systems Research, 2011, Asilomar, CA, USA, January 9-12, 2011. Online Proceedings, 2011. P. 148-151. URL: https://www.researchgate.net/publication/220988205_ Computational_Journalism_A_Call_to_Arms_to_Database_Researchers (дата обращения: 28.02.2022).

7. Иванов А. Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак: проблемное поле медиаобразования. 2015. № 2 (16). С. 32-40.

8. Hassan N., Zhang G., Arslan F., Caraballo J., Jimenez D., Gawsane S., Hasan Sh., Joseph M., Kulkarni A., Kumar Nayak A., Sable A., Li Ch., Tremayne M. ClaimBuster: the First-ever End-to-end Fact-Checking System // Very Large Data Base Endowment Inc. URL: https://vldb.org/pvldb/vol10/p1945-li.pdf (дата обращения: 28.02.2022).

9. ClaimBuster. Automated Live Fact-Checking // Innovative Data Intelligence Research Laboratory. URL: https://idir.uta.edu/claimbuster (дата обращения: 28.02.2022).

10. ClaimPortal // Innovative Data Intelligence Research Laboratory. URL: https://idir.uta.edu/claimportal (дата обращения: 28.02.2022).

11. Rauch J. Fact-Checking the President in Real Time // The Atlantic. URL: https://www.theatlantic.com/ magazine/archive/2019/06/fact-checking-donald-trump-ai/588028 (дата обращения: 28.02.2022).

12. Adair B. The lessons of Squash, Duke's automated fact-checking platform // Poynter Institute. URL: https://www.poynter.org/fact-checking/2021/the-lessons-of-squash-the-first-automated-fact-checking-platform/ (дата обращения: 28.02.2022).

13. Miranda S., Nogueira D., Mendes A., Vlachos A., Secker A., Garrett R., Mitchel J., Marino Z. Automated Fact Checking in the News Room // The World Wide Web Conference, San Francisco, CA, USA, May 13-17, 2019. New York: Association for Computing Machinery, 2019. P. 3579-3583. DOI: 10.1145/3308558.3314135.

14. Fact Checking Demo on Journalistic Corpus // Professional Video Platform Vimeo. URL: https://vimeo.com/309336679 (дата обращения: 28.02.2022).

15. Hassan N., Li Ch., Arslan F., Tremayne M. Toward Automated Fact-Checking: Detecting Check-Worthy Factual Claims by ClaimBuster // KDD '17: Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Halifax, NS, Canada, August 13-17, 2017. New York: Association for Computing Machinery, 2017. P. 1803-1812 DOI: 10.1145/3097983.3098131.

16. Gencheva P., Nakov P., Marquez L., Barron-Cedeno A, Koychev I. A Context-Aware Approach for Detecting Worth-Checking Claims in Political Debates // Proceedings of the International Conference Recent Advances in Natural Language Processing, RANLP 2017, Varna, Bulgaria, September 4-6, 2017. Varna: INCOMA Ltd, 2017. P. 267-276. DOI: 10.26615/978-954-452-049-6_037.

References

1. Vosoughi S., Roy D., Aral S. The spread of true and false news online. Science, 2018, vol. 359, no. 6380, pp. 1146-1151. DOI: 10.1126/science.aap9559.

2. Hassan N., Adair B., Hamilton J., Li Ch., Tremayne M., Yang J., Yu C. The Quest to Automate Fact-Checking. Available at: http://cj2015.brown.columbia.edu/papers/automate-fact-checking.pdf (accessed 28.02.2022).

3. Majithia S., Arslan F., Lubal S., Jimenez D., Arora P., Caraballo J., Li Ch. ClaimPortal: Integrated Monitoring, Searching, Checking, and Analytics of Factual Claims on Twitter. Available at: https://aclanthology.org/P19-3026.pdf (accessed 28.02.2022).

4. Nakov P., Corney D., Hasanain M., Alam F., Elsayed T., Barron-Cedeno A., Papotti P., Shaar Sh., Da San Martino G. Automated Fact-Checking for Assisting Human Fact-Checkers. Available at: https://arxiv.org/pdf/2103.07769.pdf (accessed 28.02.2022).

5. The Challenges of Online Fact Checking. Available at: https://fullfact.org/media/uploads/coof-2020.pdf (accessed 16.02.2022).

6. Cohen S., Li Ch., Yang J., Yu C. Computational journalism: A Call to Arms to Database Researchers. Online Proceedings, 2011, pp. 148-151. Available at: https://www.researchgate.net/publication/220988205_ Computational_Journalism_A_Call_to_Arms_to_Database_Researchers (accessed 28.02.2022).

7. Ivanov A. D. The Robotic Journalism and the first algorithms on service of editions of the international mass media. Znak: problemnoe pole mediaobrazovaniya [Sign: the problem field of media education], 2015, no. 2 (16), pp. 32-40 (In Russian).

8. Hassan N., Zhang G., Arslan F., Caraballo J., Jimenez D., Gawsane S., Hasan Sh., Joseph M., Kulkarni A., Kumar Nayak A., Sable A., Li Ch., Tremayne M. ClaimBuster: the First-ever End-to-end Fact-Checking System. Available at: https://vldb.org/pvldb/vol10/p1945-li.pdf (accessed 28.02.2022).

9. ClaimBuster. Automated Live Fact-Checking. Available at: https://idir.uta.edu/claimbuster (accessed 28.02.2022).

10. ClaimPortal. Available at: https://idir.uta.edu/claimportal (accessed 28.02.2022).

11. Rauch J. Fact-Checking the President in Real Time. Available at: https://www.theatlantic.com/maga-zine/rchive/2019/06/fact-checking-donald-trump-ai/588028 (accessed 28.02.2022).

12. Adair B. The lessons of Squash, Duke's automated fact-checking platform. Available at: https://www.poynter. org/fact-checking/2021/the-lessons-of-squash-the-first-automated-fact-checking-platform/ (accessed 28.02.2022).

13. Miranda S., Nogueira D., Mendes A., Vlachos A., Secker A., Garrett R., Mitchel J., Marino Z. Automated Fact Checking in the News Room. The World Wide Web Conference. New York, 2019, pp. 35793583. DOI: 10.1145/3308558.3314135.

14. Fact Checking Demo on Journalistic Corpus. Available at: https://vimeo.com/309336679 (accessed 28.02.2022).

15. Hassan N., Li Ch., Arslan F., Tremayne M. Toward Automated Fact-Checking: Detecting Check-Worthy Factual Claims by ClaimBuster. New York, 2017, pp. 1803-1812. DOI: 10.1145/3097983.3098131.

16. Gencheva P., Nakov P., Marquez L., Barron-Cedeno A., Koychev I. A Context-Aware Approach for Detecting Worth-Checking Claims in Political Debates. Varna, 2017, pp. 267-276. DOI: 10.26615/978-954-452-049-6_037.

Информация об авторе

Королев Игорь Александрович - старший преподаватель, аспирант кафедры медиалогии. Белорусский государственный университет (220030, г. Минск, пр. Независимости, 4, Республика Беларусь). Email: iakorolev1996@gmail.com

Information about the author

Igor Korolev - Senior Lecturer, PhD student, the Department of Medialogy. Belarusian State University (4, Nezavisimosti Ave., 220030, Minsk, Republic of Belarus). Email: iakorolev1996@gmail.com

Поступила 11.03.2022

i Надоели баннеры? Вы всегда можете отключить рекламу.