Научная статья на тему 'Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта'

Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
5624
1002
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФЕЙК-НЬЮЗ / СОЦИАЛЬНЫЕ СЕТИ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Третьяков Арсений Олегович, Филатова Ольга Георгиевна, Жук Денис Владимирович, Горлушкина Наталия Николаевна, Пучковская Антонина Алексеевна

В статье представлен разрабатываемый авторами метод определения фейковых новостей в социальных сетях. Обзор публикаций, посвященных тематике фейковых (фальшивых) новостей показывает, что, хотя до сих пор нет единого определения данного понятия, интерес к фейкам огромен. Этому способствует стремительный рост популярности социальных сетей и возможностей искусственного интеллекта. Кроме того, информация распространяется по социальным сетям довольно быстро, за счет того, что пользователи регулярно делятся информацией, в том числе и непроверенной. Появляется настоятельная необходимость разработки автоматизированных вычислительных систем для идентификации фейковых новостей в социальных сетях, чтобы научить людей, компании и организации противостоять растущей цифровой дезинформации. В статье приводится краткий обзор существующих проектов по выявлению фейковых новостей. Утверждается, что таких проектов пока не выявлено в российском сегмента интернета и на русском языке. Представлено проведенное авторами исследование, цель которого разработка концепции метода автоматизированного определения фейковых новостей для русскоязычных текстов с элементами искусственного интеллекта и машинного обучения. Сделан вывод о большом потенциале, который можно извлечь из применения искусственного интеллекта в связке с инструментарием по обработке веб-данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Method of Identify the Russian-Language Fake News Using Artificial Intelligence

The article presents a method developed by the authors for identify fake news in social networks. A review of publications on the topic of fake news shows that although there is still no single definition of this concept, the interest in fakes is enormous. This is facilitated by the rapid growth of the popularity of social networks and the possibilities of artificial intelligence. In addition, information is distributed on social networks rather quickly, due to the fact that users regularly share information, including unverified. There is an urgent need to develop automated computing systems to identify fake news on social networks. The article provides a brief overview of existing projects to identify fake news. It is argued that such projects have not yet been identified in the Russian segment of the Internet and in Russian language. The paper presents a study conducted by the authors, the purpose of which is to develop the concept of a method of automated determination of fake news for Russian-language texts using artificial intelligence and machine learning. The conclusion is made about the great potential that can be extracted from the application of artificial intelligence in conjunction with the tools for processing web data.

Текст научной работы на тему «Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта»

Метод определения русскоязычных фейковых новостей с использованием элементов искусственного интеллекта

А.О. Третьяков, О.Г. Филатова, Д.В. Жук, Н.Н. Горлушкина, А.А. Пучковская

Аннотация — В статье представлен разрабатываемый авторами метод определения фейковых новостей в социальных сетях. Обзор публикаций, посвященных тематике фейковых (фальшивых) новостей показывает, что, хотя до сих пор нет единого определения данного понятия, интерес к фейкам огромен. Этому способствует стремительный рост популярности социальных сетей и возможностей искусственного интеллекта. Кроме того, информация распространяется по социальным сетям довольно быстро, за счет того, что пользователи регулярно делятся информацией, в том числе и непроверенной. Появляется настоятельная необходимость разработки автоматизированных вычислительных систем для идентификации фейковых новостей в социальных сетях, чтобы научить людей, компании и организации противостоять растущей цифровой дезинформации.

В статье приводится краткий обзор существующих проектов по выявлению фейковых новостей. Утверждается, что таких проектов пока не выявлено в российском сегмента интернета и на русском языке. Представлено проведенное авторами исследование, цель которого - разработка концепции метода автоматизированного определения фейковых новостей для русскоязычных текстов с элементами искусственного интеллекта и машинного обучения. Сделан вывод о большом потенциале, который можно извлечь из применения искусственного интеллекта в связке с инструментарием по обработке веб-данных.

Ключевые слова: фейк-ньюз, социальные сети, искусственный интеллект, машинное обучение, нейронные сети

I. Введение

Фейковые новости (фейк-ньюз) имеют долгую историю, однако их масштаб и эффективность поднялись на

Статья получена 22.10.2018

Третьяков Арсений Олегович. Университет ИТМО, аспирант (e-mail: atretiakov@corp .ifmo.ru).

Филатова Ольга Георгиевна. Санкт-Петербургский государственный университет, Высшая школа журналистики и массовых коммуникаций, канд. философ. наук, доцент (e-mail: o.filatova@spbu.ru).

Жук Денис Владимирович, Университет ИТМО, аспирант (e-mail: jukdenis@gmail.com).

Горлушкина Наталия Николаевна. Университет ИТМО, Факультет инфокоммуникационных технологий, канд. техн. наук, доцент (e-mail: nagor@corp .ifmo.ru).

Пучковская Антонина Алексеевна. Университет ИТМО, руководитель МНЛ цифровых гуманитарных исследований, старший преподаватель Центра изучения иностранных языков, канд. культурологии, (e-mail: aapuchkovskaya@corp .ifmo.ru)

беспрецедентные уровни именно сегодня благодаря развитию социальных сетей. Автоматизация и искусственный интеллект резко снизили стоимость распространения фейковых (фальшивых) новостей в глобальном масштабе. Согласно данным исследований, большинство пользователей интернета сталкиваются с фальшивыми новостями, по крайней мере, раз в неделю. Так, судя по результатам масштабного европейского исследования - Евробарометра «Фейк-ньюз и дезинформация он-лайн», опубликованным в апреле 2018 года, более трети респондентов (37%) сталкиваются с поддельными новостями каждый день [1]. 85 % респондентов из разных стран считают фейковые новости проблемой для их страны и 83 процента рассматривают их как проблему для демократии в целом [1]. Поэтому именно сегодня как никогда важно научиться распознавать ложь, чтобы уметь в дальнейшем противостоять ей.

В данной статье мы попытаемся представить разрабатываемый авторский метод определения фейковых новостей. Метод основан на использовании искусственного интеллекта и машинного обучения. Традиционный способ проверки онлайн-контента, т. е. посредством «ручной» проверки фактов на основе знаний, становится затрудненным или практически невозможным из-за огромного объема информации, которая создается в режиме онлайн и быстро распространяется. Это особенно проявляется в случае с социальными сетями, где пользователи могут свободно обмениваться контентом, который способен стать «вирусным» всего за несколько часов. Таким образом, возникает необходимость разработки автоматизированных вычислительных систем для идентификации фейковых новостей в социальных сетях.

Понятие «фейк-ньюз» включает в себя ряд разных явлений. Поэтому в самом первом разделе статьи даны определения основного понятия. Далее рассмотрены основные существующие зарубежные проекты по выявлению фейк-ньюз, а в третьем разделе представлена авторская методика определения русскоязычных фейковых новостей.

II. Фейк-ньюз и смежные понятия:

ТЕОРЕТИЧЕСКИЕ ПОДХОДЫ

По мнению европейских исследователей, пропаганда, дезинформация и фейковые новости являются

взаимосвязанными терминами и иногда используются взаимозаменяемо [2]. Хотя все три термина, как они понимаются в настоящее время, подразумевают степень целенаправленного, систематического манипулирования информацией, более широкое понятие «пропаганда» относится к XVII веку, тогда как «дезинформация» была придумана во время «холодной войны». Фейковые новости, будучи такими же древними, как и сама пропаганда, в настоящее время приобретают новый смысл и значение. Например, как пишут Garth S. Jowett и Victoria O'Donnell в своей знаменитой книге «Пропаганда и убеждение» [3], Чингисхан (1162-1227) и его воины насаждали слухи об их жестокости и количестве всадников еще задолго до того, как печатный станок сделал массовое производство информации возможным. А Twitter, отмечают исследователи, основанный только в 2006 году, по существу сочетает устную традицию с новыми электронными средствами распространения слухов [3]. Появление фальшивых новостей в СМИ впервые было зафиксировано в 16 веке [4]. Однако сам термин «фейковые новости» получил широкое распространение только недавно и прежде всего благодаря росту социальных сетей в качестве канала распространения новостей. Поиск в базе Scopus по ключевому слову «fake news» показывает резкий рост популярности этого термина за последние четыре года: в 2015 году - всего 11 статей, в 2016 - 19, в 2017 - 237, в 2018 - уже 362. Особую популярность термин «fake news» приобрел во время предвыборной кампании Президента США Дональда Трампа, когда вирусные фейковые новости привлекали больше внимания на Facebook, чем настоящие новости.

В настоящее время существует множество разных подходов к определению поддельных новостей. Рассмотрим некоторые их них.

По мнению российских исследователей А.П. Суходолова и А.М. Бычковой фейками в современной медиасреде могут называться поддельные тексты, фото-, видео- или аудиозаписи; блоги и страницы, которые выдаются от имени реально существующих или вымышленных личностей; поддельные страницы популярных сайтов; искусственно созданная популярная личность, произведение или проект; ложная или частично искаженная информация [5, с.155].

Австралийский словарь Macquarie (The Australian Macquarie Dictionary) определяет фейк-ньюз как «дезинформацию и мистификации, опубликованные на веб-сайтах в политических целях или для управления веб-трафиком» [6]. Таким образом, если фейковые новости предназначены для обмана пользователей в политических целях, то они подпадают под определение «дезинформации», а «фальшивые новости», распространяемые в социальных медиа, можно определить как «цифровую дезинформацию».

Британский Кембриджский словарь (Cambridge Dictionary) указывает на поддельные новости как «ложные истории, которые кажутся новостями, распространяются в интернете или используются другими средствами массовой

информации, обычно создаются для влияния на политические взгляды или как шутка» [7].

Американский словарь Collins (Collins English Dictionary) характеризует фейк-ньюз как «ложную, часто сенсационную информацию, распространяемую под видом новостных репортажей» [8]. Включение слова «ложь» в это определение предполагает, что истинные и ложные новости следует различать посредством проверки основных фактов.

Allcott Hunt и Matthew Gentzkow определяют фейк-ньюз как преднамеренно и верифицируемо ошибочные или ложные новости с целью получения денег и / или продвижения идеологий [9]. Такое определение представляется оптимальным для целей нашего дальнейшего исследования. Исследования Alcott & Gentzkow [9] показывают, что верифицируемые ложные новости чаще распространяются через каналы социальных сетей, чем через традиционные отредактированные новостные сайты.

В специальном докладе о дезинформации и фейковых новостях, подготовленном Европейской комиссией (the European Commission's Joint Research Centre) в 2018 году, выделены два подхода к пониманию фейк-ньюз: узкий и широкий [10, р.10-11]. Узкое определение ограничивается верифициуемо ложной информацией. Большинство эмпирических исследований поддельных новостей в социальных науках следует именно этому узкому определению, оно требует идентифицируемого и утвержденного набора ложных новостных статей и источников для измерения охвата и воздействия фейк-ньюз. Широкое определение поддельных новостей будет включать намеренные попытки дезинформации и искажения новостей. Выявление таких новостей - более трудная задача для исследователей.

Продуктивной в дальнейшем нам представляется также идея Рейтерс [11] классифицировать фейковые новости, используя такие характеристики, как источник новостей, содержание (фактически неправильные или искаженные взгляды), метод распространения (например, целевая реклама, боты и т.д.) и намерение (влиять на выборы, накапливать недовольство или зарабатывать деньги).

III. ПРИКЛАДНЫЕ ПРОЕКТЫ ПО ВЫЯВЛЕНИЮ ФЕЙКОВЫХ НОВОСТЕЙ

Растущее использование фейк-ньюз вызывает беспокойство со стороны международного сообщества. Так, в сообщении «Борьба с дезинформацией в Интернете: европейский подход», опубликованном 26 апреля 2018 года, Европейская комиссия выдвинула план действий и инструменты саморегулирования для решения проблемы распространения и воздействия онлайн-дезинформации в Европе и обеспечения защиты европейских ценностей и демократических систем [12]. На достижение целей, изложенных в данном сообщении Еврокомиссии, направлен Кодекс практики ЕС по дезинформации, представленный 26 сентября 2018 года [13]. Впервые в мировой практике представители онлайн-платформ, ведущих социальных сетей,

рекламодателей и рекламной индустрии согласились с нормами саморегулирования для решения проблемы распространения онлайн-дезинформации и фальшивых новостей, поддержки независимой сети факт-чекинговых инструментов и инструментов для стимулирования качественной журналистики.

Развивая мысль об идентификации фек-ньюз, а также ботов и троллей в социальных медиа, перечислим ряд современных технологических инструментов и проектов, позволяющих выявлять цифровую дезинформацию. Так, неправительственная американская организация «Альянс за обеспечение безопасности демократии» (The Alliance for Securing Democracy) разработала инструментальную панель «Hamilton 68» (http://dashboard.securingdemocracy.org), направленную на то, чтобы информировать общественность почти в реальном времени о том, какие темы и контент продвигаются в США иностранными державами через Твиттер. Другой программный продукт, под названием Ботометр, разработанный в Университете Индианы (https://botometer.iuni.iu.edu), проверяет активность учетной записи Twitter и дает ей оценку, основанную на том, насколько вероятна учетная запись для бота. Debot (https://www.cs.unm.edu/~chavoshi/debot/) - система обнаружения ботов в режиме реального времени, разработанная в университет Нью Мехико. В марте 2017 года DeBot выявил более 730 тысяч уникальных ботов и занес их в специальный депозитарий.

К числу компаний, которые борются с фальшимвыми новостями, ботами и троллями, присоединились Facebook, Youtube, Google. В частности, Facebook запустил кампанию, в которой используются как сообщения Facebook, так и рекламные объявления в газетах, чтобы предоставить потребителям советы о том, как идентифицировать фейк-ньюз [14]. В июле 2018 года о мерах по пресечению распространения видеороликов с фальшивыми новостями заявил Youtube [15].

Отдельно стоит упомянуть проект Perspective, который разработали инженеры и исследователи Jigsaw, дочерней компании Google. Проект нацелен на улучшение области комментирования веб-сайтов с помощью возможностей машинного обучения. Издание New York Times, являющееся партнером Perspective, открыло промодерированные архивы комментариев за 10 лет, чтобы помочь команде Jigsaw сформировать модели для машинного обучения, которые нацелены на улучшение обсуждения в сети. Формируя новый инструмент для улучшения онлайн-обсуждений, Google раскрывает все эксперименты, модели и данные исследований, полученные в процессе машинного обучения [16].

В целом, проведенные нами исследования показывают, что европейские страны и США в настоящее время серьезно занимаются проблемами идентификации фальшивых новостей, а также ботов, троллей в социальных сетях, разрабатывают специальные проекты и проводят прикладные исследования для идентификации фальшивой информации и противодействия дезинформации в

социальных сетях [17]. К сожалению, нам пока не удалось выявить подобного рода масштабные проекты в России, в отечественных источниках пока мало обсуждений технологических решений для определения поддельных новостей в социальных сетях

Ниже представлено проведенное авторами исследование, цель которого - разработка концепции метода автоматизированного определения фейковых новостей для русскоязычных текстов с точностью определения не ниже 90%. Наша задача - описание метода с элементами искусственного интеллекта и машинного обучения для обнаружения фейковых новостей в социальных сетях. Потенциал, который можно извлечь из применения искусственного интеллекта в связке с инструментарием по обработке веб-данных, огромен.

IV. Авторский метод определения русскоязычных

ФЕЙКОВЫХ НОВОСТЕЙ В СОЦИАЛЬНЫХ СЕТЯХ

Методы обнаружения поддельных новостей на базе входных источников данных делятся на две категории: модули новостного контента и модули контента социальных сетей социального контекста [18, р.24]. Методы, относящиеся к первой категории, сосредоточены на содержании новостей, т.е. текст, заголовок и дополнительные метаданные (когда они доступны); в исследовании мы указываем эти методы как способ анализа содержания новостей. Методы, входящие во вторую категорию, фокусируются на особенностях социальных сетей, таких как взаимодействие пользователей и их отношение к новостям (например, функции «нравится» и «поделиться» в «ВКонтакте» или Facebook).

Для обнаружения поддельной новости необходимо в первую очередь определить общие характеристики поддельных сообщений. Среди них мы можем выделить репутацию интернет-ресурса и качество лексики языка. Репутация интернет-ресурса [19] - это один из ключевых показателей, который может быть использован для оценки подлинности опубликованного на нем новостного материала. Самый простой способ оценки ресурса на наличие поддельной новости - это рейтинг доверия от других ресурсов и доменный возраст искомого сайта. «Сайты с длительной историей и высоким рейтингом чаще всего являются надежными источниками, в то время как обратное может указывать на ненадежный ресурс» [20, с. 129].

В своем исследовании Г. Некрасов и И. Романова [20, с. 129] предлагают следующие характеристики в качестве модулей алгоритма:

- проверка оригинальности URL-адреса опубликованной новости на соответствие домену искомого сайта, поскольку сайты-двойники могут целиком имитировать крупные онлайн-издания;

- проверка даты публикации материала, поскольку фейковые новости, как правило, не датированы, так как сообщают о событиях, которых не было;

- наличие грамматических и пунктуационных ошибок в тексте;

- проверка на наличие внутренней согласованности анализируемой статьи - поддельные новости часто имеют большую несогласованность между различными частями текста самого материала;

- поиск совпадений фрагментов разных статей -основная статья, вышедшая на авторитетном ресурсе, копируется полностью или переписывается с внесением в нее ложных фактов и событий;

- несвязанные факты в новости;

- анализ ссылок-источников в материале, поскольку есть вероятность того, что статья будет поддельной, если она ссылается также на фейковую новость;

- поиск сигнальных (сенсационных) слов - новости, которые содержат в своих заголовках и ключевых словах привлекающие внимание (сенсационные) утверждения часто могут быть фейковыми;

- неавторитетные эксперты в обсуждаемой сфере;

- несовпадение времени создания изображений и их загрузки с реальными временными рамками событий в новости.

Известно, что «статистическая обработка множества поддельных статей позволяет выделить наборы ключевых слов, которые с определенной долей вероятности сигнализируют о возможности, что статья является поддельной» [20, с. 129]. Наш метод направлен на решение задач автоматизации исполнения процессов в программном обеспечении и технических комплексах путем распознавания и анализа задач, представленных в виде системы фактов в текстовом формате и их последующего превращения в готовый код в соответствии с входными данными на рис. 1.

Техническая составляющая системы реализуется за счет распознавания и анализа задачи, представляемой в виде системы фактов в текстовом формате [21, с.31]. Модуль этой системы обеспечивает следующие функции:

- ввод и признание системы ввода фактов;

- анализ взаимоотношений данных в графе;

- определение достаточности или недостаточности данных;

- формирование запроса дополнительных данных в случае их недостаточности;

- формирование алгоритма для решения задачи;

- составление плана выполнения задачи;

- обеспечение интерактивного выполнения плана;

- представление готового результата в форме, определяемой менеджером задач.

Ключевой особенностью является система последовательного ввода фактов, что позволяет использовать неограниченное количество условий и правил для описания конечной системы в отличии от классических нейронных сетей. Вторая особенность заключается в том, что нейронная сеть (комплекс нейронных сетей), используемая в решении, структурно изменяется в процессе работы и развивается в процессе обучения системы. Так как обучение было сделано с использованием готового модуля для анализа и препроцессинга фактов системы с элементами искусственного интеллекта, наиболее важными этапами были сбор данных для подготовки и последующей проверки достоверности проведенного обучения системы.

Для того, чтобы определить категории поддельных новостей, нам нужно большое количество примеров из разных категорий текстов, чтобы модель могла их выявлять. В результате предварительного анализа и классификации поддельных новостей была собрана и использована соответствующая база данных по множеству категорий новостей (неправильное толкование фактов, псевдонаучные факты, мнение автора, юмор и пр.).

Для распределения новостей по категориям были испытаны два подхода: автоматический сбор данных из списка источников с заранее определенной категорией новостей, а также ручной сбор и последующая сортировка по категориям. Распределение по множеству категорий поддельных новостей приводит к низкой степени достоверности, поэтому для эксперимента материалы необходимо использовать только в двух категориях: истина и ложь.

F1: Content...

F2: Title.

Рис. 1. Модуль анализа и проверки фактов

К поддельным новостям мы относим все новости, которые не содержат строго фактической информации, не подходят стандартам журналистской этики, а также те, что соответствуют нашим характеристикам фейковых новостей, которые мы выделили ранее.

Высокая точность данного подхода обусловлена возможностью обеспечить большой массив достоверной информации для обучения системы характеристикам текста, присущим надежной новостной информации. Отметим, что предложенный метод не решает проблему распространения поддельных новостей, но помогает с высоким уровнем достоверности определить ложную новость, что в комплексе с другими доступными методами, как краудсорсинг, классификации источников и авторов, проверка фактов и иные виды анализа текстов может дать максимальный уровень определения новости в классификации правда/неправда.

Дальнейшую работу мы видим в сборе русскоязычного датасета и обучении нейронной сети под текстовые сообщения на русском языке по критериям поддельных новостей, свойственных рунету. Данная методика будет положена и в основу исследования не только новостного массива, но и для анализа онлайн-дискуссий.

V. Заключение

Подводя итоги, сформулируем ряд выводов:

1) Несмотря на отсутствие в настоящий момент однозначного определения понятия «фейк-ньюз», «фальшивые новости» набирают обороты и требуют дальнейшего изучения.

2) Медиа-организации и технологические компании пытаются определить, как лучше всего реагировать на фейковые новости. Возможно, помогут более явная проверка фактов, улучшение медиаграмотности населения, дополнительные инвестиции государства в

образование, медиа, расследовательский журнализм и различные социальные институты, с целью обучить граждан правильно анализировать прессу, чтобы противостоять дезинформации.

3) Исследователи соглашаются с необходимостью разработки автоматизированных вычислительных систем для идентификации поддельной информации в социальных сетях. Наше исследование демонстрирует одно из возможных решений проблемы за счет методов определения этого типа новостей в социальных сетях, основанных на использовании систем с элементами искусственного интеллекта и машинного обучения. Применение искусственного интеллекта в связке с инструментарием по обработке веб-данных имеет большой потенциал.

4) Мы должны быть крайне осторожны в своих выводах, потому что они очень чувствительны к выборке ложных и реальных источников новостей. Сбор и анализ эмпирических данных о фейковых новостях по сути только начинается. Наше понимание этого нового явления по-прежнему весьма ограничено, но, несомненно, будет улучшаться в будущем.

Работа выполнена при поддержке Российского научного фонда (РНФ) в рамках проекта №18-18-00360 «Электронное участие как фактор динамики политического процесса и процесса принятия государственных решений».

Библиография

[1] Fake news and disinformation online. Report. European Union, 2018.

URL: https://ec.europa.eu/digital-single-market/en/news/final-results-eurobarometer-fake-news-and-online-disinformation

[2] Bentzen N. Understanding disinformation and fake news. European

Parliamentary Research Service. 2017. URL: http://www.europarl.europa.eu/RegData/etudes/ATAG/2017/599408/ EPRS_ATA(2017)599408_EN.pdf

[3] Jowett G., O'Donnell V. Propaganda and Persuasion. SAGE

Publications, 2015. 480 p.

[4] Standage T. The true history of fake news // The Economist 1843

Magazine. june/july 2017. URL:

https://www. 1843magazine.com/technology/rewind/the-true-history-of-fake-news

[5] Суходолов А.П., Бычкова А.М. «Фейковые новости» как феномен

современного медиапространства: понятия, виды, назначения, меры противодействия // Вопросы теории и практики журналистики. 2017. Т. 6, № 2. C.155-156.

[6] Fake news // Macquariedictionary.com. URL:

https://www.macquariedictionary.com.au/news/view/article/431/

[7] Fake news // Cambridge Dictionary. URL:

https://dictionary.cambridge.org/dictionary/english/fake-news

[8] Fake news // Collins English Dictionary. URL:

https://www.collinsdictionary.com/dictionary/english/fake-news

[9] Allcott H., Gentzkow M. Social media and fake news in the 2016

election // Journal of Economic Perspectives. 2017. Vol. 31(2). P. 211-236.

[10]Martens B., Aguiar L., Gomez-Herrera E., Mueller-Langer F. The digital transformation of news media and the rise of disinformation and fake news. Digital Economy Working Paper 2018-02; JRC Technical Reports. Seville, Spain: European Commission, 2018. URL: https://ec.europa.eu/jrc/sites/jrcsh/files/jrc111529.pdf

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[11]Reuters Institute. Digital News Report, published by the Reuters Institute and Oxford University Press, 2017.

[12]Tackling online disinformation: a European Approach - https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:52018DC0236

[13]Code of Practice on Disinformation. URL: https://ec.europa.eu/digital-single-market/en/news/code-practice-disinformation

[14]Al-Heeti A. Facebook Will Fight Fake News with Real Newspaper Ads (and More) // CNET. May 23, 2018.

[15]Building a better news experience on YouTube, together. URL: https://youtube.googleblog.com/2018/07/building-better-news-experience-on .html

[16]Greenberg A. Inside Google's Internet Justice League And Its Ai-Powered War On Trolls // Wired. 19.09.2016. URL: https://www.wired.com/2016/09/inside-googles-internet-justice-league-ai-powered-war-trolls/

[17] Filatova O., Bolgov R. Strategic Communication in the Context of Modern Information Confrontation: EU and NATO vs Russia and ISIS // Proceedings of the 13th International Conference on Cyber Warfare and Security ICCWS 2018. Edited by Dr John S. Hurley and Dr Jim Q. Chen. Washington DC, USA, 2018. P. 208-219.

[18]Shu K., Sliva A., Wang S., Tang J., Liu H. Fake News Detection on Social Media: A Data Mining Perspective // Arxiv.org. URL: https://arxiv.org/pdf/1708.01967.pdf

[19]Koshy J. How Content Discovery Platforms Can Fight Fake News via Web Scraping and AI // PromtCloud. URL: https://www.promptcloud.com/blog/fight-fake-news-web-scraping-artificial-intelligence

[20] Некрасов Г.А., Романова И.И. Разработка поискового робота для

обнаружения веб-контента с фейковыми новостями // Инновационные, информационные и коммуникационные технологии. 2017. № 1. С. 128-130.

[21] Жук Д.А., Жук Д.В., Третьяков А.О. Методы определения

поддельных новостей в социальных сетях с использованием машинного обучения // Информационные ресурсы России. 2018. № 3. С. 29-32.

The Method of Identify the Russian-Language Fake News Using Artificial Intelligence

Arsenii O. Tretiakov, Olga G. Filatova, Denis V. Zhuk, Natalia N. Gorlushkina, Antonina A. Puchkovskaya

Abstract — The article presents a method developed by the authors for identify fake news in social networks. A review of publications on the topic of fake news shows that although there is still no single definition of this concept, the interest in fakes is enormous. This is facilitated by the rapid growth of the popularity of social networks and the possibilities of artificial intelligence. In addition, information is distributed on social networks rather quickly, due to the fact that users regularly share information, including unverified. There is an urgent need to develop automated computing systems to identify fake news on social networks.

The article provides a brief overview of existing projects to identify fake news. It is argued that such projects have not yet been identified in the Russian segment of the Internet and in Russian language. The paper presents a study conducted by the authors, the purpose of which is to develop the concept of a method of automated determination of fake news for Russian-language texts using artificial intelligence and machine learning. The conclusion is made about the great potential that can be extracted from the application of artificial intelligence in conjunction with the tools for processing web data.

Keywords — fake news, social networks, artificial intelligence, machine learning, neural networks

References

[1] Fake news and disinformation online. Report. European Union, 2018. URL: https://ec.europa.eu/digital-single-market/en/news/final-results-eurobarometer-fake-news-and-online-disinformation

[2] Bentzen N. Understanding disinformation and fake news. European Parliamentary Research Service. 2017. URL:

http://www.europarl. europa. eu/RegData/etudes/ATAG/2017 /599408/EPRS_ATA(2017)599408_EN.pdf

[3] Jowett G., O'Donnell V. Propaganda and Persuasion. SAGE Publications, 2015. 480 p.

[4] Standage T. The true history of fake news // The Economist 1843 Magazine. june/july 2017. URL: https://www.1843magazine.com/technology/rewind/the-true-history-of-fake-news

[5] Suhodolov A.P., Bychkova A.M. «Fejkovye novosti» kak fenomen sovremennogo mediaprostranstva: ponjatija, vidy, naznachenija, mery protivodejstvija // Voprosy teorii i praktiki zhurnalistiki. 2017. T. 6, # 2. C.155-156.

[6] Fake news // Macquariedictionary.com. URL: https://www.macquariedictionary.com.au/news/view/article/ 431/

[7] Fake news // Cambridge Dictionary. URL: https://dictionary.cambridge.org/dictionary/english/fake-news

[8] Fake news // Collins English Dictionary. URL: https://www.collinsdictionary.com/dictionary/english/fake-news

[9] Allcott H., Gentzkow M. Social media and fake news in the 2016 election // Journal of Economic Perspectives. 2017. Vol. 31(2). P. 211-236.

[10] Martens B., Aguiar L., Gomez-Herrera E., Mueller-Langer F. The digital transformation of news media and the rise of disinformation and fake news. Digital Economy Working Paper 2018-02; JRC Technical Reports. Seville, Spain: European Commission, 2018. URL: https://ec.europa.eu/jrc/sites/jrcsh/files/jrc111529.pdf

[11] Reuters Institute. Digital News Report, published by the Reuters Institute and Oxford University Press, 2017.

[12] Tackling online disinformation: a European Approach - https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:52018DC0236

[13] Code of Practice on Disinformation. URL: https://ec.europa.eu/digital-single-market/en/news/code-practice-disinformation

[14] Al-Heeti A. Facebook Will Fight Fake News with Real Newspaper Ads (and More) // CNET. May 23, 2018.

[15] Building a better news experience on YouTube, together. URL: https://youtube.googleblog.com/2018/07/building-better-news-experience-on.html

[16] Greenberg A. Inside Google's Internet Justice League And Its Ai-Powered War On Trolls // Wired. 19.09.2016. URL: https://www.wired.com/2016/09/inside-googles-internet-justice-league-ai-powered-war-trolls/

[17] Filatova O., Bolgov R. Strategic Communication in the Context of Modern Information Confrontation: EU and NATO vs Russia and ISIS // Proceedings of the 13th International Conference on Cyber Warfare and Security ICCWS 2018. Edited by Dr John S. Hurley and Dr Jim Q. Chen. Washington DC, USA, 2018. P. 208-219.

[18] Shu K., Sliva A., Wang S., Tang J., Liu H. Fake News Detection on Social Media: A Data Mining Perspective // Arxiv.org. URL: https://arxiv.org/pdf/1708.01967.pdf

[19] Koshy J. How Content Discovery Platforms Can Fight Fake News via Web Scraping and AI // PromtCloud. URL: https://www.promptcloud.com/blog/fight-fake-news-web-scraping-artificial-intelligence

[20] Nekrasov G.A., Romanova I.I. Razrabotka poiskovogo robota dlja obnaruzhenija veb-kontenta s fejkovymi novostjami // Innovacionnye, informacionnye i kommunikacionnye tehnologii. 2017. # 1. S. 128-130.

[21] Zhuk D.A., Zhuk D.V., Tret'jakov A.O. Metody opredelenija poddel'nyh novostej v social'nyh setjah s ispol'zovaniem mashinnogo obuchenija // Informacionnye resursy Rossii. 2018. # 3. S. 29-32.

i Надоели баннеры? Вы всегда можете отключить рекламу.