Научная статья на тему 'МОДЕЛИРОВАНИЕ ВЫСОКОУРОВНЕВОЙ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ИЗУЧЕНИЯ ОНЛАЙН-РАДИКАЛИЗАЦИИ'

МОДЕЛИРОВАНИЕ ВЫСОКОУРОВНЕВОЙ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ИЗУЧЕНИЯ ОНЛАЙН-РАДИКАЛИЗАЦИИ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
42
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
CЕМАНТИКА / ОНТОЛОГИЯ / ТОПОЛОГИЯ / МОДЕЛЬ / РАДИКАЛИЗАЦИЯ / СОЦИАЛЬНАЯ СЕТЬ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Савельев Алексей Олегович, Карпова Анна Юрьевна

Исследования онлайн-радикализации в цифровую эпоху невозможно проводить без инструментов для автоматического анализа данных социальных сетей. Однако возможности создания прототипов для интеллектуального анализа данных ограничены в силу объективных причин, связанных с их сбором и обработкой. Для решения любой задачи интеллектуального анализа данных знание предметной области является насущной необходимостью. Соответственно, данные должны быть сначала собраны, представлены в виде онтологических моделей, которые могут быть обработаны и формализованы машинами. В статье представлена социально-топологическая модель высокоуровневой онтологии онлайн-радикализации, состоящая из четырех основных модулей, в каждом из которых обозначены измеримые индикаторы радикализации и способы вычисления их значений. Хотелось бы обратить внимание на то, что в перспективе такие онтологии станут эффективным инструментом на первом этапе проведения исследований в области изучения радикализации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Савельев Алексей Олегович, Карпова Анна Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELING A HIGH-LEVEL DOMAIN ONTOLOGY TO STUDY ONLINE RADICALIZATION

Research on online radicalization in the digital age is impossible without tools to analyze social media data automatically. But the possibilities of creating prototypes for data mining of social networks are limited due to objective reasons associated with data collection and processing. To solve any data mining task, knowledge of the subject area is an absolute must. Accordingly, knowledge of the subject area must first be collected, presented in the form of ontological models that machines can process and formalize. The article presents a socio-topological model of an online radicalization high-level ontology consisting of four main modules. Each module identifies measurable indicators of radicalization and how to calculate their values. In our approach to creating a high-level ontology of the subject area, we want to draw the attention of researchers to the fact that in the future, such ontologies are an effective tool at the first stage of research in the study of radicalization.

Текст научной работы на тему «МОДЕЛИРОВАНИЕ ВЫСОКОУРОВНЕВОЙ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ИЗУЧЕНИЯ ОНЛАЙН-РАДИКАЛИЗАЦИИ»

УДК 004.77:316.624.3-53.6

МОДЕЛИРОВАНИЕ ВЫСОКОУРОВНЕВОЙ ОНТОЛОГИИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ИЗУЧЕНИЯ ОНЛАЙН-РАДИКАЛИЗАЦИИ

Савельев Алексей Олегович,

sava@tpu.ru

Анна Юрьевна Карпова,

belts@tpu.ru

Национальный исследовательский Томский политехнический университет, Россия, 634050, г. Томск, пр. Ленина, 30

Савельев Алексей Олегович, кандидат технических наук, доцент Инженерной школы информационных технологий и робототехники Национального исследовательского Томского политехнического университета. ORCID 0000-0002-7466-6142.

Анна Юрьевна Карпова, доктор социологических наук, профессор Школы базовой инженерной подготовки Национального исследовательского Томского политехнического университета. ORCID 0000-0001-7854-1438.

Исследования онлайн-радикализации в цифровую эпоху невозможно проводить без инструментов для автоматического анализа данных социальных сетей. Однако возможности создания прототипов для интеллектуального анализа данных ограничены в силу объективных причин, связанных с их сбором и обработкой. Для решения любой задачи интеллектуального анализа данных знание предметной области является насущной необходимостью. Соответственно, данные должны быть сначала собраны, представлены в виде онтологических моделей, которые могут быть обработаны и формализованы машинами. В статье представлена социально-топологическая модель высокоуровневой онтологии онлайн-радикализации, состоящая из четырех основных модулей, в каждом из которых обозначены измеримые индикаторы радикализации и способы вычисления их значений. Хотелось бы обратить внимание на то, что в перспективе такие онтологии станут эффективным инструментом на первом этапе проведения исследований в области изучения радикализации.

Ключевые слова: Семантика, онтология, топология, модель, радикализация, социальная сеть.

Введение

Исследования радикализации стали одним из важнейших направлений изучения терроризма. Радикализация, как процесс перехода от ненасильственных форм выражения мнений к насильственным действиям, рассматривается как предиктор терроризма. Социальные сети являются ключевым носителем информации, коммуникативным инструментом взаимодействия, обмена контентом, поиска информации и общения. Террористические группы и организации также осознали потенциал социальных сетей для охвата людей по всему миру. Как следствие, они теперь используют социальные сети для распространения радикальных идеологий, деструктивного контента, вербовки, пропаганды и влияния на масштабируемость и массовость процесса радикализации уязвимых лиц, их готовности к совершению насильственных действий и террористических инцидентов. Одной из приоритетных задач обеспечения национальной безопасности является защита граждан РФ от потенциальных источников угроз и рисков, производимых в информационном поле [1-3]. Для комплексной оценки и оперативного анализа

132 БОТ 10.18799/26584956/2022/2/1167

такого рода рисков и угроз требуются новые инструменты, технологии, с использованием методов искусственного интеллекта (Artificial Intelligence, AI) и интеллектуального анализа веб-данных (Web Mining), обеспечивающие совершенствование процесса исследований за счет применения междисциплинарных подходов и автоматизации наиболее трудоемких процессов.

Социальные сети могут сыграть важную роль в борьбе с радикализацией и терроризмом. В частности, их можно рассматривать как источник данных, который может применяться для получения ценной информации о процедуре рекрутинга, распространения радикальных идеологий, оценке влияния деструктивного контента, социально -политической мобилизации и других факторов, имеющих ключевое значение в процессе радикализации. Социальные сети также необходимо рассматривать как источник данных для получения знаний о различных путях онлайн-радикализации, с целью проведения превентивной политики. Изучая пути радикализации уязвимых категорий лиц, которые не составляют ядро экстремистских и радикальных движений/сообществ, а находятся на «периферии» (в промежуточных, уязвимых группах, перемещаясь между офлайн-нерадикальной средой и радикальными онлайн-сообществами), можно выявить причины, мотивы и обстоятельства, в результате которых они попадают в «ловушку» радикализации. Существенный нюанс в том, что радикальные мнения и убеждения, не являются преступными, отличаются от радикального поведения тем, что человек продвигает радикальные идеи посредством насилия и убежден в том, что оно необходимо для продвижения к цели. Любые действия людей, которые можно рассматривать как случайные, так и закономерные ведут к каким-либо последствиям. Каждый этап радикализации, несомненно, должен рассматриваться как один из возможных индикаторов на пути принятия идеи насильственного экстремизма, перехода к участию в терроризме, но безусловно, не является единственным индикатором [4-6].

Интеллектуальный анализ данных социальных сетей связан с решением важных вопросов технического характера. Это касается ключевых проблем в области сбора, анализа и обработки огромного объема данных:

• сбор информации из социальных сетей, при наличии ограничений программных интерфейсов приложений (API), устанавливаемых провайдерами социальных сетей (допустимая частота запросов, объем предоставляемых в ответ на запрос данных и пр.);

• использование нескольких социальных медиа в качестве источников первичных данных влечет за собой разработку многоагентной подсистемы сбора;

• несмотря на экстраординарный объем данных, находящихся в открытом доступе в социальных медиа их всё еще недостаточно; нет явной информации о характере связей между пользователями и сообществами, отсутствует возможность верифицировать имеющуюся информацию (как следствие, невозможно оценить точность моделей, основанных на методах машинного обучения);

• высокая динамичность данных (содержимое социальных сетей продолжает развиваться при постоянном взаимодействии с пользователями), и огромное количество шума в данных социальных сетей влияет на качество анализа данных;

• для исследований процесса радикализации необходимы модели сетевой топологии, которые условно можно назвать «модели трудноформализуемых объектов»: их изучение пока невозможно без дополнительного звена - эксперта (экспертное выгорание становится повсеместной проблемой) [7].

Эти проблемы акцентируют внимание на необходимости автоматизации задач анализа данных, чтобы уменьшить потребность в постоянной работе эксперта, без

ущерба для качества результатов анализа [8]. Важным направлением исследований, связанным с ограничениями существующих методов интеллектуального анализа данных, является использование знаний предметной области, включая преобразование и интерпретацию данных, сокращение функций, выбор алгоритма, постобработку. Для этих целей знания предметной области должны быть сначала собраны, представлены в виде онтологических моделей, которые могут быть обработаны и формализованы машинами. Моделирование и связанный с этим процесс создания онтологии - формальное описание понятий в предметной области вместе с их свойствами и взаимоотношениями, интерпретируемое как классы онтологии и как часть онтологической концепции, называемой базой знаний. Эффективность измерений связана с тем, насколько точно проработаны индикаторы радикализации Хорошая классификация обеспечивает лучший расчет значений показателей и приводит к более точному прогнозу уровня риска радикализации [9, 10].

Онтология предметной области, которая определяет основные понятия радикализации, называется концепциями низкого уровня. Онтология предметной области, которая относится к рассматриваемым показателям/индикаторам радикализации, называется концепциями высокого уровня. Например, концепции террористической радикализации применяются в создании онтологии терроризма в части низкоуровневой онтологии «Terrorist-Personality» [11]. Проведя анализ современного состояния исследований в области создания автоматизированных систем с опорой на онтологии предметной области, мы констатируем, что за последнее десятилетие появилось несколько перспективных работ в которых онтология предметной области используется для интеллектуального анализа данных социальных сетей. Например, онтология радикализации OFEDR, основанная на применении семантического подхода к поиску индикаторов радикализации в социальных сетях и включающая низкоуровневую и высокоуровневую онтологии [12].

В статье мы предлагаем онтологию для предметной области исследований радикализации, которая позволяет создать подход к автоматическому вычислению индикаторов онлайн-радикализации. Онлайн-радикализацию мы определяем, как процесс перехода от ненасильственных форм выражения мнения в онлайне к совершению насильственных действий в офлайн-пространстве. Другими словами, мы рассматриваем он-лайн-радикализацию как процесс социальной и психологической трансформации, в котором человек принимает экстремистскую систему убеждений, независимо от того, приводит она в конечном счете к фактическому насилию или нет. Индивидуальные траектории онлайн-радикализации варьируются от человека к человеку, связаны с конкретными технологиями вовлечения в радикальные сообщества, имеют динамический характер развития демонстративной, конфронтационной и насильственной тактики. Онлайн-радикализация - это (1) стохастический процесс, который влечет за собой (2) вовлечение в экстремистскую систему убеждений, готовящая почву для (3) совершения насилия в офлайне [13].

Высокоуровневая онтология онлайн-радикализации

Онтологию онлайн-радикализации мы представляем, как формализацию когнитивных и поведенческих компонентов. Когнитивный компонент формально интерпретирует процесс, при котором человек все больше поддерживает идеи, убеждения и ценности противодействия/противостояния фундаментальным ценностям и нормам общества, включая демократию и верховенство закона. В целом это социальный и психологический процесс, постепенно переживаемой приверженности экстремистским идеологиям.

Поведенческий компонент формально интерпретирует процесс участия в экстремальной деятельности, которая может быть насильственной и незаконной либо ненасильственной и законной. Таким образом, поведенческий компонент обозначаем как коллективно определяемое, индивидуально ощущаемое и принимаемое моральное обязательство участвовать в прямых действиях в защиту группы/сообщества/движения.

Необходимо учитывать сочетание трех основных факторов, играющих ключевую роль в процессе онлайн-радикализации:

1) социальный и политический контекст, который способствует формированию или не формированию благоприятных обстоятельств для радикализации;

2) факторы группового уровня, такие как ресурсы, сеть и связь;

3) факторы индивидуального уровня. Мотивация и индивидуальный профиль человека, психосоциальные или эмоциональные факторы, которые объясняют, почему и когда он готов принять участие в коллективных действиях.

Исходя из всего вышеизложенного, мы выделили две группы индикаторов, характеризующих процесс онлайн радикализации:

1. Индикаторы, связанные с содержанием текстов, основанные на обнаружении когнитивного компонента: восприятие (например, дискриминация: расовая, религиозная, политическая, гендерная и т. п.); негативные идеи (например, ультраправых или скулшутеров); фрустрация и негативные чувства (например, ощущение относительной депривации, отчуждения или социальной изоляции, презрение, чувство незащищенности); интроверсия (фокус на внутреннюю психическую активность); позитивные идеи радикальной идеологии (например, принятие идеи о том, что только в данной идеологии решается проблема несправедливости существующего порядка вещей).

2. Индикаторы, связанные со стилем текстов, основанные на обнаружении поведенческого компонента: концентрация (сочувствие, поддержка радикальных взглядов, убеждений). Отличительные маркеры: растущая персеверация, все более негативные оценки объекта на котором концентрируется внимание, все более резкие мнения и гневные эмоциональные отклики. Идентификация (оправдание радикальной идеологии, взглядов, убеждений, ценностей). Отличительные маркеры: идентификация с радикальными действиями (представление себя «героем» или «воином»), идентификация с образцом для подражания, отождествление со своими идеологическими «союзниками» (по принципу «мы против них»). Замысел (принятие на себя морального обязательства выступить в защиту радикальной группы/сообщества/движения). Отличительные маркеры: заявление о намерении причинить вред определенной цели, планирование/исследование или реализация задуманного. Намерение может быть конкретным и явным, может быть размытым и четко не определяемым, но в том и другом случае прослеживается умысел. Умысел также влечет за собой озабоченность целью.

Высокоуровневую онтологию предметной области изучения онлайн-радикализации мы представляем в виде социально-топологической модели. Применительно к предметной области, социальная топология направлена на изучение инвариантных социальных свойств объекта в изменяемом пространстве многомерного статистического распределения. Исследование его активных свойств, при помощи анализа изменений и процедур деформации. Социально-топологическая модель (СТМ) представляет собой структуру, где эти свойства проявляются в совокупности. В целом СТМ основывается на описании социальных процессов, происходящих в локальных сообществах, с выявлением в их пространственной организации топологических констант, характеристик и проведением топологического анализа сообществ с использованием широкого методологического инструментария. Построение СТМ онлайн-радикализации позволяет: вы-

явить зависимость между группами влияния ультрарадикальных сообществ и одиночными субъектами или целевыми автономными ячейками, проверить гипотезы, провести поиск неизвестных/значимых корреляций, разработать модели онлайн - радикализации применительно к конкретным объектам изучения.

Социально-топологическая модель отражает в общем виде связь индикаторов радикализации с информацией, представленной на уровне социальных медиа. Мы представляем системный взгляд на наш подход, который состоит из четырех основных модулей. На рис. 1 приведена визуализация модели.

мснованнын о6ъект\ Г Ключевое слово

Named ciuih ) V Kc\«ord

-ж---( ')<h'j>чтит 'ж-

III —. С un!WHS

Источник: составлено авторами. Source: compiled by the authors.

Рис. 1. Высокоуровневая онтология онлайн-радикализации: социально-топологическая модель стохастического процесса онлайн-радикализации Fig. 1. High-level ontology of online radicalization: a socio-topological model of the online radicalization stochastic process

Модель описывает четыре обобщенные группы объектов:

• I - сущности социальных медиа (учетная запись, пост и сообщество).

• II - индикаторы радикализации, связанные со стилем текстов, основанные на обнаружении поведенческого компонента.

• III - маркеры радикализации, выраженные как в виде процессов (например, «миграция внимания»), так и в виде статических атрибутов объектов (например,

«лайк») или их частей (например, «цель (объект)», выраженные через «ключевое слово», которое является частью текстового статического атрибута).

• IV - инструменты для сбора и обработки данных, для выявления маркеров.

Таким образом, три основных измеримых индикатора радикализации - концентрация, идентификация и замысел - описываются следующим образом:

• Концентрация, как индикатор, может быть выражена через процессы активности и внимания. Другими словами, смещение фокуса «внимания» или «активности», выражаемых через различные измеримые критерии, как лайки, репосты и т. д., на «целевой» (т. е. относящийся к ультрарадикальной платформе) контент может трактоваться как наличие индикатора «концентрация». При этом контент любого типа (текст, видео или изображение) может содержать значимую информацию.

• Замысел выражается через соответствующие заявления, содержащие описания цели (или объекта) для активного действия и упоминание возможного инструмента (например, вида оружия).

• Идентификация выражается через значения статических атрибутов учетной записи пользователя или сообщества. Например, значение имени учетной записи пользователя «Эрик Харрис» является маркером с точки зрения фиксации интереса к идеологической платформе «скулшутеры». Или другой пример: в качестве значимого маркера идентификации - использование никнейма, подписи под сообщениями, изображение героизированных фигур вдохновляет членов сообщества, вызывает идеологические чувства, обеспечивая других пользователей форума знанием их убеждений независимо от содержания поста, и в значительной степени представляет собой предупреждающий знак. Хотя пользователи форума не могут открыто или часто использовать идеологический язык своего сообщества, символично связанные имена пользователей, подписи и изображения появляются в тексте для надежной идентификации с радикальным сообществом [13, 14].

Значения индикаторов вычисляются на основе значимости связанных с ними ключевых слов, предоставленных экспертами в предметной области. Базовый экспертный словарь может быть автоматически расширен семантически близкими словами за счет применения подхода word2vec [15, 16]. Принцип работы word2vec заключается в нахождении связей между контекстами на основе предположения, что слова, находящиеся в схожих контекстах, обозначают похожие вещи, иными словами, являются семантически близкими. С формальной точки зрения задача может быть сформулирована как максимизация косинусной близости между векторами слов (скалярное произведение векторов), которые расположены рядом друг с другом, при минимизации косинусной близости между векторами слов, которые рядом друг с другом не появляются. Таким образом «близость» векторов отдельных слов обозначает «близость» их контекстов. Формальная задача может быть представлена в следующем упрощенном виде:

(Wv х Wc)

2(Wcl X Wvy

где значение числителя отражает близость слов контекста ( Wc) и целевого слова (Wv).

Значимость (вес) связанного с индикатором ключевого слова может быть определена с использованием статистической меры TF-IDF. Для всех слов каждого из документов (например, опубликованных в открытом доступе постов) определяется мера значимости:

■ ^ г ^ nw wI \D\

weight (w, d) = =-x log -—,

Zknk \{di ED | wedi}\

где nw - число вхождений слова w в документ; nk - общее число слов в документе; w - слово в документе; d - документ; |D| - корпус всех документов;^, G D | w G d})| -число документов в корпусе D, где встречается w.

Перечень наиболее значимых слов для документа вычисляется на основе абсолютной значимости:

. _ ( гл ^weight (w.dt) weightabs (w, С) = -,

nd

где C - корпус постов, входящих в документ (С G D); nd - количество постов в C, где встречается w.

Показатели радикализации, относящиеся к низкоуровневой онтологии, разрабатываются экспертами в предметной области: социологами, психологами и криминологами. На этом этапе эксперты в предметной области применяют соответствующие концепции из области исследований терроризма и дополняют их теми, которые актуальны для области изучения радикализации. Еще раз подчеркнем, что исследование радикализации - это междисциплинарная область знаний.

В нашем подходе к созданию высокоуровневой онтологии предметной области изучения онлайн-радикализации мы предлагаем применять низкоуровневые онтологические концепции в части формализации и классификации сообщений в социальных сетях для определения радикальных идеологий и деструктивного контента. Затем формализованные базы знаний используются на этапе рассуждений, чтобы отразить в высокоуровневой онтологии наличие индикаторов радикализации. Обоснование опирается на набор правил, моделирующих определение наличия индикатора. Далее мы предполагаем рассчитать значения индикаторов для каждого пользователя на основе аннотированных сообщений и применить их для оценки уровня риска радикализации пользователя. Такой подход позволит выявлять уже радикализированных пользователей. В качестве основного вклада, отметим, что мы исследуем практику внедрения онтоло-гий предметной области в процесс автоматизации анализа социальных сетей в части выявления радикального контента, уязвимых лиц, подверженных риску радикализации, и для оценки уровня угроз и рисков онлайн-радикализации.

Заключение

Онтологии являются эффективным инструментом для сбора, обработки и интеллектуального анализа данных социальных сетей на первом этапе проведения исследований в предметной области изучения.

Высокоуровневая онтология онлайн-радикализации, специально разработанная для идентификации индикаторов, может быть расширена другими индикаторами.

В перспективе мы намерены выявить и определить диапазон идентификации: «близости» и «принадлежности» к ультрарадикальным сообществам, а также расширить низкоуровневую онтологию знаний и понимания специфических характеристик ультрарадикальных сообществ.

В завершение подчеркнем, несмотря на возросшую доступность инструментов Data Science, эффективность их использования зависит в равной степени как от соответствующих навыков, так и от компетентности в прикладной предметной области. Развитие методов AI и сопутствующих им повышает квалификационные требования к исследователям. При этом новым профессиональным требованием становится наличие базовых компетенций и навыков в области Data Science. Такой эксперт должен владеть навыками качественной формализации, иметь опыт и знания, чтобы перейти к алгоритмизации. В цифровую эпоху ключевое значение приобретает возможность проводить упреждающий мониторинг

в социальных сетях с помощью автоматизированного программного обеспечения. Однако

такие инструменты будут эффективны только при создании онтологий, которые позволяют

выявлять признаки идеологической, политической и других видов радикализации.

Исследование выполнено при финансовой поддержке ГЗ «Наука», в рамках проекта FSWW-2020-0014.

СПИСОК ЛИТЕРАТУРЫ

1. О Стратегии национальной безопасности Российской Федерации»: указ Президента Российской Федерации от 31.12.2015 № 683 // КонсультантПлюс. URL: http://www.consultant.ru/document/ cons_doc_LAW_191669/ (дата обращения 24.10.2021).

2. Защита информационного пространства Российской Федерации от идеологии терроризма. Комплексный план противодействия идеологии терроризма в Российской Федерации на 2019-2023 годы. URL: https://www.gov.spb.ru/static/writable/ckeditor/uploads/2021/03/18/08/%D0%9A%D0%BE%D0%BC%D0 %BF%D0%BB%D0%B5%D0%BA%D1%81%D0%BD%D1%8B%D0%B9_%D0%9F%D0%BB%D0%B0 %D0%BD_A5BnJWb.pdf (дата обращения 24.10.2021).

3. Комплексный план противодействия идеологии терроризма в Российской Федерации на 2019-2023 годы. URL: https://www.ryazangov.ru/upload/iblock/12c/KPPIT-RF-2019_2023.pdf (дата обращения 24.10.2021).

4. Ravndal J.A., Bjorgo T. Investigating terrorism from the extreme right: a review of past and present research // Perspectives on Terrorism. - 2018. - V. 12 (6). - P. 5-22.

5. Application of a profile similarity methodology for identifying terrorist groups that use or pursue CBRN weapons / B. Breiger, G. Ackerman, V. Asal, D. Melamed, H. Brinton Milward, K. Rethemeyer, E. Schoon. -2011. URL: https://link.springer.com/chapter/10.1007/978-3-642-19656-0_5 (дата обращения 24.10.2021).

6. Cognitive mechanisms in violent extremism / A.W. Kruglanski, J.R. Fernandez, A.R. Factor, E. Szumowska. -2018. URL: https://www.sciencedirect.com/science/article/pii/S00100277183030327via%3Dihub (дата обращения 24.10.2021)

7. Do machines replicate humans? Toward a unified understanding of radicalizing content on the open social web / M. Hall, M. Logan, G.S. Ligon, D.C. Derrick // Policy & Internet. - 2020. - V. 12. - P. 109-138.

8. Method for detecting far-right extremist communities on social media / A. Karpova, A. Savelev, A. Vilnin, S. Kuznetsov // Social Sciences. - 2022. - V. 11. - Iss. 200. DOI: https://doi.org/10.3390/socsci11050200

9. Ontologies and the semantic web / S. Grimm, A. Abecker, J. Volker, R. Studer // Handbook of semantic web technologies. - Berlin: Springer, 2011. - P. 507-579.

10. Measuring the radicalization risk in social networks / R. Lara-Cabrera, A. Gonzalez-Pardo, K. Benouart, N. Faci, D. Benslimane, D. Camacho // IEEE Access. - 2017. - V. 5. - P. 10892-10900.

11. Turner M.D. A simple ontology for the analysis of terrorist attacks // Electrical & computer engineering technical reports. URL: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://digital-repository.unm.edu/cgi/viewcontent.cgi?article=1040&context=ece_rpts (дата обращения 24.10.2021).

12. Wendelberg L. An Ontological Framework to Facilitate Early Detection of 'Radicalization' (OFEDR) - a three world perspective // Journal of Imaging. - 2021. - V. 7. - Iss. 3. DOI: https://doi.org/10.3390/ jimaging7030060

13. Karpova A., Savelev A., Maksimova N. Modeling the process of school shooters radicalization (Russian case) // Social Sciences. - 2021. - V. 10. - Iss. 477. DOI: https://doi.org/10.3390/socsci10120477

14. Карпова А.Ю., Максимова Н.Г. Скулшутинг в России: что имеет значение? // Власть. - 2021. -Т. 29 (1). - C. 93-108.

15. The high-level overview of social media content search engine / A.O. Savelev, A.Yu. Karpova, D.V. Chaykovskiy, A.D. Vilnin, A.Yu. Kaida, S.A. Kuznetsov, L.O. Igumnov, N.G. Maksimova // IOP Conference Series: Materials Science and Engineering. - 2021. - V. 1019 (1). Article number 012097.

16. Efficient estimation of word representations in vector space / T. Mikilov, K. Chen, G. Corrado, J. Dean // Proceedings of the International Conference on Learning Representations (ICLR 2013). - 2013. URL: https://arxiv.org/pdf/1301.3781v3.pdf (дата обращения 24.10.2021).

Поступила 13.02.2022 г.

UDC 004.77:316.624.3-53.6

MODELING A HIGH-LEVEL DOMAIN ONTOLOGY TO STUDY ONLINE RADICALIZATION

Aleksei O. Savelev,

sava@tpu.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Anna Yu. Karpova,

belts@tpu.ru

National Research Tomsk Polytechnic University, 30, Lenin avenue, Tomsk, 634050, Russia

Aleksei O. Savelev, Cand. Sc., associate professor, National Research Tomsk Polytechnic University. ORCID 0000-0002-7466-6142.

Anna Yu. Karpova, Dr. Sc., professor, National Research Tomsk Polytechnic University. ORCID 0000-0001-7854-1438.

Research on online radicalization in the digital age is impossible without tools to analyze social media data automatically. But the possibilities of creating prototypes for data mining of social networks are limited due to objective reasons associated with data collection and processing. To solve any data mining task, knowledge of the subject area is an absolute must. Accordingly, knowledge of the subject area must first be collected, presented in the form of ontological models that machines can process and formalize. The article presents a socio-topological model of an online radicalization high-level ontology consisting of four main modules. Each module identifies measurable indicators of radicalization and how to calculate their values. In our approach to creating a high-level ontology of the subject area, we want to draw the attention of researchers to the fact that in the future, such ontologies are an effective tool at the first stage of research in the study of radicalization.

Key words: Semantics, ontology, topology, model, radicalization, social network.

The study is funded by the Science State Program as part of the project No. FSWW-2020-0014.

REFERENCES

1. Strategii natsionalnoy bezopasnosti Rossiyskoy Federatsii [On the National Security Strategy of the Russian Federation]. Ukaz Prezidenta Rossiyskoy Federatsii ot 31.12.2015 no. 683 [Decree of the President of the Russian Federation of December 31, 2015 No. 683]. KonsultantPlyus. Available at: http://www.consultant.ru/document/cons_doc_LAW_191669/ (accessed 24 October 2021).

2. Zashchita informatsionnogo prostranstva Rossiyskoy Federatsii ot ideologii terrorizma. Kompleksny plan protivodeystviya ideologii terrorizma v Rossiyskoy Federatsii na 2019-2023 gody [Protection of the information space of the Russian Federation from the ideology of terrorism. Comprehensive plan to counter the ideology of terrorism in the Russian Federation for 2019-2023 p. 3.2]. Available at: https://www.gov.spb.ru/static/writable/ckeditor/uploads/2021/03/18/08/%D0%9A%D0%BE%D0%BC%D0 %BF%D0%BB%D0%B5%D0%BA%D1%81%D0%BD%D1%8B%D0%B9_%D0%9F%D0%BB%D0%B 0%D0%BD_A5BnJWb.pdf (accessed 24 October 2021).

3. Kompleksny plan protivodeystviya ideologii terrorizma v Rossiyskoy Federatsii na 2019-2023 gody [Comprehensive plan to counter the ideology of terrorism in the Russian Federation for 2019-2023]. Available at: https://www.ryazangov.ru/upload/iblock/12c/KPPIT-RF-2019_2023.pdf (accessed 24 October 2021).

4. Ravndal J.A., Bjorgo T. Investigating terrorism from the extreme right: a review of past and present research. Perspectives on Terrorism, 2018, vol. 12 (6), pp. 5-22.

5. Breiger B., Ackerman G., Asal V., Melamed D., Brinton Milward H., Rethemeyer K., Schoon E. Application of a profile similarity methodology for identifying terrorist groups that use or pursue CBRN weapons. 2011. Available at: https://link.springer.com/chapter/10.1007/978-3-642-19656-0_5 (accessed 24 October 2021).

6. Kruglanski A.W., Fernandez J.R., Factor A.R., Szumowska E. Cognitive mechanisms in violent extremism. 2018. Available at: https://www. sciencedirect.com/science/article/pii/S0010027718303032?via%3Dihub (accessed 24 October 2021).

7. Hall M., Logan M., Ligon G.S., Derrick D.C. Do machines replicate humans? Toward a unified understanding of radicalizing content on the open social web. Policy & Internet, 2020, vol. 12, pp. 109-138.

8. Karpova A., Savelev A., Vilnin A., Kuznetsov S. Method for detecting far-right extremist communities on social media. Social Sciences, 2022, vol. 11, Iss. 200. DOI: https://doi.org/10.3390/socsci11050200

9. Grimm S., Abecker A., Volker J., Studer R. Ontologies and the semantic web. Handbook of semantic web technologies. Berlin, Springer, 2011. pp. 507-579.

10. Lara-Cabrera R., Gonzalez-Pardo A., Benouart K., Faci N., Benslimane D., Camacho D. Measuring the rad-icalization risk in social networks. IEEE Access, 2017, vol. 5, pp. 10892-10900.

11. Turner M.D. A simple ontology for the analysis of terrorist attacks. Electrical & computer engineering technical reports. Available at: chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https:// digitalrepository.unm.edu/cgi/viewcontent.cgi?article=1040&context=ece_rpts (accessed 24 October 2021).

12. Wendelberg L. An Ontological Framework to Facilitate Early Detection of 'Radicalization' (OFEDR) - a three world perspective. Journal of Imaging, 2021, vol. 7, Iss. 3. DOI: https://doi.org/10.3390/ jimaging7030060

13. Karpova A., Savelev A., Maksimova N. Modeling the process of school shooters radicalization (Russian case). Social Sciences, 2021, vol. 10, Iss. 477. DOI: https://doi.org/10.3390/socsci10120477

14. Karpova A.Yu., Maksimova N.G. Skulshuting v Rossii: chto imeet znachenie? [Schoolshooting in Russia: what matters?]. Vlast, 2021, vol. 29 (1), pp. 93-108.

15. Savelev A.O., Karpova A.Yu., Chaykovskiy D.V., Vilnin A.D., Kaida A.Yu., Kuznetsov S.A., Igumnov L.O., Maksimova N.G. The high-level overview of social media content search engine. IOP Conference Series: Materials Science and Engineering, 2021, vol. 1019 (1), Article number 012097.

16. Mikilov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space. Proceedings of the International Conference on Learning Representations (ICLR 2013), 2013. Available at: https://arxiv.org/pdf/1301.3781v3.pdf (accessed 24 October 2021).

Received: 13 February 2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.