Научная статья на тему 'К вопросу о разработке онтологических ресурсов предметной области "терроризм"'

К вопросу о разработке онтологических ресурсов предметной области "терроризм" Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
234
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ ВЕРХНЕГО УРОВНЯ / ОНТОЛОГИЯ ПРЕДМЕТНОЙ ОБЛАСТИ / DOMAIN ONTOLOGY / РАЗРАБОТКА ОНТОЛОГИИ / ONTOLOGY DEVELOPMENT / ТЕРРОРИЗМ / TERRORISM / UPPER ONTOLOGY

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Шереметьева Светлана Олеговна, Зиновьева Анастасия Юрьевна

В статье представлен обзор основных трактовок и приемов построения онтологий c акцентом на проблеме построения онтологических ресурсов предметной области «терроризм» для автоматизированного выявления и анализа террористического содержания в текстах на естественном языке. Проанализировано несколько конкретных проектов разработки онтологий терроризма. Определено влияние отдельных аспектов террористической деятельности на структурирование онтологических моделей и описаны специфические методы их построения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON DEVELOPING ONTOLOGICAL RESOURCES FOR THE TERRORISM DOMAIN

The article considers main approaches for ontology interpretation and development. The emphasis is made on ontological resources for the subject area “terrorism” created to automatically detect and analyze the terrorist content in natural language texts. Analysis of particular projects on the development of terrorism ontologies is presented. The influence of specific aspects of terrorist activity on structuring the ontological models is determined and particular methods for their construction are described.

Текст научной работы на тему «К вопросу о разработке онтологических ресурсов предметной области "терроризм"»

УДК 821.161.1 + 81'322.4

DOI: 10.14529/ling170407

К ВОПРОСУ О РАЗРАБОТКЕ ОНТОЛОГИЧЕСКИХ РЕСУРСОВ ПРЕДМЕТНОЙ ОБЛАСТИ «ТЕРРОРИЗМ»

С.О. Шереметьева, А.Ю. Зиновьева

Южно-Уральский государственный университет, г. Челябинск, Россия

В статье представлен обзор основных трактовок и приемов построения онтологий с акцентом на проблеме построения онтологических ресурсов предметной области «терроризм» для автоматизированного выявления и анализа террористического содержания в текстах на естественном языке. Проанализировано несколько конкретных проектов разработки онтологий терроризма. Определено влияние отдельных аспектов террористической деятельности на структурирование онтологических моделей и описаны специфические методы их построения.

Ключевые слова: онтология верхнего уровня, онтология предметной области, разработка онтологии, терроризм.

Введение

Борьба с проявлениями терроризма настоятельно требует оперативного анализа текстовых документов и интернет-потоков с целью выявления в них фрагментов террористического содержания. Комплексное решение этой проблемы еще далеко от удовлетворительного решения, носит междисциплинарный характер и состоит в разработке комплексной методологии проблемно-ориентированного анализа текстов на естественном языке специфического (террористического, в нашем случае) содержания в философском, политическом, социологическом и лингвистическом аспектах.

В настоящее время работы, анализирующие террористическую активность в текстовых информационных потоках, ведутся преимущественно в рамках двух направлений:

1) поиск текстов террористического содержания;

2) анализ факторов, посредством которых террористические тексты воздействуют на определенные группы адресной аудитории.

Исследования в рамках первого направления включают в себя разработку компьютерных инструментов для классификации текстов и выявления их террористического содержания [19]. В рамках второго направления разрабатываются методики и инструментарий, предполагающий аналитическую обработку текстов террористического содержания с целью получить представление как об общих психологических особенностях людей, вовлеченных в террористическую деятельность [10], так и о личностях отдельных террористов [12]. Наблюдается возникновение интереса к тому, «каким образом» террористические тексты «соблазняют» определенные группы адресной аудитории, в частности, каким образом можно воздействовать на социальные слои населения определенной лексикой, контентом и контекстом различных медиа-платформ [1]. Ведутся работы по предотвращению радикализации аудитории в результате интернет-

коммуникации посредством искажения вредоносных текстов [7, 22].

Основным инструментом для успешного решения вышеуказанных проблем могла бы стать легкодоступная, гибкая, но всесторонняя онтология терроризма, поскольку именно онтологические ресурсы находят все большее применение в области построения систем автоматической обработки текстов, систем информационного поиска, машинного перевода, извлечения знаний, анализа и синтеза текстов и т. д. [1, 2, 16].

Настоящая работа посвящена анализу наиболее значимых современных направлений, методов и проблем построения онтологических ресурсов для предметной области «терроризм» с целью выявления действенной и реалистичной методики построения такого рода лингвистических ресурсов для автоматизированной обработки информации террористической направленности на естественном языке.

1. Основные трактовки термина

«онтология» в лингвистике

Ключевым для понимания термина «онтология» считается определение Томаса Грубера, согласно которому онтология - это «явная спецификация концептуализации», где концептуализация понимается как «абстрактная, упрощенная модель мира, создаваемая для определенных целей» [11, с. 199]. В прикладных лингвистических исследованиях концептуализация интерпретируется как представление знаний через описание множества понятий (концептов) и связей (отношений) между ними, ориентированное на решение определенной задачи, и, как правило, формализуется в виде графа, в узлах которого находятся концепты, а дуги репрезентируют виды отношений между концептами.

Несмотря на то, что приведенное выше общее определение онтологии лежит в основе практически всех работ по созданию онтологических ресурсов, конкретные трактовки этого понятия в со-

временной практике лингвистических исследований достаточно сильно отличаются одна от другой [3, 4]. Наиболее существенное различие между пониманиями термина «онтология» отражено в отношении исследователей к степени «привязки» онтологии к определенному естественному языку. В рамках одного направления онтология считается не зависящей от конкретного естественного языка, в то время как в рамках другого подхода к онтоло-гиям относят структуры, описывающие языковые выражения и их отношения в конкретном языке. Например, к независимым от лексики конкретного языка ресурсам можно отнести коммерческую онтологию MikroKosmos, первоначально созданную для целей машинного перевода [18], SUMO (Suggested Upper Merged Ontology), предназначенную для обработки информации [17], BFO (Basic Formal Ontology), спроектированную прежде всего для целей информационного поиска [9]. Наиболее зависимый от конкретного языка ресурс, часто называемый онтологическим, это хорошо известный тезаурус WordNet [14]. Промежуточное положение занимают такие ресурсы, как, например, CYC [8]. В отечественной лингвистике наиболее многообещающее исследование по созданию онтологических ресурсов для задач анализа тестов описано в работе [1]. Оно ведется в рамках подхода, предполагающего независимость концептов онтологии от конкретного языка.

Что касается способов формальной репрезентации онтологий, то они варьируются от проекта к проекту в зависимости от предпочтений разработчиков. Например, онтология MikroKosmos использует формализм направленного графа в виде запутанного дерева (tangled tree). Онтологии SUMO и BFO представлены на языке OWL (Web Ontology Language), разработанном для унифицированного представления онтологий в Семантической Сети (Semantic Web) и широко используемом в настоящее время. В отдельных случаях OWL адаптируют для целей конкретных онтологических проектов, как, например, в [1].

Несмотря на то, что каждый онтологический ресурс (вне зависимости от того, в рамках какого из указанных выше основных подходов он разработан) представляет собой структуру определенным образом связанных между собой концептов, так или иначе отражающих явления окружающего нас мира, онтологии существенно различаются по ряду параметров. Поскольку в рамках одной статьи невозможно охватить все существующие классификации, мы приведем только наиболее релевантные для нашего исследования классы онтологий. Прежде всего выделяются онтологии верхнего уровня и онтологии предметных областей.

Онтологии верхнего уровня включают в себя знания, общие для всех предметных областей и допускают многократное использование. Это ресурсы, в которых происходит первоначальное разделение действительности на самые общие катего-

рии, как, например, в онтологиях MikroKosmos, SUMO и BFO.

Онтологии предметных областей содержат знания об определенных предметных областях: культуре, медицине, авиации и др., которые могут использоваться только в рамках соответствующих предметных областей, возможно, многократно для решения различных задач обработки текстов. Онтологии предметных областей, в свою очередь, подразделяются на базовые онтологии, содержащие основные, наиболее широкие концепты предметной области и более узкие онтологии, ориентированные на ее отдельные аспекты. Содержание онтологии предметной области должно обязательно соответствовать существующему разделению в связанной с таким ресурсом онтологии более высокого уровня.

Далее, выделяются лингвистические онтологии, которые, в свою очередь, имеют следующие трактовки [3, 4, 6]:

1) онтологии, предназначенные для обработки естественного языка;

2) лексические онтологии - языковые ресурсы, созданные по типу WordNet;

3) модели представления лингвистических знаний, представляющие собой структуры (онтологические и тезауросоподобные), в которых содержатся концепты, характерные для предметной области «лингвистика».

Исследователи выделяют три возможных способа построения онтологий: нисходящий, восходящий и промежуточный. Первый способ предполагает построение онтологии сверху вниз, от наиболее универсальных концептов к более конкретным; второй же, напротив, предполагает выделять универсальные концепты на основе индивидуальных сущностей. При промежуточном подходе сначала определяются ключевые концепты, после чего происходит их обобщение и детализация [21, 13].

Источниками выделения концептов онтологий могут быть энциклопедии, толковые словари, глоссарии, базы данных, тексты и корпусы текстов, а также интуиция исследователей.

Анализ существующих исследований позволяет выделить следующий общий алгоритм построения онтологий:

• определение множества категорий (концептов), обозначающих явления реального мира, для отражения которых предназначена онтология;

• определение множества отношений между концептами;

• задание аксиом1;

• связывание концептов выбранными отношениями;

• соотнесение набора конкретных экземпляров (примеров) с концептами.

1 Аксиомами называются правила, описывающие способы связывания концептов выбранными отношениями и соотнесение набора конкретных экземпляров (примеров) с категориями._

На практике при выполнении задач каждого из этапов исследователям неизбежно приходится сталкиваться с серьезными проблемами и принимать большое количество специфических решений, адаптируя перечисленные общие положения к требованиям конкретного проекта.

2. Подходы к разработке онтологий,

ориентированных на предметную область

«терроризм»

Создание программных инструментов, автоматизирующих отслеживание и анализ текстов террористического содержания, невозможно до тех пор, пока исследователи-лингвисты не будут в состоянии построить лингвистические онтологии (в первом из перечисленных в разделе 1 понимании этого термина), формализующие знания о явлении терроризма [20].

Лингвистическая онтология, ориентированная на предметную область «терроризм», в идеале должна содержать все знания о террористической деятельности, которая представляет собой очень сложное явление и включает в себя непомерно большое число ситуаций и взаимосвязей, структурирование которых в виде единой системы в настоящее время невозможно.

Поэтому на практике каждая из разрабатываемых ныне онтологий терроризма, как правило, либо ориентирована на отдельные его аспекты, либо ограничивается построением базовых онтологий, не отражающих специфику каждого направления террористической деятельности, и представляет собой исследовательский проект в процессе развития, а не конечный продукт. При этом в каждом конкретном случае авторы разрабатывают собственные системы концептов и специфические методики решения связанных с созданием такого рода ресурсов проблем.

Мы далее иллюстрируем вышесказанное на примере исследований по разработке онтологий терроризма трех исследовательских коллективов, к числу которых относятся следующие проекты:

• онтология для веб-портала PiT (Profiles in Terror) [15, 16];

• онтология AIT (Adversary-Intent-Target)

[20];

• онтология Терроризма [5].

Первые два из указанных онтологических ресурсов разрабатываются американскими исследователями, третий представляет работу отечественных ученых. Все исследования выполнены исключительно посредством анализа англоязычного текстового материала. К сожалению, даже современные отечественные исследования терроризма демонстрируют отсутствие проработанных онтологических концепций и сложившихся научных направлений в приложении к русскому языку. Большинству из них свойственен описательный характер, констатация отдельных террористических актов с недостаточно убедительным аналитическим сопровождением.

Анализ работ проведен по следующим параметрам:

1) область применения онтологии и конечный пользователь;

2) наличие или отсутствие связи с какой-либо онтологией верхнего уровня;

3) способ построения онтологии;

4) основные понятия, или концепты;

5) способ представления онтологии.

Первый параметр - область применения онтологии - ключевой, так как он во многом определяет всю дальнейшую работу по созданию ресурса. В зависимости от этого параметра разработчик решает, необходима ли ресурсу связь с онтологией верхнего уровня, и если необходима, то с какой именно; каким должен быть набор концептов, является ли обязательным формальное представление онтологии и так далее.

Онтология PiT разрабатывается для стратегических целей разведывательных контртеррористических служб США и предназначена для представления знаний о структуре террористической сети, включающей в себя совокупность индивидов и организаций, а также многочисленные связи между ними. Конечный пользователь - разведывательные контртеррористические службы.

Онтология AIT предназначена для прогнозирования террористических актов на основе данных о террористических организациях, их намерениях и вооружении. Конечный пользователь - разведывательные контртеррористические службы США. Онтология AIT должна стать частью сложной системы - базовой онтологии терроризма BOOT (Basic Ontology Of Terrorism), с которой могли бы работать специалисты различных областей.

Онтология Терроризма не имеет строго сформулированной прикладной ориентации и целевого пользователя; исследование является концептуально-лингвистическим анализом понятия «терроризм» с целью выявления особенностей его репрезентации в англоязычном дискурсе интернет-новостей.

Второй параметр - наличие или отсутствие связи с онтологией верхнего уровня. Из проанализированных онтологий только об одной можно достоверно утверждать, что она связана с онтологией верхнего уровня: AIT поддерживает разделение действительности на категории, принятое в BFO (Basic Formal Ontology). Согласно BFO, все в мире может быть разделено на Материальные объекты, их Качества и Процессы [9]. Содержание онтологии AIT расщепляет концепты верхнего уровня BFO на концепты, специфические для предметной области «терроризм».

Онтология PiT и онтология Терроризма не связаны с какой-либо онтологией верхнего уровня и используют свое собственное структурирование понятий о соответствующей области террористической деятельности и о понятии Терроризм как таковом.

Третий и четвертый параметры - способ по-

строения онтологии и выделение концептов - тесно связаны между собой. В PiT построение онтологии идет снизу вверх. В качестве основы для разработки онтологии выступают базы данных, содержащие информацию о террористических актах и их исполнителях. В процессе разработки извлеченные из баз знаний концепты дополняются новыми, более детальными концептами. Например, к таким очевидным концептам, как Событие (к которому относится собственно террористический акт), Человек (участники террористического акта) и Организация (террористические группы), разработчики добавляют концепты, описывающие Гражданское состояние террориста, его Контакты с другими людьми, различные Способы секретной коммуникации и так далее. Онтология PiT является довольно обширной: в ней содержится 70 концептов и 173 свойства.

Онтология Терроризма основана на нисходящем подходе; источником для извлечения концептов в этом случае служит корпус текстов, отражающий англоязычный дискурс интернет-новостей, словарные дефиниции и тексты российских законов. Верхним и основным концептом онтологии является Терроризм, который затем подразделяется на концепты, описывающие Субъект, Объект, Результаты и Последствия террористической деятельности. При этом авторы упоминают Оружие как Средство террористической деятельности, однако не рассматривают его как отдельный концепт.

Создатели AIT используют промежуточный (нисходяще-восходящий) подход к построению онтологии. Разработка ресурса основана на утверждении модели (model statement) о террористической ситуации на естественном языке, которое и определяет структуру знаний в онтологии. В частности, в AIT в качестве утверждения модели используется простое предложение на английском языке «A terrorist attack occurs when an adversary, with intent and capability, uses a weapon against a target» [20, с. 13], которое в переводе на русский язык звучит следующим образом: «Террористический акт происходит, когда злоумышленник, имея намерение и возможности, использует оружие против цели». Все ключевые слова - «акт», «злоумышленник», «намерение» и другие - анализируются экспертами предметной области под руководством куратора - специалиста в области представления знаний. Например, анализ слова «злоумышленник» приводит к выводу о существовании концепта Террористическая организация и, следовательно, о необходимости создать комплементарный ему концепт Нетеррористическая организация. С помощью такого анализа определяются базовые термины предметной области и отношения между ними. Онтология поддерживает всего 11 основных отношений и 4 отношения, обратных некоторым основным, но при этом содержит множество концептов, которые получены путем детализации ключевых концептов моделирующего утверждения. После выделения набора

концептов определяются отношения между ними, что, как отмечают авторы, далеко не тривиально и ведет к переопределению некоторых концептов, что, в свою очередь, ведет к переосмыслению отношений и т. д.

Следует отметить, что каждая из трех онтоло-гий, кроме концептов, включает также экземпляры, то есть индивидуальные сущности реальной действительности, которые являются представителями того или иного концепта. Особенно важную роль экземпляры играют в PiT, поскольку значительная часть этой онтологии предназначена для описания террористической сети и построена на взаимоотношениях именно экземпляров (конкретных террористов и террористических организаций). Роль экземпляров в AIT менее существенна, поскольку отдельные конкретные теракты, особенно если они произошли в отдаленном прошлом, как считают авторы, не могут помочь в решении сегодняшних проблем контртеррористической деятельности. В онтологии Терроризма экземпляры носят иллюстративный характер.

Пятый параметр - способ представления онтологии. Онтологии PiT и AIT написаны на языке OWL (Web Ontology Language). Онтология Терроризма представлена в виде иерархической структуры фреймов, вершиной которой является концепт Терроризм.

Заключение

Анализ доступных нам работ по разработке онтологий терроризма показывает, что исследователям приходится решать как общие проблемы концептуализации онтологии, касающиеся, например, ее ширины и глубины, так и специфические для предметной области «терроризм» задачи структурирования знаний, обусловленные соображениями реалистичности выполнения поставленных задач. Требование реалистичности, в свою очередь, ведет к определенным ограничениям на онтологическое представление знаний о терроризме, которые напрямую связанны с ответами на вопросы о конечном пользователе онтологии и о доступности и объеме необходимых для построения онтологии данных, а также с различными методологическими соображениями, например, о том, каким образом онтологические концепты должны быть связаны с лексическими единицами конкретных языков.

Исследование методов создания онтологических ресурсов заставляет нас присоединиться к мнению авторов работы [15] о том, что построение онтологий - это скорее искусство, чем наука, и тем не менее, приведенные в настоящей статье конкретные методики разработки онтологий терроризма представляются весьма полезными для построения онтологических ресурсов, так необходимых для автоматизации обработки информации протеррористического содержания и эффективной борьбы с проявлениями терроризма.

Литература

1. Богуславский, И.М. Онтология для поддержки задач извлечения смысла из текста на естественном языке / И.М. Богуславский, В.Г. Ди-конов, С.П. Тимошенко // Информационные технологии и системы. - 2012. - С. 152-161.

2. Кравченко, Ю.А. Метод создания онтологии предметной области на основе глоссария / Ю.А. Кравченко, А.А. Новиков, В.В. Марков // Известия ЮФУ. Технические науки. - 2015. - №6 (167). - С. 158-168.

3. Лукашевич, Н.В. Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа: автореф. дис. ... д-ра техн. наук / Н.В. Лукашевич. - М.: ВИНИТИ РАН, 2014. - 32 с.

4. Митрофанова, О.А. Онтологии как системы хранения знаний [Электронный ресурс] / О.А. Митрофанова, Н.С. Константинова. - 2015.

- URL: goo.gl/GmMuau, свободный. - Загл. с экрана (дата обращения: 31.10.2016).

5. Мишланова, С.Л. Особенности репрезентации концепта терроризм в англоязычном дискурсе новостей интернет-ресурсов / С.Л. Мишла-нова, Е.А. Куприянычева // Филологические заметки. - 2012. - С. 265-276.

6. Соколова, Е.Г. Проблемы описания компьютерной лингвистики в виде онтологии для портала знаний [Электронный ресурс] / Е.Г. Соколова, И.С. Кононенко, Ю.А. Загорулько. -2008. - URL: https://goo.gl/zV6pN6, свободный. -Загл. с экрана (дата обращения: 5.12.2016).

7. Aly, A. The Terrorists' Audience: A Model of Internet Radicalisation / A. Aly // Journal of Australian Professional Intelligence Officers. - 2009. -Vol. 17. - P. 3-19.

8. An Introduction to the Syntax and Content of Cyc / C. Matuszek, J. Cabral, M. Witbrock, J. DeOli-veira // Conference: Formalizing and Compiling Background Knowledge and Its Applications to Knowledge Representation and Question Answering. - 2006.

- URL: https://www.researchgate.net/ publication/ 22125066, свободный. - Загл. с экрана (дата обращения: 11.11.2017).

9. Arp, R. Building Ontologies with Basic Formal Ontology / R. Arp, B. Smith, A.D. Spear. - Cambridge, MA: MIT Press. - 2015. - 248 p.

10. Behavioral Assessments Based on Automated Text Analyses. - URL: http://www.start.umd.edu/ research-projects/behavioral-assessments-based-

automated-text-analyses, свободный. - Загл. с экрана (дата обращения: 11.11.2017).

11. Gruber, T.R. A Translation Approach to Portable Ontology Specifications / T.R. Gruber // Knowledge Acquisition. - Vol. 5 (2). - 1993. - P. 199-220.

12. Harvesting and Analysis of Weak Signals for Detecting Lone Wolf Terrorists / J. Brynielsson, A. Horndahl, F. Johansson, L. Kaati, C. Martenson // Security Informatics. - Vol. 2 (1). - 2013. - P. 1-15.

13. Integrating a Bottom-Up and Top-Down Methodology for Building Semantic Resources for the Multilingual Legal Domain Semantic Processing of Legal Texts / E. Francesconi, S. Montemagni. W. Peters, D. Tiscornia //LNAE. - 2010. - Vol. 6036. - P. 95-121.

14. Introduction to WordNet: An On-line Lexical Database / G.A. Miller, R. Beckwith, C. Fellbaum et al. // International Journal of Lexicography. - 1990. -Vol. 3 (4). - P. 235-244.

15. Mannes, A. Ontology Building: A Terrorism Specialist's Perspective / A. Mannes, J. Golbeck // Aerospace Conference. - 2007. - P. 1-5.

16. Mannes, A. Building a Terrorism Ontology / A. Mannes, J. Golbeck //ISWC Workshop on Ontology Patterns for the Semantic Web. - 2005. - Vol. 36. -URL: http://goo.gl/WXeVVv, свободный. - Загл. с экрана (дата обращения: 9.07.2017).

17. Niles, I. Linking Lexicons and Ontologies: Mapping WordNet to the Suggested Upper Merged Ontology /1. Niles, A. Pease // Proceedings of the 2003 International conference on Information and Knowledge Engineering (IKE 03). - 2003. - P. 412-416.

18. Nirenburg, S. Ontological Semantics / S. Nirenburg, V. Raskin. - Cambridge: MIT Press, 2004. - 440 p.

19. Text Analysis for Detecting Terrorism-Related Articles on the Web / D. Choi, B. Ko, H. Kim, P. Kim // Journal of Network and Computer Applications. - Vol. 38. - 2014. - P. 16-21.

20. Turner, M. Simple Ontology for the Analysis of Terrorist Attacks / M. Turner, J. Turner, D. Weinberg. - 2011. - URL: https://goo.gl/tqyTRG, свободный. - Загл. с экрана (дата обращения: 1.07.2017).

21. Uschold, M. Ontologies: Principles, Methods and Applications / M. Uschold, M. Gruninger // Knowledge Engineering Review. -1996. - Vol. 11 (2). - 63 p.

22. Weimann, G. Applying the Notion of Noise to Countering Online-Terrorism / G. Weimann, K. von Knop // Studies in Conflict and Terrorism. -2008. - Vol. 31. - P. 883-902.

Шереметьева Светлана Олеговна, доктор филологических наук, доцент, профессор кафедры «Лингвистика и перевод», Южно-Уральский государственный университет (Челябинск), [email protected]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Зиновьева Анастасия Юрьевна, магистрант кафедры «Лингвистика и перевод», Южно-Уральский государственный университет (Челябинск), [email protected]

Поступила в редакцию 28 ноября 2017 г.

DOI: 10.14529/ling170407

ON DEVELOPING ONTOLOGICAL RESOURCES FOR THE TERRORISM DOMAIN

S.O. Sheremetyeva, [email protected] A.Yu. Zinoveva, [email protected]

South Ural State University, Chelyabinsk, Russian Federation

The article considers main approaches for ontology interpretation and development. The emphasis is made on ontological resources for the subject area "terrorism" created to automatically detect and analyze the terrorist content in natural language texts. Analysis of particular projects on the development of terrorism ontologies is presented. The influence of specific aspects of terrorist activity on structuring the ontological models is determined and particular methods for their construction are described.

Keywords: upper ontology, domain ontology, ontology development, terrorism.

References

1. Boguslavski I.M., Dikonov V.G., Timoshenko S.P. Ontologiya dlya podderzhki zadach izvlecheniya smys-la iz teksta na estestvennom yazyke [An Ontology to Support Meaning Extraction from Texts in a Natural Language]. Informatsionnye tekhnologii i sistemy. [Information Technologies and Systems]. 2012, pp. 152-161.

2. Kravchenko Yu.A., Novikov A.A., Markov V.V. Metod sozdaniya ontologii predmetnoy oblasti na osnove glossariya [Method of Creating a Domain Ontology from Glossary]. Izvestiya YuFU. Tekhnicheskie nauki [Izves-tiya SFedU. Engineering Sciences]. 2015. № 6 (167). Pp. 158-168.

3. Loukachevich N.V Modeli i metody avtomaticheskoi obrabotki nestrukturirovannoi informatsii na osnove bazy znanii ontologicheskogo tipa [Models and Methods for Automatic Processing of Unstructured Information based on an Ontological Knowledge Base]: PhD thesis abstract. VINITI RAS, Moscow, 2014. 32 p.

4. Mitrofanova O.A., Konstantinova N.S. Ontologii kak sistemy khraneniya znanii [Ontologies as Knowledge Management Systems]. 2015. URL: https://goo.gl/GmMuau (accessed: 31.10.2016).

5. Mishlanova S.L., Kupriyanycheva E.A. Osobennosti reprezentatsii kontsepta terrorizm v angloyazychnom diskurse novostei internet-resursov [Peculiarities of the Terrorism Concept Representation in the English-Language Internet News Discourse]. Filologicheskiye zametki [Philological Studies]. 2012, pp. 265-276.

6. Sokolova E.G., Kononenko I.S., Zagorulko Yu.A. Problemy opisaniya komputernoi lingvistiki v vide ontologii dlya portala znanii [Problems of Describing Computational Linguistics in the Form of Ontology for a Knowledge Portal]. 2008. URL: https://goo.gl/zV6pN6 (accessed: 5.12.2016).

7. Aly A. The Terrorists' Audience: A Model of Internet Radicalisation. Journal of Australian Professional Intelligence Officers. 2009, vol. 17, pp. 3-19.

8. Matuszek C., Cabral J., Witbrock M., DeOliveira J. An Introduction to the Syntax and Content of Cyc. Conference: Formalizing and Compiling Background Knowledge and Its Applications to Knowledge Representation and Question Answering. 2006. URL: https://www.researchgate.net/publication/22125066 (accessed: 11.11.2017).

9. Arp R., Smith B., Spear A.D. Building Ontologies with Basic Formal Ontology. Cambridge: MIT Press, 2015. 248 p.

10. Behavioral Assessments Based on Automated Text Analyses. URL: http://www.start.umd.edu/research-projects/behavioral-assessments-based-automated-text-analyses (accessed: 11.11.2017).

11. Gruber T.R. A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition. 1993. Vol. 5 (2). Pp. 199-220.

12. Brynielsson J., Horndahl A., Johansson F., Kaati L., Martenson C. Harvesting and Analysis of Weak Signals for Detecting Lone Wolf Terrorists. Security Informatics. 2013. Vol. 2 (1). Pp. 1-15.

13. Francesconi E., Montemagni M., Peters W., Tiscornia D. Integrating a Bottom-Up and Top-Down Methodology for Building Semantic Resources for the Multilingual Legal Domain Semantic Processing of Legal Texts. LNAE. 2010, Vol. 6036. pp. 95-121.

14. Miller G.A., Beckwith R., Fellbaum C., Gross D., Miller K.J. Introduction to WordNet: An On-line Lexical Database. International Journal of Lexicography. 1990, Vol. 3 (4). pp. 235-244.

15. Mannes A., Golbeck J. Ontology Building: A Terrorism Specialist's Perspective. Proceedings of 2007 IEEE Aerospace Conference. 2007, pp. 1-5.

16. Mannes A., Golbeck J. Building a Terrorism Ontology. ISWC Workshop on Ontology Patterns for the Semantic Web. Vol. 36. 2005. URL: http://goo.gl/WXeVVv (accessed: 9.07.2017).

17. Niles I., Pease A. Linking Lexicons and Ontologies: Mapping WordNet to the Suggested Upper Merged Ontology. Proceedings of the 2003 International conference on Information and Knowledge Engineering (IKE 03). 2003, pp. 412-416.

18. Nirenburg S., Raskin V Ontological Semantics. Cambridge: MIT Press, 2004, 440 p.

19. Choi D., Ko B., Kim H., Kim P. Text Analysis for Detecting Terrorism-Related Articles on the Web. Journal of Network and Computer Applications. 2014, Vol. 38. pp. 16-21.

20. Turner M., Turner J., Weinberg D. Simple Ontology for the Analysis of Terrorist Attacks. 2011. URL: https://goo.gl/tqyTRG (accessed: 1.07.2017).

21. Uschold M., Gruninger M. Ontologies: Principles, Methods and Applications. Knowledge Engineering Review. 1996, Vol. 11 (2). 63 p.

22. Weimann G., von Knop K. Applying the Notion of Noise to Countering Online-Terrorism. Studies in Conflict and Terrorism. 2008, Vol. 31. pp. 883-902.

Svetlana O. Sheremetyeva, PhD (Habilitation), professor of the Linguistics and Translation Department, South Ural State University (Chelyabinsk), [email protected]

Anastasia Yu. Zinoveva, graduate student of the Linguistics and Translation Department, South Ural State University (Chelyabinsk), [email protected]

Received 28 November 2017

ОБРАЗЕЦ ЦИТИРОВАНИЯ

Шереметьева, С.О. К вопросу о разработке онтологических ресурсов предметной области «терроризм» / С.О. Шереметьева, А.Ю. Зиновьева // Вестник ЮУрГУ. Серия «Лингвистика». - 2017. - Т. 14, № 4. - С. 48-54. DOI: 10.14529/1^170407

FOR CITATION

Sheremetyeva S.O., Zinoveva A.Yu. On Developing Ontological Resources for the Terrorism Domain. Bulletin of the South Ural State University. Ser. Linguistics. 2017, vol. 14, no. 4, pp. 48-54. (in Russ.). DOI: 10.14529/ling170407

i Надоели баннеры? Вы всегда можете отключить рекламу.