Научная статья на тему 'Применение паттернов онтологического проектирования для создания и использования онтологий в рамках интегрированного пространства знаний'

Применение паттернов онтологического проектирования для создания и использования онтологий в рамках интегрированного пространства знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
924
266
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ONTOLOGY / ОНТОЛОГИЧЕСКИЕ ПАТТЕРНЫ / ONTOLOGY DESIGN PATTERNS / СЕМАНТИЧЕСКАЯ СЕТЬ / SEMANTIC WEB / OWL / ОНТОЛОГИЧЕСКИЙ ИНЖИНИРИНГ / ONTOLOGY ENGINEERING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ломов П.А.

Статья посвящена проблеме разработки, сопровождения и использования прикладных онтологий, в рамках информационных систем интегрированного пространства знаний. Основной задачей при этом видится преодоление семантической разнородности онтологий и, как следствие, обеспечение семантической интероперабельности основанных на них информационных систем. Для этого предлагается применять онтологические паттерны на протяжении всего «жизненного цикла» онтологий. Представлено понятие паттерна онтологического проектирования, а также различные виды паттернов и их примеры. Приводятся основные преимущества применения паттернов в таких сценариях работы, как разработка онтологий, их визуализация для передачи онтологических знаний пользователям, выполнение запросов к онтологиям. Рассматриваются также основные проблемы, возникающие при использовании онтологий, основанных на паттернах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF ONTOLOGY DESIGN PATTERNS TO DEVELOPMENT AND USE OF ONTOLOGIES IN AN INTEGRATED KNOWLEDGE SPACE

Article is devoted to a problem of development and use of the ontologies of information systems within integrated knowledge space. The main objective in that case to overcome the semantic heterogeneity of ontologies that as a result will ensure semantic interoperability of the information systems based on them. An application of ontology design patterns during “life cycle” of such ontologies is proposed as a solution. The concept of an ontology design pattern, and also different types of patterns and their examples is presented. The main advantages of patterns application in such ontology handling scenarios as development of ontologies, their visualization for transmission of ontological knowledge to users, execution of queries to ontologies are given. In addition, the main problems arising from the use of ontologies based on patterns are considered.

Текст научной работы на тему «Применение паттернов онтологического проектирования для создания и использования онтологий в рамках интегрированного пространства знаний»

УДК 004.682 doi:10.18287/2223-9537-2015-5-2-233-245

ПРИМЕНЕНИЕ ПАТТЕРНОВ ОНТОЛОГИЧЕСКОГО ПРОЕКТИРОВАНИЯ ДЛЯ СОЗДАНИЯ И ИСПОЛЬЗОВАНИЯ ОНТОЛОГИЙ В РАМКАХ ИНТЕГРИРОВАННОГО ПРОСТРАНСТВА ЗНАНИЙ

П.А. Ломов

Институт информатики и математического моделирования технологических процессов Кольского научного центра Российской академии наук, г. Апатиты, Мурманская область, Россия lomov@iimm.ru

Аннотация

Статья посвящена проблеме разработки, сопровождения и использования прикладных онтологий, в рамках информационных систем интегрированного пространства знаний. Основной задачей при этом видится преодоление семантической разнородности онтологий и, как следствие, обеспечение семантической интероперабельности основанных на них информационных систем. Для этого предлагается применять онтологические паттерны на протяжении всего «жизненного цикла» онтологий. Представлено понятие паттерна онтологического проектирования, а также различные виды паттернов и их примеры. Приводятся основные преимущества применения паттернов в таких сценариях работы, как разработка онтологий, их визуализация для передачи онтологических знаний пользователям, выполнение запросов к онтологиям. Рассматриваются также основные проблемы, возникающие при использовании онтологий, основанных на паттернах.

Ключевые слова: онтология, онтологические паттерны, семантическая сеть, OWL, онтологический инжиниринг.

Введение

На сегодняшний день современной науке присущи интеграционные тенденции, заключающиеся в объединении в единое целое самых различных направлений научного познания мира, а также взаимодействие разнообразных методов и идей. Это приводит к формированию целостной научной картины мира и позволяет системно подходить к решению различных научных и практических задач.

В этой связи актуальна разработка технологий и программных средств, нацеленных на формирование и последующее коллективное использование интегрированного пространства знаний (ИПЗ). В работе [1] уже рассматривались общие подходы к организации архитектуры ИПЗ и был предложен гибридный вариант, предполагающий создание на общей основе и последующее связывание отдельных репозиториев научных знаний, каждый из которых поддерживается независимо. Такой способ организации соответствует сценарию создания семантической паутины (Semantic Web). Однако используемый для его реализации базис, включающий языки представления данных и знаний в машинопонимаемом виде - RDF (Resource Description Framework) и OWL (Ontology Web Language), протокол-язык запросов SPARQL (SPARQL Protocol and RDF Query Language) - позволяет в большей степени обеспечить техническую интероперабельность информационных систем, формирующих ИПЗ. Необходимым же является достижение также их семантической интероперабельности, то есть обеспечения одинаковой интерпретации ими информационных объектов.

В свою очередь семантическая интероперабельность систем напрямую зависит от семантической разнородности их онтологий, которая определяется в зависимости от трудоемкости описания понятий одной онтологии в терминологической системе другой. Преодоление такой разнородности, как правило, рассматривается в контексте сложной и требующей для своего решения привлечения экспертов проблемы интеграции онтологий [2]. Однако в значительной мере снизить семантическую разнородность онтологий и тем самым нивелировать необходимость их интеграции можно на этапе их разработки, если руководствоваться тем, что они будут использоваться в информационных системах, функционирующих в рамках ИПЗ. Это обстоятельство предъявляет дополнительные требования к специалистам разных уровней. Так, эксперт предметной области должен перед представлением своих знаний в онтологии согласовать свой взгляд на различные объекты с тем, что уже представлено в ИПЗ другими экспертами. В результате это позволит привнести новые знания как конкретизирующие существующие или как описывающие новые объекты, но в общем контексте, а также снизить вероятность появления противоречий и повторений. Специалисту по онтологическому инжинирингу необходимо при формализации понятий использовать приемы моделирования и правила описания понятий, соответствующие тем, которые были использованы при построении других онтологий ИПЗ. Вследствие чего знания предметных областей будут представлены в виде структурно сходных фрагментов онтологий, что обеспечит возможность их совместного использования без приведения к некоторому общему виду. Программисты, выполняющие реализацию информационной системы, в свою очередь должны реализовать принятый в рамках информационного пространства единый протокол обмена данными для организации формирования и корректной обработки отправляемых и принимаемых сообщений.

Для упрощения разработки и оперирования прикладными онтологиями, ориентированными на использование в рамках ИПЗ, в данной работе предлагается рассматривать их как совокупность реализаций шаблонов, или паттернов, онтологического проектирования (Ontology Design Patterns, ODP) [3]. Это позволит не только облегчить создание онтологий, позволяя экспертам предметной области работать не со специфическими языковыми конструкциями (аксиомами OWL, триплетами RDF), а их комбинациями, имеющими описания своего назначения и способами применения. В этом случае эксперту достаточно реализовать паттерн указанным образом, зависящим от вида и назначения паттерна. Впоследствии же, осуществляя различные обращения к содержимому онтологии, можно оперировать ее целостными фрагментами, исходя из смысла паттернов, которым они соответствуют.

Структура статьи выглядит следующим образом: в разделе 1 рассматривается понятие паттерна онтологического проектирования, а также технология разработки онтологий, основанная на их использовании. Раздел 2 посвящен рассмотрению преимуществ, которые могут быть получены при применении паттернов в рамках формирования ИПЗ. В раздел 3 представлены проблемы, которые необходимо решить для эффективного использования онтоло-гий, разработанных на основе паттернов. В заключении сформулированы выводы.

1 Использование паттернов при разработке онтологий

Применение шаблонного подхода для создания онтологии было заимствовано из программной инженерии, где применение паттернов программирования стало обычной практикой при разработке сложных программных приложений. Это позволяло сделать структуру программы, реализующей множество сложных алгоритмов обработки многих информационных объектов, ясной для понимания и, как следствие, упрощало долговременное сопровож-

дение программного кода разными программистами и снижало вероятность привнесения в него ошибок.

Отметим, что ранее в онтологическом инжиниринге уже применялись практики, сходные с использованием паттернов. К таковым относиться разработка прикладных онтологий на основе онтологий верхнего уровня (ОВУ), таких как DOLCE [4], BFO [5], GFO [6] и других. ОВУ в этом случае не только предоставляла систему инвариантных к предметным областям понятий и отношений, но и определяла способы представления на их основе специфических понятий предметной области. Однако использование ОВУ требовало изучения ее понятийной системы и различных концепций, лежащих в ее основе, что требовало дополнительных затрат труда и времени для эксперта. Вместе с тем в ряде случаев способы описания понятий, определенных в ОВУ, могли быть избыточными или недостаточными для конкретных задач онтологического моделирования. Решение данных проблем могло потребовать изменения понятийной системы ОВУ и/или введения различного рода дополнительных правил, которым необходимо было следовать при формализации знаний предметной области, что также усложняло дальнейшее сопровождение онтологии и нарушало «стандарты», заданные ОВУ.

К еще одной технологии, сходной с использованием паттернов, можно отнести использование микроформатов (Microformats) [7], которые являются простой альтернативой использования RDF/OWL онтологий для семантического аннотирования элементов данных в HTML-страницах. По сути, микроформаты определяют стандартные способы представления простых понятий предметной области и их атрибутов, что позволяет различным вебсервисам одинаковым образом интерпретировать содержание HTML-страниц. Такой подход позволяет обойтись без создания и использования онтологий, однако его применение позволяет лишь несколько улучшить обработку контента, не позволяя представлять и оперировать сложными знаниями предметной области.

Онтологические паттерны представляют собой детально описанные и эффективные решения регулярно возникающих проблем онтологического моделирования. Они подразделяются на несколько типов в зависимости от решаемых задач:

■ структурные паттерны (Structural ODPs) определяют общую структуру онтологии в соответствии с задачей моделирования, а также представляют способы преодоления ограничений выразительности языков описания онтологий;

■ паттерны соответствия (Correspondence ODPs) применяются при необходимости описания существующей онтологии другим языком, а также при интеграции онтологий для определения соответствия между понятиями;

■ паттерны содержания (Content ODPs) представляют собой небольшие фрагменты онтоло-гий, на основе которым можно описать типовые положения вещей в предметной области (участие в событиях, части целого, последовательность сущностей и др.);

■ паттерны логического вывода (Reasoning ODPs) позволяют обеспечить получение определенного результата логического вывода;

■ паттерны представления (Presentation ODPs) определяют соглашения по наименованию и аннотированию элементов онтологии для их удобного восприятия пользователем;

■ лексико-синтаксические паттерны (Lexico-Syntactic ODPs) содержат описания структуры предложений естественного языка, из которых могут быть построены фрагменты онтологии.

В данной работе будут рассматриваться главным образом онтологические паттерны содержания (CDP), так как они непосредственно могут быть использованы при разработке он-тологий для обеспечения в результате их согласованности. CDP являются рекомендуемыми

способами построения фрагментов онтологий, представляющих знания об объекте предметной области, полученные при его рассмотрении с определенной точки зрения.

В качестве иллюстрации рассмотрим общий паттерн «Множественное участие» (Nary Participation) [8].

Этот паттерн (см. рисунок 1) позволяет отразить присутствие некоторых объектов (Object) в событии (Event), происходящем в определенный интервал времени (Time Interval). Данное тернарное отношение представлено «служебным» классом «NaryParcticipation», который в свою очередь является разновидностью ситуации [9].

Рисунок 1 - Структура паттерна «Множественное участие»

В качестве примера специализированного CDP, ориентированного на представление знаний в области химии, физики, биологии, а также промышленности, можно привести паттерн «Материальная трансформация» [8] (рисунок 2).

Рисунок 2 - Диаграмма паттерна «Материальная трансформация»

Он позволяет представить процесс преобразования некоторого материала (Resource) в выходной продукт (Product) под действием катализатора (Catalyst).

Таким образом, CDP отражает некоторую точку зрения на понятие в онтологии, которая в свою очередь должна коррелировать с задачами моделирования предметной области. По-

этому для правильного подбора CDP с каждым из них ассоциируется набор квалификационных вопросов (Competency questions), ответы на которые можно получить из онтологии в случае применения паттерна. Данные вопросы детально отражают точку зрения на понятие, заключенную в конкретном CDP.

Использование CDP заключается в импортировании его структуры в разрабатываемую онтологию и последующем создании наследников его элементов (классов и отношений). В рамках данной работы будем называть набор элементов CDP и их наследников реализацией паттерна.

Заметим также, что CDP могут включать в себя паттерны логического вывода. Это делается с целью дополнить описание понятий предметной области формальной семантикой, которой может оперировать машина логического вывода. В результате на нее перекладываются некоторые задачи проверки корректности описаний или классификации понятий, что очень полезно при работе с объемными понятийными системами. Так, например, паттерн «Активность» (Activity) [10] помимо OWL-аксиом, представляющих его структуру (рисунок 3), содержит также аксиому: SubObjectPropertyOf( ObjectPropertyChain( :produces :isRequirement ) ■.precedes).

Рисунок 3 - Схема паттерна «Активность»

Эта аксиома позволяет выводить отношение «Предшествует» (precedes), между активностями, одна из которых производит некий объект (Outcome), а другая - требует его (Requirement) для своего осуществления.

Таким образом, онтологические паттерны представляют устоявшиеся рекомендации, применяемые в большинстве случаев в онтологическом инжиниринге. Заметим, что при выполнении конкретных проектов по созданию объемных онтологий разработчиками могут быть заданы и специализированные паттерны, направленные на решения специфических проблем онтологического моделирования в конкретной предметной области. Например, в рамках проекта по созданию генной онтологии был сформирован собственных каталог онтологических паттернов, включающий собственные реализации известных приемов онтологического моделирования, а также специализированные паттерны [8].

Общий подход к использованию онтологических паттернов, главным образом CDP, рассмотрен в работах [9, 10], в которых также предлагается технология экстремальной разработки онтологий (eXtreme Design methodology, XD), как не требующая глубоких знаний онтологического инжиниринга. Она представляет собой набор методов и программных средств, основанных на создании и использовании CDP для решения различных проблем в процессе разработки онтологий. В рамках XD при разработке онтологии определяются два множества: множество задач моделирования и множество их решений, представленных в виде CDP и ориентированных на многократное повторное использование. Задачи моделирования и пат-

терны соотносятся друг с другом на основе общих предъявляемых и удовлетворяемых требований к онтологии, которые отражаются во множестве квалификационных вопросов. Таким образом, если возникшая задача может быть частично или полностью представлена в некоторым наборе таких вопросов, сопряженном с некоторым паттерном, то последний может быть использован для её решения.

2 Преимущества использования паттернов

в рамках интегрированного пространства знаний

Применение онтологических паттернов при разработке и использовании онтологий в рамках информационных систем имеет ряд особенностей, которые могут быть использованы для более эффективного (в смысле затрат труда, времени и вычислительных ресурсов) формирования и функционирования ИПЗ.

2.1 Облегчение разработки и сопровождения онтологий

Предполагается, что в ИПЗ будет входить некоторое множество информационных систем, состоящее из более чем двух элементов. В этой связи появляется необходимость в наличии соответствующего количества узких специалистов, осуществляющих создание и поддержку онтологий. Решение данной проблемы может быть существенно облегчено за счёт использования уже упомянутой технологии экстремальной разработки онтологий, которая позволяет оперировать не специфическими языковыми конструкциями, а описаниями CDP. Это даёт возможность экспертам предметной области, не знакомым со специфическими приёмами онтологического моделирования, создавать онтологии, которые корректно и полно представляют формализованные предметные знания.

Подтверждением этого служат результаты оценки применения технологии XD, полученные в работах [12, 13]. В них рассматриваются эксперименты по созданию онтологий слабо знакомыми с онтологическим моделированием пользователями как без употребления, так и с применением CDP, а также с использованием технологии XD в целом. В завершении участники давали субъективную оценку полезности применения ими CDP, также проводилась оценка разработанных ими онтологий. В результате большинство участников отметили полезность использования CDP (93%) и в целом XD технологии. При этом онтологии, разработанные с применением CDP, содержали более полные описания понятий, включающие сложные логические аксиомы, инверсивные отношения (inverse relations), аксиомы разделения классов (disjoint class axioms), комментарии и текстовые лейблы. Наличие данных элементов в описаниях понятий упрощает дальнейшее сопровождение онтологии, а также расширяет набор различных сценариев ее машинной обработки. Отдельно отмечалось, что использование технологии XD целиком, включая несколько последовательных этапов, а не просто поиск и реализацию отдельных паттернов, хотя и потребовало некоторых усилий для освоения, но в итоге привело к сокращению количества ошибок моделирования на 15%.

Это связано с наличием этапа проверки, который предполагал выполнение SPARQL-запросов, соответствующих квалификационным вопросам паттернов, над полученной онтологией и анализа полноты и правильности полученного результата. Таким образом, было показано, что применение CDP позволяет снизить требования к квалификации разработчиков онтологий и при этом обеспечить должный уровень их качества.

2.2 Визуализация онтологий для передачи знаний

Для применения ИПЗ в задачах, требующих привлечения экспертов, необходимым требованием является обеспечение эффективной передачи онтологических знаний человеку. Как правило, решением данной проблемы служит визуализации онтологии. Следует заметить, что, несмотря на существование большого количества программных средств и технологий визуализации, они в основном ориентированы на специалистов по онтологическому моделированию и используются для решения задачи «осмысления» онтологии (ontology sensmaking) [14]. Такая задача обычно возникает при выборе онтологии для повторного использования или оптимизации многоуровневой понятийной системы большой онтологии. В результате ее решения специалист получает представление об общей структуре онтологии. Технологии и программные средства, ориентированные на решение данной задачи, представлены в работах [14-17]. Их отличительными чертами является наличие инструментов для построения обзорного представления онтологии (high level overviews), зуммирования и фильтрации отображаемых элементов.

В рамках решения проблемы эффективной передачи заключенных в онтологии знаний пользователю для визуализации наиболее важными становятся её когнитивные свойства, определяющие насколько просто и точно она может быть интерпретирована экспертом для получения смысла того или иного понятия. Таким образом, в данном случае визуализация предполагает выделение некоторого фрагмента онтологии, представляющего некоторое понятие в одном контексте, так называемую «точку зрения» (viewpoint) [18], и последующее формирование визуального образа с учетом особенностей и общих психологических принципов структурирования зрительной информации человеком. Решение данных задач было предложено в работах [19-21] в рамках технологии визуализации онтологии на основе специальных структур - когнитивных фреймов, включающих наборы фактов о понятиях и соответствующих им визуальных образов.

CDP, как это было отмечено в работе [21], можно рассматривать как формализованное описания точек зрения, которое потенциально может быть использовано для определения понятий в онтологиях. Таким образом, использование CDP при разработке онтологий и последующий их учёт в процессе визуализации позволит задать общий подход к формированию соответствующих понятиям когнитивных фреймов для визуального представления предметных знаний, хранящихся в онтологиях.

2.3 Выполнение запросов к онтологиям в рамках интегрированного пространства знаний

Взаимодействие информационных систем, включенных в ИПЗ, или обращение пользователя к онтологиям предполагает выполнение к ним запросов. На сегодняшний день для этого существует два распространенных способа: использование SPARQL и выполнение логических запросов (DL Query).

При использовании SPARQL онтология рассматривается как RDF-документ, состоящий из набора триплетов вида «субъект-свойство-объект». Например, «Автомобиль_219-имеет_цвет-Бордовый», «Автомобиль_219-имеет_год_производства-2009». Каждый триплет можно рассматривать как дугу некоторого графа и, таким образом, весь RDF-документ представлять в виде графа. В этом случае типовой SPARQL-запрос на извлечение данных представляет конъюнкцию и/или дизъюнкцию шаблонов триплетов, в соответствии с которым из онтологии выбираются удовлетворяющие им наборы триплетов, так называемые решения (Solutions). Выполнение запросов осуществляется обработчиком запросов, который обычно является компонентом хранилища триплетов (RDF-triple store).

Использование логических запросов имеет смысл при обращении к OWL-онтологиям, так как позволяет рассматривать онтологию как логическую теорию, состоящую из утверждений (OWL-аксиом) об объектах предметной области. В этом случае запрос обычно направлен на получение сущностей, которые являются эквивалентными классами и/или подклассами и/или экземплярами анонимного класса, заданного в запросе некоторым логическим утверждением (class expression). Логические запросы выполняются машинами вывода (reasoning engine) и позволяют получать ответы, основанные на выводимой из всего множества аксиом онтологии информации.

Следует заметить, что оба способа могут оказаться полезными в различных условиях. Использование SPARQL больше подходит для выполнения удаленных запросов на выборку данных. Этому способствует то, что SPARQL также и сетевой протокол, который поддерживается сервисом точки доступа, включенного в большинство современных RDF-хранилищ. Выполнение более «тяжелых» логических запросов больше подходит для выполнения действий, не требующих удаленного взаимодействия. Это может быть пополнение онтологии новыми знаниями, проверки её непротиворечивости и результатов логического вывода.

Однако в обоих случаях успешное создание и выполнение запросов требует знания структуры описания понятий, а также синтаксических правил формирования запросов. В этой связи для CDP можно подготовить основы для создания запросов обоих видов и тем самым избавить программиста или эксперта от необходимости изучения «схемы» отдельной онтологии и синтаксисов запросов.

Заметим также, что формирование запросов на основе CDP также обеспечивает дополнительные возможности для повышения скорости их выполнения в рамках RDF-хранилищ, так как этом случае запросы будут иметь сложную, но предсказуемую структуру. Это позволяет предварительно должным образом организовать структуру хранилища, определив соответствующие паттернам или их фрагментам группирующие таблицы триплетов (cluster-property table) [22] или выполнить материализацию определенных связок триплетов.

Наряду с этим знание структуры паттернов позволяет задать дополнительные правила для формирования плана выполнения запроса. Так, например, в работе [23] представлен подход к определению порядка связывания шаблонов триплетов в запросе при составлении плана его выполнения на основе часто встречающихся в массивах RDF-данных структур - наборов свойств (Characteristic sets) [24], каждый из которых состоит из свойств, использованных в триплетах, имеющих одинакового субъекта. Таким образом, с учетом таких структур можно задавать специализированные способы формирования планов для соответствующих им так зазываемых звездообразных запросов (star-shaped queries). Как отмечено в работе [22], такие запросы часто являются составными частями реальных запросов, что позволяет формировать план выполнения последнего путем объединения планов выполнения подзапросов. Таким образом, онтологические паттерны можно учитывать подобно наборам свойств при составлении плана выполнения запросов, направленных на выборку реализаций паттернов или их фрагментов.

3 Основные проблемы реализации/использования онтологий, основанных на паттернах

К основным проблемам использования CDP и разработанных на их основе онтологий можно отнести:

■ отсутствие стандартных описаний CDP на языках OWL и RDF;

■ усложнение структуры онтологии;

■ усложнение визуального представления онтологий.

Отсутствие стандартизированных определений CDP приводит к трудностям их автоматического обнаружения в онтологиях [25], а также извлечения их реализаций для последующей машинной обработки. Заметим, что речь идет именно о различиях в языковых описаниях (разные пространства имен, наименования классов и свойств) одного и того же паттерна разными разработчиками онтологий. С одной стороны, эта проблема вызвана сравнительной «молодостью» технологии использования паттернов в онтологическом инжиниринге и недавним появлением сообщества специалистов, нацеленного именно на выявление, обсуждение способов решения проблем онтологического моделирования и оформления их в виде паттернов [8]. Ранее данная проблема решалась в рамках отдельных проектов по разработке и поддержке онтологий путём определения специальных правил или рекомендаций её модификации [6]. С другой стороны, как подчёркивают авторы технологии XD [13], заданные ими паттерны не являются строгими указаниями и могут быть использованы как основа для собственных решений.

Проблема усложнения структуры онтологии вызвана тем, что каждый CDP включает лишь небольшой набор общих классов и отношений, необходимых только для определения понятия с некоторой точки зрения, а не некоторую их систему как в ОВУ. В этом случае при использовании множества CDP на верхних уровнях разрабатываемой онтологии может появиться множество неорганизованных в иерархию классов, относящихся к различным CDP. При этом каждый такой класс может иметь несколько наследников одного уровня, представляющих разные понятия предметной области, заданные на основе одного паттерна. В этом случае работа пользователя с онтологией путем оперирования традиционной иерархией «класс-подкласс» затрудняется. С одной стороны, это связано с обилием неупорядоченных «служебных» классов CDP, с другой - тем, что при изменении понятия или создании его наследников необходимо знать - с помощью какого CDP оно определено и взаимодействовать с соответствующим ему набором элементов, которые «разбросаны» по различным ветвям иерархии онтологии. Таким образом, в данном случае целесообразным было бы обеспечение возможности для пользователя при навигации по понятийной системе онтологии оперировать реализациями CDP.

Усложнение визуального представления онтологий также вытекает из необходимости рассмотрения онтологии как системы связанных реализаций CDP. Основной задачей в данном случае является формирование образа, полностью передающего смысл понятия в рамках CDP. При этом необходимо избегать большого количества (более 7-9 элементов) графических элементов и учитывать законы восприятия человеком визуальной информации. Это позволит пользователю правильно и с наименьшими усилиями интерпретировать смысл визуализации. Однако для этого требуется более сложная, чем графовая схема (node-link diagram), графическая нотация, элементы которой были бы ориентированы на отражение семантики CDP, а не специфических синтаксических конструкций OWL или RDF. Помимо этого, необходимо также решить вопрос представления без перегрузки пользователя нескольких CDP, относящихся к одному понятию, в рамках одного или нескольких связанных визуальных образов.

Заключение

Таким образом, онтологические паттерны позволяют обеспечить некоторую стандартизацию на более высоком уровне, чем языки описания онтологий. Это позволяет упростить разработку и обеспечить большую однородность онтологий уже на этапе их создания, и тем самым повысить семантическую интероперабельность использующих их информационных систем, входящих в состав ИПЗ. В дальнейшем появляются возможности учета реализован-

ных паттернов для специализации различных сценариев использования данных онтологий с целью повышения эффективности решения задач в рамках ИПЗ. Разумеется, это требует другого взгляда на онтологию не только как на набор логических утверждений или триплетов, а взаимосвязанных реализаций CDP, а также соответствующих технологий и программных средств, учитывающих особенности данного взгляда.

Благодарности

Работа выполнена при поддержке Российского фонда фундаментальных исследований -грант 15-07-03321.

Список источников

[1] Олейник, А.Г. О формировании единого пространства мультипредметных знаний Кольского научного центра РАН / А.Г. Олейник, П.А. Ломов // Труды V-й международной конференции «Системный анализ и информационные технологии» САИТ-2013 (19-25 сентября 2013 г., Красноярск, Россия) - Т. 1 - Красноярск: ИВМ СО РАН, 2013. - С. 258-265.

[2] Ломов, П.А. Интеграция онтологий с использованием тезауруса для осуществления семантического поиска / П.А. Ломов, М.Г. Шишаев // Информационные технологии и вычислительные системы. №3. 2009. - С. 4959.

[3] Gangemi, A. Ontology Design Patterns for Semantic Web Content. // Proc. of the Fourth Int. Semantic Web Conf. (Galway, Ireland). - Springer, 2005. - P. 262-276.

[4] Masolo, C. WonderWeb. Final Report. Deliverable D18 / C. Masolo, S. Borgo, A. Gangemi, N. Guarino, A. Oltramari, L. Shneider. (2003) - www.loa.istc.cnr.it/old/Papers/D18.pdf

[5] Grenon, P. Spatio-temporality in Basic Formal Ontology: SNAP and SPAN, Upper-Level Ontology, and Framework for Formalization: PART I. IFOMIS Report 05/2003 / P. Grenon. - Institute for Formal Ontology and Medical Information Science (IFOMIS), University of Leipzig, Leipzig, Germany, 2003.

[6] Herre, H. General Formal Ontology (GFO): A Foundational Ontology for Conceptual Modelling / In Theory and Applications of Ontology: Computer Applications. - Springer, 2010. - P. 297-345.

[7] Microformats. - http://microformats.org

[8] Ontology design patterns portal. - http://www.ontologydesignpatterns.org

[9] Gangemi, A. Understanding the Semantic Web through Descriptions and Situations / A. Gangemi, P. Mika // LNCS Vol. 2888/2003: On the Move to Meaningful Internet Systems 2003: CooplS DOAandODBASE. - Springer, 2003. - P. 689-706.

[10] Abdalla, A. An Ontology Design Pattern for Activity Reasoning / A. Abdalla, Y. Hu, D. Carral, N. Li, C. Janowicz // Proc. of the 5th Workshop on Ontology and Semantic Web Patterns WOP2014 co-located with the 13 th International Semantic Web Conference ISWC 2014 (Riva del Garda, Italy, October 19, 2014). - P. 78-81. - http://ceur-ws.org

[11] Egana, M. Applying Ontology Design Patterns in Bio-ontologies / M. Egana, A. Rector, R. Stevens, E. Antezana // In A. Gangemi and J. Euzenat, editors, EKAW 2008. LNCS 5268. Springer-Verlag, 2008. - P. 7-16.

[12] Blomqvist, E. Experiments on Pattern-Based Ontology Design / E. Blomqvist, A. Gangemi, V. Presutti // In: Proc. of the 5th Int. Conf. on Knowledge Capture (K-CAP 2009) (September 1-4, 2009, Redondo Beach, California, USA). ACM, 2009. - P. 41-48.

[13] Blomqvist, E. Experimenting with eXtreme Design. E. Blomqvist, V. Presutti, E. Daga, A. Gangemi // In proceedings of EKAW 2010. LNCS: Vol. 6317: Berlin-Heidelberg-New York, Springer. - P. 120-134.

[14] Motta, E. A Novel Approach to Visualizing and Navigating Ontologies / E. Motta, P. Mulholland, S. Peroni, M. d'Aquin, J. Manuel Gomez-Perez, V. Mendez, F. Zablith // LNCS: Vol. 7031. Springer, 2011. - P. 470-486.

[15] Plaisant, C. Spacetree: Supporting Exploration in Large Node Link Tree / C. Plaisant, J. Grosjean, B. Bederson // InfoVis'02. Proc. of the IEEE Symposium on Information Visualization. IEEE Computer Society Washington, 2002. - P. 57-64.

[16] Wang, T.D. CropCircles: Topology Sensitive Visualization of OWL Class Hierarchies / T.D. Wang, B. Parsia // LNCS: Vol. 4273. Springer, 2006. - P. 695-708.

[17] Shneiderman, B. Tree Visualization with Tree-Maps: A 2nd Space-Filling Approach. / B. Shneiderman // ACM Trans. Graph. 1992. 11(1). - P. 92-99.

[18] Acker, L. Extracting viewpoints from knowledge bases / L. Acker, B. Porter // Proc. of the 12th National Conf. on Artificial Intelligence, 1994. - P. 547-552.

[19] Lomov, P. Technology of Ontology Visualization Based on Cognitive Frames for Graphical User Interface / P. Lomov, M. Shishaev // Communications in Computer and Information Science. Vol. 394. Springer, 2013. - P. 54-68.

[20] Lomov, P. Visualization of Ontologies on the Basis of Cognitive Frames for Knowledge Transmission / P. Lomov, M. Shishaev // Proc. of the Int. Conf. on Information Modelling and Knowledge Bases (EJC 2014) (June 3-6, 2014, Kiel). Number 2014/2 in Kiel Computer Science Series. Department of Computer Science, Faculty of Engineering, Kiel University. - P. 339-347.

[21] Lomov, P. Creating Cognitive Frames Based on Ontology Design Patterns for Ontology Visualization / P. Lomov, M. Shishaev // Knowledge Engineering and the Semantic Web. Proc. of the 5th Int. Conf. KESW 2014 (Kazan, Russia, September 29-October 1, 2014). Communications in Computer and Information Science. Vol.468. Springer, 2014. - P. 90-104.

[22] Neumann, T. The RDF-3X engine for scalable management of RDF data / T. Neumann, G. Weikum // The VLDB Journal — The International Journal on Very Large Data Bases. 2010. Vol.19. No.1. - P. 91-113.

[23] Gubichev, A. Exploiting the query structure for efficient join ordering in SPARQL queries. / A. Gubichev, T. Neumann // Proc. 17th Int. Conf. on Extending Database Technology EDBT (Athens, Greece, March 24-28, 2014). P. 439-450.

[24] Neumann, T. Characteristic sets: Accurate cardinality estimation for RDF queries with multiple joins / T. Neumann, G. Moerkotte // Proc. Of the IEEE 27th Int. Conf. of Data Engineering. IEEE Computer Society Washington, 2011. - P. 984-994.

[25] Khan, M. Ontology Design Pattern Detection — Initial Method and Usage Scenarios. / M. Khan, E. Blomqvist // In: the 4th International Conference on Advances in Semantic Processing (SEMAPRO 2010). IARIA, 2010. -P. 19-24.

APPLICATION OF ONTOLOGY DESIGN PATTERNS TO DEVELOPMENT AND USE OF ONTOLOGIES IN AN INTEGRATED KNOWLEDGE SPACE

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

P.A. Lomov

Institute for Informatics and Mathematical Modeling of Technological Processes, The Kola Science Center of RAS, Apatity, Myrmansk region, Russia lomov@iimm.ru

Abstract

Article is devoted to a problem of development and use of the ontologies of information systems within integrated knowledge space. The main objective in that case to overcome the semantic heterogeneity of ontologies that as a result will ensure semantic interoperability of the information systems based on them. An application of ontology design patterns during "life cycle" of such ontologies is proposed as a solution. The concept of an ontology design pattern, and also different types of patterns and their examples is presented. The main advantages of patterns application in such ontology handling scenarios as development of ontologies, their visualization for transmission of ontological knowledge to users, execution of queries to ontologies are given. In addition, the main problems arising from the use of ontologies based on patterns are considered.

Key words: ontology, ontology design patterns, semantic web, OWL, ontology engineering.

Acknowledgment

This work was supported by the Russian Foundation for Basic Research - grant 15-07-03321.

References

[1] Olejnik, A.G. O formirovanii edinogo prostranstva mul'tipredmetnyh znanij Kol'skogo nauchnogo centra RAN [On the formation of a common space multi-disciplinary knowledge of the Kola Scientific Center, Russian Academy of Sciences] / A.G. Olejnik, P.A. Lomov // Trudy V-j mezhdunarodnoj konferencii "Sistemnyj analiz i informacion-nye tehnologii" SAIT-2013 (19-25 September 2013, Krasnojarsk, Russia) - T.1 - Krasnojarsk: IVM SO RAN, 2013. - P. 258-265. (In Russian).

[2] Lomov, P.A. Integracija ontologij s ispol'zovaniem tezaurusa dlja osushhestvlenija semanticheskogo poiska [The integration of ontologies with thesaurus for semantic search] / P.A. Lomov, M.G. Shishaev // Informacionnye tehnologii i vychislitel'nye sistemy. №3. 2009. - P. 49-59. (In Russian).

[3] Gangemi, A. Ontology Design Patterns for Semantic Web Content. // Proc. of the Fourth Int. Semantic Web Conf. (Galway, Ireland). - Springer, 2005. - P. 262-276.

[4] Masolo, C. WonderWeb. Final Report. Deliverable D18 / C. Masolo, S. Borgo, A. Gangemi, N. Guarino, A. Oltramari, L. Shneider. (2003) - www.loa.istc.cnr.it/old/Papers/D18.pdf

[5] Grenon, P. Spatio-temporality in Basic Formal Ontology: SNAP and SPAN, Upper-Level Ontology, and Framework for Formalization: PART I. IFOMIS Report 05/2003 / P. Grenon. - Institute for Formal Ontology and Medical Information Science (IFOMIS), University of Leipzig, Leipzig, Germany, 2003.

[6] Herre, H. General Formal Ontology (GFO): A Foundational Ontology for Conceptual Modelling / In Theory and Applications of Ontology: Computer Applications. - Springer, 2010. - P. 297-345.

[7] Microformats. - http://microformats.org

[8] Ontology design patterns portal. - http://www.ontologydesignpatterns.org

[9] Gangemi, A. Understanding the Semantic Web through Descriptions and Situations / A. Gangemi, P. Mika // LNCS Vol. 2888/2003: On the Move to Meaningful Internet Systems 2003: CooplS DOAandODBASE. - Springer, 2003. - P. 689-706.

[10] Abdalla, A. An Ontology Design Pattern for Activity Reasoning / A. Abdalla, Y. Hu, D. Carral, N. Li, C. Janowicz // Proc. of the 5th Workshop on Ontology and Semantic Web Patterns WOP2014 co-located with the 13 th International Semantic Web Conference ISWC 2014 (Riva del Garda, Italy, October 19, 2014). - P. 78-81. - http://ceur-ws.org

[11] Egana, M. Applying Ontology Design Patterns in Bio-ontologies / M. Egana, A. Rector, R. Stevens, E. Antezana // In A. Gangemi and J. Euzenat, editors, EKAW 2008. LNCS 5268. Springer-Verlag, 2008. - P. 7-16.

[12] Blomqvist, E. Experiments on Pattern-Based Ontology Design / E. Blomqvist, A. Gangemi, V. Presutti // In: Proc. of the 5th Int. Conf. on Knowledge Capture (K-CAP 2009) (September 1-4, 2009, Redondo Beach, California, USA). ACM, 2009. - P. 41-48.

[13] Blomqvist, E. Experimenting with eXtreme Design. E. Blomqvist, V. Presutti, E. Daga, A. Gangemi // In proceedings of EKAW 2010. LNCS: Vol. 6317: Berlin-Heidelberg-New York, Springer. - P. 120-134.

[14] Motta, E. A Novel Approach to Visualizing and Navigating Ontologies / E. Motta, P. Mulholland, S. Peroni, M. d'Aquin, J. Manuel Gomez-Perez, V. Mendez, F. Zablith // LNCS: Vol. 7031. Springer, 2011. - P. 470-486.

[15] Plaisant, C. Spacetree: Supporting Exploration in Large Node Link Tree / C. Plaisant, J. Grosjean, B. Bederson // InfoVis'02. Proc. of the IEEE Symposium on Information Visualization. IEEE Computer Society Washington, 2002. - P. 57-64.

[16] Wang, T.D. CropCircles: Topology Sensitive Visualization of OWL Class Hierarchies / T.D. Wang, B. Parsia // LNCS: Vol. 4273. Springer, 2006. - P. 695-708.

[17] Shneiderman, B. Tree Visualization with Tree-Maps: A 2d Space-Filling Approach. / B. Shneiderman // ACM Trans. Graph. 1992. 11(1). - P. 92-99.

[18] Acker, L. Extracting viewpoints from knowledge bases / L. Acker, B. Porter // Proc. of the 12th National Conf. on Artificial Intelligence, 1994. - P. 547-552.

[19] Lomov, P. Technology of Ontology Visualization Based on Cognitive Frames for Graphical User Interface / P. Lomov, M. Shishaev // Communications in Computer and Information Science. Vol. 394. Springer, 2013. - P. 54-68.

[20] Lomov, P. Visualization of Ontologies on the Basis of Cognitive Frames for Knowledge Transmission / P. Lomov, M. Shishaev // Proc. of the Int. Conf. on Information Modelling and Knowledge Bases (EJC 2014) (June 3-6, 2014, Kiel). Number 2014/2 in Kiel Computer Science Series. Department of Computer Science, Faculty of Engineering, Kiel University. - P. 339-347.

[21] Lomov, P. Creating Cognitive Frames Based on Ontology Design Patterns for Ontology Visualization / P. Lomov, M. Shishaev // Knowledge Engineering and the Semantic Web. Proc. of the 5th Int. Conf. KESW 2014 (Kazan, Russia, September 29-October 1, 2014). Communications in Computer and Information Science. Vol.468. Springer, 2014. - P. 90-104.

[22] Neumann, T. The RDF-3X engine for scalable management of RDF data / T. Neumann, G. Weikum // The VLDB Journal — The International Journal on Very Large Data Bases. 2010. Vol.19. No.1. - P. 91-113.

[23] Gubichev, A. Exploiting the query structure for efficient join ordering in SPARQL queries. / A. Gubichev, T. Neumann // Proc. 17th Int. Conf. on Extending Database Technology EDBT (Athens, Greece, March 24-28, 2014). P. 439-450.

[24] Neumann, T. Characteristic sets: Accurate cardinality estimation for RDF queries with multiple joins / T. Neumann, G. Moerkotte // Proc. Of the IEEE 27th Int. Conf. of Data Engineering. IEEE Computer Society Washington, 2011. - P. 984-994.

[25] Khan, M. Ontology Design Pattern Detection — Initial Method and Usage Scenarios. / M. Khan, E. Blomqvist // In: the 4th International Conference on Advances in Semantic Processing (SEMAPRO 2010). IARIA, 2010. -P. 19-24.

Сведения об авторе

Ломов Павел Андреевич, 1984 г.р., окончил Кольский филиал Петрозаводского государственного университета (2006), кандидат технических наук, научный сотрудник Института информатики и математического моделирования технологических процессов Кольского научного центра РАН. Области научных интересов: представление знаний, онтологическое моделирование, семантические сети, информационная безопасность.

Pavel Andreevich Lomov, (b. 1984) PhD, research associate of Institute for Informatics and Mathematical Modelling of Technological Processes of the Kola Science Center RAS. Research interests: knowledge representation, ontological modeling, Semantic web, information security.

i Надоели баннеры? Вы всегда можете отключить рекламу.