Научная статья на тему 'Технология применения паттернов онтологического проектирования для оптимизации выполнения запросов в системах обеспечения доступа к данным на основе онтологий'

Технология применения паттернов онтологического проектирования для оптимизации выполнения запросов в системах обеспечения доступа к данным на основе онтологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
432
118
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ОНТОЛОГИЧЕСКИЕ ПАТТЕРНЫ / РЕЛЯЦИОННЫЕ БАЗЫ ДАННЫХ / ПАТТЕРНЫ ОНТОЛОГИЧЕСКОГО ПРОЕКТИРОВАНИЯ / SPARQL / OBDA / ONTOLOGY / RELATIONAL DATABASES / ONTOLOGICAL DESIGN PATTERNS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ломов П.А., Олейник А.Г.

Доступ к данным на основе онтологий один из известных подходов к построению систем, основанных на знаниях. Он подразумевает комбинирование онтологии, представляющей понятийную систему предметной области, и реляционной базы данных, используемой для хранения данных, соответствующих заданным в онтологии понятиям. При этом онтология используется в качестве основы для формирования пользовательских запросов, а база данных для получения результатов их выполнения. В статье предложена технология повышения производительности выполнения запросов к таким системам за счёт предварительной подготовки базы данных с учётом того, что применяемая онтология разработана с использованием онтологических паттернов содержания. Данные паттерны представляют собой небольшие целостные фрагменты онтологии, формализующие обобщённые ситуации предметной области (например, участие в событии, исполнении роли, наличие частей у объекта и др.). Новизну данной технологии определяет возможность ее применения для целого класса онтологий, основанных на онтологических паттернах. Рассматривается общий принцип работы системы с доступом к данным на основе онтологий. Приведено описание предлагаемой технологии, а также её реализация на примере конкретной онтологии и экспериментальная оценка полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ломов П.А., Олейник А.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TECHNOLOGY OF APPLICATION OF ONTOLOGy DESIGN PATTERNS FOR acceleration of queries execution IN Ontology Based Data Access systems

One of the known approaches to the construction of knowledge-based systems is the Ontology-based data access (OBDA) approach, which involves combining an ontology that represents a domain conceptual system and a relational database used to store data that corresponds to the concepts defined in the ontology. In this case, the ontology is used as the basis for the formation of user queries, and the database for obtaining the results of their execution. The article proposes a technology for improving the performance of queries to such systems by preliminarily database preparation, taking into account that the used ontology have been developed with using content ontology design patterns (CDP). These patterns are small ontology fragments that describes generalized situations of the domain (for example, participation in an event, the execution of some role, the parts of an object, etc.). The novelty of this technology determines the possibility of its application for a whole class of ontologies based on ontological patterns. The general principle of ontology-based data access system is considered. The description of the proposed technology, as well as its implementation for a specific ontology, and an experimental evaluation of the obtained results are described.

Текст научной работы на тему «Технология применения паттернов онтологического проектирования для оптимизации выполнения запросов в системах обеспечения доступа к данным на основе онтологий»

УДК 004.682

ТЕХНОЛОГИЯ ПРИМЕНЕНИЯ ПАТТЕРНОВ ОНТОЛОГИЧЕСКОГО ПРОЕКТИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ ВЫПОЛНЕНИЯ ЗАПРОСОВ В СИСТЕМАХ ОБЕСПЕЧЕНИЯ ДОСТУПА К ДАННЫМ НА ОСНОВЕ ОНТОЛОГИЙ

1 2 П.А. Ломов , А.Г. Олейник

Институт информатики и математического моделирования технологических процессов Кольского научного центра РАН, Апатиты, Мурманская область, Россия 1 lomov@iimm.т, 2oleynik@iimm.ru

Аннотация

Доступ к данным на основе онтологий - один из известных подходов к построению систем, основанных на знаниях. Он подразумевает комбинирование онтологии, представляющей понятийную систему предметной области, и реляционной базы данных, используемой для хранения данных, соответствующих заданным в онтологии понятиям. При этом онтология используется в качестве основы для формирования пользовательских запросов, а база данных - для получения результатов их выполнения. В статье предложена технология повышения производительности выполнения запросов к таким системам за счёт предварительной подготовки базы данных с учётом того, что применяемая онтология разработана с использованием онтологических паттернов содержания. Данные паттерны представляют собой небольшие целостные фрагменты онтологии, формализующие обобщённые ситуации предметной области (например, участие в событии, исполнении роли, наличие частей у объекта и др.). Новизну данной технологии определяет возможность ее применения для целого класса онтологий, основанных на онтологических паттернах. Рассматривается общий принцип работы системы с доступом к данным на основе онтологий. Приведено описание предлагаемой технологии, а также её реализация на примере конкретной онтологии и экспериментальная оценка полученных результатов.

Ключевые слова: онтология, онтологические паттерны, реляционные базы данных, паттерны онтологического проектирования, SPARQL, OBDA.

Цитирование: Ломов, Л.А. Технология применения паттернов онтологического проектирования для оптимизации выполнения запросов в системах обеспечения доступа к данным на основе онто-логий / П.А. Ломов, А.Г. Олейник // Онтология проектирования. - 2017. - Т. 7, №4(26). - С. 443452. - Б01: 10.18287/2223-9537-2017-7-4-443-452.

Введение

В последние десятилетия для структурирования, формализации и унификации представления знаний с целью их многократного и гибкого использования в информационных системах применяются онтологии. Как отмечается, в частности, в работе [1], термин «онтология» впервые появился в работе Томаса Грубера [2], в которой рассматривались различные аспекты взаимодействия интеллектуальных систем между собой и с человеком. В настоящее время под онтологией понимается описание декларативных знаний, сделанное на формальном языке и снабженное некоторой классификацией специфицируемых знаний, позволяющей человеку удобно воспринимать их [1]. В качестве средств описания онтологий широкое распространение получили RDF (Resource Description Framework) и OWL (Web Ontology Language). RDF позволяет описывать онтологию в виде набора триплетов вида: «субъект-свойство-объект». OWL обеспечивает большие выразительные возможности и, вместе с тем,

обладает формальной разрешимостью. Это предоставляет возможности логического вывода на онтологиях, описанных с помощью OWL. OWL-онтология представляет систему логических выражений, формально определяющих семантику терминов предметной области (ПрО). На данный момент существующая вторая версия OWL определяет три профиля языка OWL 2 EL, OWL 2 QL, OWL 2 RL, которые задают ограничения на языковые конструкции для обеспечения эффективности логического вывода для разных типов онтологий и задач.

Основным преимуществом применения онтологии в качестве основы для хранения знаний является формальное описание ПрО в виде набора выражений, включающих понятия и предметные отношения. Это является более естественным для пользователя, так как напоминает обычный тезаурус, представляющий понятийную систему ПрО. Реляционные базы данных, в свою очередь, ориентированы главным образом на эффективное хранение и получение данных, поэтому их структура более специфична, и работа с ней потребует от пользователя особых знаний и навыков.

Также важным отличием онтологии является более простое добавление новых знаний, которые должны быть представлены в виде логических выражений, непротиворечащих уже имеющимся в онтологии. В отношении базы данных в этом случае помимо согласования предметной семантики может потребоваться внесение изменений в структуру реляционных таблиц. Это может быть достаточно затруднительно для пользователя и потребует привлечения специалиста по реляционным базам данных.

При организации хранилища знаний преимуществом онтологического подхода также является возможность логического анализа онтологии с помощью машины вывода для получения новых знаний и выявления противоречий.

Основным недостатком применения онтологий в качестве основ информационно-аналитических систем является меньшая, чем при использовании реляционных баз данных, производительность при выполнении запросов. Это является платой за предлагаемые онто-логиями выразительные возможности и отсутствие «жесткой» схемы данных.

Воспользоваться преимуществами обоих подходов можно в рамках систем обеспечения доступа к данным на основе онтологий (Ontology-based data access, OBDA) [3]. Такие системы предполагают совместное применение онтологии, представляющей понятийную систему ПрО, и базы данных, хранящей конкретные данные. В этом случае запрос формулируется с использованием онтологии, а затем транслируется в запрос к базе данных и выполняется. Это позволяет обеспечить скорость выполнения онтологического запроса, которая сопоставима со скоростью выполнения запроса в рамках традиционного подхода с применение только базы данных. Еще более повысить производительность можно за счет предварительного построения индексов таблиц базы данных. Однако формирование эффективных индексов требует априорного знания перечня запросов, которые будут выполняться над базой данных. В настоящей работе предлагается проводить индексацию базы данных, используемой в рамках OBDA системы, с учётом онтологических паттернов содержания (Content ontology Design Pattern, CDP) [4, 5], на основе которых была создана онтология. Предполагается, что это позволит еще более повысить производительность выполнения запросов к онтологии в информационной системе.

Статья структурирована следующим образом: в разделе 1 рассматривается принцип работы OBDA систем; в разделе 2 рассматриваются понятие CDP и их применение для разработки конкретной онтологии; в разделе 3 описывается реализация системы OBDA и предлагаемый способ индексации применяемой базы данных, а также проводится экспериментальная оценка его эффективности; в заключении сформулированы основные результаты работы.

1 Принцип работы OBDA систем

В существующих OBDA системах, как правило, применяются онтологии, описанные с помощью OWL. Онтология в этом случае предоставляет словарь, который используется для формулировки запроса в терминах ПрО. Обычно OWL-онтология состоит из логических выражений (OWL-аксиом) двух типов: Tbox и Abox. Выражения Tbox описывают интенсионал понятий ПрО - классы (концепты) и отношения между ними, выражения Abox представляют экстенсионал понятий - конкретные экземпляры классов онтологии. В случае применения в рамках OBDA-систем онтология содержит только выражения Tbox. Выражения Abox генерируются из результатов выполнения SQL-запроса к базе данных. Процесс генерации, как и переписывание исходного запроса к онтологии (SPARQL-запроса) в SQL-запрос, осуществляется на основе заданной схемы отображения (мэппинга), определяющей соответствие между элементами схемы базы данных и Tbox онтологии.

Таким образом, основная работа при организации доступа к содержимому базы данных на основе онтологии заключается в определении соответствующей схемы мэппинга, выполняемом полуавтоматически или вручную инженером по знаниям.

Заметим также, что на этапе переписывания онтологического запроса, сформулированного на языке SPARQL, в SQL-запрос производится его логический анализ с учетом онтологии, что позволяет расширить его новыми фрагментами, которые логически следуют из его исходного варианта. Например, в случае запроса на выборку экземпляров некоторого класса A при перезаписи в него будут добавлены фрагменты на выборку экземпляров классов, отнесенных в онтологии к подклассам A.

Данный подход позволяет представить содержимое источника данных на концептуальном уровне, предоставить пользователю привычный словарь для формирования запросов, расширить запрос за счет его сопоставления с заданной онтологией, а также адресовать исходный запрос к нескольким гетерогенным источникам данных. При этом будет гарантирована достаточно высокая скорость выполнения запроса, так как этим будет заниматься уже реляционная система управления базой данных (СУБД).

Недостатком данного подхода являются некоторые ограничения на выразительность языка описания онтологии по сравнению с подходом, предполагающим применение только онтологии и RDF-репозитория (программного средства для хранения онтологии и выполнения запросов к ней). Это необходимо для того, чтобы гарантировать приемлемую сложность перезаписи исходного запроса в запросы первого порядка (first order rewriting) [6]. Поэтому язык онтологий, применяемых в рамках OBDA-систем - OWL 2 QL, уступает в выразительности языку, применяемому при использовании RDF-репозиториев - OWL 2 RL. Однако для решения большинства практических задач такой ограниченной выразительности вполне достаточно.

2 Использование онтологических паттернов

для разработки онтологии интегрированного пространства знаний

Разрабатываемая онтология [7] используется в рамках формирования интегрированного пространства знаний (ИПЗ) для информационно-аналитической поддержки научных исследований и разработок по различным направлениям деятельности научного центра. Данная онтология включает систему понятий, описывающих процесс научного исследования, его участников, а также связанные с ним сущности: объект исследования, план, используемый метод, полученный результат и т. д.

Рассмотрим общую структуру разработанной онтологии ИПЗ, более подробно представленной в работе [8], и ее применение для организации ОББЛ. Данная онтология состоит из

нескольких модулей, определенных в соответствии с уровнем абстракции их понятий и функционального назначения их содержимого. Каждый модуль представляет собой файл, содержащий отдельную онтологию, описанную с помощью OWL. Онтология ИПЗ образуется путем импорта данных модулей (рисунок 1).

Рисунок 1 - Модульная структура онтологии интегрированного пространства знаний

В качестве основы онтологии ИПЗ используется онтология информационных артефактов (Information Artifact Ontology, IAO) [9]. Она, в свою очередь, является расширением одной из распространённых онтологий верхнего уровня - базовой формальной онтологии (Basic Formal Ontology, BFO) [10]. Элементы из BFO используются для описания абстрактных инвариантных к ПрО объектов, процессов и явлений. Элементы IAO ориентированы на представление процессов получения информации, их участников, а также информационных источников и носителей. При этом они не только образуют понятийную систему, но и заключают в себе правильные с точки зрения онтологии IAO приемы представления знаний ПрО.

Главной частью онтологии ИПЗ является набор онтологических паттернов содержания. Каждый такой паттерн представляется в виде мини-онтологии в отдельном файле и решает одну задачу онтологического моделирования, при этом в нем используются понятия и отношения из IAO. Применение паттернов является основой XD-методологии (eXtreme Design methodology) [11] разработки онтологий. Сегментация онтологии на отдельные паттерны позволяет избавить пользователя от манипуляций со всей ее понятийной системой. Кроме этого, как подчеркивают авторы XD-методологии, это позволяет обеспечить качество разрабатываемой онтологии, так как каждый паттерн является проверенным решением, доказавшим свою эффективность.

Для представления понятий ПрО пользователь выполняет подбор подходящего паттерна содержания из разработанного набора и последующую специализацию выбранного паттерна путем определения наследников его элементов. Подбор осуществляется на основе набора квалификационных вопросов, сопряженных с каждым паттерном. Они формулируются на естественном языке и указывают, какую информацию можно получить с помощью онтологии, содержащей данный паттерн.

В качестве примера рассмотрим паттерн «Спецификация исследования» (Investigation specification). UML-схема его классов и отношений представлена на рисунке 2.

Investigation specification

has-part

Entity InvObject role InvSubject role

Action specification

Inv. object spec. Inv. subject, spec. Objective spec. Study design

Рисунок 2 - UML-схема паттерна содержания «Спецификация исследования»

Данный паттерн позволяет определить части спецификации исследования: описание цели исследования (Objective specification), действий (Action specification), объекта (Investigation object specification) и предмета (Investigation subject specification) исследования и применяемого метода (Study design).

Для данного паттерна были определены следующие квалификационные вопросы:

• Какой метод планировалось применять для исследования данного объекта?

• Каковы цели/ход/метод исследования?

• Какие исследования планировались о данной сущности?

• В каких исследованиях планировалось применять данный метод/преследовать данную цель?

3 Индексации базы данных OBDA-системы

на основе использованных онтологических паттернов

В качестве программной системы для реализации подхода OBDA был использован Ontop [12]. Данное программное средство является свободно распространяемым и открытым, разрабатывается на основе солидного научного базиса, реализует доступ к содержимому базы данных с использованием техники переписывания запроса и поддерживает распространенные СУБД, такие как PostgreSQL, MySQL, Oracle.

Для применения онтологии ИПЗ в рамках OBDA системы для каждого из включенных в нее онтологических паттернов был определен фрагмент схемы базы данных. Принцип соотнесения элементов онтологии и схемы данных соответствует рекомендациям консорциума W3C [13]. На рисунке 3 представлен фрагмент схемы, соответствующий рассмотренному ранее паттерну «Спецификация исследования».

Рисунок 3 - UML схема фрагмента схемы базы данных для паттерна содержания «Спецификация исследования»

Для каждого паттерна был разработан набор правил мэппинга в формате Ontop для переписывания исходного запроса. Каждое правило соответствует одной таблице реляционной базы данных и включает компоненты: source - SQL-запрос и target - множество шаблонов для генерации выражений Abox из результатов выполнения SQL-запроса.

В качестве примера рассмотрим правило мэппинга для таблицы Study design, связанной по внешнему ключу с таблицей Investigation specification:

mappingId[study_design]

target :study_design-{id} a obo:study_design;

:study_design-{id} obo:is-part-of :investigation-specification-{is_part}. source select "id", "is_part" from "public"."study_design"

Данное правило определяет возможность генерации двух выражений из результатов выполнения SQL-запроса: «нечто» - «является экземпляром класса» - «study_design» и «нечто» - «является частью» - «study_design». Заметим, что мэппинг используется системой Ontomap не только для генерации «ответа», но и при переписывании исходного SPARQL-запроса. В этом случае, исходя из использованных в нем шаблонов Abox выражений (из секций target), подбираются соответствующие SQL-запросы (из секций source) для компоновки финального SQL-запроса.

Эффективным способом увеличения производительности выполнения SQL-запросов является построение индексов для таблиц базы данных. Обычно индексы определяются лишь на основе некоторых полей таблиц и/или их комбинаций, исходя из структур предполагаемых запросов. В нашем случае, ввиду применения онтологических паттернов при разработке онтологии, имеет смысл проводить индексацию на основе их квалификационных вопросов. Основанием для этого служит предположение о том, что в процессе эксплуатации в большинстве случаев пользователя будут интересовать ответы именно на них.

Рассмотрим формирование индексов на основе квалификационного вопроса: «Какой метод планировалось применять для исследования данного объекта?» для паттерна «Спецификация исследования». Соответствующий данному вопросу SPARQL-запрос к тестовому набору данных будет выглядеть следующим образом:

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema/>

PREFIX proc: <http://www.iimm.ru/ontologies/cdp/investigation-process#> PREFIX spec: <http://www.iimm.ru/ontologies/cdp/investigation-specificationt> PREFIX obo: <http://purl.obolibrary.org/obo/>

PREFIX inv-proc: <http://www.iimm.ru/ontologies/cdp/investigation-processt>

select ?studydesign where {

?studydesign a obo:study-design.

?studydesign obo:is-part-of ?invSpec.

?invSpec obo:has-part ?objRoleSpec.

?objRoleSpec a spec:investigation-object-specification.

?objRoleSpec obo:about ?objectRole.

?objectRole a inv-proc:investigation-object-role.

?objectRole obo:role-of <http://www.iimm.ru/ontologies/cdp/investigation-

specificationtentity-30>. }

В результате выполнения данного запроса переменной ?studydesign будет присвоено значение - идентификатор искомого метода исследования, который планировалось применять

для изучения объекта с идентификатором <http://www.iimm.ru/ontologies/cdp/investigation-specification#entity-30>.

В результате переписывания Ontop сформирует следующий SQL-запрос к СУБД:

SELECT

1 AS "studydesignQuestType", NULL AS "studydesignLang",

('http://www.iimm.ru/ontologies/cdp/investigation-specification#study_design-' || REPLACE(...) AS "studydesign"

FROM

"public"."study_design" QVIEW1, "public"."investigation_object_specification"

QVIEW2,

"public"."investigation_object_role" QVIEW3

WHERE

QVIEW1."id" IS NOT NULL AND QVIEW1."is_part" IS NOT NULL AND (QVIEW1."is_part" = QVIEW2."is_part") AND QVIEW2."id" IS NOT NULL AND QVIEW2."about" IS NOT NULL AND (QVIEW2."about" = QVIEW3."id") AND (QVIEW3."bearer_of" = '30')

Далее с помощью запросов к СУБД производится построение индексов таблиц из секции "WHERE" приведенного SQL-запроса: «study_design.id», «study_design.is_part», «investigation_object_specification.is_part», «investigation_object_role.about», «investiga-tion_object_role.bearer_of».

Для оценки эффективности использования индекса, построенного на основе квалификационных запросов паттернов, было определено время выполнения серии SPARQL-запросов с помощью системы Ontop над тестовым набором данных до и после его индексации. Объем сгенерированного тестового набора составлял 1 200 000 строк в каждой из таблиц, соответствующих паттерну «Спецификация исследования». В качестве СУБД использовалась PostgreSQL 9.6.3.

В серию входили двадцать SPARQL-запросов, соответствующие по структуре рассмотренному ранее квалификационному вопросу «Какой метод планировалось применять для исследования данного объекта?». До индексации среднее время выполнения одного запроса составило 1700 мс, после проведения индексации — 210 мс.

Заключение

Применение OBDA подхода позволяет представить содержание информационного ресурса на концептуальном уровне и обеспечить для пользователя возможность формулировки запросов с применением знакомых ему терминов ПрО. Наряду с этим на этапе переписывания исходного запроса производится его логический анализ с учетом используемой онтологии и последующее его дополнение на основе выведенных в результате анализа логических выражений. Применение традиционной реляционной СУБД для организации физического хранения данных обеспечивает сравнительно высокую скорость доступа к ним.

Использование технологии паттернов при разработке онтологий для OBDA системы даёт возможность произвести предварительную подготовку базы данных путем формирования эффективных индексов для её таблиц на основе анализа квалификационных вопросов, сформулированных для используемых паттернов. Полученный результат экспериментального испытания предложенной технологии на сгенерированном наборе данных показал существенное увеличение скорости выполнения запроса при использовании предварительной индексации таблиц базы данных.

Благодарности

Работа выполнена при поддержке Российского фонда фундаментальных исследований: грант 16-07-00562, грант 17-47-510298 р_а.

Список источников

[1] Лапшин, В.А. Онтологии в компьютерных системах. - http://rsdn.org/article/philosophy/what-is-onto.xml.

[2] Gruber, T.R.: The role of common ontology in achieving sharable, reusable knowledge bases // Principles of Knowledge Representation and Reasoning. Proc. of the Second International Conference. Eds.: J.A. Allen, R. Fikes, E. Sandewell/ - Morgan Kaufmann, 1991. - Р. 601-602.

[3] Когаловский, М.Р. Системы доступа к данным, основанные на онтологиях / М.Р. Когаловский // Программирование. - 2012. - №4. - С. 55-77.

[4] Gangemi, A. Ontology Design Patterns for Semantic Web Content. / A. Gangemi // Proc. of the Fourth International Semantic Web Conference (Galway, Ireland). - Springer, 2005. - P. 262-276.

[5] Ломов, П.А. Применение паттернов онтологического проектирования для создания и использования онтологий в рамках интегрированного пространства знаний // Онтология проектирования. - 2015. - Т. 5, №2(16). - С. 233-245.

[6] Kontchakov, R. Answering SPARQL queries over databases under OWL 2 QL entailment regime / R. Kontchakov, M. Rezk, M. Rodriguez-Muro, G. Xiao, M. Zakharyaschev // ISWC 2014, Part I. LNCS, vol. 8796. - Springer, Heidelberg, 2014 - P. 552-567.

[7] Ontology of integrated knowledge space - https://github.com/palandlom/ontology-of-integrated-knowledge-space.

[8] Олейник, А.Г. Разработка онтологии интегрированного пространства знаний / А.Г. Олейник, П.А. Ломов // Онтология проектирования. - 2016. - Т. 6, №4(22). - С. 162-172.

[9] The Information Artifact Ontology (IAO) - http://code.google.com/p/information-artifact-ontology

[10] Grenon, P. SNAP and SPAN: Towards Dynamic Spatial Ontology, Spatial Cognition & Computation / P. Grenon, B. Smith // An Interdisciplinary Journal. - 2004. - Vol. 4, No. 1. - P. 69-104.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[11] Blomqvist, E. Experimenting with eXtreme Design. / E. Blomqvist, V. Presutti, E. Daga, A. Gangemi // In proceedings of EKAW 2010. LNCS 6317. - Springer. Berlin/Heidelberg/New York, 2010.- P. 120-134.

[12] Calvanese, D. Ontop: Answering SPARQL queries over relational databases / D. Calvanese, B. Cogrel, S. Komla-Ebri, R. Kontchakov, D. Lanti, M. Rezk, M. Rodriguez-Muro, G. Xiao // Semantic Web. - 2017. - Vol. 8, No. 3. -P. 471-487.

[13] A Direct Mapping of Relational Data to RDF. W3C Recommendation 27 September 2012 -https://www.w3.org/TR/rdb-direct-mapping/.

TECHNOLOGY OF APPLICATION OF ONTOLOGY DESIGN PATTERNS FOR ACCELERATION OF QUERIES EXECUTION IN ONTOLOGY BASED DATA ACCESS SYSTEMS

P.A. Lomov1, A.G. Oleynik2

Institute for Informatics and Mathematical Modeling of Technological Processes, The Kola Science Center of RAS, Apatity, Murmansk region, Russia 1 lomov@iimm.ru, 2oleynik@iimm.ru

Abstract

One of the known approaches to the construction of knowledge-based systems is the Ontology-based data access (OBDA) approach, which involves combining an ontology that represents a domain conceptual system and a relational database used to store data that corresponds to the concepts defined in the ontology. In this case, the ontology is used as the basis for the formation of user queries, and the database for obtaining the results of their execution. The article proposes a technology for improving the performance of queries to such systems by preliminarily database preparation, taking into account that the used ontology have been developed with using content ontology design patterns (CDP). These patterns are small ontology fragments that describes generalized situations of the domain (for example, participation in an event, the execution of some role, the parts of an object, etc.). The novelty of this technology determines the possibility of its application for a whole class of ontologies based on ontological patterns. The general principle of ontology-based data access system is considered. The description of the proposed technology, as well as its implementation for a specific ontology, and an experimental evaluation of the obtained results are described.

Key words: ontology, relational databases, ontological design patterns, SPARQL, OBDA.

Citation: Lomov PA, Oleynik AG. Technology of application of ontology design patterns for acceleration of queries execution in ontology based data access systems [In Russian]. Ontology of designing. 2017; 7(4): 443-452. DOI: 10.18287/2223-9537-2017-7-4-443-452.

Acknowledgment

The work was supported by the Russian Foundation for Basic Research: grant 16-07-00562, grant 17-47-510298 r_a.

References

[1] Lapshin VA. Ontologies in computers systems. The role of ontologies in modern computer science [In Russian]. -http://rsdn.org/article/philosophy/what-is-onto.xml.

[2] Gruber TR. The role of common ontology in achieving sharable, reusable knowledge bases. Principles of Knowledge Representation and Reasoning. Proceedings of the Second International Conference. J.A. Allen, R. Fikes, E. Sandewell - eds. Morgan Kaufmann, 1991, 601-602.

[3] Kogalovsky MR. Data access systems based on ontologies [In Russian] // Programming. 2012; 4: 55-77.

[4] Gangemi A. Ontology Design Patterns for Semantic Web Content. Proceedings of the Fourth International Se man-tic Web Conference, Galway, Ireland, Springer, 2005: 262-276.

[5] Lomov PA. Development of the ontology of integrated knowledge space [In Russian]. Ontology of Designing. 2015; 5(2): 233-245.

[6] Kontchakov R, Rezk M, Rodriguez-Muro M, Xiao G, Zakharyaschev M. Answering SPARQL queries over databases under OWL 2 QL entailment regime. ISWC 2014, Part I. LNCS 8796, 2014: 552-567.

[7] Ontology of integrated knowledge space - https://github.com/palandlom/ontology-of-integrated-knowledge-space.

[8] Oleinik AG, Lomov PA. Development of the ontology of integrated knowledge space [In Russian]. Ontology of Designing. 2016; 6(4): 162-172.

[9] The Information Artifact Ontology (IAO) - http://code.google.com/p/information-artifact-ontology

[10] Grenon P, Smith B. SNAP and SPAN: Towards Dynamic Spatial Ontology, Spatial Cognition & Computation. An Interdisciplinary Journal. 2004; 4(1): 69-104.

[11] Blomqvist E, Presutti V, Daga E, Gangemi A. Experimenting with eXtreme Design. Proceedings of EKAW 2010, LNCS 6317.: 120-134.

[12] Calvanese D, Cogrel B, Komla-Ebri S, Kontchakov R, Lanti D, RezZk M, Rodriguez-Muro M, Xiao G. Ontop: Answering SPARQL queries over relational databases. Semantic Web. 2017; 8(3): 471-487.

[13] A Direct Mapping of Relational Data to RDF. W3C Recommendation 27 September 2012 -https://www.w3.org/TR/rdb-direct-mapping/.

Сведения об авторах

Ломов Павел Андреевич, 1984 г.р., окончил Кольский филиал Петрозаводского государственного университета (2006), кандидат технических наук, научный сотрудник Института информатики и математического моделирования технологических процессов Кольского научного центра РАН. Области научных интересов: представление знаний, онтологическое моделирование, семантические сети, информационная безопасность. Lomov Pavel Andreevich, (b.1984) PhD, research associate of Institute for Informatics and Mathematical Modelling of Technological Processes of the Kola Science Center RAS. Research interests: knowledge representation, ontological modeling, Semantic web, information security.

Олейник Андрей Григорьевич, 1962 г.р., доктор технических наук, врио директора Института информатики и математического моделирования технологических процессов Кольского научного центра РАН. Области научных интересов: компьютерное моделирование сложных систем; информационные системы поддержки принятия решений. Oleynik Andrey Grigorjevich, (b.1962) D.Sc. (tech), Acting Director, Institute for Informatics and Mathematical Modelling of Technological Processes of the Kola Science Center RAS. Research interests: simulation of complex systems; decision support systems; databases.

i Надоели баннеры? Вы всегда можете отключить рекламу.