Научная статья на тему 'Вопросы управления знаниями в распределённой информационной системе'

Вопросы управления знаниями в распределённой информационной системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
55
21
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шаронова Ю. В., Дидык Т. Г., Рыков В. И.

Описывается основная цель создания и использования онтологий для информационной поддержки предметной области на примере нефтедобычи. Показано, что применение онтологий станет механизмом, объединяющим информацию по исследуемой предметной области в базу знаний, а применение дескрипционных логик дает возможность программно реализовать работу с описанными онтологиями предметных областей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Вопросы управления знаниями в распределённой информационной системе»

2. Информация для потребителей газа: [Электронный ресурс] // ООО «Газпром межрегионагаз Уфа». - Режим доступа: http://www.bashkirgaz.ru (Дата обращения: 01.12.2013).

3. Анализ доменов [Электронный ресурс] - Режим доступа: http://spy-words.ru (дата обращения: 28.11.2013).

ВОПРОСЫ УПРАВЛЕНИЯ ЗНАНИЯМИ В РАСПРЕДЕЛЁННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЕ

© Шаронова Ю.В.*, Дидык Т.Г., Рыков В.И.

Уфимский государственный авиационный технический университет,

г. Уфа

Описывается основная цель создания и использования онтологий для информационной поддержки предметной области на примере нефтедобычи. Показано, что применение онтологий станет механизмом, объединяющим информацию по исследуемой предметной области в базу знаний, а применение дескрипционных логик дает возможность программно реализовать работу с описанными онтологиями предметных областей.

Современные онтологии могут содержать десятки и сотни тысяч определений, поэтому они часто имеют формат, удобный для чтения компьютером, а также строгую логическую базу. Основная цель создания онтологий -добиться общего понимания терминов, которые будут использоваться для обмена информацией в какой-либо предметной области. Онтология описывает концепты области, а так же взаимосвязи между ними.

В информатике термин «онтология» означает формальное представление знаний. Онтологии используются для фиксирования знаний о какой-либо сфере интересов и определяют понятия или концепции, относящиеся к выбранной предметной области, а также задают отношения между этими терминами. Онтологии применяются в различных областях представления знаний, выходящих за пределы науки «информатика». В интернете в свободном доступе имеются онтологии, классифицирующие знания по медицине, генетике. Кроме этого, по адресу http://www.opencyc.org имеется самая большая и полная база знаний в мире, являющаяся онтологией верхнего уровня. Онтологии создаются для того, чтобы различные люди использовали общий язык, который позволяет достичь общего понимания по тому или иному вопросу.

* Доцент кафедры Экономической информатики, кандидат социологических наук, доцент.

Рассмотрим основные тенденции и перспективы использования онтоло-гий для информационной поддержки процессов нефтедобычи. При разработке методологии описания структуры концептов в данной области следует учитывать, что методологическое знание носит четко выраженный процедурный характер. Все уровни методологии образуют сложную систему, в которой существует соподчинение методов. Методология в целом указывает, как и в каком направлении двигаться, осуществляя научно-исследовательскую деятельность. Отбор концептов для указанной предметной области - это деятельность, направленная на поиск и формирование новых знаний, их структуры, сущности, содержании и функционировании, принципах и технологиях взаимодействия между собой объектов нефтедобычи. По целевому назначению разработку методологии описания концептов предметной области на примере нефтедобычи следует отнести к области прикладных разработок.

Развитие технологии RDF на базе XML позволило существенно упростить взаимодействие интересов специалистов и объединить специфические формы и форматы представлений объектов и процессов в таких предметных областях как недропользование, обработка естественно-языковой информации, принятие решений, экспертные системы и др. на базе форматов интернет-технологий. Поскольку знания являются неотъемлемой частью любого бизнес-процесса, возникает закономерный вопрос, каким образом можно использовать результаты этих исследований в таких предметных областях, как, например, нефтедобыча.

Различные языки онтологий предоставляют неодинаковые возможности. Наиболее новая разработка среди стандартных языков онтологий - это OWL от World Wide Web Consortium (W3C) [3], получившая практическую реализацию в виде интерфейса в редакторе создания онтологий Protege. OWL позволяет описывать концепты - базовые понятия предметной области. В OWL есть богатый набор операторов. Например, пересечение, объединение и отрицание. Язык OWL основан на различных логических моделях, которые позволяют определять концепт так, как он описан. Таким образом, составной концепт может быть постепенно создан из определений более простых концептов. Кроме того, логическая модель делает возможным использование механизма «reasoner», который может проверять, являются ли все утверждения и определения в онтологии взаимно согласующимися и также распознавать под какие определения подходят концепты. Поэтому reasoner может помочь поддержанию корректной иерархичности классов. Это особенно полезно при работе с классами, имеющими больше одного родителя.

Как правило, процесс разработки онтологий (в литературе часто используется понятие «Ontology Engineerin») включает в себя ряд шагов. В первую очередь определяются термины домена и отношения между ними,

затем происходит определение концептов самого домена. Следующий шаг -это организация концептов в иерархию и определение атрибутов и свойств классов (подкласс-суперкласс), наложение ограничений на их значения. Затем происходит определение индивидов или экземпляров и придание значений атрибутам и свойствам.

Разработка онтологий является циклическим процессом и всегда начинается с обработки элементарных наборов понятий данной предметной области и описания того, как эти понятия соотносятся друг с другом. Структура онтологии, как правило, состоит из двух частей: наименование важных понятий и информация или знание об этом понятии.

В процессе создания онтологий основная идея состоит в том, что имея описание некоторых понятий, мы можем давать определения, которые, в конечном итоге и будут задавать наши понятия. Например, задав определение вида: «Геологические методы разведки нефти является подмножеством понятия «Поиск и добыча нефти», «Геофизические методы добычи нефти является подмножеством понятия «Поиск и добыча нефти», «При поиске нефти проводится картографирование геологических структур», мы получаем утверждение, что «При Геологических или геофизических методах разведки нефти проводится картографирование геологических структур». То есть любой объект, обладающий свойствами определения, автоматически, будет являться либо геологическим методом разведки нефти, либо геофизическим методом разведки и т.д.

Кроме этого, в процессе проектирования онтологий можно задавать свойства. Делается это с целью получить иерархию представленных в онтологии объектов в виде определений и свойств, а не только структуры в виде графа. Спроектировав онтологию, можно проверить результат при помощи специального инструмента - reasoner и автоматически построить таксономию. Все приведенные примеры и операции возможно решить с использованием теории дескрипционных логик.

Дескрипционные логики - семейство языков представления знаний, которые позволяют описывать понятия предметной области в формализованном виде. Запись на формальном языке позволяет выполнять однозначное описание онтологий, а также позволяет доказывать их согласованность и обрабатывать различные запросы к ним. Такие доказательства гарантируют проверку корректности составления онтологии и позволяют выполнять доказательства над набором онтологий в плане согласованности двух и более онтологий. Дескрипционные логики сочетают в себе, с одной стороны, богатые выразительные возможности, а с другой - вычислительные свойства, такие как разрешимость и относительно невысокая вычислительная сложность основных логических проблем, что делает возможным их применение на практике. Семейства дескрипционных логик являются общим классом логик специально спроектированных для моделирования онтологий. Они

являются языком выражения утверждений о фактах или утверждений о том, что является истинным.

Например, класс «Геологические методы разведки» будет содержать элементы, которые являются одним из способов разведки нефти в нашей предметной области. Классы могут быть организованы в иерархию надкласс-подкласс, которая так же известна как таксономия. Подклассы («являются частью») своими надклассами. Например, рассматривая классы «Поиск нефти» и «Геологические методы разведки» - «Геологические методы разведки» может быть подклассом «Поиск нефти» (то есть «Поиск нефти» - это надкласс класса «Геологические методы разведки»). Это формулируют так: «Все геологические методы разведки применяются для поиска нефти», «Все члены класса Геологические методы разведки являются членами класса Поиск нефти», «Использовать геологические методы разведки подразумевает, осуществлять поиск нефти» и «Геологические методы разведки является частью Поиска нефти».

Создание онтологий с использованием теории дескрипционных логик подразумевает применение формализмов для представления знаний [3]. Отличительными особенностями таких формализмов являются: формальная семантика; декларативный характер описания; знание о том, что формализм является разрешимым фрагментом логики первого порядка; наличие эффективных алгоритмов логического вывода.

Рассмотрим пример дескрипционной логики (табл. 1).

Таблица 1

Пример дескрипционной логики

Отношение двух концептов Отношение экземпляра и концепта Отношение экземпляра и концепта

Магнитные методы исследования скважин являются геофизиче -скими методами исследования скважин Метод естественного магнитного поля является геофизическим методом исследования скважин Метод естественного магнитного поля есть Магнитные методы исследования скважин

В этом примере «Магнитные методы исследования скважин», «Геофизические методы исследования скважин» представляют собой концепты, «Является» - отношение, «Метод естественного магнитного поля» - экземпляр. Экземпляр «Метод естественного магнитного поля» наследует отношение родительского понятия.

Концепты дескрипционных логик являются средством записи знаний какой-либо предметной области. Их можно подразделить на общие знания о понятиях и их взаимосвязях и знания об индивидуальных объектах, их свойствах и связях с другими объектами. Таким образом, записываемые с помощью языка дескрипционных логик знания подразделяются на набор терминологических аксиом и набор утверждений об индивидах. На основе дескрипци-

онных логик был разработан язык Web-онтологий OWL [2], являющийся одной из основных составных частей семантического Web. Целью разработки языка являлось возможность формулировать и публиковать в Web сетевые онтологии - формально записанные утверждения о понятиях и объектах некоторой предметной области и автоматизированного логического вывода новых знаний на основе уже имеющихся [1]. Рассмотренный в табл. 1 пример на языке OWL будет иметь вид:

<owl:Class ^:Ю="исследование скважин"/>

<owl:Class rdf:ID=" геофизические методы исследования скважин">

<rdfs:subClassOf rdf:resource="# исследование скважин "/> </owl:Class>

<owl:Class rdf:ID=" Магнитные методы исследования скважин "> <owl:Restriction>

<owl:onProperty rdf:resource="#является "/>

<owl:hasValue rdf:rvsource="# геофизические методы исследования скважин "/> </owl:Restriction> </owl:Class>

<owl:Thing rdf:ID="Метод естественного магнитного поля ">

<rdfs:type tdf:tesource = "# геофизические методы исследования скважин "/> </owl:Thing>

Так как все концепты: методы поиска нефти, исследование скважин, способы добычи нефти связаны множеством прямых и обратных связей и должны составлять единую, четко структурированную систему, то создание и применение онтологий станет механизмом, объединяющим огромное количество существующей информации в базу знаний. База знаний, в свою очередь, является средством для поиска и получения знаний в предметной области недропользования на примере нефтедобычи.

Применение дескрипционных логик дает возможность программно реализовать работу с описанными онтологиями предметных областей, управлять онтологиями путем отображения понятий и отношений онтологии в утверждения логики, а сформированные таким образом базы знаний могут использоваться для обработки запросов. Начиная с создания онтологии на примере нефтедобычи, в дальнейшем подобная база знаний может стать ориентиром при построении знаний в предметной области «недропользование», а для заинтересованных лиц - принципиально новым, с точки зрения своих возможностей, источником информации.

Список литературы:

1. Тузовский А.Ф., Чириков С.В., Ямпольский В.З. Системы управления знаниями (методы и технологии). - Томск: Изд-во НТЛ, 2005. - 260 с.

2. Филатов В.А., Щербак С.С., Хайрова А.А. Разработка высокоэффективных средств создания и обработки онтологических баз знаний [Элек-

тронный ресурс]. - Режим доступа: http://shcherbak.net/razrabotka-vysokoef-fektivnyx-sredstv-sozdaniya-i-obrabotki-ontologicheskix-baz-znanij. - 15.11.13.

3. W3C, Web Ontology Language (OWL) Guide Version 1.0 [Электронный ресурс]. - 2002. - Режим доступа: http://www.w3.org/TR/2002/WD-owl-guide-20021104. - 16.11.2013.

i Надоели баннеры? Вы всегда можете отключить рекламу.